JP2004348768A - 文書検索方法 - Google Patents

文書検索方法 Download PDF

Info

Publication number
JP2004348768A
JP2004348768A JP2004243236A JP2004243236A JP2004348768A JP 2004348768 A JP2004348768 A JP 2004348768A JP 2004243236 A JP2004243236 A JP 2004243236A JP 2004243236 A JP2004243236 A JP 2004243236A JP 2004348768 A JP2004348768 A JP 2004348768A
Authority
JP
Japan
Prior art keywords
document
search
word
characteristic
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004243236A
Other languages
English (en)
Inventor
Shingo Nishioka
真吾 西岡
Makoto Iwayama
真 岩山
Kazuhiro Ono
一広 大野
Akihiko Takano
明彦 高野
Yoshiki Niwa
芳樹 丹羽
Atsuko Yamaguchi
敦子 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004243236A priority Critical patent/JP2004348768A/ja
Publication of JP2004348768A publication Critical patent/JP2004348768A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】検索された文書群のタイトル情報と全体像を示す情報の両方を一覧することができるようにして、検索条件を考える際に必要となる検索結果の分析を効率的に行なうことを可能にする。
【解決手段】検索支援インターフェイスに検索結果表示部と特徴語表示部を並置することにより、ユーザーが検索結果のタイトル情報と特徴情報を一覧できるようにし、また指定した特徴語を含む文書を強調するマークタイトルボタン、指定した文書に含まれる特徴語を強調するマーク特徴語ボタンなどの検索結果分析手段を持たせることにより、ユーザーが色々な観点から容易に検索結果を分析できるようにする。
【選択図】図6

Description

本発明は、対話的なガイダンス機能を実現したユーザーインタフェースを備える文書検索方法およびこれを利用した文書検索サービスあるいは文書検索支援サービスに関する。
文献検索システムにおいてはユーザーが所望する文献集合になるべく早く容易に到達できるようさまざまな支援機能が考案、開発されている。その中の主なものとしてはフィードバックとガイダンスがある。フィードバックとは、例えば、非特許文献1の第6章にあるように、検索結果のいくつかのアイテムに対してユーザーが「当たり/はずれ」の判定を下すと、その判定を反映した検索結果を得ることができるしくみである。またガイダンスとは検索作業の各段階でその検索作業と関連のあると思われる情報、従って利用者が検索条件を工夫したり改良するのに参考になると思われる情報を提供する機能である。
ガイダンス機能については、従来一般に、入力された検索条件に対してその関連情報を提示する方法が行なわれている。例えばシソーラスなど単語間の関連性を示すデータベースを保持しておき、検索条件として入力された語と関連のある語をデータベースから取り出して提示する方法である。シソーラスの場合には主に単語間の上位−下位関係を示す木構造のデータであるが、共起統計を用いて関連語データを自動生成しそれを用いる方法もある(例えば、特許文献1あるいは非特許文献2)。また非特許文献3の第12章では単語間の共起統計データにもとづき検索語とその関連語をネットワーク状に表示する方法を与えている。
しかしながら検索条件に対してその関連情報を提示する方法では、検索語が複数になった場合や否定が使われた場合の対処が難しく、またキーワードを用いない種類の検索(連想検索など)にも対処が難しいという問題があり、それを克服する方法として、検索結果から関連情報を自動抽出してユーザーに提供する手法がある。例えばスキャター・ギャザー法(例えば、非特許文献4の318−329ページ)では検索された文書群を自動分類(クラスタリング)してクラスごとの特徴語を表示するものであり、また本願の発明者らの提案にかかわる特許文献2では検索結果からの特徴語抽出と特徴語間共起関係抽出により特徴語グラフを生成・表示する方法を与えている。
しかしながらこれら従来法では検索結果の一次情報であるタイトルリストの表示部とガイダンス情報との間のインタラクションが不十分でありユーザーはガイダンス情報を十分に活用できないという問題があった。
また検索手法の立場からみた場合にはキーワード検索と連想検索という2種類の相補的な検索が必要となるが、これらを状況に応じて使い分け、かつ同じ枠組でガイダンスを行なえるユーザーインタフェースがないという問題があった。
特開平8−161343号公報 特開平10−74210号公報 G.Salton, J.M.McGill(1983), Introduction to Modern Information Retrieval, McGraw−Hill B.R.Schatz他(1996), Interactive term suggestion for users of digitallibraries: Using subkect thesauri and co-occurrence lists for information retrieval, Proc. ACM DL'96, 126−133ページ R.H.Fowler, D.W.Dearholt(1990), Information Retrieval Using Pathfinder Networks, In R.W.Schvaneveldt 編, Pathfinder Associative Networks, Ablex D.Cutting他(1992), Scatter/Gather:A Cluster-based Approach to Browsing Large Document Collections, Proc. ACM SIGIR '92
前記従来技術の問題を解消し、利用者が検索結果のタイトルリストなどの個々の情報と全体像の両方を把握し、個別情報と全体像との関連性を分析しながら検索条件の改良を試みたり、また観点を変えた検索を試みたりすることができるようにすることであり、さらには、利用者が興味深い文書として見つけたり、すでに所持している文書やあるいは検索作業の途中で興味深い文書あるいはその一部を見つけた時に、それらと関連の深い文書を容易に検索できるようにすることである。
利用者が検索結果の全体像を把握しながら検索条件の改良を試みたり、また観点を変えた検索を試みたりすることができるようにするために、検索結果の一次情報であるタイトルのリストと共に、検索された文書群に特徴的に現れる特徴語群の関連性を示すグラフを同一画面上の比較しやすい位置に表示し、表示された特徴語をマウスによるクリック操作などで検索語として利用することができるようにし、あるいは、表示された特徴語のいくつかを簡単なマウス操作などで選択し、それらを含むタイトルを強調した表示としたり、強調されたタイトルをリストのトップに集中させるなどして利用者が特徴語とそれを含む文書との関連を認識しやすくしたり、また逆にいくつかのタイトルを選択して、これらの文書に共通に含まれる特徴語を強調した表示とすることができ、より深い検索に試行錯誤的に進みやすい検索支援インターフェイスを実現する。
本発明によれば、検索結果を利用しながら、より検索目的に合った結果を容易に得ることができる。
以下、本発明の文書検索支援方法とそれを利用した文書検索支援サービスの実施形態を説明する。
図1は文書検索支援サービスのシステム構成の一例である。本文書検索支援サービスは情報提供者側の情報保持・処理手段1(汎用計算機、ワークステーション、パソコンなど)と通信ネットワーク2(インターネット、イントラネット、またそれらの組み合わせなど)および利用者側の情報保持・処理手段3(ワークステーション、端末、パソコンなどの計算機)により構成される。利用者、情報提供者ともに複数でも構わないが、ここでは簡単のため共に単独の場合の図としてある。
情報提供者側の情報保持・処理手段(以下簡単のため「計算機」と呼ぶ)1は入力手段11、表示手段12、CPU13、ワークエリア14、情報保持手段15などから構成され、利用者側から送られてくる検索要求に応じて、提供対象である文献データベース中の該当文書を検索し、その結果を利用者へ送信し、また検索要求や検索結果に関連する有用な情報を必要に応じて生成、加工して利用者に送信するのが主な役割である。ワークエリア14は高速に読み書き可能な半導体メモリなどの記憶媒体で構成され、オペレーティングシステム141、通信プロセス142とともに、文書検索支援サービスを行なうための検索支援プログラム143が稼働する。情報保持手段15は磁気ディスクや光ディスク、CDROMなど大規模な情報を格納できてかつ高速な読み出しをするのに適した記憶媒体の組み合わせで構成され、利用者側計算機上で検索支援手段として稼働することができる利用者側検索支援駆動プログラム15X1と、それを利用者側計算機まで運び、かつ実行させる働きを持つ利用者側検索支援起動用ハイパーテキスト15F1と、検索対象などの検索用データ15Dなどの情報が保持されている。検索用データ15Dは辞書類15D0と各文書データベースに関するデータ15D1、15D2………で構成される。
利用者側の情報保持・処理手段(以下簡単のため「計算機」または「端末」と呼ぶ)3は入力手段31、表示手段32、CPU33、ワークエリア34、情報保持手段35、印刷手段36から構成され、利用者の検索要求を情報提供者側に伝え、また情報提供者側から送られてきた検索結果や付帯情報を利用者が利用しやすい形で提示するのが主な役割である。入力手段31はキーボード31、マウス32、ペン入力手段33などから構成され、ワークエリア34は高速に読み書き可能な半導体メモリなどの記憶媒体で構成され、情報保持手段35は磁気ディスク、光ディスク、CDROMなどの記憶媒体で構成される。
本検索支援サービスの実施形態は種々の方法が可能であるが、以下ではWWWブラウザなどのハイパーテキスト閲覧インターフェイスを利用する方法について述べる。図1の利用者側計算機3ではすでにハイパーテキスト閲覧プロセス343がワークエリア34にロードされて稼働しており、表示手段32にハイパーテキスト閲覧インターフェイス321が表示されている状態である。
ハイパーテキスト閲覧インターフェイス321のアドレス入力部3211から検索支援サービスが指定するアドレス(すなわち情報提供者計算機1のネットワーク上でのアドレスと利用者側検索支援起動用ハイパーテキスト15F1の存在するファイル名など)を直接に指定したり、あるいはハイパーテキスト閲覧インターフェイス321のテキスト表示部3212に表示されているハイパーテキストに検索支援サービスの指定するアドレスがアンカーとして埋め込まれている場合にはその部分をマウスなどでクリックすると、ハイパーテキスト閲覧プロセス343は利用者側通信プログラム342と情報提供者側通信プログラム142を介して利用者側検索支援起動用ハイパーテキスト15F1を受けとる。この時同時に利用者側検索支援駆動プログラム15X1が付随して送信され、かつ利用者側計算機のワークエリア34で起動されて検索支援プログラム344として稼働し、同検索支援プログラム344は検索支援インターフェイス322を表示手段32に表示する。なお検索支援インターフェイス322はハイパーテキスト表示部分3212の中に表示されても、また別のウィンドウとして表示されても良い。図1は別ウィンドウとして表示している例である。
この他ハイパーテキスト閲覧プログラム343を用いずに直接コマンド入力などにより利用者側検索支援駆動プログラム15X1を通信プログラムを介して受けとり、ワークエリア上で稼働させて検索支援サービスを受けることも可能である。またあらかじめ利用希望者には利用者側検索支援駆動プログラム15X1を配布しておき、必要に応じてそれを起動して使ってもらうようにするサービス形態も可能である。
図2は利用者側計算機3のワークエリア34にロードされた利用者側検索支援プログラム344の詳細を示した図である。利用者側検索支援プログラム344はメインの検索支援ルーチン3441とデータエリア3442、およびサブルーチンとしての検索結果描画データ作成ルーチン3443、特徴語グラフ描画データ作成ルーチン3444、特徴語リスト描画データ作成ルーチン3445などから構成される。
データエリア3442は、種々のパラメータを格納するためのエリア34421、インターフェイス描画に関するデータを格納するエリア34422、検索要求格納エリア34423、検索結果格納エリア34424a、検索結果表示順序格納エリア34424b、特徴語格納エリア34425、特徴語間リンク情報格納エリア34426、特徴語−文書対応表格納エリア34427、文書−特徴語対応表格納エリア34428などから構成される。パラメータ格納エリア34421には検索結果描画データ作成用のパラメータ344211、特徴語グラフ描画データ作成用パラメータ344212などがある。
利用者側検索支援ルーチン3441はインターフェイス描画に関するデータ34422にもとづき検索支援インターフェイス322を表示手段32に表示する。またインターフェイス上のボタンがマウスなどで押された場合には押されたボタンの種類に従って各種の操作を行なう。
図3は表示部32に表示された検索支援インターフェイス322の構成例である。検索支援インターフェイス322は利用者がキーワードなどの検索要求を入力するための検索要求入力窓E1、キーワード検索実行用ボタンB01、また指定文書との類似度に基づく検索(連想検索)を行なうための連想検索ボタンB02、連想検索を行なうための文や単語群を入力するためのテキスト入力ボタンB03、また検索対象とする文献データベースを選択するためのDB選択手段M1などの検索に関する部品群、また検索結果を表示する検索結果表示部P1と検索結果を特徴付ける情報を表示する特徴語表示部P2などの結果表示に関する部品群、また検索結果とその特徴表示にもとづいて各種の操作をする部品群などで構成される。検索結果とその特徴表示にもとづいて各種の操作をする部品群としては、選択された文書または文書群と類似した文書を検索するための拡大ボタンB11、選択された文書または文書群以外の文書を捨てるための刈り込みボタンB12、文書に付された選択状態をすべて解除するための選択解除ボタンB13、選択された一つまたは複数の特徴語を含む文書のタイトルにチェックマークなどの強調を付するためのマークタイトルボタンB31、さらにマークの強い順にタイトルを並べ替えるためのソートボタンB32、マークを消すためのクリアボタンB33、選択された一つまたは複数のタイトルに対応する文書に含まれる特徴語を強調するためのマーク特徴語ボタンB41、マークの付された特徴語を選択するための選択ボタンB42、マークを解除するためのクリアボタンB43、特徴語に付された選択状態をすべて解除するための選択解除ボタンB23、選択された一つまたは複数の特徴語と関連の強い特徴語も選択状態にする特徴語選択拡大ボタンB21などである。
この配置において特徴的なことは、タイトルリストなど検索結果を直接に表示する検索結果表示部P1と検索された文書群全体を解析してその特徴を分析した結果を表示する特徴語表示部P2を対照しやすいように並べていることである。このことにより、利用者は検索された結果の具体的な情報(タイトルリスト)と抽象化された全体情報を一度に把握することができ、さらに本実施例の後の部分で明らかになるように、両者の間のインタラクションを容易に実現することができるという利点がある。
図4はこの検索インターフェイスを描画するためのデータ格納エリア34422の詳細である。検索インターフェイスを構成するすべての部品の描画データで構成される。例えば検索要求入力窓E1を描画するためのデータ34422E1は、配置位置、窓のサイズ、表示内容(検索条件)、原点位置(窓の左に隠れてしまう文字数あるいはそれに匹敵する長さ)、カーソル位置、マーク位置、背景色、文字フォントの種類、枠線の種類などから構成される。
図5は利用者側の検索支援ルーチン3441における処理の流れを示すPAD図である。検索支援ルーチン3441の主な働きは検索支援インターフェイスを表示し利用者の操作に応じて検索結果や、関連情報の提示など必要な作業を行なうことである。
はじめに本検索支援ルーチン3441で使われる変数(フラグなど)について説明する。検索結果描画更新フラグ(変数名Fr)は検索結果表示部P1(図3)に表示する描画データを更新する必要があるかどうかを示す。特徴語描画更新フラグ(変数名Fc)は特徴語表示部P2(図3)に表示する描画データを更新する必要があるかどうかを示す。本検索支援方法では検索を実行した後には検索結果表示部P1や特徴語表示部P2を更新する必要があるが、これは他の作業の時には必ずしも必要な訳ではない。たとえば検索要求を入力しているときなどにはどちらも更新の必要がない。従って必要な時だけ、これらの作業を行なうようにこれらのフラグを使用する。またドラッグモード(変数名MM)はマウスでドラッグ操作をしている時の作業の種類を示すもので、文書選択(MM=11)、表示文書指示(MM=12)、特徴語の移動(MM=21)、特徴語選択領域(MM=22)などがある。また変数MSは直前にマウスが押された位置の文書あるいは特徴語の番号を記録し、また変数MFは同じ文書あるいは特徴語がマウスが押される前の選択状態を記録し、変数MDは現在閲覧用に表示されている文書の識別番号を記録するためのものである。初期処理34411において、立ち上げ時のこれらの変数はFr=Fc=0、MM=0、MS、MF、MDは値なしに設定される。
続いて終了ボタンが押されるまで34412以下の処理が繰り返される。始めに検索結果描画更新フラグ(Fr)がオンの場合には検索結果描画データ作成ルーチン3443を用いて検索結果表示部描画データ34422P1の更新作業34412を行なう。また特徴語描画更新フラグ(Fc)がオンの場合には特徴語グラフ描画データ作成ルーチン3444を用いて特徴語表示部描画データ34422P2の更新作業34413を行なう。立ち上げ時にはどちらのフラグもオフのためこれらは素通りする。
続いて処理34414では検索インターフェイス描画データ34422(図4)に基づいて検索インターフェイス322を表示手段32上に描画する。ここまでの処理を終えると入力待ち状態34415となる。図3の表示画面は検索支援プログラム344がスタートしてこの入力待ち状態に達した段階での検索インターフェイス322の表示状態を示している。キーボードやマウスにより何らかの入力があると分岐34416に進み、キーボード入力の場合(カット&ペーストを含む)には処理3441KB、マウスが押された場合には処理3441MP、マウスを押しながら移動中には処理3441MD、マウスを離した時には処理3441MRをそれぞれ行なう。それぞれの詳細については後に説明する。
利用者はこの検索支援インターフェイスを通じて検索要求を入力したり各種の操作を行なうことができる。この検索作業の出発点としては色々な方法が可能であり、例えばキーワードを入力してキーワード検索したり、何か関心の高い文書のネットワーク上でのアドレスを指定して、それと類似した文書を検索したり、あるいは文書全体でなくその一部である段落や文、フレーズなどから関連性の高い文書を検索するなどができる。はじめにキーワード検索からスタートする場合について説明する。
検索条件は検索要求入力窓E1(図3)にキーボードから入力するが、立ち上げ時には検索要求入力窓E1が入力待ち状態になっていない場合があるので、その場合には入力を開始するまえに検索要求入力窓E1をマウスでクリックする。これによりマウスを押した時の処理3441MPが行なわれ、検索要求入力窓E1が入力待ち状態となり、キーワードから文字が入力される度に処理3441KBで入力文字が検索要求入力部描画データの表示内容部34422E13に格納され、それが描画処理34414で検索要求入力窓に表示される。すなわちキーワードからの入力文字が次々に検索要求入力窓E1に書き込まれていくことになる。
検索条件の入力が終わったらキーボード検索ボタンB01(図3)をマウスでクリックすると検索が実行される。すなわちマウスを離した時に分岐34416で処理3441MRが選択され、その中ではクリックされたボタンの種類によって分岐が起こり、検索ボタンB01の場合には、キーワード検索要求が情報提供者側計算機1の検索支援プログラム143に送信され、検索結果と特徴語情報などが返信される。また検索結果描画更新フラグと特徴語描画更新フラグが両方ともオンにセットされるため、検索結果描画データ更新処理34412と特徴語描画データ更新処理34413では新たに受信したデータを元にしてそれぞれの描画データが作成され、検索結果表示部描画データ34422P1と特徴語表示部描画データ34422P2のデータが更新される。これら新しいデータに基づいて描画処理34414では検索インターフェイスを描画する。
図6は検索支援インターフェイスにおける検索結果と特徴語の表示例である。検索条件として「キーワードa1、キーワードa2」を入力してキーワード検索を行なった後の検索インターフェイス画面の例である。検索結果表示部P1には検索された文書のリストが関連度スコアと共に出力される。一行が一つの文書についての情報であり、左端から文書をユーザーが選択するための小窓、文書の検索要求との適合度を示す数値、それから文書を人間が識別するための情報(例えば文書のタイトルや発行日などの情報)、キーワードなどによって構成される。また検索された文書の総数がその上の部分L12に示される。この数値はインターフェイス描画データ34422の中の文字列描画データ34422Lの一つである「総数(左)」描画データ34422L11の中の文字列情報として検索された文書数「22」が格納され、それがこの表示部L12に表示される。また特徴語表示部P2には検索された文書群に特徴的に現れる単語を相互の関連性が分かるようなグラフ形式で表示される。検索された文書群からこのような特徴語グラフを生成する方法は例えば特願平8−176174「文献検索支援方法及び装置およびこれを用いた文献検索サービス」に記載されている方法を用いることができる。
図7はこの時の検索結果表示部描画データ34422P1(図4)の詳細である。同データは表示位置、領域サイズ、原点位置と表示内容で構成される。表示位置はインターフェイス全体枠の中のどの位置にこの部品を貼り付けるかを示し、原点位置は表示領域の左上角に来る描画領域の座標を示している。スクロール操作を行なうことによりこの値を変えることができる。
描画内容34422P14は描画位置と図形種類、付帯情報から構成される。これの一行目は位置(40、30)にサイズが(5、5)で色が透明の矩形を描画するということを意味である。二行目は位置(60、30)に「2」という文字列を描画する。また三行目は位置(80、30)に該当文書のタイトル名<タイトル−a1>を描画するという意味である。従ってこれらに基づいて描画を行なうことにより図6の検索結果表示部P1の1行目が描画されることになる。2行目以降も同様である。
図8も同じくこの時の特徴語表示部描画データ34422P2(図4)の詳細である。こちらの描画内容はグラフのリンクを表す線分描画データ群とノードの文字列を表す文字列描画データ群で構成されている。線分は始点と終点で指定されている。例えば1行目は座標(80、80)から座標(100、30)へ線分を描画することを意味し、また5行目は座標(100、20)に文字列<特徴語−a1>を背景色=緑で描画することを意味する。この描画内容に基づいて描画されたのが図6の特徴語表示部P2のグラフである。
検索支援インターフェイス画面の検索要求入力窓E1から検索要求として「キーワードa1、キーワードa2」を入力した状態からキーワード検索ボタンB01を押すと、途中色々な処理が行なわれて検索結果のタイトルリストと特徴語に関する情報を表示する図6のようなインターフェイス画面が得られるということをこれまでに述べてきた。以下では検索ボタンが押されて検索要求が情報提供者側の検索支援プログラム143へ送られて検索結果や特徴語などの必要な情報が用意されて利用者側の検索支援プログラム344に返信され、それらの情報にもとづいて図7、図8に示したような検索結果表示部描画データ34422P1や特徴語表示部描画データ34422P2が作成されるまでの処理過程を説明する。
キーワード検索ボタンB01がクリックされると、ボタンが一度押されて次に離された時に利用者側検索支援ルーチン3441におけるボタンが離された時の処理3441MRの一つとして、情報提供者側にキーワード検索の要求を送り、必要な情報を受信するという作業が行なわれる。
図9は図3の状態からキーワード検索ボタンB01がクリックされた時の利用者側検索要求格納エリアの内容の一例を示した図である。検索手法としては「キーワード検索」、検索内容(検索条件)としては「<キーワード−a1>or<キーワード−a2>」、また検索対象データベースは現在選択されている「<文書DB−D1>」が格納される。検索内容は検索要求入力部描画データ34422E1(図4)の表示内容欄に格納されている文字列(この場合「<キーワード−a1> <キーワード−a2>」から作成される。また検索対象データベースは図3のDB選択手段M1の欄に示されているデータベースとなる。実際にはこの情報は検索対象選択部描画データ34422M1(図4)の中に書かれている。
以下図10〜図12では情報提供者側の検索支援プログラム143、およびそこで使われるデータ類について説明する。
図10は情報提供者側計算機1のワークエリア14で稼働する検索支援プログラム143の構成例である。検索支援プログラム143はメインルーチン1431、データエリア1432とサブルーチン類1433〜1439などで構成される。データエリア1432は、メインルーチンやサブルーチンで使われる種々のパラメータを格納するためのエリア14321、検索要求格納エリア14322、検索結果格納エリア14323、特徴語格納エリア14324、特徴語間リンク情報格納エリア14325、特徴語−文書対応表格納エリア14326、文書−特徴語対応表格納エリア14327、特徴語間共起テーブル格納エリア14328などから構成され、サブルーチンとしては単語表記標準化ルーチン1433、単語表記−単語番号変換ルーチン1434a、単語番号−単語表記変換ルーチン1434b、キーワード検索ルーチン1435、連想検索ルーチン1436、特徴語抽出ルーチン1437、特徴語間共起テーブル作成ルーチン1438、特徴語間リンク情報作成ルーチン1439などから構成される。
図11は情報提供者側計算機1の情報保持手段15に保持されている検索対象データベースの一つである<文書DB−D1>という識別名を持つ文書データベースに関するデータ15D1の詳細である。同データ15D1は文書データベース15D11、文書−単語対応データ15D12、単語−文書対応データ15D13、単語頻度データ15D14、クラスタ木15D15などから構成される。以下それぞれのデータの詳細について説明する。
文書データベース15D11は検索される文書のテキストや書誌情報などのデータベースであり、情報提供者側検索支援ルーチン1431では利用者側から文書識別子を指定した閲覧要求を受けとると該当する文書データをこのデータベースから取り出して利用者側に送信する。
文書−単語対応データ15D12は文書番号に対してその文書に含まれる単語の番号とその単語の頻度の組をリストにしたものである。なお対象とする文書のサイズが大きい場合などには全文を単語カウントの対象とせず、要旨など文書全体に書かれている内容を良く反映している部分だけを対象としても良い。なお頻度は省略して単語だけのリストを対応させても良い。
文書番号とはデータベースに含まれている各文書にユニークに与えられている識別番号であり、単語番号は本検索支援システムでキーワードとして扱うことができるすべての単語に対してユニークに与えられている識別番号である。単語に対してその識別番号を得るには単語表記−単語番号変換ルーチン1434a(図10)を用いる。また単語番号に対して単語表記を得るには単語番号−単語表記変換ルーチン1434b(図10)を用いる。これらの変換ルーチンは辞書15D0(図1)中の単語番号−単語表記対応表を参照する。
単語−文書対応データ15D13は文書−単語対応データ15D12と転置関係にあるデータである。すなわち各単語番号に対してその単語を含むような文書番号とその単語の出現頻度の組のリストが対応する。なお頻度は省略して単語だけのリストを対応させても良い。
単語頻度データ15D14は各単語番号に対してその単語が文書DB全体で何回現れるかという頻度F(d)とその単語を含む文書がいくつあるかという文書頻度DF(d)の組が対応しているようなデータである。
クラスタ木15D15はこの文書DBの各文書を類似しているもの同士をまとめるという操作を繰り返して(組になったもの同士も似ているものから順にさらに大きな組にするという操作を繰り返して)階層化したものである。そのためにはたとえば特開平9−62693「確率モデルによる文書分類方法」を用いると高精度の文書クラスタ木を構成できる。(文書における単語の分布状況は文書−単語対応データ15D12から得ることができ、単語の分布状況は単語の全体を基底とする一つのベクトルと見なされるので、その角度で類似度を計るという方法もある。)このクラスタ木は連想検索(文書間類似度に基づく検索)をトップダウンの2分探索により非常に高速に行なうために利用する。探索はキーとなる文書が各分岐地点において候補となる文書クラスタのどれに属する確率が一番高いクラスタを選択するというプロセスで行なわれる。ある文書が文書クラスタに属する確率は前記特開平9−62693の計算方法を用いるのが良い。
図12は情報提供者側検索支援ルーチン1431(図10)の詳細である。同ルーチン1431は利用者側からの検索要求を受けて起動される。始めに分岐14311では検索要求における検索手法の指定に従ってキーワード検索143111または連想検索143112が行なわれる。図9に示す例の検索要求を受けとった場合であれば、検索手法の指定が「キーワード検索」なので、キーワード検索の方が選択される。キーワード検索の場合には検索内容格納エリア344232がキーワードの論理結合となるので、単語−文書対応データ15D13を参照して各キーワードを含む文書番号の集合を得、それらの論理結合となる集合を計算すれば良い。また連想検索の場合には、上記クラスタ木15D15の説明の所で説明した方法でキーとして与えられた文書と類似文書を検索する。検索結果はいずれの場合でも文書識別番号と検索条件との適合度スコアの組の集合であり、それらは適合度スコアの大きい順に検索結果格納エリア1423に格納される。キーワード検索の場合の適合度スコアは例えばいくつのキーワードを含むかでスコアづけを行なうことができ、また連想検索の場合には類似度をスコアとすることができる。
以下特徴語抽出14312、特徴語間共起テーブルの作成143131、特徴語間リンク情報作成143132、特徴語のグラフ配置座標計算143133、特徴語−文書対応表作成143141、文書−特徴語対応表作成143142、などの作業を行い、検索結果と特徴語を表示するのに必要な情報をユーザーへ返信する。
本検索支援方法の特徴は検索結果とともにその特徴情報もプラスして利用者に提示する点にある。ただし、図示及び説明は省略したが、それを希望するかどうかは利用者が選べるようにすることができる。利用者がそれを希望しないというオプションを選んだ場合には検索結果だけを利用者に返信すれば良いので、特徴語抽出14312以下の処理を省略することができる。
検索結果からの特徴語抽出14312および特徴語間共起テーブルの作成143131、特徴語間リンク情報作成143132、特徴語のグラフ配置座標計算143133については特願平8−176174「文献検索支援方法及び装置およびこれを用いた文献検索サービス」に記載されている方法を用いることができるのでここでは簡略な説明にとどめる。特徴語抽出14312ルーチンは検索結果の文書群に含まれるすべての単語各々(X)についてそれらが含まれる文書の数df(X)をカウントする。これは文書−単語対応データ15D12を参照すれば簡単に行なうことができる。また単語頻度データ15D14(図11)を参照し、それらの単語がデータベース全体でいくつの文書に出現しているかという文書頻度DF(X)を知ることができる。df(X)とDF(X)の比が単語Xがいかにこの検索結果に特異的に現れるかという度合を示すので、この値の大きな単語を特徴語として抽出する。ただし、頻度が大きい一般的な単語と頻度が小さい特殊性の強い単語を同一の尺度で比較することは困難なので、検索結果における文書頻度df(X)によりいくつかのクラスに分割し、各頻度クラスからバランス良く特徴語を取るのが良い。
特徴語間共起テーブル作成ルーチンは上記の方法で抽出した特徴語を縦横に取るテーブル形式のデータの作成ルーチンである。縦=特徴語Xと横=特徴語Yの欄には、検索結果の文書集合中で特徴語Xと特徴語Yが共に出現する文書の数CF(X,Y)が入る。
特徴語間リンク情報作成ルーチン143132では特徴語間共起テーブルを参照し、各特徴語(X)から自分自身より頻度の大きい特徴語を関連度の強い順に並べて作成する。特徴語Xと特徴語Yとの関連度の計算方法は色々な方法が可能であるが、一つの方法としては共起文書頻度CF(X,Y)とYの文書頻度df(Y)の比CF(X,Y)/df(Y)を取る方法がある。この値の大きい順にリンク先候補とする。なお抽出した特徴語が常にすべて表示される訳ではないので、実際のリンク先はこのリンク先候補を上位(左)から見ていき表示されるものかどうかを判定し、それが表示されるものであればそれが実際のリンク先となる。またリンク先とは別にどこからリンクが入るかを調べておくと便利なのでそれも調べて情報として取っておく。
特徴語のグラフ配置座標計算ルーチン143133では特徴語の集合とすべての特徴語が表示されるという仮定のもとでの特徴語リンク情報を元に特徴語を2次元配置する際の座標を計算する。前出特開平10−74210号公報の方法を簡単に説明すると縦方向の座標はそれぞれの特徴語の検索結果における文書頻度df(X)とする。(ただし変域をコンパクトにするために対数を取ったり、さらに逆正接関数を施したりする。)横座標については、はじめにリンク先のないノードを予定範囲に均等に配置する。以下再帰的にすべてのリンク先の横座標が決まったノードでリンク先のセットを共有するものを予定範囲内で均等に配置していくという方法で横座標を順次決めていく。なおこの方法ではノードに重なりが生じる場合があるので、重なりが生じた場合には右にある方をさらに右にずらして重なりを避けるようにする。
特徴語−文書対応表作成ルーチン143141では、単語−文書対応データ15D13を参照して、特徴語の一時的な番号に対して、検索された文書中でその単語を含むものの一時的な番号を対応させるようなデータを作成する。ここで一時的な単語番号とは特徴語格納エリアに格納されている特徴語が何番目に格納されているかを示す番号を指す。また一時的な文書番号とは検索結果格納エリアに格納されている文書が何番目に格納されているかを示す番号である。
文書−特徴語対応表作成ルーチン143142では、文書−単語対応データ15D12を参照して、検索された各文書に対してそれに含まれる特徴語の一時的な番号を対応させる表を作成する。
以上の操作を終えて情報提供者側の検索支援ルーチン1431は検索結果と特徴語に関するデータ、および文書と特徴語の関係を示すデータを利用者側へ返信する。以下図13〜17は利用者側へ返信されたデータの例である。
図13は送信された検索結果のデータの一例である。本体部分(a)と表示順序に関するデータ(b)に分かれている。本体の利用者側の検索結果格納エリア34424aには一時的な文書番号、文書選択に関するフラグ、文書に付けられるマークの強度、文書識別子番号、検索条件との適合度スコア、およびタイトルや発行日など、利用者が見て文書を識別しやすい情報などから構成されている。(一時的な文書番号とはこの表の何番目に格納されているかを示す番号であり、実際に文書内容を取りに行く時などには文書識別子番号の方を使う必要がある。ただし、この操作は計算機内部で行われることであり、利用者は、例えば、タイトルを指定すれば良い。)選択フラグとマーク強度は情報提供者側から送られた当初はすべてクリアされた状態になっている。利用者が検索支援インターフェイス322(図3)を操作するとこれらの値が変化し、それに応じてインターフェイス画面が変化することになる。選択フラグは利用者が関心のある文書として指定した時にオン(1)になる。選択された文書から連想検索を行なったり、選択された文書に含まれる特徴語をマーク(強調)したりする場合などに利用される。選択フラグの取る値としてはオン(1)オフ(0)の2値でも良いし、また負の選択(積極的に関心が無いという選択)を許す場合には1/0/−1の3値を取り得るようにしても良い。本実施例では1/0の2値である。一方マーク強度は、特徴語の方にも選択できる機構があり、選択された特徴語を含む文書をマーク(強調)する場合などに利用する。含む特徴語の種類が多いほどマーク強度を高くする。
適合度スコアについては図13の例では最初2つについては2で残りは1となっているが、これはキーワード検索の際に、指定したキーワードのうち何種類を含むかでスコア付けするという方法を採用し、最初の2つについては指定キーワードの<KW−a1>と<KW−a2>の両方とも含んでいるため2点となり、それ以外のものはどちらか一方しか含まなかったので1点となったものである。適合度の計算方法にはこれ以外にも色々な方法が可能である。なお連想(類似度)検索を行なった場合にはスコアは類似度をそのままあるいは何らかの方法で規格化して用いることができる。規格化の方法としては例えばもっとも類似度の高いものを100点として以下比例配分する方法などがある。
図13(b)は文書の表示順序に関するデータである。情報提供者側から送られた当初は一時的な文書番号の順で表示するので、1から順に並んでいる。後に説明するが、本検索支援インターフェイスではマーク強度によるソート機能(ボタンB32(図3参照))があり、文書の付けられたマークの強いものから順番に表示するという機能を提供する。この機能を使う時に文書表示順序を変えたり、元に戻したりするため、この表示順序格納エリア34424bが実質的に使われる。
図14は特徴語に関するデータの一例である。利用者側の特徴語格納エリア34425に格納されたデータは一時的な特徴語番号、グラフ表示に出現するかどうかを示すフラグ、選択フラグ、マーク強度、単語表記、特徴語グラフでの表示位置、頻度クラスなどから構成される。
グラフ表示に出現するかどうかのフラグは図14の例では最初の5個については1(出現)あとは0(出現せず)となっている。この5個というのは図3に示した画面の選択数L23の設定でグラフに出現する単語の個数を規定するものであるが、この値を実際にいくつにするかは情報提供者側、また利用者側双方でパラメータ設定することができる。利用者側で設定がない場合には情報提供者側の設定値をデフォールトで用いることになる。
選択フラグとマーク強度については検索結果の場合と同様、初期状態ではすべてクリアされている。グラフ表示位置はサーバー側の検索支援ルーチン1431が特徴語のグラフ配置座標計算ルーチン143133(図12)で計算した値である。頻度クラスは特徴語抽出ルーチン14312(図12)において特徴語の検索結果中での文書頻度の大小に応じてクラス分けた値である。クラス1は比較的高頻度、クラス2は中程度でクラス3は比較的低頻度であることを示す。
図15は特徴語間リンク情報データの一例である。特徴語のグラフ表示において、各特徴語からどの単語にリンクを張るかを優先順位の高い順に並べたものであり、グラフを表示する時に利用する。データは一時的な特徴語番号に対して、リンク候補の一時的な特徴語番号のリストが対応する形になっている。リンク先はグラフに表示する単語セットが決まった時点でリンク候補から最も優先的なリンク先を選んで得られる。例えば一時的特徴語番号3の特徴語からの優先順位は1、2...であるが図14のデータの場合ではグラフ表示は一時的特徴語番号1〜5が表示されるので最初の1番がリンク先となる。リンク元リストはリンク先データから自動的に作られる。
図16は特徴語−文書対応表の一例である。一時的な番号の付された各特徴語に対して、検索結果の文書中、それを含む文書の一時的な番号の文書リストが対応するという形式を取る。これは特徴語−文書対応表作成ルーチン143141(図12)で単語−文書対応データ15D13(図11)を参照して作成したものである。
図17は文書−特徴語対応表の一例である。検索結果の一時的な番号の付された各文書に対して、その文書に含まれる特徴語の一時的な番号のリストが対応するという形式を取る。文書−特徴語対応表作成ルーチン143142(図12)で文書−単語対応データ15D13(図11)を参照して作成したものである。
特徴語−文書対応と文書−特徴語対応は転置の関係にある。例えば図16で一時的文書番号が1の文書は一時的な特徴語番号が1、2、4の欄に出現しているが、図17では文書番号1の欄に特徴語番号1、2、4が出現している。
以上の受信データ(検索結果と特徴語データ)にもとづいて利用者側検索支援ルーチン3441(図5)は検索結果描画データの更新34412と特徴語描画データの更新34413を行なう。検索結果描画データの更新では検索結果描画データ作成ルーチン3443(図2)をサブルーチンとして用い、特徴語描画データの更新では特徴語グラフ描画データ作成ルーチン3444をサブルーチンとして用いる。またこれらの描画データ作成ルーチンはパラメータ格納エリア34421(図2)で設定されているパラメータ値を利用する。これらのルーチンとパラメータ値の詳細を図18〜図21A、Bを用いて説明する。
図18は検索結果描画データ作成に用いるパラメータ344211の詳細である。検索結果を表示する際の行間隔(Δy)、マーク表示位置(x1)、マークずらし幅(Δx1)、マークのビットマップ識別子(Bm)、選択窓表示横座標(x2)、選択窓サイズ(h、v)、選択されていない時の窓表示色(CS0)、選択されている時の窓表示色(CS1)、スコア表示位置右端の横座標(x3)、タイトル表示位置左端の横座標(x4)、文書表示中のタイトル表示部の背景色(CD)、タイトル表示用フォント(F)、などのパラメータがある。ここで()の中に示した文字列は、検索結果描画データ作成ルーチン3443の説明で引用するためのものである。
図19A、Bは検索結果描画データ作成ルーチン3443の詳細であり、検索支援ルーチン3441(図5)の検索結果描画データ更新ルーチン34412で使われるものである。初めに初期設定34431にて表示順序を表す変数iと表示位置の縦座標値を示す変数yをそれぞれ0に設定する。ループ34432では検索結果の文書の数だけ以下の処理を繰り返す。はじめに処理34433では変数iの値と変数yの値をそれぞれ1とΔyだけインクリメントする。Δyはパラメータ344211(図18)の中の検索結果を表示する際の行間隔の値として設定されている値である。(表示位置の縦座標は上から下に向かって数値が大きくなるものとする。)また変数nにi番目に表示する文書の一時的な番号を代入する。この値は検索結果表示順序格納エリア34424b(図13b)を参照して、表示順序iに対応する番号を取ることによって得られる。なお以下の説明では正確には「一時的な文書番号がnの文書」と言うべきところを特に誤解が生じるおそれがない限り「文書n」と略記する。
続いてマーク描画データ作成ルーチン34434、選択窓描画データ作成ルーチン34435、スコア描画データ作成ルーチン34436、タイトル等描画データ作成ルーチン34437を行なう。はじめの2つについてはそれぞれ図19B(b)と(c)で詳しく示す。スコア描画データ作成ルーチン34436では、「位置(x3、y)に図形種=文字列、貼り付け位置=右下、文字列=(文書nのスコアの10進表記)」という描画データを検索結果描画データ34422P1(図7)に追加する。ここでx3はスコア表示位置右端の横座標として検索結果描画データ作成用パラメータ344211(図18)に設定されているものである。
最後にタイトル等描画データ作成ルーチン34437では、まず当該文書が表示中であれば変数colに文書表示中のタイトル表示部の背景色CD(図18)を代入し、そうでなければ透明とする。当該文書が表示中であるかどうかは、当該文書の識別番号(検索結果格納エリア34424aの文書番号欄から分かる)と検索支援ルーチンで使われる変数MD(表示中の文書の識別番号(図5))の値が一致するかどうかで判定できる。続いて「位置(x4、y)、図形種=文字列、貼り付け位置=左下、背景色=col、文字列=(文書nのタイトル)」という描画データを検索結果描画データ34422P1に追加する。ここでx4はタイトル表示位置左端の横座標としてパラメータ設定されている値(図18)である。文書nのスコアと文書nのタイトルは検索結果格納エリア34424aの該当欄から得ることができる。
図19B(b)はマーク描画データ作成ルーチン34434の詳細である。この作業ではマーク用のビットマップ識別子として変数Bm(図18)にパラメータ設定されているマーク記号(チェックマークなど)を表示するための描画データを検索結果描画データ34422P1(図7)に追加する、という処理344343を文書nのマーク強度分(検索結果格納エリア34424aから得られる)だけ繰り返すというプロセスである。表示の横座標は初期設定344341でマーク表示位置としてパラメータ設定されている値x1(図18)が代入され、一回ごとに同じくマークずらし幅として設定されている値Δx1だけずらしながらマークを表示する。このためマーク強度に比例した太さのチェックマークが描かれることになる。
図19B(c)は選択窓描画データ作成ルーチン34435の詳細である。始めに条件判定ルーチン344351では文書nが選択されているかいないか(検索結果格納エリア34424aの選択フラグから分かる)を判定し選択されている場合には窓表示の色(col)を選択時の選択窓表示色(CS1)として指定されている色(赤などの目立つ色)とし、そうでない場合にはCS0として指定されている目立たない色(透明など)とする。つづいて条件判定ルーチン344352では、ドラッグモードが文書選択中(MM=11)の時であって、現在処理中の文書が、ドラッグ開始時にマウスが押された文書の位置と、現在マウスが指示している位置の間(端も含める)にある時、ドラッグ開始時にマウスを押した位置の文書がもともと選択されていたならば、窓表示の色を示す変数colに非選択色CS0を代入し、選択されていなかったならば変数colに選択色CS1を代入する。さらに選択窓のサイズとして、指定されてい値(h、v)を用い、「位置(x2、y)に図形種=矩形、サイズ(h、v)、色=col」という描画データを検索結果描画データ34422P1に追加する。これにより、選択状態にあるか、または現在ドラッグ中で(その時点でマウスを離せば)選択状態になる予定の文書の選択窓は選択色(CS1)になり、そうでないばあいには非選択色(CS2)となる。
図20は特徴語グラフ描画データ作成用パラメータ344212の詳細である。特徴語文字列を表示する部分の背景色、フォント種類、枠線の色についての指定であり、それぞれ、選択時と非選択時、またマークされた場合とマークがない場合の値が指定されている。この例では特徴語が選択されていない場合の背景色は緑、フォントは通常、また選択されている場合には背景色がオレンジ、フォントが強調用のフォントとなっている。またマークされている場合の枠線色は赤、そうでない場合は透明と設定されている。一般に選択された場合、やマークがある場合には目立つ色、目立つフォントを用いるのが良い。
図21A(a)は特徴語グラフ描画データ作成ルーチン3444の詳細であり、検索支援ルーチン3441(図5)の特徴語描画データ更新ルーチン34413で使われるものである。始めに検索支援ルーチン3441でのドラッグモードが特徴語移動中(MM=21)の時には変数ΔMにマウスが押された位置からの移動量(縦、横)を代入し、またドラッグモードが特徴語選択領域設定中(MM=22)の時には、特徴語選択領域(マウスが押された位置と現在の指示位置を対角とする矩形を描画するデータを特徴語描画データ34422P2に追加する。
続いて表示フラグがオンになっている特徴語(一時的番号=i)についてその特徴語のノードを描画するデータとその特徴語からのリンクを描画するデータを作成する。始めに処理34444ではplaceという変数に特徴語iの表示位置を代入する。その値は特徴語格納エリア34425(図14)から得ることができる。また特徴語の表示フラグがオンになっているかどうかも同じく特徴語格納エリアの該当する欄から得ることができる。続いて、モードが特徴語移動モード(MM=21)であって、かつ特徴語iの選択フラグがオンである場合には、変数placeに先ほど計算したΔM(マウス移動量)を加える。(すなわちマウス移動量に応じて表示位置が変化する。)このようにして、特徴語iからの描画データの作成ルーチン34446(図21A(b))と特徴語iのノードの描画データの作成ルーチン34447(図21B(c))を行なう。
図21A(b)は特徴語iからのリンクの描画データの作成ルーチン34446の詳細である。特徴語iからのリンク先がある場合には、そのすべてについて以下の処理を行なう。まず処理344462ではリンク先の表示位置(特徴語格納エリア34425における)を変数endに代入する。続いて、モードが特徴語移動モード(MM=21)であって、かつリンク先の選択フラグがオンである場合には、リンク先の表示位置変数endにマウス移動量であるΔMを加える。このように設定しておいて、「位置=place、図形種=線分、終点=end」という描画データを特徴語描画データ34422P2に加える。
図21B(c)は特徴語iのノードの描画データの作成ルーチン34447についての詳細である。特徴語iが選択されているかいないかで背景色cbとフォントftを設定値にセットし、特徴語iがマークされているかいないかで枠線色cfを設定値にセットする。そして「位置=(特徴語iの表示位置)、図形種=文字列、貼り付け位置=センター、背景色=cb、フォント=ft、枠線色=cf」という描画データを特徴語描画データ34422P2に追加する。
以下では本検索支援インターフェイス322が利用者に提供するさまざまな機能を説明する。利用者はこれらの機能を色々と組み合わせて利用することにより、検索結果を分析したり、またその情報を活かして検索方法や検索条件を改良したりしながら望みの検索結果へと近付いていくことができる。
このインターフェイスを動かすための検索支援ルーチン3441はすでに図5において示したが、ボタン操作やマウス操作など各種入力に対してどのような作業を行なうかについては極一部を示すに留まっていた。図5におけるキーボード入力に対する処理3441KB、マウスが押された場合における処理3441MP、マウスを押しながら移動している時の処理3441MD、マウスを離した時の処理3441MRがそれである。以下図22〜図26A、Bを用いてそれらについて詳述する。
図22はキーボード入力に対する処理3441KBの詳細である。入力を受け付ける可能性のある部品がいくつかあるので、始めにどの部品が入力を受け付ける状態にあるかを判定し、検索要求入力窓E1(図3)が受け付け状態にある場合にはインターフェイス描画データ格納エリア34422(図4)の検索要求入力部描画データ34422E1の中の表示内容34422E13のカーソル位置34422E15で示された所へ入力された文字を追加していく。この内容は検索支援ルーチン3441におけるインターフェイス画面描画処理34414(図5)でインターフェイス上の検索要求入力窓E1に描画される。(従ってキーボードからの入力が検索要求入力窓E1に書き込まれていくように見える。)なお削除入力の処理方法についてはいくつかバリエーションが可能であるが、マーク位置が指定されている場合にはマーク位置からカーソル位置まで削除され、またそれがない場合にはカーソル位置の直前の文字が削除されるようにするのも一法である。
また検索要求入力窓E1が受け付け状態にある場合の特殊な取り決めとして、改行が入力された場合にはキーワード検索ボタンを押した場合と同じ処理が行なわれるということにしておくと使い易い。
その他入力受け付け窓としてはテキスト入力ボタンB03が押された場合に開かれるテキスト入力部TE1(図36の説明で後述)があり、そこへキーボードからテキストを入力する場合がある。詳細はテキスト入力機能のところで説明する。
図23A(a)は検索支援ルーチン3441においてマウスが押された場合の処理3441MPの詳細である。いずれかの入力窓が押された場合にはその入力窓を入力受け付け状態にする(処理3441MP−E)。また押された位置が検索結果表示部P1の場合の処理3441MP−P1と、特徴語表示部P2の場合の処理3441MP−P2は処理が複雑になるのでそれぞれ図23A(b)と図23B(c)に分けて示した。
図23A(b)は検索結果表示部P1でマウスが押された場合の処理3441MP−P1の詳細である。始めに処理3441MP−P1−1では検索支援ルーチン3441で使われている変数MS(図5)に上から何番目の文書の表示部で押されたかを記録する。次にマウスが押された位置による分岐3441MP−P1−2があり、いずれかの文書の選択窓(小さい矩形)である場合(図6参照)には、やはり検索支援ルーチン3441で使われている変数MMを文書選択中モードであることを示す11とする。また変数MFには該当文書のマウスが押される直前の選択フラグの値(検索結果格納エリア34424a(図13(a))から得られる)が代入される。また押された位置がいずれかの文書のスコアあるいはタイトル表示部であった場合には上記モード変数MMを表示文書指定中であることを意味する値(=12)とする。
これらの値はマウスを押しながら移動する時、また離す時に参照されてそれぞれに応じた処理をするために使われる。従って実際にどのような効果を及ぼすかについてはマウスを移動中、あるいはマウスを離した時の処理の所で示す。
また検索結果描画更新フラグFr(図5)を1(オン)にすることにより検索結果描画データが更新されるようにする。
図23B(c)は特徴語表示部P2に特徴語グラフが表示されている時に特徴語表示部でマウスが押された場合の処理3441MP−P2の詳細である。
特徴語に対するマウス操作としては、指示した特徴語を検索キーワードとして用いる場合と選択/選択解除(+移動)を行なう場合がある。本実施例では左マウスで選択/選択解除を行い、右マウスでキーワードとしての追加、あるいは削除ができるような設定にしている。もちろんこれらを入れ換えても構わない。またシフトキーと併用した場合としなかった場合で異なる操作ができるようにしているが、これらもまた入れ換えること可能である。したがってここでの説明は可能な設定の中の一つの場合を実現する方法である。
マウスが押された場合の処理3441MP−P2ではまずマウスが押された位置がいずれかの特徴語の上であるかどうかで分岐する。特徴語の上で押された場合には、マウスの種類により分岐し、左マウスの場合には以下の作業を行なう。はじめにシフトキーが押されていたかどうかで条件分岐があり、左マウスとシフトキーを併用した場合には処理3441MP−P2−1が行なわれ、押された特徴語のみについて選択/非選択を反転する。すなわち特徴語格納エリア34425(図14)の選択フラグ欄の値を書き換える。また左マウスをシフトキーを用いずに押した場合には、さらに押された特徴語の選択状態により分岐し、もともと選択状態にあった場合には何も行なわず、非選択状態であった場合にはその特徴語は選択状態にし、その他の特徴語はすべて非選択状態にするという処理3441MP−P2−2を行なう。
また左マウスを用いて上記のような操作を行なった後に押された特徴語が選択状態となった場合には検索支援ルーチン3441でのモード変数MMの値を特徴語移動中であることを示す値(=21)とする。これにより、押したままマウスを移動すると選択されている特徴語をマウスの動きにつれて動かすことができるようになる。
右マウスで特徴語の上を押した場合には特に作業が行なわれないが、離す時には選択された特徴語を検索要求に加えたり削除したりという作業が行なわれる。(後述するマウスを離した時の作業参照。)
一方マウスが押された位置がいずれの特徴語の上にもない場合には処理3441MP−P2−3が行なわれ、上記のモード変数MMの値が特徴語選択領域設定中であることを示す値(=22)に設定される。これにより、押したままマウスを移動すると、特徴語選択領域を示す矩形が特徴語表示部P2に表示され、マウスを離した時にその特徴語選択領域と重なりのある特徴語がすべて選択されるという操作ができる。
また特徴語描画更新フラグFc(図5)を1(オン)にすることにより特徴語表示部の描画データが更新されるようにする。
図24はマウスを押したまま移動中(ドラッグ作業中)の処理3441MDの詳細である。直前にマウスが押された位置により以下の処理を行なう。検索結果表示部の選択窓で押された場合には処理3441−MD1において検索支援ルーチン3441の検索結果描画更新フラグFr(図5)をオン(=1)にして、移動中は常に検索結果表示部の描画内容が更新されるようにする。また特徴語表示部で押された場合には処理3441−MD2において特徴語描画更新フラグFcをオン(=1)にして、移動中は常に特徴語表示部の描画内容が更新されるようにする。またそれ以外でいずれかのボタン上で押された場合には、現在位置がその押された時と同じボタン上にあればそのボタンを押されている状態とし、そうでない場合にはそのボタンを押されていない状態とする。(インフェース描画データ格納エリア34422(図4)の該当するボタンに関するデータを書き換える。)
ところで、はじめの二つの場合には、それぞれ検索結果描画更新フラグFrと特徴語描画更新フラグFcがオンになって、移動中は常にそれぞれの描画内容が更新されることになるが、それが実際に画面上でどのように現れるかについて説明する。
はじめに検索結果表示部の選択窓からドラッグがスタートした場合であるが、検索結果描画データの更新を行なう検索結果描画データ作成ルーチン3443の選択窓描画データ作成ルーチン34435(図19B(c))では分岐344352でモードの判定を行い、文書選択モード(MM=11)にある時には直前にマウスが押された位置(MS)と現在の指示位置の間にある文書については、ローカルに選択状態を変更し、直前にマウスが押された位置の文書の選択フラグ(変数MFに代入されている)と反対の値にするという操作が行なわれる。(変数MM、MS、MFはマウスが押された時の処理3441MP−P1(図23A(b))で設定されている。)すなわち、非選択状態にあった文書の選択窓をマウスで押して、押したままマウスを移動しているとすると、押した位置と現在位置の間のすべての文書の選択窓が選択状態の色で描画されることになる。
ここで注意すべきことは、文書の選択状態が変化するといっても、それはローカルに行なわれていることであって検索結果格納エリア34424a(図13)の選択フラグを書き換えているわけではないということである。すなわち各文書のもともとの選択フラグは保存されているので、マウスの動きと共に一旦変化したものをもとにもどすことができる。例えば上から3番目の文書からスタートしてそのまま下方に移動して7番目までいくと(3番目の文書がもともと選択されていなかったとすると)3番から7番までは(もとの状態が何であれ)選択状態になる。次に押したまま向きを変えて上方に移動して5番目まで行った状態では3番から5番までが選択状態となり、それ以外(6番7番も含めて)はもともとの状態に復帰する。
次に直前にマウスを押したのが特徴語グラフを表示中の特徴語表示部の場合である。移動中に描画内容が変化するのは次の2つの場合である。一つは特徴語の上で押され、その直後にその特徴語が選択状態になった場合であり、もうひとつは特徴語が表示されていない地の部分で押された場合である。処理3441MP−P2(図23B(c))で前者ではモード変数が特徴語移動モード(MM=21)に設定され、後者では特徴語選択領域設定中モード(MM=22)に設定されていることに注意する。
実際に描画データが作成されるのは特徴語グラフ描画データ作成ルーチン3444(図21A(a))においてであるが、はじめに特徴語移動モード(MM=21)の場合についてみると、分岐34441でモードの判定が行なわれ、特徴語移動モードの場合には変数ΔMにマウスの移動量が記録される。この移動量は選択されている特徴語の描画データを作成する際に特徴語ノードの描画位置は特徴語格納エリア34425(図14)に書かれている座標が基準となるが、選択されている特徴語については処理34445ではこのマウス移動量がプラスされる。すなわちマウス移動分だけ描画位置がずれることになる。またリンクの描画データ作成ルーチン34446(図21A(b))でもリンクの始点と終点の各々について対応する特徴語が選択されている場合には座標にΔMだけプラスされるので、リンクの方も特徴語の移動とともに移動して描画されることになる。
次に特徴語選択領域設定モード(MM=22)の場合であるが、この場合には条件分岐34441にて処理344412が選択され、特徴語選択領域としてマウスが押された位置と現在の指示位置を対角とする矩形を描画するデータが作成され、それが描画されることになる。
図25A、Bは検索支援ルーチン3441において、マウスが離された(押された状態からもとに戻した)時の処理3441MRの詳細である。図25A(a)は全体図であり、直前にマウスを押した位置により検索結果表示部であった場合(3441MR−P1、図25A(b))、特徴語表示部であった場合(3441MR−P2、図25B(c))、その他の場合で押された時と同じ部品上で離された場合(3441MR1、図26A、B)に分けて示している。
図25A(b)は直前に押された位置が検索結果表示部であった場合にマウスが離された時の検索支援ルーチン3441の処理3441MR−P1の詳細である。
直前に押された位置で条件分岐し、いずれかの文書の選択窓で押された場合(モード変数MMが11になっている場合)には処理3441MR−P1−1が行なわれ、マウスが押された位置の文書の押される直前の選択フラグ(変数MFに代入されている)と反対の値をtmpとし、マウスが押された位置から離された位置までの間(端も含めて)に表示されているすべての文書について、検索結果格納エリア34424a(図13a)における選択フラグをtmpとする。
また直前に押された位置がいずれかの文書のスコアあるいはタイトルであった場合(モード変数MMが12になっている場合)には処理3441MR−P1−2が行なわれ、検索支援ルーチン3441における表示中の文書の識別番号変数(MD)に指示された文書の識別番号を代入する。表示手段32上に文書閲覧手段322Rが開いていない場合にはそれを開く。さらに該当する文書の内容を送信するように情報提供者側の検索支援プログラム143に要求を送り、送られてきた文書内容を文書閲覧手段322Rに表示する(後述の図27の説明参照)。
なおこれらの作業を行なう場合、マウスを押す時には実際に検索結果表示部P1に見えている部分で行なわれる必要があるが、離す時には隠れている部分であっても構わない。
最後に処理3441MR−P1−3では、直前にマウスが押された位置に関わらず検索支援ルーチン3441のモード変数MMを0にして通常状態に戻す。
図25B(c)は直前に押された位置が特徴語グラフ表示中の特徴語表示部であった場合にマウスが離された時の検索支援ルーチン3441の処理3441MR−P2の詳細である。
検索支援ルーチンのモード変数MMの値で異なった処理を行なう。特徴語グラフ表示中の特徴語表示部でマウスが押されているので、モード変数MMの取り得る値としては0、21、22がある。21は選択されている特徴語を移動中のモード、22は特徴語選択領域を設定しているモードであり0はそれ以外である(図23B(c)における処理3441MP−P2参照)。
特徴語移動中のモード(MM=21)となっているのは、直前にマウスを押した時に左マウスを用いて特徴語ノードの上を押した場合であり、しかも押した直後にその特徴語が選択状態になっている場合であるこの場合にマウスを離した場合には処理3441MR−P2−1が行なわれ、選択状態にあるすべての特徴語について、特徴語格納エリア34425(図14)における表示位置座標を現在のマウス指示位置と直前に押された時の位置の差分だけ変化させる。マウスを押してから以降移動中には特徴語グラフ描画データ作成ルーチン3444において描画データの座標を計算をする時に同様の処置を行なってきているが、特徴語格納エリア34425の表示位置そのものは変化させていなかった。マウスが離されたことをもって、特徴語の移動先が確定したと見なし、特徴語格納エリア34425の座標位置が書き換えられた訳である。
次にマウスを離した時点で特徴語選択領域設定中モード(MM=22)となっているのは、直前にマウスを押した位置がいずれの特徴語ノードの上でもない地の部分を押した場合である(図23B(c)処理3441MP−P2−4参照)。この場合にマウスを離した場合には処理3441MR−P2−2が行なわれる。マウスを離す時にシフトキーを押していたかいないかで、異なった処理を行なう。シフトキーを押していた場合には、特徴語選択領域(マウスを押した位置と離した位置を対角とする矩形領域)と重なる特徴語のすべてについてその選択/非選択状態を反転させる。またシフトキーを押していなかった場合には、特徴語選択領域と重なる特徴語をすべて選択状態とし、それ以外のすべての特徴語を非選択状態とする。(いずれの場合でも特徴語格納エリア34425の選択フラグを書き換える。)
またこの特殊な場合であるが、特徴語表示部P2の特徴語を表示していない地の部分をシフトを押さずにクリックすると、特徴語表示領域が特徴語を表示していない部分の一点となるため、どの特徴語とも重ならず、結果としてすべての特徴語が非選択状態になる。なお同じ作業は後述する選択解除(右)ボタンを押しても行なうことができる。
以上2つの場合以外の場合には通常モード(MM=0)となっている。(右マウスを用いた場合と、左マウスを用いて特徴語ノード上を押し、押した直後にその特徴語が非選択状態となった場合がある。)この内、右マウスを用い、直前に押した位置がいずれかの特徴語ノードの上であり、同じ特徴語の上でマウスが離された場合には、直前にマウスを押した時にシフトキーを併用したかしないか、また指示された特徴語の選択フラグのオン/オフにより、以下のような作業を行なう。シフトキーを押しながらで、かつ選択フラグがオンの場合には検索要求入力欄にある単語の内で、選択状態にある特徴語のいずれかと一致するものをすべて削除する。シフトキーを押しながらで、かつ選択フラグがオフの場合には検索要求入力欄にある単語の内で、指示された特徴語と同じ単語をすべて削除する。シフトキーを押さない場合で、選択フラグがオンの場合には選択状態にある特徴語をすべて検索要求入力欄に追加する。シフトキーを押さない場合で、選択フラグがオフの場合には指示された特徴語だけを検索要求入力欄に追加する。
なお最後にモード変数MMを0にして通常状態に戻す作業3441MR−P2−4を行なう。
図26A、Bは検索支援インターフェイス322上のボタン等をクリックした時の処理の詳細である。正確にはボタンなどの部品上でマウスが押され、同じ部品上でマウスが離された場合の作業の詳細であるが、ほとんどの場合はクリック作業によって行なわれるので、記述を見やすくするため特に必要がない限りクリックされた場合と表現することにする。クリックされた部品によって作業内容が分岐する。以下図の順序に従って説明する。
キーワード検索ボタンB01がクリックされた場合にはキーワード検索要求を情報提供者側計算機1に送り、検索結果と特徴語などの付随情報を受けとる。また検索結果描画データと特徴語描画データを更新する必要があるため、検索支援ルーチン3441でのそれぞれの更新フラグFrとFcを1(オン)にする。
連想検索ボタンB02の場合もキーワード検索の場合と同様であるがこの場合には検索要求の内容(図9)において、検索手法の指定が「連想検索」となり、また検索内容の指定は単語列もしくはネットワーク上のアドレス(インターネットのURLなど)を指定することができる。ネットワーク上のアドレスが指定された場合には情報提供者側ではまず指定されたアドレスにある文書を取ってきて、そこに含まれる単語の列を構成し、それを連想検索の入力とするという作業を行なう。
連想検索を行なった場合の検索結果と特徴語情報はキーワード検索の場合と同じ形式である。ただし、検索結果格納エリア34424a(図13a)の適合度スコアの欄にはキー文書と検索結果の文書との類似度(あるいは関連度)もしくはそれを正規化したものが入ることになる。特徴語情報は検索された文書群から作るのでキーワード検索の場合と同じである。なおこの場合にも描画更新フラグFrとFcを共にオンにする。
テキスト入力ボタンB03の場合にはテキスト入力用の別ウィンドウとしてテキスト入力手段322T(図36参照)を開く。テキスト入力手段の入力部TE1からキーボード入力、あるいはカットアンドペースト作業などにより、興味のあるフレーズや文、パラグラフ、あるいはさらに長い章や節、全文などを入力して、それをキーとして連想検索を行なうためのものである。
拡大(左)ボタン(B11)は検索結果中の一つ以上の文書が選択されている場合にそれらの文書群をつなぎ合わせたものをキーとして連想検索を行なう。Fr、Fc共にオンにする。
刈込みボタン(B12)は検索結果中の一つ以上の文書が選択されている場合に、選択されている文書のみを検索結果とする。なおそこからの特徴語の抽出を改めて行なう必要があるので、選択された文書の集合を情報提供者側へ送り、それらから特徴語抽出を行なった結果を受けとるという作業を行なう。(Fr=Fc=1)
選択解除(左)ボタン(B13)は文書の選択状態をすべて解除する。すなわち検索結果格納エリア34424aの選択フラグをすべて0にする。(Fr=1)
マークタイトルボタン(B31)は選択された特徴語を含むような検索結果の文書を目立たせるもので、検索結果表示部の該当する文書の左端などにチェックマークなどのマークを付ける機能である。なお複数の特徴語が選択されている場合には、それらをより多種類含む文書をより目立たせるため、その種類数に比例した太さのマークを付けるのも有効である。なお実際の作業としては、特徴語文書−対応表格納エリア34427のデータ(図16)を参照すれば選択されている各特徴語がどの文書に含まれているかが分かるので、選択されている特徴語の各々についてそれを含む検索結果の文書をしらべ、検索結果格納エリア34424aのマーク強度の該当する欄の値を1ずつ増やしていけば良い。(Fr=1)
ソートボタン(B32)は検索結果に付けられたマークの強さの順に検索結果の文書を並べ替えるためのものである。これによって利用者はより強いマークがついた文書からまとめて見ることができて便利である。実際には一般的なソート機能を用いて、検索結果格納エリア34424aのマーク強度欄の数値の大きい順に一時的文書番号を並び替えたものを検索結果表示順序格納エリア34424b(図13b)に格納する。なお強度が同じ場合にはもとの順序を保存する(一時的文書番号の小さい順にする(Fr=1))。
検索結果描画データ作成ルーチン3443(図19A、B)はこの検索結果表示順序格納エリア34424bの順序で該当する一時的文書番号の文書から順に表示するので、マーク強度の強い文書から表示されることになる。マーク強度が同じ場合にはオリジナルの順序を保存して表示される。
特殊な場合としてマークをすべてクリアした状態でソートボタンをクリックすると、オリジナルの順序が回復できる。これはマーク強度が一律に0なので、すべてオリジナルの順序を保存するように並び替えられるからである。これはマークづけとソートを行なって順序が入れ替わった後にはじめの並びの状態にもどしたい場合に便利な機能である。
クリア(左)ボタン(B33)は検索結果の文書のマーク強度をすべて0にする(Fr=1)。これによってマークをすべて消すことができる。
マーク特徴語ボタン(B41)は選択されている文書に含まれる特徴語を目立たせるためのものである。すなわち特徴語表示欄P2に表示される特徴語が選択されている文書のいずれかに含まれる場合には強調した表示にする。たとえば赤などの目立つ色の枠線を付けたり、文字のフォントを変えたりする方法などがある。
実際の作業としては、文書−特徴語対応表格納エリア34428のデータ(図17)を参照してどの文書がどの特徴語を含むかが分かるので、選択されている文書の各々についてそれに含まれる特徴語を調べ、特徴語格納エリア34425(図14)のマーク強度の該当する欄の値を1ずつ増やしていけば良い(Fc=1)。
特徴語グラフ描画データ作成ルーチン3444の特徴語ノードの描画データ作成ルーチン34447(図21B(c))では特徴語がマークされているかどうかを判定して、マークされている場合には特徴語グラフ描画データ作成用パラメータ344212(図20)で設定されている強調色(CFM1)を枠線に用いるので、これによりマークされた特徴語が強調表示されることになる。
選択ボタン(B42)はマークされた特徴語を一括して選択状態にするという機能である。実際の作業は特徴語格納エリア34425(図14)の各特徴語について、マーク強度が0の場合には選択フラグを0としてそれ以外の場合には選択フラグを1とする(Fc=1)。
クリア(右)ボタン(B43)は特徴語に付けられたマークをクリアするためのものである。すなわち特徴語格納エリア34425のマーク強度欄をすべて0にする(Fc=1)。
選択解除(右)ボタン(B23)は特徴語の選択状態をすべて解除する。すなわち、特徴語格納エリア34425の選択フラグ欄をすべて0にする(Fc=1)。
拡大(右)ボタン(B21)は選択されている特徴語からリンクを一つ辿って到達できる特徴語をすべて選択状態に加える機能である。特徴語格納エリア34425の各特徴語の内、選択状態にあるものの各々について、特徴語間リンク情報格納エリア34426(図15)を参照し、リンク先とリンク元の特徴語を知り、それらをすべて選択状態にすることで行なわれる(Fc=1)。
終了ボタン(B04)は本検索支援インターフェイスを終了するためのものである。
DB選択手段(M1)は検索対象とするデータベースを選択するためのものであり、利用可能なDBの名称がメニュー形式で提示されそこから検索対象を選ぶことができる。DB選択手段の選択肢が表示されている時にその中のどれかをクリックした場合には指示されたデータベースが検索対象として選択される。
テキスト入力手段322Tの連想検索ボタン(TB1)クリアボタン(TB2)、終了ボタン(TB3)については後に図36を用いて説明する。
以下では本検索支援インターフェイス322を使って各種操作をした時に画面表示がどのように変化するかについて説明する。なおその時に検索支援ルーチン3441でどのような作業が行なわれるかについては図5、図19A、B、図21A、B、図23A、B〜図26A、Bの説明で詳しく述べているのでここでは簡単に触れるにとどめる。
図27は検索結果の文書の一つ一つを閲覧している時の表示画面の例である。検索作業(キーワード検索あるいは連想検索)を行なうと検索支援インターフェイス322の検索結果表示部P1には検索結果のタイトル一覧などが表示されている。利用者は関心のあるもののタイトル部分をマウスなどでクリックすることによりその内容を表示して読むことができる。
この時の検索支援ルーチン3441の作業は以下の通りである。マウスを押した時点で処理3441MP−P1−4(図23A(b))が行なわれ検索支援ルーチン3441のモード変数MMが表示文書指定中モード(=12)に設定され、マウスを離した時には処理3441MR−P1−2(図25A(b))が行なわれ、文書閲覧手段322Rがまだ開かれていなければそれを開き、該当する文書の内容を情報提供者側検索支援プログラム143から受けとり、それが文書閲覧手段322Rに表示されるという作業が行なわれる。
なお前記処理3441MR−P1−2では検索支援ルーチンで使われる、表示中の文書の識別番号を示す変数MDに文書閲覧手段322Rに表示されている文書の識別番号が代入されるので、検索結果描画データ作成ルーチン3443のタイトル描画データ作成ルーチン34437(図19A、B)では表示中の文書に当たる文書のタイトルの背景色を周囲とは異なる色(CD=ライトブルー(図18))で表示して目立たせる。本図27では、タイトル部に下線を引いてそのことを示している。
別のタイトルをクリックすれば同じ文書閲覧手段322Rに該当する文書の内容が新たに表示される。この作業を繰り返すことにより、利用者は検索結果の中から望みのものの内容を読むことができる。また印刷ボタンRB1を押せば印刷手段36(図1)から本文内容をプリントアウトすることができる。
図28は特徴語の選択によりタイトルへのマークづけを行なう作業をしている時のインターフェイス画面の変化を示す図である。(a)は検索を行なった後の状態(図6の状態)から興味のある特徴語として<特徴語−a2>と<特徴語−a5>をシフトキーを押しながら左マウスで順番にクリックして選択状態としたところである。選択された特徴語は実際には背景色を目立つものに変えたり、フォントを目立つものに変えたりして示されるが、本図ではそのことを特徴語の先頭に星印☆を付けて示している。
特徴語をシフトキーを押しながら左マウスでクリックすると検索支援ルーチン3441では作業3441MP−P2(図23B(c))が行なわれ、押された位置の特徴語の選択/非選択が反転する(他の特徴語の選択/非選択には影響しない)ので、ここでは次々にクリックした特徴語を選択状態に変えることができる。(なお同じことをシフトキーを押さずに左マウスで順番にクリックした場合には作業3441MP−P2−2の方が行なわれ、この場合には2番目にクリックを行なうと始めに選択状態にした特徴語が選択解除されてしまう。従って複数の特徴語を一つ一つのクリック操作で選択状態にしたい場合にはシフトキーを押しながら行なう必要がある。)もちろんシフトキーを押しながら行なった場合と、押さずに行なった場合というのは単なる取り決めの問題なので、逆にしても良い。マウスの左右についても同様である。なお複数の特徴語を一括して選択状態にする方法については後に図29の説明で示す。
図28(b)は(a)の状態からマークタイトルボタン(B31)を押した場合の検索結果表示部P1の変化を示したものである。マークタイトルボタンを押すと、処理3441MR−B31(図26A、B)が行なわれ、選択された特徴語を含むような検索結果を目立たせる。本実施例ではタイトルの左端にチェックマークなどのマークを付けて強調している。なお複数の特徴語が選択されている場合には、それらをより多種類含む文書をより目立たせるため、その種類数に比例した太さのマークを付けている。
特徴語−文書対応表格納エリア34427のデータ(図16)で現在選択されている<特徴語−a2>は一時的な文書番号1、3、5、...に含まれ、<特徴語−a5>は一時的な文書番号5、7、9、...に含まれていることが分かる。これから特徴語格納エリア34425(図14)のマーク強度欄は一時的な文書番号1番と3番については1となり、5番については2となる。
検索結果描画更新フラグFrがオンになるので、検索支援ルーチン3441(図5)では検索結果描画データの更新が行なわれる。検索結果描画データ作成ルーチン3443のマーク描画データ作成ルーチン34434(図19B(b))ではマーク強度に応じた太さのマークを描画するデータを検索結果表示部描画データ34422P1(図7)に追加する。従って検索支援インターフェイス画面の描画作業34414(図5)では各文書のタイトルの横にマーク強度に応じた太さのマークが表示されることになる。本図(b)はその時の描画状態を示している。一時的文書番号1、3は<特徴語−a2>のみしか含まない(マーク強度1)ので比較的細いチェックマークが、また一時的文書番号5の文書は<特徴語−a2>と<特徴語−a5>の両方を含む(マーク強度2)ので太いチェックマークが付いたわけである。
図28(c)は(b)の状態からさらにソートボタン(B32)をクリックした時の検索結果表示部P1の状態を示したものである。ソートボタン(B32)は検索結果に付けられたマークの強さの順に検索結果の文書を並べ替える。これによって利用者はより強いマークがついた文書から順に見ることができて便利である。この例の場合では<特徴語−a5>と<特徴語−a12>がマーク強度2であって先頭に来ている。次に<特徴語−a1><特徴語−a3>などがマーク強度1で続く。なおマーク強度が同じ場合にはオリジナルの順序が保存される。この時の検索支援ルーチン3441の動作については図26A、Bのソートボタンの説明部分を参照。
図29は特徴語のグラフ表示において特徴語を選択作業をしている時のインターフェイス画面の変化の例を示した図である。図28の説明でも触れたように、複数の特徴語を選択する場合の方法としてはシフトキーを押しながら左マウスで一つずつ指定していくという方法がある。しかし比較的固まった位置にある複数の特徴語を一括して選択する方法として本検索支援方法では特徴語選択領域を利用する方法を提供している。図29(a)の特徴語表示部P2に示されている矩形P2R1がその特徴語選択領域の一例である。特徴語選択領域は特徴語の表示されていない地の部分でマウスを押して、いずれかの場所でマウスを離すことによって指定できる。なおマウスを押して動かす途中では、始点と現在の指示位置とを対角とする矩形がマウスの動きにつれて表示される。(図23B(c)、図24の説明部分参照。)本図はこの矩形P2R1の左上の地点でマウスを押して、押したまま移動して矩形の右下の地点まで来ている時の状態である。この状態でマウスを離すと、この特徴語選択領域と重なりのある特徴語がすべて選択され、本図(b)のような状態となる。(図25B(c)の処理3441MR−P2−2参照。)すなわちこの場合、特徴語選択領域P2R1と重なりがあるのは<特徴語−a3>と<特徴語−a5>なのでこの二つが選択される(☆印で示している。)特徴語表示部の上部には選択数表示部L24があるが、その部分は現在の選択数である2となる。ユーザーはこの矩形領域を見ながら、選択したい特徴語群をなるべくちょうどカバーするような位置でマウスを離せば良い。
なお選択領域と重ならない特徴語はすべて非選択となるので、借りに(a)の状態で例えば<特徴語−a2>が選択状態であったとしても、(b)では<特徴語−a2>は非選択状態となってしまう。選択したい特徴語がいくつかのグループに分かれている時にはシフトキーを押しながら特徴語選択領域を設定する作業を繰り返すと良い。この場合には作業3441MR−P2−21(図25B(c))により、選択されなかった部分には影響を与えないので、順次選択範囲を増やしていくことが可能である。
図30は特徴語のグラフ表示において特徴語を移動させている時のインターフェイス画面の変化の一例を示した図である。本図の例では特に移動させる必要性がないかもしれないが、特徴語を多数表示すると次第に図が混んできて、重なりが生じたりして見ずらくなってしまう場合がある。そのような時に選択されている特徴語を見やすい位置に移動させたいということが生じる。そのような場合には選択されている特徴語のどれか一つを左マウスで(シフトキーを押さずに)押して、押したままマウスを移動させると、選択されている特徴語がマウスの動きにつれて一括して平行移動する。(リンクもそれにつれて移動する。)これはマウスを特徴語の上で押してその直後にその特徴語が選択状態である場合には特徴語移動モード(MM=21)となるためである。その後マウスを押したまま移動中には処理3441−MD2(図24)で特徴語描画更新フラグFcが常にオンになるので常に特徴語グラフ描画データ作成ルーチン3444(図21A、B)が働き、マウスの移動についれその移動分だけ選択されている特徴語の位置が変化する。マウスを離した時にはその時点での位置で新たな表示位置が確定する。
なお図30(a)と同じ状況でシフトキーを押しながら左マウスで選択されている特徴語を押した場合には、その押された特徴語がその場で非選択状態になってしまうので、マウスを動かしても移動は起こらない。また例えば<特徴語−a2>のように選択されていない単語をシフトキーを押しながら左マウスで押すと、他の選択されている語はそのまま選択状態になったまま、<特徴語−a2>も選択状態に加わるので、マウスを押したまま移動すると、<特徴語−a2、3、5>の3つがまとめて移動されることになる。また<特徴語−a2>を今度はシフトキーを押さずに左マウスで押した場合には、<特徴語−a2>のみが選択状態となり、他の語がすべて非選択状態となるので、マウスを押したまま移動すると<特徴語−a2>のみが移動することになる。
図31は表示されている特徴語を検索語として利用する作業をしている時のインターフェイス画面の変化の一例を示した図である。特徴語は検索結果の特徴をよく反映した単語が多く現れるので、それらをキーワードとして利用したくなる場合も多い。そのような場合のために本検索支援方法では以下のような方法を提供している。図31(a)では特徴語表示部P2に特徴語グラフが表示され、現在<特徴語−a3>と<特徴語−a5>が選択されている状態である。ここで(シフトキーを押さずに)このどちらかを右マウスでクリックすると選択状態にある特徴語(この場合<特徴語−a3>と<特徴語−a5>)が一括して検索要求入力窓(E1)に追加される。これは図25B(c)の処理3441MR−P2−33が行なわれるためである。
続いて今度はシフトキーを押して同じく<特徴語−a3>を右マウスでクリックすると今度は選択状態にある特徴語のいずれかと一致する単語がすべて検索要求窓から削除され、従ってこの場合にはもとの状態にもどることになる。(ただし最初のキーワードの中に<特徴語−a3>あるいは<特徴語−a5>と同じものがあれば、それらも同時に削除されるので、その場合にはもとにもどるとは言えないが。)これは図25B(c)の処理3441MR−P2−31が行なわれるためである。
右マウスで今度は選択状態にない特徴語、例えば<特徴語−a2>をクリックすると、この場合にはそのクリックされた単語のみが検索語として追加される(図25B(c)の処理3441MR−P2−34)。シフトを押しながら同じ操作を行なうと<特徴語−a2>と同じ単語だけが検索語から削除される(図25B(c)の処理3441MR−P2−32)。
図32は特徴語のグラフ表示における選択を拡大させる機能を利用している時のインターフェイス画面の変化の一例を示した図である。(a)の状態では<特徴語−a4>のみが選択されている。この状態で拡大(右)ボタン(B21)を押すと、この選択されている<特徴語−a4>から高々1パスで辿れる特徴語がすべて選択状態となる。この場合には<特徴語−a2>のみがこの条件に叶うので、<特徴語−a2>が選択状態に変わり(b)のような状態となる。続けて拡大を行なうと(c)となりさらに行なうと(d)の状態となる。
図33は検索された文書の選択により特徴語へのマークづけを行なう作業を行なっている時のインターフェイス画面の変化の一例を示した図である。(a)は検索を行なった後の状態(図6の状態)から興味のある文書として<タイトル−a2>と<タイトル−a4>の選択窓を順次マウスでクリックして選択状態としたところである。選択された文書の選択窓は目立つ色に変化する。本図ではそのことを選択窓を黒く塗りつぶして示している。なお選択された文書数を示す欄L14は現在選択されている文書数の2が表示される。
選択窓をマウスでクリックすると離した時点で作業3441MR−P1−1(図25B(b))が行なわれ、クリックした位置の文書の選択/非選択が反転する。なお位置の連続した複数の文書を一括して選択状態にするにはどちらか一方の端の文書の選択窓でマウスを押して、押したままもう一方の端まで移動させそこで離せば良い。(ただし開始位置の文書はもともとは選択されていないとする。)この場合には処理3441MR−P1−1(図25A(b))により、両端の間の文書がすべて選択状態に変化する。
図33(b)は(a)の状態からマーク特徴語ボタン(B41)を押した場合の特徴語表示部P2の状態を示したものである。マーク特徴語ボタンを押すと、処理3441MR−B41(図26A、B)が行なわれ、選択された文書に含まれるような特徴語を目立たせる。本実施例では特徴語の枠線を目立つ色にして強調している。
文書−特徴語対応表格納エリア34428のデータ(図17)で現在選択されている文書<タイトル−a2>は一時的な特徴語番号1、3、6、...を含み、<タイトル−a4>は一時的な特徴語番号3、8、12、...を含むことが分かる。これから検索結果格納エリア34424a(図13a)のマーク強度欄は特徴語1が1、特徴語3が2となる。
またマーク特徴語ボタンが押されると特徴語描画更新フラグFcがオンになるので、検索支援ルーチン3441(図5)では特徴語描画データの更新が行なわれる。特徴語グラフ描画データ作成ルーチンの特徴語ノード描画データ作成ルーチン34447(図21B(c))ではマークされている特徴語のフレームを強調色にする描画データを特徴語表示部描画データ34422P2(図8)に追加する。従って検索支援インターフェイス画面の描画作業34414(図5)ではマークされた特徴語の枠線が強調色で描画される。本図(b)はその時の描画状態を示しており、一時的特徴語番号1、3の枠線が強調されている。
図33(c)は(b)の状態からさらに選択ボタン(B42)をクリックした時の特徴語表示部P2の状態を示したものである。選択ボタン(B42)はマークされた特徴語を一括して選択状態にするためマークされていた<特徴語−a1>と<特徴語−a3>に選択状態を示す星印が付いている。
図34は選択された文書をキーとして連想検索を行なった時のインターフェイス画面の例である。前図33(a)の状態、すなわち<タイトル−a2>と<タイトル−a4>という文書が選択されている状態から拡大(左)ボタン(B11)をクリックすると選択されている文書をキーとする連想検索を行なう要求が情報提供者側へ送られ、連想検索の結果と特徴語情報が返信され、それらが検索表示部P1と特徴語表示部P2に表示される。連想検索の場合には検索結果が検索要求に適合している度合を示すスコアがキー文書との類似度で測られるので、スコア表示欄にはその類似度を正規化した数値が表示されている。ここではトップの類似度が100に正規化されている。また検索結果はスコアの高い順にソートされている。特徴語のグラフ表示についてはキーワード検索の場合と同様である。図27〜33で説明して来たような操作は本図についてもすべて同様に行なうことができる。
図35は選択された文書のみを残しその他を削除する刈込みを行なった時のインターフェイス画面の例である。図33(a)の状態、すなわち<タイトル−a2>と<タイトル−a4>という文書が選択されている状態から刈込みボタン(B12)をクリックすると選択されている文書だけを検索結果とし、特徴語情報もそれらだけから抽出される。本図はその状態を示しており検索結果表示部は<タイトル−a2>と<タイトル−a4>のみが残り、特徴語表示部P2にはこれら2つの文書から特徴語を抽出した結果が表示され、従って図33(a)の特徴語グラフとは違うものとなっている。
図36はテキスト入力による連想検索を行なうためにテキスト入力手段322Tを開いた時の表示画面の例である。テキスト入力手段322Tはなんらかのテキストの断片を入力してそれと類似した文書を検索するためのものである。テキスト入力部TE1、連想検索ボタンTB1、クリアボタンTB2、終了ボタンTB3から構成される。テキスト入力部TE1にはキーボードなどから直接文字列を入力したり、また表示手段上でのカット&ペースト操作により、他の文書の一部や全部を入力する。テキスト入力が終ったら連想検索ボタンTB1をクリックすると、入力されたテキストをキーとして連想検索を行なうという要求が情報提供者側に送られ、検索結果と特徴語情報が返信される。以下は他の検索を行なったり、拡大(左)ボタンを押した場合と同様である。
次に、具体的に検索を実施したときのインターフェイスの画面を参照しながら、本発明により使い勝手の良い検索が出来ることを説明する。これから説明する例は、利用者が「文献検索インターフェイス」に関する特許を調査する例である。利用者は、文献検索インターフェイスについてある程度の理解を持っているが、文献検索インターフェイスのどの特徴に着目して検索するかの明確な方針を持っていない状態であるものとする。
図37はこの実施例に採用された実際のインターフェイスの画面であり、使用されるデータベースとして“特許G06F’96(18、660件)”が選択されており、検索の入力が何も無い状態を示す。この画面は図3、図6等に示すインターフェイスの画面と対比して明らかなように、最上段の左側3つのボタンを除けば、表記が英語となっているだけで実質同一である。対応を列挙すると次のようである。すなわち、B01:キーワード検索ボタン−Keywords、B02:連想検索ボタン− Association 、B03:テキスト入力ボタン−TextInput、B04:終了ボタン−Quit、B11:拡大(左)ボタン−Expand、B12:刈込みボタン−Prune、B13:選択解除(左)ボタン−UnSelect、B21:拡大(右)ボタン−Propagate、B23:選択解除(右)ボタン−UnSelect、B31:マークタイトルボタン−Mark∨Title、B32:ソートボタン−Gather、B33:クリア(左)ボタン−Clear、B41:マーク特徴語ボタン−Mark□Topics、B42:選択ボタン−Select、B43:クリア(右)ボタン−Clearとなる。
図38は、キーワードの入力として「文献検索インターフェイス」をそのまま入力した状態のインターフェイスの画面を示し、キーワードの入力窓に入力文字列がそのまま現れた様子が分かる。図39は、キーワード検索実行用ボタンKeywordsが押された結果、入力文字列の「文献検索インターフェイス」が、文献、検索およびインターフェイスの三つのキーワードに分解され検索が実行されて総数1280件の特許が検索結果として得られ、関連度スコアの大きい(3)ものからリストされ、且つ指定された総数20の範囲で重要度の高い順にキーワードがグラフ表示された状況を示す。ここで、キーワードの選択とグラフ表示の仕方は、先に引用した特願平8−176174に開示されている方法に依ったので、説明は省略する。図40は、利用者が図39のキーワードのグラフを見ながら、キーワード、存在、連語およびシソーラスのそれぞれのキーワードに着目して、これらをすべて含むタイトルのものを選択する目的で特徴語のノードをマウスでクリックして選択する。選択された特徴語が白抜き文字で表記された状態を示す。図41はその状態でマークタイトルボタンMark∨Titleを押してマーク付けを行った結果を示す。この図では、あまり明解ではないが、マークは、指定されたキーワードをより多く持つ文献のタイトルにより太く現れる。図42は、これにソートボタンGatherを押してソートをかけた結果を示す。この図では、より太いマークを持つものが上位に表れる。図43は、ここで選択解除ボタンClear(B23対応)を押して特徴語ノードの選択解除を行った状態を示す。図44は、利用者がより太いマークを持つ4件の文献に着目してこれらの選択窓を順次マウスでクリックして選択状態とした図を示す。図45は、この状態で、使用者がマーク特徴語ボタンMark□Topicsを押し、これらの文献に現れる特徴語を囲う枠が太く表示された例を示す。図46は、ここで、使用者が選択ボタンSelectを押すと、トピックスとしてマークされた特徴語が選択されたことが白抜き文字で表示される。この状態でシフトキーを押しながら、選択された特徴語をマウスの左ボタンでクリックすると、選択を解除して非選択とすることが出来る。図47は、図46で選択状態とした特徴語のすべてをキーワードとして登録するために、選択状態の特徴語の一つをマウスの右ボタンでクリックした状態を示す。この状態では新たなキーワードがキーワードの窓に表示される。図48はこの新しいキーワードに対応した検索結果を示す図である。図49は、この検索結果のうち、上位にある12件のみをマウスのクリックで選択した状態を示す。図50は、刈込みボタンPruneを押して、選択されている12件の文書のみを検索対象とした結果を示す。図51は、この状態で連想検索を行うため、2件の文献のタイトルをマウスのクリックで選択した状態を示す。図52は、この状態で検索キーAssociationを押して連想検索を実行した結果を示す。図53、図54および図55は、この連想検索の結果として得られた特徴語のグラフ表示に着目して、特徴語−ペンストロークをキーとして、特徴語の選択を拡大させる機能を利用している時のインターフェイス画面の変化の一例を示した図である。図53では特徴語−ペンストロークのみが選択されている状態を示す。図54は、この状態で拡大(右)ボタンPropagateを押すと、この選択されている特徴語−ペンストロークから高々1パスで辿れる特徴語−キーワードが選択状態となった状態を示す。図55は、続けて拡大(右)ボタンPropagateを押して拡大を行なった結果、特徴語−キーワードから高々1パスで辿れる特徴語−文書、全文および同義語が選択状態となった状態を示す。
この例から分かるように、入力文字列「文献検索インターフェイス」から多様な検索に発展できる。
以上、具体的な実施形態を例にとって説明したように、本発明の実施例によれば以下のような使い勝手の良い検索が出来る。
(1)検索結果の1次情報であるタイトルのリストと並んで、検索された文書群に特徴的に現れる語群の話題的な関連性を示す情報が表示されるので、利用者は検索結果の具体的なタイトル情報と共に全体像を把握しながら検索作業を行なうことができる。また表示された特徴語をマウスによるクリック操作などで検索語として利用でき、表示された特徴語のいくつかを簡単なマウス操作などで選択し、それらを含むタイトルを強調し、強調されたタイトルをリストのトップに集中させることができ、また逆にいくつかのタイトルを選択して、それらが含む特徴語を強調することが高速にできるので、検索条件の改良を試みたり、観点を変えた検索を試みたりすることが容易にできる。
(2)検索支援インターフェイスにはキーワードによる検索を行なうボタンと共に文書の類似度に基づく連想検索を行なうボタンがあり、検索要求入力欄から文書の所在を示す情報が入力されて、連想検索ボタンが押された場合には指定された文書をキーとする連想検索を行なわれる。また検索結果のタイトル表示部を見ながら関心のある文書を選択することができ、かつ選択された文書をキーとして連想検索を行なうボタンがあるので、利用者は興味深い文書として見つけたりすでに所持している文書やあるいは検索作業の途中で興味深い文書を見つけた時に、簡単な操作で関連の深い文書を検索できる。
(3)テキスト入力用のボタンを押すと、テキスト入力用の窓とそこに入力されたテキストをキーとして連想検索を行なうボタンを有するテキスト入力手段が画面上に表示させるので、利用者は興味のある文書の中の一部、例えば句、文、段落などをキーボードから入力したり、カット&ペースト作業で入力することにより、関連する文書を容易に検索することができる。
文書検索支援サービスのシステム構成の一例を示す図。 利用者側計算機のワークエリアにロードされた利用者側検索支援プログラムの一例の詳細を示した図。 表示部に表示された検索支援インターフェイスの構成例を示す図。 検索インターフェイスを表示手段に描画するためのデータ格納エリアの詳細の一例を示す図。 利用者側の検索支援ルーチンにおける処理の流れを示すPAD図。 検索支援インターフェイスにおける検索結果と特徴語の表示例を示す図。 検索結果表示部を描画するためのデータの構成例を示す図。 特徴語表示部を描画するためのデータの構成例を示す図。 情報提供者側検索支援プログラムが受け付ける検索要求の構成例を示す図。 情報提供者側検索支援プログラムの構成例を示す図。 検索対象の文書データベースの構成例を示す図。 情報提供者側検索支援ルーチンにおける処理の流れを示すPAD図。 利用者側に送信された検索結果に関するデータの例を示す図。 特徴語に関するデータの例を示す図。 特徴語グラフを描画する際の特徴語間リンクに関するデータの例を示す図。 特徴語−文書対応表データの例を示す図。 文書−特徴語対応表データの例を示す図。 検索結果描画データ作成用パラメータの設定例を示す図。 検索結果描画データ作成ルーチンの処理の流れの一部を示すPAD図。 検索結果描画データ作成ルーチンの処理の流れの残りの部分を示すPAD図。 特徴語グラフ描画データ作成用パラメータの設定例を示す図。 特徴語グラフ描画データ作成ルーチンの処理の流れの一部を示すPAD図。 特徴語グラフ描画データ作成ルーチンの処理の流れの残りの部分を示すPAD図。 キーボード入力に対して利用者側検索支援ルーチンが行なう処理を示すPAD図。 マウスが押された時に利用者側検索支援ルーチンが行なう処理の一部を示すPAD図。 マウスが押された時に利用者側検索支援ルーチンが行なう処理の残りの部分を示すPAD図。 マウスを押したまま移動している時に利用者側検索支援ルーチンが行なう処理を示すPAD図。 マウスが離された時に利用者側検索支援ルーチンが行なう処理の一部を示すPAD図。 マウスが離された時に利用者側検索支援ルーチンが行なう処理の残りの部分を示すPAD図。 検索支援インターフェイスのボタンがクリックされた時に利用者側検索支援ルーチンが行なう処理の一部を示すPAD図。 検索支援インターフェイスのボタンがクリックされた時に利用者側検索支援ルーチンが行なう処理の残りの部分を示すPAD図。 検索結果の文書の一つ一つを閲覧している時の表示画面の例を示す図。 特徴語の選択によりタイトルへのマークづけを行なう作業をしている時のインターフェイス画面の変化の例を示す図。 特徴語のグラフ表示において特徴語を選択作業をしている時のインターフェイス画面の変化の例を示す図。 特徴語のグラフ表示において特徴語を移動させている時のインターフェイス画面の変化の例を示す図。 表示されている特徴語を検索語として利用する作業をしている時のインターフェイス画面の変化の例を示す図。 特徴語のグラフ表示における選択を拡大させる機能を利用している時のインターフェイス画面の変化の例を示す図。 検索された文書の選択により特徴語へのマークづけを行なう作業を行なっている時のインターフェイス画面の変化の例を示す図。 連想検索を行なった時のインターフェイス画面の例を示す図。 検索結果の刈込みを行なった時のインターフェイス画面の例を示す図。 テキスト入力による連想検索を行なうためにテキスト入力手段を開いた時の表示画面の例を示す図。 実際の検索例に採用された実際のインターフェイスの画面を示す図。 キーワードの入力として「文献検索インターフェイス」をそのまま入力した状態のインターフェイスの画面を示す図。 キーワード検索実行用ボタンが押された結果、入力文字列がキーワードに分解され検索が実行された結果を示す図。 実行された検索結果から特徴語を選択する状態を示す図。 選択された特徴語に対応する文献のタイトルにマーク付けを行った結果を示す図。 マーク付けの行なわれた文献リストにソートをかけた結果を示す図。 ソートをかけられた文献リストとノードの選択解除が行なわれた特徴語の表示状態を示す図。 利用者がより太いマークを持つ文献を選択状態とした状態を示す図。 選択状態とされた文献に現れる特徴語を囲う枠が太く表示された例を示す図。 マークされた特徴語が選択されたことを表示する図。 マークされた特徴語を選択キーとする検索の実行を指示した状態を示す図。 新しいキーワードに対応した検索結果を示す図。 検索結果のうち、上位にある文献のみをマウスのクリックで選択した状態を示す図。 刈込みボタンを押して、選択されている文書のみを検索対象としたキーワード検索結果を示す図。 選択されている文書の内特定の文書との連想検索を行うため、2件の文献のタイトルをマウスのクリックで選択した状態を示す図。 検索キーAssociationを押して連想検索を実行した結果を示す図。 連想検索の結果として得られた特徴語のグラフ表示に着目して、特徴語−ペンストロークをキーとして、特徴語の選択を拡大させる機能を利用している時のインターフェイス画面の変化の一例の最初の画面として特徴語−ペンストロークのみが選択されている状態を示した図。 インターフェイス画面の変化の一例の次の画面として、拡大(右)ボタンPropagateが押され、この選択されている特徴語−ペンストロークから高々1パスで辿れる特徴語−キーワードが選択状態となった状態を示す図。 インターフェイス画面の変化の一例のさらに次の画面として、続けて拡大(右)ボタンPropagateが押されて、特徴語−キーワードから高々1パスで辿れる特徴語−文書、全文および同義語が選択状態となった状態を示す図。
符号の説明
1:情報提供者側情報保持・処理手段、11:入力手段、12:表示手段、13:CPU、14:ワークエリア、141:オペレーティングシステム、142:通信プログラム、143:情報提供者側検索支援プログラム、15:情報保持手段、15F1:利用者側検索支援起動用ハイパーテキスト、15X1:利用者側検索支援駆動プログラム、15D:検索用データ、2:通信ネットワーク、3:利用者側情報保持・処理手段、31:入力手段、311:キーボード、312:マウス、313:ペン入力手段、32:表示手段、321:ハイパーテキスト閲覧インターフェイス、322:検索支援インターフェイス、B01:キーワード検索ボタン、B02:連想検索ボタン、B03:テキスト入力ボタン、B04:終了ボタン、B11:拡大(左)ボタン、B12:刈込みボタン、B13:選択解除(左)ボタン、B21:拡大(右)ボタン、B23:選択解除(右)ボタン、B31:マークタイトルボタン、B32:ソートボタン、B33:クリア(左)ボタン、B41:マーク特徴語ボタン、B42:選択ボタン、B43:クリア(右)ボタン、E1:検索要求入力窓、M1:文献データベース選択手段、P1:検索結果表示部、P2:特徴語表示部、RB1:印刷ボタン、TE1:テキスト入力部、TB1:連想検索ボタン、TB2:クリアボタン、TB3:終了ボタン、341:オペレーティングシステム、342:通信プログラム、343:ハイパーテキスト閲覧プログラム、344:利用者側検索支援プログラム、3441:利用者側検索支援ルーチン、35:情報保持手段、36:印刷手段。

Claims (6)

  1. 検索条件を入力させ、
    前記入力された検索条件に基づいて第1の文書検索を行い、
    前記第1の文書検索結果を、文書リストとして文書リスト表示、及び、第1の文書検索の結果全体の特徴を反映した特徴語のリスト又は特徴語間相互の関連性を反映した特徴語のグラフとして特徴語表示し、
    前記文書リストから文書を選択させ、
    前記選択された文書との類似度に基づいて第2の文書検索を行い、
    前記第2の文書検索結果を、文書リスト及び特徴語表示し、
    前記特徴語表示された特徴語を検索条件として、前記第1の文書検索に追加又は削除させることを特徴とする文書検索方法。
  2. 請求項1に記載の文書検索方法において、選択された特徴語の検索語への追加、検索語の中で選択された特徴語と一致するものの削除、選択された特徴語の検索語への一括追加、検索語の中で選択された特徴語のいずれかと一致するもののすべて削除のいずれかにより、前記特徴語表示された特徴語を検索条件として、前記第1の文書検索に追加又は削除させることを特徴とする文書検索方法。
  3. 請求項1に記載の文書検索方法において、選択された特徴語を選択状態にして他を非選択状態にする操作、選択された特徴語を選択/非選択を反転させる操作、選択された矩形領域と重なる語を一括選択し他を非選択にする操作、選択された特徴語群を一括して移動させる操作、選択された特徴語のいずれかから特徴語間関連リンクを辿って到達する特徴語を選択状態に加える操作のいずれかをさせることにより、前記特徴語表示された特徴語を検索条件として、前記第1の文書検索をすることを特徴とする文書検索方法。
  4. 検索条件を入力させ、
    前記入力された検索条件に基づいて第1の文書検索を行い、
    前記第1の文書検索結果を、文書リストとして文書リスト表示、及び、第1の文書検索の結果全体の特徴を反映した特徴語のリスト又は特徴語間相互の関連性を反映した特徴語のグラフとして特徴語表示し、
    前記文書リストから文書を選択させ、
    前記選択された文書との類似度に基づいて第2の文書検索を行い、
    前記第2の文書検索結果を、文書リスト及び特徴語表示し、
    前記文書リストからの文書選択は、表示された前記文書リストごとに表示された小窓の色により、選択/非選択を反転させることを特徴とする文書検索方法。
  5. 請求項4に記載の文書検索方法において、前記文書リストから文書の選択は、前記文書リスト中から複数の文書を一括選択させることを特徴とする文書検索方法。
  6. 検索条件を入力させ、
    前記入力された検索条件に基づいて第1の文書検索を行い、
    前記第1の文書検索結果を、文書リストとして文書リスト表示、及び、第1の文書検索の結果全体の特徴を反映した特徴語のリスト又は特徴語間相互の関連性を反映した特徴語のグラフとして特徴語表示し、
    前記文書リストから文書を選択させ、
    前記選択された文書との類似度に基づいて第2の文書検索を行い、
    前記第2の文書検索結果を、文書リスト及び特徴語表示し、
    前記第2の文書検索結果として表示された文書リスト中より文書を選択させ、選択された文書より抽出された特徴語を特徴語のリスト又は特徴語間相互の関連性を反映した特徴語のグラフとして表示することを特徴とする文書検索方法。
JP2004243236A 2004-08-24 2004-08-24 文書検索方法 Pending JP2004348768A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004243236A JP2004348768A (ja) 2004-08-24 2004-08-24 文書検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004243236A JP2004348768A (ja) 2004-08-24 2004-08-24 文書検索方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP24096397A Division JP3643470B2 (ja) 1996-07-05 1997-09-05 文書検索システムおよび文書検索支援方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008205261A Division JP4224131B2 (ja) 2008-08-08 2008-08-08 文書検索システム

Publications (1)

Publication Number Publication Date
JP2004348768A true JP2004348768A (ja) 2004-12-09

Family

ID=33536024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004243236A Pending JP2004348768A (ja) 2004-08-24 2004-08-24 文書検索方法

Country Status (1)

Country Link
JP (1) JP2004348768A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241635A (ja) * 2006-03-08 2007-09-20 Nec Corp 文書検索装置、情報処理装置、検索結果出力方法、検索結果表示方法およびプログラム
WO2009136426A1 (ja) * 2008-05-08 2009-11-12 三菱電機株式会社 検索クエリ提供装置
US7769771B2 (en) 2006-07-19 2010-08-03 Ricoh Company, Ltd. Searching a document using relevance feedback
JP2015164066A (ja) * 2015-05-07 2015-09-10 富士通株式会社 情報検索装置、情報検索方法およびそのプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241635A (ja) * 2006-03-08 2007-09-20 Nec Corp 文書検索装置、情報処理装置、検索結果出力方法、検索結果表示方法およびプログラム
US7769771B2 (en) 2006-07-19 2010-08-03 Ricoh Company, Ltd. Searching a document using relevance feedback
WO2009136426A1 (ja) * 2008-05-08 2009-11-12 三菱電機株式会社 検索クエリ提供装置
JP2015164066A (ja) * 2015-05-07 2015-09-10 富士通株式会社 情報検索装置、情報検索方法およびそのプログラム

Similar Documents

Publication Publication Date Title
US6654738B2 (en) Computer program embodied on a computer-readable medium for a document retrieval service that retrieves documents with a retrieval service agent computer
JP3643470B2 (ja) 文書検索システムおよび文書検索支援方法
CA2266457C (en) System and method for search and retrieval of digital information
US7890533B2 (en) Method and system for information extraction and modeling
US7958128B2 (en) Query-independent entity importance in books
US20090144262A1 (en) Search query transformation using direct manipulation
JP2000029906A (ja) 文書情報管理システム
JP2001034618A (ja) Xmlデータ検索処理方法および検索処理システム
Riehmann et al. WORDGRAPH: Keyword-in-context visualization for NETSPEAK's wildcard search
JPH0528190A (ja) 情報検索用端末装置
JPH0484271A (ja) 文書内情報検索装置
JPH07192020A (ja) 文書情報検索装置
US20210173850A1 (en) Categorical search using visual cues and heuristics
JPH08320882A (ja) 文書処理装置および文書検索装置
JP2004348768A (ja) 文書検索方法
JP4224131B2 (ja) 文書検索システム
JP2000250908A (ja) 電子書籍の作成支援装置
JP2006513470A (ja) データベースへのアクセス方法及び装置
JP3710463B2 (ja) 翻訳支援辞書装置
JPH09311805A (ja) 文書処理方法及び装置
JP3714723B2 (ja) 文書表示システム
JP2004157965A (ja) 検索支援装置、検索支援方法、プログラムおよび記録媒体
JP2001092850A (ja) 情報検索用端末装置及び情報検索用端末装置にける情報表示・入出力方法
CN105808607A (zh) 一种文档索引的生成方法和装置
JP3537260B2 (ja) リンク付文書検索表示システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080205

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080617