JP4224131B2 - 文書検索システム - Google Patents

文書検索システム Download PDF

Info

Publication number
JP4224131B2
JP4224131B2 JP2008205261A JP2008205261A JP4224131B2 JP 4224131 B2 JP4224131 B2 JP 4224131B2 JP 2008205261 A JP2008205261 A JP 2008205261A JP 2008205261 A JP2008205261 A JP 2008205261A JP 4224131 B2 JP4224131 B2 JP 4224131B2
Authority
JP
Japan
Prior art keywords
feature word
search
document
feature
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2008205261A
Other languages
English (en)
Other versions
JP2008293534A (ja
Inventor
真吾 西岡
真 岩山
一広 大野
明彦 高野
芳樹 丹羽
敦子 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008205261A priority Critical patent/JP4224131B2/ja
Publication of JP2008293534A publication Critical patent/JP2008293534A/ja
Application granted granted Critical
Publication of JP4224131B2 publication Critical patent/JP4224131B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、対話的なガイダンス機能を実現したユーザーインタフェースを備える文書検索方法、およびこれを利用した文書検索サービスあるいは文書検索支援サービスに関する。
文献検索システムにおいては、ユーザーが所望する文献集合になるべく早く容易に到達できるよう、様々な支援機能が考案、開発されている。その中の主なものとしては、フィードバックとガイダンスがある。フィードバックとは、例えば、非特許文献1の第6章にあるように、検索結果の幾つかのアイテムに対して、ユーザーが「当たり/はずれ」の判定を下すと、その判定を反映した検索結果を得ることができるしくみである。また、ガイダンスとは、検索作業の各段階でその検索作業と関連のあると思われる情報、従って利用者が検索条件を工夫、改良するのに参考になると思われる情報を提供する機能である。
ガイダンス機能については、従来一般に、入力された検索条件に対してその関連情報を提示する方法が行なわれている。例えば、シソーラスなど、単語間の関連性を示すデータベースを保持しておき、検索条件として入力された語と関連のある語をデータベースから取り出して、提示する方法である。シソーラスの場合には、主に、単語間の上位−下位関係を示す木構造のデータであるが、共起統計を用いて関連語データを自動生成し、それを用いる方法もある(例えば、特許文献1あるいは非特許文献2)。また、非特許文献3の第12章では、単語間の共起統計データに基づき、検索語とその関連語をネットワーク状に表示する方法を与えている。
しかしながら、検索条件に対して、その関連情報を提示する方法では、検索語が複数になった場合や、否定が使われた場合の対処が難しく、また、キーワードを用いない種類の検索(連想検索など)にも対処が難しい、という問題がある。それを克服する方法として、検索結果から関連情報を自動抽出してユーザーに提供する手法がある。例えば、スキャター・ギャザー法(例えば、非特許文献4の318−329ページ)では、検索された文書群を自動分類(クラスタリング)して、クラス毎の特徴語を表示するものであり、また、本願の発明者らの提案に係わる特許文献2では、検索結果からの特徴語抽出と特徴語間共起関係抽出により、特徴語グラフを生成・表示する方法を与えている。
しかしながら、これら従来法では、検索結果の一次情報であるタイトルリストの表示部とガイダンス情報との間のインタラクションが不十分であり、ユーザーは、ガイダンス情報を十分に活用できないという問題があった。
また、検索手法の立場からみた場合には、キーワード検索と連想検索という2種類の相補的な検索が必要となるが、これらを状況に応じて使い分け、且つ同じ枠組でガイダンスを行なえるユーザーインタフェースがないという問題があった。
特開平8−161343号公報 特開平10−74210号公報 G.Salton, J.M.McGill(1983), Introduction to Modern Information Retrieval, McGraw-Hill B.R.Schatz他(1996), Interactive term suggestion for users of digitallibraries: Using subkect thesauri and co-occurrence lists for information retrieval, Proc. ACM DL'96, 126-133ページ R.H.Fowler, D.W.Dearholt(1990), Information Retrieval Using Pathfinder Networks, In R.W.Schvaneveldt 編, Pathfinder Associative Networks, Ablex D.Cutting他(1992), Scatter/Gather:A Cluster-based Approach to Browsing Large Document Collections, Proc. ACM SIGIR '92
本発明の目的は、前記従来技術の問題を解消し、利用者が検索結果のタイトルリストなどの個々の情報と全体像の両方を把握し、個別情報と全体像との関連性を分析しながら検索条件の改良を試みたり、また、観点を変えた検索を試みたりすることができるようにすることであり、更には、利用者が興味深い文書として見つけたり、既に所持している文書、検索作業の途中で興味深い文書、あるいはその一部を見つけた時に、それらと関連の深い文書を容易に検索できるようにすることである。
利用者が検索結果の全体像を把握しながら検索条件の改良を試みたり、また、観点を変えた検索を試みたりすることができるようにするために、検索結果の一次情報であるタイトルのリストと共に、検索された文書群に特徴的に現れる特徴語群の関連性を示すグラフを同一画面上の比較しやすい位置に表示し、表示された特徴語をマウスによるクリック操作などで、検索語として利用することができるようにし、あるいは、表示された特徴語のいくつかを簡単なマウス操作などで選択し、それらを含むタイトルを強調した表示としたり、強調されたタイトルをリストのトップに集中させるなどして、利用者が特徴語とそれを含む文書との関連を認識し易くしたり、逆に、幾つかのタイトルを選択して、これらの文書に共通に含まれる特徴語を強調した表示とすることができ、より深い検索に試行錯誤的に進みやすい検索支援インターフェイスを実現する。
本発明によれば、検索結果を利用しながら、より検索目的に合った結果を容易に得ることができる。
以下、本発明の文書検索支援方法とそれを利用した文書検索支援サービスの実施形態を説明する。
図1は、文書検索支援サービスのシステム構成の一例である。本文書検索支援サービスは、情報提供者側の情報保持・処理手段1(汎用計算機、ワークステーション、パソコンなど)と、通信ネットワーク2(インターネット、イントラネット、またそれらの組み合わせなど)、および利用者側の情報保持・処理手段3(ワークステーション、端末、パソコンなどの計算機)により構成される。利用者、情報提供者ともに複数でも構わないが、ここでは簡単のため共に単独の場合の図としてある。
情報提供者側の情報保持・処理手段(以下簡単のため「計算機」と呼ぶ)1は、入力手段11、表示手段12、CPU13、ワークエリア14、情報保持手段15などから構成され、利用者側から送られてくる検索要求に応じて、提供対象である文献データベース中の該当文書を検索し、その結果を利用者へ送信し、また、検索要求や検索結果に関連する有用な情報を必要に応じて生成、加工して、利用者に送信するのが主な役割である。ワークエリア14は、高速に読み書き可能な半導体メモリなどの記憶媒体で構成され、オペレーティングシステム141、通信プログラム142と共に、文書検索支援サービスを行なうための検索支援プログラム143が稼働する。情報保持手段15は、磁気ディスクや光ディスク、CDROMなど、大規模な情報を格納でき、且つ高速な読み出しをするのに適した記憶媒体の組み合わせで構成され、利用者側計算機上で検索支援手段として稼働することができる利用者側検索支援駆動プログラム15X1と、それを利用者側計算機まで運び、且つ実行させる働きを持つ利用者側検索支援起動用ハイパーテキスト15F1と、検索対象などの検索用データ15Dなどの情報が保持されている。検索用データ15Dは、辞書類15D0と、各文書データベースに関するデータ15D1、15D2………で構成される。
利用者側の情報保持・処理手段(以下簡単のため「計算機」または「端末」と呼ぶ)3は、入力手段31、表示手段32、CPU33、ワークエリア34、情報保持手段35、印刷手段36から構成され、利用者の検索要求を情報提供者側に伝え、また、情報提供者側から送られてきた検索結果や付帯情報を利用者が利用し易い形で提示するのが主な役割である。入力手段31は、キーボード31、マウス32、ペン入力手段33などから構成され、ワークエリア34は、高速に読み書き可能な半導体メモリなどの記憶媒体で構成され、情報保持手段35は、磁気ディスク、光ディスク、CDROMなどの記憶媒体で構成される。
本検索支援サービスの実施形態は、種々の方法が可能であるが、以下では、WWWブラウザなどのハイパーテキスト閲覧インターフェイスを利用する方法について述べる。図1の利用者側計算機3では、既にハイパーテキスト閲覧プログラム343がワークエリア34にロードされて稼働しており、表示手段32にハイパーテキスト閲覧インターフェイス321が表示されている状態である。
ハイパーテキスト閲覧インターフェイス321のアドレス入力部3211から、検索支援サービスが指定するアドレス(すなわち、情報提供者計算機1のネットワーク上でのアドレスと、利用者側検索支援起動用ハイパーテキスト15F1の存在するファイル名など)を直接に指定したり、あるいは、ハイパーテキスト閲覧インターフェイス321のテキスト表示部3212に表示されているハイパーテキストに検索支援サービスの指定するアドレスがアンカーとして埋め込まれている場合には、その部分をマウスなどでクリックすると、ハイパーテキスト閲覧プログラム343は、利用者側通信プログラム342と情報提供者側通信プログラム142を介して、利用者側検索支援起動用ハイパーテキスト15F1を受けとる。この時、同時に利用者側検索支援駆動プログラム15X1が付随して送信され、且つ利用者側計算機のワークエリア34で起動されて検索支援プログラム344として稼働し、同検索支援プログラム344は、検索支援インターフェイス322を表示手段32に表示する。なお、検索支援インターフェイス322は、ハイパーテキスト表示部分3212の中に表示されても、また、別のウィンドウとして表示されても良い。図1は、別ウィンドウとして表示している例である。

この他、ハイパーテキスト閲覧プログラム343を用いずに直接コマンド入力などにより、通信プログラムを介して利用者側検索支援駆動プログラム15X1を受けとり、ワークエリア上で稼働させて検索支援サービスを受けることも可能である。また、予め利用希望者には、利用者側検索支援駆動プログラム15X1を配布しておき、必要に応じて、それを起動して使ってもらうようにするサービス形態も可能である。
図2は、利用者側計算機3のワークエリア34にロードされた利用者側検索支援プログラム344の詳細を示した図である。利用者側検索支援プログラム344は、メインの検索支援ルーチン3441と、データエリア3442、およびサブルーチンとしての検索結果描画データ作成ルーチン3443、特徴語グラフ描画データ作成ルーチン3444、特徴語リスト描画データ作成ルーチン3445などから構成される。
データエリア3442は、種々のパラメータを格納するためのエリア34421、インターフェイス描画に関するデータを格納するエリア34422、検索要求格納エリア34423、検索結果格納エリア34424a、検索結果表示順序格納エリア34424b、特徴語格納エリア34425、特徴語間リンク情報格納エリア34426、特徴語−文書対応表格納エリア34427、文書−特徴語対応表格納エリア34428などから構成される。パラメータ格納エリア34421には、検索結果描画データ作成用のパラメータ344211、特徴語グラフ描画データ作成用パラメータ344212などがある。
利用者側検索支援ルーチン3441は、インターフェイス描画に関するデータ34422に基づき、検索支援インターフェイス322を表示手段32に表示する。また、インターフェイス上のボタンがマウスなどで押された場合には、押されたボタンの種類に従って各種の操作を行なう。
図3は、表示部32に表示された検索支援インターフェイス322の構成例である。検索支援インターフェイス322は、利用者がキーワードなどの検索要求を入力するための検索要求入力窓E1、キーワード検索実行用ボタンB01、指定文書との類似度に基づく検索(連想検索)を行なうための連想検索ボタンB02、連想検索を行なうための文や単語群を入力するためのテキスト入力ボタンB03、また、検索対象とする文献データベースを選択するためのDB選択手段M1などの検索に関する部品群、また検索結果を表示する検索結果表示部P1と検索結果を特徴付ける情報を表示する特徴語表示部P2などの結果表示に関する部品群、また検索結果とその特徴表示に基づいて各種の操作をする部品群などで構成される。検索結果と、その特徴表示に基づいて各種の操作をする部品群としては、選択された文書、または文書群と類似した文書を検索するための拡大ボタンB11、選択された文書、または文書群以外の文書を捨てるための刈り込みボタンB12、文書に付された選択状態をすべて解除するための選択解除ボタンB13、選択された一つ、または複数の特徴語を含む文書のタイトルに、チェックマークなどの強調を付するためのマークタイトルボタンB31、更にマークの強い順にタイトルを並べ替えるためのソートボタンB32、マークを消すためのクリアボタンB33、選択された一つ、または複数のタイトルに対応する文書に含まれる特徴語を強調するためのマーク特徴語ボタンB41、マークの付された特徴語を選択するための選択ボタンB42、マークを解除するためのクリアボタンB43、特徴語に付された選択状態をすべて解除するための選択解除ボタンB23、選択された一つ、または複数の特徴語と関連の強い特徴語も選択状態にする特徴語選択拡大ボタンB21などである。
この配置において特徴的なことは、タイトルリストなど検索結果を直接に表示する検索結果表示部P1と、検索された文書群全体を解析して、その特徴を分析した結果を表示する特徴語表示部P2を対照し易いように並べていることである。このことにより、利用者は、検索された結果の具体的な情報(タイトルリスト)と、抽象化された全体情報を一度に把握することができ、更に、本実施例の後の部分で明らかになるように、両者の間のインタラクションを容易に実現することができるという利点がある。
図4は、この検索インターフェイスを描画するためのデータ格納エリア34422の詳細である。検索インターフェイスを構成する全ての部品の描画データで構成される。例えば、検索要求入力窓E1を描画するためのデータ34422E1は、配置位置、窓のサイズ、表示内容(検索条件)、原点位置(窓の左に隠れてしまう文字数、あるいはそれに匹敵する長さ)、カーソル位置、マーク位置、背景色、文字フォントの種類、枠線の種類などから構成される。
図5は、利用者側の検索支援ルーチン3441における処理の流れを示すPAD図である。検索支援ルーチン3441の主な働きは、検索支援インターフェイスを表示し、利用者の操作に応じて、検索結果や関連情報の提示など、必要な作業を行なうことである。
初めに、本検索支援ルーチン3441で使われる変数(フラグなど)について説明する。検索結果描画更新フラグ(変数名Fr)は、検索結果表示部P1(図3)に表示する描画データを更新する必要があるかどうかを示す。特徴語描画更新フラグ(変数名Fc)は、特徴語表示部P2(図3)に表示する描画データを更新する必要があるかどうかを示す。本検索支援方法では、検索を実行した後には、検索結果表示部P1や特徴語表示部P2を更新する必要があるが、これは他の作業の時には必ずしも必要な訳ではない。例えば、検索要求を入力しているときなどには、どちらも更新の必要がない。従って、必要な時だけこれらの作業を行なうように、これらのフラグを使用する。また、ドラッグモード(変数名MM)は、マウスでドラッグ操作をしている時の作業の種類を示すもので、文書選択(MM=11)、表示文書指示(MM=12)、特徴語の移動(MM=21)、特徴語選択領域(MM=22)などがある。また、変数MSは、直前にマウスが押された位置の文書、あるいは特徴語の番号を記録し、また、変数MFは、同じ文書あるいは特徴語がマウスが押される前の選択状態を記録し、変数MDは、現在閲覧用に表示されている文書の識別番号を記録するためのものである。初期処理34411において、立ち上げ時のこれらの変数はFr=Fc=0、MM=0、MS、MF、MDは値なしに設定される。
続いて、終了ボタンが押されるまで、34412以下の処理が繰り返される。始めに、検索結果描画更新フラグ(Fr)がオンの場合には、検索結果描画データ作成ルーチン3443を用いて、検索結果表示部描画データ34422P1の更新作業34412を行なう。また、特徴語描画更新フラグ(Fc)がオンの場合には、特徴語グラフ描画データ作成ルーチン3444を用いて、特徴語表示部描画データ34422P2の更新作業34413を行なう。立ち上げ時には、どちらのフラグもオフのため、これらは素通りする。
続いて、処理34414では、検索インターフェイス描画データ34422(図4)に基づいて、検索インターフェイス322を表示手段32上に描画する。ここまでの処理を終えると、入力待ち状態34415となる。図3の表示画面は、検索支援プログラム344がスタートしてこの入力待ち状態に達した段階での、検索インターフェイス322の表示状態を示している。キーボードやマウスにより何らかの入力があると、分岐34416に進み、キーボード入力の場合(カット&ペーストを含む)には、処理3441KB、マウスが押された場合には、処理3441MP、マウスを押しながら移動中には、処理3441MD、マウスを離した時には、処理3441MRをそれぞれ行なう。それぞれの詳細については、後で説明する。
利用者は、この検索支援インターフェイスを通じて、検索要求を入力したり、各種の操作を行なうことができる。この検索作業の出発点としては、色々な方法が可能であり、例えば、キーワードを入力してキーワード検索したり、何か関心の高い文書のネットワーク上でのアドレスを指定して、それと類似した文書を検索したり、あるいは、文書全体でなくその一部である段落や文、フレーズなどから、関連性の高い文書を検索するなどができる。初めに、キーワード検索からスタートする場合について説明する。
検索条件は、検索要求入力窓E1(図3)にキーボードから入力するが、立ち上げ時には、検索要求入力窓E1が入力待ち状態になっていない場合があるので、その場合には、入力を開始する前に、検索要求入力窓E1をマウスでクリックする。これにより、マウスを押した時の処理3441MPが行なわれ、検索要求入力窓E1が入力待ち状態となり、キーワードから文字が入力される度に、処理3441KBで、入力文字が検索要求入力部描画データの表示内容部34422E13に格納され、それが描画処理34414で検索要求入力窓に表示される。すなわち、キーワードからの入力文字が、次々に検索要求入力窓E1に書き込まれていくことになる。
検索条件の入力が終わったら、キーボード検索ボタンB01(図3)をマウスでクリックすると、検索が実行される。すなわち、マウスを離した時に、分岐34416で処理3441MRが選択され、その中ではクリックされたボタンの種類によって分岐が起こり、検索ボタンB01の場合には、キーワード検索要求が、情報提供者側計算機1の検索支援プログラム143に送信され、検索結果と特徴語情報などが返信される。また、検索結果描画更新フラグと特徴語描画更新フラグが、両方ともオンにセットされるため、検索結果描画データ更新処理34412と特徴語描画データ更新処理34413では、新たに受信したデータを元にして、それぞれの描画データが作成され、検索結果表示部描画データ34422P1と特徴語表示部描画データ34422P2のデータが更新される。これら新しいデータに基づいて、描画処理34414では、検索インターフェイスを描画する。
図6は、検索支援インターフェイスにおける検索結果と特徴語の表示例である。検索条件として「キーワードa1、キーワードa2」を入力してキーワード検索を行なった後の検索インターフェイス画面の例である。検索結果表示部P1には、検索された文書のリストが関連度スコアと共に出力される。一行が一つの文書についての情報であり、左端から文書をユーザーが選択するための小窓、文書の検索要求との適合度を示す数値、それから文書を人間が識別するための情報(例えば文書のタイトルや発行日などの情報)、キーワードなどによって構成される。また、検索された文書の総数が、その上の部分L12に示される。この数値は、インターフェイス描画データ34422の中の文字列描画データ34422Lの一つである「総数(左)」描画データ34422L11の中の文字列情報として、検索された文書数「22」が格納され、それがこの表示部L12に表示される。また、特徴語表示部P2には、検索された文書群に特徴的に現れる単語を相互の関連性が分かるようなグラフ形式で表示される。検索された文書群から、このような特徴語グラフを生成する方法は、例えば、特願平8−176174「文献検索支援方法及び装置およびこれを用いた文献検索サービス」に記載されている方法を用いることができる。
図7は、この時の検索結果表示部描画データ34422P1(図4)の詳細である。同データは、表示位置、領域サイズ、原点位置と表示内容で構成される。表示位置は、インターフェイス全体枠の中のどの位置にこの部品を貼り付けるかを示し、原点位置は、表示領域の左上角に来る描画領域の座標を示している。スクロール操作を行なうことにより、この値を変えることができる。
描画内容34422P14は、描画位置と図形種類、付帯情報から構成される。これの一行目は、位置(40、30)にサイズが(5、5)で色が透明の矩形を描画するということを意味である。二行目は、位置(60、30)に「2」という文字列を描画する。また、三行目は、位置(80、30)に該当文書のタイトル名<タイトル−a1>を描画するという意味である。従って、これらに基づいて描画を行なうことにより、図6の検索結果表示部P1の1行目が描画されることになる。2行目以降も同様である。
図8も、同じくこの時の特徴語表示部描画データ34422P2(図4)の詳細である。こちらの描画内容は、グラフのリンクを表す線分描画データ群と、ノードの文字列を表す文字列描画データ群で構成されている。線分は、始点と終点で指定されている。例えば、1行目は、座標(80、80)から座標(100、30)へ線分を描画することを意味し、また、5行目は、座標(100、20)に文字列<特徴語−a1>を背景色=緑で描画することを意味する。この描画内容に基づいて描画されたのが図6の特徴語表示部P2のグラフである。
検索支援インターフェイス画面の検索要求入力窓E1から検索要求として「キーワードa1、キーワードa2」を入力した状態から、キーワード検索ボタンB01を押すと、途中色々な処理が行なわれて、検索結果のタイトルリストと特徴語に関する情報を表示する図6のようなインターフェイス画面が得られるということをこれまでに述べてきた。以下では、検索ボタンが押されて、検索要求が情報提供者側の検索支援プログラム143へ送られて、検索結果や特徴語などの必要な情報が用意されて、利用者側の検索支援プログラム344に返信され、それらの情報に基づいて、図7、図8に示したような、検索結果表示部描画データ34422P1や特徴語表示部描画データ34422P2が作成されるまでの処理過程を説明する。
キーワード検索ボタンB01がクリックされると、ボタンが一度押されて次に離された時に、利用者側検索支援ルーチン3441におけるボタンが離された時の処理3441MRの一つとして、情報提供者側にキーワード検索の要求を送り、必要な情報を受信するという作業が行なわれる。
図9は、図3の状態からキーワード検索ボタンB01がクリックされた時の利用者側検索要求格納エリアの内容の一例を示した図である。検索手法としては、「キーワード検索」、検索内容(検索条件)としては、「<キーワード−a1>or<キーワード−a2>」、また、検索対象データベースは、現在選択されている「<文書DB−D1>」が格納される。検索内容は、検索要求入力部描画データ34422E1(図4)の表示内容欄に格納されている文字列(この場合「<キーワード−a1> <キーワード−a2>」から作成される。また、検索対象データベースは、図3のDB選択手段M1の欄に示されているデータベースとなる。実際には、この情報は、検索対象選択部描画データ34422M1(図4)の中に書かれている。
以下、図10〜図12では、情報提供者側の検索支援プログラム143、およびそこで使われるデータ類について説明する。
図10は、情報提供者側計算機1のワークエリア14で稼働する検索支援プログラム143の構成例である。検索支援プログラム143は、メインルーチン1431、データエリア1432とサブルーチン類1433〜1439などで構成される。データエリア1432は、メインルーチンやサブルーチンで使われる種々のパラメータを格納するためのエリア14321、検索要求格納エリア14322、検索結果格納エリア14323、特徴語格納エリア14324、特徴語間リンク情報格納エリア14325、特徴語−文書対応表格納エリア14326、文書−特徴語対応表格納エリア14327、特徴語間共起テーブル格納エリア14328などから構成され、サブルーチンとしては単語表記標準化ルーチン1433、単語表記−単語番号変換ルーチン1434a、単語番号−単語表記変換ルーチン1434b、キーワード検索ルーチン1435、連想検索ルーチン1436、特徴語抽出ルーチン1437、特徴語間共起テーブル作成ルーチン1438、特徴語間リンク情報作成ルーチン1439などから構成される。
図11は、情報提供者側計算機1の情報保持手段15に保持されている検索対象データベースの一つである<文書DB−D1>という識別名を持つ文書データベースに関するデータ15D1の詳細である。同データ15D1は、文書データベース15D11、文書−単語対応データ15D12、単語−文書対応データ15D13、単語頻度データ15D14、クラスタ木15D15などから構成される。以下、それぞれのデータの詳細について説明する。
文書データベース15D11は、検索される文書のテキストや書誌情報などのデータベースであり、情報提供者側検索支援ルーチン1431では、利用者側から文書識別子を指定した閲覧要求を受けとると、該当する文書データをこのデータベースから取り出して、利用者側に送信する。
文書−単語対応データ15D12は、文書番号に対して、その文書に含まれる単語の番号とその単語の頻度の組をリストにしたものである。なお、対象とする文書のサイズが大きい場合などには、全文を単語カウントの対象とせず、要旨など文書全体に書かれている内容を良く反映している部分だけを対象としても良い。なお、頻度は省略して、単語だけのリストを対応させても良い。
文書番号とは、データベースに含まれている各文書にユニークに与えられている識別番号であり、単語番号は、本検索支援システムでキーワードとして扱うことができる全ての単語に対してユニークに与えられている識別番号である。単語に対してその識別番号を得るには、単語表記−単語番号変換ルーチン1434a(図10)を用いる。また、単語番号に対して単語表記を得るには、単語番号−単語表記変換ルーチン1434b(図10)を用いる。これらの変換ルーチンは、辞書15D0(図1)中の単語番号−単語表記対応表を参照する。
単語−文書対応データ15D13は、文書−単語対応データ15D12と転置関係にあるデータである。すなわち、各単語番号に対して、その単語を含むような文書番号とその単語の出現頻度の組のリストが対応する。なお、頻度は省略して、単語だけのリストを対応させても良い。
単語頻度データ15D14は、各単語番号に対して、その単語が文書DB全体で何回現れるかという頻度F(d)と、その単語を含む文書が幾つあるかという文書頻度DF(d)の組が対応しているようなデータである。
クラスタ木15D15は、この文書DBの各文書を類似しているもの同士をまとめるという操作を繰り返して(組になったもの同士も、似ているものから順に、更に大きな組にするという操作を繰り返して)、階層化したものである。そのためには、例えば、特開平9−62693「確率モデルによる文書分類方法」を用いると、高精度の文書クラスタ木を構成できる(文書における単語の分布状況は、文書−単語対応データ15D12から得ることができ、単語の分布状況は、単語の全体を基底とする一つのベクトルと見なされるので、その角度で類似度を計るという方法もある)。このクラスタ木は、連想検索(文書間類似度に基づく検索)をトップダウンの2分探索により非常に高速に行なうために利用する。探索は、キーとなる文書が各分岐地点において候補となる文書クラスタのどれに属する確率が一番高いクラスタを選択する、というプロセスで行なわれる。ある文書が文書クラスタに属する確率は、前記特開平9−62693の計算方法を用いるのが良い。
図12は、情報提供者側検索支援ルーチン1431(図10)の詳細である。同ルーチン1431は、利用者側からの検索要求を受けて起動される。始めに、分岐14311では、検索要求における検索手法の指定に従って、キーワード検索143111、または連想検索143112が行なわれる。図9に示す例の検索要求を受けとった場合であれば、検索手法の指定が「キーワード検索」なので、キーワード検索の方が選択される。キーワード検索の場合には、検索内容格納エリア344232がキーワードの論理結合となるので、単語−文書対応データ15D13を参照して、各キーワードを含む文書番号の集合を得、それらの論理結合となる集合を計算すれば良い。また、連想検索の場合には、上記クラスタ木15D15の説明の所で説明した方法で、キーとして与えられた文書と類似文書を検索する。検索結果は、いずれの場合でも、文書識別番号と検索条件との適合度スコアの組の集合であり、それらは適合度スコアの大きい順に、検索結果格納エリア1423に格納される。キーワード検索の場合の適合度スコアは、例えば、幾つのキーワードを含むかでスコアづけを行なうことができ、また、連想検索の場合には、類似度をスコアとすることができる。
以下、特徴語抽出14312、特徴語間共起テーブルの作成143131、特徴語間リンク情報作成143132、特徴語のグラフ配置座標計算143133、特徴語−文書対応表作成143141、文書−特徴語対応表作成143142、などの作業を行い、検索結果と特徴語を表示するのに必要な情報をユーザーへ返信する。
本検索支援方法の特徴は、検索結果とともにその特徴情報もプラスして、利用者に提示する点にある。ただし、図示及び説明は省略したが、それを希望するかどうかは利用者が選べるようにすることができる。利用者がそれを希望しないというオプションを選んだ場合には、検索結果だけを利用者に返信すれば良いので、特徴語抽出14312以下の処理を省略することができる。
検索結果からの特徴語抽出14312、および特徴語間共起テーブルの作成143131、特徴語間リンク情報作成143132、特徴語のグラフ配置座標計算143133については、特願平8−176174「文献検索支援方法及び装置およびこれを用いた文献検索サービス」に記載されている方法を用いることができるので、ここでは簡略な説明にとどめる。特徴語抽出14312ルーチンは、検索結果の文書群に含まれる全ての単語各々(X)について、それらが含まれる文書の数df(X)をカウントする。これは、文書−単語対応データ15D12を参照すれば、簡単に行なうことができる。また、単語頻度データ15D14(図11)を参照し、それらの単語がデータベース全体で幾つの文書に出現しているかという文書頻度DF(X)を知ることができる。df(X)とDF(X)の比が、単語Xがいかにこの検索結果に特異的に現れるかという度合を示すので、この値の大きな単語を特徴語として抽出する。ただし、頻度が大きい一般的な単語と頻度が小さい特殊性の強い単語を同一の尺度で比較することは困難なので、検索結果における文書頻度df(X)により、幾つかのクラスに分割し、各頻度クラスからバランス良く特徴語を取るのが良い。
特徴語間共起テーブル作成ルーチンは、上記の方法で抽出した特徴語を縦横に取るテーブル形式のデータの作成ルーチンである。縦=特徴語Xと横=特徴語Yの欄には、検索結果の文書集合中で特徴語Xと特徴語Yが共に出現する文書の数CF(X,Y)が入る。
特徴語間リンク情報作成ルーチン143132では、特徴語間共起テーブルを参照し、各特徴語(X)から自分自身より頻度の大きい特徴語を関連度の強い順に並べて作成する。特徴語Xと特徴語Yとの関連度の計算方法は、色々な方法が可能であるが、一つの方法としては、共起文書頻度CF(X,Y)とYの文書頻度df(Y)の比CF(X,Y)/df(Y)を取る方法がある。この値の大きい順にリンク先候補とする。なお、抽出した特徴語が常に全て表示される訳ではないので、実際のリンク先は、このリンク先候補を上位(左)から見ていき、表示されるものかどうかを判定し、それが表示されるものであれば、それが実際のリンク先となる。また、リンク先とは別に、どこからリンクが入るかを調べておくと便利なので、それも調べて情報として取っておく。
特徴語のグラフ配置座標計算ルーチン143133では、特徴語の集合と全ての特徴語が表示されるという仮定のもとで、特徴語リンク情報を元に特徴語を2次元配置する際の座標を計算する。前出特開平10−74210号公報の方法を簡単に説明すると、縦方向の座標は、それぞれの特徴語の検索結果における文書頻度df(X)とする。(ただし、変域をコンパクトにするために対数を取ったり、さらに逆正接関数を施したりする。)横座標については、はじめに、リンク先のないノードを予定範囲に均等に配置する。以下、再帰的に、全てのリンク先の横座標が決まったノードでリンク先のセットを共有するものを予定範囲内で均等に配置していくという方法で、横座標を順次決めていく。なお、この方法では、ノードに重なりが生じる場合があるので、重なりが生じた場合には、右にある方をさらに右にずらして、重なりを避けるようにする。
特徴語−文書対応表作成ルーチン143141では、単語−文書対応データ15D13を参照して、特徴語の一時的な番号に対して、検索された文書中でその単語を含むものの一時的な番号を対応させるようなデータを作成する。ここで、一時的な単語番号とは、特徴語格納エリアに格納されている特徴語が何番目に格納されているかを示す番号を指す。また、一時的な文書番号とは、検索結果格納エリアに格納されている文書が何番目に格納されているかを示す番号である。
文書−特徴語対応表作成ルーチン143142では、文書−単語対応データ15D12を参照して、検索された各文書に対して、それに含まれる特徴語の一時的な番号を対応させる表を作成する。
以上の操作を終えて、情報提供者側の検索支援ルーチン1431は、検索結果と特徴語に関するデータ、および文書と特徴語の関係を示すデータを利用者側へ返信する。以下、図13〜17は、利用者側へ返信されたデータの例である。
図13は、送信された検索結果のデータの一例である。本体部分(a)と表示順序に関するデータ(b)に分かれている。本体の利用者側の検索結果格納エリア34424aには、一時的な文書番号、文書選択に関するフラグ、文書に付けられるマークの強度、文書識別子番号、検索条件との適合度スコア、およびタイトルや発行日など、利用者が見て文書を識別しやすい情報などから構成されている(一時的な文書番号とは、この表の何番目に格納されているかを示す番号であり、実際に文書内容を取りに行く時などには文書識別子番号の方を使う必要がある。ただし、この操作は計算機内部で行われることであり、利用者は、例えば、タイトルを指定すれば良い)。選択フラグとマーク強度は、情報提供者側から送られた当初は、全てクリアされた状態になっている。利用者が検索支援インターフェイス322(図3)を操作すると、これらの値が変化し、それに応じてインターフェイス画面が変化することになる。選択フラグは、利用者が関心のある文書として指定した時にオン(1)になる。選択された文書から連想検索を行なったり、選択された文書に含まれる特徴語をマーク(強調)したりする場合などに利用される。選択フラグの取る値としては、オン(1)オフ(0)の2値でも良いし、また、負の選択(積極的に関心が無いという選択)を許す場合には、1/0/−1の3値を取り得るようにしても良い。本実施例では、1/0の2値である。一方、マーク強度は、特徴語の方にも選択できる機構があり、選択された特徴語を含む文書をマーク(強調)する場合などに利用する。含む特徴語の種類が多いほど、マーク強度を高くする。
適合度スコアについては、図13の例では、最初2つについては2で、残りは1となっているが、これはキーワード検索の際に、指定したキーワードのうち何種類を含むかでスコア付けするという方法を採用し、最初の2つについては、指定キーワードの<KW−a1>と<KW−a2>の両方とも含んでいるため、2点となり、それ以外のものは、どちらか一方しか含まなかったので、1点となったものである。適合度の計算方法には、これ以外にも色々な方法が可能である。なお、連想(類似度)検索を行なった場合には、スコアは類似度をそのまま、あるいは何らかの方法で規格化して用いることができる。規格化の方法としては、例えば、最も類似度の高いものを100点として、以下、比例配分する方法などがある。
図13(b)は、文書の表示順序に関するデータである。情報提供者側から送られた当初は、一時的な文書番号の順で表示するので、1から順に並んでいる。後に説明するが、本検索支援インターフェイスでは、マーク強度によるソート機能(ボタンB32(図3参照))があり、文書の付けられたマークの強いものから順番に表示するという機能を提供する。この機能を使う時に、文書表示順序を変えたり、元に戻したりするため、この表示順序格納エリア34424bが実質的に使われる。
図14は、特徴語に関するデータの一例である。利用者側の特徴語格納エリア34425に格納されたデータは、一時的な特徴語番号、グラフ表示に出現するかどうかを示すフラグ、選択フラグ、マーク強度、単語表記、特徴語グラフでの表示位置、頻度クラスなどから構成される。
グラフ表示に出現するかどうかのフラグは、図14の例では、最初の5個については1(出現)、あとは0(出現せず)となっている。この5個というのは、図3に示した画面の選択数L23の設定でグラフに出現する単語の個数を規定するものであるが、この値を実際に幾つにするかは、情報提供者側、また利用者側双方でパラメータ設定することができる。利用者側で設定がない場合には、情報提供者側の設定値をデフォールトで用いることになる。
選択フラグとマーク強度については、検索結果の場合と同様、初期状態では全てクリアされている。グラフ表示位置は、サーバー側の検索支援ルーチン1431が特徴語のグラフ配置座標計算ルーチン143133(図12)で計算した値である。頻度クラスは、特徴語抽出ルーチン14312(図12)において、特徴語の検索結果中での文書頻度の大小に応じてクラス分けた値である。クラス1は比較的高頻度、クラス2は中程度で、クラス3は比較的低頻度であることを示す。
図15は、特徴語間リンク情報データの一例である。特徴語のグラフ表示において、各特徴語からどの単語にリンクを張るかを優先順位の高い順に並べたものであり、グラフを表示する時に利用する。データは、一時的な特徴語番号に対して、リンク候補の一時的な特徴語番号のリストが対応する形になっている。リンク先は、グラフに表示する単語セットが決まった時点で、リンク候補から最も優先的なリンク先を選んで得られる。例えば、一時的特徴語番号3の特徴語からの優先順位は1、2...であるが、図14のデータの場合では、グラフ表示は一時的特徴語番号1〜5が表示されるので、最初の1番がリンク先となる。リンク元リストは、リンク先データから自動的に作られる。
図16は、特徴語−文書対応表の一例である。一時的な番号の付された各特徴語に対して、検索結果の文書中、それを含む文書の一時的な番号の文書リストが対応するという形式を取る。これは、特徴語−文書対応表作成ルーチン143141(図12)で、単語−文書対応データ15D13(図11)を参照して作成したものである。
図17は、文書−特徴語対応表の一例である。検索結果の一時的な番号の付された各文書に対して、その文書に含まれる特徴語の一時的な番号のリストが対応するという形式を取る。文書−特徴語対応表作成ルーチン143142(図12)で、文書−単語対応データ15D13(図11)を参照して作成したものである。
特徴語−文書対応と文書−特徴語対応は、転置の関係にある。例えば、図16で、一時的文書番号が1の文書は、一時的な特徴語番号が1、2、4の欄に出現しているが、図17では、文書番号1の欄に特徴語番号1、2、4が出現している。
以上の受信データ(検索結果と特徴語データ)に基づいて、利用者側検索支援ルーチン3441(図5)は、検索結果描画データの更新34412と、特徴語描画データの更新34413を行なう。検索結果描画データの更新では、検索結果描画データ作成ルーチン3443(図2)をサブルーチンとして用い、特徴語描画データの更新では、特徴語グラフ描画データ作成ルーチン3444をサブルーチンとして用いる。また、これらの描画データ作成ルーチンは、パラメータ格納エリア34421(図2)で設定されているパラメータ値を利用する。これらのルーチンとパラメータ値の詳細を図18〜図21A、Bを用いて説明する。
図18は、検索結果描画データ作成に用いるパラメータ344211の詳細である。検索結果を表示する際の行間隔(Δy)、マーク表示位置(x1)、マークずらし幅(Δx1)、マークのビットマップ識別子(Bm)、選択窓表示横座標(x2)、選択窓サイズ(h、v)、選択されていない時の窓表示色(CS0)、選択されている時の窓表示色(CS1)、スコア表示位置右端の横座標(x3)、タイトル表示位置左端の横座標(x4)、文書表示中のタイトル表示部の背景色(CD)、タイトル表示用フォント(F)、などのパラメータがある。ここで、( )の中に示した文字列は、検索結果描画データ作成ルーチン3443の説明で引用するためのものである。
図19A、Bは、検索結果描画データ作成ルーチン3443の詳細であり、検索支援ルーチン3441(図5)の検索結果描画データ更新ルーチン34412で使われるものである。初めに、初期設定34431にて、表示順序を表す変数iと表示位置の縦座標値を示す変数yをそれぞれ0に設定する。ループ34432では、検索結果の文書の数だけ、以下の処理を繰り返す。はじめに、処理34433では、変数iの値と変数yの値をそれぞれ1とΔyだけインクリメントする。Δyは、パラメータ344211(図18)の中の検索結果を表示する際の行間隔の値として設定されている値である(表示位置の縦座標は、上から下に向かって数値が大きくなるものとする)。また、変数nに、i番目に表示する文書の一時的な番号を代入する。この値は、検索結果表示順序格納エリア34424b(図13b)を参照して、表示順序iに対応する番号を取ることによって得られる。なお、以下の説明では、正確には「一時的な文書番号がnの文書」と言うべきところを、特に誤解が生じるおそれがない限り、「文書n」と略記する。
続いて、マーク描画データ作成ルーチン34434、選択窓描画データ作成ルーチン34435、スコア描画データ作成ルーチン34436、タイトル等描画データ作成ルーチン34437を行なう。はじめの2つについては、それぞれ図19B(b)と(c)で詳しく示す。スコア描画データ作成ルーチン34436では、「位置(x3、y)に、図形種=文字列、貼り付け位置=右下、文字列=(文書nのスコアの10進表記)」という描画データを検索結果描画データ34422P1(図7)に追加する。ここで、x3は、スコア表示位置右端の横座標として、検索結果描画データ作成用パラメータ344211(図18)に設定されているものである。
最後に、タイトル等描画データ作成ルーチン34437では、当該文書が表示中であれば、変数colに文書表示中のタイトル表示部の背景色CD(図18)を代入し、そうでなければ、透明とする。当該文書が表示中であるかどうかは、当該文書の識別番号(検索結果格納エリア34424aの文書番号欄から分かる)と検索支援ルーチンで使われる変数MD(表示中の文書の識別番号(図5))の値が一致するかどうかで判定できる。続いて、「位置(x4、y)、図形種=文字列、貼り付け位置=左下、背景色=col、文字列=(文書nのタイトル)」という描画データを検索結果描画データ34422P1に追加する。ここで、x4は、タイトル表示位置左端の横座標としてパラメータ設定されている値(図18)である。文書nのスコアと文書nのタイトルは、検索結果格納エリア34424aの該当欄から得ることができる。
図19B(b)は、マーク描画データ作成ルーチン34434の詳細である。この作業では、マーク用のビットマップ識別子として変数Bm(図18)にパラメータ設定されているマーク記号(チェックマークなど)を表示するための描画データを検索結果描画データ34422P1(図7)に追加する、という処理344343を文書nのマーク強度分(検索結果格納エリア34424aから得られる)だけ繰り返すというプロセスである。表示の横座標は、初期設定344341でマーク表示位置としてパラメータ設定されている値x1(図18)が代入され、一回ごとに、同じくマークずらし幅として設定されている値Δx1だけずらしながら、マークを表示する。このため、マーク強度に比例した太さのチェックマークが描かれることになる。
図19B(c)は、選択窓描画データ作成ルーチン34435の詳細である。始めに、条件判定ルーチン344351では、文書nが選択されているかいないか(検索結果格納エリア34424aの選択フラグから分かる)を判定し、選択されている場合には、窓表示の色(col)を選択時の選択窓表示色(CS1)として指定されている色(赤などの目立つ色)とし、そうでない場合には、CS0として指定されている目立たない色(透明など)とする。続いて、条件判定ルーチン344352では、ドラッグモードが文書選択中(MM=11)の時であって、現在処理中の文書が、ドラッグ開始時にマウスが押された文書の位置と、現在マウスが指示している位置の間(端も含める)にある時、ドラッグ開始時にマウスを押した位置の文書がもともと選択されていたならば、窓表示の色を示す変数colに非選択色CS0を代入し、選択されていなかったならば変数colに選択色CS1を代入する。さらに、選択窓のサイズとして、指定されてい値(h、v)を用い、「位置(x2、y)に図形種=矩形、サイズ(h、v)、色=col」という描画データを検索結果描画データ34422P1に追加する。これにより、選択状態にあるか、または現在ドラッグ中で(その時点でマウスを離せば)選択状態になる予定の文書の選択窓は選択色(CS1)になり、そうでないばあいには非選択色(CS2)となる。
図20は、特徴語グラフ描画データ作成用パラメータ344212の詳細である。特徴語文字列を表示する部分の背景色、フォント種類、枠線の色についての指定であり、それぞれ、選択時と非選択時、またマークされた場合とマークがない場合の値が指定されている。この例では、特徴語が選択されていない場合の背景色は緑、フォントは通常、また、選択されている場合には、背景色がオレンジ、フォントが強調用のフォントとなっている。また、マークされている場合の枠線色は赤、そうでない場合は透明と設定されている。一般に選択された場合、やマークがある場合には目立つ色、目立つフォントを用いるのが良い。
図21A(a)は、特徴語グラフ描画データ作成ルーチン3444の詳細であり、検索支援ルーチン3441(図5)の特徴語描画データ更新ルーチン34413で使われるものである。始めに、検索支援ルーチン3441でのドラッグモードが特徴語移動中(MM=21)の時には、変数ΔMにマウスが押された位置からの移動量(縦、横)を代入し、また、ドラッグモードが特徴語選択領域設定中(MM=22)の時には、特徴語選択領域(マウスが押された位置と現在の指示位置を対角とする矩形を描画するデータを特徴語描画データ34422P2に追加する。
続いて、表示フラグがオンになっている特徴語(一時的番号=i)について、その特徴語のノードを描画するデータとその特徴語からのリンクを描画するデータを作成する。始めに、処理34444では、placeという変数に特徴語iの表示位置を代入する。その値は、特徴語格納エリア34425(図14)から得ることができる。また、特徴語の表示フラグがオンになっているかどうかも、同じく特徴語格納エリアの該当する欄から得ることができる。続いて、モードが特徴語移動モード(MM=21)であって、かつ特徴語iの選択フラグがオンである場合には、変数placeに、先ほど計算したΔM(マウス移動量)を加える(すなわち、マウス移動量に応じて表示位置が変化する)。このようにして、特徴語iからの描画データの作成ルーチン34446(図21A(b))と、特徴語iのノードの描画データの作成ルーチン34447(図21B(c))を行なう。
図21A(b)は、特徴語iからのリンクの描画データの作成ルーチン34446の詳細である。特徴語iからのリンク先がある場合には、その全てについて、以下の処理を行なう。まず、処理344462では、リンク先の表示位置(特徴語格納エリア34425における)を変数endに代入する。続いて、モードが特徴語移動モード(MM=21)であって、かつリンク先の選択フラグがオンである場合には、リンク先の表示位置変数endにマウス移動量であるΔMを加える。このように設定しておいて、「位置=place、図形種=線分、終点=end」という描画データを特徴語描画データ34422P2に加える。
図21B(c)は、特徴語iのノードの描画データの作成ルーチン34447についての詳細である。特徴語iが選択されているかいないかで、背景色cbとフォントftを設定値にセットし、特徴語iがマークされているかいないかで、枠線色cfを設定値にセットする。そして、「位置=(特徴語iの表示位置)、図形種=文字列、貼り付け位置=センター、背景色=cb、フォント=ft、枠線色=cf」という描画データを特徴語描画データ34422P2に追加する。
以下では、本検索支援インターフェイス322が利用者に提供する様々な機能を説明する。利用者は、これらの機能を色々と組み合わせて利用することにより、検索結果を分析したり、また、その情報を活かして検索方法や検索条件を改良したりしながら、望みの検索結果へと近付いていくことができる。
このインターフェイスを動かすための検索支援ルーチン3441は、既に図5において示したが、ボタン操作やマウス操作など、各種入力に対してどのような作業を行なうかについては、極く一部を示すに留まっていた。図5におけるキーボード入力に対する処理3441KB、マウスが押された場合における処理3441MP、マウスを押しながら移動している時の処理3441MD、マウスを離した時の処理3441MRがそれである。以下図22〜図26A、Bを用いてそれらについて詳述する。
図22は、キーボード入力に対する処理3441KBの詳細である。入力を受け付ける可能性のある部品が幾つかあるので、始めに、どの部品が入力を受け付ける状態にあるかを判定し、検索要求入力窓E1(図3)が受け付け状態にある場合には、インターフェイス描画データ格納エリア34422(図4)の検索要求入力部描画データ34422E1の中の表示内容34422E13のカーソル位置34422E15で示された所へ、入力された文字を追加していく。この内容は、検索支援ルーチン3441におけるインターフェイス画面描画処理34414(図5)で、インターフェイス上の検索要求入力窓E1に描画される(従って、キーボードからの入力が検索要求入力窓E1に書き込まれていくように見える)。なお、削除入力の処理方法については、幾つかバリエーションが可能であるが、マーク位置が指定されている場合には、マーク位置からカーソル位置まで削除され、また、それがない場合には、カーソル位置の直前の文字が削除されるようにするのも一法である。
また、検索要求入力窓E1が受け付け状態にある場合の特殊な取り決めとして、改行が入力された場合には、キーワード検索ボタンを押した場合と同じ処理が行なわれる、ということにしておくと使い易い。
その他入力受け付け窓としては、テキスト入力ボタンB03が押された場合に開かれるテキスト入力部TE1(図36の説明で後述)があり、そこへキーボードからテキストを入力する場合がある。詳細はテキスト入力機能のところで説明する。
図23A(a)は、検索支援ルーチン3441において、マウスが押された場合の処理3441MPの詳細である。いずれかの入力窓が押された場合には、その入力窓を入力受け付け状態にする(処理3441MP−E)。また、押された位置が検索結果表示部P1の場合の処理3441MP−P1と、特徴語表示部P2の場合の処理3441MP−P2は、処理が複雑になるので、それぞれ図23A(b)と図23B(c)に分けて示した。
図23A(b)は、検索結果表示部P1でマウスが押された場合の処理3441MP−P1の詳細である。始めに、処理3441MP−P1−1では、検索支援ルーチン3441で使われている変数MS(図5)に上から何番目の文書の表示部で押されたかを記録する。次に、マウスが押された位置による分岐3441MP−P1−2があり、いずれかの文書の選択窓(小さい矩形)である場合(図6参照)には、やはり検索支援ルーチン3441で使われている変数MMを文書選択中モードであることを示す11とする。また、変数MFには、該当文書のマウスが押される直前の選択フラグの値(検索結果格納エリア34424a(図13(a))から得られる)が代入される。また、押された位置が、いずれかの文書のスコア、あるいはタイトル表示部であった場合には、上記モード変数MMを表示文書指定中であることを意味する値(=12)とする。
これらの値は、マウスを押しながら移動する時、また離す時に参照されて、それぞれに応じた処理をするために使われる。従って、実際にどのような効果を及ぼすかについては、マウスを移動中、あるいはマウスを離した時の処理の所で示す。
また、検索結果描画更新フラグFr(図5)を1(オン)にすることにより、検索結果描画データが更新されるようにする。
図23B(c)は、特徴語表示部P2に特徴語グラフが表示されている時に特徴語表示部でマウスが押された場合の処理3441MP−P2の詳細である。
特徴語に対するマウス操作としては、指示した特徴語を検索キーワードとして用いる場合と、選択/選択解除(+移動)を行なう場合がある。本実施例では、左マウスで選択/選択解除を行い、右マウスでキーワードとしての追加、あるいは削除ができるような設定にしている。もちろん、これらを入れ換えても構わない。また、シフトキーと併用した場合としなかった場合で、異なる操作ができるようにしているが、これらも、また入れ換えること可能である。従って、ここでの説明は、可能な設定の中の一つの場合を実現する方法である。
マウスが押された場合の処理3441MP−P2では、まず、マウスが押された位置がいずれかの特徴語の上であるかどうかで分岐する。特徴語の上で押された場合には、マウスの種類により分岐し、左マウスの場合には、以下の作業を行なう。はじめに、シフトキーが押されていたかどうかで条件分岐があり、左マウスとシフトキーを併用した場合には、処理3441MP−P2−1が行なわれ、押された特徴語のみについて、選択/非選択を反転する。すなわち、特徴語格納エリア34425(図14)の選択フラグ欄の値を書き換える。また、左マウスをシフトキーを用いずに押した場合には、さらに、押された特徴語の選択状態により分岐し、もともと選択状態にあった場合には、何も行なわず、非選択状態であった場合には、その特徴語は選択状態にし、その他の特徴語は全て非選択状態にするという処理3441MP−P2−2を行なう。
また、左マウスを用いて、上記のような操作を行なった後に押された特徴語が、選択状態となった場合には、検索支援ルーチン3441でのモード変数MMの値を特徴語移動中であることを示す値(=21)とする。これにより、押したままマウスを移動すると、選択されている特徴語をマウスの動きにつれて動かすことができるようになる。
右マウスで特徴語の上を押した場合には、特に作業が行なわれないが、離す時には、選択された特徴語を検索要求に加えたり削除したりという作業が行なわれる(後述するマウスを離した時の作業参照)。
一方マウスが押された位置がいずれの特徴語の上にもない場合には、処理3441MP−P2−3が行なわれ、上記のモード変数MMの値が特徴語選択領域設定中であることを示す値(=22)に設定される。これにより、押したままマウスを移動すると、特徴語選択領域を示す矩形が特徴語表示部P2に表示され、マウスを離した時に、その特徴語選択領域と重なりのある特徴語が全て選択されるという操作ができる。
また、特徴語描画更新フラグFc(図5)を1(オン)にすることにより、特徴語表示部の描画データが更新されるようにする。
図24は、マウスを押したまま移動中(ドラッグ作業中)の処理3441MDの詳細である。直前にマウスが押された位置により、以下の処理を行なう。検索結果表示部の選択窓で押された場合には、処理3441−MD1において、検索支援ルーチン3441の検索結果描画更新フラグFr(図5)をオン(=1)にして、移動中は常に検索結果表示部の描画内容が更新されるようにする。また、特徴語表示部で押された場合には、処理3441−MD2において、特徴語描画更新フラグFcをオン(=1)にして、移動中は常に特徴語表示部の描画内容が更新されるようにする。また、それ以外で、何れかのボタン上で押された場合には、現在位置がその押された時と同じボタン上にあれば、そのボタンを押されている状態とし、そうでない場合には、そのボタンを押されていない状態とする(インフェース描画データ格納エリア34422(図4)の該当するボタンに関するデータを書き換える)。
ところで、はじめの二つの場合には、それぞれ検索結果描画更新フラグFrと特徴語描画更新フラグFcがオンになって、移動中は常にそれぞれの描画内容が更新されることになるが、それが実際に画面上でどのように現れるかについて説明する。
はじめに、検索結果表示部の選択窓からドラッグがスタートした場合であるが、検索結果描画データの更新を行なう検索結果描画データ作成ルーチン3443の選択窓描画データ作成ルーチン34435(図19B(c))では、分岐344352でモードの判定を行い、文書選択モード(MM=11)にある時には、直前にマウスが押された位置(MS)と現在の指示位置の間にある文書については、ローカルに選択状態を変更し、直前にマウスが押された位置の文書の選択フラグ(変数MFに代入されている)と反対の値にするという操作が行なわれる(変数MM、MS、MFは、マウスが押された時の処理3441MP−P1(図23A(b))で設定されている)。すなわち、非選択状態にあった文書の選択窓をマウスで押して、押したままマウスを移動しているとすると、押した位置と現在位置の間のすべての文書の選択窓が選択状態の色で描画されることになる。
ここで注意すべきことは、文書の選択状態が変化するといっても、それはローカルに行なわれていることであって、検索結果格納エリア34424a(図13)の選択フラグを書き換えているわけではない、ということである。すなわち、各文書のもともとの選択フラグは保存されているので、マウスの動きと共に一旦変化したものをもとにもどすことができる。例えば、上から3番目の文書からスタートして、そのまま下方に移動して7番目までいくと(3番目の文書がもともと選択されていなかったとすると)、3番から7番までは(もとの状態が何であれ)選択状態になる。次に、押したまま向きを変えて、上方に移動して5番目まで行った状態では、3番から5番までが選択状態となり、それ以外(6番7番も含めて)は、もともとの状態に復帰する。
次に、直前にマウスを押したのが特徴語グラフを表示中の特徴語表示部の場合である。移動中に描画内容が変化するのは、次の2つの場合である。一つは、特徴語の上で押され、その直後にその特徴語が選択状態になった場合であり、もうひとつは、特徴語が表示されていない地の部分で押された場合である。処理3441MP−P2(図23B(c))で、前者では、モード変数が特徴語移動モード(MM=21)に設定され、後者では、特徴語選択領域設定中モード(MM=22)に設定されていることに注意する。
実際に描画データが作成されるのは、特徴語グラフ描画データ作成ルーチン3444(図21A(a))においてであるが、はじめに、特徴語移動モード(MM=21)の場合についてみると、分岐34441でモードの判定が行なわれ、特徴語移動モードの場合には、変数ΔMにマウスの移動量が記録される。この移動量は、選択されている特徴語の描画データを作成する際に、特徴語ノードの描画位置は特徴語格納エリア34425(図14)に書かれている座標が基準となるが、選択されている特徴語については、処理34445では、このマウス移動量がプラスされる。すなわち、マウス移動分だけ描画位置がずれることになる。また、リンクの描画データ作成ルーチン34446(図21A(b))でも、リンクの始点と終点の各々について対応する特徴語が選択されている場合には、座標にΔMだけプラスされるので、リンクの方も特徴語の移動とともに移動して、描画されることになる。
次に、特徴語選択領域設定モード(MM=22)の場合であるが、この場合には、条件分岐34441にて、処理344412が選択され、特徴語選択領域として、マウスが押された位置と現在の指示位置を対角とする矩形を描画するデータが作成され、それが描画されることになる。
図25A、Bは、検索支援ルーチン3441において、マウスが離された(押された状態からもとに戻した)時の処理3441MRの詳細である。図25A(a)は、全体図であり、直前にマウスを押した位置により検索結果表示部であった場合(3441MR−P1、図25A(b))、特徴語表示部であった場合(3441MR−P2、図25B(c))、その他の場合で押された時と同じ部品上で離された場合(3441MR1、図26A、B)に分けて示している。
図25A(b)は、直前に押された位置が検索結果表示部であった場合にマウスが離された時の検索支援ルーチン3441の処理3441MR−P1の詳細である。
直前に押された位置で条件分岐し、いずれかの文書の選択窓で押された場合(モード変数MMが11になっている場合)には、処理3441MR−P1−1が行なわれ、マウスが押された位置の文書の押される直前の選択フラグ(変数MFに代入されている)と反対の値をtmpとし、マウスが押された位置から離された位置までの間(端も含めて)に表示されているすべての文書について、検索結果格納エリア34424a(図13a)における選択フラグをtmpとする。
また、直前に押された位置がいずれかの文書のスコアあるいはタイトルであった場合(モード変数MMが12になっている場合)には、処理3441MR−P1−2が行なわれ、検索支援ルーチン3441における表示中の文書の識別番号変数(MD)に、指示された文書の識別番号を代入する。表示手段32上に文書閲覧手段322Rが開いていない場合には、それを開く。さらに、該当する文書の内容を送信するように、情報提供者側の検索支援プログラム143に要求を送り、送られてきた文書内容を文書閲覧手段322Rに表示する(後述の図27の説明参照)。
なお、これらの作業を行なう場合、マウスを押す時には、実際に検索結果表示部P1に見えている部分で行なわれる必要があるが、離す時には、隠れている部分であっても構わない。
最後に、処理3441MR−P1−3では、直前にマウスが押された位置に関わらず検索支援ルーチン3441のモード変数MMを0にして通常状態に戻す。
図25B(c)は、直前に押された位置が特徴語グラフ表示中の特徴語表示部であった場合に、マウスが離された時の検索支援ルーチン3441の処理3441MR−P2の詳細である。
検索支援ルーチンのモード変数MMの値で異なった処理を行なう。特徴語グラフ表示中の特徴語表示部でマウスが押されているので、モード変数MMの取り得る値としては、0、21、22がある。21は選択されている特徴語を移動中のモード、22は特徴語選択領域を設定しているモードであり、0はそれ以外である(図23B(c)における処理3441MP−P2参照)。
特徴語移動中のモード(MM=21)となっているのは、直前にマウスを押した時に、左マウスを用いて特徴語ノードの上を押した場合であり、しかも、押した直後に、その特徴語が選択状態になっている場合である。この場合にマウスを離した場合には、処理3441MR−P2−1が行なわれ、選択状態にあるすべての特徴語について、特徴語格納エリア34425(図14)における表示位置座標を現在のマウス指示位置と直前に押された時の位置の差分だけ変化させる。マウスを押してから以降移動中には、特徴語グラフ描画データ作成ルーチン3444において、描画データの座標を計算する時に同様の処置を行なってきているが、特徴語格納エリア34425の表示位置そのものは変化させていなかった。マウスが離されたことをもって、特徴語の移動先が確定したと見なし、特徴語格納エリア34425の座標位置が書き換えられた訳である。
次に、マウスを離した時点で、特徴語選択領域設定中モード(MM=22)となっているのは、直前にマウスを押した位置が、いずれの特徴語ノードの上でもない地の部分を押した場合である(図23B(c)処理3441MP−P2−4参照)。この場合に、マウスを離した場合には、処理3441MR−P2−2が行なわれる。マウスを離す時にシフトキーを押していたかいないかで、異なった処理を行なう。シフトキーを押していた場合には、特徴語選択領域(マウスを押した位置と離した位置を対角とする矩形領域)と重なる特徴語のすべてについて、その選択/非選択状態を反転させる。また、シフトキーを押していなかった場合には、特徴語選択領域と重なる特徴語を全て選択状態とし、それ以外の全ての特徴語を非選択状態とする(いずれの場合でも、特徴語格納エリア34425の選択フラグを書き換える)。
また、この特殊な場合であるが、特徴語表示部P2の特徴語を表示していない地の部分をシフトを押さずにクリックすると、特徴語表示領域が特徴語を表示していない部分の一点となるため、どの特徴語とも重ならず、結果として、全ての特徴語が非選択状態になる。なお、同じ作業は、後述する選択解除(右)ボタンを押しても行なうことができる。
以上、2つの場合以外の場合には、通常モード(MM=0)となっている(右マウスを用いた場合と、左マウスを用いて特徴語ノード上を押し、押した直後にその特徴語が非選択状態となった場合がある)。この内、右マウスを用い、直前に押した位置がいずれかの特徴語ノードの上であり、同じ特徴語の上でマウスが離された場合には、直前にマウスを押した時にシフトキーを併用したかしないか、また、指示された特徴語の選択フラグのオン/オフにより、以下のような作業を行なう。シフトキーを押しながらで、かつ、選択フラグがオンの場合には、検索要求入力欄にある単語の内で、選択状態にある特徴語のいずれかと一致するものを全て削除する。シフトキーを押しながら、かつ、選択フラグがオフの場合には、検索要求入力欄にある単語の内で、指示された特徴語と同じ単語を全て削除する。シフトキーを押さない場合で、選択フラグがオンの場合には、選択状態にある特徴語を全て検索要求入力欄に追加する。シフトキーを押さない場合で、選択フラグがオフの場合には、指示された特徴語だけを検索要求入力欄に追加する。
なお、最後にモード変数MMを0にして、通常状態に戻す作業3441MR−P2−4を行なう。
図26A、Bは、検索支援インターフェイス322上のボタン等をクリックした時の処理の詳細である。正確には、ボタンなどの部品上でマウスが押され、同じ部品上でマウスが離された場合の作業の詳細であるが、ほとんどの場合は、クリック作業によって行なわれるので、記述を見やすくするため、特に必要がない限りクリックされた場合と表現することにする。クリックされた部品によって、作業内容が分岐する。以下、図の順序に従って説明する。
キーワード検索ボタンB01がクリックされた場合には、キーワード検索要求を情報提供者側計算機1に送り、検索結果と特徴語などの付随情報を受けとる。また、検索結果描画データと特徴語描画データを更新する必要があるため、検索支援ルーチン3441でのそれぞれの更新フラグFrとFcを1(オン)にする。
連想検索ボタンB02の場合も、キーワード検索の場合と同様であるが、この場合には、検索要求の内容(図9)において、検索手法の指定が「連想検索」となり、また、検索内容の指定は、単語列もしくはネットワーク上のアドレス(インターネットのURLなど)を指定することができる。ネットワーク上のアドレスが指定された場合には、情報提供者側では、まず、指定されたアドレスにある文書を取ってきて、そこに含まれる単語の列を構成し、それを連想検索の入力とするという作業を行なう。
連想検索を行なった場合の検索結果と特徴語情報は、キーワード検索の場合と同じ形式である。ただし、検索結果格納エリア34424a(図13a)の適合度スコアの欄には、キー文書と検索結果の文書との類似度(あるいは関連度)、もしくはそれを正規化したものが入ることになる。特徴語情報は、検索された文書群から作るので、キーワード検索の場合と同じである。なお、この場合にも、描画更新フラグFrとFcを共にオンにする。
テキスト入力ボタンB03の場合には、テキスト入力用の別ウィンドウとしてテキスト入力手段322T(図36参照)を開く。テキスト入力手段の入力部TE1からキーボード入力、あるいはカットアンドペースト作業などにより、興味のあるフレーズや文、パラグラフ、あるいは、更に長い章や節、全文などを入力して、それをキーとして連想検索を行なうためのものである。
拡大(左)ボタン(B11)は、検索結果中の一つ以上の文書が選択されている場合に、それらの文書群をつなぎ合わせたものをキーとして連想検索を行なう。Fr、Fc共にオンにする。
刈込みボタン(B12)は、検索結果中の一つ以上の文書が選択されている場合に、選択されている文書のみを検索結果とする。なお、そこからの特徴語の抽出を改めて行なう必要があるので、選択された文書の集合を情報提供者側へ送り、それらから特徴語抽出を行なった結果を受けとるという作業を行なう。(Fr=Fc=1)
選択解除(左)ボタン(B13)は、文書の選択状態をすべて解除する。すなわち、検索結果格納エリア34424aの選択フラグをすべて0にする。(Fr=1)
マークタイトルボタン(B31)は、選択された特徴語を含むような検索結果の文書を目立たせるもので、検索結果表示部の該当する文書の左端などに、チェックマークなどのマークを付ける機能である。なお、複数の特徴語が選択されている場合には、それらをより多種類含む文書をより目立たせるため、その種類数に比例した太さのマークを付けるのも有効である。なお、実際の作業としては、特徴語文書−対応表格納エリア34427のデータ(図16)を参照すれば、選択されている各特徴語がどの文書に含まれているかが分かるので、選択されている特徴語の各々について、それを含む検索結果の文書を調べ、検索結果格納エリア34424aのマーク強度の該当する欄の値を1ずつ増やしていけば良い(Fr=1)。
ソートボタン(B32)は、検索結果に付けられたマークの強さの順に検索結果の文書を並べ替えるためのものである。これによって、利用者は、より強いマークがついた文書からまとめて見ることができて便利である。実際には、一般的なソート機能を用いて、検索結果格納エリア34424aのマーク強度欄の数値の大きい順に、一時的文書番号を並び替えたものを検索結果表示順序格納エリア34424b(図13b)に格納する。なお、強度が同じ場合には、もとの順序を保存する(一時的文書番号の小さい順にする(Fr=1))。
検索結果描画データ作成ルーチン3443(図19A、B)は、この検索結果表示順序格納エリア34424bの順序で、該当する一時的文書番号の文書から順に表示するので、マーク強度の強い文書から表示されることになる。マーク強度が同じ場合には、オリジナルの順序を保存して表示される。
特殊な場合として、マークを全てクリアした状態でソートボタンをクリックすると、オリジナルの順序が回復できる。これは、マーク強度が一律に0なので、全てオリジナルの順序を保存するように並び替えられるからである。これは、マークづけとソートを行なって順序が入れ替わった後に、はじめの並びの状態にもどしたい場合に、便利な機能である。
クリア(左)ボタン(B33)は、検索結果の文書のマーク強度を全て0にする(Fr=1)。これによってマークをすべて消すことができる。
マーク特徴語ボタン(B41)は、選択されている文書に含まれる特徴語を目立たせるためのものである。すなわち、特徴語表示欄P2に表示される特徴語が選択されている文書のいずれかに含まれる場合には、強調した表示にする。例えば、赤などの目立つ色の枠線を付けたり、文字のフォントを変えたりする方法などがある。
実際の作業としては、文書−特徴語対応表格納エリア34428のデータ(図17)を参照して、どの文書がどの特徴語を含むかが分かるので、選択されている文書の各々について、それに含まれる特徴語を調べ、特徴語格納エリア34425(図14)のマーク強度の該当する欄の値を1ずつ増やしていけば良い(Fc=1)。
特徴語グラフ描画データ作成ルーチン3444の特徴語ノードの描画データ作成ルーチン34447(図21B(c))では、特徴語がマークされているかどうかを判定して、マークされている場合には、特徴語グラフ描画データ作成用パラメータ344212(図20)で設定されている強調色(CFM1)を枠線に用いるので、これにより、マークされた特徴語が強調表示されることになる。
選択ボタン(B42)は、マークされた特徴語を一括して選択状態にするという機能である。実際の作業は、特徴語格納エリア34425(図14)の各特徴語について、マーク強度が0の場合には択フラグを0として、それ以外の場合には選択フラグを1とする(Fc=1)。
クリア(右)ボタン(B43)は、特徴語に付けられたマークをクリアするためのものである。すなわち、特徴語格納エリア34425のマーク強度欄を全て0にする(Fc=1)。
選択解除(右)ボタン(B23)は、特徴語の選択状態をすべて解除する。すなわち、特徴語格納エリア34425の選択フラグ欄を全て0にする(Fc=1)。
拡大(右)ボタン(B21)は、選択されている特徴語からリンクを一つ辿って、到達できる特徴語を全て選択状態に加える機能である。特徴語格納エリア34425の各特徴語の内、選択状態にあるものの各々について、特徴語間リンク情報格納エリア34426(図15)を参照し、リンク先とリンク元の特徴語を知り、それらを全て選択状態にすることで行なわれる(Fc=1)。
終了ボタン(B04)は、本検索支援インターフェイスを終了するためのものである。
DB選択手段(M1)は、検索対象とするデータベースを選択するためのものであり、利用可能なDBの名称がメニュー形式で提示され、そこから検索対象を選ぶことができる。DB選択手段の選択肢が表示されている時に、その中のどれかをクリックした場合には、指示されたデータベースが検索対象として選択される。
テキスト入力手段322Tの連想検索ボタン(TB1)クリアボタン(TB2)、終了ボタン(TB3)については後に図36を用いて説明する。
以下では、本検索支援インターフェイス322を使って各種操作をした時に、画面表示がどのように変化するかについて説明する。なお、その時に、検索支援ルーチン3441でどのような作業が行なわれるかについては、図5、図19A、B、図21A、B、図23A、B〜図26A、Bの説明で詳しく述べているので、ここでは簡単に触れるにとどめる。
図27は、検索結果の文書の一つ一つを閲覧している時の表示画面の例である。検索作業(キーワード検索あるいは連想検索)を行なうと、検索支援インターフェイス322の検索結果表示部P1には、検索結果のタイトル一覧などが表示されている。利用者は、関心のあるもののタイトル部分をマウスなどでクリックすることにより、その内容を表示して読むことができる。
この時の検索支援ルーチン3441の作業は、以下の通りである。マウスを押した時点で、処理3441MP−P1−4(図23A(b))が行なわれ、検索支援ルーチン3441のモード変数MMが、表示文書指定中モード(=12)に設定され、マウスを離した時には、処理3441MR−P1−2(図25A(b))が行なわれ、文書閲覧手段322Rがまだ開かれていなければそれを開き、該当する文書の内容を情報提供者側検索支援プログラム143から受けとり、それが文書閲覧手段322Rに表示されるという作業が行なわれる。
なお、前記処理3441MR−P1−2では、検索支援ルーチンで使われる、表示中の文書の識別番号を示す変数MDに、文書閲覧手段322Rに表示されている文書の識別番号が代入されるので、検索結果描画データ作成ルーチン3443のタイトル描画データ作成ルーチン34437(図19A、B)では、表示中の文書に当たる文書のタイトルの背景色を周囲とは異なる色(CD=ライトブルー(図18))で表示して目立たせる。本図27では、タイトル部に下線を引いてそのことを示している。
別のタイトルをクリックすれば、同じ文書閲覧手段322Rに該当する文書の内容が新たに表示される。この作業を繰り返すことにより、利用者は検索結果の中から望みのものの内容を読むことができる。また、印刷ボタンRB1を押せば、印刷手段36(図1)から本文内容をプリントアウトすることができる。
図28は、特徴語の選択によりタイトルへのマークづけを行なう作業をしている時のインターフェイス画面の変化を示す図である。(a)は、検索を行なった後の状態(図6の状態)から興味のある特徴語として、<特徴語−a2>と<特徴語−a5>をシフトキーを押しながら左マウスで順番にクリックして、選択状態としたところである。選択された特徴語は、実際には、背景色を目立つものに変えたり、フォントを目立つものに変えたりして示されるが、本図では、そのことを特徴語の先頭に星印☆を付けて示している。
特徴語をシフトキーを押しながら左マウスでクリックすると、検索支援ルーチン3441では、作業3441MP−P2(図23B(c))が行なわれ、押された位置の特徴語の選択/非選択が反転する(他の特徴語の選択/非選択には影響しない)ので、ここでは、次々にクリックした特徴語を選択状態に変えることができる(なお、同じことをシフトキーを押さずに左マウスで順番にクリックした場合には、作業3441MP−P2−2の方が行なわれ、この場合には、2番目にクリックを行なうと、始めに選択状態にした特徴語が選択解除されてしまう。従って、複数の特徴語を一つ一つのクリック操作で選択状態にしたい場合には、シフトキーを押しながら行なう必要がある)。もちろん、シフトキーを押しながら行なった場合と、押さずに行なった場合というのは、単なる取り決めの問題なので、逆にしても良い。マウスの左右についても同様である。なお、複数の特徴語を一括して選択状態にする方法については、後で図29の説明で示す。
図28(b)は、(a)の状態からマークタイトルボタン(B31)を押した場合の検索結果表示部P1の変化を示したものである。マークタイトルボタンを押すと、処理3441MR−B31(図26A、B)が行なわれ、選択された特徴語を含むような検索結果を目立たせる。本実施例では、タイトルの左端に、チェックマークなどのマークを付けて強調している。なお、複数の特徴語が選択されている場合には、それらをより多種類含む文書をより目立たせるため、その種類数に比例した太さのマークを付けている。
特徴語−文書対応表格納エリア34427のデータ(図16)で現在選択されている<特徴語−a2>は、一時的な文書番号1、3、5、...に含まれ、<特徴語−a5>は、一時的な文書番号5、7、9、...に含まれていることが分かる。これから、特徴語格納エリア34425(図14)のマーク強度欄は、一時的な文書番号1番と3番については1となり、5番については2となる。
検索結果描画更新フラグFrがオンになるので、検索支援ルーチン3441(図5)では、検索結果描画データの更新が行なわれる。検索結果描画データ作成ルーチン3443のマーク描画データ作成ルーチン34434(図19B(b))では、マーク強度に応じた太さのマークを描画するデータを検索結果表示部描画データ34422P1(図7)に追加する。従って、検索支援インターフェイス画面の描画作業34414(図5)では、各文書のタイトルの横に、マーク強度に応じた太さのマークが表示されることになる。本図(b)は、その時の描画状態を示している。一時的文書番号1、3は、<特徴語−a2>のみしか含まない(マーク強度1)ので、比較的細いチェックマークが、また、一時的文書番号5の文書は、<特徴語−a2>と<特徴語−a5>の両方を含む(マーク強度2)ので、太いチェックマークが付いたわけである。
図28(c)は、(b)の状態から、更にソートボタン(B32)をクリックした時の検索結果表示部P1の状態を示したものである。ソートボタン(B32)は、検索結果に付けられたマークの強さの順に、検索結果の文書を並べ替える。これによって、利用者は、より強いマークがついた文書から順に見ることができて便利である。この例の場合では、<特徴語−a5>と<特徴語−a12>が、マーク強度2であって先頭に来ている。次に、<特徴語−a1><特徴語−a3>などが、マーク強度1で続く。なお、マーク強度が同じ場合には、オリジナルの順序が保存される。この時の検索支援ルーチン3441の動作については、図26A、Bのソートボタンの説明部分を参照。
図29は、特徴語のグラフ表示において特徴語を選択作業をしている時のインターフェイス画面の変化の例を示した図である。図28の説明でも触れたように、複数の特徴語を選択する場合の方法としては、シフトキーを押しながら左マウスで一つずつ指定していくという方法がある。しかし、比較的固まった位置にある複数の特徴語を一括して選択する方法として、本検索支援方法では、特徴語選択領域を利用する方法を提供している。図29(a)の特徴語表示部P2に示されている矩形P2R1が、その特徴語選択領域の一例である。特徴語選択領域は、特徴語の表示されていない地の部分でマウスを押して、いずれかの場所でマウスを離すことによって、指定できる。なお、マウスを押して動かす途中では、始点と現在の指示位置とを対角とする矩形が、マウスの動きにつれて表示される(図23B(c)、図24の説明部分参照)。本図は、この矩形P2R1の左上の地点で、マウスを押して、押したまま移動して矩形の右下の地点まで来ている時の状態である。この状態でマウスを離すと、この特徴語選択領域と重なりのある特徴語が全て選択され、本図(b)のような状態となる(図25B(c)の処理3441MR−P2−2参照)。すなわち、この場合、特徴語選択領域P2R1と重なりがあるのは、<特徴語−a3>と<特徴語−a5>なので、この二つが選択される(☆印で示している)。特徴語表示部の上部には、選択数表示部L24があるが、その部分は現在の選択数である2となる。ユーザーは、この矩形領域を見ながら、選択したい特徴語群をなるべくちょうどカバーするような位置でマウスを離せば良い。
なお、選択領域と重ならない特徴語は全て非選択となるので、仮に、(a)の状態で、例えば、<特徴語−a2>が選択状態であったとしても、(b)では、<特徴語−a2>は非選択状態となってしまう。選択したい特徴語が幾つかのグループに分かれている時には、シフトキーを押しながら、特徴語選択領域を設定する作業を繰り返すと良い。この場合には、作業3441MR−P2−21(図25B(c))により、選択されなかった部分には影響を与えないので、順次選択範囲を増やしていくことが可能である。
図30は、特徴語のグラフ表示において、特徴語を移動させている時のインターフェイス画面の変化の一例を示した図である。本図の例では、特に移動させる必要性がないかもしれないが、特徴語を多数表示すると次第に図が混んできて、重なりが生じたりして、見づらくなってしまう場合がある。そのような時に、選択されている特徴語を見やすい位置に移動させたいということが生じる。そのような場合には、選択されている特徴語のどれか一つを左マウスで(シフトキーを押さずに)押して、押したままマウスを移動させると、選択されている特徴語がマウスの動きにつれて一括して平行移動する(リンクもそれにつれて移動する)。これは、マウスを特徴語の上で押して、その直後にその特徴語が選択状態である場合には、特徴語移動モード(MM=21)となるためである。その後、マウスを押したまま移動中には、処理3441−MD2(図24)で特徴語描画更新フラグFcが常にオンになるので、常に特徴語グラフ描画データ作成ルーチン3444(図21A、B)が働き、マウスの移動についれその移動分だけ選択されている特徴語の位置が変化する。マウスを離した時には、その時点での位置で新たな表示位置が確定する。
なお、図30(a)と同じ状況で、シフトキーを押しながら左マウスで選択されている特徴語を押した場合には、その押された特徴語がその場で非選択状態になってしまうので、マウスを動かしても移動は起こらない。また、例えば、<特徴語−a2>のように、選択されていない単語をシフトキーを押しながら左マウスで押すと、他の選択されている語はそのまま選択状態になったまま、<特徴語−a2>も選択状態に加わるので、マウスを押したまま移動すると、<特徴語−a2、3、5>の3つがまとめて移動されることになる。また、<特徴語−a2>を今度はシフトキーを押さずに左マウスで押した場合には、<特徴語−a2>のみが選択状態となり、他の語が全て非選択状態となるので、マウスを押したまま移動すると、<特徴語−a2>のみが移動することになる。
図31は、表示されている特徴語を検索語として利用する作業をしている時のインターフェイス画面の変化の一例を示した図である。特徴語は、検索結果の特徴をよく反映した単語が多く現れるので、それらをキーワードとして利用したくなる場合も多い。そのような場合のために、本検索支援方法では、以下のような方法を提供している。図31(a)では、特徴語表示部P2に特徴語グラフが表示され、現在、<特徴語−a3>と<特徴語−a5>が選択されている状態である。ここで、(シフトキーを押さずに)このどちらかを右マウスでクリックすると、選択状態にある特徴語(この場合<特徴語−a3>と<特徴語−a5>)が一括して検索要求入力窓(E1)に追加される。これは、図25B(c)の処理3441MR−P2−33が行なわれるためである。
続いて、シフトキーを押して、同じく<特徴語−a3>を右マウスでクリックすると、今度は、選択状態にある特徴語のいずれかと一致する単語が全て検索要求窓から削除され、従って、この場合には、もとの状態にもどることになる。(ただし、最初のキーワードの中に<特徴語−a3>あるいは<特徴語−a5>と同じものがあれば、それらも同時に削除されるので、その場合には、もとにもどるとは言えない)。これは、図25B(c)の処理3441MR−P2−31が行なわれるためである。
右マウスで、今度は、選択状態にない特徴語、例えば、<特徴語−a2>をクリックすると、この場合には、そのクリックされた単語のみが検索語として追加される(図25B(c)の処理3441MR−P2−34)。シフトを押しながら同じ操作を行なうと、<特徴語−a2>と同じ単語だけが検索語から削除される(図25B(c)の処理3441MR−P2−32)。
図32は、特徴語のグラフ表示における選択を拡大させる機能を利用している時のインターフェイス画面の変化の一例を示した図である。(a)の状態では、<特徴語−a4>のみが選択されている。この状態で、拡大(右)ボタン(B21)を押すと、この選択されている<特徴語−a4>から高々1パスで辿れる特徴語が全て選択状態となる。この場合には、<特徴語−a2>のみがこの条件に叶うので、<特徴語−a2>が選択状態に変わり、(b)のような状態となる。続けて拡大を行なうと、(c)となり、さらに行なうと、(d)の状態となる。
図33は、検索された文書の選択により特徴語へのマークづけを行なう作業を行なっている時のインターフェイス画面の変化の一例を示した図である。(a)は、検索を行なった後の状態(図6の状態)から、興味のある文書として<タイトル−a2>と<タイトル−a4>の選択窓を順次マウスでクリックして、選択状態としたところである。選択された文書の選択窓は、目立つ色に変化する。本図では、そのことを選択窓を黒く塗りつぶして示している。なお、選択された文書数を示す欄L14は、現在選択されている文書数の2が表示される。
選択窓をマウスでクリックすると、離した時点で、作業3441MR−P1−1(図25B(b))が行なわれ、クリックした位置の文書の選択/非選択が反転する。なお、位置の連続した複数の文書を一括して選択状態にするには、どちらか一方の端の文書の選択窓でマウスを押して、押したまま、もう一方の端まで移動させそこで離せば良い(ただし、開始位置の文書は、もともとは選択されていないとする)。この場合には、処理3441MR−P1−1(図25A(b))により、両端の間の文書が全て選択状態に変化する。
図33(b)は、(a)の状態からマーク特徴語ボタン(B41)を押した場合の特徴語表示部P2の状態を示したものである。マーク特徴語ボタンを押すと、処理3441MR−B41(図26A、B)が行なわれ、選択された文書に含まれるような特徴語を目立たせる。本実施例では、特徴語の枠線を目立つ色にして強調している。
文書−特徴語対応表格納エリア34428のデータ(図17)で、現在選択されている文書<タイトル−a2>は、一時的な特徴語番号1、3、6、...を含み、<タイトル−a4>は、一時的な特徴語番号3、8、12、...を含むことが分かる。これから検索結果格納エリア34424a(図13a)のマーク強度欄は、特徴語1が1、特徴語3が2となる。
また、マーク特徴語ボタンが押されると、特徴語描画更新フラグFcがオンになるので、検索支援ルーチン3441(図5)では、特徴語描画データの更新が行なわれる。特徴語グラフ描画データ作成ルーチンの特徴語ノード描画データ作成ルーチン34447(図21B(c))では、マークされている特徴語のフレームを強調色にする描画データを特徴語表示部描画データ34422P2(図8)に追加する。従って、検索支援インターフェイス画面の描画作業34414(図5)では、マークされた特徴語の枠線が強調色で描画される。本図(b)は、その時の描画状態を示しており、一時的特徴語番号1、3の枠線が強調されている。
図33(c)は、(b)の状態から、さらに選択ボタン(B42)をクリックした時の特徴語表示部P2の状態を示したものである。選択ボタン(B42)は、マークされた特徴語を一括して選択状態にするため、マークされていた<特徴語−a1>と<特徴語−a3>に選択状態を示す星印が付いている。
図34は、選択された文書をキーとして連想検索を行なった時のインターフェイス画面の例である。前図33(a)の状態、すなわち、<タイトル−a2>と<タイトル−a4>という文書が選択されている状態から、拡大(左)ボタン(B11)をクリックすると、選択されている文書をキーとする連想検索を行なう要求が、情報提供者側へ送られ、連想検索の結果と特徴語情報が返信され、それらが検索表示部P1と特徴語表示部P2に表示される。連想検索の場合には、検索結果が検索要求に適合している度合を示すスコアが、キー文書との類似度で測られるので、スコア表示欄には、その類似度を正規化した数値が表示されている。ここでは、トップの類似度が100に正規化されている。また、検索結果は、スコアの高い順にソートされている。特徴語のグラフ表示については、キーワード検索の場合と同様である。図27〜33で説明して来たような操作は、本図についても、全て同様に行なうことができる。
図35は、選択された文書のみを残し、その他を削除する刈込みを行なった時のインターフェイス画面の例である。図33(a)の状態、すなわち、<タイトル−a2>と<タイトル−a4>という文書が選択されている状態から、刈込みボタン(B12)をクリックすると、選択されている文書だけを検索結果とし、特徴語情報もそれらだけから抽出される。本図は、その状態を示しており、検索結果表示部は、<タイトル−a2>と<タイトル−a4>のみが残り、特徴語表示部P2には、これら2つの文書から特徴語を抽出した結果が表示され、従って、図33(a)の特徴語グラフとは違うものとなっている。
図36は、テキスト入力による連想検索を行なうためにテキスト入力手段322Tを開いた時の表示画面の例である。テキスト入力手段322Tは、何らかのテキストの断片を入力して、それと類似した文書を検索するためのものである。テキスト入力部TE1、連想検索ボタンTB1、クリアボタンTB2、終了ボタンTB3から構成される。テキスト入力部TE1には、キーボードなどから直接文字列を入力したり、また、表示手段上でのカット&ペースト操作により、他の文書の一部や全部を入力する。テキスト入力が終ったら、連想検索ボタンTB1をクリックすると、入力されたテキストをキーとして連想検索を行なうという要求が、情報提供者側に送られ、検索結果と特徴語情報が返信される。以下は、他の検索を行なったり、拡大(左)ボタンを押した場合と同様である。
次に、具体的に検索を実施したときのインターフェイスの画面を参照しながら、本発明により使い勝手の良い検索が出来ることを説明する。これから説明する例は、利用者が「文献検索インターフェイス」に関する特許を調査する例である。利用者は、文献検索インターフェイスについてある程度の理解を持っているが、文献検索インターフェイスのどの特徴に着目して検索するかの明確な方針を持っていない状態であるものとする。
図37は、この実施例に採用された実際のインターフェイスの画面であり、使用されるデータベースとして、“特許G06F’96(18、660件)”が選択されており、検索の入力が何も無い状態を示す。この画面は、図3、図6等に示すインターフェイスの画面と対比して明らかなように、最上段の左側3つのボタンを除けば、表記が英語となっているだけで実質同一である。対応を列挙すると、次のようである。すなわち、B01:キーワード検索ボタン−Keywords、B02:連想検索ボタン− Association 、B03:テキスト入力ボタン−TextInput、B04:終了ボタン−Quit、B11:拡大(左)ボタン−Expand、B12:刈込みボタン−Prune、B13:選択解除(左)ボタン−UnSelect、B21:拡大(右)ボタン−Propagate、B23:選択解除(右)ボタン−UnSelect、B31:マークタイトルボタン−Mark∨Title、B32:ソートボタン−Gather、B33:クリア(左)ボタン−Clear、B41:マーク特徴語ボタン−Mark□Topics、B42:選択ボタン−Select、B43:クリア(右)ボタン−Clearとなる。
図38は、キーワードの入力として「文献検索インターフェイス」をそのまま入力した状態のインターフェイスの画面を示し、キーワードの入力窓に入力文字列がそのまま現れた様子が分かる。図39は、キーワード検索実行用ボタンKeywordsが押された結果、入力文字列の「文献検索インターフェイス」が、文献、検索およびインターフェイスの三つのキーワードに分解され検索が実行されて、総数1280件の特許が検索結果として得られ、関連度スコアの大きい(3)ものからリストされ、且つ、指定された総数20の範囲で重要度の高い順に、キーワードがグラフ表示された状況を示す。ここで、キーワードの選択とグラフ表示の仕方は、先に引用した特願平8−176174に開示されている方法に依ったので、説明は省略する。図40は、利用者が図39のキーワードのグラフを見ながら、キーワード、存在、連語およびシソーラスのそれぞれのキーワードに着目して、これらを全て含むタイトルのものを選択する目的で、特徴語のノードをマウスでクリックして選択する。選択された特徴語が白抜き文字で表記された状態を示す。図41は、その状態で、マークタイトルボタンMark∨Titleを押してマーク付けを行った結果を示す。この図では、あまり明解ではないが、マークは、指定されたキーワードをより多く持つ文献のタイトルにより太く現れる。図42は、これにソートボタンGatherを押してソートをかけた結果を示す。この図では、より太いマークを持つものが上位に表れる。図43は、ここで選択解除ボタンClear(B23対応)を押して特徴語ノードの選択解除を行った状態を示す。図44は、利用者がより太いマークを持つ4件の文献に着目してこれらの選択窓を順次マウスでクリックして選択状態とした図を示す。図45は、この状態で、使用者がマーク特徴語ボタンMark□Topicsを押し、これらの文献に現れる特徴語を囲う枠が太く表示された例を示す。図46は、ここで、使用者が選択ボタンSelectを押すと、トピックスとしてマークされた特徴語が選択されたことが白抜き文字で表示される。この状態でシフトキーを押しながら、選択された特徴語をマウスの左ボタンでクリックすると、選択を解除して非選択とすることが出来る。図47は、図46で選択状態とした特徴語のすべてをキーワードとして登録するために、選択状態の特徴語の一つをマウスの右ボタンでクリックした状態を示す。この状態では新たなキーワードがキーワードの窓に表示される。図48はこの新しいキーワードに対応した検索結果を示す図である。図49は、この検索結果のうち、上位にある12件のみをマウスのクリックで選択した状態を示す。図50は、刈込みボタンPruneを押して、選択されている12件の文書のみを検索対象とした結果を示す。図51は、この状態で連想検索を行うため、2件の文献のタイトルをマウスのクリックで選択した状態を示す。図52は、この状態で検索キーAssociationを押して連想検索を実行した結果を示す。図53、図54および図55は、この連想検索の結果として得られた特徴語のグラフ表示に着目して、特徴語−ペンストロークをキーとして、特徴語の選択を拡大させる機能を利用している時のインターフェイス画面の変化の一例を示した図である。図53では特徴語−ペンストロークのみが選択されている状態を示す。図54は、この状態で拡大(右)ボタンPropagateを押すと、この選択されている特徴語−ペンストロークから高々1パスで辿れる特徴語−キーワードが選択状態となった状態を示す。図55は、続けて拡大(右)ボタンPropagateを押して拡大を行なった結果、特徴語−キーワードから高々1パスで辿れる特徴語−文書、全文および同義語が選択状態となった状態を示す。
この例から分かるように、入力文字列「文献検索インターフェイス」から多様な検索に発展できる。
以上、具体的な実施形態を例にとって説明したように、本発明の実施例によれば以下のような使い勝手の良い検索が出来る。
(1)検索結果の1次情報であるタイトルのリストと並んで、検索された文書群に特徴的に現れる語群の話題的な関連性を示す情報が表示されるので、利用者は検索結果の具体的なタイトル情報と共に全体像を把握しながら検索作業を行なうことができる。また、表示された特徴語をマウスによるクリック操作などで検索語として利用でき、表示された特徴語の幾つかを簡単なマウス操作などで選択し、それらを含むタイトルを強調し、強調されたタイトルをリストのトップに集中させることができ、また、逆に、幾つかのタイトルを選択して、それらが含む特徴語を強調することが高速にできるので、検索条件の改良を試みたり、観点を変えた検索を試みたりすることが容易にできる。
(2)検索支援インターフェイスには、キーワードによる検索を行なうボタンと共に、文書の類似度に基づく連想検索を行なうボタンがあり、検索要求入力欄から文書の所在を示す情報が入力されて、連想検索ボタンが押された場合には、指定された文書をキーとする連想検索を行なわれる。また、検索結果のタイトル表示部を見ながら関心のある文書を選択することができ、かつ、選択された文書をキーとして連想検索を行なうボタンがあるので、利用者は興味深い文書として見つけたり、既に所持している文書、あるいは検索作業の途中で興味深い文書を見つけた時に、簡単な操作で関連の深い文書を検索できる。
(3)テキスト入力用のボタンを押すと、テキスト入力用の窓とそこに入力されたテキストをキーとして連想検索を行なうボタンを有するテキスト入力手段が画面上に表示させるので、利用者は興味のある文書の中の一部、例えば、句、文、段落などをキーボードから入力したり、カット&ペースト作業で入力することにより、関連する文書を容易に検索することができる。
文書検索支援サービスのシステム構成の一例を示す図。 利用者側計算機のワークエリアにロードされた利用者側検索支援プログラムの一例の詳細を示した図。 表示部に表示された検索支援インターフェイスの構成例を示す図。 検索インターフェイスを表示手段に描画するためのデータ格納エリアの詳細の一例を示す図。 利用者側の検索支援ルーチンにおける処理の流れを示すPAD図。 検索支援インターフェイスにおける検索結果と特徴語の表示例を示す図。 検索結果表示部を描画するためのデータの構成例を示す図。 特徴語表示部を描画するためのデータの構成例を示す図。 情報提供者側検索支援プログラムが受け付ける検索要求の構成例を示す図。 情報提供者側検索支援プログラムの構成例を示す図。 検索対象の文書データベースの構成例を示す図。 情報提供者側検索支援ルーチンにおける処理の流れを示すPAD図。 利用者側に送信された検索結果に関するデータの例を示す図。 特徴語に関するデータの例を示す図。 特徴語グラフを描画する際の特徴語間リンクに関するデータの例を示す図。 特徴語−文書対応表データの例を示す図。 文書−特徴語対応表データの例を示す図。 検索結果描画データ作成用パラメータの設定例を示す図。 検索結果描画データ作成ルーチンの処理の流れの一部を示すPAD図。 検索結果描画データ作成ルーチンの処理の流れの残りの部分を示すPAD図。 特徴語グラフ描画データ作成用パラメータの設定例を示す図。 特徴語グラフ描画データ作成ルーチンの処理の流れの一部を示すPAD図。 特徴語グラフ描画データ作成ルーチンの処理の流れの残りの部分を示すPAD図。 キーボード入力に対して利用者側検索支援ルーチンが行なう処理を示すPAD図。 マウスが押された時に利用者側検索支援ルーチンが行なう処理の一部を示すPAD図。 マウスが押された時に利用者側検索支援ルーチンが行なう処理の残りの部分を示すPAD図。 マウスを押したまま移動している時に利用者側検索支援ルーチンが行なう処理を示すPAD図。 マウスが離された時に利用者側検索支援ルーチンが行なう処理の一部を示すPAD図。 マウスが離された時に利用者側検索支援ルーチンが行なう処理の残りの部分を示すPAD図。 検索支援インターフェイスのボタンがクリックされた時に利用者側検索支援ルーチンが行なう処理の一部を示すPAD図。 検索支援インターフェイスのボタンがクリックされた時に利用者側検索支援ルーチンが行なう処理の残りの部分を示すPAD図。 検索結果の文書の一つ一つを閲覧している時の表示画面の例を示す図。 特徴語の選択によりタイトルへのマークづけを行なう作業をしている時のインターフェイス画面の変化の例を示す図。 特徴語のグラフ表示において特徴語を選択作業をしている時のインターフェイス画面の変化の例を示す図。 特徴語のグラフ表示において特徴語を移動させている時のインターフェイス画面の変化の例を示す図。 表示されている特徴語を検索語として利用する作業をしている時のインターフェイス画面の変化の例を示す図。 特徴語のグラフ表示における選択を拡大させる機能を利用している時のインターフェイス画面の変化の例を示す図。 検索された文書の選択により特徴語へのマークづけを行なう作業を行なっている時のインターフェイス画面の変化の例を示す図。 連想検索を行なった時のインターフェイス画面の例を示す図。 検索結果の刈込みを行なった時のインターフェイス画面の例を示す図。 テキスト入力による連想検索を行なうためにテキスト入力手段を開いた時の表示画面の例を示す図。 実際の検索例に採用された実際のインターフェイスの画面を示す図。 キーワードの入力として「文献検索インターフェイス」をそのまま入力した状態のインターフェイスの画面を示す図。 キーワード検索実行用ボタンが押された結果、入力文字列がキーワードに分解され検索が実行された結果を示す図。 実行された検索結果から特徴語を選択する状態を示す図。 選択された特徴語に対応する文献のタイトルにマーク付けを行った結果を示す図。 マーク付けの行なわれた文献リストにソートをかけた結果を示す図。 ソートをかけられた文献リストとノードの選択解除が行なわれた特徴語の表示状態を示す図。 利用者がより太いマークを持つ文献を選択状態とした状態を示す図。 選択状態とされた文献に現れる特徴語を囲う枠が太く表示された例を示す図。 マークされた特徴語が選択されたことを表示する図。 マークされた特徴語を選択キーとする検索の実行を指示した状態を示す図。 新しいキーワードに対応した検索結果を示す図。 検索結果のうち、上位にある文献のみをマウスのクリックで選択した状態を示す図。 刈込みボタンを押して、選択されている文書のみを検索対象としたキーワード検索結果を示す図。 選択されている文書の内特定の文書との連想検索を行うため、2件の文献のタイトルをマウスのクリックで選択した状態を示す図。 検索キーAssociationを押して連想検索を実行した結果を示す図。 連想検索の結果として得られた特徴語のグラフ表示に着目して、特徴語−ペンストロークをキーとして、特徴語の選択を拡大させる機能を利用している時のインターフェイス画面の変化の一例の最初の画面として特徴語−ペンストロークのみが選択されている状態を示した図。 インターフェイス画面の変化の一例の次の画面として、拡大(右)ボタンPropagateが押され、この選択されている特徴語−ペンストロークから高々1パスで辿れる特徴語−キーワードが選択状態となった状態を示す図。 インターフェイス画面の変化の一例のさらに次の画面として、続けて拡大(右)ボタンPropagateが押されて、特徴語−キーワードから高々1パスで辿れる特徴語−文書、全文および同義語が選択状態となった状態を示す図。
符号の説明
1:情報提供者側情報保持・処理手段、11:入力手段、12:表示手段、13:CPU、14:ワークエリア、141:オペレーティングシステム、142:通信プログラム、143:情報提供者側検索支援プログラム、15:情報保持手段、15F1:利用者側検索支援起動用ハイパーテキスト、15X1:利用者側検索支援駆動プログラム、15D:検索用データ、2:通信ネットワーク、3:利用者側情報保持・処理手段、31:入力手段、311:キーボード、312:マウス、313:ペン入力手段、32:表示手段、321:ハイパーテキスト閲覧インターフェイス、322:検索支援インターフェイス、B01:キーワード検索ボタン、B02:連想検索ボタン、B03:テキスト入力ボタン、B04:終了ボタン、B11:拡大(左)ボタン、B12:刈込みボタン、B13:選択解除(左)ボタン、B21:拡大(右)ボタン、B23:選択解除(右)ボタン、B31:マークタイトルボタン、B32:ソートボタン、B33:クリア(左)ボタン、B41:マーク特徴語ボタン、B42:選択ボタン、B43:クリア(右)ボタン、E1:検索要求入力窓、M1:文献データベース選択手段、P1:検索結果表示部、P2:特徴語表示部、RB1:印刷ボタン、TE1:テキスト入力部、TB1:連想検索ボタン、TB2:クリアボタン、TB3:終了ボタン、341:オペレーティングシステム、342:通信プログラム、343:ハイパーテキスト閲覧プログラム、344:利用者側検索支援プログラム、3441:利用者側検索支援ルーチン、35:情報保持手段、36:印刷手段。

Claims (4)

  1. 表示画面に検索要求入力部と、検索結果表示部と、特徴語表示部とを含むインタフェース画面を生成するための手段と、
    上記検索要求入力部に検索条件となる文字列または単語列を入力するための検索条件入力手段と、
    上記検索要求入力部に入力された検索条件に基づいて文書データベースから文書を検索する文書検索手段と、
    上記文書検索手段によって検索された文書群から、該文書群に特徴的に現れる複数の単語を上記検索結果に付随する特徴語群として抽出した後、特徴語間の関連性を示すリンク情報を生成する特徴語抽出手段と、
    上記文書検索手段で検索された各文書の内容の一部を上記検索結果表示部に文書リストとして表示する文書リスト表示手段と、
    上記特徴語抽出手段で生成されたリンク情報に従って、上記特徴語群に含まれる複数の特徴語間をリンク結合し、上記特徴語群を上記特徴語表示部に特徴語グラフとして表示する特徴語グラフ表示手段と、
    上記特徴語グラフとして表示された特徴語群の中から選択された少なくとも1つの特徴語を選択状態にするための特徴語選択手段と、
    上記選択された特徴語を基点として、上記特徴語グラフ上で該特徴語とリンク結合関係にある所定範囲内の特徴語群を一括して選択状態に切り替える選択範囲拡大手段と、
    上記特徴語表示部で選択状態にある複数の特徴語を上記検索要求入力部に新たな検索条件として設定する検索条件切替え手段とを備え、
    上記文書検索手段が、上記新たな検索条件に基づいて文書検索を再実行し、文書検索結果に応じて上記検索結果表示部と上記特徴語表示部の表示内容が変化するようにしたことを特徴とする文書検索システム。
  2. 前記特徴語グラフとして表示された特徴語群のうち、前記検索結果表示部に表示された文書リスト中で選択された少なくとも1つの文書と対応する特徴語を選択状態にする第2の特徴語選択手段を有し、
    前記選択範囲拡大手段が、上記第2の特徴語選択手段によって選択された特徴語を基点として、前記リンク結合関係にある所定範囲内の特徴語群を一括して選択状態に切り替えることを特徴とする請求項1記載の文書検索システム。
  3. 前記選択範囲拡大手段が、前記特徴語グラフ上で選択状態にある特徴語を基点としてリンクを辿り、選択状態となる特徴語の範囲を段階的に拡大することを特徴とする請求項1または請求項2に記載の文書検索システム。
  4. 通信ネットワークを介して接続された第1、第2の情報処理装置からなり、
    上記第1の情報処理装置が、前記文書データベースと、前記文書検索手段と、前記特徴語抽出手段とを備え、
    上記第2の情報処理装置が、前記インタフェース画面を生成するための手段と、前記検索条件入力手段と、前記文書リスト表示手段と、前記特徴語グラフ表示手段と、前記特徴語選択手段と、前記選択範囲拡大手段と、前記検索条件切替え手段とを備え、
    上記第1の情報処理装置が、上記第2の情報処理装置から受信した検索条件に基づいて文書検索を実行し、前記文書リスト表示手段および特徴語グラフ表示手段が必要とする情報を上記第2の情報処理装置に送信すること特徴とする請求項1〜請求項3の何れかに記載の文書検索システム。
JP2008205261A 2008-08-08 2008-08-08 文書検索システム Expired - Lifetime JP4224131B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008205261A JP4224131B2 (ja) 2008-08-08 2008-08-08 文書検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008205261A JP4224131B2 (ja) 2008-08-08 2008-08-08 文書検索システム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004243236A Division JP2004348768A (ja) 2004-08-24 2004-08-24 文書検索方法

Publications (2)

Publication Number Publication Date
JP2008293534A JP2008293534A (ja) 2008-12-04
JP4224131B2 true JP4224131B2 (ja) 2009-02-12

Family

ID=40168125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008205261A Expired - Lifetime JP4224131B2 (ja) 2008-08-08 2008-08-08 文書検索システム

Country Status (1)

Country Link
JP (1) JP4224131B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5565033B2 (ja) * 2010-03-29 2014-08-06 ソニー株式会社 情報処理装置、コンテンツ表示方法及びコンピュータプログラム

Also Published As

Publication number Publication date
JP2008293534A (ja) 2008-12-04

Similar Documents

Publication Publication Date Title
JP3643470B2 (ja) 文書検索システムおよび文書検索支援方法
US6654738B2 (en) Computer program embodied on a computer-readable medium for a document retrieval service that retrieves documents with a retrieval service agent computer
CA2266457C (en) System and method for search and retrieval of digital information
JP3478725B2 (ja) 文書情報管理システム
JP4746136B2 (ja) ランク・グラフ
KR100214911B1 (ko) 지시장치를 이용한 대량 데이타의 탐색 방법
US8131779B2 (en) System and method for interactive multi-dimensional visual representation of information content and properties
JP4907715B2 (ja) テキストドキュメント及びイメージドキュメントを同期化、ディスプレイ、及び操作するための方法及び装置
US7890533B2 (en) Method and system for information extraction and modeling
US8510330B2 (en) Configurable search graphical user interface and engine
US20130305149A1 (en) Document reader and system for extraction of structural and semantic information from documents
WO2009154153A1 (ja) 文書検索システム
US20050177555A1 (en) System and method for providing information on a set of search returned documents
US6874123B1 (en) Three-dimensional model to facilitate user comprehension and management of information
JP3601675B2 (ja) 情報検索装置、情報検索方法、及び記録媒体
US20210173850A1 (en) Categorical search using visual cues and heuristics
JPH07192020A (ja) 文書情報検索装置
JPH08320882A (ja) 文書処理装置および文書検索装置
JP4224131B2 (ja) 文書検索システム
JPH01191270A (ja) 図形編集装置
JP2004348768A (ja) 文書検索方法
JP2000250908A (ja) 電子書籍の作成支援装置
JP6857212B2 (ja) 文書検索システム、文書検索装置及び方法
WO2009021563A1 (en) A data processing method, computer program product and data processing system
JP3710463B2 (ja) 翻訳支援辞書装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080902

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080902

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20080902

TRDD Decision of grant or rejection written
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20081016

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081028

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081120

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111128

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111128

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121128

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121128

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131128

Year of fee payment: 5

EXPY Cancellation because of completion of term