JP2004206492A - ドキュメント表示方法およびそれを用いたリンク先選択機能付ゲートウェイ装置 - Google Patents
ドキュメント表示方法およびそれを用いたリンク先選択機能付ゲートウェイ装置 Download PDFInfo
- Publication number
- JP2004206492A JP2004206492A JP2002375841A JP2002375841A JP2004206492A JP 2004206492 A JP2004206492 A JP 2004206492A JP 2002375841 A JP2002375841 A JP 2002375841A JP 2002375841 A JP2002375841 A JP 2002375841A JP 2004206492 A JP2004206492 A JP 2004206492A
- Authority
- JP
- Japan
- Prior art keywords
- document
- link destination
- user
- terminal
- destination candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】Webブラウザに表示されたリンクタグを辿って情報を検索する際、リンク先に必ずしも求める情報が記載されているとは限らなかった。またリンク先は固定されているため更なる情報を検索するには検索エンジン等の別の手段を用いなければならなかった。
【解決手段】Webブラウザが経由している代理サーバにリンク先候補一覧作成手段とリンク先候補表示手段を備えることにより、利用者が選択したリンク先に対して、利用者のアクセス頻度や所属部署に対する関連度等で優先付けした候補一覧を表示させる。
【選択図】 図1
【解決手段】Webブラウザが経由している代理サーバにリンク先候補一覧作成手段とリンク先候補表示手段を備えることにより、利用者が選択したリンク先に対して、利用者のアクセス頻度や所属部署に対する関連度等で優先付けした候補一覧を表示させる。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、代理サーバ機能を有するゲートウェイ装置を介して、Webブラウザ上に表示されたHTMLテキストのリンクタグに含まれるURLアドレスから、ネットワーク上のコンテンツを参照または検索する技術に関する。
【0002】
【従来の技術】
Webブラウザからネットワーク上のコンテンツを検索する際に、ブラウザの利用者の年齢、性別、居住地域、職業、嗜好等の情報を検索結果に反映させ、利用者の希望する検索結果を表示する技術として特開2002−32401号に開示されているような技術がある。しかしこのような技術においては、検索の精度を上げるには、コンテンツの提供者が、当該コンテンツに関して予め年齢や性別等の複数の評価項目に対して適合度という情報を設定し、かつ、利用者側も当該コンテンツに設定された評価項目に対して、利用者が該当する値を設定しておく必要がり、これらの評価項目に対する利用者の評価値が正しく設定されていない場合、利用者の求める結果が得られない場合がある。
【0003】
【特許文献1】
特開2002−32401号
【0004】
【発明が解決しようとする課題】
Webブラウザを使用して利用者が情報を検索する際、Webブラウザ上に表示されたリンクタグのテキストを選択(クリック)することにより、リンクタグが示すURLアドレス上のページをブラウザ上に表示させることができるが、リンク先のURLアドレスが示すWebページに利用者が求めている情報が含まれているとは限らないという課題があった。またリンク先URLアドレスは固定されおり、利用者が求めている情報が存在するリンク先に変更できないという課題があった。
【0005】
本発明の目的は、情報検索にて利用者が求めていると思われる情報を優先順位付けして表示させることにより情報検索の精度を向上することが可能となる。
【0006】
【課題を解決するための手段】
本発明ではこれらの課題を改善するために、代理サーバ機能を有するゲートウェイ装置を介してWebブラウザの動作する端末からネットワーク上のコンテンツをブラウジングする装置において、前記ブラウザ上に表示されたページからリンクを張られた別のページへジャンプする際に、複数の候補からリンク先を選択できるようにリンク先候補作成手段とリンク先候補表示手段とドキュメントDB更新手段を備えた。
【0007】
また,端末上のWebブラウザからゲートウェイ装置に備えられた代理サーバ手段を介してネットワーク上のコンテンツを検索する際に,Webブラウザに表示されたドキュメント内に記述されたリンク先を辿りながら情報を検索するドキュメント表示方法において,複数のリンク先候補を端末に表示するリンク先候補作成手段と,利用者が前記手段によって表示された候補の中から任意のリンク先を選択できるリンク先候補表示手段を備えた。また,Webブラウザが稼動する端末とネットワーク上で接続され,かつ代理サーバ手段を有する上記ゲートウェイ装置において,代理サーバのアクセス履歴記録機能とキャッシュ機能を利用して,利用者が端末上のブラウザで選択したリンク先にHTMLテキストのアンカータグで関連付けられたキーワードを抽出し,該キーワードを含むドキュメントを検索し,該キーワードの出現頻度等の順で該ドキュメントの一覧を並べ替えることを特徴とするリンク先候補作成手段を備えた。
【0008】
また,端末上のWebブラウザからゲートウェイ装置に備えられた代理サーバ手段を介してネットワーク上のコンテンツを検索する際に,Webブラウザに表示されたドキュメント内に記述されたリンク先を辿りながら情報を検索するドキュメント表示方法において,複数のリンク先候補を端末に表示するリンク先候補作成手段1と,利用者が前記手段によって表示された候補の中から任意のリンク先を選択できるリンク先候補表示手段を備えたドキュメント表示方法において,端末上で稼動するWebブラウザの代理サーバの指定にゲートウェイ装置を指定する。
【0009】
また,Webブラウザが稼動する端末とネットワーク上で接続され,かつ代理サーバ手段を有するゲートウェイ装置において,代理サーバ手段が作成および更新するのアクセス履歴とキャッシュデータを利用して,利用者が端末上のブラウザで選択したリンク先にHTMLテキストのアンカータグで関連付けられたキーワードを抽出し,該キーワードを含むドキュメントを検索し,該キーワードの出現頻度等の順で該ドキュメントの一覧を並べ替える手段を備えたリンク先候補作成手段において,ドキュメント本体とは別に該ドキュメントの保管場所を示すURLと,該ドキュメントに含まれる単語インデックス,該ドキュメントへのアクセス履歴,該ドキュメントにアクセスした利用者の情報等を保持したドキュメントデータベースと,一定時間間隔で最新のドキュメントの状態を参照して該ドキュメントデータベースを更新するドキュメントDB更新手段とを備えた。
【0010】
また,前記リンク先候補作成手段において,リンク先候補の優先順位付け条件や重み付けを利用者が設定できる優先順位設定手段を備えた。また前記リンク先候補作成手段において,リンク先候補となる検索対象ドキュメントに,テキストフィルタの存在するバイナリ形式ファイルを含めることのできる手段を備えた。また,前記リンク先候補作成手段において,リンク先候補一覧の優先付けをする際に,利用者の所属部署や担当業務と相関の高い順に並べ替える手段を備えた。
【0011】
【発明の実施の形態】
本発明の詳細を以下の実施例により説明する。端末7は図1に示すようにリンク先候補表示用ゲートウェイ装置6を介してネットワーク17に接続されている。また同一ネットワーク上にはドキュメント12,ドキュメントデータベース13(以下DBと略す),利用者DB11,アクセス履歴14,キャッシュデータ15等を保管するファイルサーバ16が接続されている。リンク先候補表示用ゲートウェイ装置6は図1に示すように,代理サーバ手段5,アクセス履歴分析手段4,リンク先候補作成手段1,リンク先候補表示手段2,ドキュメントDB更新手段3からなる。端末7上で実行されるWebブラウザ8が使用するHTTPプロトコルの代理サーバには,当該リンク先候補表示用ゲートウェイ装置6のホスト名(またはIPアドレス)と特定のTCPポート番号を設定する。代理サーバ手段5は,端末7上のWebブラウザ8から,前記特定のポート番号を指定された場合のみリンク先候補作成手段1およびリンク先候補表示手段2を実行し,それ以外のポート番号が指定された場合は通常の代理サーバとしての動作をする。端末7からWebブラウザ8を起動しWebページを参照すると,代理サーバ手段5により端末7で参照したHTMLテキスト,イメージファイル等がキャッシュデータ15に保存されるとともに,検索端末のIPアドレスやアクセスした日時,アクセス先のURL,キャッシュファイル名等の情報がアクセス履歴14に記録される。以下、本発明の全体的な処理を図3の流れ図に従って説明する。
【0012】
端末7にはWebブラウザ8上にHTML形式の参照元のドキュメントが表示されている。リンクタグはテキストに対してリンクが張られている場合,HTML言語によって「<A HREF=“URL”>表示テキスト</A>」のように表現され,ブラウザ上に表示される“表示テキスト”の部分を選択(クリック)することで,HREFに指定された“URL”で示されるリンク先のWebページをブラウザ上に表示することができる。ここでの“表示テキスト”が図1中のタグ名称9に相当する。
【0013】
リンクの対象として「<IMG SRC=“URL” [ALT=“文字列”|TITLE=“文字列”]>」のようなイメージタグを用いてイメージファイル等もブラウザ8上でリンクの選択対象として指定可能であるがその場合,検索対象文字列はイメージタグに含まれるALTまたはTITLEに指定された文字列とする。以下ではテキストにリンクされた場合について説明するが,基本的な動作はイメージ等にリンクされた場合も同様である。利用者が,Webブラウザ8上に表示されたHTMLテキストのリンクタグ9に表示された文字列をクリックすると,Webブラウザ8はHTMLテキストの当該リンクタグに指定されたリンク先のURLを,リンク先候補表示用ゲートウェイ装置6を介して,当該WWWサーバに要求する。リンク先の情報をWebブラウザ8から要求されたリンク先候補表示用のゲートウェイ装置6は,リンク先候補作成手段1により当該リンクタグに含まれる“表示文字列”を検索語として,当該文字列を含むドキュメント12をドキュメントDB11から検索し,検索対象文字列を含む頻度順や利用者の業務に関連のある順またはアクセス頻度等で優先順位付けし,リンク先候補一覧10を作成する。リンク先候補作成手段1は,作成したリンク先候補一覧10をリンク先候補一覧表示手段2に渡して動作を終了する。
【0014】
リンク先候補一覧表示手段2は,リンク先候補作成手段1から受け取った候補一覧を端末7のWebブラウザ8とは別に図2のように表示し,利用者が表示された候補の中から1つのリンク先を選択するのを待つ。ここで利用者がリンク先候補一覧10の最後に表示された優先度設定を起動するためのリンク先25を選択すると,ゲートウェイ装置6に備えられた後述する優先度設定手段26が起動され,リンク先候補一覧10を作成するための条件や重み付けの変更ができる。利用者が端末7に表示されたリンク先候補の一覧から1つを選択すると,リンク先候補表示手段2は,リンク先候補一覧10の表示を消去した後、選択されたリンク先URLまたはファイルをリンク先候補作成手段1を介さずに代理サーバ手段5へ要求し,要求の結果を端末7のWebブラウザ8に転送する。
【0015】
またリンク先候補表示手段2は,利用者が選択したリンク先と,処理が終了したこと代理サーバ手段5に通知する。代理サーバ手段5は,リンク先候補表示手段2が終了したことを検知すると,利用者が選択したリンク先URL情報でアクセス履歴14とドキュメントDB13ならびにキャッシュデータ15を更新する。リンク先候補表示手段2を介して代理サーバ手段5から要求結果を受け取ったWebブラウザ8は,結果がHTMLテキストまたはWebブラウザに組み込まれたプラグインに対応しているファイルであればブラウザの別ウィンドに表示し,そうでなければファイル名の拡張子から当該ファイルを作成したアプリケーションまたは当該ファイルを表示可能なビューワ起動し,端末8に表示する。以上が本発明の大まかな処理内容である。以下では、リンク先候補作成手段1とリンク先候補表示手段2の動作を図4の流れ図に従ってさらに詳しく説明する。
【0016】
リンク先候補作成手段1は,代理サーバ手段5が端末7上のWebブラウザ8からの要求を受け取ると代理サーバ手段5により起動される。代理サーバ手段5は,リンク先候補作成手段1を起動する際に,要求があった端末7のIPアドレスと,端末7から要求のあったURLアドレスをリンク先候補作成手段1に渡す。リンク先候補作成手段1は、Webブラウザ8からの要求を受け取ると図示されてないLDAP等の認証サーバに対してユーザ認証依頼を発行する。LDAPサーバは、リンク先候補作成手段1から端末7のIPアドレスを受取り、当該端末7上にユーザIDとパスワードの入力を促す画面を表示させる。端末7の利用者が入力したユーザIDとパスワードが間違っているか入力をキャンセルした場合、LDAPサーバはリンク先候補作成手段1にエラーを通知し、エラーを受信したリンク先候補作成手段1は、処理を中断し端末7のWebブラウザ8上で選択されたリンク先のURLアドレスを代理サーバ手段5に要求し、結果をWebブラウザ8に返して処理を終了する。入力されたユーザIDとパスワードが正しければ、リンク先候補作成手段1はWebブラウザを使用している利用者のIDをワークエリアに記録し,以下のリンク先候補の作成処理を続行する。
リンク先候補作成手段1が,リンク先候補一覧10を作成する方法について説明する。代理サーバ手段5には,利用者がWebブラウザ8でネットワーク上のコンテンツを参照する際,そのアクセス履歴14を記録する機能と,転送されたHTMLテキストやイメージファイル等をキャッシュデータ15に保存し,Webブラウザ8からコンテンツの送信要求を受けた時にキャッシュデータ15内に当該コンテンツが存在すれば,外部のネットワーク18にアクセスすることなしに当該コンテンツを要求のあったWebブラウザ8に転送する機能があることを前提とする。図6に示すようにアクセス記録にはWebブラウザ8からコンテンツの転送要求があるごとに,コンテンツの要求があった端末7のIPアドレス41,日時42,転送したコンテンツのキャッシュファイル名43,要求先のURLアドレス44等が記録される。またキャッシュデータ15には,端末7に転送されたコンテンツが前記キャッシュファイル名43で保管されている。よってキャッシュファイル名43はリンク先のURLアドレスにより一意に決められる。リンク先候補作成手段1は代理サーバ手段5の機能を利用し,端末7のIPアドレス41から端末7を使用している利用者が最後に参照したHTMLテキストを,アクセス履歴14とキャッシュデータ15から取得する。具体的には,アクセス履歴14から利用者の端末7のIPアドレス41より最後に要求のあったHTMLテキストのキャッシュデータ15内のファイル名43を取得し,取得したファイル名43のHTMLテキストをキャッシュデータ15から読込む。さらにリンク先候補作成手段1は,取得した該HTMLテキストを対象に端末7から要求のあったURLアドレスを含むリンクのタグ名称9を検索し,当該リンクタグ内に含まれる“表示文字列”に指定されているテキストを取得する。イメージがリンク先に指定されている場合は,ALTまたはTITILEに指定されている文字列を取得する。前記のように取得したテキストを検索対象テキストとする。前記リンクタグに“表示文字列”が存在しなかった場合(ALTまたはTITILEに指定された文字列が存在しなかった場合)、または検索対象テキストが取得できなかった場合、リンク先候補作成手段は,端末7上のWebブラウザ8から要求のあったURLアドレスを代理サーバ手段5に対して要求を送信し,応答結果を端末7上のWebブラウザ8に転送して処理を終了する。
【0017】
リンク先候補作成手段1は,前記の手順で検索対象テキストを取得できた場合,ドキュメントDB13に格納されたドキュメントごとの単語インデックス62に対して,検索対象テキスト内の文字列が含まれているかどうか検索し,当該文字列が含まれているドキュメントの名称60とドキュメントの所在を示すパスまたはURLアドレス61の一覧を作成する。ドキュメントDB13は図9に示すように,検索対象となるドキュメントの名称60,存在場所(URLやネットワークパスで示される場合もある)61,単語インデックス62,アクセス履歴63から構成される。ドキュメントDB13中の単語インデックスは図10に示すように,当該ドキュメントを単語に分解した場合の単語64と出現頻度65の一覧から構成される。またドキュメントDB13中のアクセス履歴は図11に示すように,利用者がリンク先候補表示手段2にて当該ドキュメントを選択した場合に,当該利用者のID66,最終アクセス日時67,アクセス頻度68を利用者IDごとに記録する。ドキュメントDB13中の前記単語インデックス62とアクセス履歴63は,1つのドキュメントを単位として作成される。ただしリンク先候補一覧10の作成過程において,端末7上のWebブラウザ8から要求のあったURLが含まれる場合は一覧に含めない。
【0018】
リンク先候補一覧作成の最終過程において,当該候補一覧は以下に記述する優先度設定手段26によって並び替えられる。並び替えをするための重み付けは,図12に示される優先度設定により行われる。図12に示される優先度設定は、省略が可能でありその場合は検索対象テキストの頻度順(デフォルト値)となる。図12に示す優先度設定において、各条件の重みは0〜1までの任意の値を設定できるが,重みの合計値は1となるように設定するものとする。重み付けの条件としてアクセス履歴順やアクセス頻度順に対しては,ドキュメントDB13に格納された情報から優先順位を決定することはがきるが,後述の所属部署等で重み付けを行う場合は一覧に含まれる各ドキュメントに対する重みを算出する処理(プログラム名)を記載する。
【0019】
図12に示す重み設定は,図7および図15に示すように,利用者IDごとの内容が利用者DB11に保管され,利用者が各条件に対する任意の重みを自由に設定し保存できる。各ドキュメントに対する重み付けを行う処理は,最小値が0,最大値が1となるように正規化されていなければならない。ただし重み0の条件に対しては、各ドキュメントに対する重み値を算出する処理を行わないものとする。各条件の重みが算出された後,各ドキュメントに対する重みの合計値を算出し,合計値の大きい順に並べ替えを行うことで優先度を設定する。前記した優先度設定26は,ゲートウェイ装置6に備えられたCGI等によるプログラムであり,端末7にリンク先候補一覧10が表示された際,リンク先候補一覧10の最後に表示される優先度設定25のリンクを選択(クリック)することで起動され,利用者が設定を変更した場合は,その結果を利用者DB11に保管する処理を実行する。
【0020】
利用者DB11に格納されるデータは,図15に示すように,検索対象文字列の出現頻度(条件1)の重み70,アクセス履歴順(条件2)の重み71,アクセス頻度順(条件3)の重み72,条件4の条件名称73,条件4の重み74,各検索対象ドキュメントの条件4に対する重みを算出するプログラム名称75を記載する。検索対照ドキュメントの重みを算出するプログラムが他に存在すれば,新たに条件5以降も設定可能である。以下ではドキュメントに含まれる検索対象文字列の出現頻度のみで替えを行うものとする。
【0021】
優先度設定手段26は特定の条件で重み付けを行いリンク先候補一覧を並び替える。通常は該当するドキュメントDB13のレコードに記録されている,単語インデックスの出現頻度65が高い順に並び替えられる。単語インデックスの出現頻度65が同一の候補は、ドキュメントDB13に記録された利用者のアクセ頻度68順やアクセス時間67順に並べ替える。ただし優先度設定手段26に何も設定がなされていない場合は、前記のように検索対象の単語の出現頻度順に並び替えられるが、優先度設定手段26に利用者の所属部署に関連の強い順を指定すると、指定した重みでリンク先候補一覧10が並び替えられる。利用者の所属部署に関連の強い順への並べ替えは、ドキュメントDB更新手段3の作用を利用することによって行われるが後述する。ドキュメントDB13に利用者ごとのアクセス頻度68やアクセス時間67を記録するのは、後述するリンク先表示手段2の作用である。以上のように優先度設定手段26により、検索対象テキストを含むドキュメントの一覧は図12に示す優先度設定に従って並び替えられる。標準設定では、検索対象テキストを含む頻度順に並び替えられる。次にリンク先候補表示手段2の動作について説明する。
リンク先候補作成手段1により作成されたリンク先候補一覧10は、リンク先候補表示手段2に渡される。
【0022】
なおドキュメントDB13は図9、図10、図11に示すように,指定されたネットワークを含むパスまたはURLアドレス上に保管された1ドキュメントごとに,ドキュメントの名称60,ドキュメントの保管場所を示すネットワークを含むパス名またはURLアドレス61,ドキュメントに含まれる単語インデックス62と各単語が出現する頻度のデータ65および利用者ID66と当該利用者が参照した頻度68、時間67で1レコード(不定長)が構成される。
【0023】
リンク先候補表示手段2は、リンク先候補作成手段1から受取ったドキュメントの名称60とURLアドレス61の一覧から候補を表示および選択するためのHTMLテキストを作成し、当該HTMLテキストを端末7上のWebブラウザ8上の現在参照しているWebページとは別の表示枠に表示させる。リンク先候補手段2は、図13に示すようなHTMLテキストを作成して端末7に送信し、端末7上のブラウザ8とは別の表示枠にリンク先候補一覧10を表示させる。具体的には、リンクタグのHREF項目にドキュメントの保管先であるURLアドレス61を、リンクタグの表示テキスト部分にドキュメントの名称60を記述する。候補一覧10が表示される順番は、リンク先候補作成手段1の優先度設定26によってつけられた優先順に表示されるものとする。端末7の利用者が、表示された候補一覧10から1つを選択(クリック)すると、選択された候補のタイトルとリンク先URLアドレスがリンク先候補表示手段2に渡される。リンク先候補表示手段2は、Webブラウザ8から利用者が選択したドキュメントの名称とULRアドレスを受取ると、リンク先候補作成手段1を介さず代理サーバ手段5に対して、要求された当該コンテンツをネットワーク経由で取得し、端末7に転送する。またリンク先候補表示手段2は、利用者のIDと利用者が選択したリンク先ドキュメントの情報を用いてドキュメントDB13を更新する。ドキュメントDB13には、ドキュメントの名称60、保管場所61、単語インデックス62の他に、利用者ごとのアクセス履歴63が保持されており、利用者が候補一覧10の中から1つのドキュメントを選択するごとに、リンク先候補表示手段2により当該アクセス頻度68が増加されとともに最終アクセス時間67が更新される。端末7には、リンク先候補表示手段2で利用者が選択したドキュメントが表示される。
【0024】
ドキュメントDB更新手段3は、ゲートウェイ装置6から一定時間間隔で起動され、指定されたファイルサーバ16のネットワークパスを含むディレクトリ下に、保存されたドキュメントに含まれるテキストを単語単位に分解して単語インデックス62を作成し、当該ドキュメントの名称60と保管場所を示すURL61ならびに単語インデックス62でドキュメントDB13の情報を更新する。ドキュメントDB更新手段3が作成の対象とするドキュメントは、当該ドキュメントに含まれるテキストが検索可能なものが対象であるが、特定アプリケーションで作成されたバイナリ形式のドキュメントであっても、当該ドキュメントに対応したテキスト抽出フィルタが存在する場合、ドキュメントDB更新手段13の作成対象ドキュメントに設定できる。ドキュメントDB更新手段13が対象とするドキュメントは、図14に示される更新対象ドキュメント設定手段29で設定する。具体的には第1カラムにドキュメントの拡張子27、第2カラムに当該拡張子のドキュメントに対するテキスト抽出フィルタのプログラム名28を設定する。対象ファイルがテキストやHTMLファイル等でフィルタ処理が必要ない場合は、第2カラムを省略する。
【0025】
ドキュメントDB更新手段13は前記の更新対象ドキュメント設定29に従い、ドキュメントがHTMLやプレーンテキスト以外のバイナリファイルだった場合は、ファイル名の拡張子に対応したテキスト抽出用のフィルタを起動し当該ファイルに含まれているテキストを作業ファイルへ出力する。さらに作業ファイルに出力されたテキストに対して単語分解とインデックス作成を実行し、その結果をドキュメントDB13に反映させる。前記のような更新対象ドキュメント設定手段29を備えることにより、HTMLやテキスト以外のファイルでも、ドキュメントDB13の作成対象ドキュメントとすることで、リンク先のドキュメントとして選択可能な候補に含めることができる。ただしファイルの拡張子に対応するテキスト抽出フィルタは、更新対象ドキュメント設定手段29によって予め設定ファイルに記録しておくものとし、登録されていない拡張子のドキュメントについては、ドキュメントDB更新手段3の対象ドキュメントとはせず、テキストの抽出ならびに単語インデックスの作成は行わない。
【0026】
ゲートウェイ装置6にリンク先候補作成手段1とリンク先候補表示手段2ならびにドキュメントDB13とその更新手段3を備えることで利用者が検索しいたい単語を多く含み、参照頻度が高くかつ検索した日時順に候補となるドキュメントの一覧を表示でき、利用者はその候補の中から最も望ましいドキュメントを選択し参照できる。
【0027】
リンク先候補作成手段1に利用者の所属や業務等の属性情報を利用することで、作成する候補一覧の精度をさらに上げ、利用者の業務内容に関係のあるドキュメントを選択候補に含める事ができる。前提として、利用者DB11に利用者が属する部署名が記録されているものとする。リンク先候補作成手段1は、作成した候補一覧10に対して優先順位付けを行う際に、利用者が所属する部署に対しての重み付けを行う。所属部署の優先順位を上げるには,図12に示される所属部署の項目の重み値を他の項目に比べて大きな値を設定する。以下の重み付けの処理は,図12に示されるProgram1の処理に相当し、具体的には以下の手順に従う。ドキュメントDB13には、リンク先候補選択手段1によって利用者が選択したドキュメントの名称60と利用者のID66、アクセス頻度68、最終アクセス日時67が記録されている。ドキュメントDB13に記録されたすべてのレコードに対して利用者ID66を利用者DB11の情報から利用者の所属する所属コード56に変換する。
【0028】
次に所属コード順にすべてのドキュメント一覧を並べ替える。その際、複数部署から参照のあったドキュメントに対しては、部署ごとの参照頻度の合計値を算出する。部署ごとにアクセス頻度を分割し、当該部署の総アクセス頻度合計を算出し、この値で各ドキュメントに対するアクセス頻度を除し、各ドキュメントに対する当該部署に所属する利用者のアクセス頻度率を算出する。当該部署に所属する利用者からのアクセス頻度が高いドキュメントほど、そのドキュメントは当該部署の業務に関係が深いと類推できるので、上記の手順により利用者の所属部署に関連のある順にドキュメントを優先順位付けできる。前記のようにして算出された各ドキュメントに対する利用者が所属する部署からのアクセス頻度は、図12で示されるProgram1によって処理された優先度としてリンク先候補作成手段1に渡される。リンク先候補作成手段1は、図12で示される優先度設定に従って候補一覧の表示順序を決定するが、それは式(1)に従う。
i番目のドキュメントの優先度=
総和(j番目の優先度)×(j番目の重み)
例えば検索対象文字列の出現頻度と所属部署の両方を考慮した優先順位で表示させたければそれぞれの重みを0.5とすることで、検索対象文字列の頻度と所属部署に関連のある文書の両方を等分に考慮した順番でリンク先候補一覧10が表示される。前記リンク先候補作成手段1に組み込むことで利用者の所属部署に関連の深いドキュメントを候補の一覧に含めることができる。以上の重み付けの手順を、リンク先候補作成手段1における候補一覧作成の最終段階に組み込むことにより、利用者が所属する部署に関連の深いドキュメントをリンク先候補に含めることができる。同様にして利用者DBとドキュメントDBに利用者の担当業務や業種の情報を付加することにより、利用者の担当業務や業種で重み付けを行い表示されるリンク先候補一覧10を並べ替えることができる。
【0029】
本発明を製造業に適用した実施例を図5に示す。前提としてリンク先候補一覧には図面のデータファイルが含まれ,当該図面ファイルに含まれるテキストを抽出するフィルタと,当該図面ファイルを端末上に表示するビューワは既存であるとする。参照元ドキュメント8は,製品名や当該製品を構成する部品名称をリンクタグの表示テキストとして含んだ設計仕様書等である。通常製品名や部品名等を含んだ図面を含むドキュメントは多岐に渡るが,本発明の前記実施例により,利用者の所属部署,最終アクセス時刻,アクセス頻度およびこれらの重みの合計値に応じた優先付けでリンク先の候補が表示されるので,最後に更新した部品図面等の検索が容易に行える。
【0030】
【発明の効果】
本発明により,ドキュメントの検索において利用者が求めていると思われる情報を優先順位付けして表示させることでよりドキュメントの検索の精度を向上することが可能となる。
【図面の簡単な説明】
【図1】本発明の構成
【図2】候補一覧の表示
【図3】全体処理フロー
【図4】リンク先候補作成手段とリンク先候補表示手段の処理フロー
【図5】本発明の一実施例
【図6】アクセス履歴ファイルのデータ構造
【図7】利用者DBのデータ構造
【図8】部署名と所属コードおよび業務名称と業務コード対応表
【図9】ドキュメントDBのデータ構造
【図10】単語インデックスのデータ構造
【図11】アクセス履歴のデータ構造
【図12】候補一覧の優先度設定内容
【図13】候補一覧を表示するHTMLテキスト
【図14】テキスト抽出フィルタの設定内容
【図15】優先度設定のデータ構造
【符号の説明】
1…リンク先候補作成手段,2…リンク先候補表示手段,3…ドキュメントDB更新手段,4…アクセス履歴分析手段,5…代理サーバ手段,6…リンク先候補表示用ゲートウェイ装置,7…端末,8…Webブラウザ,9…タグ名称,10…リンク先候補一覧,11…利用者DB,12…ドキュメント,13…ドキュメントDB,14…アクセス履歴,15…キャッシュデータ,16…ファイルサーバ装置,21…参照元のリンク先,22…リンク先URL候補1,23…リンク先URL候補2,24…リンク先URL候補3,25…優先度設定手段を起動するリンクタグ,26…優先度設定手段,27…拡張子,28…フィルタプログラム名,29…更新対象ドキュメントの設定,30…部品名称,31…CAD図面,41…要求元IPアドレス,42…日時,43…キャッシュファイル名,44…要求先URL,51…利用者ID,52…利用者の氏名,53…利用者の所属コード,54…利用者の担当業務コード,55…部署名,56…所属コード,57…業務名称,58…業務コード,59…利用者ごとの優先度設定情報,60…ドキュメント名称,61…ドキュメントの保管先URL,62…ドキュメントの単語インデックス,63…ドキュメントのアクセス履歴,64…単語,65…単語の出現頻度,66…利用者ID,67…利用者の最終アクセス日時,68…利用者のアクセス頻度,70…条件1の重み,71…条件2の重み,72…条件3の重み,73…条件4の名称,74…条件3の重み,75…条件4の重み決定方法,
【発明の属する技術分野】
本発明は、代理サーバ機能を有するゲートウェイ装置を介して、Webブラウザ上に表示されたHTMLテキストのリンクタグに含まれるURLアドレスから、ネットワーク上のコンテンツを参照または検索する技術に関する。
【0002】
【従来の技術】
Webブラウザからネットワーク上のコンテンツを検索する際に、ブラウザの利用者の年齢、性別、居住地域、職業、嗜好等の情報を検索結果に反映させ、利用者の希望する検索結果を表示する技術として特開2002−32401号に開示されているような技術がある。しかしこのような技術においては、検索の精度を上げるには、コンテンツの提供者が、当該コンテンツに関して予め年齢や性別等の複数の評価項目に対して適合度という情報を設定し、かつ、利用者側も当該コンテンツに設定された評価項目に対して、利用者が該当する値を設定しておく必要がり、これらの評価項目に対する利用者の評価値が正しく設定されていない場合、利用者の求める結果が得られない場合がある。
【0003】
【特許文献1】
特開2002−32401号
【0004】
【発明が解決しようとする課題】
Webブラウザを使用して利用者が情報を検索する際、Webブラウザ上に表示されたリンクタグのテキストを選択(クリック)することにより、リンクタグが示すURLアドレス上のページをブラウザ上に表示させることができるが、リンク先のURLアドレスが示すWebページに利用者が求めている情報が含まれているとは限らないという課題があった。またリンク先URLアドレスは固定されおり、利用者が求めている情報が存在するリンク先に変更できないという課題があった。
【0005】
本発明の目的は、情報検索にて利用者が求めていると思われる情報を優先順位付けして表示させることにより情報検索の精度を向上することが可能となる。
【0006】
【課題を解決するための手段】
本発明ではこれらの課題を改善するために、代理サーバ機能を有するゲートウェイ装置を介してWebブラウザの動作する端末からネットワーク上のコンテンツをブラウジングする装置において、前記ブラウザ上に表示されたページからリンクを張られた別のページへジャンプする際に、複数の候補からリンク先を選択できるようにリンク先候補作成手段とリンク先候補表示手段とドキュメントDB更新手段を備えた。
【0007】
また,端末上のWebブラウザからゲートウェイ装置に備えられた代理サーバ手段を介してネットワーク上のコンテンツを検索する際に,Webブラウザに表示されたドキュメント内に記述されたリンク先を辿りながら情報を検索するドキュメント表示方法において,複数のリンク先候補を端末に表示するリンク先候補作成手段と,利用者が前記手段によって表示された候補の中から任意のリンク先を選択できるリンク先候補表示手段を備えた。また,Webブラウザが稼動する端末とネットワーク上で接続され,かつ代理サーバ手段を有する上記ゲートウェイ装置において,代理サーバのアクセス履歴記録機能とキャッシュ機能を利用して,利用者が端末上のブラウザで選択したリンク先にHTMLテキストのアンカータグで関連付けられたキーワードを抽出し,該キーワードを含むドキュメントを検索し,該キーワードの出現頻度等の順で該ドキュメントの一覧を並べ替えることを特徴とするリンク先候補作成手段を備えた。
【0008】
また,端末上のWebブラウザからゲートウェイ装置に備えられた代理サーバ手段を介してネットワーク上のコンテンツを検索する際に,Webブラウザに表示されたドキュメント内に記述されたリンク先を辿りながら情報を検索するドキュメント表示方法において,複数のリンク先候補を端末に表示するリンク先候補作成手段1と,利用者が前記手段によって表示された候補の中から任意のリンク先を選択できるリンク先候補表示手段を備えたドキュメント表示方法において,端末上で稼動するWebブラウザの代理サーバの指定にゲートウェイ装置を指定する。
【0009】
また,Webブラウザが稼動する端末とネットワーク上で接続され,かつ代理サーバ手段を有するゲートウェイ装置において,代理サーバ手段が作成および更新するのアクセス履歴とキャッシュデータを利用して,利用者が端末上のブラウザで選択したリンク先にHTMLテキストのアンカータグで関連付けられたキーワードを抽出し,該キーワードを含むドキュメントを検索し,該キーワードの出現頻度等の順で該ドキュメントの一覧を並べ替える手段を備えたリンク先候補作成手段において,ドキュメント本体とは別に該ドキュメントの保管場所を示すURLと,該ドキュメントに含まれる単語インデックス,該ドキュメントへのアクセス履歴,該ドキュメントにアクセスした利用者の情報等を保持したドキュメントデータベースと,一定時間間隔で最新のドキュメントの状態を参照して該ドキュメントデータベースを更新するドキュメントDB更新手段とを備えた。
【0010】
また,前記リンク先候補作成手段において,リンク先候補の優先順位付け条件や重み付けを利用者が設定できる優先順位設定手段を備えた。また前記リンク先候補作成手段において,リンク先候補となる検索対象ドキュメントに,テキストフィルタの存在するバイナリ形式ファイルを含めることのできる手段を備えた。また,前記リンク先候補作成手段において,リンク先候補一覧の優先付けをする際に,利用者の所属部署や担当業務と相関の高い順に並べ替える手段を備えた。
【0011】
【発明の実施の形態】
本発明の詳細を以下の実施例により説明する。端末7は図1に示すようにリンク先候補表示用ゲートウェイ装置6を介してネットワーク17に接続されている。また同一ネットワーク上にはドキュメント12,ドキュメントデータベース13(以下DBと略す),利用者DB11,アクセス履歴14,キャッシュデータ15等を保管するファイルサーバ16が接続されている。リンク先候補表示用ゲートウェイ装置6は図1に示すように,代理サーバ手段5,アクセス履歴分析手段4,リンク先候補作成手段1,リンク先候補表示手段2,ドキュメントDB更新手段3からなる。端末7上で実行されるWebブラウザ8が使用するHTTPプロトコルの代理サーバには,当該リンク先候補表示用ゲートウェイ装置6のホスト名(またはIPアドレス)と特定のTCPポート番号を設定する。代理サーバ手段5は,端末7上のWebブラウザ8から,前記特定のポート番号を指定された場合のみリンク先候補作成手段1およびリンク先候補表示手段2を実行し,それ以外のポート番号が指定された場合は通常の代理サーバとしての動作をする。端末7からWebブラウザ8を起動しWebページを参照すると,代理サーバ手段5により端末7で参照したHTMLテキスト,イメージファイル等がキャッシュデータ15に保存されるとともに,検索端末のIPアドレスやアクセスした日時,アクセス先のURL,キャッシュファイル名等の情報がアクセス履歴14に記録される。以下、本発明の全体的な処理を図3の流れ図に従って説明する。
【0012】
端末7にはWebブラウザ8上にHTML形式の参照元のドキュメントが表示されている。リンクタグはテキストに対してリンクが張られている場合,HTML言語によって「<A HREF=“URL”>表示テキスト</A>」のように表現され,ブラウザ上に表示される“表示テキスト”の部分を選択(クリック)することで,HREFに指定された“URL”で示されるリンク先のWebページをブラウザ上に表示することができる。ここでの“表示テキスト”が図1中のタグ名称9に相当する。
【0013】
リンクの対象として「<IMG SRC=“URL” [ALT=“文字列”|TITLE=“文字列”]>」のようなイメージタグを用いてイメージファイル等もブラウザ8上でリンクの選択対象として指定可能であるがその場合,検索対象文字列はイメージタグに含まれるALTまたはTITLEに指定された文字列とする。以下ではテキストにリンクされた場合について説明するが,基本的な動作はイメージ等にリンクされた場合も同様である。利用者が,Webブラウザ8上に表示されたHTMLテキストのリンクタグ9に表示された文字列をクリックすると,Webブラウザ8はHTMLテキストの当該リンクタグに指定されたリンク先のURLを,リンク先候補表示用ゲートウェイ装置6を介して,当該WWWサーバに要求する。リンク先の情報をWebブラウザ8から要求されたリンク先候補表示用のゲートウェイ装置6は,リンク先候補作成手段1により当該リンクタグに含まれる“表示文字列”を検索語として,当該文字列を含むドキュメント12をドキュメントDB11から検索し,検索対象文字列を含む頻度順や利用者の業務に関連のある順またはアクセス頻度等で優先順位付けし,リンク先候補一覧10を作成する。リンク先候補作成手段1は,作成したリンク先候補一覧10をリンク先候補一覧表示手段2に渡して動作を終了する。
【0014】
リンク先候補一覧表示手段2は,リンク先候補作成手段1から受け取った候補一覧を端末7のWebブラウザ8とは別に図2のように表示し,利用者が表示された候補の中から1つのリンク先を選択するのを待つ。ここで利用者がリンク先候補一覧10の最後に表示された優先度設定を起動するためのリンク先25を選択すると,ゲートウェイ装置6に備えられた後述する優先度設定手段26が起動され,リンク先候補一覧10を作成するための条件や重み付けの変更ができる。利用者が端末7に表示されたリンク先候補の一覧から1つを選択すると,リンク先候補表示手段2は,リンク先候補一覧10の表示を消去した後、選択されたリンク先URLまたはファイルをリンク先候補作成手段1を介さずに代理サーバ手段5へ要求し,要求の結果を端末7のWebブラウザ8に転送する。
【0015】
またリンク先候補表示手段2は,利用者が選択したリンク先と,処理が終了したこと代理サーバ手段5に通知する。代理サーバ手段5は,リンク先候補表示手段2が終了したことを検知すると,利用者が選択したリンク先URL情報でアクセス履歴14とドキュメントDB13ならびにキャッシュデータ15を更新する。リンク先候補表示手段2を介して代理サーバ手段5から要求結果を受け取ったWebブラウザ8は,結果がHTMLテキストまたはWebブラウザに組み込まれたプラグインに対応しているファイルであればブラウザの別ウィンドに表示し,そうでなければファイル名の拡張子から当該ファイルを作成したアプリケーションまたは当該ファイルを表示可能なビューワ起動し,端末8に表示する。以上が本発明の大まかな処理内容である。以下では、リンク先候補作成手段1とリンク先候補表示手段2の動作を図4の流れ図に従ってさらに詳しく説明する。
【0016】
リンク先候補作成手段1は,代理サーバ手段5が端末7上のWebブラウザ8からの要求を受け取ると代理サーバ手段5により起動される。代理サーバ手段5は,リンク先候補作成手段1を起動する際に,要求があった端末7のIPアドレスと,端末7から要求のあったURLアドレスをリンク先候補作成手段1に渡す。リンク先候補作成手段1は、Webブラウザ8からの要求を受け取ると図示されてないLDAP等の認証サーバに対してユーザ認証依頼を発行する。LDAPサーバは、リンク先候補作成手段1から端末7のIPアドレスを受取り、当該端末7上にユーザIDとパスワードの入力を促す画面を表示させる。端末7の利用者が入力したユーザIDとパスワードが間違っているか入力をキャンセルした場合、LDAPサーバはリンク先候補作成手段1にエラーを通知し、エラーを受信したリンク先候補作成手段1は、処理を中断し端末7のWebブラウザ8上で選択されたリンク先のURLアドレスを代理サーバ手段5に要求し、結果をWebブラウザ8に返して処理を終了する。入力されたユーザIDとパスワードが正しければ、リンク先候補作成手段1はWebブラウザを使用している利用者のIDをワークエリアに記録し,以下のリンク先候補の作成処理を続行する。
リンク先候補作成手段1が,リンク先候補一覧10を作成する方法について説明する。代理サーバ手段5には,利用者がWebブラウザ8でネットワーク上のコンテンツを参照する際,そのアクセス履歴14を記録する機能と,転送されたHTMLテキストやイメージファイル等をキャッシュデータ15に保存し,Webブラウザ8からコンテンツの送信要求を受けた時にキャッシュデータ15内に当該コンテンツが存在すれば,外部のネットワーク18にアクセスすることなしに当該コンテンツを要求のあったWebブラウザ8に転送する機能があることを前提とする。図6に示すようにアクセス記録にはWebブラウザ8からコンテンツの転送要求があるごとに,コンテンツの要求があった端末7のIPアドレス41,日時42,転送したコンテンツのキャッシュファイル名43,要求先のURLアドレス44等が記録される。またキャッシュデータ15には,端末7に転送されたコンテンツが前記キャッシュファイル名43で保管されている。よってキャッシュファイル名43はリンク先のURLアドレスにより一意に決められる。リンク先候補作成手段1は代理サーバ手段5の機能を利用し,端末7のIPアドレス41から端末7を使用している利用者が最後に参照したHTMLテキストを,アクセス履歴14とキャッシュデータ15から取得する。具体的には,アクセス履歴14から利用者の端末7のIPアドレス41より最後に要求のあったHTMLテキストのキャッシュデータ15内のファイル名43を取得し,取得したファイル名43のHTMLテキストをキャッシュデータ15から読込む。さらにリンク先候補作成手段1は,取得した該HTMLテキストを対象に端末7から要求のあったURLアドレスを含むリンクのタグ名称9を検索し,当該リンクタグ内に含まれる“表示文字列”に指定されているテキストを取得する。イメージがリンク先に指定されている場合は,ALTまたはTITILEに指定されている文字列を取得する。前記のように取得したテキストを検索対象テキストとする。前記リンクタグに“表示文字列”が存在しなかった場合(ALTまたはTITILEに指定された文字列が存在しなかった場合)、または検索対象テキストが取得できなかった場合、リンク先候補作成手段は,端末7上のWebブラウザ8から要求のあったURLアドレスを代理サーバ手段5に対して要求を送信し,応答結果を端末7上のWebブラウザ8に転送して処理を終了する。
【0017】
リンク先候補作成手段1は,前記の手順で検索対象テキストを取得できた場合,ドキュメントDB13に格納されたドキュメントごとの単語インデックス62に対して,検索対象テキスト内の文字列が含まれているかどうか検索し,当該文字列が含まれているドキュメントの名称60とドキュメントの所在を示すパスまたはURLアドレス61の一覧を作成する。ドキュメントDB13は図9に示すように,検索対象となるドキュメントの名称60,存在場所(URLやネットワークパスで示される場合もある)61,単語インデックス62,アクセス履歴63から構成される。ドキュメントDB13中の単語インデックスは図10に示すように,当該ドキュメントを単語に分解した場合の単語64と出現頻度65の一覧から構成される。またドキュメントDB13中のアクセス履歴は図11に示すように,利用者がリンク先候補表示手段2にて当該ドキュメントを選択した場合に,当該利用者のID66,最終アクセス日時67,アクセス頻度68を利用者IDごとに記録する。ドキュメントDB13中の前記単語インデックス62とアクセス履歴63は,1つのドキュメントを単位として作成される。ただしリンク先候補一覧10の作成過程において,端末7上のWebブラウザ8から要求のあったURLが含まれる場合は一覧に含めない。
【0018】
リンク先候補一覧作成の最終過程において,当該候補一覧は以下に記述する優先度設定手段26によって並び替えられる。並び替えをするための重み付けは,図12に示される優先度設定により行われる。図12に示される優先度設定は、省略が可能でありその場合は検索対象テキストの頻度順(デフォルト値)となる。図12に示す優先度設定において、各条件の重みは0〜1までの任意の値を設定できるが,重みの合計値は1となるように設定するものとする。重み付けの条件としてアクセス履歴順やアクセス頻度順に対しては,ドキュメントDB13に格納された情報から優先順位を決定することはがきるが,後述の所属部署等で重み付けを行う場合は一覧に含まれる各ドキュメントに対する重みを算出する処理(プログラム名)を記載する。
【0019】
図12に示す重み設定は,図7および図15に示すように,利用者IDごとの内容が利用者DB11に保管され,利用者が各条件に対する任意の重みを自由に設定し保存できる。各ドキュメントに対する重み付けを行う処理は,最小値が0,最大値が1となるように正規化されていなければならない。ただし重み0の条件に対しては、各ドキュメントに対する重み値を算出する処理を行わないものとする。各条件の重みが算出された後,各ドキュメントに対する重みの合計値を算出し,合計値の大きい順に並べ替えを行うことで優先度を設定する。前記した優先度設定26は,ゲートウェイ装置6に備えられたCGI等によるプログラムであり,端末7にリンク先候補一覧10が表示された際,リンク先候補一覧10の最後に表示される優先度設定25のリンクを選択(クリック)することで起動され,利用者が設定を変更した場合は,その結果を利用者DB11に保管する処理を実行する。
【0020】
利用者DB11に格納されるデータは,図15に示すように,検索対象文字列の出現頻度(条件1)の重み70,アクセス履歴順(条件2)の重み71,アクセス頻度順(条件3)の重み72,条件4の条件名称73,条件4の重み74,各検索対象ドキュメントの条件4に対する重みを算出するプログラム名称75を記載する。検索対照ドキュメントの重みを算出するプログラムが他に存在すれば,新たに条件5以降も設定可能である。以下ではドキュメントに含まれる検索対象文字列の出現頻度のみで替えを行うものとする。
【0021】
優先度設定手段26は特定の条件で重み付けを行いリンク先候補一覧を並び替える。通常は該当するドキュメントDB13のレコードに記録されている,単語インデックスの出現頻度65が高い順に並び替えられる。単語インデックスの出現頻度65が同一の候補は、ドキュメントDB13に記録された利用者のアクセ頻度68順やアクセス時間67順に並べ替える。ただし優先度設定手段26に何も設定がなされていない場合は、前記のように検索対象の単語の出現頻度順に並び替えられるが、優先度設定手段26に利用者の所属部署に関連の強い順を指定すると、指定した重みでリンク先候補一覧10が並び替えられる。利用者の所属部署に関連の強い順への並べ替えは、ドキュメントDB更新手段3の作用を利用することによって行われるが後述する。ドキュメントDB13に利用者ごとのアクセス頻度68やアクセス時間67を記録するのは、後述するリンク先表示手段2の作用である。以上のように優先度設定手段26により、検索対象テキストを含むドキュメントの一覧は図12に示す優先度設定に従って並び替えられる。標準設定では、検索対象テキストを含む頻度順に並び替えられる。次にリンク先候補表示手段2の動作について説明する。
リンク先候補作成手段1により作成されたリンク先候補一覧10は、リンク先候補表示手段2に渡される。
【0022】
なおドキュメントDB13は図9、図10、図11に示すように,指定されたネットワークを含むパスまたはURLアドレス上に保管された1ドキュメントごとに,ドキュメントの名称60,ドキュメントの保管場所を示すネットワークを含むパス名またはURLアドレス61,ドキュメントに含まれる単語インデックス62と各単語が出現する頻度のデータ65および利用者ID66と当該利用者が参照した頻度68、時間67で1レコード(不定長)が構成される。
【0023】
リンク先候補表示手段2は、リンク先候補作成手段1から受取ったドキュメントの名称60とURLアドレス61の一覧から候補を表示および選択するためのHTMLテキストを作成し、当該HTMLテキストを端末7上のWebブラウザ8上の現在参照しているWebページとは別の表示枠に表示させる。リンク先候補手段2は、図13に示すようなHTMLテキストを作成して端末7に送信し、端末7上のブラウザ8とは別の表示枠にリンク先候補一覧10を表示させる。具体的には、リンクタグのHREF項目にドキュメントの保管先であるURLアドレス61を、リンクタグの表示テキスト部分にドキュメントの名称60を記述する。候補一覧10が表示される順番は、リンク先候補作成手段1の優先度設定26によってつけられた優先順に表示されるものとする。端末7の利用者が、表示された候補一覧10から1つを選択(クリック)すると、選択された候補のタイトルとリンク先URLアドレスがリンク先候補表示手段2に渡される。リンク先候補表示手段2は、Webブラウザ8から利用者が選択したドキュメントの名称とULRアドレスを受取ると、リンク先候補作成手段1を介さず代理サーバ手段5に対して、要求された当該コンテンツをネットワーク経由で取得し、端末7に転送する。またリンク先候補表示手段2は、利用者のIDと利用者が選択したリンク先ドキュメントの情報を用いてドキュメントDB13を更新する。ドキュメントDB13には、ドキュメントの名称60、保管場所61、単語インデックス62の他に、利用者ごとのアクセス履歴63が保持されており、利用者が候補一覧10の中から1つのドキュメントを選択するごとに、リンク先候補表示手段2により当該アクセス頻度68が増加されとともに最終アクセス時間67が更新される。端末7には、リンク先候補表示手段2で利用者が選択したドキュメントが表示される。
【0024】
ドキュメントDB更新手段3は、ゲートウェイ装置6から一定時間間隔で起動され、指定されたファイルサーバ16のネットワークパスを含むディレクトリ下に、保存されたドキュメントに含まれるテキストを単語単位に分解して単語インデックス62を作成し、当該ドキュメントの名称60と保管場所を示すURL61ならびに単語インデックス62でドキュメントDB13の情報を更新する。ドキュメントDB更新手段3が作成の対象とするドキュメントは、当該ドキュメントに含まれるテキストが検索可能なものが対象であるが、特定アプリケーションで作成されたバイナリ形式のドキュメントであっても、当該ドキュメントに対応したテキスト抽出フィルタが存在する場合、ドキュメントDB更新手段13の作成対象ドキュメントに設定できる。ドキュメントDB更新手段13が対象とするドキュメントは、図14に示される更新対象ドキュメント設定手段29で設定する。具体的には第1カラムにドキュメントの拡張子27、第2カラムに当該拡張子のドキュメントに対するテキスト抽出フィルタのプログラム名28を設定する。対象ファイルがテキストやHTMLファイル等でフィルタ処理が必要ない場合は、第2カラムを省略する。
【0025】
ドキュメントDB更新手段13は前記の更新対象ドキュメント設定29に従い、ドキュメントがHTMLやプレーンテキスト以外のバイナリファイルだった場合は、ファイル名の拡張子に対応したテキスト抽出用のフィルタを起動し当該ファイルに含まれているテキストを作業ファイルへ出力する。さらに作業ファイルに出力されたテキストに対して単語分解とインデックス作成を実行し、その結果をドキュメントDB13に反映させる。前記のような更新対象ドキュメント設定手段29を備えることにより、HTMLやテキスト以外のファイルでも、ドキュメントDB13の作成対象ドキュメントとすることで、リンク先のドキュメントとして選択可能な候補に含めることができる。ただしファイルの拡張子に対応するテキスト抽出フィルタは、更新対象ドキュメント設定手段29によって予め設定ファイルに記録しておくものとし、登録されていない拡張子のドキュメントについては、ドキュメントDB更新手段3の対象ドキュメントとはせず、テキストの抽出ならびに単語インデックスの作成は行わない。
【0026】
ゲートウェイ装置6にリンク先候補作成手段1とリンク先候補表示手段2ならびにドキュメントDB13とその更新手段3を備えることで利用者が検索しいたい単語を多く含み、参照頻度が高くかつ検索した日時順に候補となるドキュメントの一覧を表示でき、利用者はその候補の中から最も望ましいドキュメントを選択し参照できる。
【0027】
リンク先候補作成手段1に利用者の所属や業務等の属性情報を利用することで、作成する候補一覧の精度をさらに上げ、利用者の業務内容に関係のあるドキュメントを選択候補に含める事ができる。前提として、利用者DB11に利用者が属する部署名が記録されているものとする。リンク先候補作成手段1は、作成した候補一覧10に対して優先順位付けを行う際に、利用者が所属する部署に対しての重み付けを行う。所属部署の優先順位を上げるには,図12に示される所属部署の項目の重み値を他の項目に比べて大きな値を設定する。以下の重み付けの処理は,図12に示されるProgram1の処理に相当し、具体的には以下の手順に従う。ドキュメントDB13には、リンク先候補選択手段1によって利用者が選択したドキュメントの名称60と利用者のID66、アクセス頻度68、最終アクセス日時67が記録されている。ドキュメントDB13に記録されたすべてのレコードに対して利用者ID66を利用者DB11の情報から利用者の所属する所属コード56に変換する。
【0028】
次に所属コード順にすべてのドキュメント一覧を並べ替える。その際、複数部署から参照のあったドキュメントに対しては、部署ごとの参照頻度の合計値を算出する。部署ごとにアクセス頻度を分割し、当該部署の総アクセス頻度合計を算出し、この値で各ドキュメントに対するアクセス頻度を除し、各ドキュメントに対する当該部署に所属する利用者のアクセス頻度率を算出する。当該部署に所属する利用者からのアクセス頻度が高いドキュメントほど、そのドキュメントは当該部署の業務に関係が深いと類推できるので、上記の手順により利用者の所属部署に関連のある順にドキュメントを優先順位付けできる。前記のようにして算出された各ドキュメントに対する利用者が所属する部署からのアクセス頻度は、図12で示されるProgram1によって処理された優先度としてリンク先候補作成手段1に渡される。リンク先候補作成手段1は、図12で示される優先度設定に従って候補一覧の表示順序を決定するが、それは式(1)に従う。
i番目のドキュメントの優先度=
総和(j番目の優先度)×(j番目の重み)
例えば検索対象文字列の出現頻度と所属部署の両方を考慮した優先順位で表示させたければそれぞれの重みを0.5とすることで、検索対象文字列の頻度と所属部署に関連のある文書の両方を等分に考慮した順番でリンク先候補一覧10が表示される。前記リンク先候補作成手段1に組み込むことで利用者の所属部署に関連の深いドキュメントを候補の一覧に含めることができる。以上の重み付けの手順を、リンク先候補作成手段1における候補一覧作成の最終段階に組み込むことにより、利用者が所属する部署に関連の深いドキュメントをリンク先候補に含めることができる。同様にして利用者DBとドキュメントDBに利用者の担当業務や業種の情報を付加することにより、利用者の担当業務や業種で重み付けを行い表示されるリンク先候補一覧10を並べ替えることができる。
【0029】
本発明を製造業に適用した実施例を図5に示す。前提としてリンク先候補一覧には図面のデータファイルが含まれ,当該図面ファイルに含まれるテキストを抽出するフィルタと,当該図面ファイルを端末上に表示するビューワは既存であるとする。参照元ドキュメント8は,製品名や当該製品を構成する部品名称をリンクタグの表示テキストとして含んだ設計仕様書等である。通常製品名や部品名等を含んだ図面を含むドキュメントは多岐に渡るが,本発明の前記実施例により,利用者の所属部署,最終アクセス時刻,アクセス頻度およびこれらの重みの合計値に応じた優先付けでリンク先の候補が表示されるので,最後に更新した部品図面等の検索が容易に行える。
【0030】
【発明の効果】
本発明により,ドキュメントの検索において利用者が求めていると思われる情報を優先順位付けして表示させることでよりドキュメントの検索の精度を向上することが可能となる。
【図面の簡単な説明】
【図1】本発明の構成
【図2】候補一覧の表示
【図3】全体処理フロー
【図4】リンク先候補作成手段とリンク先候補表示手段の処理フロー
【図5】本発明の一実施例
【図6】アクセス履歴ファイルのデータ構造
【図7】利用者DBのデータ構造
【図8】部署名と所属コードおよび業務名称と業務コード対応表
【図9】ドキュメントDBのデータ構造
【図10】単語インデックスのデータ構造
【図11】アクセス履歴のデータ構造
【図12】候補一覧の優先度設定内容
【図13】候補一覧を表示するHTMLテキスト
【図14】テキスト抽出フィルタの設定内容
【図15】優先度設定のデータ構造
【符号の説明】
1…リンク先候補作成手段,2…リンク先候補表示手段,3…ドキュメントDB更新手段,4…アクセス履歴分析手段,5…代理サーバ手段,6…リンク先候補表示用ゲートウェイ装置,7…端末,8…Webブラウザ,9…タグ名称,10…リンク先候補一覧,11…利用者DB,12…ドキュメント,13…ドキュメントDB,14…アクセス履歴,15…キャッシュデータ,16…ファイルサーバ装置,21…参照元のリンク先,22…リンク先URL候補1,23…リンク先URL候補2,24…リンク先URL候補3,25…優先度設定手段を起動するリンクタグ,26…優先度設定手段,27…拡張子,28…フィルタプログラム名,29…更新対象ドキュメントの設定,30…部品名称,31…CAD図面,41…要求元IPアドレス,42…日時,43…キャッシュファイル名,44…要求先URL,51…利用者ID,52…利用者の氏名,53…利用者の所属コード,54…利用者の担当業務コード,55…部署名,56…所属コード,57…業務名称,58…業務コード,59…利用者ごとの優先度設定情報,60…ドキュメント名称,61…ドキュメントの保管先URL,62…ドキュメントの単語インデックス,63…ドキュメントのアクセス履歴,64…単語,65…単語の出現頻度,66…利用者ID,67…利用者の最終アクセス日時,68…利用者のアクセス頻度,70…条件1の重み,71…条件2の重み,72…条件3の重み,73…条件4の名称,74…条件3の重み,75…条件4の重み決定方法,
Claims (4)
- 端末上のWebブラウザからゲートウェイ装置に備えられた代理サーバを介してネットワーク上のコンテンツを検索する際に,Webブラウザに表示されたドキュメント内に記述されたリンク先を辿りながら情報を検索するドキュメント表示方法において,
複数のリンク先候補を端末に表示するリンク先候補作成ステップと,利用者が前記手段によって表示された候補の中から任意のリンク先を選択できるリンク先候補表示ステップとを有することを特徴とするドキュメント表示方法。 - Webブラウザが稼動する端末とネットワーク上で接続され,代理サーバを有するゲートウェイ装置において,
代理サーバのアクセス履歴記録機能とキャッシュ機能を利用して,利用者が端末上のブラウザで選択したリンク先にHTMLテキストのアンカータグで関連付けられたキーワードを抽出し,該キーワードを含むドキュメントを検索し,該キーワードの出現頻度等の順で該ドキュメントの一覧を並べ替えるリンク先候補作成手段を備えたことを特徴とするゲートウェイ装置。 - 端末上のWebブラウザからゲートウェイ装置に備えられた代理サーバ手段を介してネットワーク上のコンテンツを検索する際に,Webブラウザに表示されたドキュメント内に記述されたリンク先を辿りながら情報を検索するドキュメント表示方法において,
複数のリンク先候補を端末に表示するリンク先候補作成ステップと,利用者が前記手段によって表示された候補の中から任意のリンク先を選択できるリンク先候補表示ステップと,上記端末で稼動するWebブラウザの代理サーバにゲートウェイ装置を指定することを特徴とするドキュメント表示方法。 - Webブラウザが稼動する端末とネットワーク上で接続され,代理サーバ手段を有するゲートウェイ装置において,
代理サーバ手段が作成および更新するのアクセス履歴とキャッシュデータを利用して,利用者が端末上のブラウザで選択したリンク先にHTMLテキストのアンカータグで関連付けられたキーワードを抽出し,該キーワードを含むドキュメントを検索し,該キーワードの出現頻度等の順で該ドキュメントの一覧を並べ替える手段と,ドキュメントとは別に該ドキュメントの保管場所を示すURLと,該ドキュメントに含まれる単語インデックス,該ドキュメントへのアクセス履歴,該ドキュメントにアクセスした利用者の情報等を保持したドキュメントデータベースと,一定時間間隔で最新のドキュメントの状態を参照して該ドキュメントデータベースを更新するドキュメントDB更新手段とを備えたことを特徴とするゲートウェイ装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002375841A JP2004206492A (ja) | 2002-12-26 | 2002-12-26 | ドキュメント表示方法およびそれを用いたリンク先選択機能付ゲートウェイ装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002375841A JP2004206492A (ja) | 2002-12-26 | 2002-12-26 | ドキュメント表示方法およびそれを用いたリンク先選択機能付ゲートウェイ装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004206492A true JP2004206492A (ja) | 2004-07-22 |
Family
ID=32813451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002375841A Pending JP2004206492A (ja) | 2002-12-26 | 2002-12-26 | ドキュメント表示方法およびそれを用いたリンク先選択機能付ゲートウェイ装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004206492A (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006235873A (ja) * | 2005-02-23 | 2006-09-07 | Ntt Docomo Inc | コンテンツ中継サーバ、コンテンツ配信システム及びコンテンツ中継方法 |
JP2008059336A (ja) * | 2006-08-31 | 2008-03-13 | Yafoo Japan Corp | Webドキュメントへのリンクを表示させる方法 |
JP2009044512A (ja) * | 2007-08-09 | 2009-02-26 | Silex Technology Inc | ネットワーク機器およびネットワーク機器設定方法 |
JP2009146044A (ja) * | 2007-12-12 | 2009-07-02 | Nec Corp | 情報検索装置、情報検索方法、及び情報検索プログラム |
JP2009230536A (ja) * | 2008-03-24 | 2009-10-08 | Fujitsu Ltd | 表示制御装置、表示制御方法及び表示制御プログラム |
JP2010003230A (ja) * | 2008-06-23 | 2010-01-07 | Onkyo Corp | コンテンツ再生装置及びそのプログラム |
JP2012038333A (ja) * | 2005-09-07 | 2012-02-23 | Ricoh Co Ltd | 情報処理装置 |
JP2012073917A (ja) * | 2010-09-29 | 2012-04-12 | Nec Personal Computers Ltd | 統計的な設定情報収集システム及び方法 |
JP2014153781A (ja) * | 2013-02-05 | 2014-08-25 | Kddi Corp | 文字列の理解度レベルに応じたリンク先を提示する情報提供装置、サーバ、プログラム及び方法 |
WO2014203352A1 (ja) * | 2013-06-19 | 2014-12-24 | 富士通株式会社 | 通信装置、通信システム、通信方法、及び通信プログラム |
JP2018156393A (ja) * | 2017-03-17 | 2018-10-04 | ヤフー株式会社 | 推定装置、推定方法、及び推定プログラム |
-
2002
- 2002-12-26 JP JP2002375841A patent/JP2004206492A/ja active Pending
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4503464B2 (ja) * | 2005-02-23 | 2010-07-14 | 株式会社エヌ・ティ・ティ・ドコモ | コンテンツ中継サーバ、コンテンツ配信システム及びコンテンツ中継方法 |
JP2006235873A (ja) * | 2005-02-23 | 2006-09-07 | Ntt Docomo Inc | コンテンツ中継サーバ、コンテンツ配信システム及びコンテンツ中継方法 |
JP2012038333A (ja) * | 2005-09-07 | 2012-02-23 | Ricoh Co Ltd | 情報処理装置 |
JP2008059336A (ja) * | 2006-08-31 | 2008-03-13 | Yafoo Japan Corp | Webドキュメントへのリンクを表示させる方法 |
JP2009044512A (ja) * | 2007-08-09 | 2009-02-26 | Silex Technology Inc | ネットワーク機器およびネットワーク機器設定方法 |
JP4660785B2 (ja) * | 2007-08-09 | 2011-03-30 | サイレックス・テクノロジー株式会社 | ネットワーク機器およびネットワーク機器設定方法 |
JP2009146044A (ja) * | 2007-12-12 | 2009-07-02 | Nec Corp | 情報検索装置、情報検索方法、及び情報検索プログラム |
JP2009230536A (ja) * | 2008-03-24 | 2009-10-08 | Fujitsu Ltd | 表示制御装置、表示制御方法及び表示制御プログラム |
JP2010003230A (ja) * | 2008-06-23 | 2010-01-07 | Onkyo Corp | コンテンツ再生装置及びそのプログラム |
JP2012073917A (ja) * | 2010-09-29 | 2012-04-12 | Nec Personal Computers Ltd | 統計的な設定情報収集システム及び方法 |
JP2014153781A (ja) * | 2013-02-05 | 2014-08-25 | Kddi Corp | 文字列の理解度レベルに応じたリンク先を提示する情報提供装置、サーバ、プログラム及び方法 |
WO2014203352A1 (ja) * | 2013-06-19 | 2014-12-24 | 富士通株式会社 | 通信装置、通信システム、通信方法、及び通信プログラム |
JP2018156393A (ja) * | 2017-03-17 | 2018-10-04 | ヤフー株式会社 | 推定装置、推定方法、及び推定プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6718365B1 (en) | Method, system, and program for ordering search results using an importance weighting | |
US11163802B1 (en) | Local search using restriction specification | |
US6959319B1 (en) | System and method for automatically personalizing web portals and web services based upon usage history | |
US7809716B2 (en) | Method and apparatus for establishing relationship between documents | |
USRE44794E1 (en) | Method and apparatus for representing and navigating search results | |
JP5112324B2 (ja) | 構造化データ上での検索 | |
US8639687B2 (en) | User-customized content providing device, method and recorded medium | |
US8849818B1 (en) | Searching via user-specified ratings | |
US20080195588A1 (en) | Personalized Search Method and System for Enabling the Method | |
US20080028334A1 (en) | Searchable personal browsing history | |
US9529861B2 (en) | Method, system, and graphical user interface for improved search result displays via user-specified annotations | |
US20020073165A1 (en) | Real-time context-sensitive customization of user-requested content | |
US8589391B1 (en) | Method and system for generating web site ratings for a user | |
WO2005052811A1 (en) | Searching in a computer network | |
JP2010508579A (ja) | マクロを使用する個別化検索 | |
JP4430598B2 (ja) | 情報共有システムおよび情報共有方法 | |
JP4939637B2 (ja) | 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体 | |
JP2006099341A (ja) | 更新履歴生成装置及びプログラム | |
US7895337B2 (en) | Systems and methods of generating a content aware interface | |
US7836108B1 (en) | Clustering by previous representative | |
JP2004206492A (ja) | ドキュメント表示方法およびそれを用いたリンク先選択機能付ゲートウェイ装置 | |
JP4955841B2 (ja) | 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体 | |
JP2001325290A (ja) | 文書ファイル検索システム | |
KR20060115488A (ko) | 웹 브라우저의 즐겨찾기 리스트를 이용한 개인화 검색 방법및 검색 서버 | |
JP2012043290A (ja) | 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体 |