JP2006185167A - ファイル検索方法、ファイル検索装置、および、ファイル検索プログラム - Google Patents

ファイル検索方法、ファイル検索装置、および、ファイル検索プログラム Download PDF

Info

Publication number
JP2006185167A
JP2006185167A JP2004377960A JP2004377960A JP2006185167A JP 2006185167 A JP2006185167 A JP 2006185167A JP 2004377960 A JP2004377960 A JP 2004377960A JP 2004377960 A JP2004377960 A JP 2004377960A JP 2006185167 A JP2006185167 A JP 2006185167A
Authority
JP
Japan
Prior art keywords
file
browsed
score
experience
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004377960A
Other languages
English (en)
Other versions
JP4445849B2 (ja
Inventor
Tetsuyuki Morita
哲之 森田
Yasuhisa Kato
泰久 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004377960A priority Critical patent/JP4445849B2/ja
Publication of JP2006185167A publication Critical patent/JP2006185167A/ja
Application granted granted Critical
Publication of JP4445849B2 publication Critical patent/JP4445849B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザにとってより有用な類似ファイルを検索する。
【解決手段】表示装置に表示されている表示ファイルを取得する表示ファイル取得ステップと、履歴記憶部を参照し、閲覧済ファイル毎に、表示ファイルとの類似度を示す類似スコアを算出する類似スコア算出ステップと、履歴記憶部を参照し、閲覧済ファイル毎に、過去に閲覧した際に当該閲覧済みファイルに対するユーザの経験の強さを示す経験スコアを算出する経験スコア算出ステップと、閲覧済ファイル毎に算出された類似スコアおよび経験スコアを用いて統合スコアを算出する統合スコア算出ステップと、統合スコア各々と、当該統合スコアに対応する前記履歴記憶部に記憶された閲覧済ファイルの情報と、を表示装置に出力する出力ステップと、を行う。
【選択図】 図1

Description

本発明は、ファイルを検索する技術に関し、特にユーザが過去に閲覧したファイルの中から類似するファイルを検索する技術に関する。
類似ファイルを検索するサービスとして、例えばGoogle社(登録商標)が提供する情報検索のための検索サイト(Google(登録商標))がある。この検索サイトでは、検索結果であるWebページのURL毎に、当該Webページに関連するWebページのリンク先情報を提供する。すなわち、この検索サイトでは、Webページの内容や、Webページを公開しているサイトのURLなどから類似度を算出して、関連するWebページを検索する。
また、ユーザが過去に閲覧した情報を管理する技術として、例えば、「お気に入り」や「履歴」がある。「お気に入り」や「履歴」は、Microsoft Corporation(登録商標)のWebブラウザであるInternet Explorer(登録商標)が提供する機能である。ユーザは、「お気に入り」や「履歴」の機能を使用することにより、過去に閲覧したWebページに容易にアクセスすることができる。
また、特許文献1には、ユーザの操作履歴に基づいて各Webページの評価値を算出し、類似した評価値を有する他のユーザが高く評価しているWebページのURLを、ユーザに提供する閲覧支援装置が記載されている。
特開平10−307845
一般的に、所定のファイル(Webページを含む)に類似するファイルを検索する場合、キーワード、ファイルの作成日、アクセス日時などを用いて算出された類似スコアの順に、類似するファイルを表示する。しかしながら、検索された類似ファイルの数が膨大な場合、ユーザにとって有用なファイルが常に上位に表示されるとは限らない。そのため、ユーザは、検索された類似ファイルの中から、有用なファイルにアクセスすることが困難な場合がある。
一方、ユーザが過去に閲覧したファイルは、一度も閲覧していないファイルに比べて有用である場合が多い。また、過去に閲覧したファイルであっても、ユーザが当該ファイルを閲覧した状況に応じて、有用度が異なると考えられる。例えば、ユーザがただ単にファイルを表示した場合と、ユーザが表示したファイルの内容を理解した場合とでは、後者の方がユーザにとって有用であると考えられる。
本発明は上記事情に鑑みてなされたものであり、本発明の目的は、ユーザにとってより有用な類似ファイルを検索することにある。
上記課題を解決するために、例えば、第1の発明では、ファイル検索装置が行うファイル検索方法であって、ファイル検索装置は、過去に閲覧した閲覧済ファイルの情報が記憶された履歴記憶部と、処理部と、を有する。そして、処理部は、表示装置に表示されている表示ファイルを取得する表示ファイル取得ステップと、履歴記憶部を参照し、閲覧済ファイル毎に、表示ファイルとの類似度を示す類似スコアを算出する類似スコア算出ステップと、履歴記憶部を参照し、閲覧済ファイル毎に、過去に閲覧した際に当該閲覧済みファイルに対するユーザの経験の強さを示す経験スコアを算出する経験スコア算出ステップと、閲覧済ファイル毎に算出された類似スコアおよび経験スコアを用いて統合スコアを算出する統合スコア算出ステップと、統合スコア各々と、当該統合スコアに対応する前記履歴記憶部に記憶された閲覧済ファイルの情報と、を表示装置に出力する出力ステップと、を行う。
また、第2の発明は、ファイル検索装置と表示装置とを有するファイル検索システムにおけるファイル検索装置であって、過去に閲覧した閲覧済ファイルの情報が記憶された履歴記憶手段と、表示手段に表示されている表示ファイルを取得する表示ファイル取得手段と、履歴記憶手段を参照し、閲覧済ファイル毎に、表示ファイルとの類似度を示す類似スコアを算出する類似スコア算出手段と、履歴記憶手段を参照し、閲覧済ファイル毎に、過去に閲覧した際に当該閲覧済ファイルに対するユーザの経験の強さを示す経験スコアを算出する経験スコア算出手段と、閲覧済ファイル毎に算出された類似スコアおよび経験スコアを用いて統合スコアを算出する統合スコア算出手段と、統合スコア各々と、当該統合スコアに対応する履歴記憶手段に記憶された閲覧済ファイルの情報と、を表示手段に出力する出力手段と、を有する。
また、第3の発明は、情報処理装置が実行するファイル検索プログラムであって、情報処理装置は、過去に閲覧した閲覧済ファイルの情報が記憶された履歴記憶部と、処理部と、を有する。そして、処理部に、表示装置に表示されている表示ファイルを取得する表示ファイル取得ステップと、履歴記憶部を参照し、閲覧済ファイル毎に、表示ファイルとの類似度を示す類似スコアを算出する類似スコア算出ステップと、履歴記憶部を参照し、閲覧済ファイル毎に、過去に閲覧した際に当該閲覧済みファイルに対するユーザの経験の強さを示す経験スコアを算出する経験スコア算出ステップと、閲覧済ファイル毎に算出された類似スコアおよび経験スコアを用いて統合スコアを算出する統合スコア算出ステップと、統合スコア各々と、当該統合スコアに対応する履歴記憶部に記憶された閲覧済ファイルの情報と、を表示装置に出力する出力ステップと、を実行させる。
本発明により、ユーザにとってより有用な類似ファイルを検索することができる。また、これにより、ユーザは、より有用な類似ファイルに容易にアクセスすることができる。
以下、本発明の実施の形態について説明する。
図1は、本発明の一実施形態が適用されたファイル検索システムの構成図である。
図示する類似ファイル検索システムは、所定のファイルに類似するファイルを検索するシステムである。類似ファイル検索システムは、図示するように、Webブラウザ11と、類似ファイル表示部12と、閲覧中ファイル取得部21と、検索管理部22と、類似スコア算出部23と、経験スコア算出部24と、操作履歴取得部25と、記憶部26と、を有する。
Webブラウザ11は、Webページを閲覧するためのアプリケーションである。すなわち、Webブラウザ11は、インターネットなどのネットワークを介してWebサーバ(不図示)から各種の情報(HTMLファイル、画像など)をダウンロードし、出力装置(不図示)に表示する。類似ファイル表示部12は、所定のファイルに類似するファイルを出力装置に表示する。
閲覧中ファイル取得部21は、出力装置に表示されている閲覧中ファイル(表示ファイル)を取得する。検索管理部22は、閲覧中ファイル取得部21が取得した閲覧中ファイルに類似するファイルを検索する。類似スコア算出部23は、記憶部26に記憶された閲覧済みファイル各々について、閲覧中ファイルとの類似度を示す類似スコアを算出する。経験スコア算出部24は、記憶部26に記憶された閲覧済みファイル各々について、当該閲覧済みファイルを過去に閲覧した際のユーザの操作状況を示す経験スコアを算出する。操作履歴取得部25は、ユーザの操作指示に基づいて閲覧済みファイルを取得し、記憶部26に記憶する。
記憶部26には、閲覧済みファイル27と、ファイル属性情報DB28と、操作履歴DB29と、が記憶されている。閲覧済みファイル27は、閲覧済みファイルの情報本体でであって、例えば、Webページを表示するHTMLファイル、テキストデータファイル、イメージデータファイルなどである。ファイル属性情報DB28は、閲覧済みファイル27各々の属性が記憶されたデータベースである。操作履歴DB29は、閲覧済みファイル27各々の操作内容が記憶されたデータベースである。なお、ファイル属性情報DB28および操作履歴DB29については後述する。
上記説明した、類似ファイル検索システムは、例えばCPUと、メモリと、HDD等の外部記憶装置と、キーボードやマウスなどの入力装置と、ディスプレイやプリンタなどの出力装置と、ネットワーク接続するための通信制御装置と、を備えた汎用的なコンピュータシステムを用いることができる。このコンピュータシステムにおいて、CPUがメモリ上にロードされた類似ファイル検索システムのプログラムを実行することにより、各機能が実現される。なお、記憶部26には、メモリまたは外部記憶装置が用いられる。
また、本実施形態における類似ファイル検索システムは、1つのPC(Personal Computer)を用いるものとする。しかしながら、本発明はこれに限定されず、例えば、Webブラウザ11および類似ファイル表示部12の機能はPC上で、それ以外の機能21〜29はサーバ上で実現することとしてもよい。この場合、PCおよびサーバは、それぞれ、CPUと、メモリと、外部記憶装置等を備えるものとする。そして、PCおよびサーバの各機能は、PC用のプログラムの場合はPCのCPUが、サーバ用のプログラムの場合はサーバのCPUが、それぞれ実行することにより実現される。
次に、記憶部26の操作履歴DB29およびファイル属性情報DB28について説明する。
図2は、操作履歴DB29の一例を示す図である。操作履歴DB29は、経験スコアを算出するために必要な指標(操作内容)が記憶されている。図示する操作履歴DB29は、閲覧済みファイル毎に、閲覧開始時間201と、閲覧終了時間202と、URL203と、ハッシュ値204と、ファイル格納場所205と、を有する。
閲覧開始時間201には、閲覧済みファイルを出力装置に表示した時刻が設定される。閲覧終了時間202には、閲覧済みファイル以外の別のファイルが出力装置に表示された時刻(すなわち、閲覧を終了した時刻)が設定される。URL203には、閲覧済みファイルがインターネット上に存在する場合のアドレスが設定される。ハッシュ値には、例えばMD5ハッシュ関数を用いて、閲覧済みファイルの情報本体から生成された固定長の疑似乱数が設定される。ファイル格納場所205には、記憶部26に格納された閲覧済みファイル27の格納場所がフルパスで設定される。
なお、本実施形態では、経験スコアを算出するための指標として、閲覧開始時間201および閲覧終了時間202から算出される閲覧時間を用いることとする。すなわち、より長い時間をかけて閲覧(熟読)したファイルに記載されている情報を理解することは、過去に比較的短時間しか閲覧していないファイルに記載されている情報を理解することに比べて容易であるといえる。そのため、本実施形態では、経験スコアの指標として閲覧時間を用いることとする。
しかしながら、本発明はこれに限定されることなく、経験スコアを算出するための指標として、閲覧済みファイルに対する印刷指示の有無、マウスのクリック(リンク先への移動指示など)、テキストの入力などの操作を用いることとしてもよい。
図3は、ファイル属性情報DB28の一例を示した図である。ファイル属性情報DB28は、類似スコアを算出するために必要な指標(ファイルの属性)が記憶されている。図示するファイル属性情報DB28は、過去に閲覧した閲覧済みファイル毎に、ファイルの格納場所301と、作者302と、タイトル303と、更新日304と、ハッシュ値305と、URL306と、を有する。
なお、本実施形態では、類似スコアを算出するための指標として、作者302と、タイトル303と、更新日304と、記憶部26に記憶された閲覧済みファイル27本体を用いるものとする。
次に、本システムの閲覧済みファイルに対する操作履歴の取得処理について説明する。なお、本実施形態では、操作履歴の取得処理は、本システムのOS(Operating System)の起動中、繰り返し行われるものとする。
図4は、操作履歴取得処理の処理フロー図である。操作履歴取得部25は、OS上でグローバルに通信されているメッセージを取得(フック)し、アクティブ状態となったアプリケーションを特定する(S41)。メッセージは、OSがマウスやキーボードなどの入力装置から受け付けた各種のイベントを、対象となるアプリケーションに通知するものである。なお、図示する例では、特定されたアクティブ状態のアプリケーションは、Webブラウザ11であるものとして、以下説明する。
そして、操作履歴取得部25は、プログラム間通信によって、Webブラウザ11と通信し、Webブラウザ11が出力装置に表示しているファイル(この場合は、Webページを表示するためのHTMLファイル)と、当該ファイルのURLと、を取得する(S42)。そして、操作履歴取得部25は、取得したファイル本体のハッシュ値を算出する(S43)。
そして、操作履歴取得部25は、取得したファイルを、閲覧済みファイル27として記憶部26に記憶する(S44)。そして、操作履歴取得部25は、閲覧開始時間と、URLと、算出したハッシュ値と、ファイルの格納場所と、を記憶部26の操作履歴DB29(図2参照)に記憶する(S45)。なお、閲覧開始時間には、S41で取得したメッセージに含まれる時刻を、当該ファイルの閲覧(表示)を開始した時刻と推定し、閲覧開始時間に設定する。また、ファイルの格納場所には、記憶部26内に記憶された閲覧済みファイルの格納場所を示すフルパスが設定される。
そして、操作履歴取得部25は、記憶部26に記憶した閲覧済みファイル27を解析して、当該ファイルのタイトルと、作者と、更新日と、を特定する(S46)。なお、図示する例では閲覧済みファイル27はHTMLファイルである。したがって、操作履歴取得部25は、THMLファイルのタグを解析することにより、タイトル、作者および更新日を取得する。
そして、操作履歴取得部25は、S46で取得したタイトル、作者および更新日と、S45で操作履歴DB29に記憶したファイルの格納場所、ハッシュ値およびURLとを、ファイル属性情報DB28(図3参照)に記憶する(S47)。
そして、操作履歴取得部25は、出力装置に表示されているファイルが新たなファイルに切り替わった場合、当該新たなファイルが表示され時刻をファイルの閲覧を終了した時刻と推定して、操作履歴DB29の閲覧終了時間に記憶する(S48)。すなわち、操作履歴取得部25は、例えば、Webブラウザ11から新たなファイルの表示を通知するメッセージを取得した場合、または、Webブラウザ11を非アクティブ状態とするメッセージを取得した場合、当該メッセージに含まれる時刻を操作履歴DB29の閲覧終了時間に記憶する。そして、操作履歴取得部25は、S41(またはS42)に戻り、次に出力装置に表示されたファイルを閲覧済みファイルとして、同様の処理を行う。
次に、類似ファイル検索処理について説明する。
図5は、類似ファイル検索処理の処理フロー図である。まず、検索管理部22は、記憶部26に記憶された初期設定ファイル(不図示)を参照し、初期設定ファイルにあらかじめ設定されたアプリケーション種別およびスコア算出方法を取得する(S51)。
アプリケーション種別は、類似ファイルの検索を行うアプリケーションの種類を設定したものである。図示する例では、対象となるアプリケーション種別は、Webブラウザ11とし、Webブラウザ11が現在表示中のファイルに類似する類似ファイルを検索し、表示するものとする。なお、アプリケーション種別を、全てのアプリケーションとし、全てのアプリケーションが表示するファイルについて類似ファイルを検索し、表示することとしてもよい。
スコア算出方法には、例えば、優先するファイル属性、最大閲覧時間、スコア配分などがある。優先するファイル属性は、後述する類似スコア算出部23の処理において、優先する(重み付けをする)ファイルの属性が設定されている。最大閲覧時間は、後述する経験スコア算出部24の処理において、上限となる閲覧時間を定めたものである。スコア配分は、類似スコアと経験スコアとの比率(優先度合い)を定めたものである。
なお、検索管理部22は、初期設定ファイルからアプリケーション種別およびスコア算出方法を取得するだけでなく、ユーザが入力装置を用いて入力したアプリケーション種別およびスコア算出方法を取得することとしてもよい。なお、ユーザが入力する場合の入力画面については後述する。
そして、検索管理部22は、閲覧中ファイル取得部21に、対象となるアプリケーション(Webブラウザ11)の識別情報を送信する。そして、閲覧中ファイル取得部21は、Webブラウザ11に問い合わせて、現在表示中(閲覧中)のファイル(HTMLファイル)とURLとを取得する。そして、閲覧中ファイル取得部21は、取得したファイルとURLとを検索管理部22に送信する(S52)。
なお、閲覧中ファイル取得部21は、操作履歴DB29の中から最新の閲覧済みファイル(すなわち、現在表示中のファイル)を特定し、当該ファイルのURLと、ファイルの格納場所から特定した閲覧済みファイル27と、を取得することとしてもよい。
そして、検索管理部22は、現在表示中のファイルおよびURLと、S1で取得したスコア計算方法の優先するファイル属性と、を類似スコア算出部23に送信する。そして、類似スコア算出部23は、検索管理部22から受信した現在表示中のファイルを解析し、タイトルと作者と更新日とを特定する(S53)。具体的には、類似スコア算出部23は、THMLファイルのタグを解析することにより、タイトル、作者および更新日を取得する。
そして、類似スコア算出部23は、記憶部26のファイル属性情報DB28に記憶されている閲覧済みファイル各々について、現在表示中のファイルとの類似スコア(類似度)を算出する(S54)。なお、類似スコアの算出については、例えば、ファイルの内容を解析し、テキストマッチングにより各キーワードに対するスコアを割り当てる手法や、Webのハイパーリンク構造を利用する手法などがある。
本実施形態では、閲覧済みファイルの情報本体の類似スコアと、作者の類似スコアと、タイトルの類似スコアと、更新日の類似スコアと、URLの類似スコアとをテキストマッチング技術を用いてそれぞれ算出するものとする。なお、類似スコア算出部23は、ファイル属性情報DB28のファイルの格納場所を用いて、記憶部26に記憶された各閲覧済みファイル27の情報本体にアクセスする。
そして、類似スコア算出部23は、検索管理部22から送信されたスコア算出方法(優先するファイル属性)にもとづいて、所定の類似スコアに重み付けし、統合類似スコアを算出する(S55)。本実施形態の優先するファイル属性は、例えばタイトルとする。この場合、類似スコア算出部23は、各閲覧済みファイルについて、以下の式により統合類似スコアを算出する。
統合類似スコア=閲覧済みファイルの情報本体の類似スコア+作者の類似スコア+(タイトルの類似スコア×2)+更新日の類似スコア+URLの類似スコア
そして、類似スコア算出部23は、ファイル毎に、算出した統合類似スコアとファイルの格納場所とをペアにした類似スコアリストを検索管理部22に送信する。
そして、検索管理部22は、S51で取得したスコア算出方法の最大閲覧時間を経験スコア算出部24に送信する。そして、経験スコア算出部24は、操作履歴DB29を参照し、閲覧済みファイル毎に閲覧時間を算出する。すなわち、経験スコア算出部24は、閲覧終了時間から閲覧開始時間を減算することによる閲覧時間を算出する。そして、経験スコア算出部24は、閲覧済みファイル毎に算出した閲覧時間各々を、スコア算出方法(最大閲覧時間)により補正して、経験スコアを算出する(S56)。
なお、本実施形態の最大閲覧時間は例えば5分とする。この場合、経験スコア算出部24は、5分を超える閲覧時間は切り捨てて、一律5分とする。そして、経験スコア算出部は、1秒あたり1ポイントとして、各閲覧済みファイルの経験スコアを算出する。そして、経験スコア算出部24は、閲覧済みファイル毎に算出した経験スコアと、当該ファイルの格納場所とをペアにした経験スコアリストを検索管理部22に送信する。
そして、検索管理部22は、類似スコア算出部23が送信した類似スコアリストと、経験スコア算出部24が送信した経験スコアリストとを用いて、統合スコアを算出する(S57)。すなわち、検索管理部22は、ファイルの格納場所をマッチングキーとして、類似スコアリストと経験スコアリストとをマッチングする。そして、検索管理部22は、S51で取得したスコア配分の比率を統合類似スコアおよび経験スコアに掛け合わせ、統合スコアを算出する。なお、本実施形態のスコア配分は、統合類似スコアが「3」で経験スコアは「7」の割合とする。この場合、検索管理部22は、以下の式により各閲覧済みファイルの統合スコアを算出する。
統合スコア=統合類似スコア×0.3+経験スコア×0.7
そして、検索管理部22は、閲覧済みファイル毎に算出した統合スコアと、当該統合スコアに対応するファイルの格納場所とをペアにした統合スコアリストを類似ファイル表示部12に送信する。類似ファイル表示部12は、統合スコアの高い順に閲覧済みファイルに関する情報を出力装置に表示する(S58)。
図6は、類似する閲覧済みファイルが表示された出力画面の一例を示した図である。図示する表示画面には、類似ファイル表示部12が表示する類似ファイルのツールバー61と、起動中のアプリケーションであるWebブラウザ11が表示する現在表示中のファイル(Webページ)62と、が表示されている。そして、類似ファイルのツールバー61には、ユーザの入力エリア63と、類似ファイルの表示エリア64とが表示されている。
ユーザの入力エリア63は、類似ファイルの検索対象となるアプリケーション、および、スコア算出方法を入力するためのエリアである。図示する例では、対象となるアプリケーションでは、前述の初期設定ファイルに設定されたWebブラウザが対象となっている(図5:S51)。ユーザは、所望のチェックボックスに入力することにより、対象となるアプリケーションの種別を、随時、変更することができる。
また、図示する例では、スコア算出方法として、スコア配分を示すバーが表示されている。ユーザは、スコア配分を示すバーを、入力装置を用いて移動させることにより、図5のS57で算出される統合スコアの算出方法(統合類似スコアと経験スコアとの比率)を変更することができる。なお、入力エリア63は、他のスコア算出方法(優先するファイル属性、最大閲覧時間等)についても入力できるようにしてもよい。
類似ファイルの表示エリア64には、統合スコアの高い順に、各閲覧済みファイルに関する情報が、所定の数だけ表示されるものとする。閲覧済みファイルに関する情報としては、例えば閲覧済みファイルのタイトル、閲覧済みファイルの情報本体の要約、URLなどが考えられる。類似ファイル表示部12は、検索管理部22から送信された統合リストを、統合スコアをソートキーとして並べ替え、上位の閲覧済みファイルを特定する。そして、類似ファイル表示部12は、特定した上位の閲覧済みファイル各々について、ファイルの格納場所を検索キーとし、ファイル属性情報DB28と、操作履歴DB29と、閲覧済みファイル27の情報本体とにアクセスして、所定の情報を類似ファイルの表示エリア64に表示する。
以上、本発明の一実施形態を説明した。
本実施形態では、過去に閲覧した閲覧済みファイルの中から、現在表示されているファイルに類似するファイルを、ファイルの類似スコアおよび当該ファイルを過去に閲覧した際の経験スコアに基づいて検索し表示する。これにより、ユーザにとってより有用な類似ファイルを抽出し、上位に表示することできる。また、上位に有用なファイルが表示されることにより、ユーザは容易に有用なファイルにアクセスすることができる。
また、本実施形態では、経験スコアを算出するための指標としてファイルの閲覧時間を用いている。これにより、長時間閲覧したファイルが比較的上位に表示され、ユーザは過去に長い時間かけて熟読した(内容を理解した)ファイルにアクセスしやすくなる。

また、本実施形態では、図6に示す表示画面において、類似ファイルの検索対象のアプリケーション、および、スコア算出方法の指定を受け付ける。すなわち、ユーザが指定したスコア算出方法等を受け付けて、統合スコアの算出方法等を柔軟に変更することができる。
なお、本発明は上記の実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。例えば、本実施形態では、操作履歴取得部25が各種のメッセージからユーザの操作履歴を取得する。しかしながら、Webブラウザ11の履歴取得機能を流用することにより操作履歴を取得することとしてもよい。また、類似ファイル検索システムとネットワークで接続されたWebサーバから、操作履歴を取得することとしてもよい。
また、上記の実施形態では、類似ファイルの検索対象範囲を、過去に閲覧した閲覧済みファイルとした。しかしながら、類似スコア算出部23は、過去に閲覧していないファイル(情報)を含めた任意の範囲のファイルから類似スコアを算出することとしてもよい。すなわち、類似スコア算出部23は、外部の検索サービスと通信して、ユーザが過去に閲覧していないファイルを含む任意の範囲で、現在表示中のファイルと類似しているファイルを検索することとしてもよい。
また、本類似ファイル検索システムは、類似スコア算出部23を有しないこととしてもいよい。すなわち、本類似ファイル検索システムの検索管理部22は、他の外部システムに、現在表示中のファイルとURLとを送信することにより、類似スコアの算出結果を受け取ることとしてもよい。
本発明の一実施形態が適用された類似ファイル検索システムの構成図である。 ファイル属性情報DBのデータ構造の一例を示す図である。 操作履歴DBのデータ構造の一例を示す図である。 操作履歴取得処理の処理フロー図である。 類似ファイル検索処理の処理フロー図である。 類似ファイル表示画面の一例を示す図である。
符号の説明
11:Webブラウザ、12:類似ファイル表示部、21:閲覧中ファイル取得部、22:検索管理部、23:類似スコア算出部、24:経験スコア算出部、25:操作履歴取得部、26:記憶部、27:閲覧済みファイル、28:ファイル属性情報DB、29:操作履歴DB

Claims (12)

  1. ファイル検索装置が行うファイル検索方法であって、
    前記ファイル検索装置は、過去に閲覧した閲覧済ファイルの情報が記憶された履歴記憶部と、処理部と、を有し、
    前記処理部は、
    表示装置に表示されている表示ファイルを取得する表示ファイル取得ステップと、
    前記履歴記憶部を参照し、前記閲覧済ファイル毎に、前記表示ファイルとの類似度を示す類似スコアを算出する類似スコア算出ステップと、
    前記履歴記憶部を参照し、前記閲覧済ファイル毎に、過去に閲覧した際に当該閲覧済みファイルに対するユーザの経験の強さを示す経験スコアを算出する経験スコア算出ステップと、
    前記閲覧済ファイル毎に算出された類似スコアおよび経験スコアを用いて統合スコアを算出する統合スコア算出ステップと、
    前記統合スコア各々と、当該統合スコアに対応する前記履歴記憶部に記憶された閲覧済ファイルの情報と、を前記表示装置に出力する出力ステップと、を行うこと
    を特徴とするファイル検索方法。
  2. 請求項1記載のファイル検索方法であって、
    前記履歴記憶部には、前記閲覧済ファイル毎に、当該閲覧済ファイルを前記表示装置に表示した表示時間が記憶され、
    前記経験スコア算出ステップは、前記履歴記憶部の前記表示時間に応じて、前記閲覧済ファイル毎に前記経験スコアを算出すること
    を特徴とするファイル検索方法。
  3. 請求項1記載のファイル検索方法であって、
    前記処理部は、前記類似スコアおよび前記経験スコアの優先度を受け付ける受付ステップを、さらに行い、
    前記統合スコア算出ステップは、前記閲覧済ファイル毎の類似スコアおよび経験スコアを、前記受付ステップで受け付けた優先度に基づく計算式に当てはめて、前記統合スコアを算出すること
    を特徴とするファイル検索方法。
  4. 請求項1記載のファイル検索方法であって、
    前記処理部は、ユーザの操作指示を取得し、取得した操作指示に基づいて前記表示装置で起動されているアプリケーションプログラムの識別情報を特定し、特定したアプリケーションプログラムから閲覧済ファイルを取得し、前記履歴記憶部に格納する閲覧済ファイル取得ステップを、さらに行うこと
    を特徴とするファイル検索方法。
  5. ファイル検索装置と表示装置とを有するファイル検索システムにおけるファイル検索装置であって、
    過去に閲覧した閲覧済ファイルの情報が記憶された履歴記憶手段と、
    前記表示手段に表示されている表示ファイルを取得する表示ファイル取得手段と、
    前記履歴記憶手段を参照し、前記閲覧済ファイル毎に、前記表示ファイルとの類似度を示す類似スコアを算出する類似スコア算出手段と、
    前記履歴記憶手段を参照し、前記閲覧済ファイル毎に、過去に閲覧した際に当該閲覧済ファイルに対するユーザの経験の強さを示す経験スコアを算出する経験スコア算出手段と、
    前記閲覧済ファイル毎に算出された類似スコアおよび経験スコアを用いて統合スコアを算出する統合スコア算出手段と、
    前記統合スコア各々と、当該統合スコアに対応する前記履歴記憶手段に記憶された閲覧済ファイルの情報と、を前記表示手段に出力する出力手段と、を有すること
    を特徴とするファイル検索装置。
  6. 請求項5記載のファイル検索装置であって、
    前記履歴記憶手段には、前記閲覧済ファイル毎に、当該閲覧済ファイルを前記表示装置に表示した表示時間が記憶され、
    前記経験スコア算出手段は、前記履歴記憶手段の前記表示時間に応じて、前記閲覧済ファイル毎に前記経験スコアを算出すること
    を特徴とするファイル検索装置。
  7. 請求項5記載のファイル検索装置であって、
    前記類似スコアおよび前記経験スコアの優先度を受け付ける受付手段を、さらに有し、
    記統合スコア算出手段は、前記閲覧済ファイル毎の類似スコアおよび経験スコアを、前記受付手段が受け付けた優先度に基づく算出式にあてはめて前記統合スコアを算出すること
    を特徴とするファイル検索装置。
  8. 請求項5記載のファイル検索装置であって、
    ユーザの操作指示を取得し、取得した操作指示に基づいて前記表示装置で起動されているアプリケーションプログラムを特定し、特定したアプリケーションプログラムから閲覧済ファイルを取得し、前記履歴記憶手段に格納する閲覧済ファイル取得手段を、さらに有すること
    を特徴とするファイル検索装置。
  9. 情報処理装置が実行するファイル検索プログラムであって、
    前記情報処理装置は、過去に閲覧した閲覧済ファイルの情報が記憶された履歴記憶部と、処理部と、を有し、
    前記処理部に、
    表示装置に表示されている表示ファイルを取得する表示ファイル取得ステップと、
    前記履歴記憶部を参照し、前記閲覧済ファイル毎に、前記表示ファイルとの類似度を示す類似スコアを算出する類似スコア算出ステップと、
    前記履歴記憶部を参照し、前記閲覧済ファイル毎に、過去に閲覧した際に当該閲覧済みファイルに対するユーザの経験の強さを示す経験スコアを算出する経験スコア算出ステップと、
    前記閲覧済ファイル毎に算出された類似スコアおよび経験スコアを用いて総合スコアを算出する統合スコア算出ステップと、
    前記統合スコア各々と、当該統合スコアに対応する前記履歴記憶部に記憶された閲覧済ファイルの情報と、を前記表示装置に出力する出力ステップと、を実行させること
    を特徴とするファイル検索プログラム。
  10. 請求項9記載のファイル検索プログラムであって、
    前記履歴記憶部には、前記閲覧済ファイル毎に、当該閲覧済ファイルを前記表示装置に表示した表示時間が記憶され、
    前記経験スコア算出ステップは、前記履歴記憶部の前記表示時間に応じて、前記閲覧済ファイル毎に前記経験スコアを算出すること
    を特徴とするファイル検索プログラム。
  11. 請求項9記載のファイル検索プログラムであって、
    前記処理部に、前記類似スコアおよび前記経験スコアの優先度を受け付ける受付ステップを、さらに実行させ、
    前記統合スコア算出ステップは、前記閲覧済ファイル毎の類似スコアおよび経験スコアを、前記受付ステップで受け付けた優先度に基づく計算式に当てはめて、前記統合スコアを算出すること
    を特徴とするファイル検索プログラム。
  12. 請求項9記載のファイル検索プログラムであって、
    前記処理部に、ユーザの操作指示を取得し、取得した操作指示に基づいて前記表示装置で起動されているアプリケーションプログラムを特定し、特定したアプリケーションプログラムから閲覧済ファイルを取得し、前記履歴記憶部に格納する閲覧済ファイル取得ステップを、さらに実行させること
    を特徴とするファイル検索プログラム。


JP2004377960A 2004-12-27 2004-12-27 ファイル検索方法、ファイル検索装置、および、ファイル検索プログラム Active JP4445849B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004377960A JP4445849B2 (ja) 2004-12-27 2004-12-27 ファイル検索方法、ファイル検索装置、および、ファイル検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004377960A JP4445849B2 (ja) 2004-12-27 2004-12-27 ファイル検索方法、ファイル検索装置、および、ファイル検索プログラム

Publications (2)

Publication Number Publication Date
JP2006185167A true JP2006185167A (ja) 2006-07-13
JP4445849B2 JP4445849B2 (ja) 2010-04-07

Family

ID=36738239

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004377960A Active JP4445849B2 (ja) 2004-12-27 2004-12-27 ファイル検索方法、ファイル検索装置、および、ファイル検索プログラム

Country Status (1)

Country Link
JP (1) JP4445849B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009070256A (ja) * 2007-09-14 2009-04-02 Toshiba Corp 情報共有システム及び情報共有プログラム
US8005830B2 (en) 2007-04-04 2011-08-23 Nec Corporation Similar files management apparatus and method and program therefor
US8244704B2 (en) 2008-03-24 2012-08-14 Fujitsu Limited Recording medium recording object contents search support program, object contents search support method, and object contents search support apparatus
US8321958B1 (en) * 2008-07-30 2012-11-27 Next It Corporation Detecting presence of a subject string in a target string and security event qualification based on prior behavior by an end user of a computer system
JP2013218482A (ja) * 2012-04-06 2013-10-24 Toppan Printing Co Ltd 電子書籍表示装置、蔵書情報表示プログラム及び蔵書情報表示方法
JP2014011553A (ja) * 2012-06-28 2014-01-20 Konica Minolta Inc 複写機、プログラム、および記録媒体
JP2014056285A (ja) * 2012-09-11 2014-03-27 Nippon Telegr & Teleph Corp <Ntt> コピー追跡システム
JP2017161976A (ja) * 2016-03-07 2017-09-14 日本放送協会 興味情報処理装置およびプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8005830B2 (en) 2007-04-04 2011-08-23 Nec Corporation Similar files management apparatus and method and program therefor
JP2009070256A (ja) * 2007-09-14 2009-04-02 Toshiba Corp 情報共有システム及び情報共有プログラム
US8244704B2 (en) 2008-03-24 2012-08-14 Fujitsu Limited Recording medium recording object contents search support program, object contents search support method, and object contents search support apparatus
US8321958B1 (en) * 2008-07-30 2012-11-27 Next It Corporation Detecting presence of a subject string in a target string and security event qualification based on prior behavior by an end user of a computer system
JP2013218482A (ja) * 2012-04-06 2013-10-24 Toppan Printing Co Ltd 電子書籍表示装置、蔵書情報表示プログラム及び蔵書情報表示方法
JP2014011553A (ja) * 2012-06-28 2014-01-20 Konica Minolta Inc 複写機、プログラム、および記録媒体
JP2014056285A (ja) * 2012-09-11 2014-03-27 Nippon Telegr & Teleph Corp <Ntt> コピー追跡システム
JP2017161976A (ja) * 2016-03-07 2017-09-14 日本放送協会 興味情報処理装置およびプログラム

Also Published As

Publication number Publication date
JP4445849B2 (ja) 2010-04-07

Similar Documents

Publication Publication Date Title
US9948531B2 (en) Predictive prefetching to reduce document generation times
US8819003B2 (en) Query refinement based on user selections
EP2894579B1 (en) A system and a method for presenting multiple sets of search results for a single query
JP4714156B2 (ja) 記事情報を用いて検索ランク付けを改良するための方法およびシステム
US9607107B2 (en) Information processing apparatus and information processing method
US20050114330A1 (en) Method, apparatus and computer-readable medium for searching and navigating a document database
US20100262610A1 (en) Identifying Subject Matter Experts
US7756860B2 (en) Advanced handling of multiple form fields based on recent behavior
US20180225332A1 (en) Pre-fetching information in anticipation of a user request
KR100843913B1 (ko) 서버로부터 페이지를 요청하는 방법, 데이터 프로세싱 시스템 및 컴퓨터 판독가능 저장 매체
US20030074416A1 (en) Method of establishing a navigation mark for a web page
JP2010097461A (ja) 文書検索装置、文書検索方法および文書検索プログラム
US7895337B2 (en) Systems and methods of generating a content aware interface
JP4445849B2 (ja) ファイル検索方法、ファイル検索装置、および、ファイル検索プログラム
JP2004206492A (ja) ドキュメント表示方法およびそれを用いたリンク先選択機能付ゲートウェイ装置
EP1696375A1 (en) A workflow retrieval system
JP4528203B2 (ja) ファイル検索方法、ファイル検索装置、及びファイル検索プログラム
EP1973047A1 (en) Information retrieval system and information retrieval method
JP4962973B2 (ja) 検索サーバ、方法及びプログラム
JP4528202B2 (ja) ファイル検索方法、ファイル検索装置、及びファイル検索プログラム
JP2007310808A (ja) 閲覧場所検索方法及び装置及びプログラム
JP2006024157A (ja) ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置
JP4550876B2 (ja) 構造化文書検索システム及びプログラム
US20080021875A1 (en) Method and apparatus for performing a tone-based search
JP2019021228A (ja) 検索装置、検索システム及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070219

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091006

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100105

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100118

R150 Certificate of patent or registration of utility model

Ref document number: 4445849

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130122

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350