JP2009145953A - データ検索装置、データ検索方法、コンピュータプログラム、及び記録媒体 - Google Patents

データ検索装置、データ検索方法、コンピュータプログラム、及び記録媒体 Download PDF

Info

Publication number
JP2009145953A
JP2009145953A JP2007319550A JP2007319550A JP2009145953A JP 2009145953 A JP2009145953 A JP 2009145953A JP 2007319550 A JP2007319550 A JP 2007319550A JP 2007319550 A JP2007319550 A JP 2007319550A JP 2009145953 A JP2009145953 A JP 2009145953A
Authority
JP
Japan
Prior art keywords
search
access
storage means
data
log
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007319550A
Other languages
English (en)
Inventor
Atsutoshi Morimoto
淳寿 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2007319550A priority Critical patent/JP2009145953A/ja
Priority to US12/324,712 priority patent/US20090150390A1/en
Priority to CN2008101851091A priority patent/CN101458701B/zh
Publication of JP2009145953A publication Critical patent/JP2009145953A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution

Abstract

【課題】ユーザが所望のデータを素早く見つけることができるデータ検索装置、データ検索方法、コンピュータプログラム、及び記録媒体を提供する。
【解決手段】複数の文書を記憶する文書データベース61と、入力された検索条件に対応する文書を文書データベース61から検索したときの検索履歴を記憶する検索ログデータベース62と、文書を閲覧及び印刷等したときのアクセス履歴を記憶するアクセスログデータベース63とを備えるサーバ装置1において、検索履歴及びアクセス履歴のそれぞれに基づいて、文書の利用度を算出し、算出した利用度に基づいて、文書データベース61から文書を抽出する。そして、抽出結果の要求を受け付けた場合に、抽出結果をユーザが利用するPC10に提示する。
【選択図】図1

Description

本発明は、データ検索装置、データ検索装置で行うデータ検索方法、データ検索装置を実現するコンピュータプログラム、及びコンピュータプログラムを記録する記録媒体に関する。
近年、ネットワークの普及に伴い、コンピュータで作成されたデータ、及び、書類から電子化されたデータ等をサーバに格納し、ユーザが、ネットワークを介してサーバに接続される端末により、サーバに格納されたデータの閲覧または編集等を行うシステムが実用化されている。このようなシステムでは、サーバには大容量のデータが格納されており、ユーザが、サーバに格納されるデータから所望のデータを素早く取得できることが望まれている。
例えば、特許文献1には、ユーザにより入力された、キーワードとユーザの検索意図とを反映したデータの検索を行い、検索結果の一覧をユーザに提示する文書検索装置が開示されている。ユーザの検索意図とは、「知らない情報を新たに発見したい」、または、「見たことのある情報を思い出したい」等である。また、特許文献2には、データの印刷回数が多ければデータの重要度が高いと判別することで、データの印刷回数からデータの重要度を算出し、ユーザからの要求に応じて、算出した重要度の順番でデータを一覧表示する情報処理装置が開示されている。
特開2006−268789号公報 特開2007−122685号公報
特許文献1及び特許文献2により、ユーザは、所定条件で絞り込まれたデータの一覧を取得でき、取得した一覧から所望のデータを検索することが可能となる。しかしながら、特許文献1では、ユーザが入力したキーワードに対応するデータが存在しない場合があり、また、キーワードが入力されてから検索が開始されるために、ユーザが検索結果を取得するまでに時間を要するという問題がある。また、特許文献2では、ユーザにとって重要なデータが、印刷されていないことから重要度が高いと判別されないため、ユーザが本当に必要なデータの一覧を取得できないおそれがある。
本発明はかかる事情に鑑みてなされたものであり、その目的とするところは、データの利用度に基づいて抽出したデータをユーザに提示することで、ユーザが所望のデータを素早く見つけることができるデータ検索装置、データ検索方法、コンピュータプログラム、及び記録媒体を提供することにある。
本発明に係るデータ検索装置は、複数のデータを記憶する記憶手段と、入力された検索条件に対応するデータを前記記憶手段から検索する検索手段と、該検索手段が行った検索についてのログを記憶する検索ログ記憶手段と、前記記憶手段に記憶されたデータへのアクセスを行うアクセス手段と、該アクセス手段が行ったアクセスについてのログを記憶するアクセスログ記憶手段とを備えるデータ検索装置において、前記検索ログ記憶手段及び前記アクセスログ記憶手段のそれぞれに記憶されたログに基づいて、前記記憶手段に記憶されたデータそれぞれの利用度を算出する算出手段と、該算出手段が算出した利用度に基づいて、前記記憶手段からデータを抽出する抽出手段と、該抽出手段による抽出結果の要求を受け付ける受付手段と、該受付手段が要求を受け付けた場合、前記抽出結果を出力する出力手段とを備えることを特徴とする。
また、本発明に係るデータ検索装置は、前記算出手段は、前記検索ログ記憶手段に記憶されたログから、前記検索手段が行った検索の検索頻度を取得する検索頻度取得手段と、前記アクセスログ記憶手段に記憶されたログから、前記アクセス手段が行ったアクセスのアクセス頻度を取得するアクセス頻度取得手段とを有し、前記検索頻度取得手段が取得した検索頻度、及び前記アクセス頻度取得手段が取得したアクセス頻度に基づいて利用度を算出する構成としてあることを特徴とする。
さらに、本発明に係るデータ検索装置は、前記アクセス手段は、前記記憶手段に記憶されたデータを閲覧可能にする構成としてあり、前記アクセス頻度は、前記アクセス手段が前記記憶手段に記憶されたデータを閲覧可能とした閲覧頻度であることを特徴とする。
また、本発明に係るデータ検索装置は、前記算出手段は、前記検索頻度及び前記アクセス頻度に基づいて利用度を算出する際に、前記アクセス頻度の比重を前記検索頻度よりも大きくして、前記利用度を算出する構成としてあることを特徴とする。
本発明に係るデータ検索方法は、複数のデータを記憶する記憶手段と、入力された検索条件に対応するデータを前記記憶手段から検索する検索手段と、該検索手段が行った検索についてのログを記憶する検索ログ記憶手段と、前記記憶手段に記憶されたデータへのアクセスを行うアクセス手段と、該アクセス手段が行ったアクセスについてのログを記憶するアクセスログ記憶手段とを備えるデータ検索装置で行うデータ検索方法において、前記検索ログ記憶手段及び前記アクセスログ記憶手段のそれぞれに記憶されたログに基づいて、前記記憶手段に記憶されたデータそれぞれの利用度を算出するステップと、算出した利用度に基づいて、前記記憶手段からデータを抽出するステップと、抽出結果の要求を受け付けるステップと、前記要求を受け付けた場合、前記抽出結果を出力するステップとを備えることを特徴とする。
本発明に係るコンピュータプログラムは、複数のデータを記憶する記憶手段と、入力された検索条件に対応するデータを前記記憶手段から検索する検索手段と、該検索手段が行った検索についてのログを記憶する検索ログ記憶手段と、前記記憶手段に記憶されたデータへのアクセスを行うアクセス手段と、該アクセス手段が行ったアクセスについてのログを記憶するアクセスログ記憶手段とを備えるコンピュータで実行されるコンピュータプログラムにおいて、前記コンピュータを、前記検索ログ記憶手段及び前記アクセスログ記憶手段のそれぞれに記憶されたログに基づいて、前記記憶手段に記憶されたデータそれぞれの利用度を算出する算出手段、該算出手段が算出した利用度に基づいて、前記記憶手段からデータを抽出する抽出手段、該抽出手段による抽出結果の要求を受け付ける受付手段、及び、該受付手段が要求を受け付けた場合、前記抽出結果を出力する出力手段として機能させることを特徴とする。
本発明に係る記録媒体は、本発明のコンピュータプログラムが記録されていることを特徴とする。
本発明においては、ユーザが指定した検索条件に基づいて行った検索についてのログと、記憶手段に記憶されたデータに対するアクセスについてのログとに基づいて、データ毎の利用度を算出する。そして、算出した利用度に基づいて、データを抽出し、出力する。即ち、ユーザは、自身が行った検索及びデータへのアクセスに基づいて抽出されたデータの抽出結果を取得できる。
本発明においては、データの検索頻度と、データへのアクセス頻度とから各データの利用度を算出する。これにより、ユーザの実使用に近い利用度を算出することが可能となる。
本発明においては、アクセス頻度を、データの閲覧頻度として、データの利用度を算出する。これにより、さらにユーザの実使用に近い利用度を算出することが可能となる。
本発明においては、検索頻度よりアクセス頻度に重みをおいて、利用度を算出することで、ユーザの実使用がより反映された利用度を算出することができる。
本発明により、複数のデータを、例えばデータの利用度が高いものだけに絞りこむことができ、または、利用度の高い順に並び変えることができることで、ユーザは、検索条件を指定しない場合であっても、絞り込まれたデータから所望のデータを見つけ易くなる。
以下、本発明に係るデータ検索装置の好適な実施の形態について図面を参照して説明する。本実施の形態では、本発明に係るデータ検索装置を、複数のPC(Personal Computer)とネットワークを介して接続されるサーバ装置として説明する。
図1は、本実施の形態に係るサーバ装置の構成を示すブロック図である。サーバ装置1は、図1に示すように、有線又は無線のネットワークを介して、ユーザが利用するPC10とデータ通信可能に接続されている。
本実施の形態に係るPC10は、文書が作成可能な、一般的なパーソナルコンピュータであり、特定のソフトウェアを実行することで、サーバ装置1へ作成した文書の送信が可能となる。サーバ装置1に送信された文書は、サーバ装置1で管理、保存される。また、PC10は、サーバ装置1に保存される複数の文書から、ユーザが入力したキーワードに対応する文書、例えば、内容又はタイトル等にキーワードを含む文書の検索を行うことができる。さらに、PC10は、サーバ装置1に保存される文書を閲覧し、図示しない印刷装置から文書を印刷し、又は文書のデータをダウンロードすることができる。
サーバ装置1は、CPU(Central Processing Unit)2、RAM(Random Access Memory)3、読取部4、PC10との接続を可能にする通信部5、及び記憶部6を備えており、それぞれがデータバス8を介して接続されている。
読取部4は、サーバ装置1を実現するための本発明に係るコンピュータプログラムが記録されたCD−ROM等の記録媒体7から、記録内容を読み込むためのCD−ROMドライブ等である。そして、読取部4により読み込まれたデータはRAM3に記録される。
記憶部6は、CPU2によりアクセスされるHDD(Hard Disk Drive)などの大容量記憶装置であり、記憶領域の一部に、文書データベース(文書DB)61、検索ログデータベース(検索ログDB)62、及びアクセスログデータベース(アクセスログDB)63の各種データベースを有している。
文書データベース61は、ユーザによりPC10で作成された様々な文書のデータを蓄積、保存する。文書データベース61は、各文書を、例えば作成日時又は文書のジャンル等、カテゴリ別に記憶する。なお、各文書は、スキャナにより原稿を読み取ることで作成されたものであってもよい。
検索ログデータベース62は、ユーザがPC10から、入力したキーワードに対応する文書の検索を行ったときの検索履歴を蓄積、保存する。図2は、検索ログデータベース62のデータ構造を模式的に示す図である。検索ログデータベース62は、図2に示すように、検索にヒットした文書のファイル名、PC10から検索を行ったユーザのユーザID、検索日時、キーワード、及びヒットランクを記録する。なお、ヒットランクとは、検索にヒットした際の順位である。例えば、図2の一列目は、9月18日9時10分に、「ユーザ1」のユーザIDを持つユーザが、「キーワード1」のキーワードで検索を行い、その際に、ファイル名「文書1」の文書が1番目にヒットしたことを表している。
アクセスログデータベース63は、ユーザがPC10から文書へのアクセスを行ったときのアクセス履歴を蓄積、保存する。ここでのアクセスとは、文書を閲覧し、印刷し、又はダウンロードすることを言う。図3は、アクセスログデータベース63のデータ構造を模式的に示す図である。アクセスログデータベース63は、図3に示すように、アクセスされた文書のファイル名、PC10からアクセスを行ったユーザのユーザID、アクセス日時、及び処理内容を記録する。処理内容は、閲覧、印刷及びダウンロード等、上述したアクセスの内容である。例えば、図3の一列目は、9月18日9時40分に、「ユーザ1」のユーザIDを持つユーザが、PC10から、ファイル名「文書1」の文書を閲覧したことを表している。
なお、検索履歴及びアクセス履歴は、検索ログデータベース62及びアクセスログデータベース63に所定期間T(例えば、180日間)保存される。具体的には、検索履歴及びアクセス履歴の記録が開始されてから所定期間T経過時に、検索ログデータベース62及びアクセスログデータベース63の記録内容がリセットされ、その後、新たに記録が開始される。
CPU2は、データバス8を介して上述したサーバ装置1の各部と接続されていて、記録媒体7から読み込みRAM3に格納されたプログラムに従って、種々のソフトウェア的機能を実行し、サーバ装置1の各部を制御する。例えば、CPU2は、文書データベース61から文書を検索する機能、各文書へのアクセスを行う機能、検索ログデータベース62から検索頻度を取得する機能、アクセスログデータベース63から閲覧頻度を取得する機能、検索頻度と閲覧頻度とから各文書の利用度を算出する機能、利用度に基づいて、文書データベース61に記憶される文書の文書リストを作成する機能、及び、作成した文書リストをPC10に送信する機能等を実行する。
検索頻度とは、各文書がPC10から検索された回数であり、ユーザ毎に取得される。例えば、ユーザID「ユーザ1」のユーザに係る文書1の検索頻度は、図2に示す検索ログデータベース62に、ユーザIDが「ユーザ1」として記憶される文書1の数から取得できる。また、閲覧頻度とは、各文書がPC10から閲覧された回数であり、ユーザ毎に取得される。例えば、ユーザID「ユーザ1」のユーザに係る文書1の閲覧頻度は、図3に示すアクセスログデータベース63に、ユーザIDが「ユーザ1」、かつ、処理内容が「閲覧」として記憶される文書1の数から取得できる。また、文書の利用度とは、各ユーザが、文書を検索又はアクセスした頻度である。さらに、文書リストとは、利用度に基づいて文書データベース61から抽出及びソートした文書のファイル名を一覧にしたものである。文書リストはPC10に送信され、PC10において表示される。表示された文書リストにより、ユーザは、例えば自身の利用度が高い順に並んだ文書を確認できる。
RAM3は、記録媒体7から読み込んだプログラム、及びCPU2が処理を行うために必要な情報を一時的に記憶する。例えば、RAM3には、CPU2が取得した検索頻度及び閲覧頻度、並びに、作成した文書リスト等が記憶される。なお、EPROM(Erasable and Programmable ROM)又はフラッシュメモリ等を設けて記憶するようにしてもよい。
次に、検索頻度及び閲覧頻度から文書毎の利用度を算出する算出方法について説明する。以下、利用度の算出方法の一例として、ユーザID「ユーザ1」のユーザに対する、ファイル名「文書1」の文書の利用度S(文書1:ユーザ1)を算出する方法について説明する。
利用度S(文書1:ユーザ1)は、式(1)で与えられる。
Figure 2009145953
式(1)において、VF及びVDは、閲覧頻度に関連した関数であり、SF及びSDは、検索頻度に関連した関数である。また、a、b、c、dは、重み付け係数であり、a、b>c、dとなるように設定されている。即ち、利用度における閲覧頻度の比重を検索頻度よりも高くして、利用度が算出されるようになっている。
VFは、全閲覧文書数に対する、閲覧された文書1の比率であり、式(2)で与えられる。
Figure 2009145953
式(2)において、文書1の閲覧頻度は、図3のアクセスログデータベース63に、ユーザIDが「ユーザ1」として記憶される文書1の数である。全閲覧文書数は、図3のアクセスログデータベース63に、ユーザIDが「ユーザ1」、かつ、処理内容が「閲覧」として記憶される全文書の数である。
VDは、文書1が閲覧された日から算出日までの経過日数によって算出される係数であり、式(3)で与えられる。
Figure 2009145953
式(3)において、算出日とは、利用度を算出する日である。所定日数とは、所定期間T(例えば、180日)の日数である。
SFは、全検索文書数に対する、検索された文書1の比率であり、式(4)で与えられる。
Figure 2009145953
式(4)において、文書1の検索頻度は、図2に示す検索ログデータベース62に、ユーザIDが「ユーザ1」として記憶される文書1の数である。全検索文書数は、図2の検索ログデータベース62において、ユーザIDが「ユーザ1」として記憶される全文書の数である。
SDは、文書1が検索された日から算出日までの経過日数によって算出される係数であり、式(5)で与えられる。
Figure 2009145953
検索頻度及び閲覧頻度は、検索履歴及びアクセス履歴に基づいて取得されるが、検索履歴及びアクセス履歴は所定期間T毎にリセットされる。従って、利用度は、常に最近の検索履歴及びアクセス履歴を考慮して算出されるため、ユーザの実使用を反映した値となる。
次に、以上のように構成されるサーバ装置1の動作について説明する。図4及び図5は、サーバ装置1の動作を示すフローチャートである。図4は、検索履歴及びアクセス履歴を作成する際の動作を示すフローチャートであり、図5は、文書の利用度を算出する際の動作を示すフローチャートである。CPU2は、記録媒体7から読み込みRAM3に格納されたプログラムを実行することで、各動作を開始する。各動作は、何れもCPU2により並行して実行される。
まず、図4のフローチャートについて説明する。CPU2は、PC10からのアクセスを受け付けたか否かを判定する(S1)。PC10からのアクセスを受け付けていない場合(S1:NO)、CPU2は、処理をS10に移す。PC10からのアクセスを受け付けた場合(S1:YES)、CPU2は、PC10から検索要求を受け付けたか否かを判定する(S2)。
PC10から検索要求を受け付けていない場合(S2:NO)、CPU2は、処理をS6に移す。PC10から検索要求を受け付けた場合(S2:YES)、CPU2は、検索処理を行い(S3)、検索ログデータベース62を更新する(S4)。具体的には、CPU2は、PC10において入力されたキーワードに対応する文書を文書データベース61から検索する。そして、検索にヒットした文書を抽出し、抽出結果をPC10に送信する。この場合、抽出した文書のファイル名又は文書が記憶された所在地(アドレス)等をPC10に送信する。また、検索終了後、検索にヒットした文書のファイル名、及び検索日時等を検索ログデータベース62に記録する。その後、CPU2は、検索回数を更新する(S5)。例えば、CPU2は、S3で検索処理が実行する都度、実行回数をインクリメントし、RAM3などに記憶する。
次に、CPU2は、PC10から文書データベース61に記憶される文書へのアクセス要求を受け付けたか否かを判定する(S6)。PC10からアクセス要求を受け付けていない場合(S6:NO)、CPU2は、処理をS10に移す。PC10からアクセス要求を受け付けた場合(S6:YES)、CPU2は、閲覧処理及び印刷処理等のアクセス処理を行い(S7)、アクセスログデータベース63を更新する(S8)。具体的には、CPU2は、PC10からのアクセス要求に従い、文書データベース61に記憶される文書に対して、閲覧処理、印刷処理、及びダウンロード処理等を実行する。そして、アクセス処理終了後、処理対象の文書のファイル名、アクセス日時、及び処理内容等をアクセスログデータベース63に記録する。
その後、CPU2は、アクセス回数を更新する(S9)。CPU2は、S7で検索処理が実行する都度、実行回数をインクリメントし、RAM3などに記憶する。CPU2は、アクセス処理の内容毎、即ち、閲覧処理、印刷処理及びダウンロード処理毎に実行した回数をカウントする。
次に、CPU2は、例えば図示しないタイマーICから時間を取得し(S10)、所定期間T経過したか否かを判定する(S11)。なお、この場合において、CPU2は、カレンダICから現在日を取得し、予め設定された所定日を経過したかを判定するようにしてもよい。
所定期間T経過していない場合(S11:NO)、CPU2は、処理をS13に移す。所定期間T経過している場合(S11:YES)、CPU2は、検索履歴、アクセス履歴、検索回数及びアクセス回数等の初期化を行う(S12)。その後、CPU2は、記録媒体7から読み込みRAM3に格納されたプログラムを終了するか否かを判定し(S13)、終了する場合(S13:YES)、CPU2は、図4の処理を終了する。プログラムを終了しない場合(S13:NO)、CPU2は、処理をS1に戻す。
次に、図5のフローチャートについて説明する。CPU2は、まず、RAM3などに記憶される検索回数を取得する(S20)。検索回数は、図4のS3で検索処理が実行される都度、実行回数がカウントされ、RAM3などに記憶される。検索回数が所定値以上であるか否かを判定する(S21)。なお、検索回数は、上述したように所定期間Tが経過する度にリセットされる。
検索回数が所定値以上である場合(S21:YES)、CPU2は、処理をS26に移す。検索回数が所定値以上でない場合(S21:NO)、CPU2は、RAM3などに記憶される閲覧回数を取得する(S22)。閲覧回数は、図4のS7でアクセス処理の一つである閲覧処理が実行される都度、実行回数がカウントされ、RAM3などに記憶される。そして、CPU2は、閲覧回数が所定値以上であるか否かを判定する(S23)。なお、S21及びS23における所定回数は、一つの値であってもよいし、複数の値であってもよい。具体的には、検索回数及び閲覧回数が、10回、20回、30回、、、のように各値を超えたことを判定するようにしてもよい。
閲覧回数が所定値以上である場合(S23:YES)、CPU2は、処理をS26に移す。所定値以上でない場合(S23:NO)、CPU2は、例えばタイマーICから経過時間を取得する(S24)。経過時間は、前回利用度を算出してからの経過時間(例えば、1日)である。そして、CPU2は、所定時間経過したか否かを判定する(S25)。所定時間経過していない場合(S25:NO)、CPU2は、処理をS33に移す。所定時間経過した場合(S25:YES)、CPU2は、処理をS26に移す。S26では、CPU2は、以降の処理で利用度を算出するため、前回利用度を算出してからの時間である経過時間をリセットする(S26)。
次に、CPU2は、検索ログデータベース62から各文書の検索頻度をユーザ毎に取得する(S27)。そして、CPU2は、アクセスログデータベース63から各文書の閲覧頻度をユーザ毎に取得する(S28)。その後、CPU2は、取得した検索頻度及び閲覧頻度から各文書の利用度を算出する(S29)。即ち、本実施の形態では、利用度は、ユーザからの指示を受けることなく、所定時間(例えば、1日)経過毎、所定回数以上の文書が検索される毎、及び、所定回数以上文書が閲覧される毎に算出される。
CPU2は、算出した利用度に基づいて、文書データベース61から文書を抽出し、ソートを行い、文書リストを作成する(S30)。例えば、CPU2は、利用度が高い順に文書を抽出することで、文書データベース61に記憶される文書は利用度が高い順にソートされる。そして、ソートされた文書のファイル名が一覧化された文書リストを作成する。なお、S29では、CPU2は、ユーザ毎に利用度を算出する。従って、文書リストは、ユーザ毎に作成される。
S30において、CPU2は、文書データベース61に記憶される全文書を利用度の順に抽出して文書リストを作成してもよいし、閾値以上の利用度に対応する文書のみを抽出して文書リストを作成してもよい。また、検索時のキーワード又は文書のジャンル等を考慮して、文書リストを作成してもよい。例えば、検索時に最も頻度の高いキーワード又はヒットランクが高いキーワードで検索を行った場合の利用度に基づいて、文書リストを作成してもよい。この場合、ユーザは、自身が頻繁に入力したキーワード及びそのキーワードで検索にヒットした文書の一覧を把握できるようになる。
次に、CPU2は、PC10から文書リストが要求されたか否かを判定する(S31)。要求されていなければ(S31:NO)、CPU2は、処理をS33に移す。文書リストが要求された場合(S31:YES)、CPU2は、要求したユーザのユーザIDと一致する文書リストをPC10に送信する(S32)。これにより、ユーザは、キーワードを入力し、文書の検索を行わなくても、文書リストを要求することで、自身がよく検索又はアクセスする順に文書がソートされた文書リストを取得でき、所望の文書を見つけ易くなる。
そして、CPU2は、記録媒体7から読み込みRAM3に格納されたプログラムを終了するか否かを判定し(S33)、終了する場合(S33:YES)、CPU2は、図5に示す処理を終了する。プログラムを終了しない場合(S33:NO)、CPU2は、処理をS20に戻す。
次に、文書リストを受信したPC10における、文書リストの表示態様について説明する。図6及び図7は、PC10における文書リストの表示態様の一例を模式的に示す図である。
文書リストを受信したPC10では、文書リスト全体が表示されてもよく、文書リストがカテゴリ別に分類された場合、図6に示すように、カテゴリ毎に表示してもよい。また、図7に示すように、記憶部6における文書のデータの格納場所とリンクされるフォルダをツリー構造で表示し、ファイルが格納されているフォルダの色を変えて表示し、フォルダをクリックして所望のデータにアクセスできるようにしてもよい。
以上説明したように、本実施の形態のサーバ装置1は、ユーザ毎に、文書の検索頻度及び閲覧頻度を取得し、検索頻度及び閲覧頻度に基づいて利用度を算出する。そして、利用度から文書リストを作成し、ユーザに提示する。これにより、ユーザは、自身の文書の利用度が高い順に、サーバ装置1に保存される文書を確認でき、その結果、所望の文書が見つけ易くなる場合がある。
なお、本実施の形態では、ユーザ毎に利用度を算出しているが、ユーザ毎に利用度を算出し、その後、さらに全ユーザを考慮して利用度を算出する構成であってもよい。例えば、全ユーザを考慮した場合の、ユーザID「ユーザ1」のユーザに対する、ファイル名「文書1」の文書の利用度は、式(6)で与えられる。
Figure 2009145953
式(6)において、sum(S(文書1:他ユーザ))は、ユーザID「ユーザ1」のユーザ以外の利用度を加算した係数である。また、u1,u2は、重み付け係数であり、u1<u2となるように設定されている。即ち、ユーザ1の利用度の比重が、他のユーザよりも低くなるように、利用度が算出されるようになっている。この場合、ユーザは、自分以外のユーザの利用度が高い文書を確認できる。
また、利用度を算出する方法は、本実施の形態で述べた方法に限定されることはなく文書の閲覧頻度及び検索頻度以外のパラメータを考慮して、利用度を算出するようにしてもよい。さらに、文書へのアクセスとして、PC10による文書の閲覧、印刷及びダウンロードとしているが、これに限定されることはない。
本発明は、上述のサーバ装置1の他、パーソナルコンピュータの動作をデータ検索装置として擬似的に実行するようなコンピュータプログラムにおいても、本発明を適用して実行することができる。その場合、コンピュータプログラムを記録する記録媒体は、DVD−ROM、CD−ROM、FD(フレキシブルディスク)、その他任意の記録媒体を利用できる。これら記録媒体は、コンピュータシステムに備えられるプログラム読み取り装置により読み取られることで上述した処理が実行される。
本実施の形態では、この記録媒体としては、マイクロコンピュータで処理が行われるために図示していないメモリ、例えばROMそのものがプログラムメディアであってもよいし、また、図示していないが外部記憶装置としてプログラム読み取り装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであってもよい。何れの場合においても、格納されているプログラムはマイクロプロセッサがアクセスして実行させる構成であってもよいし、あるいは、プログラムコードを読み出し、読み出されたプログラムコードは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのプログラムコードが実行される方式であってもよい。このダウンロード用のプログラムは予め本体装置に格納されているものとする。
また、本実施の形態においては、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムコードをダウンロードするように流動的にプログラムを担持する媒体であってもよい。なお、このように通信ネットワークからプログラムコードをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであってもよい。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
以上、本発明の好適な一実施の形態について、具体的に説明したが、各構成及び動作等は適宜変更可能であって、上述の実施の形態に限定されることはない。
本実施の形態に係るサーバ装置の構成を示すブロック図である。 検索ログデータベースのデータ構造を模式的に示す図である。 アクセスログデータベースのデータ構造を模式的に示す図である。 サーバ装置の動作を示すフローチャートである。 サーバ装置の動作を示すフローチャートである。 PCにおける文書リストの表示態様の一例を模式的に示す図である。 PCにおける文書リストの表示態様の一例を模式的に示す図である。
符号の説明
1 サーバ装置
2 CPU
3 RAM
4 読取部
5 通信部
6 記憶部
7 記録媒体
10 PC
61 文書データベース
62 検索ログデータベース
63 アクセスログデータベース

Claims (7)

  1. 複数のデータを記憶する記憶手段と、入力された検索条件に対応するデータを前記記憶手段から検索する検索手段と、該検索手段が行った検索についてのログを記憶する検索ログ記憶手段と、前記記憶手段に記憶されたデータへのアクセスを行うアクセス手段と、該アクセス手段が行ったアクセスについてのログを記憶するアクセスログ記憶手段とを備えるデータ検索装置において、
    前記検索ログ記憶手段及び前記アクセスログ記憶手段のそれぞれに記憶されたログに基づいて、前記記憶手段に記憶されたデータそれぞれの利用度を算出する算出手段と、
    該算出手段が算出した利用度に基づいて、前記記憶手段からデータを抽出する抽出手段と、
    該抽出手段による抽出結果の要求を受け付ける受付手段と、
    該受付手段が要求を受け付けた場合、前記抽出結果を出力する出力手段と
    を備えることを特徴とするデータ検索装置。
  2. 前記算出手段は、
    前記検索ログ記憶手段に記憶されたログから、前記検索手段が行った検索の検索頻度を取得する検索頻度取得手段と、
    前記アクセスログ記憶手段に記憶されたログから、前記アクセス手段が行ったアクセスのアクセス頻度を取得するアクセス頻度取得手段と
    を有し、
    前記検索頻度取得手段が取得した検索頻度、及び前記アクセス頻度取得手段が取得したアクセス頻度に基づいて利用度を算出する構成としてある
    ことを特徴とする請求項1に記載のデータ検索装置。
  3. 前記アクセス手段は、
    前記記憶手段に記憶されたデータを閲覧可能にする構成としてあり、
    前記アクセス頻度は、
    前記アクセス手段が前記記憶手段に記憶されたデータを閲覧可能とした閲覧頻度であることを特徴とする請求項2に記載のデータ検索装置。
  4. 前記算出手段は、
    前記検索頻度及び前記アクセス頻度に基づいて利用度を算出する際に、前記アクセス頻度の比重を前記検索頻度よりも大きくして、前記利用度を算出する構成としてある
    ことを特徴とする請求項2又は3に記載のデータ検索装置。
  5. 複数のデータを記憶する記憶手段と、入力された検索条件に対応するデータを前記記憶手段から検索する検索手段と、該検索手段が行った検索についてのログを記憶する検索ログ記憶手段と、前記記憶手段に記憶されたデータへのアクセスを行うアクセス手段と、該アクセス手段が行ったアクセスについてのログを記憶するアクセスログ記憶手段とを備えるデータ検索装置で行うデータ検索方法において、
    前記検索ログ記憶手段及び前記アクセスログ記憶手段のそれぞれに記憶されたログに基づいて、前記記憶手段に記憶されたデータそれぞれの利用度を算出するステップと、
    算出した利用度に基づいて、前記記憶手段からデータを抽出するステップと、
    抽出結果の要求を受け付けるステップと、
    前記要求を受け付けた場合、前記抽出結果を出力するステップと
    を備えることを特徴とするデータ検索方法。
  6. 複数のデータを記憶する記憶手段と、入力された検索条件に対応するデータを前記記憶手段から検索する検索手段と、該検索手段が行った検索についてのログを記憶する検索ログ記憶手段と、前記記憶手段に記憶されたデータへのアクセスを行うアクセス手段と、該アクセス手段が行ったアクセスについてのログを記憶するアクセスログ記憶手段とを備えるコンピュータで実行されるコンピュータプログラムにおいて、
    前記コンピュータを、
    前記検索ログ記憶手段及び前記アクセスログ記憶手段のそれぞれに記憶されたログに基づいて、前記記憶手段に記憶されたデータそれぞれの利用度を算出する算出手段、
    該算出手段が算出した利用度に基づいて、前記記憶手段からデータを抽出する抽出手段、
    該抽出手段による抽出結果の要求を受け付ける受付手段、及び、
    該受付手段が要求を受け付けた場合、前記抽出結果を出力する出力手段
    として機能させることを特徴とするコンピュータプログラム。
  7. 請求項6に記載のコンピュータプログラムが記録されていることを特徴とするコンピュータでの読取り可能な記録媒体。
JP2007319550A 2007-12-11 2007-12-11 データ検索装置、データ検索方法、コンピュータプログラム、及び記録媒体 Pending JP2009145953A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007319550A JP2009145953A (ja) 2007-12-11 2007-12-11 データ検索装置、データ検索方法、コンピュータプログラム、及び記録媒体
US12/324,712 US20090150390A1 (en) 2007-12-11 2008-11-26 Data retrieving apparatus, data retrieving method and recording medium
CN2008101851091A CN101458701B (zh) 2007-12-11 2008-12-09 数据检索装置以及数据检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007319550A JP2009145953A (ja) 2007-12-11 2007-12-11 データ検索装置、データ検索方法、コンピュータプログラム、及び記録媒体

Publications (1)

Publication Number Publication Date
JP2009145953A true JP2009145953A (ja) 2009-07-02

Family

ID=40722704

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007319550A Pending JP2009145953A (ja) 2007-12-11 2007-12-11 データ検索装置、データ検索方法、コンピュータプログラム、及び記録媒体

Country Status (3)

Country Link
US (1) US20090150390A1 (ja)
JP (1) JP2009145953A (ja)
CN (1) CN101458701B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012003423A (ja) * 2010-06-15 2012-01-05 Ntt Docomo Inc 情報処理装置及びダウンロード制御方法
JP2012003422A (ja) * 2010-06-15 2012-01-05 Ntt Docomo Inc 情報処理装置及び検索条件提示方法
JP2014505945A (ja) * 2011-01-14 2014-03-06 アリババ・グループ・ホールディング・リミテッド 検索情報の提供

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10296520B1 (en) * 2013-07-24 2019-05-21 Veritas Technologies Llc Social network analysis of file access information
US20150205799A1 (en) * 2013-12-05 2015-07-23 Lenovo (Singapore) Pte. Ltd. Determining trends for a user using contextual data
JP6323187B2 (ja) * 2014-06-06 2018-05-16 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7124129B2 (en) * 1998-03-03 2006-10-17 A9.Com, Inc. Identifying the items most relevant to a current query based on items selected in connection with similar queries
US7346839B2 (en) * 2003-09-30 2008-03-18 Google Inc. Information retrieval based on historical data
US7698270B2 (en) * 2004-12-29 2010-04-13 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
US7546294B2 (en) * 2005-03-31 2009-06-09 Microsoft Corporation Automated relevance tuning
JP2006323629A (ja) * 2005-05-19 2006-11-30 Kan:Kk ウェブサーバのページ更新のための情報を解析するサーバ、ウェブサーバ及びページ更新方法
US8266117B2 (en) * 2005-07-11 2012-09-11 Fujitsu Limited Method and apparatus for tracing data in audit trail, and computer product
JP4908094B2 (ja) * 2005-09-30 2012-04-04 株式会社リコー 情報処理システム、情報処理方法及び情報処理プログラム
US8418054B2 (en) * 2006-03-31 2013-04-09 Nec Corporation Web content read information display device, method, and program
US8095602B1 (en) * 2006-05-30 2012-01-10 Avaya Inc. Spam whitelisting for recent sites
CN100456298C (zh) * 2006-07-12 2009-01-28 百度在线网络技术(北京)有限公司 广告信息检索系统及广告信息检索方法
US20090037402A1 (en) * 2007-07-31 2009-02-05 Rosie Jones System and method for predicting clickthrough rates and relevance

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012003423A (ja) * 2010-06-15 2012-01-05 Ntt Docomo Inc 情報処理装置及びダウンロード制御方法
JP2012003422A (ja) * 2010-06-15 2012-01-05 Ntt Docomo Inc 情報処理装置及び検索条件提示方法
JP2014505945A (ja) * 2011-01-14 2014-03-06 アリババ・グループ・ホールディング・リミテッド 検索情報の提供

Also Published As

Publication number Publication date
CN101458701B (zh) 2012-07-18
CN101458701A (zh) 2009-06-17
US20090150390A1 (en) 2009-06-11

Similar Documents

Publication Publication Date Title
JP4832061B2 (ja) コンテンツ収集装置およびコンテンツ収集システム
JP2004126840A (ja) 文書検索方法、プログラムおよびシステム
US20070239692A1 (en) Logo or image based search engine for presenting search results
JP2009145953A (ja) データ検索装置、データ検索方法、コンピュータプログラム、及び記録媒体
JP2008003721A (ja) 情報検索システムおよび情報検索方法およびプログラムおよび記録媒体
JP2011154467A (ja) 検索結果順位付け方法および検索結果順位付けシステム
JP2011191862A (ja) ファイル管理装置、ファイル管理システム、およびファイル管理プログラム
JP5228584B2 (ja) 興味情報特定システム、興味情報特定方法、および興味情報特定用プログラム
JP2009265754A (ja) 情報提供装置、情報提供方法及び情報提供プログラム
JP4344596B2 (ja) コンテンツ検索システム、コンテンツ検索プログラムおよび記録媒体
CN109446417B (zh) 一种智能化检索方法和装置
WO2010061990A1 (en) Web page searching system and method using access time and frequency
JP5579140B2 (ja) 文書検索装置及び方法及びプログラム
JP5151368B2 (ja) 情報処理装置および情報処理プログラム
JP2011175453A (ja) キーワード検索システム
JP5407336B2 (ja) 情報処理装置
JP2011053996A (ja) Webブラウザ選択方法および装置
JP4751430B2 (ja) 最新情報提供方法及びそのシステム
JP2010086210A (ja) 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ
JP2010128675A (ja) 検索装置
KR100371805B1 (ko) 관련 웹 사이트 제공 방법 및 시스템
JP2009217741A (ja) メタデータ付与方法及び装置、並びにメタデータ付与プログラム
JP2009146013A (ja) コンテンツ検索方法及び装置並びにプログラム
JP4859891B2 (ja) コンテンツに関連する情報を提供するサーバ、システム及び方法
JP2006309559A (ja) ブックマーク機能を備えたwebブラウザ、ブックマーク管理方法、ブックマーク管理プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090915

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091029

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100202