JP4509918B2 - Information retrieval method and apparatus, and computer-readable recording medium - Google Patents

Information retrieval method and apparatus, and computer-readable recording medium Download PDF

Info

Publication number
JP4509918B2
JP4509918B2 JP2005340987A JP2005340987A JP4509918B2 JP 4509918 B2 JP4509918 B2 JP 4509918B2 JP 2005340987 A JP2005340987 A JP 2005340987A JP 2005340987 A JP2005340987 A JP 2005340987A JP 4509918 B2 JP4509918 B2 JP 4509918B2
Authority
JP
Japan
Prior art keywords
file
information
score
search
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005340987A
Other languages
Japanese (ja)
Other versions
JP2007148688A (en
Inventor
哲之 森田
泰久 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005340987A priority Critical patent/JP4509918B2/en
Publication of JP2007148688A publication Critical patent/JP2007148688A/en
Application granted granted Critical
Publication of JP4509918B2 publication Critical patent/JP4509918B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報検索方法及び装置及びコンピュータ読み取り可能な記録媒体に係り、特に、利用者の操作履歴情報を管理し、利用者が過去に閲覧した情報を容易に検索することが可能な情報検索方法及び装置及びコンピュータ読み取り可能な記録媒体に関する。   The present invention relates to an information search method and apparatus and a computer-readable recording medium, and in particular, information search capable of managing user operation history information and easily searching for information browsed by the user in the past. The present invention relates to a method and apparatus and a computer-readable recording medium.

従来、利用者の操作履歴を検索する方法としては、利用者端末の詳細な操作履歴を収集し、利用者が過去に閲覧したファイル毎に、利用者が経験した強さを示す経験スコアを算出し、利用者が過去に閲覧したファイルの中から重要なファイルを簡単に探し出す方法がある(例えば、特許文献1参照)。   Conventionally, as a method of searching for user operation history, a detailed operation history of the user terminal is collected, and an empirical score indicating the strength experienced by the user is calculated for each file browsed by the user in the past. In addition, there is a method of easily searching for an important file among files browsed by the user in the past (see, for example, Patent Document 1).

また、利用者が過去に閲覧したファイルの検索結果と、インターネット上のファイルの検索結果を分けて表示するツールが公開されている。
特開2005−174138号公報「コンテンツ検索方法及びシステム、プログラムおよびプログラム記録媒体」
In addition, a tool for displaying a search result of a file browsed by a user in the past and a search result of a file on the Internet is disclosed.
JP 2005-174138 A “Content Search Method and System, Program, and Program Recording Medium”

利用者が、“ある事柄についての情報”を得たいと考えており、Google(登録商標)やgoo(登録商標)を用いて検索した場合、検索結果が何百件、何千件とあり、全ての検索結果を確認できないことがある。具体的には、Google(登録商標)やgoo(登録商標)では独自のランキング方法により、検索キーワードへの適合度準に表示する。ランキングは固定的である。   When a user wants to obtain “information about a certain matter” and searches using Google (registered trademark) or goo (registered trademark), there are hundreds or thousands of search results. Not all search results can be confirmed. Specifically, Google (registered trademark) and goo (registered trademark) display in the degree of suitability to the search keyword by a unique ranking method. Ranking is fixed.

しかし、過去に見たWebページの方が利用者にとって有効である場合がある。例えば、過去に見たことがあるWebページは、“ある事柄についての情報”を理解することは、過去に見たことがないWebページに比べて容易である。どんな情報がどこに書いてあるのかをある程度推測できるため、短時間で該Webページ中の“ある事柄についての情報”に辿り着き、ポイントを抑えて、“ある事柄についての情報”を理解できる。そして、過去に利用者が経験した度合いが強いほど、利用者が短時間で理解できる可能性が高い。   However, Web pages viewed in the past may be more effective for the user. For example, a Web page that has been viewed in the past is easier to understand “information about a certain matter” than a Web page that has not been viewed in the past. Since it is possible to guess to some extent what information is written, it is possible to reach “information about a certain matter” in the Web page in a short time, and to understand “information about a certain matter” by suppressing points. And the stronger the degree that the user has experienced in the past, the higher the possibility that the user can understand in a short time.

そして、既存の技術では、過去にみたことがあるページの中から、わずかな操作履歴を利用して検索し、検索結果を表示するか、あるいは、過去に見たことがあるかないかに関わらず検索するが過去に見たページであることを考慮せず検索結果を表示している。つまり、利用者が経験した強さを示す経験スコアを十分に算出できない。   And with existing technology, search from a page you've seen in the past, using a small amount of operation history, and display the search results, or search regardless of whether you've seen it in the past However, the search results are displayed without considering that the page has been viewed in the past. In other words, an experience score indicating the strength experienced by the user cannot be calculated sufficiently.

また、従来の方法では、また、利用者が過去に閲覧したファイルの検索結果と、インターネット上のファイルの検索結果を分けて表示するため、インターネット上の検索結果が示す個々のファイルが、過去に閲覧したファイルとどれだけ関係しているのかがわからない。   Also, in the conventional method, since the search result of the file browsed by the user in the past and the search result of the file on the Internet are displayed separately, each file indicated by the search result on the Internet is displayed in the past. I don't know how related to the file I browsed.

本発明は、上記の点に鑑みなされたもので、再度閲覧することに価値があると思われる過去に強く経験した情報を容易に検索することができる情報検索方法及び装置及びコンピュータ読み取り可能な記録媒体を提供することである。   The present invention has been made in view of the above points, an information search method and apparatus, and a computer-readable record capable of easily searching for information that has been strongly experienced in the past that seems to be valuable for browsing again. To provide a medium.

図1は、本発明の原理を説明するための図である。   FIG. 1 is a diagram for explaining the principle of the present invention.

本発明(請求項1)は、操作履歴情報を検索する情報検索方法であって、
要求元から検索要求を受け取ると、ファイル検索手段が、該検索要求に基づいて、該検索要求に適合する利用者が過去に閲覧した情報本体(ファイル)を検索するファイル検索ステップ(ステップ1)と、
スコア算出手段が、ファイルの格納場所情報に基づいて、ファイル毎に検索要求への適合度を表すファイル適合スコア、または、操作履歴データベースの操作履歴情報を用いて前記利用者が経験した強さを前記PC上で動作させたファイル毎に表す経験スコアを算出し、該ファイル適合スコアと該経験スコアを統合した統合スコアを算出するスコア算出ステップ(ステップ2)と、
類似度算出手段が、前記利用者が閲覧していないファイルを含む任意の範囲の情報を母集団として検索した結果のファイルと、過去に閲覧したファイルとの類似度を求める類似度算出ステップ(ステップ3,4)と、
検索管理手段が、前記類似度と前記統合スコアから求めた表示優先度に基づいて、検索結果を出力する出力ステップ(ステップ5,6)と、を行う。
と、を行う。
The present invention (Claim 1) is an information retrieval method for retrieving operation history information,
When a search request is received from the request source, a file search step (step 1) in which the file search means searches for an information body (file) browsed in the past by a user who matches the search request based on the search request. ,
Based on the storage location information of the file, the score calculation means indicates the strength that the user has experienced using the file suitability score indicating the degree of suitability for the search request for each file or the operation history information in the operation history database. A score calculation step (step 2) for calculating an experience score represented for each file operated on the PC, and calculating an integrated score obtained by integrating the file fitness score and the experience score;
Similarity calculation means for calculating a similarity between a file obtained as a result of searching an arbitrary range of information including files not browsed by the user and a file browsed in the past (step 3, 4)
The search management means performs an output step (steps 5 and 6) for outputting a search result based on the display priority obtained from the similarity and the integrated score.
And do.

また、本発明(請求項2)は、要求元から、検索要求へのファイル適合スコア、経験スコア及び統合スコアを計算する方法を指定する識別子を受け取るステップと、
スコア算出ステップにおいて、
識別子に応じて、検索要求へのファイル適合スコア、経験スコア及び統合スコアの計算方法を変更し、該ファイル適合スコア、該経験スコア及び該統合スコアの計算を行うステップと、を行う。
The present invention (Claim 2) receives, from the requester, an identifier that specifies a method for calculating a file suitability score, an experience score, and an integrated score for a search request;
In the score calculation step,
According to the identifier, the method of calculating the file suitability score, the experience score, and the integrated score for the search request is changed, and the file suitability score, the experience score, and the integrated score are calculated.

また、本発明(請求項3)は、要求元から、類似度と統合スコアから表示優先度を算出する方法を指定する表示優先度調整情報を受け取るステップと、
表示優先度調整情報を利用して表示優先度を算出するステップと、を行う。
Further, the present invention (Claim 3) receives, from the request source, display priority adjustment information that specifies a method for calculating the display priority from the similarity and the integrated score;
Calculating display priority using display priority adjustment information.

また、本発明(請求項4)は、操作履歴取得手段が、
PC上のメッセージ電文及び、該PC上で作動しているプログラムとの通信を利用して、利用者のPCを操作した履歴を取得するステップと、
利用者のPCを操作した履歴から、該利用者が閲覧した情報を特定する識別子を取得するステップと、
利用者が閲覧した情報を特定する識別子に基づいて、該利用者が過去に閲覧した情報本体を取得し、ファイルとして操作履歴データベースに保存するステップと、
情報本体の属性情報を取得し、ファイル属性情報としてファイル属性情報データベースに保存するステップと、を行う。
In the present invention (Claim 4), the operation history acquisition means includes:
Using a message message on a PC and communication with a program operating on the PC to obtain a history of operating the user's PC;
Obtaining an identifier for identifying information viewed by the user from a history of operating the user's PC;
Based on an identifier for identifying information browsed by the user, obtaining the information body browsed in the past by the user, and storing it in the operation history database as a file;
Acquiring attribute information of the information body and storing it in the file attribute information database as file attribute information.

図2は、本発明の原理構成図である。   FIG. 2 is a principle configuration diagram of the present invention.

本発明(請求項5)は、操作履歴情報を検索する情報検索装置であって、
利用者のパーソナルコンピュータ(PC)を操作した履歴である操作履歴情報を操作履歴データベース109と、
要求元から取得した検索要求に基づいて、該検索要求に適合する利用者が過去に閲覧した情報本体(ファイル)を検索するファイル検索手段103と、
ファイルの格納場所情報に基づいて、ファイル毎に検索要求への適合度を表すファイル適合スコア、または、操作履歴データベース109の操作履歴情報を用いて利用者が経験した強さをPC上で動作させたファイル毎に表す経験スコアを算出し、該ファイル適合スコアと該経験スコアを統合した統合スコアを算出するスコア算出手段112と、
利用者が閲覧していないファイルを含む任意の範囲の情報を母集団として検索した結果のファイルと、過去に閲覧したファイルとの類似度を求める類似度算出手段107と、
類似度と統合スコアから求めた表示優先度に基づいて、検索結果を出力する出力手段102と、を有する。
The present invention (Claim 5) is an information retrieval apparatus for retrieving operation history information,
The operation history database 109 includes operation history information which is a history of operating a user's personal computer (PC),
Based on a search request acquired from a request source, a file search means 103 for searching an information body (file) browsed in the past by a user who matches the search request;
Based on the storage location information of the file, the file conformity score indicating the degree of conformity to the search request for each file or the strength experienced by the user using the operation history information of the operation history database 109 is operated on the PC. A score calculation unit 112 that calculates an experience score represented for each file and calculates an integrated score obtained by integrating the file suitability score and the experience score;
A similarity calculation means 107 for obtaining a similarity between a file as a result of searching information in an arbitrary range including a file that is not browsed by a user and a file browsed in the past;
Output means 102 for outputting a search result based on the display priority obtained from the similarity and the integrated score.

本発明(請求項6)は、コンピュータに、
請求項1乃至4記載の情報検索方法の各ステップを実行させる情報検索プログラムを格納したコンピュータ読み取り可能な記録媒体である。
The present invention (Claim 6) provides a computer with:
A computer-readable recording medium storing an information search program for executing each step of the information search method according to claim 1.

上記のように本発明によれば、インターネット上の情報を検索するとき、検索結果に示される個々のファイルに対して、過去に経験した強さを考慮しながら、関連する過去に見たことがあるWebページを表示することができる。過去により強く経験したファイルは、過去に行っていた行動を代表的に示すファイルである可能性が高いと考えられるため、例えば、サムネイルを一瞬見るだけで過去に行っていた行為をより短時間に思い出すことも可能となる。また、過去に強く経験した情報は、再度閲覧した場合に、過去に弱く(例えば、短い時間だけ)経験した情報に比べて、比較的短時間で情報の内容が取得できると思われる。本発明により、再度閲覧することに価値があると思われる過去に強く経験した情報を容易に検索することができる。   As described above, according to the present invention, when searching for information on the Internet, the individual files shown in the search results are viewed in the past in consideration of the strength experienced in the past. A certain web page can be displayed. Files that have been experienced more strongly in the past are more likely to be representative files of actions that have been taken in the past. You can also remember. In addition, information that has been strongly experienced in the past can be acquired in a relatively short time when viewed again, compared to information that has been weakly experienced in the past (for example, only for a short time). According to the present invention, it is possible to easily search for information that has been strongly experienced in the past that is considered worthwhile to be browsed again.

また、インターネット上の検索結果の内容やURLに類似した過去に閲覧したファイルを容易に発見することができる。   Further, it is possible to easily find a file browsed in the past similar to the contents of search results on the Internet and URLs.

また、内容やURLの類似性と、過去に経験した強さのどちらを優先して、過去に閲覧したファイルを表示するかを、利用者が簡単に指定することができる。   In addition, the user can easily specify which of the similarities between contents and URL and the strength experienced in the past is prioritized to display a file browsed in the past.

以下、図面と共に本発明の実施の形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図3は、本発明の一実施の形態における検索装置の構成を示す。   FIG. 3 shows a configuration of the search device according to the embodiment of the present invention.

同図に示す検索装置100は、情報検索端末(IE)200、外部検索エンジン(goo(登録商標))300、Webサーバ400と接続されている。   A search device 100 shown in the figure is connected to an information search terminal (IE) 200, an external search engine (goo (registered trademark)) 300, and a Web server 400.

検索装置100は、情報検索端末200からの検索要求に基づいて、インターネットの上の検索結果の個々のファイルに対して、関係のある過去に閲覧したファイルを付加して提示する。   Based on a search request from the information search terminal 200, the search device 100 adds and presents a file that has been viewed in the past to each file of the search result on the Internet.

検索装置100は、操作履歴取得部101、検索管理部102、ファイル検索部103、経験スコア算出部104、統合スコア算出部105、全ページ検索部106、類似度算出部107、表示優先度算出部108、操作履歴DB(データベース)109、ファイル属性情報DB(データベース)110、過去操作ファイル蓄積部111から構成される。   The search device 100 includes an operation history acquisition unit 101, a search management unit 102, a file search unit 103, an experience score calculation unit 104, an integrated score calculation unit 105, an all page search unit 106, a similarity calculation unit 107, and a display priority calculation unit. 108, an operation history DB (database) 109, a file attribute information DB (database) 110, and a past operation file storage unit 111.

操作履歴取得部101は、PC上のメッセージ電文及び、PC上で作動しているプログラムとの通信を利用して、利用者のPCを操作した履歴を取得して、当該利用者のPCを操作した履歴から、該利用者が閲覧した情報を特定する識別子を取得し、利用者が閲覧した情報を特定する識別子に基づいて、該利用者が過去に閲覧した情報本体を取得し、ファイルとして操作履歴データベース109に保存する。また、操作履歴取得部101は、情報本体の属性情報を取得し、ファイル属性情報としてファイル属性情報DB110に保存する。   The operation history acquisition unit 101 uses a message message on a PC and communication with a program operating on the PC to acquire a history of operating the user's PC and operate the user's PC. An identifier for identifying information browsed by the user is acquired from the recorded history, and based on an identifier for identifying information browsed by the user, an information body browsed in the past by the user is acquired and operated as a file. Save in the history database 109. Further, the operation history acquisition unit 101 acquires attribute information of the information main body and stores it in the file attribute information DB 110 as file attribute information.

検索管理部102は、情報検索端末200より以下の情報を取得する。
・検索要求(検索キーワード);
・検索要求へのファイル適合スコアを計算する方法を指定する識別子;
・検索要求への統合スコアを計算する方法を指定する識別子;
・検索要求への経験スコアを計算する方法を指定する識別子;
・類似度と統合スコアから表示優先度を算出する方法を指定する表示優先度調整情報;
検索要求及び、検索要求へのファイル適合スコアを計算する方法を指定する識別子をファイル検索部103に転送する。また、検索要求への経験スコアを計算する方法を指定する識別子を経験スコア算出部104に転送する。また、検索要求への統合スコアを計算する方法を指定する識別子を統合スコア算出部105に転送する。さらに、類似度と統合スコアから表示優先度を算出する方法を指定する表示優先度調整情報を表示優先度算出部108に転送する。また、検索要求を全ページ検索部106に転送する。
The search management unit 102 acquires the following information from the information search terminal 200.
・ Search request (search keyword);
An identifier that specifies how to calculate the file suitability score for a search request;
An identifier that specifies how to calculate the integrated score for the search request;
An identifier that specifies how to calculate the experience score for a search request;
Display priority adjustment information for specifying a method for calculating the display priority from the similarity and the integrated score;
The search request and an identifier for designating a method for calculating the file suitability score for the search request are transferred to the file search unit 103. In addition, an identifier that specifies a method for calculating the experience score for the search request is transferred to the experience score calculation unit 104. In addition, an identifier that specifies a method for calculating the integrated score for the search request is transferred to the integrated score calculation unit 105. Further, display priority adjustment information for specifying a method for calculating the display priority from the similarity and the integrated score is transferred to the display priority calculation unit 108. Further, the search request is transferred to the all page search unit 106.

また、検索管理部102は、各構成要素とやり取りを行い、総合スコア算出部105から取得した利用者が閲覧していないファイルを含む任意の範囲の情報を母集団として検索した結果に、表示優先度算出部108から取得した表示優先度が高い過去に閲覧したファイルを関連付けて表示するための検索結果表示ファイルを作成し、それを検索要求元の情報検索端末200に送信する。   In addition, the search management unit 102 interacts with each component, and display priority is given to a result obtained by searching information in an arbitrary range including files that are not viewed by the user acquired from the total score calculation unit 105 as a population. A search result display file for associating and displaying a file browsed in the past with a high display priority acquired from the degree calculation unit 108 is created and transmitted to the information search terminal 200 of the search request source.

ファイル検索部103は、要求元からの検索要求に基づいて、利用者が過去に閲覧した情報本体(ファイル)の格納場所情報を操作履歴データベース109より取得し、格納場所情報に基づいて、利用者が過去に閲覧したファイルを、過去操作ファイル蓄積部111の該ファイル内の文章及びファイル属性によって検索する。また、情報検索端末200から取得した検索要求へのファイル適合スコアを計算する方法を指定する識別子に基づいて、ファイル毎に適合度を表すファイル適合スコアを算出し、メモリ(図示せず)に格納する。   Based on the search request from the request source, the file search unit 103 acquires storage location information of the information body (file) browsed in the past by the user from the operation history database 109, and based on the storage location information, the user The file browsed in the past is searched by the text and file attributes in the file of the past operation file storage unit 111. Further, based on an identifier that specifies a method for calculating the file suitability score for the search request acquired from the information search terminal 200, a file suitability score representing the suitability for each file is calculated and stored in a memory (not shown). To do.

経験スコア算出部104は、検索管理部102を介して取得した、検索要求への経験スコアを計算する方法を指定する識別子に基づいて、操作履歴データベース109の操作履歴情報より、利用者が経験した強さをPC上で動作させたファイル毎に表す経験スコアを算出し、メモリ(図示せず)に格納する。   The experience score calculation unit 104 experienced from the operation history information in the operation history database 109 based on the identifier that is obtained through the search management unit 102 and specifies the method for calculating the experience score for the search request. An experience score representing the strength for each file operated on the PC is calculated and stored in a memory (not shown).

統合スコア算出部105は、検索管理部102を介して取得した検索要求への統合スコアを計算する方法を指定する識別子に基づいて、操作履歴情報を利用して、ファイル検索部103のメモリ(図示せず)に格納されているファイル毎のファイル適合スコアと、経験スコア算出部103のメモリ(図示せず)に格納されているファイル毎の経験スコアを統合した統合スコアを算出し、メモリ(図示せず)に格納する。   The integrated score calculation unit 105 uses the operation history information on the basis of an identifier that specifies a method for calculating the integrated score for the search request acquired via the search management unit 102 (see FIG. An integrated score is calculated by integrating the file fitness score for each file stored in the memory (not shown) and the experience score for each file stored in the memory (not shown) of the experience score calculation unit 103, and the memory (see FIG. (Not shown).

全ページ検索部106は、外部検索エンジン300から、利用者が閲覧していないファイルを含む任意の範囲の情報を母集団として検索を行い、検索結果を類似度算出部107に転送する。   The all-page search unit 106 searches the external search engine 300 for an arbitrary range of information including files that are not viewed by the user as a population, and transfers the search result to the similarity calculation unit 107.

類似度算出部107は、全ページ検索部106から利用者が閲覧していないファイルを含む任意の範囲情報を母集団として検索した結果のファイルを取得し、当該検索した結果のファイル(URL)に基づいてWebサーバ400にアクセスし、結果を取得し、当該結果と過去に閲覧したファイルとの類似度を計算し、メモリ(図示せず)に格納する。   The similarity calculation unit 107 acquires a file as a result of searching as a population the arbitrary range information including a file that is not viewed by the user from the all-page search unit 106, and stores the file as a search result file (URL). Based on this, the Web server 400 is accessed, the result is acquired, the similarity between the result and a file browsed in the past is calculated, and stored in a memory (not shown).

表示優先度算出部108は、検索管理部102を介して取得した、類似度と統合スコアから表示優先度を算出する方法を指定する表示優先度調整情報を利用して、類似度算出部107のメモリ(図示せず)に格納されている類似度と、統合スコア算出部105のメモリ(図示せず)に格納されている統合スコアから表示優先度を算出する。   The display priority calculation unit 108 uses the display priority adjustment information that specifies the method of calculating the display priority from the similarity and the integrated score, which is acquired via the search management unit 102, and uses the display priority adjustment information of the similarity calculation unit 107. The display priority is calculated from the similarity stored in the memory (not shown) and the integrated score stored in the memory (not shown) of the integrated score calculation unit 105.

次に、上記の構成における動作を説明する。   Next, the operation in the above configuration will be described.

まず、操作履歴取得部101が操作履歴を取得する方法を説明する。   First, a method in which the operation history acquisition unit 101 acquires an operation history will be described.

操作履歴DB109は、図4、図5に示すように、Web操作履歴テーブル、IME入力テーブル、印刷テーブル、Webファイルテーブル、メールファイルテーブルを有する。   As illustrated in FIGS. 4 and 5, the operation history DB 109 includes a Web operation history table, an IME input table, a print table, a Web file table, and a mail file table.

Web操作履歴テーブル(図4(a))は、File-Key(情報本体のハッシュ値(MD5))、閲覧開始時間、閲覧終了時間の項目から構成される。   The Web operation history table (FIG. 4A) includes items of File-Key (information body hash value (MD5)), browsing start time, and browsing end time.

IME入力テーブル(図4(b))は、発生時間と入力内容の項目から構成される。   The IME input table (FIG. 4B) is composed of items of occurrence time and input contents.

印刷テーブル(図4(c))、は、発生時間、ファイル種別、File-keyの項目から構成される。   The print table (FIG. 4C) is composed of items of occurrence time, file type, and file-key.

Webファイルテーブル(図5(d))は、Content-Key(情報本体のハッシュ値(MD5))、過去に見たWebページを保存したファイル名、作者、タイトル、更新日、インターネット上で公開されていたURLの項目から構成される。   The web file table (FIG. 5 (d)) is published on the Internet as Content-Key (hash value of information body (MD5)), file name storing the web page seen in the past, author, title, update date. It consists of the items of the URL that has been.

図6は、本発明の一実施の形態における操作履歴取得部における操作履歴情報の登録動作を示す図である。   FIG. 6 is a diagram showing an operation history information registration operation in the operation history acquisition unit according to the embodiment of the present invention.

・Web:
操作履歴取得部101は、キーボードイベントやマウスイベントやアクティブになっているウィンドウの状態変化イベントが生じたときに、Windows(登録商標)OS上でグローバルに通信されているウィンドウメッセージを取得(フック)し(ステップ101)、今どのプログラムがユーザによって操作されているかを特定する(ステップ102)。また、どのウィンドウがアクティブになった、あるいは非アクティブになったということを取得できる。本実施の形態では、Micro Soft Corporationのインターネットエクスプローラ(登録商標)(以下、IEと記す)であったとして説明する。
・ Web:
The operation history acquisition unit 101 acquires (hooks) a window message that is globally communicated on the Windows (registered trademark) OS when a keyboard event, a mouse event, or an active window state change event occurs. (Step 101), it is specified which program is being operated by the user (Step 102). You can also get information about which windows are active or inactive. In the present embodiment, description will be made assuming that the Internet Explorer (registered trademark) (hereinafter referred to as IE) of Micro Soft Corporation is used.

次に、プログラム間通信によってIEと通信し(ステップ103)、IEのウィンドウ上で現在表示しているホームページのURLと、表示している情報本体(多くの場合HTMLファイル)を取得する(ステップ104)。   Next, it communicates with the IE through inter-program communication (step 103), and acquires the URL of the home page currently displayed on the IE window and the displayed information body (in many cases, an HTML file) (step 104). ).

次に、当該情報本体のMD5ハッシュ値を計算し、この値を、コンテンツを一意に識別するContent-keyとする(ステップ105)。   Next, the MD5 hash value of the information body is calculated, and this value is set as a Content-key for uniquely identifying the content (step 105).

次に、情報本体をPCの過去操作ファイル蓄積部111に『過去に見たファイル』として保存する(ステップ106)。   Next, the information body is stored in the past operation file storage unit 111 of the PC as “file seen in the past” (step 106).

次に、上記ウィンドウメッセージに含まれるウィンドウのアクティブ化の時間を当該URLの閲覧開始時間であると推定し(ステップ107)、操作履歴DB109に閲覧開始時間と情報本体のMD5ハッシュ値をWeb操作履歴テーブル(図4(a))に登録する(ステップ108)。   Next, the activation time of the window included in the window message is estimated to be the browsing start time of the URL (step 107), and the browsing start time and the MD5 hash value of the information body are stored in the operation history DB 109 as the Web operation history. It is registered in the table (FIG. 4A) (step 108).

次に、操作履歴取得部101は、上記の情報本体を解析した結果と、既に取得した上記の情報を用いて、情報本体の属性情報である、作者、タイトル、更新日、情報本体のMD5ハッシュ値、インターネットで公開されていたURL、当該情報本体を保存したファイル名(フルパス)をWebファイルテーブル(図5(d))に保存する(ステップ109)。その後、操作履歴取得部101が上記のウィンドウメッセージに含まれるウィンドウの非アクティブ化のメッセージを受け取ると(ステップ110)、その時間を当該URLの閲覧終了時間であると推定し(ステップ111)、操作履歴DB109のWeb操作履歴テーブル(図4(a))に閲覧終了時間を登録する(ステップ112)。   Next, the operation history acquisition unit 101 uses the analysis result of the information body and the acquired information, and the author, title, update date, and MD5 hash of the information body, which are attribute information of the information body. The value, the URL published on the Internet, and the file name (full path) storing the information body are stored in the Web file table (FIG. 5D) (step 109). After that, when the operation history acquisition unit 101 receives a window deactivation message included in the window message (step 110), the operation history acquisition unit 101 estimates that time is the browsing end time of the URL (step 111). The browsing end time is registered in the Web operation history table (FIG. 4A) of the history DB 109 (step 112).

・e−mail:
上記のウィンドウメッセージの取得(フック)により、IME入力をその発生時間と共に操作履歴DBのIME入力テーブル(図4(b))に保存する。
・ E-mail:
By acquiring (hooking) the window message, the IME input is stored in the IME input table (FIG. 4B) in the operation history DB together with the generation time.

・印刷:
また、プリンタスプールへの問い合わせにより、印刷イベントを、その発生時間と共に操作履歴として操作履歴DB109の印刷テーブル(図4(c))に格納する。
·printing:
In response to an inquiry to the printer spool, the print event is stored in the print table (FIG. 4C) of the operation history DB 109 as an operation history together with the generation time.

次に、検索装置100が検索を行う手順を説明する。以下では、上記のようにして蓄積された操作履歴DB109を利用するものとする。   Next, a procedure in which the search device 100 performs a search will be described. Hereinafter, it is assumed that the operation history DB 109 accumulated as described above is used.

図7は、本発明の一実施の形態における検索動作を示す図である。   FIG. 7 is a diagram showing a search operation in one embodiment of the present invention.

検索管理部102は、情報検索端末200から、検索キーワードと表示優先算出方法指定情報(β=0.6)と統合スコア計算方法識別子(a:『優先作者=太郎:それ以外=デフォルト』、b:『閲覧時間5分以上は切り捨てる;それ以外=デフォルト』、c:『(経験重み係数α,ファイル適合重み係数1−α)=(0.7,0.3)』)を受け取る(ステップ201)。   The search management unit 102 receives the search keyword, display priority calculation method designation information (β = 0.6), and integrated score calculation method identifier (a: “prior author = Taro: other = default”, b) from the information search terminal 200. : “Browsing time of 5 minutes or longer; otherwise = default”, c: “(experience weight coefficient α, file matching weight coefficient 1−α) = (0.7, 0.3)”) is received (step 201) ).

検索管理部102は、操作履歴DB109を検索することにより、過去に見たファイルと過去に見たメールが保存されているContent-keyとファイルパスのリストを取得する(ステップ202)。   The search management unit 102 searches the operation history DB 109 to obtain a list of content-keys and file paths in which files seen in the past and mails seen in the past are stored (step 202).

検索管理部102は、検索キーワードとContent-keyとファイルパスのリストと統合スコア計算方法識別子a『優先作者=太郎:それ以外=デフォルト』とをファイル検索部103に送る(ステップ203)。   The search management unit 102 sends the search keyword, content-key, file path list, and integrated score calculation method identifier a “prior author = taro: other = default” to the file search unit 103 (step 203).

ファイル検索部103は、検索キーワードとファイルパスのリストを用いて、過去操作ファイル蓄積部111から過去に見たファイルと過去に見たメールを検索し(ステップ204)、ファイル適合スコアを算出する(ステップ205)。このとき、作者が「太郎」であるファイルまたは、メールかどうかをファイル属性で110にアクセスすることで調べ、作者が「太郎」であるファイルのファイル適合スコアを2倍する。また、検索キーワードを含まない(検索にヒットしない)ファイルとメールのファイル適合スコアは“0”とする。ファイル検索部103は、Content-keyとファイル適合スコアのペアのリストを検索管理部102に送信する(ステップ206)。   The file search unit 103 uses the search keyword and the list of file paths to search the past operation file storage unit 111 for files that have been viewed in the past and mails that have been viewed in the past (step 204), and calculates a file suitability score (step 204). Step 205). At this time, it is checked whether or not the file is “Taro” by the author or whether it is a mail by accessing 110 with the file attribute, and the file conformity score of the file whose author is “Taro” is doubled. In addition, the file matching score of a file that does not include a search keyword (does not hit the search) and mail is “0”. The file search unit 103 transmits a list of pairs of Content-key and file matching score to the search management unit 102 (step 206).

検索管理部102は、Content-keyと統合スコア計算方法識別子b『閲覧時間5分以上は切り捨てる:それ以外=デフォルト』を経験スコア算出部104に送信する(ステップ207)。経験スコア算出部104は、操作履歴DB109にアクセスして、過去に閲覧されたファイルの閲覧時間長さを計算し(ステップ208)、経験スコアを計算する(ステップ209)。この計算は、図9に示す式で計算する。但し、閲覧時間5分以上は切り捨てて閲覧された時間を5分とする。そして、Content-keyと経験スコアと閲覧期間のペアのリスト(例えば
『(Content-key 閲覧監視、閲覧収容時間、経験スコア)=(Fasfasfafadfasdfga, 2004/09/01/09:11:55,2003/09/01/09:12:45,170)』
を検索管理部102に返信する(ステップ210)。
The search management unit 102 transmits to the experience score calculation unit 104 the Content-key and the integrated score calculation method identifier b “browse the viewing time of 5 minutes or longer: otherwise = default” (step 207). The experience score calculation unit 104 accesses the operation history DB 109, calculates the browsing time length of a file browsed in the past (step 208), and calculates the experience score (step 209). This calculation is performed using the formula shown in FIG. However, the viewing time of 5 minutes or more is rounded down to 5 minutes. And a list of pairs of Content-key, experience score and browsing period (for example, “(Content-key browsing monitoring, browsing accommodation time, experience score) = (Fasfasfafadfasdfga, 2004/09/01/09: 11: 55,2003 / 09/01/09: 12: 45,170)
Is returned to the search management unit 102 (step 210).

検索管理部102は、Content-keyと経験スコアとファイル適合スコアのペアのリスト、計算方法識別子=『(経験重み係数α、ファイル適合重み係数1−α)=(0.7,0.3)』を統合スコア算出部105に送信する(ステップ211)。   The search management unit 102 is a list of pairs of Content-key, experience score, and file match score, calculation method identifier = “(experience weight coefficient α, file match weight coefficient 1−α) = (0.7, 0.3) ] Is transmitted to the integrated score calculation unit 105 (step 211).

統合スコア算出部105は、Content-keyと経験スコアとファイル適合スコアのペアのリスト、計算方法識別子=『(経験重み係数α、ファイル適合重み係数1−α)=(0.7,0.3)』を利用して統合スコアを算出する(ステップ212)。この統合スコアの算出は、経験スコアにα=0.7を乗じた値と、ファイル適合スコアに(1−α)=0.3を乗じた値との和を計算し、統合スコアとする。統合スコア時間関数は、任意の時間にキーワードに適合したファイルをどれだけ深く経験していたかを示す指標である。統合スコア算出部105は、Content-keyと統合スコアのペアのリストを検索管理部102に送信する(ステップ213)。   The integrated score calculation unit 105 is a list of pairs of Content-key, experience score, and file match score, calculation method identifier = “(experience weight coefficient α, file match weight coefficient 1−α) = (0.7, 0.3 )] Is used to calculate the integrated score (step 212). For the calculation of the integrated score, a sum of a value obtained by multiplying the experience score by α = 0.7 and a value obtained by multiplying the file matching score by (1−α) = 0.3 is calculated as an integrated score. The integrated score time function is an index indicating how deeply a file matching a keyword was experienced at an arbitrary time. The integrated score calculation unit 105 transmits a list of content-key and integrated score pairs to the search management unit 102 (step 213).

検索管理部102は、全ページ検索部106に検索キーワードを送信する(ステップ214)。   The search management unit 102 transmits the search keyword to the all page search unit 106 (step 214).

全ページ検索部106は、ユーザが過去に閲覧していないファイルを含むインターネット上の検索可能な全ての範囲のファイルを検索できる外部検索エンジン300(例えば、goo(登録商標)、Google(登録商標)等と通信し、検索キーワードに適合するURL、要約文、タイトルを上位100件分取得する(ステップ215)。   The all-page search unit 106 is an external search engine 300 (for example, goo (registered trademark), Google (registered trademark)) that can search all the searchable files on the Internet including files that the user has not browsed in the past. , Etc., and the top 100 URLs, summary sentences, and titles that match the search keyword are acquired (step 215).

全ページ検索部106は、該検索キーワードに適合するURL、要約文、タイトルを検索管理部102に送信する(ステップ216)。   The all-page search unit 106 transmits the URL, summary sentence, and title that match the search keyword to the search management unit 102 (step 216).

検索管理部102は、当該URL(100件分)、過去に閲覧したファイルのContent-keyと、当該Content-keyの情報本体を保存したファイル名(フルパス)を類似度算出部107に送信する(ステップ217)。   The search management unit 102 transmits the URL (for 100 cases), the content-key of the file browsed in the past, and the file name (full path) in which the information body of the content-key is stored to the similarity calculation unit 107 ( Step 217).

類似度計算部107は、当該URL(100件分)を利用してWebサーバ400にアクセスし、URLの示すファイル(100件分)を取得する(ステップ218)。次に、各ファイルと過去に閲覧したそれぞれのContent-keyのファイルとのテキスト類似度を算出する(ステップ219)。これは、文書内に出現する単語ベクトルのコサイン類似度を用いて行うなど、既存の技術で実現できる。   The similarity calculation unit 107 accesses the Web server 400 using the URL (for 100 cases) and acquires the file (for 100 cases) indicated by the URL (step 218). Next, the text similarity between each file and each content-key file browsed in the past is calculated (step 219). This can be realized by existing techniques such as using the cosine similarity of word vectors appearing in a document.

次に、そのファイルと過去に閲覧したそれぞれのContent-keyのファイルのURLの類似度(=URL類似度)を計算する(ステップ220)。例えば、URL類似度は、URLが完全に一致すれば、1ポイント、サイトのみが同じであれば、0.5ポイント、URLのサイトとそれ以下の一部のパスが同じであれば0.5ポイント、別のサイトであれば、0ポイントとする。   Next, the URL similarity (= URL similarity) between the file and each Content-key file browsed in the past is calculated (step 220). For example, the URL similarity is 0.5 points if the URLs completely match and 0.5 points if only the site is the same, and 0.5 points if the URL site and the part of the path below it are the same. Points, 0 points for other sites.

類似度は、テキスト類似度と、URL類似度の和とする。   The similarity is the sum of the text similarity and the URL similarity.

類似度算出部107は、100件の各URLと過去に閲覧したそれぞれのContent-key
のファイルとの類似度を検索管理部102に送信する(ステップ221)。
The similarity calculation unit 107 includes 100 URLs and each Content-key viewed in the past.
The similarity to the file is transmitted to the search management unit 102 (step 221).

検索管理部102は、100件のURLと過去に閲覧したContent-keyのファイルとの類似度と、Content-keyとのリストと、表示優先度算出方法指定情報(β=0.6)を表示優先度算出部108に送信する(ステップ222)。   The search management unit 102 displays the similarity between 100 URLs and Content-key files browsed in the past, a list of Content-keys, and display priority calculation method designation information (β = 0.6). It transmits to the priority calculation part 108 (step 222).

表示優先度算出部108は、類似度算出部107から100件のURLと過去に閲覧したContent-keyのファイルとの類似度とContent-keyとのリストと、検索管理部102から表示優先度算出方法指定情報(β=0.6)を受け取る。表示優先度算出部108は、各URLに表示する、過去に閲覧したContent-keyのファイルの表示優先度を算出する(ステップ223)。算出方法を図10に示す。表示優先度算出部108は、URLと、それぞれのURLに対する過去に閲覧したContent-keyのファイルの優先度を検索管理部102に送信する(ステップ224)。   The display priority calculation unit 108 calculates the display priority from the search management unit 102 and the list of similarities and content-keys between 100 URLs from the similarity calculation unit 107 and the content-key files browsed in the past. The method designation information (β = 0.6) is received. The display priority calculation unit 108 calculates the display priority of the content-key file browsed in the past and displayed on each URL (step 223). The calculation method is shown in FIG. The display priority calculation unit 108 transmits the URL and the priority of the content-key file browsed in the past for each URL to the search management unit 102 (step 224).

検索管理部102は、それぞれのURLに対し、過去に閲覧したContent-keyのファイルのうち表示優先度の高い3件のファイルを選択し、それぞれのURLに対して、表示優先度の高い順に表示する検索結果表示ファイルを作成する(ステップ225)。次に、情報検索端末200に検索結果表示ファイルを送信する(ステップ226)。情報検索端末200に表示する画面イメージを図11に示す。   For each URL, the search management unit 102 selects three files with high display priority from among the content-key files browsed in the past, and displays them in order of display priority for each URL. A search result display file is created (step 225). Next, the search result display file is transmitted to the information search terminal 200 (step 226). A screen image displayed on the information search terminal 200 is shown in FIG.

情報検索端末200を操作するユーザは、検索要求を行う際に、検索キーワードを入力できる。また、コンテンツの類似度と、過去に経験した度合いである経験スコアの重み付けを調整し、それぞれのURLに対し、過去に閲覧したContent-keyのファイルの中で実際に表示する表示優先度の高い3件のファイルを変更する表示優先度情報を調節するバーと、統合スコア計算のための経験スコアとファイル適合スコアの重み付けを調節するバーを操作できる。   A user who operates the information search terminal 200 can input a search keyword when making a search request. Also, the content similarity and the weight of the experience score, which is the degree experienced in the past, are adjusted, and each URL has a high display priority for actual display in the content-key file browsed in the past. It is possible to operate a bar for adjusting display priority information for changing three files and a bar for adjusting the weight of the experience score for calculating the integrated score and the file matching score.

また、利用者の操作履歴は、操作履歴取得部101より取得される場合もあれば、インターネットエクスプローラ(登録商標)などの他の利用者端末のアプリケーションからの登録要求により登録される場合もある。また、利用者が閲覧したい情報を要求したWebサーバから登録される場合もある。   The user's operation history may be acquired from the operation history acquisition unit 101 or may be registered by a registration request from an application of another user terminal such as Internet Explorer (registered trademark). In some cases, the user may register from a Web server that requested information to be viewed.

なお、上記の実施の形態における検索装置100の動作をプログラムとして構築し、単独のサーバ、あるいは、既存のサーバ、あるいは、利用者端末にインストールする、または、ネットワークを介して流通させることができる。   Note that the operation of the search device 100 in the above embodiment can be constructed as a program, installed on a single server, an existing server, a user terminal, or distributed via a network.

また、構築されたプログラムを、ハードディスク装置や、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納しておき、単独のサーバ、あるいは、既存のサーバ、あるいは、利用者端末にインストールする、または、配布することが可能である。   In addition, the constructed program is stored in a portable storage medium such as a hard disk device or a flexible disk / CD-ROM, and installed in a single server, an existing server, or a user terminal, or It is possible to distribute.

なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。   The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.

本発明は、利用者のPCの操作内容を検索する技術に適用可能である。   The present invention can be applied to a technique for searching for operation contents of a user's PC.

本発明の原理を説明するための図である。It is a figure for demonstrating the principle of this invention. 本発明の原理構成図である。It is a principle block diagram of this invention. 本発明の一実施の形態における検索装置の構成図である。It is a block diagram of the search device in one embodiment of this invention. 本発明の一実施の形態における操作履歴DBのテーブルの例(その1)である。It is an example (the 1) of the table of operation history DB in one embodiment of this invention. 本発明の一実施の形態における操作履歴DBのテーブルの例(その2)である。It is an example (the 2) of the table of operation history DB in one embodiment of this invention. 本発明の一実施の形態における操作履歴情報の登録動作を示す図である。It is a figure which shows the registration operation | movement of the operation history information in one embodiment of this invention. 本発明の一実施の形態における検索動作を示す図(その1)である。It is FIG. (1) which shows the search operation in one embodiment of this invention. 本発明の一実施の形態における検索動作を示す図(その2)である。It is FIG. (2) which shows the search operation in one embodiment of this invention. 本発明の一実施の形態における経験スコア計算の例である。It is an example of the experience score calculation in one embodiment of this invention. 本発明の一実施の形態における表示優先度算出方法を示す図である。It is a figure which shows the display priority calculation method in one embodiment of this invention. 本発明の一実施の形態における画面イメージである。It is a screen image in one embodiment of the present invention.

符号の説明Explanation of symbols

100 情報検索装置
101 操作履歴取得部
102 検索管理手段、検索管理部
103 ファイル検索手段、ファイル検索部
104 経験スコア算出手段、経験スコア算出部
105 統合スコア算出手段、統合スコア算出部
106 全ページ検索手段、全ページ検索部
107 類似度算出手段、類似度算出部
108 表示優先度算出手段、表示優先度算出部
109 操作履歴DB(データベース)
110 ファイル属性DB(データベース)
111 過去操作ファイル蓄積部
112 スコア算出手段
200 情報検索端末(IE)
300 外部検索エンジン
400 Webサーバ
DESCRIPTION OF SYMBOLS 100 Information search device 101 Operation history acquisition part 102 Search management means, Search management part 103 File search means, File search part 104 Experience score calculation means, Experience score calculation part 105 Integrated score calculation means, Integrated score calculation part 106 All page search means , All page search unit 107 similarity calculation unit, similarity calculation unit 108 display priority calculation unit, display priority calculation unit 109 operation history DB (database)
110 File attribute DB (database)
111 Past operation file storage unit 112 Score calculation means 200 Information retrieval terminal (IE)
300 External search engine 400 Web server

Claims (6)

操作履歴情報を検索する情報検索方法であって、
要求元から検索要求を受け取ると、ファイル検索手段が、該検索要求に基づいて該検索要求に適合する利用者が過去に閲覧した情報本体(ファイル)を検索するファイル検索ステップと、
スコア算出手段が、ファイルの格納場所情報に基づいて、ファイル毎に検索要求への適合度を表すファイル適合スコア、または、操作履歴データベースの操作履歴情報を用いて前記利用者が経験した強さを前記PC上で動作させたファイル毎に表す経験スコアを算出し、該ファイル適合スコアと該経験スコアを統合した統合スコアを算出するスコア算出ステップと、
類似度算出手段が、前記利用者が閲覧していないファイルを含む任意の範囲の情報を母集団として検索した結果のファイルと、過去に閲覧したファイルとの類似度を求める類似度算出ステップと、
検索管理手段が、前記類似度と前記統合スコアから求めた表示優先度に基づいて、検索結果を出力する出力ステップと、
を行うことを特徴とする情報検索方法。
An information search method for searching operation history information,
When receiving a search request from the request source, the file search means searches for an information body (file) browsed in the past by a user who matches the search request based on the search request;
Based on the storage location information of the file, the score calculation means indicates the strength that the user has experienced using the file suitability score indicating the degree of suitability for the search request for each file or the operation history information in the operation history database. A score calculation step of calculating an experience score represented for each file operated on the PC, and calculating an integrated score obtained by integrating the file suitability score and the experience score;
Similarity calculation means, a similarity calculation step for obtaining a similarity between a file as a result of searching information in an arbitrary range including a file that the user has not browsed as a population, and a file browsed in the past,
An output step for the search management means to output a search result based on the display priority obtained from the similarity and the integrated score;
An information retrieval method characterized by:
前記要求元から、前記検索要求へのファイル適合スコア、前記経験スコア及び前記統合スコアを計算する方法を指定する識別子を受け取るステップと、
前記スコア算出ステップにおいて、
前記識別子に応じて、前記検索要求への前記ファイル適合スコア、前記経験スコア及び前記統合スコアの計算方法を変更し、該ファイル適合スコア、該経験スコア及び該統合スコアの計算を行うステップと、
を行う請求項1記載の情報検索方法。
Receiving from the requester an identifier specifying a method for calculating a file conformity score to the search request, the experience score, and the integrated score;
In the score calculating step,
According to the identifier, changing the calculation method of the file suitability score, the experience score, and the integrated score for the search request, and calculating the file suitability score, the experience score, and the integrated score;
The information search method according to claim 1, wherein:
前記要求元から、前記類似度と前記統合スコアから前記表示優先度を算出する方法を指定する表示優先度調整情報を受け取るステップと、
前記表示優先度調整情報を利用して表示優先度を算出するステップと、
を行う請求項1記載の情報検索方法。
Receiving display priority adjustment information for designating a method for calculating the display priority from the similarity and the integrated score from the requester;
Calculating display priority using the display priority adjustment information;
The information search method according to claim 1, wherein:
操作履歴取得手段が、
前記PC上のメッセージ電文及び、該PC上で作動しているプログラムとの通信を利用して、前記利用者のPCを操作した履歴を取得するステップと、
前記利用者のPCを操作した履歴から、該利用者が閲覧した情報を特定する識別子を取得するステップと、
前記利用者が閲覧した情報を特定する識別子に基づいて、該利用者が過去に閲覧した情報本体を取得し、ファイルとして前記操作履歴データベースに保存するステップと、
前記情報本体の属性情報を取得し、ファイル属性情報としてファイル属性情報データベースに保存するステップと、
を行う請求項1記載の情報検索方法。
The operation history acquisition means
Obtaining a history of operating the user's PC using communication with a message message on the PC and a program operating on the PC;
Obtaining an identifier for identifying information viewed by the user from a history of operating the user's PC;
Based on an identifier for identifying information browsed by the user, obtaining an information body browsed in the past by the user, and storing it in the operation history database as a file;
Obtaining attribute information of the information body and storing it in a file attribute information database as file attribute information;
The information search method according to claim 1, wherein:
操作履歴情報を検索する情報検索装置であって、
利用者のパーソナルコンピュータ(PC)を操作した履歴である操作履歴情報を操作履歴データベースと、
要求元から取得した検索要求に基づいて、該検索要求に基づいて該検索要求に適合する利用者が過去に閲覧した情報本体(ファイル)を検索するファイル検索手段と、
ファイルの格納場所情報に基づいて、ファイル毎に検索要求への適合度を表すファイル適合スコアまたは、前記操作履歴データベースの操作履歴情報を用いて前記利用者が経験した強さを前記PC上で動作させたファイル毎に表す経験スコアを算出し、該ファイル適合スコアと該経験スコアを統合した統合スコアを算出するスコア算出手段と、
前記利用者が閲覧していないファイルを含む任意の範囲の情報を母集団として検索した結果のファイルと、過去に閲覧したファイルとの類似度を求める類似度算出手段と、
前記類似度と前記統合スコアから求めた表示優先度に基づいて、検索結果を出力する出力と、
を有することを特徴とする情報検索装置。
An information retrieval device for retrieving operation history information,
Operation history information, which is a history of operating a user's personal computer (PC), an operation history database,
Based on a search request acquired from a request source, a file search means for searching an information body (file) browsed in the past by a user who matches the search request based on the search request;
Based on the storage location information of the file, the file conformity score indicating the degree of conformity to the search request for each file or the strength experienced by the user using the operation history information of the operation history database is operated on the PC. A score calculation means for calculating an experience score represented for each file and calculating an integrated score obtained by integrating the file conformity score and the experience score;
Similarity calculation means for obtaining a similarity between a file as a result of searching an arbitrary range of information including a file that is not browsed by the user and a file browsed in the past,
Based on the display priority obtained from the similarity and the integrated score, an output for outputting a search result;
An information retrieval apparatus comprising:
コンピュータに、
請求項1乃至4記載の情報検索方法の各ステップを実行させる情報検索プログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。
On the computer,
5. A computer-readable recording medium storing an information search program for executing each step of the information search method according to claim 1.
JP2005340987A 2005-11-25 2005-11-25 Information retrieval method and apparatus, and computer-readable recording medium Active JP4509918B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005340987A JP4509918B2 (en) 2005-11-25 2005-11-25 Information retrieval method and apparatus, and computer-readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005340987A JP4509918B2 (en) 2005-11-25 2005-11-25 Information retrieval method and apparatus, and computer-readable recording medium

Publications (2)

Publication Number Publication Date
JP2007148688A JP2007148688A (en) 2007-06-14
JP4509918B2 true JP4509918B2 (en) 2010-07-21

Family

ID=38210049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005340987A Active JP4509918B2 (en) 2005-11-25 2005-11-25 Information retrieval method and apparatus, and computer-readable recording medium

Country Status (1)

Country Link
JP (1) JP4509918B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4510109B2 (en) * 2008-03-24 2010-07-21 富士通株式会社 Target content search support program, target content search support method, and target content search support device
JP5504722B2 (en) 2009-07-15 2014-05-28 富士ゼロックス株式会社 Information processing apparatus and computer program
JP5478530B2 (en) * 2011-02-15 2014-04-23 日本電信電話株式会社 Presentation method, apparatus, and program
JP5891875B2 (en) 2012-03-19 2016-03-23 富士ゼロックス株式会社 Information processing apparatus and information processing program

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002099568A (en) * 2000-09-22 2002-04-05 Yafoo Japan Corp Www server having function of automatically generating book mark for personal use
JP2003178094A (en) * 2001-12-12 2003-06-27 Sharp Corp Information processor, information processing program therefor and recording medium with the program recorded thereon
JP2004070390A (en) * 2002-08-01 2004-03-04 Nippon Telegr & Teleph Corp <Ntt> Device and program for assisting reuse of message and medium recording this program
JP2004279049A (en) * 2003-03-12 2004-10-07 Matsushita Electric Ind Co Ltd Camera position calculation system
JP2005174138A (en) * 2003-12-12 2005-06-30 Nippon Telegr & Teleph Corp <Ntt> Content retrieval method, system, and program, and program recording medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002099568A (en) * 2000-09-22 2002-04-05 Yafoo Japan Corp Www server having function of automatically generating book mark for personal use
JP2003178094A (en) * 2001-12-12 2003-06-27 Sharp Corp Information processor, information processing program therefor and recording medium with the program recorded thereon
JP2004070390A (en) * 2002-08-01 2004-03-04 Nippon Telegr & Teleph Corp <Ntt> Device and program for assisting reuse of message and medium recording this program
JP2004279049A (en) * 2003-03-12 2004-10-07 Matsushita Electric Ind Co Ltd Camera position calculation system
JP2005174138A (en) * 2003-12-12 2005-06-30 Nippon Telegr & Teleph Corp <Ntt> Content retrieval method, system, and program, and program recording medium

Also Published As

Publication number Publication date
JP2007148688A (en) 2007-06-14

Similar Documents

Publication Publication Date Title
JP4908094B2 (en) Information processing system, information processing method, and information processing program
US7890485B2 (en) Knowledge management tool
JP4638439B2 (en) Personalized web search
US7783644B1 (en) Query-independent entity importance in books
JP5307417B2 (en) System and method for annotating documents
JP5074378B2 (en) Fact Query Engine user interface with snippets from information sources including query terms and response terms
US7730054B1 (en) Systems and methods for providing searchable prior history
JP5222581B2 (en) System and method for annotating documents
US20120124038A1 (en) Variable Length Snippet Generation
JP2007517308A (en) Method and system for improving search ranking using article information
US20120059822A1 (en) Knowledge management tool
US9361375B2 (en) Building a research document based on implicit/explicit actions
JP2007188352A (en) Page reranking apparatus, and page reranking program
JP2010128928A (en) Retrieval system and retrieval method
JP5194731B2 (en) Document relevance calculation system, document relevance calculation method, and document relevance calculation program
JP4509918B2 (en) Information retrieval method and apparatus, and computer-readable recording medium
JP4750628B2 (en) Information ranking method and apparatus, program, and computer-readable recording medium
JP4610543B2 (en) Period extracting device, period extracting method, period extracting program implementing the method, and recording medium storing the program
US20110252313A1 (en) Document information selection method and computer program product
JP4445849B2 (en) File search method, file search device, and file search program
JP4567581B2 (en) Operation search method and apparatus, and computer-readable recording medium
JP4528203B2 (en) File search method, file search device, and file search program
JP2002251410A (en) Information retrieving device, information retrieving program, and computer-readable recording medium recording therein information retrieving program
JP2006236221A (en) Management server for web page retrieval
JP2002049638A (en) Document information retrieval device, method, document information retrieval program and computer readable recording medium storing document information retrieval program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100428

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4509918

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140514

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350