JP4479439B2 - Information processing apparatus, information processing method, and computer program - Google Patents

Information processing apparatus, information processing method, and computer program Download PDF

Info

Publication number
JP4479439B2
JP4479439B2 JP2004271457A JP2004271457A JP4479439B2 JP 4479439 B2 JP4479439 B2 JP 4479439B2 JP 2004271457 A JP2004271457 A JP 2004271457A JP 2004271457 A JP2004271457 A JP 2004271457A JP 4479439 B2 JP4479439 B2 JP 4479439B2
Authority
JP
Japan
Prior art keywords
information
ranking
document
search
mail
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004271457A
Other languages
Japanese (ja)
Other versions
JP2006085564A (en
Inventor
歩 瀬木
高明 住友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2004271457A priority Critical patent/JP4479439B2/en
Publication of JP2006085564A publication Critical patent/JP2006085564A/en
Application granted granted Critical
Publication of JP4479439B2 publication Critical patent/JP4479439B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、および情報処理方法、並びにコンピュータ・プログラムに関する。さらに、詳細には、クライアントの送受信するメールから、ドキュメント(文書)のランキング情報として適用可能なデータを取得して、このランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データのランキング設定処理を実行してユーザに提供することを可能とした情報処理装置、および情報処理方法、並びにコンピュータ・プログラムに関する。   The present invention relates to an information processing apparatus, an information processing method, and a computer program. In more detail, data applicable as ranking information of a document (document) is acquired from an email sent and received by the client, and document information provided to the client according to the ranking information, for example, a search request from the client. The present invention relates to an information processing apparatus, an information processing method, and a computer program that can perform ranking setting processing of search result data generated in response to the user and provide it to a user.

多数の文書情報などの情報から、特定の情報を抽出するデータ検索において、ユーザの興味や嗜好を反映したフィルタリング処理を実行して検索結果を提示する処理を行なうものがある。インターネットあるいはイントラネットなどのネットワーク通信が盛んになり、このようなネットワークを介したニュース配信、メール配信などが盛んに行われているが、このようなデータ配信では、ユーザの興味に応じたデータ配信を可能とするためのフィルタリング処理が行われる。   In a data search for extracting specific information from a large number of pieces of information such as document information, there is a type of executing a filtering process that reflects a user's interests and preferences to present a search result. Network communication such as the Internet or Intranet has become popular, and news distribution and mail distribution via such networks are actively performed. In such data distribution, data distribution according to the user's interest is performed. Filtering processing is performed to make it possible.

ユーザの推薦情報や、興味情報などに基づいてデータをフィルタリングする処理をソーシャルフィルタリング(Social filtering)と呼ぶ。このようなデータフィルタリングを行なうことで、ユーザ各々に対応した個別のユーザ適応情報を、各ユーザに提供することが可能となる。   The process of filtering data based on user recommendation information, interest information, and the like is called social filtering. By performing such data filtering, individual user adaptation information corresponding to each user can be provided to each user.

データ検索システムにおいてこのようなフィルタリング処理を適用することにより、多数のデータの中から、ユーザの興味の高いと判定されるデータを順番に提示したリストを生成してユーザに検索結果として提供する構成が可能となる。すなわち、検索を実行するシステム側に、各ユーザのプロファイリング情報を格納し、格納したプロファイリング情報を参照して、各ユーザの興味レベルの高い順にデータをリスト化して提示するものである。特許文献1には、同じグループに所属するユーザ同士がドキュメントを推薦し、ユーザが推薦情報の入力を検索システムに対して実行することで、推薦情報に基づくドキュメントのランキングを行なうシステムが開示されている。   A configuration in which a list in which data determined to be of high interest by a user is sequentially generated from a large number of data by applying such filtering processing in a data search system and provided to a user as a search result Is possible. That is, the profiling information of each user is stored on the system executing the search, and the stored profiling information is referred to, and the data is listed and presented in descending order of the interest level of each user. Patent Document 1 discloses a system in which users belonging to the same group recommend documents and users perform ranking of documents based on the recommendation information by inputting recommendation information to the search system. Yes.

しかし、上述した従来技術では、ユーザが検索システムに対して推薦情報を通知しなければならないという処理負荷が発生する。
特開平11−282875号公報
However, in the above-described conventional technology, a processing load occurs in which the user has to notify the search system of recommendation information.
JP-A-11-282875

本発明は、上述の問題点に鑑みてなされたものであり、データ検索、あるいはデータフィルタリングシステムなど、多数の情報の中から例えばユーザの興味の高いと判断される特定データを抽出する構成において、ユーザからの推薦情報を通知する処理など、ユーザの負荷を発生させることなく、ユーザの興味がどのような情報に対して高いか等を判定することを可能として、データソートなどのデータ加工を実行し、ユーザの興味の高い情報を優先してユーザに提示することを可能とした情報処理装置、および情報処理方法、並びにコンピュータ・プログラムを提供することを目的とする。   The present invention has been made in view of the above-described problems, and in a configuration for extracting specific data that is judged to be of high interest to the user from a large amount of information, such as data search or a data filtering system, Performs data processing such as data sorting, making it possible to determine what kind of information a user is interested in without causing a load on the user, such as processing to notify recommended information from the user. It is an object of the present invention to provide an information processing apparatus, an information processing method, and a computer program that can preferentially present information of interest to the user to the user.

さらに、具体的には、本発明は、クライアントの送受信するメールから、ドキュメント(文書)のランキング情報として適用可能なデータを取得して、このランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データのランキング設定処理を実行してユーザに提供することを可能とした情報処理装置、および情報処理方法、並びにコンピュータ・プログラムを提供することを目的とする。   Furthermore, more specifically, the present invention obtains data applicable as ranking information of a document (document) from a mail transmitted / received by the client, and provides document information to the client according to the ranking information, for example, the client It is an object to provide an information processing apparatus, an information processing method, and a computer program that can perform ranking setting processing of search result data generated in response to a search request from a user and provide the ranking to a user .

本発明の第1の側面は、
情報処理装置であり、
クライアントに提供するドキュメント情報を含むインデックスデータを格納したインデックス格納部と、
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索部と、
ネットワークを介して転送されるメールデータから、前記ドキュメント情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、前記インデックス格納部に格納する処理を実行するランキング情報決定部と、
前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理部と、
を有することを特徴とする情報処理装置にある。
The first aspect of the present invention is:
An information processing device,
An index storage unit storing index data including document information to be provided to the client;
A search unit that executes a search process based on the storage information of the index storage unit;
A ranking information determination unit that acquires ranking information to be applied to ranking processing of the document information from mail data transferred via a network, and stores the information in the index storage unit as ranking information corresponding to each document; ,
A ranking processing unit that executes a provision data generation process to which the ranking information is applied to a first search result generated by the search of the search unit, and generates a second search result reflecting the ranking information;
There is an information processing apparatus characterized by having.

さらに、本発明の情報処理装置の一実施態様において、前記ランキング情報決定部は、ネットワークを介して転送されるメールデータから、
(a)メール本文中に記述されているドキュメント情報、
(b)メール宛先情報(To)、
(c)メールコピー先情報(CC)、
(d)メール送信者情報(FROM)、
(e)メール送信日時情報(DATE)、
上記(a)〜(e)の情報中、少なくとも(a)ドキュメント情報と、その他の(b)〜(e)中、取得可能なデータをランキング情報として取得する処理を実行する構成であることを特徴とする。
Furthermore, in one embodiment of the information processing apparatus of the present invention, the ranking information determination unit is configured to receive mail data transferred via a network,
(A) Document information described in the mail text,
(B) Mail destination information (To),
(C) Mail copy destination information (CC),
(D) Mail sender information (FROM),
(E) Mail transmission date / time information (DATE),
Among the above-mentioned information (a) to (e), at least (a) document information and the other (b) to (e) are configured to execute processing for acquiring acquirable data as ranking information. Features.

さらに、本発明の情報処理装置の一実施態様において、前記ランキング情報決定部は、ランキング情報として取得するメールアドレスデータに複数のメールアドレスの集合として設定されたメーリングリストを、各ユーザ対応のメールアドレスに変換する処理を実行する構成であることを特徴とする。   Furthermore, in one embodiment of the information processing apparatus of the present invention, the ranking information determination unit sets a mailing list set as a set of a plurality of mail addresses in the mail address data acquired as ranking information as a mail address corresponding to each user. It is the structure which performs the process to convert.

さらに、本発明の情報処理装置の一実施態様において、前記情報処理装置は、さらに、メールアドレス情報とユーザ名とを対応付けたユーザ情報データを格納したユーザ情報格納部を有し、前記ランキング情報決定部は、ランキング情報として取得するメールアドレスデータを、前記ユーザ情報に従って、ユーザ名に変換し、ランキング情報を生成する処理を実行する構成であることを特徴とする。   Furthermore, in an embodiment of the information processing apparatus of the present invention, the information processing apparatus further includes a user information storage unit that stores user information data in which mail address information and a user name are associated with each other, and the ranking information The determination unit is configured to perform processing for converting mail address data acquired as ranking information into a user name according to the user information, and generating ranking information.

さらに、本発明の情報処理装置の一実施態様において、前記ランキング情報決定部は、ネットワークを介して転送されるメールデータから、前記ドキュメント情報のランキング処理に適用するランキング情報を取得した場合、前記インデックス格納部に格納済みのインデックスデータに、取得ランキング情報を追加する更新処理を実行する構成であることを特徴とする。   Furthermore, in one embodiment of the information processing apparatus of the present invention, when the ranking information determination unit acquires ranking information to be applied to ranking processing of the document information from mail data transferred via a network, the index The present invention is characterized in that an update process for adding acquired ranking information to index data already stored in the storage unit is executed.

さらに、本発明の情報処理装置の一実施態様において、前記ランキング処理部は、前記ランキング情報の構成データに対して重み(W)または係数(N)を設定し、前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に基づいて、前記重み(W)および係数(N)と、該ランキング情報の構成データに検索実行ユーザが含まれるか否かによって異なる値とした変数とに基づいて、ドキュメント対応のランク値[R]を算出し、該算出したランク値[R]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする。   Furthermore, in one embodiment of the information processing apparatus of the present invention, the ranking processing unit sets a weight (W) or a coefficient (N) for the configuration data of the ranking information, and is generated by a search of the search unit. Whether or not a search execution user is included in the weight (W) and coefficient (N) and the configuration data of the ranking information based on the ranking information set corresponding to the document included in the first search result. The document-corresponding rank value [R] is calculated based on the variable having different values, and the document included in the first search result is sorted based on the calculated rank value [R]. It is the structure which performs and produces | generates the 2nd search result reflecting ranking information.

さらに、本発明の情報処理装置の一実施態様において、前記ランキング処理部は、ランキング情報を構成するメール宛先情報(To)、メールコピー先情報(CC)、メール送信者情報(FROM)の各々について、重み(W)を決定し、さらに、ランキング情報を構成する文書の有無を示すデータについて文書有無に応じて異なる値とした係数(N)を設定する構成であることを特徴とする。   Furthermore, in an embodiment of the information processing apparatus according to the present invention, the ranking processing unit includes each of mail destination information (To), mail copy destination information (CC), and mail sender information (FROM) constituting the ranking information. The weight (W) is determined, and the coefficient (N) having a different value is set for the data indicating the presence / absence of the document constituting the ranking information according to the presence / absence of the document.

さらに、本発明の情報処理装置の一実施態様において、前記ランキング処理部は、前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に含まれるメール送信日時情報としての日付データについて、同一ドキュメントについて最新のデータを取得する日付代表値[T]算出処理を実行し、該算出した日付代表値[T]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする。   Furthermore, in an embodiment of the information processing apparatus of the present invention, the ranking processing unit is included in ranking information set corresponding to a document included in the first search result generated by the search of the search unit. A date representative value [T] calculation process for obtaining the latest data for the same document is performed on the date data as the mail transmission date and time information, and the first search result is based on the calculated date representative value [T]. The second search result reflecting the ranking information is generated by sorting the documents included in the document.

さらに、本発明の情報処理装置の一実施態様において、前記ランキング処理部は、前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用したソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする。   Furthermore, in one embodiment of the information processing apparatus of the present invention, the ranking processing unit executes a sorting process that applies the ranking information to the first search result generated by the search of the search unit, The second search result reflecting the ranking information is generated.

さらに、本発明の第2の側面は、
ランキング情報に基づくデータ処理をコンピュータ上で実行させるコンピュータ・プログラムであり、
ネットワークを介して転送されるメールデータから、ドキュメント情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、インデックス格納部に格納する処理を実行するランキング情報決定ステップと、
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索ステップと、
前記検索ステップにおける検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理ステップと、
を有することを特徴とするコンピュータ・プログラムにある。
Furthermore, the second aspect of the present invention provides
A computer program that executes data processing based on ranking information on a computer,
A ranking information determination step for obtaining ranking information to be applied to ranking processing of document information from mail data transferred via a network, and executing processing for storing in the index storage unit as ranking information corresponding to each document;
A search step for executing a search process based on the storage information of the index storage unit;
A ranking process step of executing a provision data generation process applying the ranking information to the first search result generated by the search in the search step, and generating a second search result reflecting the ranking information;
There is a computer program characterized by comprising:

さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング情報決定ステップは、ネットワークを介して転送されるメールデータから、
(a)メール本文中に記述されているドキュメント情報、
(b)メール宛先情報(To)、
(c)メールコピー先情報(CC)、
(d)メール送信者情報(FROM)、
(e)メール送信日時情報(DATE)、
上記(a)〜(e)の情報中、少なくとも(a)ドキュメント情報と、その他の(b)〜(e)中、取得可能なデータをランキング情報として取得する処理を実行するステップを含むことを特徴とする。
Furthermore, in one embodiment of the computer program according to the present invention, the ranking information determining step is performed from mail data transferred via a network.
(A) Document information described in the mail text,
(B) Mail destination information (To),
(C) Mail copy destination information (CC),
(D) Mail sender information (FROM),
(E) Mail transmission date / time information (DATE),
Including at least (a) document information in the information of (a) to (e) and a process of acquiring data that can be acquired as ranking information in other (b) to (e). Features.

さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング情報決定ステップは、ランキング情報として取得するメールアドレスデータに複数のメールアドレスの集合として設定されたメーリングリストを、各ユーザ対応のメールアドレスに変換する処理を実行するステップを含むことを特徴とする。   Furthermore, in one embodiment of the computer program of the present invention, the ranking information determination step uses a mailing list set as a set of a plurality of mail addresses in the mail address data acquired as ranking information, as a mail address corresponding to each user. The method includes a step of executing a conversion process.

さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング情報決定ステップは、ランキング情報として取得するメールアドレスデータを、メールアドレス情報とユーザ名とを対応付けたユーザ情報データを格納したユーザ情報格納部から取得するユーザ情報に従って、ユーザ名に変換し、ランキング情報を生成する処理を実行するステップを含むことを特徴とする。   Furthermore, in one embodiment of the computer program of the present invention, the ranking information determination step includes user information storing user information data in which mail address data acquired as ranking information is associated with mail address information and a user name. According to the user information acquired from a storage part, the step which converts into a user name and produces | generates ranking information is included, It is characterized by the above-mentioned.

さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング情報決定ステップは、ネットワークを介して転送されるメールデータから、前記ドキュメント情報のランキング処理に適用するランキング情報を取得した場合、前記インデックス格納部に格納済みのインデックスデータに、取得ランキング情報を追加する更新処理を実行することを特徴とする。   Furthermore, in one embodiment of the computer program of the present invention, when the ranking information determining step acquires ranking information to be applied to ranking processing of the document information from mail data transferred via a network, the index Update processing for adding acquired ranking information to index data already stored in the storage unit is performed.

さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング処理ステップは、前記ランキング情報の構成データに対して重み(W)または係数(N)を設定し、前記第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に基づいて、前記重み(W)および係数(N)と、該ランキング情報の構成データに検索実行ユーザが含まれるか否かによって異なる値とした変数とに基づいて、ドキュメント対応のランク値[R]を算出し、該算出したランク値[R]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成するステップを含むことを特徴とする。   Furthermore, in an embodiment of the computer program of the present invention, the ranking processing step sets a weight (W) or a coefficient (N) for the configuration data of the ranking information, and is included in the first search result. Based on the ranking information set corresponding to the document to be stored, the weight (W) and the coefficient (N), and variables having different values depending on whether or not the search execution user is included in the configuration data of the ranking information, Based on the document, a document-corresponding rank value [R] is calculated, and based on the calculated rank value [R], the sorting process of the documents included in the first search result is executed, and the ranking information is reflected. The method includes generating a second search result.

さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング処理ステップは、ランキング情報を構成するメール宛先情報(To)、メールコピー先情報(CC)、メール送信者情報(FROM)の各々について、重み(W)を決定し、さらに、ランキング情報を構成する文書の有無を示すデータについて文書有無に応じて異なる値とした係数(N)を設定するステップを含むことを特徴とする。   Furthermore, in an embodiment of the computer program of the present invention, the ranking processing step is performed for each of mail destination information (To), mail copy destination information (CC), and mail sender information (FROM) constituting the ranking information. , Determining a weight (W), and further setting a coefficient (N) having different values for data indicating the presence / absence of a document constituting the ranking information depending on the presence / absence of the document.

さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング処理ステップは、前記第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に含まれるメール送信日時情報としての日付データについて、同一ドキュメントについて最新のデータを取得する日付代表値[T]算出処理を実行し、該算出した日付代表値[T]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成するステップを含むことを特徴とする。   Furthermore, in an embodiment of the computer program of the present invention, the ranking processing step includes date data as mail transmission date / time information included in ranking information set corresponding to a document included in the first search result. For the same document, a date representative value [T] calculation process for obtaining the latest data is executed, and based on the calculated date representative value [T], a document included in the first search result is sorted. Executing and generating a second search result reflecting the ranking information.

さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング処理ステップは、前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用したソート処理を実行し、ランキング情報を反映した第2の検索結果を生成するステップであることを特徴とする。   Furthermore, in one embodiment of the computer program of the present invention, the ranking processing step executes a sorting process that applies the ranking information to the first search result generated by the search of the search unit, This is a step of generating a second search result reflecting the ranking information.

さらに、本発明の第3の側面は、
ランキング情報に基づくデータ処理を実行する情報処理方法であり、
ランキング情報決定部における処理であり、ネットワークを介して転送されるメールデータから、ドキュメント情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、インデックス格納部に格納する処理を実行するランキング情報決定ステップと、
検索部における処理であり、前記インデックス格納部の格納情報に基づいて検索処理を実行する検索ステップと、
ランキング処理部における処理であり、前記検索ステップにおける検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理ステップと、
を有することを特徴とする情報処理方法にある。
Furthermore, the third aspect of the present invention provides
An information processing method for executing data processing based on ranking information,
A process in the ranking information determination unit that acquires ranking information to be applied to document information ranking processing from mail data transferred via a network, and stores it in the index storage unit as ranking information corresponding to each document. Ranking information determination step to be executed;
A search step that is a process in the search unit, and executes a search process based on the storage information of the index storage unit;
A second search result reflecting the ranking information by executing the provision data generation process to which the ranking information is applied to the first search result generated by the search in the search step. A ranking processing step for generating
There is an information processing method characterized by comprising:

なお、本発明のコンピュータ・プログラムは、例えば、様々なプログラム・コードを実行可能なコンピュータシステムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体、例えば、CDやFD、MOなどの記録媒体、あるいは、ネットワークなどの通信媒体によって提供可能なコンピュータ・プログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、コンピュータシステム上でプログラムに応じた処理が実現される。   Note that the computer program of the present invention is a recording medium provided in a computer-readable format for a computer system capable of executing various program codes, for example, a recording medium such as a CD, FD, or MO. A computer program that can be provided by a medium or a communication medium such as a network. By providing such a program in a computer-readable format, processing corresponding to the program is realized on the computer system.

本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。   Other objects, features, and advantages of the present invention will become apparent from a more detailed description based on embodiments of the present invention described later and the accompanying drawings. In this specification, the system is a logical set configuration of a plurality of devices, and is not limited to one in which the devices of each configuration are in the same casing.

本発明の構成によれば、日常的にクライアントの送受信するメールから、ドキュメント(文書)のランキング情報として適用可能なデータを取得して、取得したデータをドキュメント情報格納部としてのインデックス格納部に格納し、これらのランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データに対して、ランキング処理を実行してユーザに提示する構成としたので、ユーザによる文書の推薦処理といった手間をかけることなく、ユーザに対応した最適なランキングを行った情報提供が可能となる。   According to the configuration of the present invention, data applicable as ranking information of a document (document) is acquired from a mail transmitted and received by a client on a daily basis, and the acquired data is stored in an index storage unit as a document information storage unit According to the ranking information, the document information provided to the client, for example, the search result data generated in response to the search request from the client, is configured to execute the ranking process and present it to the user. Thus, it is possible to provide information with an optimal ranking corresponding to the user without taking the trouble of recommending a document.

以下、図面を参照しながら本発明の情報処理装置、および情報処理方法、並びにコンピュータ・プログラムの詳細について説明する。   Details of the information processing apparatus, information processing method, and computer program of the present invention will be described below with reference to the drawings.

図1は本発明の適用可能な情報検索システムの全体構成を示す図である。情報検索システムは、検索処理を実行する検索実行装置としての情報処理装置110、情報処理装置110に対してネットワーク150を介して検索の依頼を行い、検索結果を受領するクライアント131−1〜n、情報処理装置110における検索対象のデータファイルを格納したファイルサーバ121、クライアントの送受信するメールを格納するメールサーバ122によって構成される。   FIG. 1 is a diagram showing the overall configuration of an information search system to which the present invention can be applied. The information search system includes an information processing apparatus 110 as a search execution apparatus that executes search processing, a client 131-1 to n that requests the information processing apparatus 110 via the network 150 and receives search results. The information processing apparatus 110 includes a file server 121 that stores data files to be searched, and a mail server 122 that stores mail sent and received by clients.

クライアント131、検索実行装置としての情報処理装置110、ファイルサーバ121、メールサーバ122は、ネットワーク150を介して接続されている。ネットワークは、インターネット、イントラネット、LAN等の通信ネットワークである。   The client 131, the information processing apparatus 110 as a search execution apparatus, the file server 121, and the mail server 122 are connected via a network 150. The network is a communication network such as the Internet, an intranet, or a LAN.

ファイルサーバ121は、例えば、業務で利用されるドキュメントが格納された種々の文書管理システムを統括的に管理するサーバである。なお、ドキュメントとは、クライアントに提示される情報、すなわち検索対象となりえるドキュメントである。ファイルサーバ121は、クライアント131の検索対象のドキュメント実体を格納したデータベースを管理している。   The file server 121 is a server that comprehensively manages, for example, various document management systems that store documents used in business. The document is information presented to the client, that is, a document that can be searched. The file server 121 manages a database that stores document entities to be searched by the client 131.

検索実行装置としての情報処理装置110は、ドキュメント実体は格納しておらず、ドキュメントの検索に適用可能なドキュメントID(文書ID)、要約、キーワードなど書誌事項、さらに、ランキング処理に適用するための様々なインデックス情報をインデックス格納部113に格納している。検索部112は、インデックス格納部113に格納されたインデックス情報に基づいて、例えばクライアントからの検索要求に応じた検索処理を実行し、ランキング処理を行ってユーザの興味の高いと判断されたドキュメント情報(インデックス格納部113に格納された情報)をリスト化して検索結果としてクライアントに提示する。   The information processing apparatus 110 as a search execution apparatus does not store a document entity, and is applied to a bibliographic item such as a document ID (document ID), a summary, and a keyword that can be applied to a document search, and further to ranking processing. Various index information is stored in the index storage unit 113. Based on the index information stored in the index storage unit 113, the search unit 112 executes, for example, a search process according to a search request from a client, performs a ranking process, and determines document information that has been determined to be of high user interest (Information stored in the index storage unit 113) is listed and presented as a search result to the client.

検索実行装置としての情報処理装置110は、ランキング情報決定部111、検索部112、インデックス格納部113、データ収集・登録処理部114、ユーザ情報格納部115、ランキング処理部116を有する。   The information processing apparatus 110 as a search execution apparatus includes a ranking information determination unit 111, a search unit 112, an index storage unit 113, a data collection / registration processing unit 114, a user information storage unit 115, and a ranking processing unit 116.

情報処理装置110のデータ収集・登録処理部114は、ファイルサーバ121からドキュメント対応のインデックス情報を取得してインデックス格納部113に格納する処理を実行する。例えば、ドキュメントの検索に適用可能なドキュメントID(文書ID)、要約、キーワードなどの様々なインデックス情報である。   The data collection / registration processing unit 114 of the information processing apparatus 110 executes processing for acquiring index information corresponding to a document from the file server 121 and storing it in the index storage unit 113. For example, various index information such as a document ID (document ID), a summary, and a keyword that can be applied to a document search.

ランキング情報決定部111は、クライアント131において送受信されているメールデータをメールサーバ122から取得し、取得したメールデータの属性情報、すなわち、メールの送受信ユーザ情報やメールの送信日付情報などの属性情報と、メール本文中に記述されているドキュメントの格納場所情報を抽出し、インデックス格納部113に、ドキュメントのインデックス情報を構成するランキング情報として格納する。   The ranking information determination unit 111 acquires mail data transmitted / received in the client 131 from the mail server 122, and attribute information of the acquired mail data, that is, attribute information such as mail transmission / reception user information and mail transmission date information, Then, the storage location information of the document described in the mail text is extracted and stored in the index storage unit 113 as ranking information constituting the index information of the document.

検索部112は、例えばクライアントからの検索要求、例えばキーワードに基づく検索式や、特定のカテゴリを指定したデータ検索要求などに応じて、インデックス格納部113に格納されたインデックス情報に基づく検索処理を実行して検索結果をクライアント131に提供する。なお、前述したように、ドキュメント本体は、ファイルサーバ121に格納されており、ドキュメント対応の書誌情報、キーワード、文書IDなどの各種インデックス情報がインデックス格納部113に格納されている。   The search unit 112 executes a search process based on index information stored in the index storage unit 113 in response to a search request from a client, for example, a search expression based on a keyword, a data search request specifying a specific category, or the like. The search result is provided to the client 131. As described above, the document main body is stored in the file server 121, and various index information such as bibliographic information, keywords, and document IDs corresponding to the document is stored in the index storage unit 113.

ランキング情報決定部111は、メールサーバ122から、クライアント131の送受信するメールデータを取得し、メールの属性情報、メール本文中に記述されているドキュメントの格納場所情報などを抽出して、これらをインデックス情報としてインデックス格納部113に格納する。ランキング処理部116は、このインデックス情報を、例えば検索結果としてユーザに提供するドキュメント情報リストのランキングに適用する。   The ranking information determination unit 111 acquires mail data transmitted / received by the client 131 from the mail server 122, extracts mail attribute information, document storage location information described in the mail text, and indexes them. The information is stored in the index storage unit 113 as information. The ranking processing unit 116 applies the index information to the ranking of the document information list provided to the user as a search result, for example.

ユーザ情報格納部115には、ユーザ名と、ユーザのメールアドレス、ユーザの所属などのユーザ情報が格納される。ランキング情報決定部111は、メールサーバ122から、クライアント131の送受信するメールデータを取得し、メール中に含まれるメールアドレスに基づいてユーザ情報格納部115からユーザ情報を取得し、取得したユーザ情報を適用してインデックス情報としてのランキング情報を生成し、インデックス格納部113に格納する。   The user information storage unit 115 stores user information such as a user name, a user email address, and a user affiliation. The ranking information determination unit 111 acquires mail data transmitted and received by the client 131 from the mail server 122, acquires user information from the user information storage unit 115 based on the mail address included in the mail, and obtains the acquired user information. By applying, ranking information as index information is generated and stored in the index storage unit 113.

ランキング処理部116は、インデックス格納部113に格納したランキング情報に基づいて、検索部112の実行した検索処理結果としての検索結果リストのランキング処理を実行する。これらの処理の詳細については後述する。ランキング処理部116は、インデックス格納部に格納されたインデックス情報、具体的には、ランキング情報を適用して、ユーザにとって価値の高いドキュメントを抽出して価値の高い順にランキングしたランキングリストを生成する。検索部112は、このランキングリストを検索結果としてクライアント131に提供する。   Based on the ranking information stored in the index storage unit 113, the ranking processing unit 116 executes ranking processing of a search result list as a search processing result executed by the search unit 112. Details of these processes will be described later. The ranking processing unit 116 applies index information stored in the index storage unit, specifically, ranking information, extracts documents with high value for the user, and generates a ranking list ranked in descending order of value. The search unit 112 provides this ranking list to the client 131 as a search result.

例えば、ユーザが検索を実行した際、検索結果として含まれるドキュメントのうち、ユーザ宛(またはCCにユーザアドレスが記述されていた)メールに、例えばドキュメント格納場所情報などドキュメント関連情報が記述されていたドキュメントについてリストの提示順序の優先度を上げた検索結果リストを生成してクライアントに提供する。本構成により、ユーザにとって価値が高いドキュメント、例えば、業務で参照することが要求されているドキュメント(文書)が検索結果リストにおいて優先的に提示されることとなる。この処理について、以下、詳細に説明する。   For example, when a user executes a search, out of documents included as a search result, document related information such as document storage location information is described in an email addressed to the user (or a user address is described in CC). A search result list in which the priority of the list presentation order is increased for a document is generated and provided to the client. With this configuration, a document having high value for the user, for example, a document (document) that is requested to be referred to in business, is preferentially presented in the search result list. This process will be described in detail below.

図2以下を参照して、検索実行装置としての情報処理装置110の実行する処理の詳細について説明する。   Details of processing executed by the information processing apparatus 110 as a search execution apparatus will be described with reference to FIG.

図2は、情報処理装置110のランキング情報決定部111、ランキング処理部116の実行する処理について、各処理機能毎に、順次説明する図である。図2に示すように、ランキング情報決定部111は、メール取得部201、ランキング情報抽出部202、メーリングリスト(ML)メンバー抽出部203、ユーザ情報抽出部204、更新文書決定部205、ランキング情報更新部206を有する。   FIG. 2 is a diagram for sequentially explaining the processing executed by the ranking information determination unit 111 and the ranking processing unit 116 of the information processing apparatus 110 for each processing function. As shown in FIG. 2, the ranking information determination unit 111 includes a mail acquisition unit 201, a ranking information extraction unit 202, a mailing list (ML) member extraction unit 203, a user information extraction unit 204, an updated document determination unit 205, a ranking information update unit. 206.

以下、これらの各処理部の実行する処理について、順次説明する。メール取得部201は、メールサーバ122からメール211を取得する。メール211は図1におけるクライアント131がネットワーク150を介して送受信するメールである。メール211のデータ構成例を図3に示す。   Hereinafter, processes executed by each of these processing units will be sequentially described. The mail acquisition unit 201 acquires the mail 211 from the mail server 122. A mail 211 is a mail sent and received by the client 131 in FIG. A data configuration example of the mail 211 is shown in FIG.

図3には2つのメール構成例(a),(b)を示している。いずれも、属性データ部301と、本文データ部302から構成されており、
属性データ部301には、
送信日時情報[DATE]
送信者情報[FROM]
主題[Subject]
宛先[To]
の各データが含まれ、さらに、(b)には、
コピー送付先[cc]
のデータを含む構成となっている。
FIG. 3 shows two mail configuration examples (a) and (b). Both are composed of an attribute data part 301 and a body data part 302,
In the attribute data part 301,
Transmission date / time information [DATE]
Sender information [FROM]
Theme [Subject]
Destination [To]
In addition, (b) includes
Copy destination [cc]
It is configured to include the data.

また、本文データ部302には、
ランキング情報抽出部202(図2参照)の抽出対象データとしてのドキュメント情報311〜313が含まれる。なお、ドキュメント情報311〜313は、ドキュメントの格納場所情報、ドキュメント名情報など、ドキュメントに関する各種情報を含む。
In the body data section 302,
Document information 311 to 313 as extraction target data of the ranking information extraction unit 202 (see FIG. 2) is included. The document information 311 to 313 includes various information related to the document such as document storage location information and document name information.

図2に示すランキング情報抽出部202は、メール取得部201がメールサーバ122から取得したメール211から、インデックス格納部113に格納すべきランキング情報(1)212の抽出処理を行なう。   The ranking information extraction unit 202 shown in FIG. 2 performs an extraction process of ranking information (1) 212 to be stored in the index storage unit 113 from the mail 211 acquired by the mail acquisition unit 201 from the mail server 122.

図4を参照して、ランキング情報抽出部202がメール211から抽出するランキング情報(1)212について説明する。ランキング情報抽出部202がメールから抽出するランキング情報には、図4に示すように、以下のデータが含まれる。
(1)メール本文中に記述されているドキュメント情報
(1a)ドキュメント格納場所情報(パス)
(1b)ドキュメント格納場所情報(文書名)
(2)メール宛先情報(To)
(3)メールコピー先情報(CC)
(4)メール送信者情報(FROM)
(5)メール送信日時情報(DATE)
少なくとも、上記(1)〜(5)中、(1)のドキュメント情報は必須情報であり、ドキュメント情報を含むメールについてのみ、その他の書誌情報として、上記(2)〜(5)について、メールから取得可能な情報を取得する。ドキュメント情報が含まれないメールデータについては、ランキング情報として適用しないので情報取得の必要はない。
With reference to FIG. 4, the ranking information (1) 212 that the ranking information extraction unit 202 extracts from the mail 211 will be described. The ranking information extracted from the mail by the ranking information extraction unit 202 includes the following data as shown in FIG.
(1) Document information described in the mail text (1a) Document storage location information (path)
(1b) Document storage location information (document name)
(2) Mail destination information (To)
(3) Mail copy destination information (CC)
(4) Mail sender information (FROM)
(5) Mail transmission date / time information (DATE)
At least in (1) to (5) above, the document information of (1) is indispensable information, and only the mail including the document information is used as other bibliographic information. Acquire information that can be acquired. Mail data that does not include document information is not applied as ranking information, so there is no need to acquire information.

次に、図2に示すメーリングリスト(ML)抽出部203が、メールサーバ122に問い合わせを実行して、メーリングリスト(ML)と、メーリングリストの構成メンバーの対応データを記述したMLメンバーデータ217を取得し、取得した情報に基づいて、ランキング情報抽出部202が生成したランキング情報(1)212の更新を実行し、ランキング情報(2)213を生成する。   Next, the mailing list (ML) extraction unit 203 shown in FIG. 2 executes an inquiry to the mail server 122 to obtain the ML member data 217 describing the mailing list (ML) and the corresponding data of the constituent members of the mailing list, Based on the acquired information, the ranking information (1) 212 generated by the ranking information extraction unit 202 is updated to generate ranking information (2) 213.

図2に示すメーリングリスト(ML)抽出部203が、メールサーバ122から取得するMLメンバーデータ217の構成例を図5に示す。ML(メーリングリスト)メンバーデータ217は、図5に示すように、メーリングリスト(ML)と、メーリングリストの構成メンバーの対応データからなるテーブルデータである。図に示す例では、例えば、
ML:ProjectA・・・
は、メンバーとして、
fuji.hanako@xyz・・・
asama.taro@xyz・・・
hakuba.ichiro@xyz・・・
の各メンバーを含むことを示している。
FIG. 5 shows a configuration example of the ML member data 217 acquired from the mail server 122 by the mailing list (ML) extraction unit 203 shown in FIG. As shown in FIG. 5, ML (mailing list) member data 217 is table data including a mailing list (ML) and corresponding data of members of the mailing list. In the example shown in the figure, for example,
ML: ProjectA ...
As a member
fuji.hanako@xyz ...
asama.taro@xyz ...
hakuba.ichiro@xyz ...
Including each member.

図2に示すメーリングリスト(ML)メンバー抽出部203は、これらの情報をメールサーバ122から取得し、これらの情報に基づいて、ランキング情報抽出部202が生成したランキング情報(1)212の更新を実行し、ランキング情報(2)213を生成する。   The mailing list (ML) member extraction unit 203 shown in FIG. 2 acquires these pieces of information from the mail server 122, and updates the ranking information (1) 212 generated by the ranking information extraction unit 202 based on these pieces of information. Then, ranking information (2) 213 is generated.

メーリングリスト(ML)メンバー抽出部203の生成するランキング情報(2)213のデータ構成例を図6に示す。図6に示すランキング情報(2)は、先に図4を参照して説明したランキング情報(1)の更新情報であり、メール宛先情報(To)の項目に対応するデータが、更新されている。   A data configuration example of the ranking information (2) 213 generated by the mailing list (ML) member extraction unit 203 is shown in FIG. The ranking information (2) shown in FIG. 6 is the update information of the ranking information (1) described above with reference to FIG. 4, and the data corresponding to the item of the mail destination information (To) is updated. .

すなわち、図4に示したメール宛先情報(To)の項目に対応するデータに含まれるML(メーリングリスト)について、図5に示すMLメンバーデータに基づいて、メンバーに対応するアドレスデータに置き換えられている。具体的には、たとえば図4に示すパス¥PC1¥dataのメール宛先情報(To)の項目には、
ML:ProjectA・・・
のメーリングリストデータが格納されているが、
図6の対応データ格納部には、ML:ProjectA・・・のメーリングリストデータを図5に示すMLメンバーデータに基づいて、メンバーに対応するアドレスデータ、すなわち、
fuji.hanako@xyz・・・
asama.taro@xyz・・・
hakuba.ichiro@xyz・・・
の各メンバーのアドレスデータに置き換えられてる。
That is, ML (mailing list) included in the data corresponding to the item of the mail destination information (To) shown in FIG. 4 is replaced with address data corresponding to the member based on the ML member data shown in FIG. . Specifically, for example, the mail destination information (To) item of the path \ PC1 \ data shown in FIG.
ML: ProjectA ...
Mailing list data is stored,
In the corresponding data storage unit of FIG. 6, the mailing list data of ML: ProjectA... Is based on the ML member data shown in FIG.
fuji.hanako@xyz ...
asama.taro@xyz ...
hakuba.ichiro@xyz ...
It has been replaced with the address data of each member.

このように、メーリングリスト(ML)メンバー抽出部203は、ランキング情報抽出部202の生成するランキング情報(1)212にメーリングリスト(ML)に相当するアドレス情報が含まれる場合、これらのMLデータを各個人のユーザアドレスに変更する処理を実行する。なお、上述の例では、宛先(To)データのみを対象とした処理例を示したが、その他、(CC)などのアドレスデータがMLデータによって記述されている場合も、同様のメンバーアドレスへの展開処理を実行する。   As described above, when the ranking information (1) 212 generated by the ranking information extraction unit 202 includes address information corresponding to the mailing list (ML), the mailing list (ML) member extraction unit 203 converts these ML data to each individual person. To change to the user address. In the above example, a processing example for only the destination (To) data has been shown. However, in the case where address data such as (CC) is described by ML data, Execute the expansion process.

次に、図2に示すユーザ情報抽出部204は、メーリングリスト(ML)メンバー抽出部203の生成したランキング情報(2)(図6参照)に、含まれるメールアドレスをキーとして、ユーザ情報格納部115から、メールアドレス対応のユーザ情報218を取得し、ランキング情報(2)(図6参照)に記録されたアドレスデータをユーザ情報に置き換えたランキング情報(3)214を生成する。   Next, the user information extraction unit 204 shown in FIG. 2 uses the email address included in the ranking information (2) (see FIG. 6) generated by the mailing list (ML) member extraction unit 203 as a key to the user information storage unit 115. Then, the user information 218 corresponding to the mail address is obtained, and the ranking information (3) 214 is generated by replacing the address data recorded in the ranking information (2) (see FIG. 6) with the user information.

図2に示すユーザ情報抽出部204が、メーリングリスト(ML)メンバー抽出部203の生成したランキング情報(2)(図6参照)に、含まれるメールアドレスをキーとして、ユーザ情報格納部115から取得するユーザ情報218の例を図7に示し、ランキング情報(2)(図6参照)に記録されたアドレスデータをユーザ情報に置き換えたランキング情報(3)214の例を図8に示す。   The user information extraction unit 204 shown in FIG. 2 acquires the ranking information (2) (see FIG. 6) generated by the mailing list (ML) member extraction unit 203 from the user information storage unit 115 using the mail address included as a key. An example of user information 218 is shown in FIG. 7, and an example of ranking information (3) 214 in which the address data recorded in ranking information (2) (see FIG. 6) is replaced with user information is shown in FIG.

図7に示すように、ユーザ情報格納部115から取得するユーザ情報218は、ユーザのメールアドレスと、ユーザ名、ユーザ所属先情報などを対応付けたデータとして構成される。図2に示すユーザ情報抽出部204は、メーリングリスト(ML)メンバー抽出部203の生成したランキング情報(2)(図6参照)に、含まれるメールアドレスに対応するユーザ情報を取得し、取得情報に基づいてランキング情報(2)(図6参照)を更新し、図8に示すランキング情報(3)を生成する。   As shown in FIG. 7, the user information 218 acquired from the user information storage unit 115 is configured as data in which a user's email address is associated with a user name, user affiliation information, and the like. The user information extraction unit 204 illustrated in FIG. 2 acquires user information corresponding to the mail address included in the ranking information (2) (see FIG. 6) generated by the mailing list (ML) member extraction unit 203, and obtains the acquired information. Based on the ranking information (2) (see FIG. 6), the ranking information (3) shown in FIG. 8 is generated.

図8に示すランキング情報(3)は、図6に示したランキング情報(2)のアドレス情報がユーザ名に変更されたデータ構成を持つ。すなわち、メール宛先情報(To)、メールコピー先情報(CC)、メール送信者情報(FROM)の各欄に記録されていたアドレス情報がユーザ名として置き換えられている。なお、ここでは、ユーザ名のみをユーザ情報として設定した例を示しているが、所属などのユーザ情報を設定する構成としてもよい。   The ranking information (3) shown in FIG. 8 has a data structure in which the address information of the ranking information (2) shown in FIG. 6 is changed to a user name. That is, the address information recorded in each column of the mail destination information (To), the mail copy destination information (CC), and the mail sender information (FROM) is replaced with the user name. Here, an example is shown in which only the user name is set as user information, but user information such as affiliation may be set.

次に、図2に示す更新文書決定部205は、ユーザ情報抽出部204が生成したランキング情報(3)214(図8参照)に基づいて、ランキング情報(3)214(図8参照)に含まれるドキュメント情報に対応するドキュメント(文書)に関するインデックス情報を更新リスト215としてインデックス格納部113から取得する。   Next, the updated document determination unit 205 shown in FIG. 2 is included in the ranking information (3) 214 (see FIG. 8) based on the ranking information (3) 214 (see FIG. 8) generated by the user information extraction unit 204. Index information related to a document (document) corresponding to the document information to be acquired is acquired from the index storage unit 113 as an update list 215.

更新文書決定部205は、ユーザ情報抽出部204が生成したランキング情報(3)214(図8参照)に設定されているドキュメント(文書)情報に対応するドキュメント(文書)情報を持つインデックス情報を更新リスト215としてインデックス格納部113から取得する。   The update document determination unit 205 updates the index information having document (document) information corresponding to the document (document) information set in the ranking information (3) 214 (see FIG. 8) generated by the user information extraction unit 204. Obtained from the index storage unit 113 as a list 215.

図9に、インデックス格納部113から取得する更新リスト215の例を示す。図9に示す更新リストは、図8に示すランキング情報(3)に記録されたドキュメント(文書)情報に基づいて、インデックス格納部113から対応するドキュメント(文書)情報を持つインデックス情報(ランキング情報を含む)を取得した結果である。すなわち、図8に示すランキング情報(3)に記録されたドキュメント(文書)情報は、
パス:¥¥PC1¥data,文書:doc.txt
パス:http://ww.・・・,文書:download.html
パス:¥¥PCN¥data¥ProjectA・・・
の3つあり、これらの3ドキュメントについて、既にインデックス格納部113に格納されたインデックス情報が、ランキングデータの更新対象データ、すなわち更新リスト215としてインデックス格納部113から取得される。
FIG. 9 shows an example of the update list 215 acquired from the index storage unit 113. The update list shown in FIG. 9 is based on the document (document) information recorded in the ranking information (3) shown in FIG. It is the result of having acquired. That is, the document (document) information recorded in the ranking information (3) shown in FIG.
Path: \\ PC1 \ data, document: doc. txt
Path: http: // ww ...., document: download. html
Path: \\ PCN \ data \ ProjectA ...
For these three documents, the index information already stored in the index storage unit 113 is acquired from the index storage unit 113 as the update target data of the ranking data, that is, the update list 215.

図9に示すデータが、インデックス格納部113から取得されるインデックス格納部113に格納済みのインデックスデータであり、
パス:¥¥PC1¥data,文書:doc.txt
パス:http://ww.・・・,文書:download.html
パス:¥¥PCN¥data¥ProjectA・・・
の3ドキュメントについてのインデックスデータである。
The data shown in FIG. 9 is index data already stored in the index storage unit 113 acquired from the index storage unit 113.
Path: \\ PC1 \ data, document: doc. txt
Path: http: // ww ...., document: download. html
Path: \\ PCN \ data \ ProjectA ...
Index data for the three documents.

インデックス格納部113に格納されるインデックスデータは、図9に示すように、ドキュメント(文書)情報と、ランキング情報によって構成される。ドキュメント情報には、ドキュメントの格納場所データとして、パス名、文書名などが格納される。また、ランキング情報は、後述するランキング処理に適用可能な情報であり、
(a)メール宛先情報(To)
(b)メールコピー先情報(CC)
(c)メール送信者情報(FROM)
(d)メール送信日時情報(DATE)
(e)文書名有無
の各データが格納される。
上記(a)〜(e)の各データは、ランキング情報決定部111が取得したメールに基づくランキングデータであり、メールに設定された、メール宛先情報(To)、メールコピー先情報(CC)、メール送信者情報(FROM)、メール送信日時情報(DATE)を記録したデータである。文書名の有無は、ランキング情報決定部111が取得したメールに文書名が含まれていた(True)か否(False)かのデータである。
As shown in FIG. 9, the index data stored in the index storage unit 113 includes document (document) information and ranking information. The document information stores a path name, a document name, and the like as document storage location data. The ranking information is information applicable to ranking processing described later,
(A) Mail destination information (To)
(B) Mail copy destination information (CC)
(C) Mail sender information (FROM)
(D) Mail transmission date / time information (DATE)
(E) Document name presence / absence data is stored.
Each of the data (a) to (e) is ranking data based on the mail acquired by the ranking information determination unit 111, and the mail destination information (To), mail copy destination information (CC), This is data in which mail sender information (FROM) and mail transmission date / time information (DATE) are recorded. The presence / absence of the document name is data indicating whether the document name is included in the email acquired by the ranking information determination unit 111 (True) or not (False).

図2に示すランキング情報更新部206は、インデックス格納部113から取得した更新リスト215(図9参照)を、ユーザ情報抽出部204の生成したランキング情報(3)(図8参照)に従って更新処理を実行し、更新インデックス216を生成して、インデックス格納部113に格納する。   2 updates the update list 215 (see FIG. 9) acquired from the index storage unit 113 according to the ranking information (3) (see FIG. 8) generated by the user information extraction unit 204. The update index 216 is generated and stored in the index storage unit 113.

図2に示すランキング情報更新部206の生成する更新インデックス216の例を図10に示す。図10において、ランキング情報部の太線枠内データ部351〜354が、ユーザ情報抽出部204の生成したランキング情報(3)(図8参照)に従って更新されたデータ部である。これらのデータは、更新リスト215(図9参照)には含まれていないデータである。   An example of the update index 216 generated by the ranking information update unit 206 shown in FIG. 2 is shown in FIG. In FIG. 10, the data units 351 to 354 in the thick line frame of the ranking information part are data parts updated according to the ranking information (3) (see FIG. 8) generated by the user information extraction unit 204. These data are not included in the update list 215 (see FIG. 9).

更新リスト215(図9参照)は、図10に示す太線枠内データ部351〜354以外のデータのみからなり、ランキング情報更新部206は、新たに、ユーザ情報抽出部204の生成したランキング情報(3)(図8参照)のデータ、すなわち、太線枠内データ部351〜354を追加して更新インデックス216を生成して、インデックス格納部113に格納する。   The update list 215 (see FIG. 9) includes only data other than the data portions 351 to 354 in the thick line frame shown in FIG. 10, and the ranking information update unit 206 newly creates the ranking information ( 3) The update index 216 is generated by adding the data (see FIG. 8), that is, the data units 351 to 354 in the thick line frame, and stored in the index storage unit 113.

次に、ランキング処理部116の処理について説明する。前述したように、ランキング処理部116は、インデックス格納部113に格納したランキング情報に基づいて、検索部112の実行した検索処理結果としての検索結果リストのランキング処理を実行する。すなわち、インデックス格納部113に格納されたインデックス情報、具体的には、ランキング情報を適用して、ユーザにとって価値の高いドキュメントを抽出して価値の高い順にランキングしたランキングリストを生成する。検索部112は、このランキングリストを検索結果としてクライアント131に提供する。   Next, processing of the ranking processing unit 116 will be described. As described above, the ranking processing unit 116 executes ranking processing of a search result list as a search processing result executed by the search unit 112 based on the ranking information stored in the index storage unit 113. That is, index information stored in the index storage unit 113, specifically, ranking information, is applied to extract documents with high value for the user and generate a ranking list ranked in descending order of value. The search unit 112 provides this ranking list to the client 131 as a search result.

ランキング処理部116は、検索部112の検索結果に含まれるドキュメントのランキングを実行するため、まず、ランキング情報ごとの重みと係数を設定する。この処理について、図11を参照して説明する。   The ranking processing unit 116 first sets a weight and a coefficient for each ranking information in order to perform ranking of documents included in the search result of the search unit 112. This process will be described with reference to FIG.

ランキング情報は、インデックス格納部113に格納されたインデックス情報に含まれるデータであり、図10を参照して説明したように、ドキュメント情報に対応付けられた以下のデータ項目によって構成される。すなわち、
(a)メール宛先情報(To)
(b)メールコピー先情報(CC)
(c)メール送信者情報(FROM)
(d)メール送信日時情報(DATE)
(e)文書名有無
The ranking information is data included in the index information stored in the index storage unit 113, and includes the following data items associated with the document information as described with reference to FIG. That is,
(A) Mail destination information (To)
(B) Mail copy destination information (CC)
(C) Mail sender information (FROM)
(D) Mail transmission date / time information (DATE)
(E) Document name presence / absence

ランキング処理部116は、これらのランキング情報各々について重み(W)と係数(N)を定める。重み(W)と係数(N)の決定態様は、様々な設定が可能である。ここで示す例は、メール送信日時情報としての日付データは、ソート処理に適用するデータ項目とし、
(a)メール宛先情報(To)
(b)メールコピー先情報(CC)
(c)メール送信者情報(FROM)
に、それぞれ重み(W)を設定し、
(e)文書名有無
のデータに係数(N)を設定した処理例を説明する。
The ranking processing unit 116 determines a weight (W) and a coefficient (N) for each of the ranking information. Various settings are possible for the manner of determining the weight (W) and the coefficient (N). In the example shown here, the date data as the email transmission date and time information is a data item to be applied to the sorting process,
(A) Mail destination information (To)
(B) Mail copy destination information (CC)
(C) Mail sender information (FROM)
Set the weight (W) to
(E) An example of processing in which a coefficient (N) is set in the document name presence / absence data will be described.

ランキング処理部116は、図11に示すように、
(a)メール宛先情報(To)の重みをWTO
(b)メールコピー先情報(CC)の重みをWCC
(c)メール送信者情報(FROM)の重みをWFROM
とし、
(e)文書名有無
のデータに係数を、
Trueの場合の係数:N=NTRUE
Falseの場合の係数:N=NFALSE
とする。
The ranking processing unit 116, as shown in FIG.
(A) The weight of the mail destination information (To) is W TO ,
(B) The weight of the mail copy destination information (CC) is W CC ,
(C) The weight of the mail sender information (FROM) is set to W FROM ,
age,
(E) A coefficient is added to the document name data.
Coefficient for True: N = N TRUE
Coefficient for False: N = N FALSE
And

ランキング処理部116は、これらの重み(W)、係数(N)に基づいて、検索部112の実行した検索結果に対してランキング処理を実行する。検索部112の実行した検索に基づく検索結果を図2に示す検索結果(1)221とし、ランキング処理部116におけるランキング処理を実行した検索結果を検索結果(2)222とする。   The ranking processing unit 116 performs ranking processing on the search results executed by the search unit 112 based on these weights (W) and coefficients (N). The search result based on the search executed by the search unit 112 is set as a search result (1) 221 shown in FIG. 2, and the search result executed by the ranking process in the ranking processing unit 116 is set as a search result (2) 222.

図12のフローチャートを参照して、検索部112の実行した検索に基づく検索結果(1)から、ランキング処理部116におけるランキング処理を実行し、検索結果(2)を取得する処理手順について説明する。   With reference to the flowchart of FIG. 12, a processing procedure for executing the ranking process in the ranking processing unit 116 and obtaining the search result (2) from the search result (1) based on the search performed by the search unit 112 will be described.

ランキング処理部116は、まず、検索部112の実行した検索に基づく検索結果(1)を入力すると、ステップS101〜ステップS105において、検索結果(1)に含まれるドキュメント(文書)各々について、
ランク値[R]、
日付代表値[T]、
を定める。
First, the ranking processing unit 116 inputs a search result (1) based on the search executed by the search unit 112, and in steps S101 to S105, for each document (document) included in the search result (1).
Rank value [R],
Date representative value [T],
Determine.

まず、ステップS101において、検索結果(1)から処理対象のドキュメント(文書)を選択し、ステップS102において、選択ドキュメント(文書)に含まれる各ランキング情報(ロー(行))についてランク値[r]を、下記式、
r=(isTO×WTO+isCC×WCC+isFROM×WFROM)×N
にしたがって、算出する。
上記式において、
isTOは、ランキング情報におけるメール宛先情報(To)のデータ欄に検索実行者のユーザ名が存在する場合は[1]、存在しない場合は[0]となる値をとる。
isCCは、ランキング情報におけるメールコピー先情報(CC)のデータ欄に検索実行者のユーザ名が存在する場合は[1]、存在しない場合は[0]となる値をとる。
isFROMは、ランキング情報におけるメール送信者情報(FROM)のデータ欄に検索実行者のユーザ名が存在する場合は[1]、存在しない場合は[0]となる値をとる。
First, in step S101, a document (document) to be processed is selected from the search result (1), and in step S102, the rank value [r] for each ranking information (row (row)) included in the selected document (document). With the following formula:
r = (isTO × W TO + isCC × W CC + isFROM × W FROM ) × N
According to the calculation.
In the above formula,
The isTO takes a value of [1] when the user name of the search executor exists in the data field of the mail destination information (To) in the ranking information, and [0] when it does not exist.
The isCC takes a value of [1] if the user name of the search executor exists in the data field of the mail copy destination information (CC) in the ranking information, and [0] otherwise.
The isFROM takes a value [1] when the user name of the search executor exists in the data field of the mail sender information (FROM) in the ranking information, and [0] when it does not exist.

上記式に従って、選択ドキュメント(文書)に含まれる各ランキング情報(ロー(行))についてのランク値[r]を算出し、ステップS103において、選択文書に対する全てのランキング情報のランク値算出処理の終了を判定し、終了していない場合は、ステップS102戻り、選択文書に対する未処理のランキング情報のランク値算出を実行する。   In accordance with the above formula, the rank value [r] for each ranking information (row (row)) included in the selected document (document) is calculated. In step S103, the rank value calculation processing for all ranking information for the selected document is completed. If the process is not completed, the process returns to step S102 to calculate the rank value of unprocessed ranking information for the selected document.

選択文書に対する全てのランキング情報のランク値算出処理が終了した場合は、ステップS104に進み、各ランキング情報(ロー(行))についてのランク値[r]を積算:ΣR+して、選択ドキュメント(文書)のランク値[R]を求める。   When the rank value calculation processing of all ranking information for the selected document is completed, the process proceeds to step S104, and the rank value [r] for each ranking information (row (row)) is integrated: ΣR + to select the selected document (document ) For the rank value [R].

なお、日付代表値[T]は、ステップS101において算出される値であり、処理対象の1つの文書に対して、複数のランキング情報が存在する場合は、最新の日付を日付代表値[T]とする。   The date representative value [T] is a value calculated in step S101. When a plurality of ranking information exists for one document to be processed, the date representative value [T] is the latest date. And

このように、ランク値[R]は、処理対象の1つの文書に対して、複数のランキング情報が存在する場合は、各ランキング情報単位で算出し、全ての算出値の積算値を、そのドキュメント(文書)のランキング値[R]とする。また、日付代表値[T]は、処理対象の1つの文書に対して、複数のランキング情報が存在する場合は、最新の日付を日付代表値[T]とする。   As described above, the rank value [R] is calculated for each ranking information unit when a plurality of ranking information exists for one document to be processed, and the integrated value of all the calculated values is calculated for the document. The (document) ranking value [R] is used. The date representative value [T] is the date representative value [T] when there is a plurality of ranking information for one document to be processed.

図12に示すステップS101〜S105において、検索結果(1)に含まれるドキュメント(文書)各々について、
ランク値[R]、
日付代表値[T]、
が算出された後、ステップS106において、検索結果(1)に含まれるドキュメント(文書)のリストを、ドキュメント(文書)各々についてのランク値[R]と、日付代表値[T]とを適用してソート処理を実行して、検索結果(2)222(図2参照)を生成する。
In steps S101 to S105 shown in FIG. 12, for each document (document) included in the search result (1),
Rank value [R],
Date representative value [T],
In step S106, the list of documents (documents) included in the search result (1) is applied with the rank value [R] and the date representative value [T] for each document (document). The sort process is executed to generate a search result (2) 222 (see FIG. 2).

具体的な処理例について、図13を参照して説明する。図13(a)は、検索部112の検索結果(1)を示している。例えばクライアントが示したキーワードなどに基づく検索条件に従って、検索部112がインデックス格納部113に格納されたインデックスに基づいて抽出した検索結果データである。前述したように、インデックス情報は、ドキュメント(文書)情報と、ランキング情報とによって構成されている。ランキング情報は、それぞれメールに基づいて取得されたデータである。   A specific processing example will be described with reference to FIG. FIG. 13A shows the search result (1) of the search unit 112. For example, search result data extracted by the search unit 112 based on an index stored in the index storage unit 113 in accordance with a search condition based on, for example, a keyword indicated by the client. As described above, the index information is composed of document (document) information and ranking information. The ranking information is data acquired based on each email.

例えば、検索結果ID[1]に対応する文書、すなわち、
パス:¥¥PC1¥data、文書名:doc.txt
の文書は、それぞれ異なるメールに基づいて取得された3つのランキング情報421〜423を有することを意味している。
For example, the document corresponding to the search result ID [1], that is,
Path: \\ PC1 \ data, document name: doc. txt
Means that the document has three pieces of ranking information 421 to 423 acquired based on different mails.

図13を参照して、図13(a)の検索結果(1)に含まれるドキュメント(文書)として、検索結果ID[1]に対応する文書、すなわち、
パス:¥¥PC1¥data、文書名:doc.txt
についてのランク値[R]と、日付代表値[T]の算出処理例について説明する。
Referring to FIG. 13, as a document (document) included in search result (1) of FIG. 13A, a document corresponding to search result ID [1], that is,
Path: \\ PC1 \ data, document name: doc. txt
An example of the calculation process of the rank value [R] and the date representative value [T] will be described.

ここで、検索実施ユーザは、図13(c)に示すように、
ユーザ名:asama
であるとする。
また、前述した重み[W]と、係数[T]は、図13(c)に示すように、
(a)メール宛先情報(To)の重みをWTO=100
(b)メールコピー先情報(CC)の重みをWCC=50
(c)メール送信者情報(FROM)の重みをWFROM=70
として設定され、また、
(e)文書名有無
のデータに対する係数が、
Trueの場合の係数:NTRUE=1、
Falseの場合の係数:NFALSE=0.5
として設定されているものとする。
Here, as shown in FIG.
User name: asama
Suppose that
Further, the weight [W] and the coefficient [T] described above are as shown in FIG.
(A) The weight of the mail destination information (To) is set to W TO = 100
(B) The weight of the mail copy destination information (CC) is W CC = 50
(C) The weight of the mail sender information (FROM) is set to W FROM = 70
Is also set as
(E) The coefficient for the document name presence / absence data is
Coefficient for True: N TRUE = 1,
Coefficient for False: N FALSE = 0.5
Is set as.

このとき、図13(a)に示す
パス:¥¥PC1¥data、文書名:doc.txt
についてのランク値[R]と、日付代表値[T]は、
図13(b)に示す算出式によって求められる。すなわち、
R=(1×100+0×50+0×70)×1
+(1×100+0×50+0×70)×1
+(1×100+0×50+0×70)×0.5
=250
となる。
At this time, the path shown in FIG. 13A: \\ PC1 \ data, document name: doc. txt
The rank value [R] and date representative value [T] for
It is calculated | required by the calculation formula shown in FIG.13 (b). That is,
R = (1 × 100 + 0 × 50 + 0 × 70) × 1
+ (1 × 100 + 0 × 50 + 0 × 70) × 1
+ (1 × 100 + 0 × 50 + 0 × 70) × 0.5
= 250
It becomes.

上記式において、
(1×100+0×50+0×70)×1
は、パス:¥¥PC1¥data、文書名:doc.txtのランキング情報中の最上段のロー(行)421のランキング情報データに基づく算出式であり、
最初の[1×100]は、メール宛先情報(To)のデータ、すなわち、図13のデータ401に基づいており、データ401に、
検索ユーザ名:asama
が含まれていることで[1]が設定され、さらに、メール宛先情報(To)の重み:WTO=100を乗算している。
次の[0×50]は、メールコピー先情報(CC)のデータ、すなわち、図13のデータ402に基づいており、データ402に、
検索ユーザ名:asama
が含まれていないことで[0]が設定され、さらに、メールコピー先情報(CC)の重み:WCC=50を乗算している。
次の[0×70]は、メール送信者情報(FROM)のデータ、すなわち、図13のデータ403に基づいており、データ403に、
検索ユーザ名:asama
が含まれていないことで[0]が設定され、さらに、メール送信者情報(FROM)の重み:WFROM=70を乗算している。
最後の[×1]は、文書名ありのデータ、すなわち、図13のデータ404に基づいており、データ404に設定された情報が、文書名あり[True]を示していることから、文書名有無のデータに対する係数としての、Trueの場合の係数:NTRUE=1、
を乗算している。
In the above formula,
(1 × 100 + 0 × 50 + 0 × 70) × 1
Is: path: \\ PC1 \ data, document name: doc. It is a calculation formula based on the ranking information data of the top row (row) 421 in the ranking information of txt,
The first [1 × 100] is based on the data of the mail destination information (To), that is, the data 401 of FIG.
Search user name: asama
[1] is set, and the weight of the mail destination information (To): W TO = 100 is further multiplied.
The next [0 × 50] is based on the mail copy destination information (CC) data, that is, the data 402 in FIG.
Search user name: asama
Is not included, [0] is set, and the weight of mail copy destination information (CC): W CC = 50 is further multiplied.
The next [0 × 70] is based on the mail sender information (FROM) data, that is, the data 403 in FIG.
Search user name: asama
Is not included, [0] is set, and the weight of mail sender information (FROM): W FROM = 70 is further multiplied.
The last [× 1] is based on the data with the document name, that is, the data 404 in FIG. 13, and the information set in the data 404 indicates [True] with the document name. Coefficient for True as coefficient for presence / absence data: N TRUE = 1,
Is multiplied.

図13(b)に示すランク値[R]の算出式中の第2行の式、すなわち、
(1×100+0×50+0×70)×1
は、図13に示すパス:¥¥PC1¥data、文書名:doc.txtのランキング情報中の中段のロー(行)422のランキング情報に対応する算出式であり、
図13(b)に示すランク値[R]の算出式中の第3行の式、すなわち、
(1×100+0×50+0×70)×0.5
は、図13に示すパス:¥¥PC1¥data、文書名:doc.txtのランキング情報中の下段のロー(行)423のランキング情報に対応する算出式である。
The formula in the second row in the formula for calculating the rank value [R] shown in FIG.
(1 × 100 + 0 × 50 + 0 × 70) × 1
Is a path shown in FIG. 13: \\ PC1 \ data, document name: doc. It is a calculation formula corresponding to the ranking information of the middle row (row) 422 in the ranking information of txt,
The formula in the third row in the formula for calculating the rank value [R] shown in FIG.
(1 x 100 + 0 x 50 + 0 x 70) x 0.5
Is a path shown in FIG. 13: \\ PC1 \ data, document name: doc. This is a calculation formula corresponding to the ranking information of the lower row (row) 423 in the ranking information of txt.

各ロー(行)421〜423は、いずれも、パス:¥¥PC1¥data、文書名:doc.txtのランキング情報として、それぞれ個別のメールにもとづいて取得されたランキング情報である。結果として、パス:¥¥PC1¥data、文書名:doc.txtに対応するランク値[R]は、これら3つのランキング情報に対応する算出ランク値の積算値として算出される。すなわち、
R=(1×100+0×50+0×70)×1
+(1×100+0×50+0×70)×1
+(1×100+0×50+0×70)×0.5
=250
となる。
Each row (line) 421 to 423 has a path: \\ PC1 \ data, a document name: doc. The ranking information acquired based on each individual mail as the ranking information of txt. As a result, path: \\ PC1 \ data, document name: doc. The rank value [R] corresponding to txt is calculated as an integrated value of the calculated rank values corresponding to these three ranking information. That is,
R = (1 × 100 + 0 × 50 + 0 × 70) × 1
+ (1 × 100 + 0 × 50 + 0 × 70) × 1
+ (1 × 100 + 0 × 50 + 0 × 70) × 0.5
= 250
It becomes.

一方、パス:¥¥PC1¥data、文書名:doc.txtの日付代表値[T]は、前述したように、処理対象の1つの文書に対して、複数のランキング情報が存在する場合は、最新の日付を日付代表値[T]とするという規則に基づいて、図13(b)に示すように、
T=max(2004/03/12,2004/03/08,2004/03/05)
=2004/03/12
として、求められる。
On the other hand, path: \\ PC1 \ data, document name: doc. As described above, the date representative value [T] of txt is based on the rule that the latest date is the date representative value [T] when a plurality of ranking information exists for one document to be processed. Based on this, as shown in FIG.
T = max (2004/03/12, 2004/03/08, 2004/03/05)
= 2004/03/12
As required.

このように、図12のステップS101、S102では、検索結果(1)に含まれるドキュメント(文書)について、ランク値[R]と、日付代表値[T]とが求められる。ランク値[R]と、日付代表値[T]は、検索結果(1)に含まれるドキュメント(文書)各々について算出される。   As described above, in steps S101 and S102 in FIG. 12, the rank value [R] and the date representative value [T] are obtained for the document (document) included in the search result (1). The rank value [R] and the date representative value [T] are calculated for each document (document) included in the search result (1).

上述した処理を検索結果(1)に含まれるドキュメント(文書)各々について実行して、検索結果(1)に含まれるドキュメント(文書)について、ランク値[R]と、日付代表値[T]が求められた後、図12のフローのステップS106に進む。   The above-described processing is executed for each document (document) included in the search result (1), and the rank value [R] and the date representative value [T] are obtained for the document (document) included in the search result (1). After the determination, the process proceeds to step S106 in the flow of FIG.

ステップS106では、検索結果(1)に含まれるドキュメント(文書)のリストを、ドキュメント(文書)各々についてのランク値[R]と、日付代表値[T]とを適用してソート処理を実行して、検索結果(2)222(図2参照)を生成する。   In step S106, the list of documents (documents) included in the search result (1) is sorted by applying the rank value [R] and the date representative value [T] for each document (document). The search result (2) 222 (see FIG. 2) is generated.

ソート結果として取得されるリスト、すなわち検索結果(2)の例を図14に示す。図14の検索結果(2)は、図12(a)に示す検索結果(1)に基づいて生成されたデータであり、検索結果(1)に示す各文書、すなわち、
(ID1)¥¥PC1¥data,doc.txt
(ID2)http://www・・・download.htm
(ID3)¥¥PCN¥data・・・Info.doc
の3文書について、ランク値[R]と、日付代表値[T]とを適用してソート処理を実行した結果が、図14に示す検索結果(2)である。
FIG. 14 shows an example of the list acquired as the sort result, that is, the search result (2). The search result (2) in FIG. 14 is data generated based on the search result (1) shown in FIG. 12A, and each document shown in the search result (1), that is,
(ID1) \\ PC1 \ data, doc. txt
(ID2) http: //www...download.htm
(ID3) \\ PCN \ data ... Info. doc
The search result (2) shown in FIG. 14 is the result of executing the sort process by applying the rank value [R] and the date representative value [T] to these three documents.

各文書のランク値[R]と、日付代表値[T]は、図14に示すように、
ID1の文書:ランク値R=250、日付代表値T=2004/03/12
ID2の文書:ランク値R=100、日付代表値T=2004/03/12
ID3の文書:ランク値R=220、日付代表値T=2004/03/08
として算出されている。
The rank value [R] and the date representative value [T] of each document are as shown in FIG.
Document with ID1: rank value R = 250, date representative value T = 2004/03/12
Document ID2: Rank value R = 100, date representative value T = 2004/03/12
Document with ID3: rank value R = 220, date representative value T = 2004/03/08
It is calculated as.

本例において、ソート処理は、図12のステップS106に記述しているように、ランク値[R]を第1キーとして、日付代表値[T]を第2キーとしてソート処理を実行する。結果として、図14に示すように、リスト順は、
(リスト1)ID1の文書:ランク値R=250、日付代表値T=2,004/03/1
(リスト2)ID3の文書:ランク値R=220、日付代表値T=2004/03/08
(リスト3)ID2の文書:ランク値R=100、日付代表値T=2004/03/12
として、検索結果(2)が生成される。
In this example, the sort process is performed using the rank value [R] as the first key and the date representative value [T] as the second key as described in step S106 of FIG. As a result, as shown in FIG.
(List 1) Document ID1: Rank value R = 250, Date representative value T = 2, 004/03/1
(List 2) Document ID3: Rank value R = 220, Date representative value T = 2004/03/08
(List 3) Document ID2: Rank value R = 100, date representative value T = 2004/03/12
As a result, the search result (2) is generated.

なお、上述のソート処理におけるソートキーの設定は一例であり、この他のソートキーの設定を適用してソートを行うことは可能である。   Note that the setting of the sort key in the sort process described above is an example, and it is possible to perform sorting by applying other sort key settings.

このように、本発明の構成では、日常的にクライアントの送受信するメールから、ドキュメント(文書)のランキング情報を取得して、取得したランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データに対して、ランキング処理を実行してユーザに提示することが可能となり、ユーザによる文書の推薦処理といった手間をかけることなく、ユーザに対応した最適なランキングを行った情報提供が可能となる。   As described above, according to the configuration of the present invention, the ranking information of the document (document) is acquired from the mail transmitted and received by the client on a daily basis, and the document information provided to the client according to the acquired ranking information, for example, from the client It is possible to perform ranking processing on the search result data generated in response to the search request and present it to the user, and the optimum ranking corresponding to the user can be obtained without trouble of document recommendation processing by the user. The information provided can be provided.

最後に、上述した処理を実行する情報処理装置110のハードウェア構成例について、図15を参照して説明する。   Finally, a hardware configuration example of the information processing apparatus 110 that performs the above-described processing will be described with reference to FIG.

CPU(Central Processing Unit)501は、OS(Operating System)、上述の実施例において説明した検索処理、ランキング情報決定処理、ランキング処理等の各処理の実行シーケンスを記述した各種コンピュータ・プログラムに従った処理を実行する制御部である。   A CPU (Central Processing Unit) 501 is a process according to various computer programs describing an execution sequence of each process such as an OS (Operating System), search processing, ranking information determination processing, ranking processing, and the like described in the above-described embodiments. It is a control part which performs.

ROM(Read Only Memory)502は、CPU501が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)503は、CPU501の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス504により相互に接続されている。   A ROM (Read Only Memory) 502 stores programs used by the CPU 501, calculation parameters, and the like. A RAM (Random Access Memory) 503 stores programs used in the execution of the CPU 501, parameters that change as appropriate during the execution, and the like. These are connected to each other by a host bus 504 including a CPU bus.

ホストバス504は、ブリッジ505を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス506に接続されている。   The host bus 504 is connected to an external bus 506 such as a PCI (Peripheral Component Interconnect / Interface) bus via a bridge 505.

キーボード508、ポインティングデバイス509は、ユーザにより操作される入力デバイスである。ディスプレイ510は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージで表示する。   A keyboard 508 and a pointing device 509 are input devices operated by the user. The display 510 includes a liquid crystal display device, a CRT (Cathode Ray Tube), or the like, and displays various types of information as text and images.

HDD(Hard Disk Drive)511は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU501によって実行するプログラムや情報を記録または再生させる。ハードディスクは、図1に示すインデックス格納部113としての役割、および各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。   An HDD (Hard Disk Drive) 511 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the CPU 501 and information. The hard disk stores various computer programs such as the role of the index storage unit 113 shown in FIG. 1 and various data processing programs.

ドライブ512は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体521に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース507、外部バス506、ブリッジ505、およびホストバス504を介して接続されているRAM503に供給する。   The drive 512 reads data or a program recorded on a removable recording medium 521 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and the data or program is read out from the interface 507 and the external bus 506. , And supplied to the RAM 503 connected via the bridge 505 and the host bus 504.

接続ポート514は、外部接続機器522を接続するポートであり、USB,IEEE1394等の接続部を持つ。接続ポート514は、インタフェース507、および外部バス506、ブリッジ505、ホストバス504等を介してCPU501等に接続されている。通信部515は、ネットワークに接続され、CPU501、またはHDD511等からの供給データの送信、データ受信を実行する。   The connection port 514 is a port for connecting the external connection device 522 and has a connection unit such as USB or IEEE1394. The connection port 514 is connected to the CPU 501 and the like via the interface 507, the external bus 506, the bridge 505, the host bus 504, and the like. A communication unit 515 is connected to a network and executes transmission of data supplied from the CPU 501 or the HDD 511 and data reception.

なお、図15に示す情報処理装置のハードウェア構成例は、PCを適用して構成した装置の一例であり、本発明の情報処理装置は、図15に示す構成に限らず、上述した実施例において説明した処理を実行可能な構成であればよい。   Note that the hardware configuration example of the information processing apparatus shown in FIG. 15 is an example of an apparatus configured by applying a PC, and the information processing apparatus of the present invention is not limited to the configuration shown in FIG. Any configuration can be used as long as the processing described in the above can be executed.

以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。   The present invention has been described in detail above with reference to specific embodiments. However, it is obvious that those skilled in the art can make modifications and substitutions of the embodiments without departing from the gist of the present invention. In other words, the present invention has been disclosed in the form of exemplification, and should not be interpreted in a limited manner. In order to determine the gist of the present invention, the claims should be taken into consideration.

なお、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。   The series of processes described in the specification can be executed by hardware, software, or a combined configuration of both. When executing processing by software, the program recording the processing sequence is installed in a memory in a computer incorporated in dedicated hardware and executed, or the program is executed on a general-purpose computer capable of executing various processing. It can be installed and run.

例えば、プログラムは記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことができる。あるいは、プログラムはフレキシブルディスク、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することができる。   For example, the program can be recorded in advance on a hard disk or ROM (Read Only Memory) as a recording medium. Alternatively, the program is temporarily or permanently stored on a removable recording medium such as a flexible disk, a CD-ROM (Compact Disc Read Only Memory), an MO (Magneto optical) disk, a DVD (Digital Versatile Disc), a magnetic disk, or a semiconductor memory. It can be stored (recorded). Such a removable recording medium can be provided as so-called package software.

なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。   The program is installed on the computer from the removable recording medium as described above, or is wirelessly transferred from the download site to the computer, or is wired to the computer via a network such as a LAN (Local Area Network) or the Internet. The computer can receive the program transferred in this manner and install it on a recording medium such as a built-in hard disk.

なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。   Note that the various processes described in the specification are not only executed in time series according to the description, but may be executed in parallel or individually according to the processing capability of the apparatus that executes the processes or as necessary. Further, in this specification, the system is a logical set configuration of a plurality of devices, and the devices of each configuration are not limited to being in the same casing.

以上、説明したように、本発明の構成によれば、日常的にクライアントの送受信するメールから、ドキュメント(文書)のランキング情報として適用可能なデータを取得して、取得したデータをドキュメント情報格納部としてのインデックス格納部に格納し、これらのランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データに対して、ランキング処理を実行してユーザに提示する構成としたので、ユーザによる文書の推薦処理といった手間をかけることなく、ユーザに対応した最適なランキングを行った情報提供が可能となり、ユーザに適応したデータリストなど、検索結果を効率的に提供可能な検索システム、情報提供システムが構築可能となる。   As described above, according to the configuration of the present invention, data applicable as ranking information of a document (document) is acquired from mail that is regularly transmitted and received by a client, and the acquired data is stored in a document information storage unit. The index information is stored in the index storage unit, and the ranking information is executed on the document information provided to the client according to the ranking information, for example, the search result data generated in response to the search request from the client, and presented to the user. It is possible to provide information with the most suitable ranking corresponding to the user without the trouble of recommending the document by the user, and efficiently provide search results such as a data list adapted to the user. Possible search system and information provision system can be constructed.

本発明の適用可能な情報検索システムの全体構成を示す図である。1 is a diagram illustrating an overall configuration of an information search system to which the present invention is applicable. 検索実行装置としての情報処理装置110の実行する処理の詳細について説明する図である。It is a figure explaining the detail of the process which the information processing apparatus 110 as a search execution apparatus performs. クライアントがネットワークを介して送受信するメールのデータ構成例を示す図である。It is a figure which shows the data structural example of the mail which a client transmits / receives via a network. ランキング情報抽出部202がメールから抽出するランキング情報(1)について説明する図である。It is a figure explaining the ranking information (1) which the ranking information extraction part 202 extracts from an email. メーリングリスト(ML)抽出部203が、メールサーバ122から取得するMLメンバーデータの構成例を示す図である。It is a figure which shows the structural example of ML member data which the mailing list (ML) extraction part 203 acquires from the mail server 122. FIG. メーリングリスト(ML)メンバー抽出部203の生成するランキング情報(2)のデータ構成例を説明する図である。It is a figure explaining the example of a data structure of the ranking information (2) which the mailing list (ML) member extraction part 203 produces | generates. ユーザ情報抽出部204が、メーリングリスト(ML)メンバー抽出部203の生成したランキング情報(2)(図6)に、含まれるメールアドレスをキーとして、ユーザ情報格納部115から取得するユーザ情報の例を説明する図である。An example of user information that the user information extraction unit 204 acquires from the user information storage unit 115 using the mail address included in the ranking information (2) (FIG. 6) generated by the mailing list (ML) member extraction unit 203 as a key. It is a figure explaining. ランキング情報(2)(図6)に記録されたアドレスデータをユーザ情報に置き換えたランキング情報(3)の例を示す図である。It is a figure which shows the example of ranking information (3) which replaced the address data recorded on ranking information (2) (FIG. 6) with user information. インデックス格納部113から取得する更新リストの例を示す図である。It is a figure which shows the example of the update list | wrist acquired from the index storage part. ランキング情報更新部206の生成する更新インデックスの例を示す図である。It is a figure which shows the example of the update index which the ranking information update part 206 produces | generates. ランキング処理部におけるランキングを実行するためのランキング情報ごとの重みと係数を設定する処理について説明する図である。It is a figure explaining the process which sets the weight and coefficient for every ranking information for performing the ranking in a ranking process part. 検索部112の実行した検索に基づく検索結果(1)から、ランキング処理部116におけるランキング処理を実行し、検索結果(2)を取得する処理手順について説明するフロー図である。It is a flowchart explaining the process sequence which performs the ranking process in the ranking process part 116, and acquires search result (2) from the search result (1) based on the search which the search part 112 performed. ランク値[R]の算出、日付代表値の算出処理の具体例について説明する図である。It is a figure explaining the example of calculation of rank value [R], and the calculation process of a date representative value. ソート結果として取得されるリストである検索結果(2)のデータ例を示す図である。It is a figure which shows the example of data of search result (2) which is a list | wrist acquired as a sort result. 検索処理及び検索結果の生成、提示処理を実行する情報処理装置のハードウェア構成例について説明する図である。FIG. 3 is a diagram for describing a hardware configuration example of an information processing apparatus that executes search processing, search result generation, and presentation processing.

符号の説明Explanation of symbols

110 情報処理装置
111 ランキング情報決定部
112 検索部
113 インデックス格納部
114 データ収集・登録処理部
115 ユーザ情報格納部
116 ランキング処理部
121 ファイルサーバ
122 メールサーバ
131 クライアント
150 ネットワーク
201 メール取得部
202 ランキング情報抽出部
203 メーリングリスト(ML)メンバー抽出部
204 ユーザ情報抽出部
205 更新文書決定部
206 ランキング情報更新部
211 メール
212 ランキング情報(1)
213 ランキング情報(2)
214 ランキング情報(3)
215 更新リスト
216 更新インデックス
217 MLメンバーデータ
218 ユーザ情報
221 検索結果(1)
222 検索結果(2)
301 属性データ部
302 本文データ部
311〜313 ドキュメント情報
351〜354 データ部
401〜404 データ
421〜423 ランキング情報
501 CPU(Central Processing Unit)
502 ROM(Read-Only-Memory)
503 RAM(Random Access Memory)
504 ホストバス
505 ブリッジ
506 外部バス
507 インタフェース
508 キーボード
509 ポインティングデバイス
510 ディスプレイ
511 HDD(Hard Disk Drive)
512 ドライブ
514 接続ポート
515 通信部
521 リムーバブル記録媒体
522 外部接続機器
DESCRIPTION OF SYMBOLS 110 Information processing apparatus 111 Ranking information determination part 112 Search part 113 Index storage part 114 Data collection / registration processing part 115 User information storage part 116 Ranking processing part 121 File server 122 Mail server 131 Client 150 Network 150 Mail acquisition part 202 Ranking information extraction Section 203 Mailing list (ML) member extraction section 204 User information extraction section 205 Update document determination section 206 Ranking information update section 211 Mail 212 Ranking information (1)
213 Ranking information (2)
214 Ranking Information (3)
215 Update list 216 Update index 217 ML member data 218 User information 221 Search results (1)
222 results found (2)
DESCRIPTION OF SYMBOLS 301 Attribute data part 302 Body data part 311 to 313 Document information 351 to 354 Data part 401 to 404 Data 421 to 423 Ranking information 501 CPU (Central Processing Unit)
502 ROM (Read-Only-Memory)
503 RAM (Random Access Memory)
504 Host bus 505 Bridge 506 External bus 507 Interface 508 Keyboard 509 Pointing device 510 Display 511 HDD (Hard Disk Drive)
512 drive 514 connection port 515 communication unit 521 removable recording medium 522 external connection device

Claims (9)

情報処理装置であり、
キュメントを特定するドキュメント特定情報を含むインデックスデータを格納したインデックス格納部と、
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索部と、
ネットワークを介して転送されるメールデータから、前記ドキュメント特定情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、前記インデックス格納部に格納する処理を実行するランキング情報決定部と、
前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理部と、
を有し、
前記ランキング情報決定部は、前記メールデータのうちのドキュメント格納情報を含むメールデータの各々から、
(a)メール本文中に記述されているドキュメント格納場所情報、
と、
(b)メール宛先情報(To)、
(c)メールコピー先情報(CC)、
(d)メール送信者情報(FROM)、
のメールデータの属性情報のうちの少なくとも1つとを抽出し、
当該メールデータの各々について、前記インデックスデータにおいて、(a)メール本文中に記述されているドキュメント格納場所情報に対応するドキュメント特定情報に関連付けて、前記メールデータの属性情報のうちの少なくとも1つをランキング情報として格納し、
前記ランキング処理部は、前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して前記メールデータごとに設定されたランキング情報の各々に基づいて、該ランキング情報の構成データに検索実行ユーザが含まれるか否かによって異なる値とした変数から前記メールデータごとのランキング情報についてランク値[r]を算出し、これらランキング情報ごとのランク値[r]を累積して当該ドキュメントの統合ランク値[R]を算出し、該算出した統合ランク値[R]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成
することを特徴とする情報処理装置。
The information processing apparatus der is,
And index storage unit for storing the index data including the document identification information for identifying the document,
A search unit that executes a search process based on the storage information of the index storage unit;
A ranking information determination unit that acquires ranking information to be applied to ranking processing of the document specific information from mail data transferred via a network, and stores the ranking information corresponding to each document in the index storage unit When,
A ranking processing unit that executes a provision data generation process to which the ranking information is applied to a first search result generated by the search of the search unit, and generates a second search result reflecting the ranking information;
I have a,
The ranking information determination unit, from each of mail data including document storage information of the mail data,
(A) Document storage location information described in the email body,
When,
(B) Mail destination information (To),
(C) Mail copy destination information (CC),
(D) Mail sender information (FROM),
And at least one of the attribute information of the mail data of
For each of the mail data, in the index data, (a) at least one of the attribute information of the mail data is associated with the document specifying information corresponding to the document storage location information described in the mail text. Store as ranking information,
The ranking processing unit is configured based on each ranking information set for each mail data corresponding to a document included in the first search result generated by the search of the search unit. The rank value [r] is calculated for the ranking information for each of the mail data from the variable that is different depending on whether or not the search execution user is included, and the rank value [r] for each ranking information is accumulated to obtain the document. The integrated rank value [R] is calculated, and based on the calculated integrated rank value [R], the document included in the first search result is sorted, and the second search that reflects the ranking information is performed. An information processing apparatus that generates a result .
前記ランキング情報決定部は、
ランキング情報として取得するメールアドレスデータに複数のメールアドレスの集合として設定されたメーリングリストを、各ユーザ対応のメールアドレスに変換する処理を実行する構成であることを特徴とする請求項1に記載の情報処理装置。
The ranking information determination unit
The information according to claim 1, wherein the mail address list acquired as ranking information is configured to execute a process of converting a mailing list set as a set of a plurality of mail addresses into mail addresses corresponding to each user. Processing equipment.
前記情報処理装置は、さらに、
メールアドレス情報とユーザ名とを対応付けたユーザ情報データを格納したユーザ情報格納部を有し、
前記ランキング情報決定部は、
ランキング情報として取得するメールアドレスデータを、前記ユーザ情報に従って、ユーザ名に変換し、ランキング情報を生成する処理を実行する構成であることを特徴とする請求項1に記載の情報処理装置。
The information processing apparatus further includes:
A user information storage unit storing user information data in which mail address information and a user name are associated;
The ranking information determination unit
The information processing apparatus according to claim 1, wherein mail address data acquired as ranking information is converted into a user name according to the user information, and processing for generating ranking information is executed.
前記ランキング情報決定部は、
ネットワークを介して転送されるメールデータから、前記ドキュメント情報のランキング処理に適用するランキング情報を取得した場合、
前記インデックス格納部に格納済みのインデックスデータに、取得ランキング情報を追加する更新処理を実行する構成であることを特徴とする請求項1に記載の情報処理装置。
The ranking information determination unit
When the ranking information applied to the ranking processing of the document information is acquired from the mail data transferred via the network,
The information processing apparatus according to claim 1, wherein the information processing apparatus is configured to execute an update process for adding acquired ranking information to index data stored in the index storage unit.
前記ランキング処理部は、
前記ランキング情報の構成データに対して重み(W)または係数(N)を設定し、
前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に基づいて、前記重み(W)および係数(N)と、該ランキング情報の構成データに検索実行ユーザが含まれるか否かによって異なる値とした前記変数とに基づいて、ドキュメント対応のランク値[R]を算出し、該算出したランク値[R]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする請求項1に記載の情報処理装置。
The ranking processing unit
Set weight (W) or coefficient (N) for the constituent data of the ranking information,
Based on the ranking information set corresponding to the document included in the first search result generated by the search of the search unit, the weight (W) and coefficient (N) and the constituent data of the ranking information based search run different values depending on whether the user is included and the said variables, calculates the document corresponding rank value [R], based on the rank value the calculated [R], search the first The information processing apparatus according to claim 1, wherein the information processing apparatus is configured to execute a sorting process of documents included in the result and generate a second search result reflecting the ranking information.
前記ランキング情報の各々は、対応するメールデータから抽出した(a)メール本文中に記述されているドキュメント格納場所情報が、文書の特定情報を含むか、あるいはパス名のみかを表す構成データを含み、
前記ランキング処理部は、ランキング情報ごとに算出したランク値に対して、当該構成データに基づいて文書の特定情報を含むか否かに応じて異なる値とした係数(N)を設定する構成であることを特徴とする請求項1に記載の情報処理装置。
Each of the ranking information includes (a) configuration data indicating whether the document storage location information described in the mail text includes specific document information or only a path name extracted from the corresponding mail data. ,
The ranking processing unit is configured to set a coefficient (N) with different values depending on whether or not document specific information is included based on the configuration data for the rank value calculated for each ranking information. The information processing apparatus according to claim 1.
情報処理装置であり、
ドキュメントを特定するドキュメント特定情報を含むインデックスデータを格納したインデックス格納部と、
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索部と、
ネットワークを介して転送されるメールデータから、前記ドキュメント特定情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、前記インデックス格納部に格納する処理を実行するランキング情報決定部と、
前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理部と、
を有し、
前記ランキング情報決定部は、前記メールデータのうちのドキュメント格納情報を含むメールデータの各々から、
(a)メール本文中に記述されているドキュメント格納場所情報、
と、
(b)メール送信日時情報(DATE)、
とを抽出し、
当該メールデータの各々について、前記インデックスデータにおいて、(a)メール本文中に記述されているドキュメント格納場所情報に対応するドキュメント特定情報に関連付けて、(b)メール送信日時情報(DATE)をランキング情報として格納し、
前記ランキング処理部は、
前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に含まれるメール送信日時情報としての日付データについて、同一ドキュメントについて最新のデータを取得する日付代表値[T]算出処理を実行し、該算出した日付代表値[T]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする情報処理装置。
An information processing device,
An index storage unit storing index data including document specifying information for specifying a document;
A search unit that executes a search process based on the storage information of the index storage unit;
A ranking information determination unit that acquires ranking information to be applied to ranking processing of the document specific information from mail data transferred via a network, and stores the ranking information corresponding to each document in the index storage unit When,
A ranking processing unit that executes a provision data generation process to which the ranking information is applied to a first search result generated by the search of the search unit, and generates a second search result reflecting the ranking information;
Have
The ranking information determination unit, from each of mail data including document storage information of the mail data,
(A) Document storage location information described in the email body,
When,
(B) Mail transmission date / time information (DATE),
And extract
For each of the mail data, in the index data, (a) in association with document specifying information corresponding to the document storage location information described in the mail body, (b) the mail transmission date / time information (DATE) is ranked information. Store as
The ranking processing unit
The date for obtaining the latest data for the same document as the date data as the mail transmission date / time information included in the ranking information set corresponding to the document included in the first search result generated by the search by the search unit The representative value [T] calculation process is executed, and based on the calculated date representative value [T], the document included in the first search result is sorted, and the second search reflecting the ranking information is performed. information processing apparatus you characterized in that is configured to produce a result.
コンピュータを、
ドキュメントを特定するドキュメント特定情報を含むインデックスデータを格納したインデックス格納部、
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索部と、
ネットワークを介して転送されるメールデータから、前記ドキュメント特定情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、前記インデックス格納部に格納する処理を実行するランキング情報決定部、
前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理部、
として機能させ、
前記ランキング情報決定部は、前記メールデータのうちのドキュメント格納情報を含むメールデータの各々から、
(a)メール本文中に記述されているドキュメント格納場所情報、
と、
(b)メール宛先情報(To)、
(c)メールコピー先情報(CC)、
(d)メール送信者情報(FROM)、
のメールデータの属性情報のうちの少なくとも1つとを抽出し、
当該メールデータの各々について、前記インデックスデータにおいて、(a)メール本文中に記述されているドキュメント格納場所情報に対応するドキュメント特定情報に関連付けて、前記メールデータの属性情報のうちの少なくとも1つをランキング情報として格納し、
前記ランキング処理部は、前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して前記メールデータごとに設定されたランキング情報の各々に基づいて、該ランキング情報の構成データに検索実行ユーザが含まれるか否かによって異なる値とした変数から前記メールデータごとのランキング情報についてランク値[r]を算出し、これらランキング情報ごとのランク値[r]を累積して当該ドキュメントの統合ランク値[R]を算出し、該算出した統合ランク値[R]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成することを特徴とするコンピュータ・プログラム。
Computer
An index storage unit storing index data including document specifying information for specifying a document;
A search unit that executes a search process based on the storage information of the index storage unit;
A ranking information determination unit that acquires ranking information to be applied to ranking processing of the document specific information from mail data transferred via a network, and stores the ranking information corresponding to each document in the index storage unit ,
A ranking processing unit that executes a provision data generation process that applies the ranking information to the first search result generated by the search of the search unit, and generates a second search result that reflects the ranking information;
Function as
The ranking information determination unit, from each of mail data including document storage information of the mail data,
(A) Document storage location information described in the email body,
When,
(B) Mail destination information (To),
(C) Mail copy destination information (CC),
(D) Mail sender information (FROM),
And at least one of the attribute information of the mail data of
For each of the mail data, in the index data, (a) at least one of the attribute information of the mail data is associated with the document specifying information corresponding to the document storage location information described in the mail text. Store as ranking information,
The ranking processing unit is configured based on each ranking information set for each mail data corresponding to a document included in the first search result generated by the search of the search unit. The rank value [r] is calculated for the ranking information for each of the mail data from the variable that is different depending on whether or not the search execution user is included, and the rank value [r] for each ranking information is accumulated to obtain the document. The integrated rank value [R] is calculated, and based on the calculated integrated rank value [R], the document included in the first search result is sorted, and the second search that reflects the ranking information is performed. A computer program characterized by generating a result .
コンピュータを、Computer
ドキュメントを特定するドキュメント特定情報を含むインデックスデータを格納したインデックス格納部、An index storage unit storing index data including document specifying information for specifying a document;
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索部、A search unit that executes a search process based on the storage information of the index storage unit;
ネットワークを介して転送されるメールデータから、前記ドキュメント特定情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、前記インデックス格納部に格納する処理を実行するランキング情報決定部、A ranking information determination unit that acquires ranking information to be applied to ranking processing of the document specific information from mail data transferred via a network, and stores the ranking information corresponding to each document in the index storage unit ,
前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理部、A ranking processing unit that executes a provision data generation process that applies the ranking information to the first search result generated by the search of the search unit, and generates a second search result that reflects the ranking information;
として機能させ、Function as
前記ランキング情報決定部は、前記メールデータのうちのドキュメント格納情報を含むメールデータの各々から、The ranking information determination unit, from each of mail data including document storage information of the mail data,
(a)メール本文中に記述されているドキュメント格納場所情報、(A) Document storage location information described in the email body,
と、When,
(b)メール送信日時情報(DATE)、(B) Mail transmission date / time information (DATE),
とを抽出し、And extract
当該メールデータの各々について、前記インデックスデータにおいて、(a)メール本文中に記述されているドキュメント格納場所情報に対応するドキュメント特定情報に関連付けて、(b)メール送信日時情報(DATE)をランキング情報として格納し、For each of the mail data, in the index data, (a) in association with document specifying information corresponding to the document storage location information described in the mail body, (b) the mail transmission date / time information (DATE) is ranked information. Store as
前記ランキング処理部は、The ranking processing unit
前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に含まれるメール送信日時情報としての日付データについて、同一ドキュメントについて最新のデータを取得する日付代表値[T]算出処理を実行し、該算出した日付代表値[T]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とするコンピュータ・プログラム。The date for obtaining the latest data for the same document as the date data as the mail transmission date / time information included in the ranking information set corresponding to the document included in the first search result generated by the search by the search unit The representative value [T] calculation process is executed, and based on the calculated date representative value [T], the document included in the first search result is sorted, and the second search reflecting the ranking information is performed. A computer program characterized by being configured to generate a result.
JP2004271457A 2004-09-17 2004-09-17 Information processing apparatus, information processing method, and computer program Expired - Fee Related JP4479439B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004271457A JP4479439B2 (en) 2004-09-17 2004-09-17 Information processing apparatus, information processing method, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004271457A JP4479439B2 (en) 2004-09-17 2004-09-17 Information processing apparatus, information processing method, and computer program

Publications (2)

Publication Number Publication Date
JP2006085564A JP2006085564A (en) 2006-03-30
JP4479439B2 true JP4479439B2 (en) 2010-06-09

Family

ID=36164001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004271457A Expired - Fee Related JP4479439B2 (en) 2004-09-17 2004-09-17 Information processing apparatus, information processing method, and computer program

Country Status (1)

Country Link
JP (1) JP4479439B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9773347B2 (en) 2011-11-08 2017-09-26 Koninklijke Philips N.V. Interacting with a three-dimensional object dataset

Also Published As

Publication number Publication date
JP2006085564A (en) 2006-03-30

Similar Documents

Publication Publication Date Title
JP4678546B2 (en) RECOMMENDATION DEVICE AND METHOD, PROGRAM, AND RECORDING MEDIUM
JP5147947B2 (en) Method and system for generating search collection by query
KR101064634B1 (en) Customized contents providing method and system
CN105900117B (en) Method and system for collecting, normalizing, matching and enriching data
US8396879B1 (en) Ranking authors and their content in the same framework
US9069771B2 (en) Music recognition method and system based on socialized music server
JP2006331117A (en) Document retrieval system, document retrieval apparatus, document retrieval method and document retrieval program
JP4962980B2 (en) Search result classification apparatus and method using click log
JP2011203964A (en) Document management system and method
JP2006099341A (en) Update history generation device and program
CA2847187A1 (en) Searching for and creating an adaptive content
JP2009265754A (en) Information providing system, information providing method, and information providing program
JP5458861B2 (en) Document search device, program, document registration device, and document search system
KR20080078930A (en) Information providing method and system of extracting a personalized issue
JP5010624B2 (en) Search device
JP5284064B2 (en) Product ID server device and method for controlling product ID server device
JP5266975B2 (en) Personal search system, information processing apparatus, personal search method, program, and recording medium
JP4181196B2 (en) SEARCH SYSTEM, SEARCH METHOD, AND INFORMATION MANAGEMENT DEVICE
JP4287464B2 (en) System infrastructure configuration development support system and support method
JP4479439B2 (en) Information processing apparatus, information processing method, and computer program
JP5181504B2 (en) Data processing method, program, and information processing apparatus
JP2010282503A (en) Relevant information retrieval/display system, relevant information retrieval/display method, and program
JP4469818B2 (en) Data management apparatus, data program, and data management method
JP2006092023A (en) Document control computer program, document control device and method
JP2006185020A (en) Information processor, information processing method and computer program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090825

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091019

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100223

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100308

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130326

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4479439

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130326

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140326

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees