JP4479439B2 - Information processing apparatus, information processing method, and computer program - Google Patents
Information processing apparatus, information processing method, and computer program Download PDFInfo
- Publication number
- JP4479439B2 JP4479439B2 JP2004271457A JP2004271457A JP4479439B2 JP 4479439 B2 JP4479439 B2 JP 4479439B2 JP 2004271457 A JP2004271457 A JP 2004271457A JP 2004271457 A JP2004271457 A JP 2004271457A JP 4479439 B2 JP4479439 B2 JP 4479439B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- ranking
- document
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、情報処理装置、および情報処理方法、並びにコンピュータ・プログラムに関する。さらに、詳細には、クライアントの送受信するメールから、ドキュメント(文書)のランキング情報として適用可能なデータを取得して、このランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データのランキング設定処理を実行してユーザに提供することを可能とした情報処理装置、および情報処理方法、並びにコンピュータ・プログラムに関する。 The present invention relates to an information processing apparatus, an information processing method, and a computer program. In more detail, data applicable as ranking information of a document (document) is acquired from an email sent and received by the client, and document information provided to the client according to the ranking information, for example, a search request from the client. The present invention relates to an information processing apparatus, an information processing method, and a computer program that can perform ranking setting processing of search result data generated in response to the user and provide it to a user.
多数の文書情報などの情報から、特定の情報を抽出するデータ検索において、ユーザの興味や嗜好を反映したフィルタリング処理を実行して検索結果を提示する処理を行なうものがある。インターネットあるいはイントラネットなどのネットワーク通信が盛んになり、このようなネットワークを介したニュース配信、メール配信などが盛んに行われているが、このようなデータ配信では、ユーザの興味に応じたデータ配信を可能とするためのフィルタリング処理が行われる。 In a data search for extracting specific information from a large number of pieces of information such as document information, there is a type of executing a filtering process that reflects a user's interests and preferences to present a search result. Network communication such as the Internet or Intranet has become popular, and news distribution and mail distribution via such networks are actively performed. In such data distribution, data distribution according to the user's interest is performed. Filtering processing is performed to make it possible.
ユーザの推薦情報や、興味情報などに基づいてデータをフィルタリングする処理をソーシャルフィルタリング(Social filtering)と呼ぶ。このようなデータフィルタリングを行なうことで、ユーザ各々に対応した個別のユーザ適応情報を、各ユーザに提供することが可能となる。 The process of filtering data based on user recommendation information, interest information, and the like is called social filtering. By performing such data filtering, individual user adaptation information corresponding to each user can be provided to each user.
データ検索システムにおいてこのようなフィルタリング処理を適用することにより、多数のデータの中から、ユーザの興味の高いと判定されるデータを順番に提示したリストを生成してユーザに検索結果として提供する構成が可能となる。すなわち、検索を実行するシステム側に、各ユーザのプロファイリング情報を格納し、格納したプロファイリング情報を参照して、各ユーザの興味レベルの高い順にデータをリスト化して提示するものである。特許文献1には、同じグループに所属するユーザ同士がドキュメントを推薦し、ユーザが推薦情報の入力を検索システムに対して実行することで、推薦情報に基づくドキュメントのランキングを行なうシステムが開示されている。
A configuration in which a list in which data determined to be of high interest by a user is sequentially generated from a large number of data by applying such filtering processing in a data search system and provided to a user as a search result Is possible. That is, the profiling information of each user is stored on the system executing the search, and the stored profiling information is referred to, and the data is listed and presented in descending order of the interest level of each user.
しかし、上述した従来技術では、ユーザが検索システムに対して推薦情報を通知しなければならないという処理負荷が発生する。
本発明は、上述の問題点に鑑みてなされたものであり、データ検索、あるいはデータフィルタリングシステムなど、多数の情報の中から例えばユーザの興味の高いと判断される特定データを抽出する構成において、ユーザからの推薦情報を通知する処理など、ユーザの負荷を発生させることなく、ユーザの興味がどのような情報に対して高いか等を判定することを可能として、データソートなどのデータ加工を実行し、ユーザの興味の高い情報を優先してユーザに提示することを可能とした情報処理装置、および情報処理方法、並びにコンピュータ・プログラムを提供することを目的とする。 The present invention has been made in view of the above-described problems, and in a configuration for extracting specific data that is judged to be of high interest to the user from a large amount of information, such as data search or a data filtering system, Performs data processing such as data sorting, making it possible to determine what kind of information a user is interested in without causing a load on the user, such as processing to notify recommended information from the user. It is an object of the present invention to provide an information processing apparatus, an information processing method, and a computer program that can preferentially present information of interest to the user to the user.
さらに、具体的には、本発明は、クライアントの送受信するメールから、ドキュメント(文書)のランキング情報として適用可能なデータを取得して、このランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データのランキング設定処理を実行してユーザに提供することを可能とした情報処理装置、および情報処理方法、並びにコンピュータ・プログラムを提供することを目的とする。 Furthermore, more specifically, the present invention obtains data applicable as ranking information of a document (document) from a mail transmitted / received by the client, and provides document information to the client according to the ranking information, for example, the client It is an object to provide an information processing apparatus, an information processing method, and a computer program that can perform ranking setting processing of search result data generated in response to a search request from a user and provide the ranking to a user .
本発明の第1の側面は、
情報処理装置であり、
クライアントに提供するドキュメント情報を含むインデックスデータを格納したインデックス格納部と、
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索部と、
ネットワークを介して転送されるメールデータから、前記ドキュメント情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、前記インデックス格納部に格納する処理を実行するランキング情報決定部と、
前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理部と、
を有することを特徴とする情報処理装置にある。
The first aspect of the present invention is:
An information processing device,
An index storage unit storing index data including document information to be provided to the client;
A search unit that executes a search process based on the storage information of the index storage unit;
A ranking information determination unit that acquires ranking information to be applied to ranking processing of the document information from mail data transferred via a network, and stores the information in the index storage unit as ranking information corresponding to each document; ,
A ranking processing unit that executes a provision data generation process to which the ranking information is applied to a first search result generated by the search of the search unit, and generates a second search result reflecting the ranking information;
There is an information processing apparatus characterized by having.
さらに、本発明の情報処理装置の一実施態様において、前記ランキング情報決定部は、ネットワークを介して転送されるメールデータから、
(a)メール本文中に記述されているドキュメント情報、
(b)メール宛先情報(To)、
(c)メールコピー先情報(CC)、
(d)メール送信者情報(FROM)、
(e)メール送信日時情報(DATE)、
上記(a)〜(e)の情報中、少なくとも(a)ドキュメント情報と、その他の(b)〜(e)中、取得可能なデータをランキング情報として取得する処理を実行する構成であることを特徴とする。
Furthermore, in one embodiment of the information processing apparatus of the present invention, the ranking information determination unit is configured to receive mail data transferred via a network,
(A) Document information described in the mail text,
(B) Mail destination information (To),
(C) Mail copy destination information (CC),
(D) Mail sender information (FROM),
(E) Mail transmission date / time information (DATE),
Among the above-mentioned information (a) to (e), at least (a) document information and the other (b) to (e) are configured to execute processing for acquiring acquirable data as ranking information. Features.
さらに、本発明の情報処理装置の一実施態様において、前記ランキング情報決定部は、ランキング情報として取得するメールアドレスデータに複数のメールアドレスの集合として設定されたメーリングリストを、各ユーザ対応のメールアドレスに変換する処理を実行する構成であることを特徴とする。 Furthermore, in one embodiment of the information processing apparatus of the present invention, the ranking information determination unit sets a mailing list set as a set of a plurality of mail addresses in the mail address data acquired as ranking information as a mail address corresponding to each user. It is the structure which performs the process to convert.
さらに、本発明の情報処理装置の一実施態様において、前記情報処理装置は、さらに、メールアドレス情報とユーザ名とを対応付けたユーザ情報データを格納したユーザ情報格納部を有し、前記ランキング情報決定部は、ランキング情報として取得するメールアドレスデータを、前記ユーザ情報に従って、ユーザ名に変換し、ランキング情報を生成する処理を実行する構成であることを特徴とする。 Furthermore, in an embodiment of the information processing apparatus of the present invention, the information processing apparatus further includes a user information storage unit that stores user information data in which mail address information and a user name are associated with each other, and the ranking information The determination unit is configured to perform processing for converting mail address data acquired as ranking information into a user name according to the user information, and generating ranking information.
さらに、本発明の情報処理装置の一実施態様において、前記ランキング情報決定部は、ネットワークを介して転送されるメールデータから、前記ドキュメント情報のランキング処理に適用するランキング情報を取得した場合、前記インデックス格納部に格納済みのインデックスデータに、取得ランキング情報を追加する更新処理を実行する構成であることを特徴とする。 Furthermore, in one embodiment of the information processing apparatus of the present invention, when the ranking information determination unit acquires ranking information to be applied to ranking processing of the document information from mail data transferred via a network, the index The present invention is characterized in that an update process for adding acquired ranking information to index data already stored in the storage unit is executed.
さらに、本発明の情報処理装置の一実施態様において、前記ランキング処理部は、前記ランキング情報の構成データに対して重み(W)または係数(N)を設定し、前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に基づいて、前記重み(W)および係数(N)と、該ランキング情報の構成データに検索実行ユーザが含まれるか否かによって異なる値とした変数とに基づいて、ドキュメント対応のランク値[R]を算出し、該算出したランク値[R]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする。 Furthermore, in one embodiment of the information processing apparatus of the present invention, the ranking processing unit sets a weight (W) or a coefficient (N) for the configuration data of the ranking information, and is generated by a search of the search unit. Whether or not a search execution user is included in the weight (W) and coefficient (N) and the configuration data of the ranking information based on the ranking information set corresponding to the document included in the first search result. The document-corresponding rank value [R] is calculated based on the variable having different values, and the document included in the first search result is sorted based on the calculated rank value [R]. It is the structure which performs and produces | generates the 2nd search result reflecting ranking information.
さらに、本発明の情報処理装置の一実施態様において、前記ランキング処理部は、ランキング情報を構成するメール宛先情報(To)、メールコピー先情報(CC)、メール送信者情報(FROM)の各々について、重み(W)を決定し、さらに、ランキング情報を構成する文書の有無を示すデータについて文書有無に応じて異なる値とした係数(N)を設定する構成であることを特徴とする。 Furthermore, in an embodiment of the information processing apparatus according to the present invention, the ranking processing unit includes each of mail destination information (To), mail copy destination information (CC), and mail sender information (FROM) constituting the ranking information. The weight (W) is determined, and the coefficient (N) having a different value is set for the data indicating the presence / absence of the document constituting the ranking information according to the presence / absence of the document.
さらに、本発明の情報処理装置の一実施態様において、前記ランキング処理部は、前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に含まれるメール送信日時情報としての日付データについて、同一ドキュメントについて最新のデータを取得する日付代表値[T]算出処理を実行し、該算出した日付代表値[T]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする。 Furthermore, in an embodiment of the information processing apparatus of the present invention, the ranking processing unit is included in ranking information set corresponding to a document included in the first search result generated by the search of the search unit. A date representative value [T] calculation process for obtaining the latest data for the same document is performed on the date data as the mail transmission date and time information, and the first search result is based on the calculated date representative value [T]. The second search result reflecting the ranking information is generated by sorting the documents included in the document.
さらに、本発明の情報処理装置の一実施態様において、前記ランキング処理部は、前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用したソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする。 Furthermore, in one embodiment of the information processing apparatus of the present invention, the ranking processing unit executes a sorting process that applies the ranking information to the first search result generated by the search of the search unit, The second search result reflecting the ranking information is generated.
さらに、本発明の第2の側面は、
ランキング情報に基づくデータ処理をコンピュータ上で実行させるコンピュータ・プログラムであり、
ネットワークを介して転送されるメールデータから、ドキュメント情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、インデックス格納部に格納する処理を実行するランキング情報決定ステップと、
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索ステップと、
前記検索ステップにおける検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理ステップと、
を有することを特徴とするコンピュータ・プログラムにある。
Furthermore, the second aspect of the present invention provides
A computer program that executes data processing based on ranking information on a computer,
A ranking information determination step for obtaining ranking information to be applied to ranking processing of document information from mail data transferred via a network, and executing processing for storing in the index storage unit as ranking information corresponding to each document;
A search step for executing a search process based on the storage information of the index storage unit;
A ranking process step of executing a provision data generation process applying the ranking information to the first search result generated by the search in the search step, and generating a second search result reflecting the ranking information;
There is a computer program characterized by comprising:
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング情報決定ステップは、ネットワークを介して転送されるメールデータから、
(a)メール本文中に記述されているドキュメント情報、
(b)メール宛先情報(To)、
(c)メールコピー先情報(CC)、
(d)メール送信者情報(FROM)、
(e)メール送信日時情報(DATE)、
上記(a)〜(e)の情報中、少なくとも(a)ドキュメント情報と、その他の(b)〜(e)中、取得可能なデータをランキング情報として取得する処理を実行するステップを含むことを特徴とする。
Furthermore, in one embodiment of the computer program according to the present invention, the ranking information determining step is performed from mail data transferred via a network.
(A) Document information described in the mail text,
(B) Mail destination information (To),
(C) Mail copy destination information (CC),
(D) Mail sender information (FROM),
(E) Mail transmission date / time information (DATE),
Including at least (a) document information in the information of (a) to (e) and a process of acquiring data that can be acquired as ranking information in other (b) to (e). Features.
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング情報決定ステップは、ランキング情報として取得するメールアドレスデータに複数のメールアドレスの集合として設定されたメーリングリストを、各ユーザ対応のメールアドレスに変換する処理を実行するステップを含むことを特徴とする。 Furthermore, in one embodiment of the computer program of the present invention, the ranking information determination step uses a mailing list set as a set of a plurality of mail addresses in the mail address data acquired as ranking information, as a mail address corresponding to each user. The method includes a step of executing a conversion process.
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング情報決定ステップは、ランキング情報として取得するメールアドレスデータを、メールアドレス情報とユーザ名とを対応付けたユーザ情報データを格納したユーザ情報格納部から取得するユーザ情報に従って、ユーザ名に変換し、ランキング情報を生成する処理を実行するステップを含むことを特徴とする。 Furthermore, in one embodiment of the computer program of the present invention, the ranking information determination step includes user information storing user information data in which mail address data acquired as ranking information is associated with mail address information and a user name. According to the user information acquired from a storage part, the step which converts into a user name and produces | generates ranking information is included, It is characterized by the above-mentioned.
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング情報決定ステップは、ネットワークを介して転送されるメールデータから、前記ドキュメント情報のランキング処理に適用するランキング情報を取得した場合、前記インデックス格納部に格納済みのインデックスデータに、取得ランキング情報を追加する更新処理を実行することを特徴とする。 Furthermore, in one embodiment of the computer program of the present invention, when the ranking information determining step acquires ranking information to be applied to ranking processing of the document information from mail data transferred via a network, the index Update processing for adding acquired ranking information to index data already stored in the storage unit is performed.
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング処理ステップは、前記ランキング情報の構成データに対して重み(W)または係数(N)を設定し、前記第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に基づいて、前記重み(W)および係数(N)と、該ランキング情報の構成データに検索実行ユーザが含まれるか否かによって異なる値とした変数とに基づいて、ドキュメント対応のランク値[R]を算出し、該算出したランク値[R]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成するステップを含むことを特徴とする。 Furthermore, in an embodiment of the computer program of the present invention, the ranking processing step sets a weight (W) or a coefficient (N) for the configuration data of the ranking information, and is included in the first search result. Based on the ranking information set corresponding to the document to be stored, the weight (W) and the coefficient (N), and variables having different values depending on whether or not the search execution user is included in the configuration data of the ranking information, Based on the document, a document-corresponding rank value [R] is calculated, and based on the calculated rank value [R], the sorting process of the documents included in the first search result is executed, and the ranking information is reflected. The method includes generating a second search result.
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング処理ステップは、ランキング情報を構成するメール宛先情報(To)、メールコピー先情報(CC)、メール送信者情報(FROM)の各々について、重み(W)を決定し、さらに、ランキング情報を構成する文書の有無を示すデータについて文書有無に応じて異なる値とした係数(N)を設定するステップを含むことを特徴とする。 Furthermore, in an embodiment of the computer program of the present invention, the ranking processing step is performed for each of mail destination information (To), mail copy destination information (CC), and mail sender information (FROM) constituting the ranking information. , Determining a weight (W), and further setting a coefficient (N) having different values for data indicating the presence / absence of a document constituting the ranking information depending on the presence / absence of the document.
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング処理ステップは、前記第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に含まれるメール送信日時情報としての日付データについて、同一ドキュメントについて最新のデータを取得する日付代表値[T]算出処理を実行し、該算出した日付代表値[T]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成するステップを含むことを特徴とする。 Furthermore, in an embodiment of the computer program of the present invention, the ranking processing step includes date data as mail transmission date / time information included in ranking information set corresponding to a document included in the first search result. For the same document, a date representative value [T] calculation process for obtaining the latest data is executed, and based on the calculated date representative value [T], a document included in the first search result is sorted. Executing and generating a second search result reflecting the ranking information.
さらに、本発明のコンピュータ・プログラムの一実施態様において、前記ランキング処理ステップは、前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用したソート処理を実行し、ランキング情報を反映した第2の検索結果を生成するステップであることを特徴とする。 Furthermore, in one embodiment of the computer program of the present invention, the ranking processing step executes a sorting process that applies the ranking information to the first search result generated by the search of the search unit, This is a step of generating a second search result reflecting the ranking information.
さらに、本発明の第3の側面は、
ランキング情報に基づくデータ処理を実行する情報処理方法であり、
ランキング情報決定部における処理であり、ネットワークを介して転送されるメールデータから、ドキュメント情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、インデックス格納部に格納する処理を実行するランキング情報決定ステップと、
検索部における処理であり、前記インデックス格納部の格納情報に基づいて検索処理を実行する検索ステップと、
ランキング処理部における処理であり、前記検索ステップにおける検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理ステップと、
を有することを特徴とする情報処理方法にある。
Furthermore, the third aspect of the present invention provides
An information processing method for executing data processing based on ranking information,
A process in the ranking information determination unit that acquires ranking information to be applied to document information ranking processing from mail data transferred via a network, and stores it in the index storage unit as ranking information corresponding to each document. Ranking information determination step to be executed;
A search step that is a process in the search unit, and executes a search process based on the storage information of the index storage unit;
A second search result reflecting the ranking information by executing the provision data generation process to which the ranking information is applied to the first search result generated by the search in the search step. A ranking processing step for generating
There is an information processing method characterized by comprising:
なお、本発明のコンピュータ・プログラムは、例えば、様々なプログラム・コードを実行可能なコンピュータシステムに対して、コンピュータ可読な形式で提供する記憶媒体、通信媒体、例えば、CDやFD、MOなどの記録媒体、あるいは、ネットワークなどの通信媒体によって提供可能なコンピュータ・プログラムである。このようなプログラムをコンピュータ可読な形式で提供することにより、コンピュータシステム上でプログラムに応じた処理が実現される。 Note that the computer program of the present invention is a recording medium provided in a computer-readable format for a computer system capable of executing various program codes, for example, a recording medium such as a CD, FD, or MO. A computer program that can be provided by a medium or a communication medium such as a network. By providing such a program in a computer-readable format, processing corresponding to the program is realized on the computer system.
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。 Other objects, features, and advantages of the present invention will become apparent from a more detailed description based on embodiments of the present invention described later and the accompanying drawings. In this specification, the system is a logical set configuration of a plurality of devices, and is not limited to one in which the devices of each configuration are in the same casing.
本発明の構成によれば、日常的にクライアントの送受信するメールから、ドキュメント(文書)のランキング情報として適用可能なデータを取得して、取得したデータをドキュメント情報格納部としてのインデックス格納部に格納し、これらのランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データに対して、ランキング処理を実行してユーザに提示する構成としたので、ユーザによる文書の推薦処理といった手間をかけることなく、ユーザに対応した最適なランキングを行った情報提供が可能となる。 According to the configuration of the present invention, data applicable as ranking information of a document (document) is acquired from a mail transmitted and received by a client on a daily basis, and the acquired data is stored in an index storage unit as a document information storage unit According to the ranking information, the document information provided to the client, for example, the search result data generated in response to the search request from the client, is configured to execute the ranking process and present it to the user. Thus, it is possible to provide information with an optimal ranking corresponding to the user without taking the trouble of recommending a document.
以下、図面を参照しながら本発明の情報処理装置、および情報処理方法、並びにコンピュータ・プログラムの詳細について説明する。 Details of the information processing apparatus, information processing method, and computer program of the present invention will be described below with reference to the drawings.
図1は本発明の適用可能な情報検索システムの全体構成を示す図である。情報検索システムは、検索処理を実行する検索実行装置としての情報処理装置110、情報処理装置110に対してネットワーク150を介して検索の依頼を行い、検索結果を受領するクライアント131−1〜n、情報処理装置110における検索対象のデータファイルを格納したファイルサーバ121、クライアントの送受信するメールを格納するメールサーバ122によって構成される。
FIG. 1 is a diagram showing the overall configuration of an information search system to which the present invention can be applied. The information search system includes an
クライアント131、検索実行装置としての情報処理装置110、ファイルサーバ121、メールサーバ122は、ネットワーク150を介して接続されている。ネットワークは、インターネット、イントラネット、LAN等の通信ネットワークである。
The
ファイルサーバ121は、例えば、業務で利用されるドキュメントが格納された種々の文書管理システムを統括的に管理するサーバである。なお、ドキュメントとは、クライアントに提示される情報、すなわち検索対象となりえるドキュメントである。ファイルサーバ121は、クライアント131の検索対象のドキュメント実体を格納したデータベースを管理している。
The
検索実行装置としての情報処理装置110は、ドキュメント実体は格納しておらず、ドキュメントの検索に適用可能なドキュメントID(文書ID)、要約、キーワードなど書誌事項、さらに、ランキング処理に適用するための様々なインデックス情報をインデックス格納部113に格納している。検索部112は、インデックス格納部113に格納されたインデックス情報に基づいて、例えばクライアントからの検索要求に応じた検索処理を実行し、ランキング処理を行ってユーザの興味の高いと判断されたドキュメント情報(インデックス格納部113に格納された情報)をリスト化して検索結果としてクライアントに提示する。
The
検索実行装置としての情報処理装置110は、ランキング情報決定部111、検索部112、インデックス格納部113、データ収集・登録処理部114、ユーザ情報格納部115、ランキング処理部116を有する。
The
情報処理装置110のデータ収集・登録処理部114は、ファイルサーバ121からドキュメント対応のインデックス情報を取得してインデックス格納部113に格納する処理を実行する。例えば、ドキュメントの検索に適用可能なドキュメントID(文書ID)、要約、キーワードなどの様々なインデックス情報である。
The data collection /
ランキング情報決定部111は、クライアント131において送受信されているメールデータをメールサーバ122から取得し、取得したメールデータの属性情報、すなわち、メールの送受信ユーザ情報やメールの送信日付情報などの属性情報と、メール本文中に記述されているドキュメントの格納場所情報を抽出し、インデックス格納部113に、ドキュメントのインデックス情報を構成するランキング情報として格納する。
The ranking
検索部112は、例えばクライアントからの検索要求、例えばキーワードに基づく検索式や、特定のカテゴリを指定したデータ検索要求などに応じて、インデックス格納部113に格納されたインデックス情報に基づく検索処理を実行して検索結果をクライアント131に提供する。なお、前述したように、ドキュメント本体は、ファイルサーバ121に格納されており、ドキュメント対応の書誌情報、キーワード、文書IDなどの各種インデックス情報がインデックス格納部113に格納されている。
The
ランキング情報決定部111は、メールサーバ122から、クライアント131の送受信するメールデータを取得し、メールの属性情報、メール本文中に記述されているドキュメントの格納場所情報などを抽出して、これらをインデックス情報としてインデックス格納部113に格納する。ランキング処理部116は、このインデックス情報を、例えば検索結果としてユーザに提供するドキュメント情報リストのランキングに適用する。
The ranking
ユーザ情報格納部115には、ユーザ名と、ユーザのメールアドレス、ユーザの所属などのユーザ情報が格納される。ランキング情報決定部111は、メールサーバ122から、クライアント131の送受信するメールデータを取得し、メール中に含まれるメールアドレスに基づいてユーザ情報格納部115からユーザ情報を取得し、取得したユーザ情報を適用してインデックス情報としてのランキング情報を生成し、インデックス格納部113に格納する。
The user
ランキング処理部116は、インデックス格納部113に格納したランキング情報に基づいて、検索部112の実行した検索処理結果としての検索結果リストのランキング処理を実行する。これらの処理の詳細については後述する。ランキング処理部116は、インデックス格納部に格納されたインデックス情報、具体的には、ランキング情報を適用して、ユーザにとって価値の高いドキュメントを抽出して価値の高い順にランキングしたランキングリストを生成する。検索部112は、このランキングリストを検索結果としてクライアント131に提供する。
Based on the ranking information stored in the
例えば、ユーザが検索を実行した際、検索結果として含まれるドキュメントのうち、ユーザ宛(またはCCにユーザアドレスが記述されていた)メールに、例えばドキュメント格納場所情報などドキュメント関連情報が記述されていたドキュメントについてリストの提示順序の優先度を上げた検索結果リストを生成してクライアントに提供する。本構成により、ユーザにとって価値が高いドキュメント、例えば、業務で参照することが要求されているドキュメント(文書)が検索結果リストにおいて優先的に提示されることとなる。この処理について、以下、詳細に説明する。 For example, when a user executes a search, out of documents included as a search result, document related information such as document storage location information is described in an email addressed to the user (or a user address is described in CC). A search result list in which the priority of the list presentation order is increased for a document is generated and provided to the client. With this configuration, a document having high value for the user, for example, a document (document) that is requested to be referred to in business, is preferentially presented in the search result list. This process will be described in detail below.
図2以下を参照して、検索実行装置としての情報処理装置110の実行する処理の詳細について説明する。
Details of processing executed by the
図2は、情報処理装置110のランキング情報決定部111、ランキング処理部116の実行する処理について、各処理機能毎に、順次説明する図である。図2に示すように、ランキング情報決定部111は、メール取得部201、ランキング情報抽出部202、メーリングリスト(ML)メンバー抽出部203、ユーザ情報抽出部204、更新文書決定部205、ランキング情報更新部206を有する。
FIG. 2 is a diagram for sequentially explaining the processing executed by the ranking
以下、これらの各処理部の実行する処理について、順次説明する。メール取得部201は、メールサーバ122からメール211を取得する。メール211は図1におけるクライアント131がネットワーク150を介して送受信するメールである。メール211のデータ構成例を図3に示す。
Hereinafter, processes executed by each of these processing units will be sequentially described. The
図3には2つのメール構成例(a),(b)を示している。いずれも、属性データ部301と、本文データ部302から構成されており、
属性データ部301には、
送信日時情報[DATE]
送信者情報[FROM]
主題[Subject]
宛先[To]
の各データが含まれ、さらに、(b)には、
コピー送付先[cc]
のデータを含む構成となっている。
FIG. 3 shows two mail configuration examples (a) and (b). Both are composed of an
In the
Transmission date / time information [DATE]
Sender information [FROM]
Theme [Subject]
Destination [To]
In addition, (b) includes
Copy destination [cc]
It is configured to include the data.
また、本文データ部302には、
ランキング情報抽出部202(図2参照)の抽出対象データとしてのドキュメント情報311〜313が含まれる。なお、ドキュメント情報311〜313は、ドキュメントの格納場所情報、ドキュメント名情報など、ドキュメントに関する各種情報を含む。
In the
図2に示すランキング情報抽出部202は、メール取得部201がメールサーバ122から取得したメール211から、インデックス格納部113に格納すべきランキング情報(1)212の抽出処理を行なう。
The ranking
図4を参照して、ランキング情報抽出部202がメール211から抽出するランキング情報(1)212について説明する。ランキング情報抽出部202がメールから抽出するランキング情報には、図4に示すように、以下のデータが含まれる。
(1)メール本文中に記述されているドキュメント情報
(1a)ドキュメント格納場所情報(パス)
(1b)ドキュメント格納場所情報(文書名)
(2)メール宛先情報(To)
(3)メールコピー先情報(CC)
(4)メール送信者情報(FROM)
(5)メール送信日時情報(DATE)
少なくとも、上記(1)〜(5)中、(1)のドキュメント情報は必須情報であり、ドキュメント情報を含むメールについてのみ、その他の書誌情報として、上記(2)〜(5)について、メールから取得可能な情報を取得する。ドキュメント情報が含まれないメールデータについては、ランキング情報として適用しないので情報取得の必要はない。
With reference to FIG. 4, the ranking information (1) 212 that the ranking
(1) Document information described in the mail text (1a) Document storage location information (path)
(1b) Document storage location information (document name)
(2) Mail destination information (To)
(3) Mail copy destination information (CC)
(4) Mail sender information (FROM)
(5) Mail transmission date / time information (DATE)
At least in (1) to (5) above, the document information of (1) is indispensable information, and only the mail including the document information is used as other bibliographic information. Acquire information that can be acquired. Mail data that does not include document information is not applied as ranking information, so there is no need to acquire information.
次に、図2に示すメーリングリスト(ML)抽出部203が、メールサーバ122に問い合わせを実行して、メーリングリスト(ML)と、メーリングリストの構成メンバーの対応データを記述したMLメンバーデータ217を取得し、取得した情報に基づいて、ランキング情報抽出部202が生成したランキング情報(1)212の更新を実行し、ランキング情報(2)213を生成する。
Next, the mailing list (ML)
図2に示すメーリングリスト(ML)抽出部203が、メールサーバ122から取得するMLメンバーデータ217の構成例を図5に示す。ML(メーリングリスト)メンバーデータ217は、図5に示すように、メーリングリスト(ML)と、メーリングリストの構成メンバーの対応データからなるテーブルデータである。図に示す例では、例えば、
ML:ProjectA・・・
は、メンバーとして、
fuji.hanako@xyz・・・
asama.taro@xyz・・・
hakuba.ichiro@xyz・・・
の各メンバーを含むことを示している。
FIG. 5 shows a configuration example of the
ML: ProjectA ...
As a member
fuji.hanako@xyz ...
asama.taro@xyz ...
hakuba.ichiro@xyz ...
Including each member.
図2に示すメーリングリスト(ML)メンバー抽出部203は、これらの情報をメールサーバ122から取得し、これらの情報に基づいて、ランキング情報抽出部202が生成したランキング情報(1)212の更新を実行し、ランキング情報(2)213を生成する。
The mailing list (ML)
メーリングリスト(ML)メンバー抽出部203の生成するランキング情報(2)213のデータ構成例を図6に示す。図6に示すランキング情報(2)は、先に図4を参照して説明したランキング情報(1)の更新情報であり、メール宛先情報(To)の項目に対応するデータが、更新されている。
A data configuration example of the ranking information (2) 213 generated by the mailing list (ML)
すなわち、図4に示したメール宛先情報(To)の項目に対応するデータに含まれるML(メーリングリスト)について、図5に示すMLメンバーデータに基づいて、メンバーに対応するアドレスデータに置き換えられている。具体的には、たとえば図4に示すパス¥PC1¥dataのメール宛先情報(To)の項目には、
ML:ProjectA・・・
のメーリングリストデータが格納されているが、
図6の対応データ格納部には、ML:ProjectA・・・のメーリングリストデータを図5に示すMLメンバーデータに基づいて、メンバーに対応するアドレスデータ、すなわち、
fuji.hanako@xyz・・・
asama.taro@xyz・・・
hakuba.ichiro@xyz・・・
の各メンバーのアドレスデータに置き換えられてる。
That is, ML (mailing list) included in the data corresponding to the item of the mail destination information (To) shown in FIG. 4 is replaced with address data corresponding to the member based on the ML member data shown in FIG. . Specifically, for example, the mail destination information (To) item of the path \ PC1 \ data shown in FIG.
ML: ProjectA ...
Mailing list data is stored,
In the corresponding data storage unit of FIG. 6, the mailing list data of ML: ProjectA... Is based on the ML member data shown in FIG.
fuji.hanako@xyz ...
asama.taro@xyz ...
hakuba.ichiro@xyz ...
It has been replaced with the address data of each member.
このように、メーリングリスト(ML)メンバー抽出部203は、ランキング情報抽出部202の生成するランキング情報(1)212にメーリングリスト(ML)に相当するアドレス情報が含まれる場合、これらのMLデータを各個人のユーザアドレスに変更する処理を実行する。なお、上述の例では、宛先(To)データのみを対象とした処理例を示したが、その他、(CC)などのアドレスデータがMLデータによって記述されている場合も、同様のメンバーアドレスへの展開処理を実行する。
As described above, when the ranking information (1) 212 generated by the ranking
次に、図2に示すユーザ情報抽出部204は、メーリングリスト(ML)メンバー抽出部203の生成したランキング情報(2)(図6参照)に、含まれるメールアドレスをキーとして、ユーザ情報格納部115から、メールアドレス対応のユーザ情報218を取得し、ランキング情報(2)(図6参照)に記録されたアドレスデータをユーザ情報に置き換えたランキング情報(3)214を生成する。
Next, the user
図2に示すユーザ情報抽出部204が、メーリングリスト(ML)メンバー抽出部203の生成したランキング情報(2)(図6参照)に、含まれるメールアドレスをキーとして、ユーザ情報格納部115から取得するユーザ情報218の例を図7に示し、ランキング情報(2)(図6参照)に記録されたアドレスデータをユーザ情報に置き換えたランキング情報(3)214の例を図8に示す。
The user
図7に示すように、ユーザ情報格納部115から取得するユーザ情報218は、ユーザのメールアドレスと、ユーザ名、ユーザ所属先情報などを対応付けたデータとして構成される。図2に示すユーザ情報抽出部204は、メーリングリスト(ML)メンバー抽出部203の生成したランキング情報(2)(図6参照)に、含まれるメールアドレスに対応するユーザ情報を取得し、取得情報に基づいてランキング情報(2)(図6参照)を更新し、図8に示すランキング情報(3)を生成する。
As shown in FIG. 7, the
図8に示すランキング情報(3)は、図6に示したランキング情報(2)のアドレス情報がユーザ名に変更されたデータ構成を持つ。すなわち、メール宛先情報(To)、メールコピー先情報(CC)、メール送信者情報(FROM)の各欄に記録されていたアドレス情報がユーザ名として置き換えられている。なお、ここでは、ユーザ名のみをユーザ情報として設定した例を示しているが、所属などのユーザ情報を設定する構成としてもよい。 The ranking information (3) shown in FIG. 8 has a data structure in which the address information of the ranking information (2) shown in FIG. 6 is changed to a user name. That is, the address information recorded in each column of the mail destination information (To), the mail copy destination information (CC), and the mail sender information (FROM) is replaced with the user name. Here, an example is shown in which only the user name is set as user information, but user information such as affiliation may be set.
次に、図2に示す更新文書決定部205は、ユーザ情報抽出部204が生成したランキング情報(3)214(図8参照)に基づいて、ランキング情報(3)214(図8参照)に含まれるドキュメント情報に対応するドキュメント(文書)に関するインデックス情報を更新リスト215としてインデックス格納部113から取得する。
Next, the updated
更新文書決定部205は、ユーザ情報抽出部204が生成したランキング情報(3)214(図8参照)に設定されているドキュメント(文書)情報に対応するドキュメント(文書)情報を持つインデックス情報を更新リスト215としてインデックス格納部113から取得する。
The update
図9に、インデックス格納部113から取得する更新リスト215の例を示す。図9に示す更新リストは、図8に示すランキング情報(3)に記録されたドキュメント(文書)情報に基づいて、インデックス格納部113から対応するドキュメント(文書)情報を持つインデックス情報(ランキング情報を含む)を取得した結果である。すなわち、図8に示すランキング情報(3)に記録されたドキュメント(文書)情報は、
パス:¥¥PC1¥data,文書:doc.txt
パス:http://ww.・・・,文書:download.html
パス:¥¥PCN¥data¥ProjectA・・・
の3つあり、これらの3ドキュメントについて、既にインデックス格納部113に格納されたインデックス情報が、ランキングデータの更新対象データ、すなわち更新リスト215としてインデックス格納部113から取得される。
FIG. 9 shows an example of the
Path: \\ PC1 \ data, document: doc. txt
Path: http: // ww ...., document: download. html
Path: \\ PCN \ data \ ProjectA ...
For these three documents, the index information already stored in the
図9に示すデータが、インデックス格納部113から取得されるインデックス格納部113に格納済みのインデックスデータであり、
パス:¥¥PC1¥data,文書:doc.txt
パス:http://ww.・・・,文書:download.html
パス:¥¥PCN¥data¥ProjectA・・・
の3ドキュメントについてのインデックスデータである。
The data shown in FIG. 9 is index data already stored in the
Path: \\ PC1 \ data, document: doc. txt
Path: http: // ww ...., document: download. html
Path: \\ PCN \ data \ ProjectA ...
Index data for the three documents.
インデックス格納部113に格納されるインデックスデータは、図9に示すように、ドキュメント(文書)情報と、ランキング情報によって構成される。ドキュメント情報には、ドキュメントの格納場所データとして、パス名、文書名などが格納される。また、ランキング情報は、後述するランキング処理に適用可能な情報であり、
(a)メール宛先情報(To)
(b)メールコピー先情報(CC)
(c)メール送信者情報(FROM)
(d)メール送信日時情報(DATE)
(e)文書名有無
の各データが格納される。
上記(a)〜(e)の各データは、ランキング情報決定部111が取得したメールに基づくランキングデータであり、メールに設定された、メール宛先情報(To)、メールコピー先情報(CC)、メール送信者情報(FROM)、メール送信日時情報(DATE)を記録したデータである。文書名の有無は、ランキング情報決定部111が取得したメールに文書名が含まれていた(True)か否(False)かのデータである。
As shown in FIG. 9, the index data stored in the
(A) Mail destination information (To)
(B) Mail copy destination information (CC)
(C) Mail sender information (FROM)
(D) Mail transmission date / time information (DATE)
(E) Document name presence / absence data is stored.
Each of the data (a) to (e) is ranking data based on the mail acquired by the ranking
図2に示すランキング情報更新部206は、インデックス格納部113から取得した更新リスト215(図9参照)を、ユーザ情報抽出部204の生成したランキング情報(3)(図8参照)に従って更新処理を実行し、更新インデックス216を生成して、インデックス格納部113に格納する。
2 updates the update list 215 (see FIG. 9) acquired from the
図2に示すランキング情報更新部206の生成する更新インデックス216の例を図10に示す。図10において、ランキング情報部の太線枠内データ部351〜354が、ユーザ情報抽出部204の生成したランキング情報(3)(図8参照)に従って更新されたデータ部である。これらのデータは、更新リスト215(図9参照)には含まれていないデータである。
An example of the
更新リスト215(図9参照)は、図10に示す太線枠内データ部351〜354以外のデータのみからなり、ランキング情報更新部206は、新たに、ユーザ情報抽出部204の生成したランキング情報(3)(図8参照)のデータ、すなわち、太線枠内データ部351〜354を追加して更新インデックス216を生成して、インデックス格納部113に格納する。
The update list 215 (see FIG. 9) includes only data other than the
次に、ランキング処理部116の処理について説明する。前述したように、ランキング処理部116は、インデックス格納部113に格納したランキング情報に基づいて、検索部112の実行した検索処理結果としての検索結果リストのランキング処理を実行する。すなわち、インデックス格納部113に格納されたインデックス情報、具体的には、ランキング情報を適用して、ユーザにとって価値の高いドキュメントを抽出して価値の高い順にランキングしたランキングリストを生成する。検索部112は、このランキングリストを検索結果としてクライアント131に提供する。
Next, processing of the
ランキング処理部116は、検索部112の検索結果に含まれるドキュメントのランキングを実行するため、まず、ランキング情報ごとの重みと係数を設定する。この処理について、図11を参照して説明する。
The
ランキング情報は、インデックス格納部113に格納されたインデックス情報に含まれるデータであり、図10を参照して説明したように、ドキュメント情報に対応付けられた以下のデータ項目によって構成される。すなわち、
(a)メール宛先情報(To)
(b)メールコピー先情報(CC)
(c)メール送信者情報(FROM)
(d)メール送信日時情報(DATE)
(e)文書名有無
The ranking information is data included in the index information stored in the
(A) Mail destination information (To)
(B) Mail copy destination information (CC)
(C) Mail sender information (FROM)
(D) Mail transmission date / time information (DATE)
(E) Document name presence / absence
ランキング処理部116は、これらのランキング情報各々について重み(W)と係数(N)を定める。重み(W)と係数(N)の決定態様は、様々な設定が可能である。ここで示す例は、メール送信日時情報としての日付データは、ソート処理に適用するデータ項目とし、
(a)メール宛先情報(To)
(b)メールコピー先情報(CC)
(c)メール送信者情報(FROM)
に、それぞれ重み(W)を設定し、
(e)文書名有無
のデータに係数(N)を設定した処理例を説明する。
The
(A) Mail destination information (To)
(B) Mail copy destination information (CC)
(C) Mail sender information (FROM)
Set the weight (W) to
(E) An example of processing in which a coefficient (N) is set in the document name presence / absence data will be described.
ランキング処理部116は、図11に示すように、
(a)メール宛先情報(To)の重みをWTO、
(b)メールコピー先情報(CC)の重みをWCC、
(c)メール送信者情報(FROM)の重みをWFROM、
とし、
(e)文書名有無
のデータに係数を、
Trueの場合の係数:N=NTRUE
Falseの場合の係数:N=NFALSE
とする。
The
(A) The weight of the mail destination information (To) is W TO ,
(B) The weight of the mail copy destination information (CC) is W CC ,
(C) The weight of the mail sender information (FROM) is set to W FROM ,
age,
(E) A coefficient is added to the document name data.
Coefficient for True: N = N TRUE
Coefficient for False: N = N FALSE
And
ランキング処理部116は、これらの重み(W)、係数(N)に基づいて、検索部112の実行した検索結果に対してランキング処理を実行する。検索部112の実行した検索に基づく検索結果を図2に示す検索結果(1)221とし、ランキング処理部116におけるランキング処理を実行した検索結果を検索結果(2)222とする。
The
図12のフローチャートを参照して、検索部112の実行した検索に基づく検索結果(1)から、ランキング処理部116におけるランキング処理を実行し、検索結果(2)を取得する処理手順について説明する。
With reference to the flowchart of FIG. 12, a processing procedure for executing the ranking process in the
ランキング処理部116は、まず、検索部112の実行した検索に基づく検索結果(1)を入力すると、ステップS101〜ステップS105において、検索結果(1)に含まれるドキュメント(文書)各々について、
ランク値[R]、
日付代表値[T]、
を定める。
First, the
Rank value [R],
Date representative value [T],
Determine.
まず、ステップS101において、検索結果(1)から処理対象のドキュメント(文書)を選択し、ステップS102において、選択ドキュメント(文書)に含まれる各ランキング情報(ロー(行))についてランク値[r]を、下記式、
r=(isTO×WTO+isCC×WCC+isFROM×WFROM)×N
にしたがって、算出する。
上記式において、
isTOは、ランキング情報におけるメール宛先情報(To)のデータ欄に検索実行者のユーザ名が存在する場合は[1]、存在しない場合は[0]となる値をとる。
isCCは、ランキング情報におけるメールコピー先情報(CC)のデータ欄に検索実行者のユーザ名が存在する場合は[1]、存在しない場合は[0]となる値をとる。
isFROMは、ランキング情報におけるメール送信者情報(FROM)のデータ欄に検索実行者のユーザ名が存在する場合は[1]、存在しない場合は[0]となる値をとる。
First, in step S101, a document (document) to be processed is selected from the search result (1), and in step S102, the rank value [r] for each ranking information (row (row)) included in the selected document (document). With the following formula:
r = (isTO × W TO + isCC × W CC + isFROM × W FROM ) × N
According to the calculation.
In the above formula,
The isTO takes a value of [1] when the user name of the search executor exists in the data field of the mail destination information (To) in the ranking information, and [0] when it does not exist.
The isCC takes a value of [1] if the user name of the search executor exists in the data field of the mail copy destination information (CC) in the ranking information, and [0] otherwise.
The isFROM takes a value [1] when the user name of the search executor exists in the data field of the mail sender information (FROM) in the ranking information, and [0] when it does not exist.
上記式に従って、選択ドキュメント(文書)に含まれる各ランキング情報(ロー(行))についてのランク値[r]を算出し、ステップS103において、選択文書に対する全てのランキング情報のランク値算出処理の終了を判定し、終了していない場合は、ステップS102戻り、選択文書に対する未処理のランキング情報のランク値算出を実行する。 In accordance with the above formula, the rank value [r] for each ranking information (row (row)) included in the selected document (document) is calculated. In step S103, the rank value calculation processing for all ranking information for the selected document is completed. If the process is not completed, the process returns to step S102 to calculate the rank value of unprocessed ranking information for the selected document.
選択文書に対する全てのランキング情報のランク値算出処理が終了した場合は、ステップS104に進み、各ランキング情報(ロー(行))についてのランク値[r]を積算:ΣR+して、選択ドキュメント(文書)のランク値[R]を求める。 When the rank value calculation processing of all ranking information for the selected document is completed, the process proceeds to step S104, and the rank value [r] for each ranking information (row (row)) is integrated: ΣR + to select the selected document (document ) For the rank value [R].
なお、日付代表値[T]は、ステップS101において算出される値であり、処理対象の1つの文書に対して、複数のランキング情報が存在する場合は、最新の日付を日付代表値[T]とする。 The date representative value [T] is a value calculated in step S101. When a plurality of ranking information exists for one document to be processed, the date representative value [T] is the latest date. And
このように、ランク値[R]は、処理対象の1つの文書に対して、複数のランキング情報が存在する場合は、各ランキング情報単位で算出し、全ての算出値の積算値を、そのドキュメント(文書)のランキング値[R]とする。また、日付代表値[T]は、処理対象の1つの文書に対して、複数のランキング情報が存在する場合は、最新の日付を日付代表値[T]とする。 As described above, the rank value [R] is calculated for each ranking information unit when a plurality of ranking information exists for one document to be processed, and the integrated value of all the calculated values is calculated for the document. The (document) ranking value [R] is used. The date representative value [T] is the date representative value [T] when there is a plurality of ranking information for one document to be processed.
図12に示すステップS101〜S105において、検索結果(1)に含まれるドキュメント(文書)各々について、
ランク値[R]、
日付代表値[T]、
が算出された後、ステップS106において、検索結果(1)に含まれるドキュメント(文書)のリストを、ドキュメント(文書)各々についてのランク値[R]と、日付代表値[T]とを適用してソート処理を実行して、検索結果(2)222(図2参照)を生成する。
In steps S101 to S105 shown in FIG. 12, for each document (document) included in the search result (1),
Rank value [R],
Date representative value [T],
In step S106, the list of documents (documents) included in the search result (1) is applied with the rank value [R] and the date representative value [T] for each document (document). The sort process is executed to generate a search result (2) 222 (see FIG. 2).
具体的な処理例について、図13を参照して説明する。図13(a)は、検索部112の検索結果(1)を示している。例えばクライアントが示したキーワードなどに基づく検索条件に従って、検索部112がインデックス格納部113に格納されたインデックスに基づいて抽出した検索結果データである。前述したように、インデックス情報は、ドキュメント(文書)情報と、ランキング情報とによって構成されている。ランキング情報は、それぞれメールに基づいて取得されたデータである。
A specific processing example will be described with reference to FIG. FIG. 13A shows the search result (1) of the
例えば、検索結果ID[1]に対応する文書、すなわち、
パス:¥¥PC1¥data、文書名:doc.txt
の文書は、それぞれ異なるメールに基づいて取得された3つのランキング情報421〜423を有することを意味している。
For example, the document corresponding to the search result ID [1], that is,
Path: \\ PC1 \ data, document name: doc. txt
Means that the document has three pieces of ranking
図13を参照して、図13(a)の検索結果(1)に含まれるドキュメント(文書)として、検索結果ID[1]に対応する文書、すなわち、
パス:¥¥PC1¥data、文書名:doc.txt
についてのランク値[R]と、日付代表値[T]の算出処理例について説明する。
Referring to FIG. 13, as a document (document) included in search result (1) of FIG. 13A, a document corresponding to search result ID [1], that is,
Path: \\ PC1 \ data, document name: doc. txt
An example of the calculation process of the rank value [R] and the date representative value [T] will be described.
ここで、検索実施ユーザは、図13(c)に示すように、
ユーザ名:asama
であるとする。
また、前述した重み[W]と、係数[T]は、図13(c)に示すように、
(a)メール宛先情報(To)の重みをWTO=100
(b)メールコピー先情報(CC)の重みをWCC=50
(c)メール送信者情報(FROM)の重みをWFROM=70
として設定され、また、
(e)文書名有無
のデータに対する係数が、
Trueの場合の係数:NTRUE=1、
Falseの場合の係数:NFALSE=0.5
として設定されているものとする。
Here, as shown in FIG.
User name: asama
Suppose that
Further, the weight [W] and the coefficient [T] described above are as shown in FIG.
(A) The weight of the mail destination information (To) is set to W TO = 100
(B) The weight of the mail copy destination information (CC) is W CC = 50
(C) The weight of the mail sender information (FROM) is set to W FROM = 70
Is also set as
(E) The coefficient for the document name presence / absence data is
Coefficient for True: N TRUE = 1,
Coefficient for False: N FALSE = 0.5
Is set as.
このとき、図13(a)に示す
パス:¥¥PC1¥data、文書名:doc.txt
についてのランク値[R]と、日付代表値[T]は、
図13(b)に示す算出式によって求められる。すなわち、
R=(1×100+0×50+0×70)×1
+(1×100+0×50+0×70)×1
+(1×100+0×50+0×70)×0.5
=250
となる。
At this time, the path shown in FIG. 13A: \\ PC1 \ data, document name: doc. txt
The rank value [R] and date representative value [T] for
It is calculated | required by the calculation formula shown in FIG.13 (b). That is,
R = (1 × 100 + 0 × 50 + 0 × 70) × 1
+ (1 × 100 + 0 × 50 + 0 × 70) × 1
+ (1 × 100 + 0 × 50 + 0 × 70) × 0.5
= 250
It becomes.
上記式において、
(1×100+0×50+0×70)×1
は、パス:¥¥PC1¥data、文書名:doc.txtのランキング情報中の最上段のロー(行)421のランキング情報データに基づく算出式であり、
最初の[1×100]は、メール宛先情報(To)のデータ、すなわち、図13のデータ401に基づいており、データ401に、
検索ユーザ名:asama
が含まれていることで[1]が設定され、さらに、メール宛先情報(To)の重み:WTO=100を乗算している。
次の[0×50]は、メールコピー先情報(CC)のデータ、すなわち、図13のデータ402に基づいており、データ402に、
検索ユーザ名:asama
が含まれていないことで[0]が設定され、さらに、メールコピー先情報(CC)の重み:WCC=50を乗算している。
次の[0×70]は、メール送信者情報(FROM)のデータ、すなわち、図13のデータ403に基づいており、データ403に、
検索ユーザ名:asama
が含まれていないことで[0]が設定され、さらに、メール送信者情報(FROM)の重み:WFROM=70を乗算している。
最後の[×1]は、文書名ありのデータ、すなわち、図13のデータ404に基づいており、データ404に設定された情報が、文書名あり[True]を示していることから、文書名有無のデータに対する係数としての、Trueの場合の係数:NTRUE=1、
を乗算している。
In the above formula,
(1 × 100 + 0 × 50 + 0 × 70) × 1
Is: path: \\ PC1 \ data, document name: doc. It is a calculation formula based on the ranking information data of the top row (row) 421 in the ranking information of txt,
The first [1 × 100] is based on the data of the mail destination information (To), that is, the
Search user name: asama
[1] is set, and the weight of the mail destination information (To): W TO = 100 is further multiplied.
The next [0 × 50] is based on the mail copy destination information (CC) data, that is, the
Search user name: asama
Is not included, [0] is set, and the weight of mail copy destination information (CC): W CC = 50 is further multiplied.
The next [0 × 70] is based on the mail sender information (FROM) data, that is, the
Search user name: asama
Is not included, [0] is set, and the weight of mail sender information (FROM): W FROM = 70 is further multiplied.
The last [× 1] is based on the data with the document name, that is, the
Is multiplied.
図13(b)に示すランク値[R]の算出式中の第2行の式、すなわち、
(1×100+0×50+0×70)×1
は、図13に示すパス:¥¥PC1¥data、文書名:doc.txtのランキング情報中の中段のロー(行)422のランキング情報に対応する算出式であり、
図13(b)に示すランク値[R]の算出式中の第3行の式、すなわち、
(1×100+0×50+0×70)×0.5
は、図13に示すパス:¥¥PC1¥data、文書名:doc.txtのランキング情報中の下段のロー(行)423のランキング情報に対応する算出式である。
The formula in the second row in the formula for calculating the rank value [R] shown in FIG.
(1 × 100 + 0 × 50 + 0 × 70) × 1
Is a path shown in FIG. 13: \\ PC1 \ data, document name: doc. It is a calculation formula corresponding to the ranking information of the middle row (row) 422 in the ranking information of txt,
The formula in the third row in the formula for calculating the rank value [R] shown in FIG.
(1 x 100 + 0 x 50 + 0 x 70) x 0.5
Is a path shown in FIG. 13: \\ PC1 \ data, document name: doc. This is a calculation formula corresponding to the ranking information of the lower row (row) 423 in the ranking information of txt.
各ロー(行)421〜423は、いずれも、パス:¥¥PC1¥data、文書名:doc.txtのランキング情報として、それぞれ個別のメールにもとづいて取得されたランキング情報である。結果として、パス:¥¥PC1¥data、文書名:doc.txtに対応するランク値[R]は、これら3つのランキング情報に対応する算出ランク値の積算値として算出される。すなわち、
R=(1×100+0×50+0×70)×1
+(1×100+0×50+0×70)×1
+(1×100+0×50+0×70)×0.5
=250
となる。
Each row (line) 421 to 423 has a path: \\ PC1 \ data, a document name: doc. The ranking information acquired based on each individual mail as the ranking information of txt. As a result, path: \\ PC1 \ data, document name: doc. The rank value [R] corresponding to txt is calculated as an integrated value of the calculated rank values corresponding to these three ranking information. That is,
R = (1 × 100 + 0 × 50 + 0 × 70) × 1
+ (1 × 100 + 0 × 50 + 0 × 70) × 1
+ (1 × 100 + 0 × 50 + 0 × 70) × 0.5
= 250
It becomes.
一方、パス:¥¥PC1¥data、文書名:doc.txtの日付代表値[T]は、前述したように、処理対象の1つの文書に対して、複数のランキング情報が存在する場合は、最新の日付を日付代表値[T]とするという規則に基づいて、図13(b)に示すように、
T=max(2004/03/12,2004/03/08,2004/03/05)
=2004/03/12
として、求められる。
On the other hand, path: \\ PC1 \ data, document name: doc. As described above, the date representative value [T] of txt is based on the rule that the latest date is the date representative value [T] when a plurality of ranking information exists for one document to be processed. Based on this, as shown in FIG.
T = max (2004/03/12, 2004/03/08, 2004/03/05)
= 2004/03/12
As required.
このように、図12のステップS101、S102では、検索結果(1)に含まれるドキュメント(文書)について、ランク値[R]と、日付代表値[T]とが求められる。ランク値[R]と、日付代表値[T]は、検索結果(1)に含まれるドキュメント(文書)各々について算出される。 As described above, in steps S101 and S102 in FIG. 12, the rank value [R] and the date representative value [T] are obtained for the document (document) included in the search result (1). The rank value [R] and the date representative value [T] are calculated for each document (document) included in the search result (1).
上述した処理を検索結果(1)に含まれるドキュメント(文書)各々について実行して、検索結果(1)に含まれるドキュメント(文書)について、ランク値[R]と、日付代表値[T]が求められた後、図12のフローのステップS106に進む。 The above-described processing is executed for each document (document) included in the search result (1), and the rank value [R] and the date representative value [T] are obtained for the document (document) included in the search result (1). After the determination, the process proceeds to step S106 in the flow of FIG.
ステップS106では、検索結果(1)に含まれるドキュメント(文書)のリストを、ドキュメント(文書)各々についてのランク値[R]と、日付代表値[T]とを適用してソート処理を実行して、検索結果(2)222(図2参照)を生成する。 In step S106, the list of documents (documents) included in the search result (1) is sorted by applying the rank value [R] and the date representative value [T] for each document (document). The search result (2) 222 (see FIG. 2) is generated.
ソート結果として取得されるリスト、すなわち検索結果(2)の例を図14に示す。図14の検索結果(2)は、図12(a)に示す検索結果(1)に基づいて生成されたデータであり、検索結果(1)に示す各文書、すなわち、
(ID1)¥¥PC1¥data,doc.txt
(ID2)http://www・・・download.htm
(ID3)¥¥PCN¥data・・・Info.doc
の3文書について、ランク値[R]と、日付代表値[T]とを適用してソート処理を実行した結果が、図14に示す検索結果(2)である。
FIG. 14 shows an example of the list acquired as the sort result, that is, the search result (2). The search result (2) in FIG. 14 is data generated based on the search result (1) shown in FIG. 12A, and each document shown in the search result (1), that is,
(ID1) \\ PC1 \ data, doc. txt
(ID2) http: //www...download.htm
(ID3) \\ PCN \ data ... Info. doc
The search result (2) shown in FIG. 14 is the result of executing the sort process by applying the rank value [R] and the date representative value [T] to these three documents.
各文書のランク値[R]と、日付代表値[T]は、図14に示すように、
ID1の文書:ランク値R=250、日付代表値T=2004/03/12
ID2の文書:ランク値R=100、日付代表値T=2004/03/12
ID3の文書:ランク値R=220、日付代表値T=2004/03/08
として算出されている。
The rank value [R] and the date representative value [T] of each document are as shown in FIG.
Document with ID1: rank value R = 250, date representative value T = 2004/03/12
Document ID2: Rank value R = 100, date representative value T = 2004/03/12
Document with ID3: rank value R = 220, date representative value T = 2004/03/08
It is calculated as.
本例において、ソート処理は、図12のステップS106に記述しているように、ランク値[R]を第1キーとして、日付代表値[T]を第2キーとしてソート処理を実行する。結果として、図14に示すように、リスト順は、
(リスト1)ID1の文書:ランク値R=250、日付代表値T=2,004/03/1
(リスト2)ID3の文書:ランク値R=220、日付代表値T=2004/03/08
(リスト3)ID2の文書:ランク値R=100、日付代表値T=2004/03/12
として、検索結果(2)が生成される。
In this example, the sort process is performed using the rank value [R] as the first key and the date representative value [T] as the second key as described in step S106 of FIG. As a result, as shown in FIG.
(List 1) Document ID1: Rank value R = 250, Date representative value T = 2, 004/03/1
(List 2) Document ID3: Rank value R = 220, Date representative value T = 2004/03/08
(List 3) Document ID2: Rank value R = 100, date representative value T = 2004/03/12
As a result, the search result (2) is generated.
なお、上述のソート処理におけるソートキーの設定は一例であり、この他のソートキーの設定を適用してソートを行うことは可能である。 Note that the setting of the sort key in the sort process described above is an example, and it is possible to perform sorting by applying other sort key settings.
このように、本発明の構成では、日常的にクライアントの送受信するメールから、ドキュメント(文書)のランキング情報を取得して、取得したランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データに対して、ランキング処理を実行してユーザに提示することが可能となり、ユーザによる文書の推薦処理といった手間をかけることなく、ユーザに対応した最適なランキングを行った情報提供が可能となる。 As described above, according to the configuration of the present invention, the ranking information of the document (document) is acquired from the mail transmitted and received by the client on a daily basis, and the document information provided to the client according to the acquired ranking information, for example, from the client It is possible to perform ranking processing on the search result data generated in response to the search request and present it to the user, and the optimum ranking corresponding to the user can be obtained without trouble of document recommendation processing by the user. The information provided can be provided.
最後に、上述した処理を実行する情報処理装置110のハードウェア構成例について、図15を参照して説明する。
Finally, a hardware configuration example of the
CPU(Central Processing Unit)501は、OS(Operating System)、上述の実施例において説明した検索処理、ランキング情報決定処理、ランキング処理等の各処理の実行シーケンスを記述した各種コンピュータ・プログラムに従った処理を実行する制御部である。 A CPU (Central Processing Unit) 501 is a process according to various computer programs describing an execution sequence of each process such as an OS (Operating System), search processing, ranking information determination processing, ranking processing, and the like described in the above-described embodiments. It is a control part which performs.
ROM(Read Only Memory)502は、CPU501が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)503は、CPU501の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス504により相互に接続されている。
A ROM (Read Only Memory) 502 stores programs used by the
ホストバス504は、ブリッジ505を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス506に接続されている。
The
キーボード508、ポインティングデバイス509は、ユーザにより操作される入力デバイスである。ディスプレイ510は、液晶表示装置またはCRT(Cathode Ray Tube)などから成り、各種情報をテキストやイメージで表示する。
A
HDD(Hard Disk Drive)511は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU501によって実行するプログラムや情報を記録または再生させる。ハードディスクは、図1に示すインデックス格納部113としての役割、および各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
An HDD (Hard Disk Drive) 511 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the
ドライブ512は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記録媒体521に記録されているデータまたはプログラムを読み出して、そのデータまたはプログラムを、インタフェース507、外部バス506、ブリッジ505、およびホストバス504を介して接続されているRAM503に供給する。
The
接続ポート514は、外部接続機器522を接続するポートであり、USB,IEEE1394等の接続部を持つ。接続ポート514は、インタフェース507、および外部バス506、ブリッジ505、ホストバス504等を介してCPU501等に接続されている。通信部515は、ネットワークに接続され、CPU501、またはHDD511等からの供給データの送信、データ受信を実行する。
The
なお、図15に示す情報処理装置のハードウェア構成例は、PCを適用して構成した装置の一例であり、本発明の情報処理装置は、図15に示す構成に限らず、上述した実施例において説明した処理を実行可能な構成であればよい。 Note that the hardware configuration example of the information processing apparatus shown in FIG. 15 is an example of an apparatus configured by applying a PC, and the information processing apparatus of the present invention is not limited to the configuration shown in FIG. Any configuration can be used as long as the processing described in the above can be executed.
以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。 The present invention has been described in detail above with reference to specific embodiments. However, it is obvious that those skilled in the art can make modifications and substitutions of the embodiments without departing from the gist of the present invention. In other words, the present invention has been disclosed in the form of exemplification, and should not be interpreted in a limited manner. In order to determine the gist of the present invention, the claims should be taken into consideration.
なお、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。 The series of processes described in the specification can be executed by hardware, software, or a combined configuration of both. When executing processing by software, the program recording the processing sequence is installed in a memory in a computer incorporated in dedicated hardware and executed, or the program is executed on a general-purpose computer capable of executing various processing. It can be installed and run.
例えば、プログラムは記録媒体としてのハードディスクやROM(Read Only Memory)に予め記録しておくことができる。あるいは、プログラムはフレキシブルディスク、CD−ROM(Compact Disc Read Only Memory),MO(Magneto optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウエアとして提供することができる。 For example, the program can be recorded in advance on a hard disk or ROM (Read Only Memory) as a recording medium. Alternatively, the program is temporarily or permanently stored on a removable recording medium such as a flexible disk, a CD-ROM (Compact Disc Read Only Memory), an MO (Magneto optical) disk, a DVD (Digital Versatile Disc), a magnetic disk, or a semiconductor memory. It can be stored (recorded). Such a removable recording medium can be provided as so-called package software.
なお、プログラムは、上述したようなリムーバブル記録媒体からコンピュータにインストールする他、ダウンロードサイトから、コンピュータに無線転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送し、コンピュータでは、そのようにして転送されてくるプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。 The program is installed on the computer from the removable recording medium as described above, or is wirelessly transferred from the download site to the computer, or is wired to the computer via a network such as a LAN (Local Area Network) or the Internet. The computer can receive the program transferred in this manner and install it on a recording medium such as a built-in hard disk.
なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。 Note that the various processes described in the specification are not only executed in time series according to the description, but may be executed in parallel or individually according to the processing capability of the apparatus that executes the processes or as necessary. Further, in this specification, the system is a logical set configuration of a plurality of devices, and the devices of each configuration are not limited to being in the same casing.
以上、説明したように、本発明の構成によれば、日常的にクライアントの送受信するメールから、ドキュメント(文書)のランキング情報として適用可能なデータを取得して、取得したデータをドキュメント情報格納部としてのインデックス格納部に格納し、これらのランキング情報に従って、クライアントに提供する文書情報、例えば、クライアントからの検索要求に応じて生成した検索結果データに対して、ランキング処理を実行してユーザに提示する構成としたので、ユーザによる文書の推薦処理といった手間をかけることなく、ユーザに対応した最適なランキングを行った情報提供が可能となり、ユーザに適応したデータリストなど、検索結果を効率的に提供可能な検索システム、情報提供システムが構築可能となる。 As described above, according to the configuration of the present invention, data applicable as ranking information of a document (document) is acquired from mail that is regularly transmitted and received by a client, and the acquired data is stored in a document information storage unit. The index information is stored in the index storage unit, and the ranking information is executed on the document information provided to the client according to the ranking information, for example, the search result data generated in response to the search request from the client, and presented to the user. It is possible to provide information with the most suitable ranking corresponding to the user without the trouble of recommending the document by the user, and efficiently provide search results such as a data list adapted to the user. Possible search system and information provision system can be constructed.
110 情報処理装置
111 ランキング情報決定部
112 検索部
113 インデックス格納部
114 データ収集・登録処理部
115 ユーザ情報格納部
116 ランキング処理部
121 ファイルサーバ
122 メールサーバ
131 クライアント
150 ネットワーク
201 メール取得部
202 ランキング情報抽出部
203 メーリングリスト(ML)メンバー抽出部
204 ユーザ情報抽出部
205 更新文書決定部
206 ランキング情報更新部
211 メール
212 ランキング情報(1)
213 ランキング情報(2)
214 ランキング情報(3)
215 更新リスト
216 更新インデックス
217 MLメンバーデータ
218 ユーザ情報
221 検索結果(1)
222 検索結果(2)
301 属性データ部
302 本文データ部
311〜313 ドキュメント情報
351〜354 データ部
401〜404 データ
421〜423 ランキング情報
501 CPU(Central Processing Unit)
502 ROM(Read-Only-Memory)
503 RAM(Random Access Memory)
504 ホストバス
505 ブリッジ
506 外部バス
507 インタフェース
508 キーボード
509 ポインティングデバイス
510 ディスプレイ
511 HDD(Hard Disk Drive)
512 ドライブ
514 接続ポート
515 通信部
521 リムーバブル記録媒体
522 外部接続機器
DESCRIPTION OF
213 Ranking information (2)
214 Ranking Information (3)
215
222 results found (2)
DESCRIPTION OF
502 ROM (Read-Only-Memory)
503 RAM (Random Access Memory)
504
512
Claims (9)
ドキュメントを特定するドキュメント特定情報を含むインデックスデータを格納したインデックス格納部と、
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索部と、
ネットワークを介して転送されるメールデータから、前記ドキュメント特定情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、前記インデックス格納部に格納する処理を実行するランキング情報決定部と、
前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理部と、
を有し、
前記ランキング情報決定部は、前記メールデータのうちのドキュメント格納情報を含むメールデータの各々から、
(a)メール本文中に記述されているドキュメント格納場所情報、
と、
(b)メール宛先情報(To)、
(c)メールコピー先情報(CC)、
(d)メール送信者情報(FROM)、
のメールデータの属性情報のうちの少なくとも1つとを抽出し、
当該メールデータの各々について、前記インデックスデータにおいて、(a)メール本文中に記述されているドキュメント格納場所情報に対応するドキュメント特定情報に関連付けて、前記メールデータの属性情報のうちの少なくとも1つをランキング情報として格納し、
前記ランキング処理部は、前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して前記メールデータごとに設定されたランキング情報の各々に基づいて、該ランキング情報の構成データに検索実行ユーザが含まれるか否かによって異なる値とした変数から前記メールデータごとのランキング情報についてランク値[r]を算出し、これらランキング情報ごとのランク値[r]を累積して当該ドキュメントの統合ランク値[R]を算出し、該算出した統合ランク値[R]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成
することを特徴とする情報処理装置。 The information processing apparatus der is,
And index storage unit for storing the index data including the document identification information for identifying the document,
A search unit that executes a search process based on the storage information of the index storage unit;
A ranking information determination unit that acquires ranking information to be applied to ranking processing of the document specific information from mail data transferred via a network, and stores the ranking information corresponding to each document in the index storage unit When,
A ranking processing unit that executes a provision data generation process to which the ranking information is applied to a first search result generated by the search of the search unit, and generates a second search result reflecting the ranking information;
I have a,
The ranking information determination unit, from each of mail data including document storage information of the mail data,
(A) Document storage location information described in the email body,
When,
(B) Mail destination information (To),
(C) Mail copy destination information (CC),
(D) Mail sender information (FROM),
And at least one of the attribute information of the mail data of
For each of the mail data, in the index data, (a) at least one of the attribute information of the mail data is associated with the document specifying information corresponding to the document storage location information described in the mail text. Store as ranking information,
The ranking processing unit is configured based on each ranking information set for each mail data corresponding to a document included in the first search result generated by the search of the search unit. The rank value [r] is calculated for the ranking information for each of the mail data from the variable that is different depending on whether or not the search execution user is included, and the rank value [r] for each ranking information is accumulated to obtain the document. The integrated rank value [R] is calculated, and based on the calculated integrated rank value [R], the document included in the first search result is sorted, and the second search that reflects the ranking information is performed. An information processing apparatus that generates a result .
ランキング情報として取得するメールアドレスデータに複数のメールアドレスの集合として設定されたメーリングリストを、各ユーザ対応のメールアドレスに変換する処理を実行する構成であることを特徴とする請求項1に記載の情報処理装置。 The ranking information determination unit
The information according to claim 1, wherein the mail address list acquired as ranking information is configured to execute a process of converting a mailing list set as a set of a plurality of mail addresses into mail addresses corresponding to each user. Processing equipment.
メールアドレス情報とユーザ名とを対応付けたユーザ情報データを格納したユーザ情報格納部を有し、
前記ランキング情報決定部は、
ランキング情報として取得するメールアドレスデータを、前記ユーザ情報に従って、ユーザ名に変換し、ランキング情報を生成する処理を実行する構成であることを特徴とする請求項1に記載の情報処理装置。 The information processing apparatus further includes:
A user information storage unit storing user information data in which mail address information and a user name are associated;
The ranking information determination unit
The information processing apparatus according to claim 1, wherein mail address data acquired as ranking information is converted into a user name according to the user information, and processing for generating ranking information is executed.
ネットワークを介して転送されるメールデータから、前記ドキュメント情報のランキング処理に適用するランキング情報を取得した場合、
前記インデックス格納部に格納済みのインデックスデータに、取得ランキング情報を追加する更新処理を実行する構成であることを特徴とする請求項1に記載の情報処理装置。 The ranking information determination unit
When the ranking information applied to the ranking processing of the document information is acquired from the mail data transferred via the network,
The information processing apparatus according to claim 1, wherein the information processing apparatus is configured to execute an update process for adding acquired ranking information to index data stored in the index storage unit.
前記ランキング情報の構成データに対して重み(W)または係数(N)を設定し、
前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に基づいて、前記重み(W)および係数(N)と、該ランキング情報の構成データに検索実行ユーザが含まれるか否かによって異なる値とした前記変数とに基づいて、ドキュメント対応のランク値[R]を算出し、該算出したランク値[R]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする請求項1に記載の情報処理装置。 The ranking processing unit
Set weight (W) or coefficient (N) for the constituent data of the ranking information,
Based on the ranking information set corresponding to the document included in the first search result generated by the search of the search unit, the weight (W) and coefficient (N) and the constituent data of the ranking information based search run different values depending on whether the user is included and the said variables, calculates the document corresponding rank value [R], based on the rank value the calculated [R], search the first The information processing apparatus according to claim 1, wherein the information processing apparatus is configured to execute a sorting process of documents included in the result and generate a second search result reflecting the ranking information.
前記ランキング処理部は、ランキング情報ごとに算出したランク値に対して、当該構成データに基づいて文書の特定情報を含むか否かに応じて異なる値とした係数(N)を設定する構成であることを特徴とする請求項1に記載の情報処理装置。 Each of the ranking information includes (a) configuration data indicating whether the document storage location information described in the mail text includes specific document information or only a path name extracted from the corresponding mail data. ,
The ranking processing unit is configured to set a coefficient (N) with different values depending on whether or not document specific information is included based on the configuration data for the rank value calculated for each ranking information. The information processing apparatus according to claim 1.
ドキュメントを特定するドキュメント特定情報を含むインデックスデータを格納したインデックス格納部と、
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索部と、
ネットワークを介して転送されるメールデータから、前記ドキュメント特定情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、前記インデックス格納部に格納する処理を実行するランキング情報決定部と、
前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理部と、
を有し、
前記ランキング情報決定部は、前記メールデータのうちのドキュメント格納情報を含むメールデータの各々から、
(a)メール本文中に記述されているドキュメント格納場所情報、
と、
(b)メール送信日時情報(DATE)、
とを抽出し、
当該メールデータの各々について、前記インデックスデータにおいて、(a)メール本文中に記述されているドキュメント格納場所情報に対応するドキュメント特定情報に関連付けて、(b)メール送信日時情報(DATE)をランキング情報として格納し、
前記ランキング処理部は、
前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に含まれるメール送信日時情報としての日付データについて、同一ドキュメントについて最新のデータを取得する日付代表値[T]算出処理を実行し、該算出した日付代表値[T]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とする情報処理装置。 An information processing device,
An index storage unit storing index data including document specifying information for specifying a document;
A search unit that executes a search process based on the storage information of the index storage unit;
A ranking information determination unit that acquires ranking information to be applied to ranking processing of the document specific information from mail data transferred via a network, and stores the ranking information corresponding to each document in the index storage unit When,
A ranking processing unit that executes a provision data generation process to which the ranking information is applied to a first search result generated by the search of the search unit, and generates a second search result reflecting the ranking information;
Have
The ranking information determination unit, from each of mail data including document storage information of the mail data,
(A) Document storage location information described in the email body,
When,
(B) Mail transmission date / time information (DATE),
And extract
For each of the mail data, in the index data, (a) in association with document specifying information corresponding to the document storage location information described in the mail body, (b) the mail transmission date / time information (DATE) is ranked information. Store as
The ranking processing unit
The date for obtaining the latest data for the same document as the date data as the mail transmission date / time information included in the ranking information set corresponding to the document included in the first search result generated by the search by the search unit The representative value [T] calculation process is executed, and based on the calculated date representative value [T], the document included in the first search result is sorted, and the second search reflecting the ranking information is performed. information processing apparatus you characterized in that is configured to produce a result.
ドキュメントを特定するドキュメント特定情報を含むインデックスデータを格納したインデックス格納部、
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索部と、
ネットワークを介して転送されるメールデータから、前記ドキュメント特定情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、前記インデックス格納部に格納する処理を実行するランキング情報決定部、
前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理部、
として機能させ、
前記ランキング情報決定部は、前記メールデータのうちのドキュメント格納情報を含むメールデータの各々から、
(a)メール本文中に記述されているドキュメント格納場所情報、
と、
(b)メール宛先情報(To)、
(c)メールコピー先情報(CC)、
(d)メール送信者情報(FROM)、
のメールデータの属性情報のうちの少なくとも1つとを抽出し、
当該メールデータの各々について、前記インデックスデータにおいて、(a)メール本文中に記述されているドキュメント格納場所情報に対応するドキュメント特定情報に関連付けて、前記メールデータの属性情報のうちの少なくとも1つをランキング情報として格納し、
前記ランキング処理部は、前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して前記メールデータごとに設定されたランキング情報の各々に基づいて、該ランキング情報の構成データに検索実行ユーザが含まれるか否かによって異なる値とした変数から前記メールデータごとのランキング情報についてランク値[r]を算出し、これらランキング情報ごとのランク値[r]を累積して当該ドキュメントの統合ランク値[R]を算出し、該算出した統合ランク値[R]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成することを特徴とするコンピュータ・プログラム。 Computer
An index storage unit storing index data including document specifying information for specifying a document;
A search unit that executes a search process based on the storage information of the index storage unit;
A ranking information determination unit that acquires ranking information to be applied to ranking processing of the document specific information from mail data transferred via a network, and stores the ranking information corresponding to each document in the index storage unit ,
A ranking processing unit that executes a provision data generation process that applies the ranking information to the first search result generated by the search of the search unit, and generates a second search result that reflects the ranking information;
Function as
The ranking information determination unit, from each of mail data including document storage information of the mail data,
(A) Document storage location information described in the email body,
When,
(B) Mail destination information (To),
(C) Mail copy destination information (CC),
(D) Mail sender information (FROM),
And at least one of the attribute information of the mail data of
For each of the mail data, in the index data, (a) at least one of the attribute information of the mail data is associated with the document specifying information corresponding to the document storage location information described in the mail text. Store as ranking information,
The ranking processing unit is configured based on each ranking information set for each mail data corresponding to a document included in the first search result generated by the search of the search unit. The rank value [r] is calculated for the ranking information for each of the mail data from the variable that is different depending on whether or not the search execution user is included, and the rank value [r] for each ranking information is accumulated to obtain the document. The integrated rank value [R] is calculated, and based on the calculated integrated rank value [R], the document included in the first search result is sorted, and the second search that reflects the ranking information is performed. A computer program characterized by generating a result .
ドキュメントを特定するドキュメント特定情報を含むインデックスデータを格納したインデックス格納部、An index storage unit storing index data including document specifying information for specifying a document;
前記インデックス格納部の格納情報に基づいて検索処理を実行する検索部、A search unit that executes a search process based on the storage information of the index storage unit;
ネットワークを介して転送されるメールデータから、前記ドキュメント特定情報のランキング処理に適用するランキング情報を取得し、各ドキュメント対応のランキング情報として、前記インデックス格納部に格納する処理を実行するランキング情報決定部、A ranking information determination unit that acquires ranking information to be applied to ranking processing of the document specific information from mail data transferred via a network, and stores the ranking information corresponding to each document in the index storage unit ,
前記検索部の検索により生成された第1の検索結果に対して、前記ランキング情報を適用した提供データ生成処理を実行し、ランキング情報を反映した第2の検索結果を生成するランキング処理部、A ranking processing unit that executes a provision data generation process that applies the ranking information to the first search result generated by the search of the search unit, and generates a second search result that reflects the ranking information;
として機能させ、Function as
前記ランキング情報決定部は、前記メールデータのうちのドキュメント格納情報を含むメールデータの各々から、The ranking information determination unit, from each of mail data including document storage information of the mail data,
(a)メール本文中に記述されているドキュメント格納場所情報、(A) Document storage location information described in the email body,
と、When,
(b)メール送信日時情報(DATE)、(B) Mail transmission date / time information (DATE),
とを抽出し、And extract
当該メールデータの各々について、前記インデックスデータにおいて、(a)メール本文中に記述されているドキュメント格納場所情報に対応するドキュメント特定情報に関連付けて、(b)メール送信日時情報(DATE)をランキング情報として格納し、For each of the mail data, in the index data, (a) in association with document specifying information corresponding to the document storage location information described in the mail body, (b) the mail transmission date / time information (DATE) is ranked information. Store as
前記ランキング処理部は、The ranking processing unit
前記検索部の検索により生成された第1の検索結果に含まれるドキュメントに対応して設定されたランキング情報に含まれるメール送信日時情報としての日付データについて、同一ドキュメントについて最新のデータを取得する日付代表値[T]算出処理を実行し、該算出した日付代表値[T]に基づいて、前記第1の検索結果に含まれるドキュメントのソート処理を実行し、ランキング情報を反映した第2の検索結果を生成する構成であることを特徴とするコンピュータ・プログラム。The date for obtaining the latest data for the same document as the date data as the mail transmission date / time information included in the ranking information set corresponding to the document included in the first search result generated by the search by the search unit The representative value [T] calculation process is executed, and based on the calculated date representative value [T], the document included in the first search result is sorted, and the second search reflecting the ranking information is performed. A computer program characterized by being configured to generate a result.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004271457A JP4479439B2 (en) | 2004-09-17 | 2004-09-17 | Information processing apparatus, information processing method, and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004271457A JP4479439B2 (en) | 2004-09-17 | 2004-09-17 | Information processing apparatus, information processing method, and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006085564A JP2006085564A (en) | 2006-03-30 |
JP4479439B2 true JP4479439B2 (en) | 2010-06-09 |
Family
ID=36164001
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004271457A Expired - Fee Related JP4479439B2 (en) | 2004-09-17 | 2004-09-17 | Information processing apparatus, information processing method, and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4479439B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9773347B2 (en) | 2011-11-08 | 2017-09-26 | Koninklijke Philips N.V. | Interacting with a three-dimensional object dataset |
-
2004
- 2004-09-17 JP JP2004271457A patent/JP4479439B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006085564A (en) | 2006-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4678546B2 (en) | RECOMMENDATION DEVICE AND METHOD, PROGRAM, AND RECORDING MEDIUM | |
JP5147947B2 (en) | Method and system for generating search collection by query | |
KR101064634B1 (en) | Customized contents providing method and system | |
CN105900117B (en) | Method and system for collecting, normalizing, matching and enriching data | |
US8396879B1 (en) | Ranking authors and their content in the same framework | |
US9069771B2 (en) | Music recognition method and system based on socialized music server | |
JP2006331117A (en) | Document retrieval system, document retrieval apparatus, document retrieval method and document retrieval program | |
JP4962980B2 (en) | Search result classification apparatus and method using click log | |
JP2011203964A (en) | Document management system and method | |
JP2006099341A (en) | Update history generation device and program | |
CA2847187A1 (en) | Searching for and creating an adaptive content | |
JP2009265754A (en) | Information providing system, information providing method, and information providing program | |
JP5458861B2 (en) | Document search device, program, document registration device, and document search system | |
KR20080078930A (en) | Information providing method and system of extracting a personalized issue | |
JP5010624B2 (en) | Search device | |
JP5284064B2 (en) | Product ID server device and method for controlling product ID server device | |
JP5266975B2 (en) | Personal search system, information processing apparatus, personal search method, program, and recording medium | |
JP4181196B2 (en) | SEARCH SYSTEM, SEARCH METHOD, AND INFORMATION MANAGEMENT DEVICE | |
JP4287464B2 (en) | System infrastructure configuration development support system and support method | |
JP4479439B2 (en) | Information processing apparatus, information processing method, and computer program | |
JP5181504B2 (en) | Data processing method, program, and information processing apparatus | |
JP2010282503A (en) | Relevant information retrieval/display system, relevant information retrieval/display method, and program | |
JP4469818B2 (en) | Data management apparatus, data program, and data management method | |
JP2006092023A (en) | Document control computer program, document control device and method | |
JP2006185020A (en) | Information processor, information processing method and computer program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090825 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091019 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100223 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100308 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130326 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4479439 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130326 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140326 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |