JP2019175419A - Data providing system, data providing method, and computer program - Google Patents
Data providing system, data providing method, and computer program Download PDFInfo
- Publication number
- JP2019175419A JP2019175419A JP2018180220A JP2018180220A JP2019175419A JP 2019175419 A JP2019175419 A JP 2019175419A JP 2018180220 A JP2018180220 A JP 2018180220A JP 2018180220 A JP2018180220 A JP 2018180220A JP 2019175419 A JP2019175419 A JP 2019175419A
- Authority
- JP
- Japan
- Prior art keywords
- data
- feature data
- cluster
- group
- clusters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本開示は、情報処理システム及びデータ提供システム、並びに関連する方法に関する。 The present disclosure relates to an information processing system, a data providing system, and related methods.
従来、商品の販売データに基づき顧客の購買行動を解析することが行われている。商業活動に役立てるために、顧客によるマスメディアやネットワークコンテンツへの接触行動を解析することも行われている。アンケート形式や対面での質問形式により、顧客の購買行動、マスメディア/ネットワークコンテンツへの接触行動、及び、ライフスタイル等の多様な情報を収集することも行われている。 Conventionally, a customer's purchasing behavior is analyzed based on product sales data. In order to make use for commercial activities, the customer's contact with mass media and network contents is also analyzed. Various types of information such as customer purchase behavior, mass media / network content contact behavior, and lifestyles are also collected using a questionnaire format or a face-to-face question format.
近年では、こうした顧客に関するデータを備える巨大なデータベースを、各企業が有している。しかしながら、各企業は、個人情報保護を主な理由として、これらの顧客に関するデータを外部に提供することに消極的である。これらのデータは、それを保有する企業から外部に提供される場合、暗号化されて提供されたり、顧客の特定に繋がる情報が大幅に削除されて提供されたり、意図的に誤り(ノイズ)を含むように変更された状態で提供されたりする(特許文献1参照)。 In recent years, each company has a huge database with data on such customers. However, each company is reluctant to provide data on these customers to the outside mainly due to the protection of personal information. When these data are provided to the outside by the company that owns them, they are provided in encrypted form, provided with information that leads to the identification of customers being significantly deleted, or intentionally erroneous (noise). It is provided in a state changed to include (see Patent Document 1).
上述したように、データ保有企業からの顧客に関するデータの提供は、従来、個人情報保護の観点から限られている。 As described above, the provision of data related to customers from data holding companies is conventionally limited from the viewpoint of personal information protection.
そこで、本開示の一側面では、個人情報保護を考慮したデータ提供及びデータ処理に関する新規技術を提供できることが望ましい。 Therefore, in one aspect of the present disclosure, it is desirable to be able to provide a new technique related to data provision and data processing in consideration of personal information protection.
本開示の一側面に係る情報処理システムは、記憶ユニットと、取得ユニットと、結合ユニットと、を備える。記憶ユニットは、第一のグループに関する第一の特徴データの一群を記憶するように構成される。取得ユニットは、第二のグループに関する第二の特徴データの一群を取得するように構成される。第一のグループは、複数の第一の構成体を含む。第二のグループは、複数の第二の構成体を含む。 An information processing system according to an aspect of the present disclosure includes a storage unit, an acquisition unit, and a combining unit. The storage unit is configured to store a group of first feature data relating to the first group. The acquisition unit is configured to acquire a group of second feature data relating to the second group. The first group includes a plurality of first structures. The second group includes a plurality of second structures.
第一の特徴データのそれぞれは、対応する一以上の第一の構成体の特徴を表す。第一の特徴データのそれぞれは、対応する一以上の第一の構成体の識別子である第一の識別子に関連付けられる。 Each of the first feature data represents a feature of the corresponding one or more first components. Each of the first feature data is associated with a first identifier that is an identifier of the corresponding one or more first constructs.
第二の特徴データのそれぞれは、第二のグループにおける複数のクラスタのそれぞれに対応する。複数のクラスタのそれぞれは、複数の第二の構成体のうちの二以上を含む。第二の特徴データのそれぞれは、対応するクラスタに含まれる二以上の第二の構成体の特徴を統計量で表す統計データを備える。統計データは、対応するクラスタに含まれる二以上の第二の構成体の識別子である第二の識別子に関連付けられる。 Each of the second feature data corresponds to each of the plurality of clusters in the second group. Each of the plurality of clusters includes two or more of the plurality of second structures. Each of the second feature data includes statistical data that represents the features of two or more second constituents included in the corresponding cluster by a statistical amount. The statistical data is associated with a second identifier that is an identifier of two or more second constructs included in the corresponding cluster.
結合ユニットは、第一の特徴データに関連付けられた第一の識別子に基づき、第一の特徴データのそれぞれを、対応する第二の識別子に関連付けられた第二の特徴データの統計データと結合するように、第一の特徴データの一群と第二の特徴データの一群とを結合するように構成される。 The combining unit combines each of the first feature data with the statistical data of the second feature data associated with the corresponding second identifier based on the first identifier associated with the first feature data. As described above, the first feature data group and the second feature data group are configured to be combined.
この情報処理システムによれば、第二のグループに関する第二の特徴データを、情報保護された統計データとして取得しながらも、統計データに対応する構成体を第二の識別子に基づき具体的に識別して、対応する構成体の第一の特徴データと結合することができる。従って、本開示の一側面によれば、個人情報保護を実現しながら、第一のグループの構成体と第二のグループの構成体と間の対応関係に適合した有意義なデータ結合を実現することができる。このように、本開示の一側面によれば、有意義なデータ結合技術を提供することができる。 According to this information processing system, the second feature data related to the second group is acquired as statistical data with information protection, and the structure corresponding to the statistical data is specifically identified based on the second identifier. Thus, it can be combined with the first feature data of the corresponding structure. Therefore, according to one aspect of the present disclosure, it is possible to realize a meaningful data combination suitable for the correspondence between the first group constituent and the second group constituent while realizing the protection of personal information. Can do. Thus, according to one aspect of the present disclosure, a meaningful data combining technique can be provided.
本開示の一側面によれば、取得ユニットは、複数の第二の構成体のそれぞれに対応する複数の個別特徴データを備えるデータ提供システムに、指定した制約条件に従って複数の第二の構成体を複数のクラスタにクラスタリングするように要求し、データ提供システムから制約条件に従う複数のクラスタに対応する第二の特徴データの一群を取得してもよい。 According to one aspect of the present disclosure, an acquisition unit includes a plurality of second constituents according to a designated constraint condition in a data providing system including a plurality of individual feature data corresponding to each of the plurality of second constituents. The cluster may be requested to be clustered into a plurality of clusters, and a group of second feature data corresponding to the plurality of clusters complying with the constraints may be acquired from the data providing system.
データ提供システムは、制約条件に従って、複数の第二の構成体を複数のクラスタにクラスタリングし、複数のクラスタに対応する第二の特徴データの一群を、情報処理システムに提供するように構成されてもよい。本開示の一側面によれば、統計データは、データ提供システムが、対応するクラスタに含まれる二以上の第二の構成体の個別特徴データが示す二以上の第二の構成体の特徴を統計量に変換することにより生成されてもよい。 The data providing system is configured to cluster a plurality of second constructs into a plurality of clusters according to a constraint condition, and to provide a group of second feature data corresponding to the plurality of clusters to the information processing system. Also good. According to one aspect of the present disclosure, the statistical data is obtained by statistically analyzing the characteristics of the two or more second components indicated by the individual feature data of the two or more second components included in the corresponding cluster. It may be generated by converting to a quantity.
制約条件を情報処理システムがデータ提供システムに指定することによれば、情報処理システムは、データ提供システムのクラスタリングを制御することができる。これにより、一つのクラスタに対応する複数の個別特徴データが有する情報が、統計データとしてまとめられる際に、有意義な情報が失われるのを抑制することができる。即ち、データ提供システムにおける不適切なクラスタリングに起因して、データ提供システムから統計データとして提供される情報の価値が劣化するのを抑制することができる。 When the information processing system designates the constraint condition for the data providing system, the information processing system can control the clustering of the data providing system. As a result, it is possible to suppress the loss of meaningful information when information included in a plurality of individual feature data corresponding to one cluster is collected as statistical data. That is, it is possible to suppress deterioration of the value of information provided as statistical data from the data providing system due to inappropriate clustering in the data providing system.
本開示の一側面によれば、複数の第二の構成体には、複数の第一の構成体のいずれかに対応する複数の対応構成体と、複数の第一の構成体のいずれにも対応しない複数の非対応構成体と、が含まれてもよい。取得ユニットにより取得される第二の特徴データのそれぞれは、第二のグループにおける複数の対応構成体をクラスタリングして定義される複数のクラスタのそれぞれに対応してもよい。 According to one aspect of the present disclosure, the plurality of second constituent members include a plurality of corresponding constituent members corresponding to any of the plurality of first constituent members and a plurality of first constituent members. A plurality of non-corresponding constructs that do not correspond may be included. Each of the second feature data acquired by the acquisition unit may correspond to each of a plurality of clusters defined by clustering a plurality of corresponding constituents in the second group.
本開示の一側面によれば、取得ユニットは、データ提供システムに、複数の対応構成体を複数のクラスタにクラスタリングするように要求してもよい。データ提供システムは、この要求に従って、複数の対応構成体を複数のクラスタにクラスタリングし、複数のクラスタに対応する第二の特徴データの一群を、情報処理システムに提供するように構成されてもよい。 According to one aspect of the present disclosure, the acquisition unit may request the data providing system to cluster a plurality of corresponding constructs into a plurality of clusters. In accordance with this request, the data providing system may be configured to cluster a plurality of corresponding constructs into a plurality of clusters and provide a group of second feature data corresponding to the plurality of clusters to the information processing system. .
本開示の一側面によれば、取得ユニットは、構成体のリストを、データ提供システムに送信してもよい。リストは、具体的には、複数の第一の構成体のリスト又は複数の対応構成体のリストであり得る。データ提供システムは、リストに基づき、第二のグループにおける複数の対応構成体を識別するように構成されてもよい。 According to one aspect of the present disclosure, the acquisition unit may send a list of constructs to the data providing system. Specifically, the list may be a list of a plurality of first structures or a list of a plurality of corresponding structures. The data providing system may be configured to identify a plurality of corresponding entities in the second group based on the list.
本開示の一側面によれば、取得ユニットは、リストに含まれる複数の構成体間の特徴空
間上の距離を表す距離情報をデータ提供システムに送信してもよい。データ提供システムは、距離情報に基づき、第二のグループにおける複数の対応構成体を、複数のクラスタにクラスタリングするように構成されてもよい。このような距離情報の提供は、データ提供システムにおける第二のグループの適切なクラスタリングに役立つ。
According to one aspect of the present disclosure, the acquisition unit may transmit distance information representing a distance on a feature space between a plurality of constituents included in the list to the data providing system. The data providing system may be configured to cluster a plurality of corresponding constituents in the second group into a plurality of clusters based on the distance information. Providing such distance information is useful for proper clustering of the second group in the data providing system.
本開示の一側面によれば、取得ユニットは、リストに含まれる複数の構成体のそれぞれの分類を表す分類情報をデータ提供システムに送信してもよい。データ提供システムは、分類情報に基づき、第二のグループにおける複数の対応構成体を、一つのクラスタに異なる分類の対応構成体が混在しないように、複数のクラスタにクラスタリングするように構成されてもよい。このような分類情報の提供は、同様に、データ提供システムにおける第二のグループの適切なクラスタリングに役立つ。 According to one aspect of the present disclosure, the acquisition unit may transmit classification information representing each classification of the plurality of constituents included in the list to the data providing system. The data providing system may be configured to cluster a plurality of corresponding constituents in the second group into a plurality of clusters based on the classification information so that corresponding constituents of different classifications are not mixed in one cluster. Good. Providing such classification information is also useful for proper clustering of the second group in the data providing system.
本開示の一側面によれば、第二のグループにおける複数の対応構成体は、第一のグループにおける複数の第一の構成体のいずれかと同一の構成であってもよい。第一のグループと第二のグループとの間では、複数の対応構成体のそれぞれに、同一の識別子が割り当てられていてもよい。結合ユニットは、第一の特徴データのそれぞれを、同一の識別子に関連付けられた第二の特徴データの統計データと結合してもよい。 According to one aspect of the present disclosure, the plurality of corresponding constituents in the second group may have the same configuration as any of the plurality of first constituents in the first group. Between the first group and the second group, the same identifier may be assigned to each of the plurality of corresponding components. The combining unit may combine each of the first feature data with statistical data of the second feature data associated with the same identifier.
本開示の一側面によれば、記憶ユニットは、第一の識別子と第二の識別子との間の対応関係を記憶してもよい。結合ユニットは、対応関係に従って、第一の特徴データのそれぞれを、対応する第二の識別子に関連付けられた第二の特徴データの統計データと結合してもよい。 According to one aspect of the present disclosure, the storage unit may store a correspondence relationship between the first identifier and the second identifier. The combining unit may combine each of the first feature data with statistical data of the second feature data associated with the corresponding second identifier according to the correspondence relationship.
本開示の一側面によれば、第一の特徴データのそれぞれは、第一のグループにおける複数のクラスタのそれぞれに対応していてもよい。複数のクラスタのそれぞれは、複数の第一の構成体のうちの二以上を含んでいてもよい。第一の特徴データは、対応するクラスタに含まれる二以上の第一の構成体の特徴を統計量で表す統計データを備えてもよい。統計データは、対応するクラスタに含まれる二以上の第一の構成体の識別子に関連付けられていてもよい。 According to one aspect of the present disclosure, each of the first feature data may correspond to each of a plurality of clusters in the first group. Each of the plurality of clusters may include two or more of the plurality of first structures. The first feature data may include statistical data that represents the features of two or more first constituents included in the corresponding cluster by a statistical amount. The statistical data may be associated with identifiers of two or more first structures included in the corresponding cluster.
本開示の一側面によれば、複数の第二の構成体には、複数の第一の構成体のいずれかに対応する複数の対応構成体が含まれる環境で、取得ユニットが次のように動作してもよい。即ち、取得ユニットは、複数の対応構成体を、対応する複数の第一の構成体の第一の特徴データに基づき、複数のクラスタにクラスタリングして、複数の対応構成体のそれぞれが属するクラスタを識別可能なクラスタ情報を、複数の第二の構成体のそれぞれに対応する複数の個別特徴データを備えるデータ提供システムに提供し、データ提供システムからクラスタ情報に従う第二の特徴データの一群を取得してもよい。この場合、データ提供システムは、クラスタ情報から識別されるクラスタ毎に、対応するクラスタに含まれる二以上の第二の構成体の個別特徴データが示す二以上の第二の構成体の特徴を統計量に変換することによって、対応するクラスタの第二の特徴データを生成し、生成した第二の特徴データの一群を情報処理システムに提供するように構成されてもよい。 According to one aspect of the present disclosure, in an environment in which the plurality of second constituents include a plurality of corresponding constituents corresponding to any of the plurality of first constituents, the acquisition unit is as follows: It may work. That is, the acquisition unit clusters a plurality of corresponding constituents into a plurality of clusters based on the first feature data of the corresponding first constituents, and selects a cluster to which each of the plurality of corresponding constituents belongs. Providing identifiable cluster information to a data providing system including a plurality of individual feature data corresponding to each of a plurality of second structures, and obtaining a group of second feature data according to the cluster information from the data providing system May be. In this case, for each cluster identified from the cluster information, the data providing system statistically analyzes the characteristics of the two or more second components indicated by the individual feature data of the two or more second components included in the corresponding cluster. It may be configured to generate the second feature data of the corresponding cluster by converting into a quantity, and to provide the group of the generated second feature data to the information processing system.
本開示の一側面によれば、記憶ユニットと、クラスタリングユニットと、生成ユニットと、提供ユニットと、を備えるデータ提供システムが提供されてもよい。記憶ユニットは、グループ内の複数の構成体に対応する複数の個別特徴データを記憶してもよい。 According to one aspect of the present disclosure, a data provision system including a storage unit, a clustering unit, a generation unit, and a provision unit may be provided. The storage unit may store a plurality of individual feature data corresponding to a plurality of components in the group.
クラスタリングユニットは、複数の構成体を複数のクラスタにクラスタリングするように構成されてもよい。生成ユニットは、複数のクラスタに対応するクラスタ特徴データの一群を生成するように構成されてもよい。提供ユニットは、生成ユニットにより生成されたクラスタ特徴データの一群を、情報処理システムに提供するように構成されてもよい。 The clustering unit may be configured to cluster a plurality of constructs into a plurality of clusters. The generating unit may be configured to generate a group of cluster feature data corresponding to a plurality of clusters. The providing unit may be configured to provide a group of cluster feature data generated by the generating unit to the information processing system.
個別特徴データのそれぞれは、対応する構成体の特徴を表すことができる。個別特徴データのそれぞれは、対応する構成体の識別子に関連付けられていてもよい。クラスタ特徴データのそれぞれは、対応するクラスタに含まれる二以上の構成体の特徴を統計量で表す統計データを備えていてもよい。統計データは、対応するクラスタに含まれる二以上の構成体の識別子に関連付けられていてもよい。生成ユニットは、統計データを、対応するクラスタに含まれる二以上の構成体の個別特徴データが示す二以上の構成体の特徴を統計量に変換して生成するように構成されてもよい。 Each piece of individual feature data can represent a feature of the corresponding construct. Each piece of individual feature data may be associated with an identifier of a corresponding construct. Each of the cluster feature data may include statistical data that represents the features of two or more constituents included in the corresponding cluster by a statistical amount. The statistical data may be associated with identifiers of two or more constructs included in the corresponding cluster. The generation unit may be configured to generate the statistical data by converting the features of two or more constituents indicated by the individual feature data of the two or more constituents included in the corresponding cluster into statistics.
このデータ提供システムは、第二のグループにおける構成体の特徴を、情報保護した統計データとして情報処理システムに提供しながらも、統計データに第二の識別子を関連付けることで、情報処理システムが、統計データに対応する第二のグループの構成体を具体的に識別できるようにする。従って、データ提供システムは、データ結合に役立つ有意義な情報を情報処理システムに提供することができる。 This data providing system provides the information processing system with the characteristics of the constructs in the second group as information-protected statistical data, but also associates the second identifier with the statistical data. The structure of the second group corresponding to the data can be specifically identified. Therefore, the data providing system can provide meaningful information useful for data combination to the information processing system.
本開示の一側面によれば、クラスタリングユニットは、情報処理システムから指定された制約条件に従って、複数の構成体を複数のクラスタにクラスタリングしてもよい。本開示の一側面によれば、情報処理システムは、複数の構成体間の特徴空間上の距離を表す距離情報をデータ提供システムに送信するように構成されてもよい。クラスタリングユニットは、情報処理システムからの距離情報に基づき、複数の構成体を複数のクラスタにクラスタリングしてもよい。距離情報に基づけば、データ提供システムは、複数の構成体をより適切にクラスタリングすることができ、高い情報価値を有するクラスタ特徴データを情報処理システムに提供することができる。 According to one aspect of the present disclosure, the clustering unit may cluster a plurality of constructs into a plurality of clusters in accordance with a constraint specified by the information processing system. According to one aspect of the present disclosure, the information processing system may be configured to transmit distance information representing a distance on a feature space between a plurality of components to the data providing system. The clustering unit may cluster a plurality of constructs into a plurality of clusters based on distance information from the information processing system. Based on the distance information, the data providing system can more appropriately cluster a plurality of constructs, and can provide cluster information data having high information value to the information processing system.
本開示の一側面によれば、情報処理システムは、複数の構成体のそれぞれの分類を表す分類情報をデータ提供システムに送信するように構成されてもよい。クラスタリングユニットは、情報処理システムからの分類情報に基づき、複数の構成体を、一つのクラスタに異なる分類の構成体が混在しないように、複数のクラスタにクラスタリングしてもよい。分類情報に基づけば、データ提供システムは、複数の構成体をより適切にクラスタリングすることができる。 According to one aspect of the present disclosure, the information processing system may be configured to transmit classification information representing each classification of the plurality of constituents to the data providing system. The clustering unit may cluster a plurality of constituents into a plurality of clusters based on classification information from the information processing system so that different classification constituents are not mixed in one cluster. Based on the classification information, the data providing system can more appropriately cluster a plurality of components.
本開示の一側面によれば、情報処理システムは、構成体のリストを、データ提供システムに送信するように構成されてもよい。データ提供システムは、複数の構成体の中から、リストに含まれる構成体のいずれかと対応する複数の対応構成体を識別するように構成される識別ユニットを備えてもよい。クラスタリングユニットは、識別ユニットにより識別された複数の対応構成体を複数のクラスタにクラスタリングしてもよい。 According to one aspect of the present disclosure, the information processing system may be configured to transmit a list of constructs to the data providing system. The data providing system may include an identification unit configured to identify a plurality of corresponding components corresponding to any of the components included in the list from among the plurality of components. The clustering unit may cluster a plurality of corresponding constituents identified by the identification unit into a plurality of clusters.
本開示の一側面によれば、コンピュータが実行する情報処理方法が提供されてもよい。情報処理方法は、複数の第一の構成体を含む第一のグループに関する第一の特徴データの一群を取得することと、複数の第二の構成体を含む第二のグループに関する第二の特徴データの一群を取得することと、取得した第一の特徴データの一群と、取得した第二の特徴データの一群とを結合することとを含んでいてもよい。 According to one aspect of the present disclosure, an information processing method executed by a computer may be provided. The information processing method acquires a group of first feature data related to a first group including a plurality of first constituents and a second feature related to a second group including a plurality of second constituents Acquiring a group of data, and combining the acquired group of first feature data and the acquired group of second feature data may be included.
第一の特徴データのそれぞれは、対応する一以上の第一の構成体の特徴を表すことができる。第一の特徴データのそれぞれには、対応する一以上の第一の構成体の識別子である第一の識別子が関連付けられてもよい。 Each of the first feature data can represent a feature of one or more corresponding first components. Each of the first feature data may be associated with a first identifier that is an identifier of one or more corresponding first components.
第二の特徴データのそれぞれは、第二のグループにおける複数のクラスタのそれぞれに対応してもよい。複数のクラスタのそれぞれは、複数の第二の構成体のうちの二以上を含んでいてもよい。第二の特徴データのそれぞれは、対応するクラスタに含まれる二以上の
第二の構成体の特徴を統計量で表す統計データを備えていてもよい。統計データは、対応するクラスタに含まれる二以上の第二の構成体の識別子である第二の識別子に関連付けられていてもよい。
Each of the second feature data may correspond to each of a plurality of clusters in the second group. Each of the plurality of clusters may include two or more of the plurality of second structures. Each of the second feature data may include statistical data that represents the features of two or more second constituents included in the corresponding cluster by a statistical amount. The statistical data may be associated with a second identifier that is an identifier of two or more second structures included in the corresponding cluster.
結合することは、第一の特徴データに関連付けられた第一の識別子に基づき、第一の特徴データのそれぞれを、対応する第二の識別子に関連付けられた第二の特徴データの統計データと結合するように、第一の特徴データの一群と第二の特徴データの一群とを結合することを含んでいてもよい。 Combining is based on a first identifier associated with the first feature data, and combining each of the first feature data with statistical data of the second feature data associated with the corresponding second identifier. As such, it may include combining a group of first feature data and a group of second feature data.
本開示の一側面によれば、第一の特徴データの一群を取得することは、第一の特徴データの一群を記憶する記憶デバイスから、第一の特徴データの一群を読み出すことを含んでいてもよい。第二の特徴データの一群を取得することは、第二の特徴データの一群を提供するデータ提供システムから、第二の特徴データの一群を取得することを含んでいてもよい。この方法によれば、上述した情報処理システムと同様の効果を得ることができる。 According to one aspect of the present disclosure, obtaining the group of first feature data includes reading the group of first feature data from a storage device that stores the group of first feature data. Also good. Acquiring a group of second feature data may include acquiring a group of second feature data from a data providing system that provides the group of second feature data. According to this method, the same effect as the information processing system described above can be obtained.
本開示の一側面によれば、コンピュータが実行するデータ提供方法が提供されてもよい。データ提供方法は、グループ内の複数の構成体のそれぞれに対応する複数の個別特徴データを取得することと、複数の構成体を複数のクラスタにクラスタリングすることと、複数のクラスタに対応するクラスタ特徴データの一群を生成することと、生成したクラスタ特徴データの一群を、情報処理システムに提供することと、を含んでいてもよい。 According to one aspect of the present disclosure, a data providing method executed by a computer may be provided. The data providing method includes acquiring a plurality of individual feature data corresponding to each of a plurality of constituents in a group, clustering the plurality of constituents into a plurality of clusters, and cluster features corresponding to the plurality of clusters. Generating a group of data and providing the generated group of cluster feature data to an information processing system may be included.
個別特徴データのそれぞれは、対応する構成体の特徴を表すことができる。個別特徴データのそれぞれは、対応する構成体の識別子に関連付けられていてもよい。クラスタ特徴データのそれぞれは、対応するクラスタに含まれる二以上の構成体の特徴を統計量で表す統計データを備えていてもよい。統計データは、対応するクラスタに含まれる二以上の構成体の識別子に関連付けられていてもよい。 Each piece of individual feature data can represent a feature of the corresponding construct. Each piece of individual feature data may be associated with an identifier of a corresponding construct. Each of the cluster feature data may include statistical data that represents the features of two or more constituents included in the corresponding cluster by a statistical amount. The statistical data may be associated with identifiers of two or more constructs included in the corresponding cluster.
生成することは、統計データを、対応するクラスタに含まれる二以上の構成体の個別特徴データが示す二以上の構成体の特徴を統計量に変換して生成することを含んでいてもよい。 Generating may include generating statistical data by converting features of two or more constituents indicated by individual feature data of two or more constituents included in the corresponding cluster into statistics.
本開示の一側面によれば、クラスタリングすることは、情報処理システムから指定された制約条件に従って複数の構成体を複数のクラスタにクラスタリングすることを含んでいてもよい。 According to one aspect of the present disclosure, clustering may include clustering a plurality of constructs into a plurality of clusters according to a constraint specified by the information processing system.
本開示の一側面によれば、クラスタリングすることは、情報処理システムからの複数の構成体間の特徴空間上の距離を表す距離情報に基づき、複数の構成体を、複数のクラスタにクラスタリングすることを含んでいてもよい。 According to one aspect of the present disclosure, clustering includes clustering a plurality of constructs into a plurality of clusters based on distance information representing a distance in a feature space between the plurality of constructs from the information processing system. May be included.
本開示の一側面によれば、クラスタリングすることは、情報処理システムからの複数の構成体のそれぞれの分類を表す分類情報に基づき、複数の構成体を、一つのクラスタに異なる分類の構成体が混在しないように、複数のクラスタにクラスタリングすることを含んでいてもよい。 According to one aspect of the present disclosure, clustering is based on classification information representing each classification of a plurality of components from the information processing system, and a plurality of components are classified into one cluster. Clustering into a plurality of clusters may be included so as not to be mixed.
本開示の一側面によれば、複数の個別特徴データを取得することは、複数の個別特徴データを記憶する記憶デバイスから、複数の個別特徴データを読み出すことを含んでいてもよい。 According to one aspect of the present disclosure, obtaining the plurality of individual feature data may include reading the plurality of individual feature data from a storage device that stores the plurality of individual feature data.
本開示の一側面によれば、上述した情報処理システムが備える取得ユニット、及び、結合ユニットの少なくとも一つとして、コンピュータを機能させるためのコンピュータプロ
グラムが提供されてもよい。本開示の一側面によれば、上述したデータ提供システムが備えるクラスタリングユニット、生成ユニット、識別ユニット、及び提供ユニットの少なくとも一つとして、コンピュータを機能させるためのコンピュータプログラムが提供されてもよい。
According to one aspect of the present disclosure, a computer program for causing a computer to function may be provided as at least one of the acquisition unit and the coupling unit included in the information processing system described above. According to an aspect of the present disclosure, a computer program for causing a computer to function may be provided as at least one of a clustering unit, a generation unit, an identification unit, and a provision unit included in the data provision system described above.
本開示の一側面によれば、上述した情報処理方法を、コンピュータを実行させるためのコンピュータプログラムが提供されてもよい。本開示の一側面によれば、上述したデータ提供方法を、コンピュータを実行させるためのコンピュータプログラムが提供されてもよい。本開示の一側面によれば、上述したコンピュータプログラムを格納したコンピュータ読取可能な一時的でない記録媒体が提供されてもよい。 According to one aspect of the present disclosure, a computer program for causing a computer to execute the information processing method described above may be provided. According to one aspect of the present disclosure, a computer program for causing a computer to execute the above-described data providing method may be provided. According to one aspect of the present disclosure, a computer-readable non-transitory recording medium storing the above-described computer program may be provided.
以下に本開示の例示的実施形態を、図面を参照しながら説明する。 Hereinafter, exemplary embodiments of the present disclosure will be described with reference to the drawings.
[第一実施形態]
第一実施形態のデータ加工システム1は、図1に示すように、結合システム10と、データ提供システム30とを備える。このデータ加工システム1では、結合システム10が有する第一グループの消費者に関する第一データベース151と、データ提供システム30が有する第二グループの消費者に関する第二データベース351とに基づき、結合データベース155が生成される。
[First embodiment]
As shown in FIG. 1, the
結合システム10は、プロセッサ(CPU)11と、メモリ13と、ストレージ装置15と、を備える。結合システム10は、図示しない通信インタフェースを備え、ネットワークNTを通じて、データ提供システム30と通信可能に接続される。プロセッサ11は、ストレージ装置15に記憶されたコンピュータプログラムに従う処理を実行する。メモリ13は、ROM及びRAMを含む。ストレージ装置15は、第一データベース151を備える。
The combined
第一データベース151は、図2Aに示すように、第一グループの消費者毎に、対応する消費者個人の特徴データF1を有する。第一グループの消費者は、第一グループの構成体に対応する。以下では、消費者個人の特徴データのことを、個別特徴データと表現し、第一データベース151が有する個別特徴データF1のことを第一個別特徴データF1と表現する。図2Aによれば、第一個別特徴データF1は、一行のデータで表される。第一個別特徴データF1は、対応する一人の消費者の特徴を、その消費者の識別コードに関連付けて表す。具体的には、第一個別特徴データF1は、対応する消費者の特徴を、複数のパラメータX1,X2,X3で表す。
As shown in FIG. 2A, the
図2Aによれば、第一個別特徴データF1は、対応する消費者の特徴を、三つのパラメータX1,X2,X3で表す。しかしながら、これは、図面サイズを考慮して単純化された例に過ぎない。第一個別特徴データF1は、三つより多いパラメータX1,X2,X3で消費者の特徴を表し得る。 According to FIG. 2A, the first individual feature data F1 represents the corresponding consumer feature with three parameters X1, X2, X3. However, this is only a simplified example in view of the drawing size. The first individual feature data F1 may represent consumer features with more than three parameters X1, X2, X3.
図2Aでは、各消費者の複数パラメータX1,X2,X3の値が、「PE」で表される。この表現「PE」は、対応する値が保護されるべき個人情報であることを示す。この表現「PE」の意味は、他の図面でも同様である。複数のパラメータX1,X2,X3の例には、対応する消費者の年齢、性別、及び居住地域等のデモグラフィック属性に関するパラメータの他、対応する消費者の消費行動に関するパラメータが含まれる。消費行動に関するパラメータの例には、利用店舗、購入商品、購入時期、購入数、及び、購入金額等の情報が含まれる。 In FIG. 2A, the values of the multiple parameters X1, X2, and X3 of each consumer are represented by “PE”. This expression “PE” indicates that the corresponding value is personal information to be protected. The meaning of the expression “PE” is the same in other drawings. Examples of the plurality of parameters X1, X2, and X3 include parameters related to demographic attributes such as the age, sex, and residential area of the corresponding consumer, as well as parameters related to the consumption behavior of the corresponding consumer. Examples of the parameters related to the consumption behavior include information such as the store used, the purchased product, the purchase time, the number of purchases, and the purchase price.
ストレージ装置15には更に、プロセッサ11が実行する処理により生成される結合データベース155が格納される(詳細後述)。
The
データ提供システム30は、図1に示すように、プロセッサ31と、メモリ33と、ストレージ装置35と、を備える。データ提供システム30は、図示しない通信インタフェースを備え、ネットワークNTを通じて、結合システム10と通信可能に接続される。
As shown in FIG. 1, the
プロセッサ31は、ストレージ装置35に記憶されたコンピュータプログラムに従う処理を実行する。メモリ33は、ROM及びRAMを含む。ストレージ装置35は、第二データベース351を格納する。
The
第二データベース351は、第二グループの消費者毎に、個別特徴データF2を有する。第二グループの消費者は、第二グループの構成体に対応する。以下では、第二データベース351が有する個別特徴データF2のことを第二個別特徴データF2と表現する。図2Bによれば、第二個別特徴データF2は、第一個別特徴データF1と同様に、対応する一人の消費者の特徴を、その消費者の識別コードに関連付けて表す。具体的には、第二個別特徴データF2は、対応する消費者の特徴を、複数のパラメータY1,Y2,Y3で表す。パラメータ数が限定されるものではないことは、第一個別特徴データF1と同様である。
The
パラメータY1,Y2,Y3は、第一個別特徴データF1におけるパラメータX1,X
2,X3とは少なくとも部分的に異なるパラメータを含む。例えば、パラメータY1,Y2,Y3には、第一個別特徴データF1とは異なる商品に関する、消費者の消費行動に関するパラメータが含まれ得る。
The parameters Y1, Y2, Y3 are parameters X1, X in the first individual feature data F1
2 and X3 include at least partially different parameters. For example, the parameters Y1, Y2, and Y3 may include parameters related to consumer consumption behavior related to products different from the first individual feature data F1.
第二グループの消費者には、第一グループの消費者と同一の消費者が一部含まれる。以下では、第一グループ及び第二グループの両者に属する消費者、すなわち、第一グループと第二グループとの間で共通する消費者のことを、共通消費者と表現する。図2A及び図2Bにおいて符号Cで示される範囲の第一個別特徴データF1及び第二個別特徴データF2が、共通消費者の第一個別特徴データF1及び第二個別特徴データF2に対応する。 The second group of consumers includes some of the same consumers as the first group of consumers. Hereinafter, consumers belonging to both the first group and the second group, that is, consumers common to the first group and the second group are expressed as a common consumer. The first individual feature data F1 and the second individual feature data F2 in the range indicated by the symbol C in FIGS. 2A and 2B correspond to the first individual feature data F1 and the second individual feature data F2 of the common consumer.
図2A及び図2Bから理解できるように、第一データベース151及び第二データベース351では、消費者の識別コードとして共通の識別コードが用いられる。即ち、同一の消費者の第一個別特徴データF1及び第二個別特徴データF2には、同一の識別コードが関連付けられる。
As can be understood from FIGS. 2A and 2B, in the
このように識別コードを共通化するために、第一データベース151を保有する企業又は結合システム10の運営企業は、第二データベース351を保有する企業に、識別コードを発行することができる。識別コードの例には、クッキーIDが含まれる。クッキー技術等を利用して消費者の端末装置をトラッキングすることにより、識別コードを共通化することができる。
In order to share the identification code in this way, the company that owns the
続いて、結合システム10及びデータ提供システム30が実行する処理の詳細を説明する。結合システム10のプロセッサ11は、図示しないユーザインタフェースを通じて結合システム10の操作者から、結合データベース155の生成指示が入力されると、図3に示す結合データベース生成処理を実行する。データ提供システム30のプロセッサ31は、結合システム10から要求信号を受信すると、図4に示す要求受付処理を実行する。
Next, details of processing executed by the combined
結合データベース生成処理において、結合システム10のプロセッサ11は、結合対象の第一データベース151及び第二データベース351の内、結合システム10が有する第一データベース151をストレージ装置15から読み出す(S110)。更に、結合対象に対応する第一グループと第二グループとの間における共通消費者を識別する(S120)。
In the combined database generation process, the
具体的に、プロセッサ11は、共通消費者を識別するために、第二グループの消費者リストを要求するリスト要求信号をデータ提供システム30に送信し(S121)、データ提供システム30から、第二グループの消費者リストを受信することができる(S123)。
Specifically, the
データ提供システム30のプロセッサ31は、図4に示すように、結合システム10からリスト要求信号を受信すると(S210でYes)、第二データベース351を参照し、第二データベース351に第二個別特徴データF2が登録された第二グループの消費者リストを、結合システム10に送信する(S215)。第二グループの消費者リストには、第二グループの消費者の識別コードが含まれるが、消費者の個人情報は含まれない。
As shown in FIG. 4, when the
結合システム10のプロセッサ11は、この消費者リストを受信した後、受信した消費者リストが示す第二グループの消費者の識別コードと、S110で読み出した第一データベース151が示す第一グループの消費者の識別コードとを比較することにより(S125)、第一グループと第二グループとの間の共通消費者を識別することができる。
After receiving this consumer list, the
プロセッサ11は、S120で共通消費者を識別すると、データ提供システム30にデ
ータベース要求信号を送信する(S130)。データベース要求信号には、S120で識別した共通消費者のリストが付属する。共通消費者のリストには、第一グループに含まれる共通消費者の識別コードが含まれる。
When the
データ提供システム30のプロセッサ31は、図4に示すように、結合システム10からデータベース要求信号を受信すると(S220でYes)、データベース要求信号に付属する共通消費者のリストに基づき、第二データベース351を参照して、共通消費者の第二個別特徴データF2を識別する(S230)。
As shown in FIG. 4, when the
その後、プロセッサ31は、共通消費者の第二個別特徴データF2に基づいて、共通消費者を複数のクラスタにクラスタリングする(S240)。クラスタリングは、例えばk−means法(k平均法)又はその他の公知技法に基づいて行うことができる。
Thereafter, the
クラスタリングは、一つのクラスタに含まれる消費者数(即ちクラスタサイズ)が、所定数以上となるように行われる。所定数は、個人情報保護の観点で定められる。クラスタリングは、共通消費者を、特徴空間上に配置したときの共通消費者の分布に基づき、特徴空間上で距離が近い複数の消費者を一つのクラスタにまとめるように行われる。 Clustering is performed so that the number of consumers (that is, cluster size) included in one cluster is equal to or greater than a predetermined number. The predetermined number is determined from the viewpoint of personal information protection. Clustering is performed based on the distribution of common consumers when common consumers are arranged on the feature space so that a plurality of consumers that are close to each other on the feature space are combined into one cluster.
クラスタリングに際し、プロセッサ31は、共通消費者間の距離Dy[i,j]を、ユークリッド距離で求めることができる。消費者iと消費者jとの間の距離Dy[i,j]は、次式に従って算出され得る。
At the time of clustering, the
Dy[i,j]={Σ(yn[i]−yn[j])2}1/2
ここで、Σ(yn[i]−yn[j])2は、n=1からn=Nまでの(yn[i]−yn[j])2の和である。値Nは、第二個別特徴データF2において消費者の特徴を表すパラメータY1,Y2,Y3の数に対応する。図2BによればN=3である。
Dy [i, j] = {Σ (yn [i] −yn [j]) 2 } 1/2
Here, Σ (yn [i] −yn [j]) 2 is the sum of (yn [i] −yn [j]) 2 from n = 1 to n = N. The value N corresponds to the number of parameters Y1, Y2, Y3 representing consumer characteristics in the second individual characteristic data F2. According to FIG. 2B, N = 3.
yn[i]は、消費者iのパラメータYnの値である。yn[j]は、消費者jのパラメータYnの値である。図5左領域には、第二データベース351が示され、ここでは、消費者iに関する第二個別特徴データF2の各パラメータY1,Y2の値がy1[i],y2[i]で表されている(i=1,2,3,…)。
yn [i] is the value of parameter Yn for consumer i. yn [j] is a value of the parameter Yn of the consumer j. In the left area of FIG. 5, a
プロセッサ31は、S240において、第二グループ内の共通消費者を複数のクラスタにクラスタリングすると、S250に移行し、複数のクラスタのそれぞれに対して、対応するクラスタに属する複数消費者の第二個別特徴データF2を統合した、一つのクラスタ特徴データFC2を生成する。
If the common consumer in the second group is clustered into a plurality of clusters in S240, the
具体的に、プロセッサ31は、対応するクラスタに属する複数消費者の第二個別特徴データF2が示す複数パラメータY1,Y2,Y3の値を、パラメータ毎に、一つの統計量STに変換して、このクラスタに対応する一つのクラスタ特徴データFC2を生成する。
Specifically, the
図5右領域には、図5左領域に示される第二データベース351内の第二個別特徴データF2の一群に基づき、生成されるクラスタ特徴データFC2の一群が例示される。
The right region of FIG. 5 illustrates a group of cluster feature data FC2 generated based on the group of second individual feature data F2 in the
図5に示す例によれば、識別コードID001,ID002,ID003の消費者が一つのクラスタにまとめられて、これら消費者の第二個別特徴データF2に基づき、一つのクラスタ特徴データFC2が生成される。 According to the example shown in FIG. 5, the consumers with the identification codes ID001, ID002, and ID003 are combined into one cluster, and one cluster feature data FC2 is generated based on the second individual feature data F2 of these consumers. The
この例によれば、識別コードID001,ID002,ID003のパラメータY1の値y1[1],y1[2],y1[3]が、一つの統計量ST{y1[1],y1[2]
,y1[3]}に変換される。ここで、表現ST{}は、括弧{}内の値の統計量を意味すると理解されてよい。同様に、パラメータY2の値y2[1],y2[2],y2[3]が、一つの統計量ST{y2[1],y2[2],y2[3]}に変換される。同様に、パラメータY3の値y3[1],y3[2],y3[3]が、一つの統計量ST{y3[1],y3[2],y3[3]}に変換される。
According to this example, the values y1 [1], y1 [2], y1 [3] of the parameter Y1 of the identification codes ID001, ID002, ID003 are one statistic ST {y1 [1], y1 [2].
, Y1 [3]}. Here, the expression ST {} may be understood to mean the statistic of the value in parentheses {}. Similarly, the values y2 [1], y2 [2], y2 [3] of the parameter Y2 are converted into one statistic ST {y2 [1], y2 [2], y2 [3]}. Similarly, the values y3 [1], y3 [2], y3 [3] of the parameter Y3 are converted into one statistic ST {y3 [1], y3 [2], y3 [3]}.
これにより、同一クラスタに属する識別コードID001,ID002,ID003の消費者の第二個別特徴データF2は、同一クラスタに属する消費者の特徴を、パラメータY1,Y2,Y3の統計量ST{y1[1],y1[2],y1[3]},ST{y2[1],y2[2],y2[3]},ST{y3[1],y3[2],y3[3]}で表す統計データFS2を備えた一つのクラスタ特徴データFC2に変換される。このクラスタ特徴データFC2は、対応するクラスタに属する消費者の識別コードID001,ID002,ID003を統計データFS2に関連付けて備える。 As a result, the second individual feature data F2 of the consumers with the identification codes ID001, ID002, and ID003 belonging to the same cluster is obtained by using the statistics ST {y1 [1] of the parameters Y1, Y2, and Y3 of the consumers that belong to the same cluster. ], Y1 [2], y1 [3]}, ST {y2 [1], y2 [2], y2 [3]}, ST {y3 [1], y3 [2], y3 [3]} It is converted into one cluster feature data FC2 having the statistical data FS2. The cluster feature data FC2 includes identification codes ID001, ID002, and ID003 of consumers belonging to the corresponding cluster in association with the statistical data FS2.
統計量STは、パラメータY1,Y2,Y3の種類毎に予め定められ得る。統計量STの例には、比率、平均値、中央値、最大値、標準偏差、及び分散が含まれる。平均値、中央値、及び最大値は、クラスタの代表値に対応する。統計量STは、複数の異なる統計量の組合せであってもよい。 The statistic ST can be determined in advance for each type of parameters Y1, Y2, Y3. Examples of the statistic ST include ratio, average value, median value, maximum value, standard deviation, and variance. The average value, median value, and maximum value correspond to the representative value of the cluster. The statistic ST may be a combination of a plurality of different statistics.
例えば、パラメータが性別を表すとき、統計量STは、クラスタ内の男性及び/又は女性の比率を表し得る。パラメータが年齢を表すとき、統計量STは、クラスタ内の平均年齢を表し得る。パラメータが商品の購入経験を表すとき、統計量STは、クラスタ内において商品の購入経験を有する消費者の比率であり得る。パラメータが商品の購入数を表すとき、統計量STは、商品の購入数の平均値、中央値、及び、最大値の一つ又は組合せであり得る。 For example, when the parameter represents gender, the statistic ST may represent the ratio of males and / or females in the cluster. When the parameter represents age, the statistic ST may represent the average age within the cluster. When the parameter represents product purchase experience, the statistic ST can be the proportion of consumers who have product purchase experience in the cluster. When the parameter represents the number of products purchased, the statistic ST can be one or a combination of the average value, median value, and maximum value of the number of products purchased.
図5によれば同様に、識別コードID004,ID005,ID006,ID007の消費者が一つのクラスタにまとめられて、これらの消費者の特徴を統計量STで表す一つのクラスタ特徴データFC2が生成される。図5によれば同様に、識別コードID008,ID009,ID0010の消費者が一つのクラスタにまとめられて、これらの消費者の特徴を統計量STで表す一つのクラスタ特徴データFC2が生成される。 Similarly, according to FIG. 5, the consumers of the identification codes ID004, ID005, ID006, and ID007 are grouped into one cluster, and one cluster feature data FC2 that represents these consumer features as a statistic ST is generated. The Similarly, according to FIG. 5, the consumers of the identification codes ID008, ID009, and ID0010 are combined into one cluster, and one cluster feature data FC2 that expresses the features of these consumers as a statistic ST is generated.
S250での処理後、プロセッサ31は、第二グループ内の非共通消費者を複数のクラスタにクラスタリングする(S260)。このようにして、本実施形態では、第二グループ内の非共通消費者を、共通消費者とは別にクラスタリングし、一つのクラスタ内に、共通消費者と非共通消費者とが混在しないようにする。
After the processing in S250, the
S260でのクラスタリングも、S240と同様に行われる。即ち、クラスタリングは、一つのクラスタに含まれる消費者数が、所定数以上となるように行われる。クラスタリングは、非共通消費者を、特徴空間上に配置したときの非共通消費者の分布に基づき、特徴空間上で距離が近い複数の消費者を一つのクラスタにまとめるように行われる。 Clustering in S260 is also performed in the same manner as S240. That is, clustering is performed so that the number of consumers included in one cluster is equal to or greater than a predetermined number. Clustering is performed so that a plurality of consumers that are close to each other in the feature space are combined into one cluster based on the distribution of the non-common consumers when the non-common consumers are arranged on the feature space.
プロセッサ31は、S260での処理を終えると、S270に移行し、非共通消費者に関する複数のクラスタのそれぞれに対し、一つのクラスタ特徴データFC2を生成する。S270におけるクラスタ特徴データFC2の生成は、S250での処理と同様に行われる。
After completing the processing in S260, the
図5の例によれば、識別コードID015,ID016の非共通消費者が一つのクラスタにまとめられて、これらの消費者の特徴を統計量STで表す一つのクラスタ特徴データFC2が生成される。同様に、識別コードID017,ID0018の消費者が一つのク
ラスタにまとめられて、これらの消費者の特徴を統計量STで表す一つのクラスタ特徴データFC2が生成される。
According to the example of FIG. 5, the non-common consumers with the identification codes ID015 and ID016 are grouped into one cluster, and one cluster feature data FC2 that expresses the features of these consumers as a statistic ST is generated. Similarly, the consumers of the identification codes ID017 and ID0018 are collected into one cluster, and one cluster feature data FC2 that represents the characteristics of these consumers as a statistic ST is generated.
本実施形態において、複数の第二個別特徴データF2が統合されて、一つのクラスタ特徴データFC2が生成されるのは、消費者の個人情報を保護するためである。従って、クラスタの人数は、二人より多いのが好ましい。ここでは、説明及び図示を簡単にするために、クラスタ内の消費者数が二人である例を示しただけである。 In the present embodiment, the plurality of second individual feature data F2 are integrated to generate one cluster feature data FC2 in order to protect consumer personal information. Therefore, the number of clusters is preferably greater than two. Here, in order to simplify the explanation and illustration, only an example in which the number of consumers in the cluster is two is shown.
S270での処理を終えると、プロセッサ31は、S250及びS270で生成した共通消費者及び非共通消費者のクラスタ特徴データFC2の一群を、加工後データベースFP2として、データベース要求元の結合システム10に送信する(S280)。
When the processing in S270 is completed, the
図6には、加工後データベースFP2の例を示す。図6から理解できるように、加工後データベースFP2は、共通消費者及び非共通消費者のそれぞれに関して、クラスタ毎のクラスタ特徴データFC2を有する。図6では、クラスタ特徴データFC2内の複数パラメータY1,Y2,Y3の値が、「ST」で表される。「ST」は、対応するパラメータの値が統計量STであることを示す。図6における太実線は、共通消費者と非共通消費者との境界を示す。 FIG. 6 shows an example of the post-processing database FP2. As can be understood from FIG. 6, the post-processing database FP2 has cluster feature data FC2 for each cluster for each of the common consumer and the non-common consumer. In FIG. 6, the values of the plurality of parameters Y1, Y2, Y3 in the cluster feature data FC2 are represented by “ST”. “ST” indicates that the value of the corresponding parameter is the statistic ST. A thick solid line in FIG. 6 indicates a boundary between a common consumer and a non-common consumer.
結合システム10のプロセッサ11は、S130で送信したデータベース要求信号に応答してデータ提供システム30から送信されてくる加工後データベースFP2を受信すると(S140)、S150に移行する。S150において、プロセッサ11は、第一データベース151とデータ提供システム30から受信した加工後データベースFP2とを結合することにより、結合データベース155を生成する(S150)。図7には、結合データベース155の例が示される。
When the
S150において、プロセッサ11は、第一個別特徴データF1に関連付けられた識別コードに基づき、第一個別特徴データF1のそれぞれを、対応する識別コードに関連付けられたクラスタ特徴データFC2の統計データFS2と結合するように、第一個別特徴データF1の一群とクラスタ特徴データFC2の一群とを結合して、結合データベース155を生成する。
In S150, based on the identification code associated with the first individual feature data F1, the
即ち、S150では、第一個別特徴データF1のそれぞれが、同一の識別コードに関連付けられたクラスタ特徴データFC2の統計データFS2と結合されて、結合データベース155が生成される。但し、第一グループにおける非共通消費者の第一個別特徴データF1は、クラスタ特徴データFC2と結合されることなく、結合データベース155に登録される。同様に、第二グループにおける非共通消費者のクラスタ特徴データFC2は、第一個別特徴データF1と結合されることなく、結合データベース155に登録される。このようにして結合データベース155は生成される。
That is, in S150, each of the first individual feature data F1 is combined with the statistical data FS2 of the cluster feature data FC2 associated with the same identification code, and the combined
付言すると、データ提供システム30から提供されるクラスタ特徴データFC2のそれぞれは、図8Aに示すように、統計データFS2として、対応するクラスタに属する複数の消費者のそれぞれの統計データFSIを有した構成にされてもよい。この場合、対応するクラスタ内の各消費者の統計データFSIは、一つの統計データを複製した同一データであり、同じ統計量を示す。
In addition, as shown in FIG. 8A, each of the cluster feature data FC2 provided from the
この場合、結合データベース155では、図8Bに示すように、消費者毎に、第一個別特徴データF1と、対応するクラスタ特徴データFC2の統計データFSIとが結合される。
In this case, in the combined
図7に示す例によれば、図及び説明を簡単にするために、一つのクラスタが、連続する識別コードでまとめられている。しかしながら、クラスタリングは、特徴空間上の距離が近い、即ち、特徴の類似する複数の消費者を一つのクラスタにまとめるように行われる。従って、一つのクラスタに属する複数の消費者は、第一データベース151及び第二データベース351において、分散しているのが通常である。
According to the example shown in FIG. 7, for the sake of simplicity of illustration and description, one cluster is grouped with continuous identification codes. However, the clustering is performed so that a plurality of consumers having a short distance in the feature space, that is, similar features, are combined into one cluster. Therefore, a plurality of consumers belonging to one cluster are usually distributed in the
統計データFSIを消費者毎に用意すれば、加工後データベースFP2及び結合データベース155において、消費者の配列を、一つのクラスタに属する複数の消費者が隣接するように並び替える必要がなく、便利である。
If the statistical data FSI is prepared for each consumer, it is not necessary to rearrange the consumer array in the post-processing database FP2 and the combined
本実施形態では、データ提供システム30が個人情報保護を図りながら結合システム10に消費者に関するデータを消費者の識別コード付で提供することができ、結合システム10は、識別コードに基づき精度よく、同一消費者に関する複数種のデータを結合して、消費者に関する有意義な結合データベース155を生成することができる。従って、結合データベース155は、これを参照可能な企業が消費者行動を分析するのに大変役立つ。
In this embodiment, the
[第二実施形態]
続いて、第二実施形態のデータ加工システム2を説明する。本実施形態のデータ加工システム2は、第一実施形態のデータ加工システム1に、更なるデータ提供システム50が設けられた構成にされる。図9に示すように、データ加工システム2は、結合システム10及びデータ提供システム30に加えて、更なるデータ提供システム50を備える。以下では、データ提供システム30のことを、第一データ提供システム30と表現し、データ提供システム50のことを第二データ提供システム50と表現する。以下では、第一実施形態と同様の構成に関する説明を、適宜省略する。
[Second Embodiment]
Then, the
第二データ提供システム50は、プロセッサ51と、メモリ53と、ストレージ装置55と、を備える。第二データ提供システム50は、ネットワークNTを通じて、結合システム10と通信可能に接続される。プロセッサ51は、ストレージ装置55に記憶されたコンピュータプログラムに従う処理を実行する。ストレージ装置55は、第三グループの消費者に関する第三データベース551を格納する。
The second
第三データベース551は、図10Aに示すように、第三グループの消費者毎に、個別特徴データF3を有する。以下では、第三データベース551が有する個別特徴データF3のことを第三個別特徴データF3と表現する。第三個別特徴データF3は、対応する一人の消費者の特徴を、その消費者の識別コードに関連付けて表す。具体的には、第三個別特徴データF3は、対応する消費者の特徴を、複数のパラメータZ1,Z2,Z3で表す。パラメータ数が限定されるものではないことは、第一及び第二個別特徴データF1,F2と同様である。
As shown in FIG. 10A, the
パラメータZ1,Z2,Z3は、第一個別特徴データF1のパラメータX1,X2,X3及び第二個別特徴データF2のパラメータY1,Y2,Y3とは少なくとも部分的に異なるパラメータである。パラメータZ1,Z2,Z3には、第一個別特徴データF1及び第二個別特徴データF2とは異なる商品に関する、消費者の消費行動に関するパラメータが含まれ得る。 The parameters Z1, Z2, and Z3 are parameters that are at least partially different from the parameters X1, X2, and X3 of the first individual feature data F1 and the parameters Y1, Y2, and Y3 of the second individual feature data F2. The parameters Z1, Z2, and Z3 may include parameters related to consumer consumption behavior related to products different from the first individual feature data F1 and the second individual feature data F2.
また、図10Aから理解できるように、第一グループと第三グループとの間の共通消費者は、第一グループと第二グループとの間の共通消費者とは異なる。図2Bに示す例によれば、第一グループと第二グループとの間の共通消費者は、識別コードID001から識別コードID010までの消費者であるのに対し、図10Aに示す例によれば、第一グループと第三グループとの間の共通消費者は、範囲Cに示すように、識別コードID005
から識別コードID014までの消費者である。
Moreover, as can be understood from FIG. 10A, the common consumer between the first group and the third group is different from the common consumer between the first group and the second group. According to the example shown in FIG. 2B, the common consumers between the first group and the second group are consumers from the identification code ID001 to the identification code ID010, whereas according to the example shown in FIG. 10A. The common consumer between the first group and the third group has an identification code ID005 as shown in range C.
To the identification code ID014.
本実施形態において、結合システム10のプロセッサ11は、第一データベース151と、第一データ提供システム30から得た加工後データベースFP2と、に基づく結合データベース155に、第二データ提供システム50から得た、第三データベース551に基づく加工後データベースFP3を結合して、結合データベース155を拡張するように構成される。そのために、プロセッサ11は、第二データ提供システム50に対しても図3に示すS120−S140の処理を実行し、第二データ提供システム50から加工後データベースFP3を取得する。
In this embodiment, the
第二データ提供システム50のプロセッサ51は、第一データ提供システム30と同様に、図4に示す処理を実行し、結合システム10からリスト要求信号を受信した場合には(S210でYes)、第三グループの消費者リストを結合システム10に提供する(S215)。
Similarly to the first
第二データ提供システム50のプロセッサ51は、結合システム10からデータベース要求信号を受信した場合には(S220でYes)、第一グループと第三グループとの間の共通消費者の第三個別特徴データF3を識別し(S230)、この第三個別特徴データF3に基づき、第一グループと第三グループとの間の共通消費者を、複数のクラスタにクラスタリングし(S240)、クラスタ毎のクラスタ特徴データFC3を生成する(S250)。クラスタ特徴データFC3は、図10Bに示される。
When the
第二データ提供システム50におけるクラスタリング手法及びクラスタ特徴データFC3の生成手法は、第一データ提供システム30と同様である。即ち、プロセッサ51は、クラスタ毎に、対応するクラスタに属する複数消費者の第三個別特徴データF3が示す複数パラメータZ1,Z2,Z3の値を、パラメータ毎に、一つの統計量STに変換して、このクラスタに対応する一つのクラスタ特徴データFC3を生成する(S250)。クラスタ特徴データFC3は、パラメータ毎の統計量STを含む統計データFS3を、クラスタに属する複数消費者の識別コードに関連付けて有する。
The clustering method and the cluster feature data FC3 generation method in the second
このように共通消費者に関するクラスタ特徴データFC3の一群を生成すると(S250)、プロセッサ51は更に、第三グループにおける第一グループとの非共通消費者を、複数のクラスタにクラスタリングし(S260)、クラスタ毎に、対応する一つのクラスタ特徴データFC3を生成する(S270)。そして、これら共通消費者及び非共通消費者のクラスタ特徴データFC3の一群を、加工後データベースFP3として、結合システム10に送信する(S280)。図10Bに示される太実線は、加工後データベースFP3において第一グループと第三グループとの間の共通消費者と非共通消費者との境界を示す。
When a group of cluster feature data FC3 related to the common consumer is generated in this way (S250), the
結合システム10のプロセッサ11は、第二データ提供システム50から加工後データベースFP3を受信すると(S140)、この加工後データベースFP3に基づき、結合データベース155を拡張する(S150)。即ち、プロセッサ11は、第一データベース151に加工後データベースFP2を結合した結合データベース155に、更に、第三データベース551に基づく加工後データベースFP3を結合することにより、結合データベース155を拡張する(S150)。
Upon receiving the processed database FP3 from the second data providing system 50 (S140), the
拡張された結合データベース155の例は、図11に示される。この結合データベース155では、図11に示されるように、消費者の特徴が多くのパラメータで表される。しかも、第二グループ及び第三グループは、第一グループとの非共通消費者内に、第二グループと第三グループとの間で共通する消費者を有する。これら消費者に関する統計データ
FS2,FS3は、拡張された結合データベース155において結合される。従って、拡張された結合データベース155は、消費者行動に分析に大変役立つ。
An example of an extended combined
[第三実施形態]
続いて、第三実施形態を説明する。第三実施形態のデータ加工システムは、第一実施形態のデータ加工システム1の変形例に対応する。以下では、第一実施形態と同様の構成に関する説明を、適宜省略する。
[Third embodiment]
Subsequently, a third embodiment will be described. The data processing system of the third embodiment corresponds to a modification of the
第三実施形態によれば、第一グループの消費者には、第一実施形態と同じ識別コード(以下、第一識別コードという。)が割り当てられているのに対し、第二グループの消費者には、第一識別コードとは異なる種類の第二識別コードが割り当てられている。このため、図12Aに示される本実施形態の第二データベース351において範囲Cの第二個別特徴データF4は、図2Aの範囲Cに示される第一個別特徴データF1と同一消費者のデータであるが、第一グループと同一の識別コードを有さない。図12Aに例示される第二識別コードは、図2Aに例示される第一識別コードとの間に一定の規則性を示すが、この規則性は、対応関係の理解を容易にするために便宜的に設けられたものであり、通常、第一識別コードと第二識別コードとの間に規則性はない。
According to the third embodiment, the first group of consumers is assigned the same identification code as the first embodiment (hereinafter referred to as the first identification code), whereas the second group of consumers. Is assigned a second identification code of a different type from the first identification code. Therefore, in the
このため、本実施形態では、第一識別コードと第二識別コードとの間の対応関係を表す対応表が用意され、この対応表に基づき、第一グループと第二グループとの間の共通消費者が識別される。図13に示す例示的な対応表は、第一識別コード毎に、対応する第二識別コードが記された構成にされる。 For this reason, in this embodiment, a correspondence table showing the correspondence between the first identification code and the second identification code is prepared, and based on this correspondence table, the common consumption between the first group and the second group is prepared. Is identified. The exemplary correspondence table shown in FIG. 13 has a configuration in which a corresponding second identification code is written for each first identification code.
結合システム10は、例えば、外部システムから対応表を取得することができる。例えば、第一識別コード及び第二識別コードが異なるウェブサイト又はオンライン店舗のユーザIDである場合、これらのユーザIDは、ウェブサイトを利用するユーザ端末装置の端末IDやクッキーIDを通じて結びつく。外部システムは、ユーザ端末装置が接続される広域ネットワーク(インターネット)を監視して、端末IDやクッキーIDを拠り所に、対応表を生成することができる。あるいは、対応表は、ID連携サービスを提供する企業や提携企業の多い有価ポイントの発行会社から取得されてもよい。
For example, the combined
本実施形態において、結合システム10のプロセッサ11は、図3に示す処理を実行し、S120では、上記外部システムから対応表を取得し、取得した対応表に基づいて第一グループと第二グループとの共通消費者を識別することができる。プロセッサ11は、取得した対応表をメモリ13又はストレージ装置15に記憶することができる。
In the present embodiment, the
プロセッサ11は、この共通消費者の第二識別コードのリストを付したデータベース要求信号を、データ提供システム30に送信することができる(S130)。これによりデータ提供システム30は、第一グループと第二グループとの間の共通消費者を、リスト内の第二識別コードに基づいて識別することができる(S230)。
The
そして、データ提供システム30は、識別した共通消費者についてクラスタリングを行い(S240)、第二識別コードに関連付けられたクラスタ特徴データFC4を有する図12Bに示す加工後データベースFP4を生成及び送信することができる(S250,S280)。加工後データベースFP4は、非共通消費者のクラスタ特徴データが含まれない点で、第一実施形態の加工後データベースFP2とは異なる。
Then, the
結合システム10のプロセッサ11は、この加工後データベースFP4をデータ提供システム30から取得すると(S140)、対応表を参照して、結合データベース155を生成する。即ち、対応表を参照して、第一個別特徴データF1のそれぞれを、その第一個
別特徴データF1が有する第一識別コードに対応する第二識別コードに関連付けられたクラスタ特徴データFC4の統計データFS4と結合し、結合データベース155を生成する。
When the
図14には、本実施形態において生成される結合データベース155が示される。この結合データベース155は、非共通消費者に関するクラスタ特徴データを有さない。この結合データベース155の構成は、第一及び第二実施形態に適用されてもよい。この場合、第一実施形態及び第二実施形態におけるデータ提供システム30,50は、非共通消費者のクラスタ特徴データを結合システム10に提供しないように構成されてもよい。
FIG. 14 shows a combined
第三実施形態によれば、第一グループと第二グループとの間で異なる識別コードが用いられる場合にも、適切に、同一消費者の第一個別特徴データF1と、クラスタ特徴データFC4とを結合して、有意義な結合データベース155を生成することができる。
According to the third embodiment, even when different identification codes are used between the first group and the second group, the first individual feature data F1 of the same consumer and the cluster feature data FC4 are appropriately displayed. Combined, a meaningful combined
[第四実施形態]
続いて、第四実施形態を説明する。第四実施形態のデータ加工システムは、第一実施形態のデータ加工システム1の変形例に対応する。以下では、第一実施形態と同様の構成に関する説明を、適宜省略する。
[Fourth embodiment]
Subsequently, a fourth embodiment will be described. The data processing system of the fourth embodiment corresponds to a modification of the
第四実施形態によれば、結合システム10のプロセッサ11は、図15に示す共通消費者のリストL4を付したデータベース要求信号を、S130でデータ提供システム30に送信する。図15に示すリストL4は、共通消費者のそれぞれの所属セグメントを表すセグメント情報を有した構成にされる。セグメント情報は、共通消費者のそれぞれの分類を表す分類情報に対応する。具体的に、このリストL4は、セグメント毎に、対応するセグメントに属する共通消費者の識別コードが記された構成にされる。
According to the fourth embodiment, the
図15によれば、リストL4内には、第一セグメント(SEG1)、第二セグメント(SEG2)、及び、第三セグメント(SEG3)が規定され、セグメント毎に、対応するセグメントに属する共通消費者の識別コードが記述されている。 According to FIG. 15, the first segment (SEG1), the second segment (SEG2), and the third segment (SEG3) are defined in the list L4. For each segment, the common consumers belonging to the corresponding segment The identification code is described.
セグメント情報は、結合システム10がデータ提供システム30におけるクラスタリングを制御するために用いられる。ここで言うクラスタリングの制御は、一つのクラスタ内に、異なるセグメントの消費者が混在しないように、データ提供システム30におけるクラスタリングを制御することを含む。
The segment information is used by the combining
プロセッサ11は、S130において、予め定められた規則に従って、第一グループ内の共通消費者を、複数のセグメントに分類することができる。例えば、第一個別特徴データF1を参照することにより共通消費者の性別を判別することができる場合、プロセッサ11は、異なる性別の共通消費者が同一のクラスタに混在しないように、リストL4内に男性のセグメント及び女性のセグメントを規定することができる。即ち、プロセッサ11は、S130において、セグメント毎に、対応する性別の共通消費者の識別コードを記述したリストL4を生成して、データ提供システム30に送信することができる。
In S <b> 130, the
あるいは、第一個別特徴データF1を参照することにより共通消費者の居住地域を判別することができる場合、プロセッサ11は、異なる居住地域の共通消費者が同一のクラスタに混在しないように、居住地域毎のセグメントを規定することができる。即ち、プロセッサ11は、S130において、セグメント毎に、対応する居住地域の共通消費者の識別コードを記述したリストL4を生成して、データ提供システム30に送信することができる。消費者の個人情報を保護するために、リストL4は、セグメントの詳細、即ち、セグメント内の消費者の具体的な属性(性別や居住地域)を特定できるような情報を含まない
ように、生成され得る。
Alternatively, when the residential area of the common consumer can be determined by referring to the first individual characteristic data F1, the
このセグメント情報付の共通消費者のリストL4を受信するデータ提供システム30のプロセッサ31は、S240及びS250で、図4に示す処理に代えて、図16に示す処理を実行することができる。図16に示す処理では、リストL4に基づき、共通消費者がセグメント毎に、複数のクラスタにクラスタリングされる。
In S240 and S250, the
図16に示す例によれば、プロセッサ31は、まず、受信したリストL4に基づき、第二グループ内の共通消費者の所属セグメントを識別する(S241)。その後、複数セグメントの一つを、処理対象セグメントに選択し(S243)、選択した処理対象セグメントに属する共通消費者を複数のクラスタにクラスタリングする(S245)。S245での処理後、プロセッサ31は、処理対象セグメントにおける複数のクラスタのそれぞれに対して、対応するクラスタに属する複数消費者の第二個別特徴データF2に基づき、一つのクラスタ特徴データFC2を生成する(S247)。
According to the example shown in FIG. 16, the
プロセッサ31は、その後、全てのセグメントについてS245,S247の処理を実行したか判断する(S249)。全てのセグメントについて実行していないと判断した場合(S249でNo)、プロセッサ31は、処理対象セグメントとして未選択のセグメントの一つを新たな処理対象セグメントに選択し(S243)、S245及びS247の処理を実行する。全てのセグメントについて処理を実行したと判断すると(S249でYes)、図16に示す処理を終了する。
Thereafter, the
本実施形態によれば、結合システム10は、第一データベース151の情報を有意義に活用して、クラスタ特徴データFC2の生成時に所望の情報が失われないように、データ提供システム30のクラスタリングを制御することができる。従って、よりデータ分析に適した結合データベース155を生成することができる。
According to the present embodiment, the
本実施形態は、結合システム10がデータ提供システム30のクラスタリングを制御する思想、及び、データ提供システム30が結合システム10から指定された制約条件に従って複数の消費者をクラスタリングする思想を含む。
This embodiment includes the idea that the combined
従って、更なる変形例として、結合システム10は、セグメント情報を提供せずに、男女別でクラスタリングすること、居住地域別にクラスタリングすることを要求するデータベース要求信号を送信するように構成されてもよい。この場合、データ提供システム30のプロセッサ31は、第二データベース351の第二個別特徴データF2に基づいて、共通消費者及び非共通消費者のセグメント(性別又は居住地域)を判別して、セグメント毎のクラスタリングを、結合システム10からの要求に応じて実行することができる。
Thus, as a further variation, the combined
[第五実施形態]
続いて、第五実施形態を説明する。第五実施形態のデータ加工システムは、第一実施形態のデータ加工システム1の変形例に対応する。以下では、第一実施形態と同様の構成に関する説明を、適宜省略する。
[Fifth embodiment]
Next, a fifth embodiment will be described. The data processing system of the fifth embodiment corresponds to a modification of the
第五実施形態によれば、結合システム10のプロセッサ11は、S130で図17に示す処理を実行することにより、距離情報を含む共通消費者のリストL5を付したデータベース要求信号をデータ提供システム30に送信する。
According to the fifth embodiment, the
具体的に、プロセッサ11は、第一データベース151の第一個別特徴データF1を参照することにより、共通消費者間の特徴空間上の距離Dx[i,j]を算出する(S131)。距離Dx[i,j]は、第一個別特徴データF1に基づく消費者iと消費者jとの
間の距離を示し、この距離は、消費者iと消費者jとの間の特徴の類似度に対応する。
Specifically, the
プロセッサ11は、共通消費者間の特徴空間上の距離Dx[i,j]を、ユークリッド距離で求めることができる。消費者iと消費者jとの間の距離Dx[i,j]は、次式に従って算出され得る。
The
Dx[i,j]={Σ(xn[i]−xn[j])2}1/2
ここで、Σ(xn[i]−xn[j])2は、n=1からn=Mまでの(xn[i]−xn[j])2の和である。値Mは、第一個別特徴データF1において消費者の特徴を定義するパラメータX1,X2,X3の数に対応する。図2AによればM=3である。xn[i]は、消費者iのパラメータXnの値である。xn[j]は、消費者jのパラメータXnの値である。S131では、共通消費者に該当する消費者i及び消費者jの全ての組合せに関して、距離Dx[i,j]を算出する。
Dx [i, j] = {Σ (xn [i] −xn [j]) 2 } 1/2
Here, Σ (xn [i] −xn [j]) 2 is the sum of (xn [i] −xn [j]) 2 from n = 1 to n = M. The value M corresponds to the number of parameters X1, X2, and X3 that define consumer characteristics in the first individual characteristic data F1. According to FIG. 2A, M = 3. xn [i] is the value of the parameter Xn of the consumer i. xn [j] is a value of the parameter Xn of the consumer j. In S131, the distance Dx [i, j] is calculated for all combinations of the consumer i and the consumer j corresponding to the common consumer.
その後、プロセッサ11は、共通消費者のリストL5であって、共通消費者の識別コードに、S131で算出した距離Dxの情報を付した距離情報付のリストL5を生成する(S133)。図17に示す例によれば、リストL5には、消費者jの識別コードに、消費者iとの組合せ毎の距離Dx[i,j]が関連付けられている。
After that, the
プロセッサ11は、このようにS133で生成した距離情報付の共通消費者のリストL5をデータ提供システム30に送信する(S135)。
The
一方、距離情報付のリストL5を受信するデータ提供システム30のプロセッサ31は、S240において、図18に示す処理を実行することができる。即ち、プロセッサ31は、クラスタリング対象の消費者間(即ち、共通消費者間)の距離Dy[i,j]を、第二個別特徴データF2に基づき算出する。距離Dyi,j]は、第一実施形態において説明した方法と同様の方法で算出することができる(S310)。
On the other hand, the
その後、プロセッサ31は、消費者間の合成距離D[i,j]を、次式に従い算出する(S320)。合成距離D[i,j]は、消費者iと消費者jとの間の合成距離である。
D[i,j]=(Dx[i,j]2+D2[i,j]2)1/2
Thereafter, the
D [i, j] = (Dx [i, j] 2 + D2 [i, j] 2 ) 1/2
S320での処理後、プロセッサ31は、合成距離D[i,j]から特定されるクラスタリング対象の消費者の分布に基づき、合成距離D[i,jが近い消費者同士を一つのクラスタにまとめるように、クラスタリング対象の消費者を、複数のクラスタにクラスタリングする(S330)。
After the processing in S320, the
第五実施形態によれば、結合システム10は、第一データベース151の個人情報を秘匿にしながら、第一データベース151から特定される共通消費者間の距離情報、即ち類似度情報をデータ提供システム30に提供して、データ提供システム30においてより良いクラスタリングが行われるようにする。従って、個人情報保護を図りながら、より情報価値の高い結合データベース155を生成することができる。
According to the fifth embodiment, the combining
[第六実施形態]
続いて、第六実施形態を説明する。第六実施形態のデータ加工システムは、第一実施形態のデータ加工システム1の変形例に対応する。以下では、第一実施形態と同様の構成に関する説明を、適宜省略する。
[Sixth embodiment]
Subsequently, a sixth embodiment will be described. The data processing system of the sixth embodiment corresponds to a modification of the
第六実施形態によれば、結合システム10のプロセッサ11が、共通消費者を複数のクラスタにクラスタリングし、そのクラスタ情報をデータ提供システム30に提供し、クラ
スタ毎のクラスタ特徴データFC2を取得するように構成される。即ち、第六実施形態は、共通消費者に関するクラスタリングの主体がデータ提供システム30ではなく、結合システム10に変更されている点で、第一実施形態とは異なる。
According to the sixth embodiment, the
具体的に、本実施形態における結合システム10は、プロセッサ11が、図3に示す処理に代えて、図19に示す結合データベース生成処理を実行するように構成される。データ提供システム30は、プロセッサ31が図4に示すS230からS280までの処理に代えて、図20に示すS530からS580までの処理を実行するように構成される。
Specifically, the combined
結合システム10のプロセッサ11は、図19に示す処理を開始すると、S110での処理と同様に、第一データベース151をストレージ装置15から読み出す(S410)。更に、S120での処理と同様に、グループ間の共通消費者を識別する(S420)。
When starting the processing shown in FIG. 19, the
その後、プロセッサ11は、共通消費者の第一個別特徴データF1に基づき、共通消費者を複数のクラスタにクラスタリングする(S425)。ここでは、第二個別特徴データF2に代えて第一個別特徴データF1を用いることを除けば、S240での処理と同様の手法で、共通消費者をクラスタリングすることができる。
Thereafter, the
S425での処理後、プロセッサ11は、クラスタ情報を含む、共通消費者の第二識別コードのリストを付したデータベース要求信号を、データ提供システム30に送信する(S430)。クラスタ情報は、共通消費者のそれぞれが属するクラスタをデータ提供システム30が識別可能に構成される。
After the processing in S425, the
データ提供システム30のプロセッサ31は、データベース要求信号を受信すると(S220でYes)、図20に示すように、リストに含まれるクラスタ情報に基づき、各共通消費者が属するクラスタを識別すると共に、リストに含まれる第二識別コードに基づき、各共通消費者の第二個別特徴データF2を識別する(S530)。
When receiving the database request signal (Yes in S220), the
その後、プロセッサ31は、クラスタ情報から識別される複数のクラスタのそれぞれに対して、対応するクラスタに属する複数消費者の第二個別特徴データF2を統合した、一つのクラスタ特徴データFC2を生成する(S550)。S550では、第一実施形態におけるS250と同様の処理を実行することができる。
Thereafter, the
S550での処理を終えると、プロセッサ31は、第一実施形態におけるS260,S270と同様の処理をS560,S570で実行して、非共通消費者に関するクラスタ毎のクラスタ特徴データFC2を生成することができる。
When the processing in S550 is completed, the
その後、プロセッサ31は、S550及びS570で生成した共通消費者及び非共通消費者のクラスタ特徴データFC2の一群を、加工後データベースFP2として、結合システム10に送信する(S580)。
Thereafter, the
結合システム10のプロセッサ11は、このようにデータ提供システム30から送信されてくる加工後データベースFP2を受信し(S440)、結合データベース155を生成する(S450)。プロセッサ11は、S440及びS450において、第一実施形態におけるS140及びS150と同様の処理を実行することができる。
The
第六実施形態においても、第一実施形態と同様の結合データベース155を生成することができる。第六実施形態から理解できるように、共通消費者のクラスタリングは、結合システム10及びデータ提供システム30のいずれでも実行し得る。これに関連して、第五実施形態において結合システム10がデータ提供システム30に距離情報を提供する技
術思想は、データ提供システム30が結合システム10に距離情報を提供する形態で、第六実施形態にも適用し得る。
Also in the sixth embodiment, the same combined
この場合には、データ提供システム30のプロセッサ31が、第二データベース351の第二個別特徴データF2に基づいて、共通消費者及び非共通消費者の距離情報を生成し、生成した距離情報を結合システム10に提供することができる。結合システム10のプロセッサ11は、この距離情報を用いて、共通消費者を複数のクラスタにクラスタリングすることができる。この場合、プロセッサ11は、距離情報を用いて、非共通消費者のクラスタリングを更に実行してもよい。
In this case, the
[その他]
以上、本開示の例示的実施形態を説明したが、本開示は、上記実施形態に限定されるものではなく、種々の態様を採り得ることは言うまでもない。
[Others]
As mentioned above, although exemplary embodiment of this indication was described, it cannot be overemphasized that this indication is not limited to the above-mentioned embodiment and can take various modes.
例えば、第一及び第二のグループの構成体は、消費者に限定されない。第一及び第二のグループの一方又は両方は、人の活動に関連する物及び場所の少なくとも一つの集合であってもよく、第一及び第二のグループの構成体は、これら集合の要素であってもよい。 For example, the first and second group members are not limited to consumers. One or both of the first and second groups may be at least one set of things and places related to human activity, and the members of the first and second groups are elements of these sets. There may be.
上述の実施形態では、結合システム10がデータ提供システム30から第二グループの消費者リストを取得して、共通消費者を識別するが、結合システム10は、S120の処理を実行せず、S130において、第一グループ全体の消費者リストを送信するように構成されてもよい。この場合、データ提供システム30は、S230において、第一グループ全体の消費者リストに含まれる識別コードと、第二グループの消費者の識別コードとを比較することにより、共通消費者を識別することができる。共通消費者の識別は、多種の方法で行うことができ、これらの方法のいずれが採用されてもよい。
In the above-described embodiment, the combined
この他、上記実施形態における1つの構成要素が有する機能は、複数の構成要素に分散して設けられてもよい。複数の構成要素が有する機能は、1つの構成要素に統合されてもよい。上記実施形態の構成の一部は、省略されてもよい。上記実施形態の構成の少なくとも一部は、他の上記実施形態の構成に対して付加又は置換されてもよい。特許請求の範囲に記載の文言から特定される技術思想に含まれるあらゆる態様が本開示の実施形態である。 In addition, the function of one component in the above embodiment may be distributed among a plurality of components. Functions of a plurality of components may be integrated into one component. A part of the configuration of the above embodiment may be omitted. At least a part of the configuration of the embodiment may be added to or replaced with the configuration of the other embodiment. Any aspect included in the technical idea specified from the wording of the claims is an embodiment of the present disclosure.
最後に用語間の対応関係を説明する。結合システム10は、情報処理システムの一例に対応する。結合システム10がデータベース要求信号を送信してデータ提供システム30,50から加工後データベースFP2,FP3,FP4を取得する処理は、情報処理システムの取得ユニットにより実現される処理の一例に対応する。共通消費者は、対応構成体の一例に対応する。データ提供システム30,50がS230において共通消費者の個別特徴データF2,F3を識別する処理は、識別ユニットにより実現される処理の一例に対応する。
Finally, the correspondence between terms will be explained. The
1,2…データ加工システム、10…結合システム、11…プロセッサ、13…メモリ、15…ストレージ装置、30…データ提供システム、31…プロセッサ、33…メモリ、35…ストレージ装置、50…データ提供システム、51…プロセッサ、53…メモリ、55…ストレージ装置、151…第一データベース、155…結合データベース、351…第二データベース、551…第三データベース、F1,F2,F3,F4…個別特徴データ、FC2,FC3,FC4…クラスタ特徴データ、FP2,FP3,FP4…加工後データベース、FS2,FS3,FS4,FSI…統計データ、L4,L5…リスト。
DESCRIPTION OF
Claims (30)
複数の第二の構成体を含む第二のグループに関する第二の特徴データの一群を取得するように構成される取得ユニットと、
結合ユニットと、
を備え、
前記第一の特徴データは、対応する一以上の第一の構成体の識別子である第一の識別子に関連付けられており、前記対応する一以上の第一の構成体の特徴を表し、
前記第二の特徴データのそれぞれは、前記第二のグループにおける複数のクラスタのそれぞれに対応し、前記複数のクラスタのそれぞれは、前記複数の第二の構成体のうちの二以上を含み、前記第二の特徴データは、対応するクラスタに含まれる前記二以上の第二の構成体の識別子である第二の識別子に関連付けられた、前記対応するクラスタに含まれる前記二以上の第二の構成体の特徴を統計量で表す統計データを備え、
前記結合ユニットは、前記第一の特徴データに関連付けられた前記第一の識別子に基づき、前記第一の特徴データのそれぞれを、対応する第二の識別子に関連付けられた前記第二の特徴データの前記統計データと結合するように、前記第一の特徴データの一群と前記第二の特徴データの一群とを結合するように構成される情報処理システム。 A storage unit configured to store a group of first feature data relating to a first group including a plurality of first constructs;
An acquisition unit configured to acquire a group of second feature data relating to a second group including a plurality of second constructs;
A coupling unit;
With
The first feature data is associated with a first identifier that is an identifier of the corresponding one or more first constructs, and represents the features of the corresponding one or more first constructs;
Each of the second feature data corresponds to each of a plurality of clusters in the second group, and each of the plurality of clusters includes two or more of the plurality of second constructs, The second feature data is associated with a second identifier that is an identifier of the two or more second constructs included in the corresponding cluster, and the two or more second configurations included in the corresponding cluster. It has statistical data that expresses body characteristics as statistics,
Based on the first identifier associated with the first feature data, the combining unit converts each of the first feature data to the second feature data associated with the corresponding second identifier. An information processing system configured to combine a group of the first feature data and a group of the second feature data so as to combine with the statistical data.
前記取得ユニットは、前記複数の第二の構成体のそれぞれに対応する複数の個別特徴データを備えるデータ提供システムに、指定した制約条件に従って前記複数の第二の構成体を前記複数のクラスタにクラスタリングするように要求し、前記データ提供システムから前記制約条件に従う前記複数のクラスタに対応する前記第二の特徴データの一群を取得し、
前記データ提供システムは、前記制約条件に従って、前記複数の第二の構成体を前記複数のクラスタにクラスタリングし、前記複数のクラスタに対応する前記第二の特徴データの一群を、前記情報処理システムに提供するように構成される情報処理システム。 An information processing system according to claim 1,
The acquisition unit is configured to cluster the plurality of second structures into the plurality of clusters according to a specified constraint condition in a data providing system including a plurality of individual feature data corresponding to each of the plurality of second structures. And obtaining a group of the second feature data corresponding to the plurality of clusters according to the constraint condition from the data providing system,
The data providing system clusters the plurality of second structures into the plurality of clusters according to the constraint condition, and the group of the second feature data corresponding to the plurality of clusters is stored in the information processing system. An information processing system configured to provide.
前記統計データは、前記データ提供システムが、前記対応するクラスタに含まれる前記二以上の第二の構成体の個別特徴データが示す前記二以上の第二の構成体の特徴を統計量に変換して生成される情報処理システム。 An information processing system according to claim 2,
In the statistical data, the data providing system converts the features of the two or more second constituents indicated by the individual feature data of the two or more second constituents included in the corresponding cluster into statistics. Information processing system.
前記複数の第二の構成体には、前記複数の第一の構成体のいずれかに対応する複数の対応構成体と、前記複数の第一の構成体のいずれにも対応しない複数の非対応構成体と、が含まれ、
前記取得ユニットにより取得される前記第二の特徴データのそれぞれは、前記第二のグループにおける前記複数の対応構成体をクラスタリングして定義される複数のクラスタのそれぞれに対応する情報処理システム。 An information processing system according to claim 1,
The plurality of second constituent bodies include a plurality of corresponding constituent bodies corresponding to any of the plurality of first constituent bodies, and a plurality of non-corresponding sections not corresponding to any of the plurality of first constituent bodies. A construct, and
Each of the second feature data acquired by the acquisition unit corresponds to each of a plurality of clusters defined by clustering the plurality of corresponding constituents in the second group.
前記取得ユニットは、前記複数の第二の構成体のそれぞれに対応する複数の個別特徴データを有するデータ提供システムに、前記複数の対応構成体を前記複数のクラスタにクラスタリングするように要求し、
前記データ提供システムは、前記要求に従って、前記複数の対応構成体を前記複数のクラスタにクラスタリングし、前記複数のクラスタに対応する前記第二の特徴データの一群を、前記情報処理システムに提供するように構成される情報処理システム。 An information processing system according to claim 4,
The acquisition unit requests a data providing system having a plurality of individual feature data corresponding to each of the plurality of second structures to cluster the plurality of corresponding structures into the plurality of clusters,
In accordance with the request, the data providing system clusters the plurality of corresponding constructs into the plurality of clusters, and provides the information processing system with the second group of feature data corresponding to the plurality of clusters. An information processing system composed of
前記取得ユニットは、構成体のリストとして、前記複数の第一の構成体のリスト又は前記複数の対応構成体のリストを、前記データ提供システムに送信し、
前記データ提供システムは、前記リストに基づき、前記第二のグループにおける前記複数の対応構成体を識別するように構成される情報処理システム。 An information processing system according to claim 5,
The acquisition unit transmits the list of the plurality of first structures or the list of the plurality of corresponding structures to the data providing system as a list of structures,
The data providing system is an information processing system configured to identify the plurality of corresponding constituents in the second group based on the list.
前記取得ユニットは、前記リストに含まれる複数の構成体間の特徴空間上の距離を表す距離情報を前記データ提供システムに送信し、
前記データ提供システムは、前記距離情報に基づき、前記第二のグループにおける前記複数の対応構成体を、前記複数のクラスタにクラスタリングするように構成される情報処理システム。 An information processing system according to claim 6,
The acquisition unit transmits distance information representing a distance on a feature space between a plurality of constituents included in the list to the data providing system,
The data providing system is an information processing system configured to cluster the plurality of corresponding constituents in the second group into the plurality of clusters based on the distance information.
前記取得ユニットは、前記リストに含まれる前記複数の構成体のそれぞれの分類を表す分類情報を前記データ提供システムに送信し、
前記データ提供システムは、前記分類情報に基づき、前記第二のグループにおける前記複数の対応構成体を、一つのクラスタに異なる分類の対応構成体が混在しないように、前記複数のクラスタにクラスタリングするように構成される情報処理システム。 The information processing system according to claim 6 or 7,
The acquisition unit transmits classification information representing each classification of the plurality of constituents included in the list to the data providing system,
The data providing system clusters the plurality of corresponding constituents in the second group into the plurality of clusters based on the classification information so that corresponding constituents of different classifications are not mixed in one cluster. An information processing system composed of
前記第二のグループにおける前記複数の対応構成体は、前記第一のグループにおける前記複数の第一の構成体のいずれかと同一の構成体であり、
前記第一のグループと前記第二のグループとの間では、前記複数の対応構成体のそれぞれに、同一の識別子が割り当てられており、
前記結合ユニットは、前記第一の特徴データのそれぞれを、同一の識別子に関連付けられた前記第二の特徴データの前記統計データと結合する情報処理システム。 An information processing system according to any one of claims 4 to 8,
The plurality of corresponding structural bodies in the second group are the same structural bodies as any of the plurality of first structural bodies in the first group;
Between the first group and the second group, the same identifier is assigned to each of the plurality of corresponding components,
The information processing system, wherein the combining unit combines each of the first feature data with the statistical data of the second feature data associated with the same identifier.
前記記憶ユニットは、前記第一の識別子と前記第二の識別子との間の対応関係を記憶し、
前記結合ユニットは、前記対応関係に従って、前記第一の特徴データのそれぞれを、前記対応する第二の識別子に関連付けられた前記第二の特徴データの前記統計データと結合する情報処理システム。 An information processing system according to any one of claims 1 to 8,
The storage unit stores a correspondence relationship between the first identifier and the second identifier;
The information processing system, wherein the combining unit combines each of the first feature data with the statistical data of the second feature data associated with the corresponding second identifier according to the correspondence relationship.
前記第一の特徴データのそれぞれは、前記第一のグループにおける複数のクラスタのそれぞれに対応し、前記複数のクラスタのそれぞれは、前記複数の第一の構成体のうちの二以上を含み、前記第一の特徴データは、対応するクラスタに含まれる前記二以上の第一の構成体の識別子に関連付けられた、前記対応するクラスタに含まれる前記二以上の第一の構成体の特徴を統計量で表す統計データを備える情報処理システム。 An information processing system according to any one of claims 1 to 10,
Each of the first feature data corresponds to each of a plurality of clusters in the first group, each of the plurality of clusters including two or more of the plurality of first constructs, The first feature data is a statistic indicating the features of the two or more first components included in the corresponding cluster associated with the identifiers of the two or more first components included in the corresponding cluster. Information processing system with statistical data represented by
前記複数の第二の構成体には、前記複数の第一の構成体のいずれかに対応する複数の対応構成体が含まれ、
前記取得ユニットは、前記複数の対応構成体を、対応する複数の第一の構成体の第一の特徴データに基づき、複数のクラスタにクラスタリングして、前記複数の対応構成体のそれぞれが属するクラスタを識別可能なクラスタ情報を、前記複数の第二の構成体のそれぞれに対応する複数の個別特徴データを備えるデータ提供システムに提供し、前記データ提
供システムから前記クラスタ情報に従う第二の特徴データの一群を取得し、
前記データ提供システムは、前記クラスタ情報から識別されるクラスタ毎に、対応するクラスタに含まれる二以上の第二の構成体の個別特徴データが示す前記二以上の第二の構成体の特徴を統計量に変換することによって、前記対応するクラスタの第二の特徴データを生成し、生成した第二の特徴データの一群を前記情報処理システムに提供するように構成される情報処理システム。 An information processing system according to claim 1,
The plurality of second constituents include a plurality of corresponding constituents corresponding to any of the plurality of first constituents,
The acquisition unit clusters the plurality of corresponding constituents into a plurality of clusters based on first feature data of the corresponding first constituents, and a cluster to which each of the plurality of corresponding constituents belongs. Is provided to a data providing system including a plurality of individual feature data corresponding to each of the plurality of second structures, and the second feature data according to the cluster information is provided from the data providing system. Get a group,
For each cluster identified from the cluster information, the data providing system statistically analyzes the characteristics of the two or more second structures indicated by the individual feature data of the two or more second structures included in the corresponding cluster. An information processing system configured to generate second feature data of the corresponding cluster by converting into a quantity, and to provide the group of the generated second feature data to the information processing system.
前記複数の構成体を複数のクラスタにクラスタリングするように構成されるクラスタリングユニットと、
前記複数のクラスタに対応するクラスタ特徴データの一群を生成するように構成される生成ユニットと、
前記生成ユニットにより生成された前記クラスタ特徴データの一群を、情報処理システムに提供するように構成される提供ユニットと、
を備え、
前記個別特徴データは、対応する構成体の識別子に関連付けられており、前記対応する構成体の特徴を表し、
前記クラスタ特徴データは、対応するクラスタに含まれる二以上の構成体の識別子に関連付けられた、前記対応するクラスタに含まれる前記二以上の構成体の特徴を統計量で表す統計データを備え、
前記生成ユニットは、前記統計データを、前記対応するクラスタに含まれる前記二以上の構成体の個別特徴データが示す前記二以上の構成体の特徴を前記統計量に変換して生成するデータ提供システム。 A storage unit for storing a plurality of individual feature data corresponding to each of a plurality of components in the group;
A clustering unit configured to cluster the plurality of constructs into a plurality of clusters;
A generating unit configured to generate a group of cluster feature data corresponding to the plurality of clusters;
A providing unit configured to provide a group of the cluster feature data generated by the generating unit to an information processing system;
With
The individual feature data is associated with an identifier of a corresponding construct, and represents the feature of the corresponding construct;
The cluster feature data includes statistical data that represents the features of the two or more constructs included in the corresponding cluster in a statistic associated with identifiers of the two or more constructs included in the corresponding cluster;
The data generation system, wherein the generation unit generates the statistical data by converting the characteristics of the two or more constituents indicated by the individual feature data of the two or more constituents included in the corresponding cluster into the statistics. .
前記クラスタリングユニットは、前記情報処理システムから指定された制約条件に従って、前記複数の構成体を前記複数のクラスタにクラスタリングするデータ提供システム。 14. The data providing system according to claim 13, wherein
The data providing system, wherein the clustering unit clusters the plurality of constructs into the plurality of clusters in accordance with a constraint specified by the information processing system.
前記情報処理システムは、前記複数の構成体間の特徴空間上の距離を表す距離情報を前記データ提供システムに送信するように構成され、
前記クラスタリングユニットは、前記情報処理システムからの前記距離情報に基づき、前記複数の構成体を前記複数のクラスタにクラスタリングするデータ提供システム。 14. The data providing system according to claim 13, wherein
The information processing system is configured to transmit distance information representing a distance on a feature space between the plurality of constructs to the data providing system,
The data providing system, wherein the clustering unit clusters the plurality of constructs into the plurality of clusters based on the distance information from the information processing system.
前記情報処理システムは、前記複数の構成体のそれぞれの分類を表す分類情報を前記データ提供システムに送信するように構成され、
前記クラスタリングユニットは、前記情報処理システムからの前記分類情報に基づき、前記複数の構成体を、一つのクラスタに異なる分類の構成体が混在しないように、前記複数のクラスタにクラスタリングするデータ提供システム。 The data providing system according to claim 13 or 15,
The information processing system is configured to transmit classification information representing each classification of the plurality of constructs to the data providing system,
The clustering unit is a data providing system that clusters the plurality of constituents into the plurality of clusters based on the classification information from the information processing system so that constituents of different classifications are not mixed in one cluster.
前記情報処理システムは、構成体のリストを前記データ提供システムに送信するように構成され、
前記データ提供システムは、前記複数の構成体の中から、前記リストに含まれる構成体のいずれかと対応する複数の対応構成体を識別するように構成される識別ユニットを備え、
前記クラスタリングユニットは、前記識別ユニットにより識別された前記複数の対応構成体を前記複数のクラスタにクラスタリングするデータ提供システム。 The data providing system according to claim 13 or 15,
The information processing system is configured to transmit a list of constructs to the data providing system;
The data providing system includes an identification unit configured to identify a plurality of corresponding components corresponding to any of the components included in the list from the plurality of components.
The data providing system in which the clustering unit clusters the plurality of corresponding constituents identified by the identification unit into the plurality of clusters.
前記複数の構成体を複数のクラスタにクラスタリングするように構成されるクラスタリングユニットと、
前記複数のクラスタに対応するクラスタ特徴データの一群を生成するように構成される生成ユニットと、
前記生成ユニットにより生成された前記クラスタ特徴データの一群を、情報処理システムに提供するように構成される提供ユニットと、
を備え、
前記個別特徴データは、対応する構成体の特徴を表し、
前記クラスタ特徴データは、対応するクラスタに含まれる二以上の構成体の特徴を統計量で表す統計データを備え、
前記クラスタリングユニットは、前記情報処理システムから指定された制約条件に従って前記複数の構成体を複数のクラスタにクラスタリングし、
前記生成ユニットは、前記統計データを、前記対応するクラスタに含まれる前記二以上の構成体の個別特徴データが示す前記二以上の構成体の特徴を前記統計量に変換して生成するデータ提供システム。 A storage unit for storing a plurality of individual feature data corresponding to each of a plurality of components in the group;
A clustering unit configured to cluster the plurality of constructs into a plurality of clusters;
A generating unit configured to generate a group of cluster feature data corresponding to the plurality of clusters;
A providing unit configured to provide a group of the cluster feature data generated by the generating unit to an information processing system;
With
The individual feature data represents a feature of a corresponding component,
The cluster feature data includes statistical data that expresses features of two or more constituents included in a corresponding cluster by a statistic.
The clustering unit clusters the plurality of constructs into a plurality of clusters according to a constraint specified by the information processing system,
The data generation system, wherein the generation unit generates the statistical data by converting the characteristics of the two or more constituents indicated by the individual feature data of the two or more constituents included in the corresponding cluster into the statistics. .
前記複数の構成体を複数のクラスタにクラスタリングするように構成されるクラスタリングユニットと、
前記複数のクラスタに対応するクラスタ特徴データの一群を生成するように構成される生成ユニットと、
前記生成ユニットにより生成された前記クラスタ特徴データの一群を、情報処理システムに提供するように構成される提供ユニットと、
を備え、
前記個別特徴データは、対応する構成体の特徴を表し、
前記クラスタ特徴データは、対応するクラスタに含まれる二以上の構成体の特徴を統計量で表す統計データを備え、
前記情報処理システムは、前記複数の構成体間の特徴空間上の距離を表す距離情報を前記データ提供システムに送信するように構成され、
前記クラスタリングユニットは、前記情報処理システムからの前記距離情報に基づき、前記複数の構成体を、前記複数のクラスタにクラスタリングし、
前記生成ユニットは、前記統計データを、前記対応するクラスタに含まれる前記二以上の構成体の個別特徴データが示す前記二以上の構成体の特徴を前記統計量に変換して生成するデータ提供システム。 A storage unit for storing a plurality of individual feature data corresponding to each of a plurality of components in the group;
A clustering unit configured to cluster the plurality of constructs into a plurality of clusters;
A generating unit configured to generate a group of cluster feature data corresponding to the plurality of clusters;
A providing unit configured to provide a group of the cluster feature data generated by the generating unit to an information processing system;
With
The individual feature data represents a feature of a corresponding component,
The cluster feature data includes statistical data that expresses features of two or more constituents included in a corresponding cluster by a statistic.
The information processing system is configured to transmit distance information representing a distance on a feature space between the plurality of constructs to the data providing system,
The clustering unit clusters the plurality of constructs into the plurality of clusters based on the distance information from the information processing system,
The data generation system, wherein the generation unit generates the statistical data by converting the characteristics of the two or more constituents indicated by the individual feature data of the two or more constituents included in the corresponding cluster into the statistics. .
前記複数の構成体を複数のクラスタにクラスタリングするように構成されるクラスタリングユニットと、
前記複数のクラスタに対応するクラスタ特徴データの一群を生成するように構成される生成ユニットと、
前記生成ユニットにより生成された前記クラスタ特徴データの一群を、情報処理システムに提供するように構成される提供ユニットと、
を備え、
前記個別特徴データは、対応する構成体の特徴を表し、
前記クラスタ特徴データは、対応するクラスタに含まれる二以上の構成体の特徴を統計
量で表す統計データを備え、
前記情報処理システムは、前記複数の構成体のそれぞれの分類を表す分類情報を前記データ提供システムに送信するように構成され、
前記クラスタリングユニットは、前記情報処理システムからの前記分類情報に基づき、前記複数の構成体を、一つのクラスタに異なる分類の構成体が混在しないように、前記複数のクラスタにクラスタリングし、
前記生成ユニットは、前記統計データを、前記対応するクラスタに含まれる前記二以上の構成体の個別特徴データが示す前記二以上の構成体の特徴を前記統計量に変換して生成するデータ提供システム。 A storage unit for storing a plurality of individual feature data corresponding to each of a plurality of components in the group;
A clustering unit configured to cluster the plurality of constructs into a plurality of clusters;
A generating unit configured to generate a group of cluster feature data corresponding to the plurality of clusters;
A providing unit configured to provide a group of the cluster feature data generated by the generating unit to an information processing system;
With
The individual feature data represents a feature of a corresponding component,
The cluster feature data includes statistical data that expresses features of two or more constituents included in a corresponding cluster by a statistic.
The information processing system is configured to transmit classification information representing each classification of the plurality of constructs to the data providing system,
The clustering unit, based on the classification information from the information processing system, clusters the plurality of constituents into the plurality of clusters so that constituents of different classifications are not mixed in one cluster,
The data generation system, wherein the generation unit generates the statistical data by converting the characteristics of the two or more constituents indicated by the individual feature data of the two or more constituents included in the corresponding cluster into the statistics. .
複数の第一の構成体を含む第一のグループに関する第一の特徴データの一群を取得することと、
複数の第二の構成体を含む第二のグループに関する第二の特徴データの一群を取得することと、
前記取得した第一の特徴データの一群と、前記取得した第二の特徴データの一群とを結合することと
を含み、
前記第一の特徴データは、対応する一以上の第一の構成体の識別子である第一の識別子に関連付けられており、前記対応する一以上の第一の構成体の特徴を表し、
前記第二の特徴データのそれぞれは、前記第二のグループにおける複数のクラスタのそれぞれに対応し、前記複数のクラスタのそれぞれは、前記複数の第二の構成体のうちの二以上を含み、前記第二の特徴データは、対応するクラスタに含まれる前記二以上の第二の構成体の識別子である第二の識別子に関連付けられた、前記対応するクラスタに含まれる前記二以上の第二の構成体の特徴を統計量で表す統計データを備え、
前記結合することは、前記第一の特徴データに関連付けられた前記第一の識別子に基づき、前記第一の特徴データのそれぞれを、対応する第二の識別子に関連付けられた前記第二の特徴データの前記統計データと結合するように、前記第一の特徴データの一群と前記第二の特徴データの一群とを結合することを含む情報処理方法。 An information processing method executed by a computer,
Obtaining a group of first feature data relating to a first group comprising a plurality of first constructs;
Obtaining a group of second feature data relating to a second group comprising a plurality of second constructs;
Combining the acquired first feature data group and the acquired second feature data group;
The first feature data is associated with a first identifier that is an identifier of the corresponding one or more first constructs, and represents the features of the corresponding one or more first constructs;
Each of the second feature data corresponds to each of a plurality of clusters in the second group, and each of the plurality of clusters includes two or more of the plurality of second constructs, The second feature data is associated with a second identifier that is an identifier of the two or more second constructs included in the corresponding cluster, and the two or more second configurations included in the corresponding cluster. It has statistical data that expresses body characteristics as statistics,
The combining is based on the first identifier associated with the first feature data, and each of the first feature data is associated with the corresponding second identifier. An information processing method comprising combining the group of the first feature data and the group of the second feature data so as to be combined with the statistical data.
前記第一の特徴データの一群を取得することは、前記第一の特徴データの一群を記憶する記憶デバイスから、前記第一の特徴データの一群を読み出すことを含み、
前記第二の特徴データの一群を取得することは、前記第二の特徴データの一群を提供するデータ提供システムから、前記第二の特徴データの一群を取得することを含む情報処理方法。 The information processing method according to claim 21,
Obtaining the group of first feature data includes reading the group of first feature data from a storage device storing the group of first feature data;
Obtaining the group of second feature data includes obtaining the group of second feature data from a data providing system that provides the group of second feature data.
グループ内の複数の構成体のそれぞれに対応する複数の個別特徴データを取得することと、
前記複数の構成体を複数のクラスタにクラスタリングすることと、
前記複数のクラスタに対応するクラスタ特徴データの一群を生成することと、
前記生成したクラスタ特徴データの一群を、情報処理システムに提供することと、
を含み、
前記個別特徴データは、対応する構成体の識別子に関連付けられており、前記対応する構成体の特徴を表し、
前記クラスタ特徴データは、対応するクラスタに含まれる二以上の構成体の識別子に関連付けられた、前記対応するクラスタに含まれる前記二以上の構成体の特徴を統計量で表す統計データを備え、
前記生成することは、前記統計データを、前記対応するクラスタに含まれる前記二以上
の構成体の個別特徴データが示す前記二以上の構成体の特徴を前記統計量に変換して生成することを含むデータ提供方法。 A data providing method executed by a computer,
Obtaining a plurality of individual feature data corresponding to each of a plurality of constructs in the group;
Clustering the plurality of constructs into a plurality of clusters;
Generating a group of cluster feature data corresponding to the plurality of clusters;
Providing a group of the generated cluster feature data to an information processing system;
Including
The individual feature data is associated with an identifier of a corresponding construct, and represents the feature of the corresponding construct;
The cluster feature data includes statistical data that represents the features of the two or more constructs included in the corresponding cluster in a statistic associated with identifiers of the two or more constructs included in the corresponding cluster;
The generating includes generating the statistical data by converting the characteristics of the two or more constituents indicated by the individual feature data of the two or more constituents included in the corresponding cluster into the statistics. Data provision method including.
グループ内の複数の構成体のそれぞれに対応する複数の個別特徴データを取得することと、
前記複数の構成体を複数のクラスタにクラスタリングすることと、
前記複数のクラスタに対応するクラスタ特徴データの一群を生成することと、
前記生成したクラスタ特徴データの一群を、情報処理システムに提供することと、
を含み、
前記個別特徴データは、対応する構成体の特徴を表し、
前記クラスタ特徴データは、対応するクラスタに含まれる二以上の構成体の特徴を統計量で表す統計データを備え、
前記クラスタリングすることは、前記情報処理システムから指定された制約条件に従って前記複数の構成体を前記複数のクラスタにクラスタリングすることを含み、
前記生成することは、前記統計データを、前記対応するクラスタに含まれる前記二以上の構成体の個別特徴データが示す前記二以上の構成体の特徴を前記統計量に変換して生成することを含むデータ提供方法。 A data providing method executed by a computer,
Obtaining a plurality of individual feature data corresponding to each of a plurality of constructs in the group;
Clustering the plurality of constructs into a plurality of clusters;
Generating a group of cluster feature data corresponding to the plurality of clusters;
Providing a group of the generated cluster feature data to an information processing system;
Including
The individual feature data represents a feature of a corresponding component,
The cluster feature data includes statistical data that expresses features of two or more constituents included in a corresponding cluster by a statistic.
The clustering includes clustering the plurality of constructs into the plurality of clusters according to a constraint specified by the information processing system;
The generating includes generating the statistical data by converting the characteristics of the two or more constituents indicated by the individual feature data of the two or more constituents included in the corresponding cluster into the statistics. Data provision method including.
グループ内の複数の構成体のそれぞれに対応する複数の個別特徴データを取得することと、
前記複数の構成体を複数のクラスタにクラスタリングすることと、
前記複数のクラスタに対応するクラスタ特徴データの一群を生成することと、
前記生成したクラスタ特徴データの一群を、情報処理システムに提供することと、
を含み、
前記個別特徴データは、対応する構成体の特徴を表し、
前記クラスタ特徴データは、対応するクラスタに含まれる二以上の構成体の特徴を統計量で表す統計データを備え、
前記クラスタリングすることは、前記情報処理システムからの前記複数の構成体間の特徴空間上の距離を表す距離情報に基づき、前記複数の構成体を、前記複数のクラスタにクラスタリングすることを含み、
前記生成することは、前記統計データを、前記対応するクラスタに含まれる前記二以上の構成体の個別特徴データが示す前記二以上の構成体の特徴を前記統計量に変換して生成することを含むデータ提供方法。 A data providing method executed by a computer,
Obtaining a plurality of individual feature data corresponding to each of a plurality of constructs in the group;
Clustering the plurality of constructs into a plurality of clusters;
Generating a group of cluster feature data corresponding to the plurality of clusters;
Providing a group of the generated cluster feature data to an information processing system;
Including
The individual feature data represents a feature of a corresponding component,
The cluster feature data includes statistical data that expresses features of two or more constituents included in a corresponding cluster by a statistic.
The clustering includes clustering the plurality of constructs into the plurality of clusters based on distance information representing a distance on a feature space between the plurality of constructs from the information processing system,
The generating includes generating the statistical data by converting the characteristics of the two or more constituents indicated by the individual feature data of the two or more constituents included in the corresponding cluster into the statistics. Including data provision methods.
グループ内の複数の構成体のそれぞれに対応する複数の個別特徴データを取得することと
前記複数の構成体を複数のクラスタにクラスタリングすることと、
前記複数のクラスタに対応するクラスタ特徴データの一群を生成することと、
前記生成したクラスタ特徴データの一群を、情報処理システムに提供することと、
を含み、
前記個別特徴データは、対応する構成体の特徴を表し、
前記クラスタ特徴データは、対応するクラスタに含まれる二以上の構成体の特徴を統計量で表す統計データを備え、
前記クラスタリングすることは、前記情報処理システムからの前記複数の構成体のそれぞれの分類を表す分類情報に基づき、前記複数の構成体を、一つのクラスタに異なる分類の構成体が混在しないように、前記複数のクラスタにクラスタリングすることを含み、
前記生成することは、前記統計データを、前記対応するクラスタに含まれる前記二以上
の構成体の個別特徴データが示す前記二以上の構成体の特徴を前記統計量に変換して生成することを含むデータ提供方法。 A data providing method executed by a computer,
Obtaining a plurality of individual feature data corresponding to each of a plurality of constructs in a group; clustering the plurality of constructs into a plurality of clusters;
Generating a group of cluster feature data corresponding to the plurality of clusters;
Providing a group of the generated cluster feature data to an information processing system;
Including
The individual feature data represents a feature of a corresponding component,
The cluster feature data includes statistical data that expresses features of two or more constituents included in a corresponding cluster by a statistic.
The clustering is based on classification information representing each classification of the plurality of constituents from the information processing system, so that the plurality of constituents are not mixed in different constituents in one cluster. Clustering into the plurality of clusters,
The generating includes generating the statistical data by converting the characteristics of the two or more constituents indicated by the individual feature data of the two or more constituents included in the corresponding cluster into the statistics. Data provision method including.
前記複数の個別特徴データを取得することは、前記複数の個別特徴データを記憶する記憶デバイスから、前記複数の個別特徴データを読み出すことを含むデータ提供方法。 The data providing method according to any one of claims 23 to 26, wherein:
The method of providing data, wherein obtaining the plurality of individual feature data includes reading the plurality of individual feature data from a storage device that stores the plurality of individual feature data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018180220A JP6535128B1 (en) | 2018-09-26 | 2018-09-26 | Data providing system, data providing method, and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018180220A JP6535128B1 (en) | 2018-09-26 | 2018-09-26 | Data providing system, data providing method, and computer program |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018060006A Division JP6431229B1 (en) | 2017-10-10 | 2018-03-27 | Information processing system, information processing method, and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6535128B1 JP6535128B1 (en) | 2019-06-26 |
JP2019175419A true JP2019175419A (en) | 2019-10-10 |
Family
ID=67023742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018180220A Active JP6535128B1 (en) | 2018-09-26 | 2018-09-26 | Data providing system, data providing method, and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6535128B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022036713A (en) * | 2020-08-24 | 2022-03-08 | Kddi株式会社 | Information processor, information processing method, and program |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016126609A (en) * | 2015-01-06 | 2016-07-11 | 株式会社博報堂Dyホールディングス | Information processing system, and program |
JP2017174403A (en) * | 2016-03-16 | 2017-09-28 | キヤノン株式会社 | Information processing device, information processing method and program |
-
2018
- 2018-09-26 JP JP2018180220A patent/JP6535128B1/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016126609A (en) * | 2015-01-06 | 2016-07-11 | 株式会社博報堂Dyホールディングス | Information processing system, and program |
JP2017174403A (en) * | 2016-03-16 | 2017-09-28 | キヤノン株式会社 | Information processing device, information processing method and program |
Non-Patent Citations (1)
Title |
---|
廣田啓一、外8名: "情報大航海プロジェクトにおける個人情報匿名化基盤の構築と検証", 電子情報通信学会技術研究報告, vol. 110, no. 113, JPN6018050488, 24 June 2010 (2010-06-24), pages 297 - 308, ISSN: 0003945099 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022036713A (en) * | 2020-08-24 | 2022-03-08 | Kddi株式会社 | Information processor, information processing method, and program |
JP7309673B2 (en) | 2020-08-24 | 2023-07-18 | Kddi株式会社 | Information processing device, information processing method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP6535128B1 (en) | 2019-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5913722B1 (en) | Information processing system and program | |
JP6201077B1 (en) | Investigation data processing apparatus and investigation data processing method | |
CN105531691A (en) | Methods and apparatus to identify privacy relevant correlations between data values | |
CN103649981B (en) | Method and apparatus for delivering targeted content | |
US8639569B2 (en) | Information processing using a point system based on usage history and associated data creation | |
US20040176966A1 (en) | Method and system for generating recommendations | |
JP2009181468A (en) | Image search log collection system, image search log collection method and program | |
US11593513B2 (en) | Information processing system, data provision system, and related method | |
CN105678317B (en) | Information processing method and server | |
JP6679451B2 (en) | Selection device, selection method, and selection program | |
JP6784499B2 (en) | Decision device, decision method and decision program | |
JP2016042297A (en) | Learning device, learning method, and learning program | |
JP6431229B1 (en) | Information processing system, information processing method, and computer program | |
JP6535128B1 (en) | Data providing system, data providing method, and computer program | |
JP6302126B1 (en) | Information processing system, information processing method, and program | |
JP7227412B1 (en) | Information processing system, computer program, and information processing method | |
WO2020170287A1 (en) | Product characteristic score estimation device, method, and program | |
Zhou et al. | Model and implementation of e-commerce recommendation system based on user clustering | |
JP5329633B2 (en) | Information collection system, information collection method, and program | |
JP6679415B2 (en) | Selection device, selection method, and selection program | |
WO2017072873A1 (en) | Document distribution device, document distribution method, program, and non-temporary recording medium | |
JP2020161038A (en) | Estimation system, estimation method and computer program | |
JP6862456B2 (en) | Geographically targeted message delivery using point-of-sale data | |
CN113393271B (en) | Product customer big data application matching system and computer storage medium | |
WO2023182161A1 (en) | Information processing system and information processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180926 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180926 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20180926 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20181213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190530 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6535128 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |