JP7107979B2 - Linkage server program, provider server program, and data linkage system - Google Patents
Linkage server program, provider server program, and data linkage system Download PDFInfo
- Publication number
- JP7107979B2 JP7107979B2 JP2020010110A JP2020010110A JP7107979B2 JP 7107979 B2 JP7107979 B2 JP 7107979B2 JP 2020010110 A JP2020010110 A JP 2020010110A JP 2020010110 A JP2020010110 A JP 2020010110A JP 7107979 B2 JP7107979 B2 JP 7107979B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- customer data
- server
- unit
- customer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 claims description 22
- 238000013500 data storage Methods 0.000 claims description 21
- 239000000284 extract Substances 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000009825 accumulation Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 20
- 238000000605 extraction Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 238000013145 classification model Methods 0.000 description 9
- 230000015654 memory Effects 0.000 description 9
- 230000036541 health Effects 0.000 description 8
- 238000000034 method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000007726 management method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- LFYJSSARVMHQJB-QIXNEVBVSA-N bakuchiol Chemical compound CC(C)=CCC[C@@](C)(C=C)\C=C\C1=CC=C(O)C=C1 LFYJSSARVMHQJB-QIXNEVBVSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、連携サーバプログラム、事業者サーバプログラム、及びデータ連携システムに関する。 The present invention relates to a linking server program, a provider server program, and a data linking system.
近年、いわゆるビックデータを利活用するサービスが多く存在する。このようなサービスの提供にあたっては、多種多様なデータを大量に収集し、収集した大量のデータを掛け合わせてビックデータを実現する。しかしながら、異なる事業者から個人情報等の顧客に関するデータを収集する際には、顧客本人から同意を得る、又は顧客個人を特定できないような状態(例えば、匿名化等)にする必要がある。下記特許文献1には、一般利用者用のヘルスケアシステムと企業用のヘルスケアシステムから、一般利用者や従業員のヘルスケアデータを匿名化した匿名化ヘルスケアデータを取得して集計し、集計したデータを企業用のヘルスケアシステムに送信する健康情報総合管理システムが開示されている。
In recent years, there are many services that utilize so-called big data. In providing such services, a large amount of diverse data is collected, and big data is realized by multiplying the collected large amount of data. However, when collecting customer-related data such as personal information from different business operators, it is necessary to obtain the consent of the customer himself/herself, or to make it so that the individual customer cannot be identified (e.g., anonymization). In
特許文献1に開示された上記システムでは、一般利用者を識別する一般利用者識別データと従業員を識別する従業員識別データとが予め対応付けられていることにより、同一人物における一般利用者としての匿名化ヘルスケアデータと従業員としての匿名化ヘルスケアデータとを掛け合わせることができる。このため、上記システムでは、予めこのように対応付けされていなければ、同一人物において匿名化されたデータ同士を対応付けることができないという課題がある。
In the above system disclosed in
そこで、本発明は、上記課題を解決するため、異なる事業者間において同一人物におけるデータの対応付けが予めなくとも、同一人物において匿名化されたデータ同士を対応付けることができる連携サーバプログラム、事業者サーバプログラム、及びデータ連携システムを提供することを目的とする。 Therefore, in order to solve the above problems, the present invention provides a link server program capable of associating anonymized data of the same person even if the data of the same person is not associated in advance between different business operators. The object is to provide a server program and a data linkage system.
本発明の一態様に係る連携サーバプログラムは、顧客に関する顧客データを管理する複数の事業者サーバと通信可能な連携サーバに、複数の事業者サーバから、それぞれが管理する顧客データを匿名化した匿名化顧客データと、複数の事業者サーバ間でそれぞれが管理する顧客データ同士を結合させるためのキーとする顧客データのキーデータ項目のデータに基づいて算出されたハッシュ値を示すハッシュデータと、を取得する連携取得部と、複数の事業者サーバからそれぞれ取得したハッシュ値をキーにして、複数の事業者サーバからそれぞれ取得した匿名化顧客データ同士を結合して、結合匿名化顧客データを生成する結合部と、結合匿名化顧客データを、事業者サーバ及びその他の外部の装置の少なくともいずれか一つに提供する連携提供部と、を実現させる。 A cooperation server program according to one aspect of the present invention provides a cooperation server capable of communicating with a plurality of business servers that manage customer data relating to customers. and hash data indicating a hash value calculated based on the data of the key data item of the customer data as a key for linking the customer data managed by each of the multiple business server servers. Combine the anonymized customer data acquired from each of the multiple operator servers, using the hash values acquired from each of the multiple operator servers as keys, and generate combined anonymized customer data. A combining unit and a cooperation providing unit that provides combined anonymized customer data to at least one of a business operator server and other external devices are realized.
本発明の一態様に係る事業者サーバプログラムは、複数の顧客に関する顧客データ同士を結合させる連携サーバと通信可能な顧客データを管理する複数の事業者サーバに、顧客データが有するデータ項目のうち、異なる事業者サーバとの間で顧客データ同士を結合させるためのキーとなるキーデータ項目を示すキー情報を記憶するキー記憶部を参照して、顧客データのキーデータ項目のデータに基づいて、ハッシュ値を算出するハッシュ算出部と、顧客データを匿名化した匿名化顧客データを記憶する顧客データ記憶部と、ハッシュ値を示すハッシュデータと匿名化顧客データとを、異なる事業者サーバとの間で匿名化顧客データ同士を結合させるために連携サーバに提供する事業者提供部と、連携サーバから、当該連携サーバで匿名化顧客データ同士を結合して生成された結合匿名化顧客データを取得する事業者取得部と、を実現させる。 A business server program according to an aspect of the present invention stores, among data items of customer data, a business server program that manages customer data that can be communicated with a linking server that combines customer data relating to a plurality of customers. By referring to a key storage unit that stores key information indicating a key data item that serves as a key for linking customer data between different business servers, hashing is performed based on the data of the key data item of the customer data. A hash calculation unit that calculates a value, a customer data storage unit that stores anonymized customer data obtained by anonymizing customer data, and hash data that indicates a hash value and the anonymized customer data are transferred between different business servers. A business that acquires anonymized customer data that is generated by combining anonymized customer data on the linking server with a business provider that provides it to the linking server in order to combine the anonymized customer data, and from the linking server. a person acquisition unit;
本発明の一態様に係るデータ連携システムは、顧客に関する顧客データを管理する複数の事業者サーバと、複数の事業者サーバと通信可能な連携サーバと、を有するデータ連携システムであって、事業者サーバは、顧客データが有するデータ項目のうち、異なる事業者サーバとの間で顧客データ同士を結合させるためのキーとなるキーデータ項目を示すキー情報を記憶するキー記憶部を参照して、顧客データのキーデータ項目のデータに基づいて、ハッシュ値を算出するハッシュ算出部と、顧客データを匿名化した匿名化顧客データを記憶する顧客データ記憶部と、を備え、連携サーバは、複数の事業者サーバから、それぞれの匿名化顧客データ及びハッシュ値を取得する連携取得部と、複数の事業者サーバからそれぞれ取得したハッシュ値をキーにして、複数の事業者サーバからそれぞれ取得した匿名化顧客データ同士を結合して、結合匿名化顧客データを生成する結合部と、結合匿名化顧客データを、事業者サーバ及びその他の外部の装置の少なくともいずれか一つに提供する連携提供部と、を備える。 A data linkage system according to one aspect of the present invention is a data linkage system that includes a plurality of business operator servers that manage customer data related to customers, and a linkage server that can communicate with the plurality of business operator servers, wherein the business operator The server refers to a key storage unit that stores key information indicating a key data item that serves as a key for linking customer data between different business servers, among the data items of the customer data, and stores customer data. The cooperation server comprises a hash calculation unit that calculates a hash value based on data of key data items of data, and a customer data storage unit that stores anonymized customer data obtained by anonymizing customer data. a cooperative acquisition unit that acquires each anonymized customer data and hash value from each company server; A combining unit that combines the data to generate combined anonymized customer data, and a cooperation providing unit that provides the combined anonymized customer data to at least one of the operator server and other external devices. .
上記の態様によれば、連携サーバは、複数の事業者サーバからそれぞれ匿名化された顧客データと異なる事業者サーバとの間で顧客データ同士を結合するために算出されたハッシュ値を取得することができる。そして、上記の態様によれば、連携サーバは、この取得したハッシュ値を結合キーにして匿名化された顧客データ同士を対応付けて結合することができる。さらに、上記の態様によれば、事業者サーバは、この結合された顧客データを取得することができる。 According to the above aspect, the linking server acquires hash values calculated for combining customer data between anonymized customer data from a plurality of operator servers and different operator servers. can be done. Then, according to the above aspect, the cooperation server can associate and combine the anonymized customer data by using the acquired hash value as a combining key. Further, according to the above aspects, the merchant server can obtain this combined customer data.
本発明によれば、異なる事業者間において同一人物におけるデータの対応付けが予めなくとも、同一人物において匿名化されたデータ同士を対応付けることができる連携サーバプログラム、事業者サーバプログラム、及びデータ連携システムを提供することができる。 ADVANTAGE OF THE INVENTION According to the present invention, a linking server program, a business server program, and a data linking system capable of linking anonymized data of the same person even if data of the same person are not linked in advance between different business operators. can be provided.
添付図面を参照して、本発明の好適な実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。 Preferred embodiments of the present invention will be described with reference to the accompanying drawings. It should be noted that, in each figure, the same reference numerals have the same or similar configurations.
本発明において、「部」や「手段」、「装置」、「システム」とは、単に物理的手段を意味するものではなく、その「部」や「手段」、「装置」、「システム」が有する機能をソフトウェアによって実現する場合も含む。また、1つの「部」や「手段」、「装置」、「システム」が有する機能が2つ以上の物理的手段や装置により実現されても、2つ以上の「部」や「手段」、「装置」、「システム」の機能が1つの物理的手段や装置により実現されても良い。 In the present invention, "part", "means", "apparatus" and "system" do not simply mean physical means, but the "part", "means", "apparatus" and "system" It also includes the case where the function is realized by software. In addition, even if the function of one "part", "means", "apparatus", or "system" is realized by two or more physical means or devices, two or more "part", "means", "device", or "system" The functions of "apparatus" and "system" may be realized by one physical means or device.
また、本実施形態のプログラムは、CD-ROM等の光学ディスク、磁気ディスク、半導体メモリ等の各種の記憶媒体を通じて、又は通信ネットワーク等を介してダウンロードすることにより、コンピュータにインストール又はロードすることができる。 In addition, the program of the present embodiment can be installed or loaded into a computer by downloading through various storage media such as optical discs such as CD-ROMs, magnetic discs, semiconductor memories, etc., or through communication networks, etc. can.
[第1実施形態]
まず、本発明の第1実施形態について説明する。本実施形態では、複数の事業者それぞれが使用するサーバ(以下、「事業者サーバ」という)から匿名化された顧客データを収集し、それらを結合して複数の事業者の顧客データを連携させたいわゆるビックデータを提供する例を用いて説明するがこれに限る趣旨ではない。
[First embodiment]
First, a first embodiment of the present invention will be described. In this embodiment, anonymized customer data is collected from a server used by each of a plurality of business operators (hereinafter referred to as a "business server") and combined to link customer data of multiple business operators. An example of providing so-called big data will be used for explanation, but it is not intended to be limited to this.
「顧客データ」とは、顧客に関する種々のデータが該当する。顧客データは、例えば、顧客を識別するための顧客識別情報、顧客の氏名、電話番号、住所、メールアドレス、個人番号(マイナンバー)、性別又は生年月日等の顧客のいわゆる個人情報を含んでもよい。また、顧客データは、例えば、顧客の免許証番号、カード番号、顧客が保有する口座の口座情報(例えば、口座種別、口座番号、名義等)、顧客が使用する端末装置のデバイス情報(例えば、MACアドレス、IPアドレス、製造番号等)を含んでもよい。また、顧客データは、例えば、ユーザの生体的特徴に関する生体情報(例えば、ユーザの顔画像データ、指紋情報、眼球の虹彩情報又は声紋情報等)を含んでもよい。また、顧客データは、例えば、位置情報(例えば、GPSデータ等)、Web履歴情報(例えば、閲覧履歴、検索履歴、Cookie情報等)、又はECサイトでの商品の購入履歴情報等を含んでもよい。 "Customer data" corresponds to various data related to customers. Customer data may include, for example, customer identification information for identifying the customer, customer's so-called personal information such as customer's name, telephone number, address, e-mail address, personal number (My Number), gender or date of birth. good. In addition, customer data includes, for example, the customer's driver's license number, card number, account information of the account held by the customer (e.g., account type, account number, name, etc.), device information of the terminal device used by the customer (e.g., MAC address, IP address, serial number, etc.). The customer data may also include, for example, biometric information related to the user's biometric features (eg, user's face image data, fingerprint information, iris information, voiceprint information, etc.). Further, the customer data may include, for example, location information (eg, GPS data, etc.), web history information (eg, browsing history, search history, cookie information, etc.), or product purchase history information on EC sites. .
<1.システム構成>
図1を参照して、本実施形態に係るデータ連携システム1のシステム構成例を説明する。
<1. System configuration>
A system configuration example of a
データ連携システム1は、相互に顧客データを連携させたい複数の事業者に対して、それぞれの事業者が管理する顧客データを結合させたいわゆるビックデータをこれらの事業者に提供するためのシステムである。図1に示すように、データ連携システム1は、第1事業者が使用する第1事業者サーバ100aと、第2事業者が使用する第2事業者サーバ100bと、連携サーバ200とを含む。なお、第1事業者サーバ100aと、第2事業者サーバ100bとは、特に区別の必要が無い場合は、総称して「事業者サーバ100」という。
The
連携サーバ200は、第1事業者サーバ100aと第2事業者サーバ100bとの間でそれぞれの顧客データの連携を行うため、ネットワークNを介して、第1事業者サーバ100aと第2事業者サーバ100bとに通信可能に接続されている。また、連携サーバ200は、例えば、ネットワークNを介して、その他の外部の装置と通信可能に接続されてもよい。
The linking
ネットワークNは、無線ネットワークや有線ネットワークにより構成される。ネットワークの一例としては、携帯電話網や、PHS(Personal Handy-phone System)網、無線LAN(Local Area Network)、3G(3rd Generation)、LTE(Long Term Evolution)、4G(4th Generation)、5G(5th Generation)、WiMax(登録商標)、赤外線通信、Bluetooth(登録商標)、有線LAN、電話線、電灯線ネットワーク、IEEE1394等に準拠したネットワークがある。 The network N is composed of a wireless network and a wired network. Examples of networks include mobile phone networks, PHS (Personal Handy-phone System) networks, wireless LAN (Local Area Network), 3G (3rd Generation), LTE (Long Term Evolution), 4G (4th Generation), 5G ( 5th Generation), WiMax (registered trademark), infrared communication, Bluetooth (registered trademark), wired LAN, telephone line, power line network, and IEEE1394-compliant network.
事業者サーバ100は、事業者の顧客に関する顧客データを管理するためのサーバ装置である。事業者サーバ100は、事業者サーバプログラム等の所定のプログラムを実行することにより、顧客データ及び顧客データに関する情報等を管理するサーバ機能を実現する。なお、この所定のプログラムは、例えば、事業者サーバ100にインストールされたデータ連携システム1専用のアプリケーションプログラムであってもよい。事業者サーバ100は、例えば、顧客データを所定の形式に合わせるよう正規化する等のいわゆるデータクレンジングを行ったり、顧客データからハッシュ値を算出したり、顧客データを匿名加工したりする。事業者サーバ100は、図1において、説明を簡単にするために事業者ごとに1台のみ図示しているが、複数台設けてもよい。
The
連携サーバ200は、第1事業者と第2事業者に対して、それぞれの顧客データを連携させるサービス(以下、「データ連携サービス」という)を提供するためのサーバ装置である。換言すれば、連携サーバ200は、第1事業者と第2事業者との間で顧客データを連携するための基盤(以下、「連携基盤」ともいう)でもある。連携サーバ200は、連携サーバプログラム等の所定のプログラムを実行することにより、複数の事業者サーバ100から匿名化顧客データを取得して、取得したこれらのデータを結合して事業者サーバ100に提供するサーバ機能を実現する。なお、この所定のプログラムは、例えば、連携サーバ200にインストールされたデータ連携システム1専用のアプリケーションプログラムであってもよい。なお、連携サーバ200は、データ連携システム1専用のハードウェアやOS等(例えば、オンプレミス型のサーバ構成)を設けてもよいし、クラウドサーバによるSaaS(Software as a Service)、PaaS(Platform as a Service)、IaaS(Infrastructure as a Service)を適宜用いてもよい。ここで「匿名化顧客データ」とは、匿名化された顧客データをいう。匿名化顧客データの詳細は、後述する。
The linking
<2.概要>
図2を参照して、データ連携システム1の概要の一例を説明する。なお、本例では、第1事業者サーバ100a及び第2事業者サーバ100bからそれぞれが管理する顧客データを匿名化した匿名化顧客データを取得して結合し、結合した匿名化顧客データをこれらの事業者サーバ100に提供する例を用いて説明するが、これに限る趣旨ではない。例えば、顧客データの取得元の事業者サーバ100は三つ以上あってもよいし、また、結合した匿名化顧客データの提供先は取得元の事業者サーバ100のいずれか一つであってもよいし、その他の外部の装置であってもよい。
<2. Overview>
An example of the outline of the
(1)図2に示すように、第1事業者サーバ100a及び第2事業者サーバ100bのデータクレンジング部111は、データクレンジングとして、全角と半角の違いや、空白文字や区切り記号の有無等の表記の揺れを解消するよう、それぞれ顧客データに対する書式合わせを行う。これらの事業者サーバ100のデータクレンジング部111は、この書式合わせを行った顧客データを正規化顧客データとして記憶部120に記憶する。ここで「正規化顧客データ」とは、異なる事業者間でそれぞれの顧客データ同士を結合させるためにデータクレンジングが行われた顧客データである。
(1) As shown in FIG. 2, the
(2)第1事業者サーバ100a及び第2事業者サーバ100bのハッシュ算出部112は、それぞれキー情報を記憶する後述の連携サーバ200のキー記憶部231を参照して、正規化顧客データのキーデータ項目のデータに基づいて、ハッシュ値を算出する。ここで「キー情報」とは、顧客データが有するデータ項目のうち、異なる事業者サーバ100間で顧客データ同士を結合させるためのキー(いわゆる結合キー)となるキーデータ項目を示す情報である。キーデータ項目は、例えば、顧客データが有する、顧客の氏名、住所、電話番号、メールアドレス、電話番号、個人番号、免許証番号、カード番号、口座情報、デバイス情報等のいずれか一つのデータ項目であってもよいし、二つ以上のデータ項目の順列又は組み合わせでもよい。
(2) The
(3)第1事業者サーバ100a及び第2事業者サーバ100bの匿名加工部114は、それぞれ自身が管理する顧客データに対して匿名加工を行って匿名化する。事業者サーバ100の匿名加工部114は、それぞれこの匿名化した顧客データを匿名化顧客データとして記憶部120に記憶する。
(3) The
(4)連携サーバ200の連携取得部211は、第1事業者サーバ100a及び第2事業者サーバ100bそれぞれから、事業者サーバ100の事業者提供部115から提供される匿名化顧客データとハッシュ値を示すハッシュデータを取得する。
(4) The
(5)連携サーバ200の結合部212は、第1事業者サーバ100a及び第2事業者サーバ100bそれぞれから取得したハッシュ値をキーにして、それぞれから取得した匿名化顧客データ同士を結合する。(6)連携サーバ200の結合部212は、所定の期間、結合した匿名化顧客データを結合匿名化データとして蓄積顧客データ記憶部232に蓄積する。
(5) The combining
(7)連携サーバ200の類型化部219は、蓄積顧客データ記憶部232に蓄積された結合匿名化データに基づいて、顧客の特性を類型化する。(8)連携サーバ200の連携提供部213は、結合匿名化顧客データと上記類型化の結果を示す類型情報を第1事業者サーバ100a及び第2事業者サーバ100bそれぞれに提供する。事業者サーバ100の事業者取得部116は、この提供された結合匿名化顧客データと類型情報とを取得する。
(7) The
上記構成によれば、データ連携システム1においては、顧客データの共通のデータ項目から算出したハッシュ値を結合キーとすることで、異なる事業者間において同一人物におけるデータの対応付けが予めなくとも、同一人物における匿名化されたデータ同士を対応付けることができる。また、事業者サーバ100は、それぞれの顧客データを結合させるために連携サーバ200に顧客データを提供する際に、顧客データから算出されたハッシュ値及び匿名化した匿名化顧客データを提供するため、特に個人情報の第三者提供に対する顧客からの同意がなくとも連携サーバ200に顧客データを提供することができる。
According to the above configuration, in the
<3.事業者サーバの機能構成>
図3を参照して、本実施形態に係る事業者サーバ100の機能構成を説明する。図3に示すように、事業者サーバ100は、制御部110と、記憶部120と、通信部130と、を備える。
<3. Functional Configuration of Provider Server>
A functional configuration of the
制御部110は、ハッシュ算出部112と、事業者提供部115と、事業者取得部116と、を備える。また、制御部110は、例えば、データクレンジング部111、抽出部113、又は匿名加工部114を備えてもよい。
The
データクレンジング部111は、顧客データのキーデータ項目のデータに対して、データクレンジングを行う。データクレンジング部111におけるデータクレンジングは、後述のハッシュ算出部112においてキーデータ項目のデータからハッシュ値を算出する際に、実質的に同じデータであるにも関わらずデータの揺らぎ等により異なるハッシュ値が算出されてしまうことを抑止する。データクレンジング部111は、例えば、データクレンジングとして、顧客データ間のデータの揺らぎや不整合を抽出し、抽出した揺らぎや不整合を解消するよう顧客データを加工(例えば、データの修正又は正規化等)してもよい。データクレンジング部111は、例えば、所定の書式に基づき、これらのデータの揺らぎや不整合を抽出し、解消してもよい。
The
ハッシュ算出部112は、キー情報を記憶する連携サーバ200のキー記憶部231を参照して、顧客データのキーデータ項目のデータに基づいて、ハッシュ値を算出する。ハッシュ算出部112は、このように算出したハッシュ値を示すハッシュデータを記憶部120に記憶してもよい。
The
ハッシュ算出部112は、例えば、データクレンジングが行われたキーデータ項目のデータに基づいて、ハッシュ値を算出してもよい。このような構成によれば、ハッシュ算出部112は、顧客データを結合するためのキーとして、より精度よくハッシュ値を算出することができる。
The
抽出部113は、顧客データが有するデータ項目のうち、顧客個人を特定可能なデータ項目を抽出する。抽出部113は、例えば、所定の抽出条件に合致するデータ項目を抽出してもよい。所定の抽出条件は、例えば、顧客個人を特定可能な顧客の氏名、個人番号、パスポート番号等のリストアップされたデータ項目を抽出させる条件でもよい。
The extracting
匿名加工部114は、抽出部113により抽出されたデータ項目のデータを匿名加工して匿名化顧客データを生成する。なお、匿名加工部114が匿名加工する対象は、顧客データであっても正規化顧客データであってもよい。匿名加工部114は、顧客データ記憶部121に生成された匿名化顧客データを記憶する。匿名加工部114は、例えば、項目削除若しくはセル削除、データの全部又は一部を抽象化、上位概念化若しくは数値による短縮化によって置き換える一般化、トップ(ボトム)コーディング、データ交換、又はノイズ(誤差)の付加等を対象のデータに施すことによって加工してもよい。
The
上記構成によれば、匿名加工部114は、顧客個人を特定可能なデータ項目のみ匿名加工することができる。このため、上記構成によれば、匿名加工部114は、顧客データの匿名化に必要十分なデータ項目に限定して効率よく匿名加工することができる。
According to the above configuration, the
事業者提供部115は、ハッシュ算出部112で算出されたハッシュ値を示すハッシュデータと匿名加工部114で匿名化された匿名化顧客データとを、異なる事業者サーバとの間で匿名化顧客データ同士を結合させるために連携サーバ200に提供する。事業者提供部115がハッシュデータと匿名化顧客データとを含む各種データ・各種情報を提供する態様は、どのような態様でもよく、後述の連携提供部213と同様である。
The business
事業者取得部116は、連携サーバ200から、連携サーバ200で匿名化顧客データ同士を結合して生成された結合匿名化顧客データを取得する。事業者取得部116が結合匿名化顧客データを含む各種情報を取得する態様は、どのような態様でもよく、後述の連携取得部211と同様である。
The
記憶部120は、顧客データ及び顧客データの管理に関する情報を記憶する。また、記憶部120は、例えば、キー情報、ハッシュデータ、正規化顧客データ、匿名化顧客データ等を記憶してもよい。記憶部120は、データベースマネジメントシステム(DBMS)を利用して各情報を記憶してもよいし、ファイルシステムを利用して各情報を記憶してもよい。DBMSを利用する場合は、上記情報ごとにテーブルを設けて、当該テーブル間を関連付けて各情報を管理してもよい。
The
記憶部120は、例えば、顧客データ記憶部121を備えてもよい。顧客データ記憶部121は、顧客データと、匿名化顧客データとを記憶する。また、顧客データ記憶部121は、例えば、正規化された顧客データを示す正規化顧客データを記憶してもよい。
The
通信部130は、ネットワークNを介して、事業者サーバ100又はその他の外部システムの装置等と各種情報を送受信する。通信部130は、例えば、ネットワークNを介して、連携サーバ200に匿名化顧客データやハッシュデータを送信したり、連携サーバ200から結合匿名化顧客データや類型情報を受信したりする。
The
<4.連携サーバの機能構成>
図4を参照して、本実施形態に係る連携サーバ200の機能構成を説明する。図4に示すように、連携サーバ200は、連携制御部210と、連携記憶部230と、連携通信部240と、を備える。
<4. Functional Configuration of Collaborative Server>
A functional configuration of the
連携制御部210は、連携取得部211と、結合部212と、連携提供部213とを備える。また、連携制御部210は、例えば、参照部214、キー決定部215、組み合わせ抽出部216、追加匿名加工部217、蓄積部218、又は類型化部219を備えてもよい。
The
連携取得部211は、複数の事業者サーバ100から、それぞれが管理する顧客データを匿名化した匿名化顧客データと、それぞれが管理する顧客データ同士を結合させるためのキーとする顧客データのキーデータ項目のデータに基づいて算出されたハッシュ値を示すハッシュデータと、を取得する。連携取得部211が上記の匿名化顧客データ及びハッシュデータ等(以下、「匿名化顧客データ等」ともいう)を取得する態様は、どのような態様でもよく、例えば、事業者サーバ100から匿名化顧客データ等のデータファイルを受信してもよい。また、連携取得部211が匿名化顧客データ等を取得する態様は、他の例として、事業者サーバ100にリモートアクセスして匿名化顧客データ等のデータファイルを取得してもよいし、事業者サーバ100が実装するAPIに匿名化顧客データ等の参照を指示してその結果として匿名化顧客データ等を取得してもよい。
The
結合部212は、複数の事業者サーバ100からそれぞれ取得したハッシュデータのハッシュ値をキーにして、複数の事業者サーバからそれぞれ取得した匿名化顧客データ同士を結合する。結合部212は、結合した匿名化顧客データから結合匿名化顧客データを生成する。
The combining
連携提供部213は、結合匿名化顧客データを、事業者サーバ100及びその他の外部の装置の少なくともいずれか一つに提供する。連携提供部213が結合匿名化顧客データを含む各種データ・各種情報を事業者サーバ100等に提供する態様は、どのような態様でもよく、例えば、各種データ・各種情報のデータファイルを事業者サーバ100等に送信してもよいし、各種データ・各種情報を事業者サーバ100等に参照させるためのAPIを実装してもよい。また、連携提供部213が各種データ・各種情報を提供する態様は、他の例として、連携提供部213が、各種データ・各種情報を示すWebサイトを生成して、連携通信部240を介して事業者サーバ100等に配信してもよい。事業者等は、事業者サーバ100等に配信されたこのWebサイトにより各種データ・各種情報を照会することができる。
The
連携提供部213が各種データ・各種情報を提供する態様は、他の例として、事業者サーバ100等から連携サーバ200にリモートアクセスさせて、事業者サーバ100等に連携サーバ200が格納する各種データ・各種情報を取得させてもよい。この事業者サーバ100等から連携サーバ200へのリモートアクセスにあたっては、例えば、ネットワークN上に構築されたVPN(Virtual Private Network)を利用するものであってもよい。このVPNを利用する場合、事業者サーバ100等と連携サーバ200との通信は、VPN装置を介して通信させてもよい。また、事業者サーバ100等から連携サーバ200へのリモートアクセスにあたっては、例えば、TELNET等の通信プロトコル、もしくはSSH(Secure Shell)またはVNC(Virtual Network Computing)等のリモートアクセスツールをそれぞれ用いて実現してもよい。
As another example, the form in which the
上記構成によれば、連携提供部213は、複数の事業者それぞれの匿名化顧客データを結合した結合匿名化データを、特に個人情報の第三者提供に対する顧客からの同意がなくともこれらの事業者に提供することができる。上記構成によれば、事業者は、他の事業者の匿名化顧客データを自身の顧客データと結合させた形で得ることができる。
According to the above configuration, the
連携提供部213は、例えば、後述の類型化部219における類型化の結果を示す類型情報を、事業者サーバ100及びその他の外部装置の少なくともいずれか一つに提供してもよい。このような構成によれば、連携提供部213は、マーケティング活動に資する顧客の類型化の結果を各事業者に提供することができる。また、このような構成によれば、連携提供部213は、事業者自身が管理する顧客データから事業者自身の顧客の特性を事業者自身が予測するための分類モデル等として類型化の結果を提供することができる。
The
参照部214は、事業者サーバ100に対して、それぞれが管理する顧客データのデータ項目の参照を指示する。参照部214は、事業者サーバ100から当該参照の結果として、それぞれが管理する顧客データのデータ項目を取得する。
The
キー決定部215は、参照部214における上記参照の結果に基づいて、結合対象の顧客データ同士がそれぞれ有するデータ項目を比較してキーデータ項目をそれぞれ決定する。キー決定部215は、例えば、結合対象の顧客データのそれぞれのデータ項目を所定の順にソートして、それぞれのデータ項目を順に、データ項目名又はデータ項目名に加えてデータ型及び/若しくはデータのサイズを照合する。キー決定部215は、当該照合の結果、略一致(完全一致又は部分一致を含む)した項目をキーデータ項目に決定してもよい。キー決定部215は、当該決定したキーデータ項目を示すキー情報をキー記憶部231に記憶させる。
The
上記構成によれば、データ連携システム1は、事業者側で顧客データのデータ構成に変更が生じても、変更したデータ構成に応じてキーデータ項目を決定することができる。
According to the above configuration, the
組み合わせ抽出部216は、結合匿名化顧客データが有するデータ項目の組み合わせのうち、顧客個人を特定可能なデータ項目の組み合わせを抽出する。組み合わせ抽出部216は、例えば、予め設定した所定の組み合わせ条件に合致するデータ項目の組み合わせを抽出してもよい。
The
「所定の組み合わせ条件」とは、顧客個人を特定可能なデータ項目の組み合わせか否かを判定するための条件である。所定の組み合わせ条件は、例えば、結合匿名化データにおいて、顧客の生年月日、性別、及び住所(住所の全部又は一部)の組み合わせを抽出するものであってもよい。具体的には、第1事業者の匿名化顧客データには、生年月日、性別及び住所のうち、生年月日のみ加工されていない状態で含まれ、一方第2事業者の匿名化顧客データにおいて生年月日、性別、及び住所のうち、性別及び住所が加工されていない状態で含まれている場合、第1事業者と第2事業者の匿名化顧客データを結合すると生年月日、性別、及び住所が加工されていない状態で組み合わされてしまう。生年月日、性別、及び住所はそれ単独では個人を特定できないものの組み合わせることで個人の特定につながる可能性があるとして、組み合わせ抽出部216が当該組み合わせを抽出する。
The "predetermined combination condition" is a condition for determining whether or not a combination of data items can identify an individual customer. The predetermined combination condition may be, for example, extracting a combination of the customer's date of birth, gender, and address (all or part of the address) in the combined anonymized data. Specifically, out of the date of birth, gender, and address, the anonymized customer data of the first business includes only the date of birth in an unprocessed state, while the anonymized customer data of the second business in the date of birth, gender, and address, if the gender and address are included in an unprocessed state, when the anonymized customer data of the first business operator and the second business operator are combined, the date of birth, gender, and , and addresses are combined in an unprocessed state. The
追加匿名加工部217は、抽出されたデータ項目の組み合わせを匿名加工して結合匿名化顧客データを更新する。追加匿名加工部217は、例えば、上記の匿名加工部114と同様に、対象のデータに項目削除や一般化等を施すことによって加工してもよい。
The additional
上記構成によれば、追加匿名加工部217は、異なる事業者間の匿名化顧客データを結合させた結果そのデータ項目の組み合わせにより顧客個人を特定可能になった場合でも、追加で匿名加工することで顧客個人の特定を抑止することができる。
According to the above configuration, the additional
蓄積部218は、所定の期間、結合匿名化顧客データを蓄積顧客データ記憶部232に蓄積する。ここで「所定の期間」とは、結合匿名化顧客データを蓄積させる期間であり、例えば、半年、1年、10年等の期間を適宜用いればよい。
The
類型化部219は、蓄積顧客データ記憶部232に蓄積された結合匿名化顧客データに基づいて、顧客の行動特性を類型化する。類型化部219は、当該類型化の結果を、類型情報として連携記憶部230に記憶する。
The typifying
類型化部219の類型化はどのような態様でもよい。類型化部219は、例えば、教師なし学習としてクラスタリング(例えば、k-means法など)、主成分分析、自己組織化マップ(Self Organization Map:SOM)等の手法を用いる分類モデルを構築して類型化してもよい。また、類型化部219は、他の例として、教師あり学習としてサポートベクターマシーン、ベイジアンフィルタ、決定木の構築のためのID3、ランダムフォレスト等の手法により学習させた分類モデルを構築して類型化してもよい。類型情報は、これら分類モデルであってもよい。換言すれば、類型情報は、例えば、顧客データに示された性別、年代、職業、趣向、健康状態、所得、性質、家族構成、所在(例えば、顧客データの位置情報により算出してもよい)、Webサイトへのアクセス履歴、商品の購入履歴等の属性のうち少なくとも一つを説明変数とし、目的変数として顧客の行動特性を含めた特性の傾向を求めてもよい。
The categorization by the
類型化部219は、具体的には、顧客データに示された、千葉県在住、45歳、独身、外資系ITベンダーに勤務する人物であり、輸入バイクや時計の価格比較サイトを巡回したWeb閲覧履歴があるという属性をもつ人物は、「中所得以上」「浪費家」「郊外在住」という特性の傾向を持つとして類型化してもよい。
Specifically, the
連携記憶部230は、匿名化顧客データ等の取得や結合匿名化顧客データの外部への提供に関する各種情報を記憶する。連携記憶部230は、例えば、匿名化顧客データ、ハッシュデータ、又は類型情報(後述の分類モデルを含む)等を記憶してもよい。連携記憶部230は、データベースマネジメントシステム(DBMS)を利用して各情報を記憶してもよいし、ファイルシステムを利用して各情報を記憶してもよい。DBMSを利用する場合は、上記情報ごとにテーブルを設けて、当該テーブル間を関連付けて各情報を管理してもよい。連携記憶部230は、例えば、キー記憶部231又は蓄積顧客データ記憶部232を備えてもよい。キー記憶部231は、キー情報を記憶する。蓄積顧客データ記憶部232は、所定の期間蓄積された結合匿名化顧客データを記憶する。
The
連携通信部240は、ネットワークNを介して、事業者サーバ100、又はその他の外部の装置等に各種情報を送受信する。連携通信部240は、例えば、ネットワークNを介して、事業者サーバ100から匿名化顧客データやハッシュデータ等を受信したり、事業者サーバ100やその他の外部の装置に結合匿名化顧客データや類型情報等を送信したりする。
The
<5.動作例>
図5を参照して、データ連携システム1の動作例を説明する。図5は、データ連携システム1において、連携サーバ200が事業者サーバ100のそれぞれの顧客データのデータ項目からキーデータ項目を決定し、連携サーバ200が決定したキーデータ項目のハッシュ値により匿名化顧客データを結合して事業者サーバ100に提供するまでの処理の流れを示すフロー図である。なお、以下に示す処理の順番は一例であって、適宜、変更されてもよい。
<5. Operation example>
An operation example of the
図5に示すように、連携サーバ200の参照部214は、第1事業者サーバ100aと第2事業者サーバ100bに対して、それぞれが管理する顧客データのデータ項目の参照を指示する(S10)。第1事業者サーバ100aは、連携サーバ200から顧客データのデータ項目の参照の指示を受けると、顧客データ記憶部121に記憶する第1事業者の顧客に関する顧客データのデータ項目を参照する(S11)。第2事業者サーバ100bは、連携サーバ200から顧客データのデータ項目の参照の指示を受けると、顧客データ記憶部121に記憶する第2事業者の顧客に関する顧客データのデータ項目を参照する(S12)。第1事業者サーバ100aは、上記参照の結果を連携サーバ200に送信する(S13)。第2事業者サーバ100bは、上記参照の結果を連携サーバ200に送信する(S14)。
As shown in FIG. 5, the
連携サーバ200のキー決定部215は、連携通信部240を介して第1事業者サーバ100aと第2事業者サーバ100bから上記参照の結果をそれぞれ受信すると、結合対象の第1事業者サーバ100aと第2事業者サーバ100bの顧客データ同士がそれぞれ有するデータ項目を比較してキーデータ項目をそれぞれ決定する。キー決定部215は、当該それぞれ決定したキーデータ項目を示すキー情報をキー記憶部231に記憶させる(S15)。
When the
連携サーバ200は、第1事業者サーバ100aと第2事業者サーバ100bにそれぞれ決定されたキーデータ項目を示すキー情報を送信する(S16)。
The
第1事業者サーバ100aのデータクレンジング部111は、上記キー情報を受信すると、顧客データのキーデータ項目のデータに対して、データクレンジングを行う(S17)。ハッシュ算出部112は、データクレンジングが行われたキーデータ項目のデータに基づいて、ハッシュ値を算出する(S18)。抽出部113は、顧客データが有するデータ項目のうち、顧客個人を特定可能なデータ項目を抽出する(S19)。匿名加工部114は、抽出されたデータ項目のデータを匿名加工して匿名化顧客データを生成し、顧客データ記憶部121に当該生成された匿名化顧客データを記憶する(S20)。第1事業者サーバ100aは、生成された匿名化顧客データ及び算出されたハッシュ値を示すハッシュデータを連携サーバ200に送信する(S21)。
When receiving the key information, the
第2事業者サーバ100bのデータクレンジング部111は、上記キー情報を受信すると、顧客データのキーデータ項目のデータに対して、データクレンジングを行う(S22)。ハッシュ算出部112は、データクレンジングが行われたキーデータ項目のデータに基づいて、ハッシュ値を算出する(S23)。抽出部113は、顧客データが有するデータ項目のうち、顧客個人を特定可能なデータ項目を抽出する(S24)。匿名加工部114は、抽出されたデータ項目のデータを匿名加工して匿名化顧客データを生成し、顧客データ記憶部121に当該生成された匿名化顧客データを記憶する(S25)。第2事業者サーバ100bは、生成された匿名化顧客データ及び算出されたハッシュ値を示すハッシュデータを連携サーバ200に送信する(S26)。
Upon receiving the key information, the
連携サーバ200の連携取得部211は、第1事業者サーバ100a及び第2事業者サーバ100bから、それぞれの匿名化顧客データ及びハッシュデータを取得する(S27)。
The
連携サーバ200の結合部212は、第1事業者サーバ100a及び第2事業者サーバ100bからそれぞれ取得したハッシュ値をキーにして、第1事業者サーバ100a及び第2事業者サーバ100bからそれぞれ取得した匿名化顧客データ同士を結合して、結合匿名化顧客データを生成する(S28)。
The combining
連携サーバ200の組み合わせ抽出部216は、結合匿名化顧客データが有するデータ項目の組み合わせのうち、顧客個人を特定可能なデータ項目の組み合わせを抽出する(S29)。追加匿名加工部217は、抽出されたデータ項目の組み合わせを匿名加工して結合匿名化顧客データを更新する(S30)。
The
連携サーバ200の連携提供部213は、結合匿名化顧客データを、第1事業者サーバ100a及び第2事業者サーバ100bに提供する(S31)。
The
<6.ハードウェア構成>
図6を参照して、上述してきた事業者サーバ100及び連携サーバ200をコンピュータ800により実現する場合のハードウェア構成の一例を説明する。なお、それぞれの装置の機能は、複数台の装置に分けて実現することもできる。
<6. Hardware Configuration>
With reference to FIG. 6, an example of a hardware configuration in which the above-described
図6に示すように、コンピュータ800は、プロセッサ801と、メモリ803と、記憶装置805と、入力I/F部807と、データI/F部809と、通信I/F部811、及び表示装置813を含む。
As shown in FIG. 6, the
プロセッサ801は、メモリ803に記憶されているプログラムを実行することによりコンピュータ800における様々な処理を制御する。例えば、事業者サーバ100の制御部110及び連携サーバ200の連携制御部210が備える各機能部等は、メモリ803に一時記憶されたプログラムを、プロセッサ801が実行することにより実現可能である。
メモリ803は、例えばRAM(Random Access Memory)等の記憶媒体である。メモリ803は、プロセッサ801によって実行されるプログラムのプログラムコードや、プログラムの実行時に必要となるデータを一時的に記憶する。
The
記憶装置805は、例えばハードディスクドライブ(HDD)やフラッシュメモリ等の不揮発性の記憶媒体である。記憶装置805は、オペレーティングシステムや、上記各構成を実現するための各種プログラムを記憶する。この他、記憶装置805は、匿名化顧客データやハッシュデータ等の各種情報・各種データを登録するテーブルと、当該テーブルを管理するDBを記憶することも可能である。このようなプログラムやデータは、必要に応じてメモリ803にロードされることにより、プロセッサ801から参照される。
The
入力I/F部807は、ユーザからの入力を受け付けるためのデバイスである。入力I/F部807の具体例としては、キーボードやマウス、タッチパネル、各種センサ、ウェアラブル・デバイス等が挙げられる。入力I/F部807は、例えばUSB(Universal Serial Bus)等のインタフェースを介してコンピュータ800に接続されても良い。
An input I/
データI/F部809は、コンピュータ800の外部からデータを入力するためのデバイスである。データI/F部809の具体例としては、各種記憶媒体に記憶されているデータを読み取るためのドライブ装置等がある。データI/F部809は、コンピュータ800の外部に設けられることも考えられる。その場合、データI/F部809は、例えばUSB等のインタフェースを介してコンピュータ800へと接続される。
A data I/
通信I/F部811は、コンピュータ800の外部の装置と有線又は無線により、インターネットNを介したデータ通信を行うためのデバイスである。通信I/F部811は、コンピュータ800の外部に設けられることも考えられる。その場合、通信I/F部811は、例えばUSB等のインタフェースを介してコンピュータ800に接続される。
The communication I/
表示装置813は、各種情報を表示するためのデバイスである。表示装置813の具体例としては、例えば液晶ディスプレイや有機EL(Electro-Luminescence)ディスプレイ、ウェアラブル・デバイスのディスプレイ等が挙げられる。表示装置813は、コンピュータ800の外部に設けられても良い。その場合、表示装置813は、例えばディスプレイケーブル等を介してコンピュータ800に接続される。また、入力I/F部807としてタッチパネルが採用される場合には、表示装置813は、入力I/F部807と一体化して構成することが可能である。
The
[第2実施形態]
次に、本発明の第2実施形態について説明する。本実施形態は、顧客本人の同意を得た上で、複数の事業者間で顧客データを結合し、結合された顧客データに対して第1実施形態で類型化した顧客の特性を当てはめて、顧客の特性を予測する形態である。以下、第1実施形態と異なる点を中心に説明する。
[Second embodiment]
Next, a second embodiment of the invention will be described. In this embodiment, after obtaining the consent of the customer himself/herself, customer data is combined between a plurality of business operators, and the characteristics of the customers categorized in the first embodiment are applied to the combined customer data, It is a form of predicting customer characteristics. In the following, the points different from the first embodiment will be mainly described.
<1.概要>
図7を参照して、本実施形態に係るデータ連携システムの概要の一例を説明する。なお、本例では、本実施形態に係る第1事業者サーバ100a及び第2事業者サーバ100bからそれぞれ顧客データを取得して結合し、結合した顧客データにおける顧客の特性を予測しその結果をこれらの事業者サーバ100に提供する例を用いて説明するが、これに限る趣旨ではない。例えば、顧客データの取得元の事業者サーバ100は三つ以上あってもよいし、また、顧客の特性を予測した結果の提供先は取得元の事業者サーバ100の少なくともいずれか一つであってもよいし、その他の外部の装置であってもよい。なお、本実施形態に係る第1事業者サーバ100Aaと第2事業者サーバ100Abとは、特に区別の必要が無い場合は、総称して「事業者サーバ100A」という。
<1. Overview>
An example of the overview of the data linkage system according to this embodiment will be described with reference to FIG. In this example, customer data is acquired from each of the
(1)図7に示すように、事業者サーバ100Aは、データクレンジングとしてそれぞれ顧客データに対する書式合わせを行う。事業者サーバ100Aは、この書式合わせを行った顧客データを正規化顧客データとして記憶部120に記憶する。
(1) As shown in FIG. 7, the provider server 100A performs format matching for each customer data as data cleansing. The provider server 100A stores the formatted customer data in the
(2)本実施形態に係る連携サーバ200Aの連携取得部211Aは、事業者サーバ100Aに対して同意情報の参照を指示する。連携取得部211Aは、当該参照の結果事業者サーバ100Aから連携サーバ200Aに正規化顧客データが提供可能な場合、事業者サーバ100Aから正規化顧客データを取得する。
(2) The
「同意情報」とは、外部への顧客データの提供及び提供先での顧客データの利用等に対する顧客の同意を表す情報である。同意情報は、例えば、対象の同意事項を含んでもよい。対象の同意事項とは、例えば、外部への顧客データの提供可否、外部での利用可否、又は、顧客データの外部への提供及び利用を「可」とする場合におけるその利用目的(例えば、第三者への提供/開示等)等を含んでもよい。 "Consent information" is information that represents the customer's consent to the provision of customer data to the outside and the use of customer data at the destination. Consent information may include, for example, a subject's consent. For example, whether customer data can be provided externally, whether it can be used externally, or if the provision and use of customer data to the outside is permitted, the purpose of use (for example, provision/disclosure to a third party, etc.).
(3)連携サーバ200Aの結合部212Aは、キー情報に基づいて、結合対象の正規化顧客データ同士のキーデータ項目のデータをキーにして、第1事業者サーバ100Aaと第2事業者サーバAbからそれぞれ取得した正規化顧客データ同士を結合して、結合顧客データを生成する。
(3) Based on the key information, the linking
(4)連携サーバ200Aの分類部220は、類型情報に基づいて、結合顧客データにより特定される顧客を類型化の結果である類型ごとに分類する。(5)連携サーバ200Aの予測部221は、上記(4)の分類の結果に基づいて、特定される顧客の特性を予測する。(6)連携提供部213Aは、上記(5)の予測の結果を示す予測情報を、事業者サーバ100A及びその他の外部装置の少なくともいずれか一つに提供する。
(4) Based on the type information, the
上記構成によれば、連携サーバ200Aは、各事業者におけるOne to Oneマーケティング活動等に資する顧客の特性の予測を各事業者に提供することができる。
According to the above configuration, the
<2.連携サーバの機能構成>
図8を参照して、本実施形態に係る連携サーバ200Aの機能構成の一例について説明する。連携サーバ200Aは、第1実施形態に係る連携サーバ200の連携記憶部230と連携通信部240とを共通して備える。連携サーバ200Aの連携制御部210においては、第1実施形態に係る連携制御部210の連携取得部211と、結合部212と、連携提供部213とにさらに機能を加えた連携取得部211Aと、結合部212Aと、連携提供部213Aとを備え、これらの機能部に加えて、分類部220と、予測部221とを備える。
<2. Functional Configuration of Collaborative Server>
An example of the functional configuration of the
連携取得部211Aは、例えば、事業者サーバ100Aに対して同意情報の参照を指示する。連携取得部211Aは、当該参照の結果を事業者サーバ100Aから取得する。そして連携取得部211Aは、上記参照の結果事業者サーバ100Aから連携サーバ200Aに顧客データが提供可能な場合、事業者サーバ100から顧客データを取得してもよい。
The
結合部212Aは、例えば、キー情報に基づいて、結合対象の顧客データ同士のキーデータ項目のデータをキーにして、複数の事業者サーバ100Aからそれぞれ取得した顧客データ同士を結合してもよい。結合部212Aは、結合した顧客データから結合顧客データを生成する。結合部212Aは、他の例として、結合用に設定された顧客の識別情報により複数の事業者サーバ100Aからそれぞれ取得した顧客データ同士を結合してもよい。結合部212Aは、例えば、同一の顧客に対して、第1事業者で発行・管理されている当該顧客の識別情報と、第2事業者で発行・管理されている当該顧客の識別情報とを連結させる当該顧客の識別情報を発行してもよい。結合部212Aは、この発行した顧客の識別情報を、上記結合用の上記顧客の識別情報として設定してもよい。
The merging
連携提供部213Aは、例えば、後述の予測部221による予測の結果を示す予測情報を事業者サーバ100A及びその他の外部装置の少なくともいずれか一つに提供してもよい。
The
上記構成によれば、連携提供部213Aは、各事業者におけるOne to Oneマーケティング活動等に資する顧客の特性の予測を各事業者に提供することができる。
According to the above configuration, the
分類部220は、類型情報に基づいて、結合顧客データにより特定される顧客を類型化の結果である類型ごとに分類する。分類部220は、例えば、第1実施形態における類型化部219により構築された分類モデルを類型情報として、結合顧客データにより特定される顧客を類型ごとに分類してもよい。分類部220は、他の例として、類型化部219により構築された分類モデルではない予め連携記憶部230に記憶された分類モデルを類型情報として、結合顧客データにより特定される顧客を類型ごとに分類してもよい。
Based on the type information, the
予測部221は、分類部220の上記分類の結果に基づいて、結合顧客データにより特定される顧客の特性を予測する。予測部221は、例えば、上記の類型化部219により構築された、又はその他の連携記憶部230に記憶された分類モデルを用いて顧客の特性を予測してもよい。予測部221は、当該予測の結果を予測情報として連携記憶部230に記憶してもよい。
The
なお、上記実施の形態は、本発明を説明するための例示であり、本発明をその実施の形態のみに限定する趣旨ではない。また、本発明は、その要旨を逸脱しない限り、さまざまな変形が可能である。さらに、当業者であれば、以下に述べる各要素を均等なものに置換した実施の形態を採用することが可能であり、かかる実施の形態も本発明の範囲に含まれる。 It should be noted that the above-described embodiment is an example for explaining the present invention, and is not intended to limit the present invention only to the embodiment. Also, the present invention can be modified in various ways without departing from the gist thereof. Furthermore, those skilled in the art can adopt embodiments in which each element described below is replaced with equivalents, and such embodiments are also included in the scope of the present invention.
また、上記実施の形態で記載された事業者サーバ100及び連携サーバ200が備える構成要素は、記憶装置805に格納されたプログラムがプロセッサ801によって実行されることで、定められた処理が他のハードウェアと協働して実現されるものとする。また、言い換えれば、これらの構成要素は、ソフトウェア又はファームウェアとしても、それと対応するハードウェアとしても想定され、その双方の概念において、「機能」、「手段」、「部」、「処理回路」、「ユニット」、又は「モジュール」等とも記載され、またそれぞれに読み替えることができる。
Further, the components provided in the
[変形例]
なお、本発明を上記実施の形態に基づいて説明してきたが、以下のような場合も本発明に含まれる。
[Modification]
Although the present invention has been described based on the above embodiments, the following cases are also included in the present invention.
(1)上記実施形態に係る事業者サーバ100、100Aが備える各構成の少なくとも一部は、連携サーバ200、200Aが備えていてもよい。例えば、事業者サーバ100の抽出部113の機能を連携サーバ200に実装させてもよい。
(1) At least part of each configuration included in the
(2)上記(1)とは逆に、上記実施形態に係る連携サーバ200、200Aが備える各構成の少なくとも一部は、事業者サーバ100、100Aが備えていてもよい。例えば、事業者サーバ100、100Aがインストールするデータ連携システム1の専用アプリケーションプログラムに、連携サーバ200、200Aの連携制御部210が備える各機能部の機能を実装させる。事業者サーバ100、100Aがこのアプリケーションプログラムをインストールすることで、連携サーバ200、200Aを設けずに事業者サーバ100、100A間で顧客データ、匿名化顧客データ又は結合匿名化顧客データ等の連携、顧客の特性の類型化や予測等を行ってもよい。言い換えれば、複数の事業者サーバ100、100Aのうち少なくとも一つのサーバを、連携サーバ200、200Aとしてもよい。この際、事業者サーバ100、100Aのうち特定のサーバに集中させて連携サーバ200、200Aの上記機能を備えさせてもよいし、複数の事業者サーバ100、100Aそれぞれに分散させて備えさせてもよい。なお、データ連携システム1の専用アプリケーションプログラムに実装させる連携サーバ200、200Aの連携制御部210が備える各機能部の機能は、全部であってもよいし、一部であってもよい。
(2) Contrary to (1) above, at least a part of each configuration included in the
上記のように連携基盤である連携サーバ200、200Aを設けない場合、複数の事業者サーバ100のいずれかで類型情報や予想情報、又は結合匿名化顧客データを生成し、生成した結合匿名化顧客データを複数の事業者サーバ100の間で分散管理させてもよい。また、この分散管理にあたっては、例えば、分散型台帳技術、いわゆるブロックチェーン技術を用いて実現してもよい。また、連携サーバ200、200Aを設けずに、複数の事業者サーバ100、100A間で顧客データ、匿名化顧客データ、結合匿名化顧客データ、類型情報又は予想情報等を連携する場合、P2P方式を用いて事業者サーバ100、100A間を接続し通信させてもよい。
As described above, if the
(3)上記実施形態では、キー情報を記憶するキー記憶部は、連携サーバ200が備える例を説明したが、連携サーバ200以外の装置、例えば事業者サーバ100が備えてもよい。また、事業者サーバ100が備えるキー記憶部をキー決定部が参照する際は、例えば、事業者サーバ100が当該参照のために実装するAPIを利用してもよいし、事業者サーバ100にリモートアクセスしてもよい。
(3) In the above embodiment, the key storage unit for storing key information is provided in the
1…データ連携システム、100、100A…事業者サーバ、100a、100Aa…第1事業者サーバ、100b、100Ab…第2事業者サーバ、110…制御部、111…データクレンジング部、112…ハッシュ算出部、113…抽出部、114…匿名加工部、115…事業者提供部、116…事業者取得部、120…記憶部、121…顧客データ記憶部、130…通信部、200、200A…連携サーバ、210…連携制御部、211、211A…連携取得部、212、212A…結合部、213、213A…連携提供部、214…参照部、215…キー決定部、216…抽出部、217…追加匿名加工部、218…蓄積部、219…類型化部、220…分類部、221…予測部、230…連携記憶部、231…キー記憶部、232…蓄積顧客データ記憶部、240…連携通信部、800…コンピュータ、801…プロセッサ、803…メモリ、805…記憶装置、807…入力I/F部、809…データI/F部、811…通信I/F部、813…表示装置
DESCRIPTION OF
Claims (6)
前記複数の事業者サーバから、それぞれが管理する顧客データを匿名化した匿名化顧客データと、前記複数の事業者サーバ間でそれぞれが管理する顧客データ同士を結合させるためのキーとする前記顧客データのキーデータ項目のデータに基づいて算出されたハッシュ値を示すハッシュデータと、を取得する連携取得部と、
前記複数の事業者サーバからそれぞれ取得した前記ハッシュ値をキーにして、複数の前記事業者サーバからそれぞれ取得した匿名化顧客データ同士を結合して、結合匿名化顧客データを生成する結合部と、
前記結合匿名化顧客データを、前記事業者サーバ及びその他の外部の装置の少なくともいずれか一つに提供する連携提供部と、
前記結合匿名化顧客データが有するデータ項目の組み合わせのうち、顧客個人を特定可能なデータ項目の組み合わせを抽出する組み合わせ抽出部と、
前記抽出されたデータ項目の組み合わせを匿名加工して前記結合匿名化顧客データを更新する追加匿名加工部と、を実現させる、
連携サーバプログラム。 In a cooperation server that can communicate with multiple business servers that manage customer data related to customers,
Anonymized customer data obtained by anonymizing customer data managed by each of the plurality of operator servers, and the customer data serving as a key for linking the customer data managed by each of the plurality of operator servers. a cooperation acquisition unit that acquires hash data indicating a hash value calculated based on the data of the key data item of
a combining unit for generating combined anonymized customer data by combining the anonymized customer data respectively acquired from the plurality of operator servers using the hash values respectively acquired from the plurality of operator servers as keys;
a cooperation providing unit that provides the combined anonymized customer data to at least one of the business operator server and other external devices ;
a combination extracting unit that extracts a combination of data items that can identify an individual customer from among the combinations of data items included in the combined anonymized customer data;
an additional anonymization processing unit that anonymizes the combination of the extracted data items and updates the combined anonymized customer data;
Cooperation server program.
前記蓄積顧客データ記憶部に蓄積された結合匿名化顧客データに基づいて、顧客の特性を類型化する類型化部と、をさらに備え、
前記連携提供部は、前記類型化の結果を示す類型情報を、前記事業者サーバ及びその他の外部装置の少なくともいずれか一つに提供する、
請求項1に記載の連携サーバプログラム。 an accumulation unit for accumulating the combined anonymized customer data in an accumulated customer data storage unit for a predetermined period;
a typifying unit that typifies customer characteristics based on the combined anonymized customer data accumulated in the accumulated customer data storage unit;
The cooperation providing unit provides type information indicating the result of the categorization to at least one of the business operator server and other external devices,
The cooperation server program according to claim 1 .
前記結合部は、結合対象の顧客データ同士の前記キーデータ項目のデータをキーにして、複数の事業者サーバからそれぞれ取得した前記顧客データ同士を結合して、結合顧客データを生成する、
請求項2に記載の連携サーバプログラム。 The cooperation acquisition unit instructs the business operator server to refer to consent information including whether or not to provide the customer data managed by the business operator server to a third party, and as a result of the reference, when the customer data can be provided to the cooperation server, obtaining the customer data from the business operator server;
The combining unit generates combined customer data by combining the customer data acquired from each of the plurality of business operator servers, using the data of the key data item of the customer data to be combined as a key.
The cooperation server program according to claim 2 .
前記分類の結果に基づいて、前記顧客の特性を予測する予測部と、をさらに実現させる、
前記連携提供部は、前記予測の結果を示す予測情報を、前記事業者サーバ及びその他の外部装置の少なくともいずれか一つに提供する、
請求項3に記載の連携サーバプログラム。 a classifying unit that classifies the customers identified by the combined customer data according to the types resulting from the classification, based on the type information;
a prediction unit that predicts the characteristics of the customer based on the result of the classification;
The cooperation providing unit provides prediction information indicating the result of the prediction to at least one of the business operator server and other external devices,
A cooperation server program according to claim 3 .
前記参照の結果に基づいて、結合対象の顧客データ同士がそれぞれ有するデータ項目を比較して前記キーデータ項目をそれぞれ決定し、当該決定したキーデータ項目を示すキー情報を前記事業者サーバに提供するキー決定部と、をさらに実現させる、
請求項1から4のいずれか一項に記載の連携サーバプログラム。 a reference unit that instructs the business server to refer to a data item of customer data managed by each;
Based on the result of the reference, the data items of the customer data to be combined are compared to determine the key data items, respectively, and key information indicating the determined key data items is provided to the business operator server. further realizing a key determination unit;
The cooperation server program according to any one of claims 1 to 4 .
前記事業者サーバは、
前記顧客データが有するデータ項目のうち、異なる前記事業者サーバとの間で顧客データ同士を結合させるためのキーとなるキーデータ項目を示すキー情報を記憶するキー記憶部を参照して、前記顧客データの前記キーデータ項目のデータに基づいて、ハッシュ値を算出するハッシュ算出部と、
前記顧客データを匿名化した匿名化顧客データを記憶する顧客データ記憶部と、を備え、
前記連携サーバは、
複数の前記事業者サーバから、それぞれの前記匿名化顧客データ及び前記ハッシュ値を取得する連携取得部と、
複数の前記事業者サーバからそれぞれ取得した前記ハッシュ値をキーにして、複数の前記事業者サーバからそれぞれ取得した匿名化顧客データ同士を結合して、結合匿名化顧客データを生成する結合部と、
前記結合匿名化顧客データを、前記事業者サーバ及びその他の外部の装置の少なくともいずれか一つに提供する連携提供部と、
前記結合匿名化顧客データが有するデータ項目の組み合わせのうち、顧客個人を特定可能なデータ項目の組み合わせを抽出する組み合わせ抽出部と、
前記抽出されたデータ項目の組み合わせを匿名加工して前記結合匿名化顧客データを更新する追加匿名加工部と、を備える、
データ連携システム。 A data linkage system comprising: a plurality of operator servers for managing customer data relating to customers; and a linkage server capable of communicating with the plurality of operator servers,
The operator server is
By referring to a key storage unit that stores key information indicating a key data item that serves as a key for linking customer data between different business servers, among the data items of the customer data, the customer a hash calculation unit that calculates a hash value based on the data of the key data item of the data;
a customer data storage unit that stores anonymized customer data obtained by anonymizing the customer data;
The cooperation server is
a cooperation acquisition unit that acquires each of the anonymized customer data and the hash value from the plurality of business servers;
a combining unit that generates combined anonymized customer data by combining the anonymized customer data respectively acquired from the plurality of operator servers using the hash values respectively acquired from the plurality of operator servers as keys;
a cooperation providing unit that provides the combined anonymized customer data to at least one of the business operator server and other external devices ;
a combination extracting unit that extracts a combination of data items that can identify an individual customer from among the combinations of data items included in the combined anonymized customer data;
an additional anonymization processing unit that anonymizes the combination of the extracted data items and updates the combined anonymized customer data;
Data linkage system.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020010110A JP7107979B2 (en) | 2020-01-24 | 2020-01-24 | Linkage server program, provider server program, and data linkage system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020010110A JP7107979B2 (en) | 2020-01-24 | 2020-01-24 | Linkage server program, provider server program, and data linkage system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021117679A JP2021117679A (en) | 2021-08-10 |
JP7107979B2 true JP7107979B2 (en) | 2022-07-27 |
Family
ID=77174883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020010110A Active JP7107979B2 (en) | 2020-01-24 | 2020-01-24 | Linkage server program, provider server program, and data linkage system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7107979B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7349192B1 (en) | 2022-10-31 | 2023-09-22 | 邦生 越村 | Data transmission/reception management method and data transmission/reception management system |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7493087B1 (en) | 2023-11-30 | 2024-05-30 | Kddi株式会社 | Information processing device and information processing method |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004318391A (en) | 2003-04-15 | 2004-11-11 | Mitsubishi Electric Corp | Information providing device, information providing system, and distributed database system |
WO2008102754A1 (en) | 2007-02-21 | 2008-08-28 | Nec Corporation | Information associating system, user information associating method and program |
-
2020
- 2020-01-24 JP JP2020010110A patent/JP7107979B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004318391A (en) | 2003-04-15 | 2004-11-11 | Mitsubishi Electric Corp | Information providing device, information providing system, and distributed database system |
WO2008102754A1 (en) | 2007-02-21 | 2008-08-28 | Nec Corporation | Information associating system, user information associating method and program |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7349192B1 (en) | 2022-10-31 | 2023-09-22 | 邦生 越村 | Data transmission/reception management method and data transmission/reception management system |
WO2024095587A1 (en) | 2022-10-31 | 2024-05-10 | 邦生 越村 | Data transmission and reception management method and data transmission and reception management system |
JP2024065981A (en) * | 2022-10-31 | 2024-05-15 | 邦生 越村 | Data transmission/reception management method and data transmission/reception management system |
Also Published As
Publication number | Publication date |
---|---|
JP2021117679A (en) | 2021-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107818344B (en) | Method and system for classifying and predicting user behaviors | |
JP5735969B2 (en) | System and method for analyzing social graph data for determining connections within a community | |
US10325243B1 (en) | Systems and methods for identifying and ranking successful agents based on data analytics | |
US20120059677A1 (en) | Methods and systems for automated, predictive modeling of the outcome of benefits claims | |
US20160048766A1 (en) | Method and system for generating and aggregating models based on disparate data from insurance, financial services, and public industries | |
AU2019203992A1 (en) | Data platform for automated data extraction, transformation, and/or loading | |
US20120221606A1 (en) | Rapid caching and data delivery system and method | |
TW201636937A (en) | Diversity analysis with actionable feedback methodologies | |
JP7107979B2 (en) | Linkage server program, provider server program, and data linkage system | |
KR102162765B1 (en) | System and method for automated management of customer churn based on artificial intelligence and computer program for the same | |
US11237937B1 (en) | Intermediate check points and controllable parameters for addressing process deficiencies | |
US10069758B2 (en) | Processing system responsive to analysis filter criteria | |
US10770171B2 (en) | Augmenting datasets using de-identified data and selected authorized records | |
CA3204198A1 (en) | Context based privacy risk footprint and incident protection | |
US10803514B1 (en) | Intelligent product plan dataset | |
GB2517964A (en) | Quotation intermediary system and method | |
JP2023542404A (en) | Machine learning model training from manual decisions | |
JP2024511307A (en) | A cognitive framework for privacy-driven user data sharing | |
US20220269979A1 (en) | System method and code for un-learning an individual from an artificial intelligence (ai) model | |
CN115081447A (en) | Method, device and equipment for constructing requirement document of software development and storage medium | |
US20150112771A1 (en) | Systems, methods, and program products for enhancing performance of an enterprise computer system | |
US20130226862A1 (en) | System and method for creating macro profiles | |
JP2021105868A (en) | Information providing server, program, and information providing method | |
US8892642B2 (en) | Computer-based comparison of human individuals | |
CN116192400B (en) | Mobile middle station system supporting HCCM service |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210617 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220331 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220413 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220714 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7107979 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |