JP2023001109A - Information processing device, information processing method, and information processing program - Google Patents
Information processing device, information processing method, and information processing program Download PDFInfo
- Publication number
- JP2023001109A JP2023001109A JP2022109850A JP2022109850A JP2023001109A JP 2023001109 A JP2023001109 A JP 2023001109A JP 2022109850 A JP2022109850 A JP 2022109850A JP 2022109850 A JP2022109850 A JP 2022109850A JP 2023001109 A JP2023001109 A JP 2023001109A
- Authority
- JP
- Japan
- Prior art keywords
- company
- data
- information
- customer
- companies
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program.
データ共有システムにおいて、各社が保有するデータの内容を他社に開示することなく、安全に活用する技術が開示されている。 In a data sharing system, a technology is disclosed for safely using the data held by each company without disclosing it to other companies.
しかしながら、上記の従来技術は、データ共有システムに参加する組織等から提供される機微データを、所定の暗号方式(暗号化状態のまま、検索や分析等を含む演算を行うことができる暗号方式)で暗号化してデータ処理する一方、暗号化及び復号に用いる鍵は、当該機微データを提供した各組織において管理するというものに過ぎない。 However, the above-described conventional technology uses a predetermined cryptographic method (a cryptographic method that allows operations including search and analysis to be performed in an encrypted state) for sensitive data provided by organizations participating in a data sharing system. However, the key used for encryption and decryption is simply managed by each organization that provided the sensitive data.
また、共通IDでのID統合(ID Connect)を全クライアントに強制するとデータ圏加盟企業が増えないという問題がある。また、データ圏に企業が加盟したとしても、各企業から全顧客データ(個人情報)を、マザーサーバ側に送信してもらうのは非現実的(これに賛同できない企業が多いはず)である。そのため、データ圏加盟企業が、自社のデータをあまり出さず、他社のデータのみに頼ってマーケティング活用できないような設計が必要である。すなわち、フリーライド(ただ乗り)できない仕組みや、自社のデータを出したくなる仕組みが必要である。 In addition, there is a problem that if all clients are forced to integrate IDs (ID Connect) using a common ID, the number of companies participating in the data area will not increase. Also, even if companies join the data sphere, it would be unrealistic to have each company send all customer data (personal information) to the mother server side (many companies would not agree with this). Therefore, it is necessary to design so that the member companies of the data zone do not release much of their own data and cannot rely only on the data of other companies for marketing purposes. In other words, it is necessary to have a mechanism that prevents free riding and a mechanism that makes people want to release their company's data.
本願は、上記に鑑みてなされたものであって、データ圏加盟企業が自社のデータを出したくなる仕組みを提供することを目的とする。 The present application has been made in view of the above, and aims to provide a mechanism that makes data area member companies want to publish their own data.
本願に係る情報処理装置は、複数の企業の各々から顧客データをベクトル化した匿名情報を取得する取得部と、前記各企業からの匿名情報を用いてAIの機械学習をする学習部と、前記機械学習を経たAIにより、前記複数の企業のうち特定企業の目的に適合する顧客を推定する推定部と、前記推定部による推定結果に基づく情報を提供する提供部とを備えることを特徴とする。 An information processing apparatus according to the present application includes an acquisition unit that acquires anonymous information obtained by vectorizing customer data from each of a plurality of companies, a learning unit that performs AI machine learning using the anonymous information from each company, and An estimating unit for estimating a customer suitable for the purpose of a specific company among the plurality of companies by AI that has undergone machine learning, and a providing unit for providing information based on the estimation result of the estimating unit. .
実施形態の一態様によれば、データ圏加盟企業が自社のデータを出したくなる仕組みを提供することができる。 According to one aspect of the embodiments, it is possible to provide a mechanism that makes data zone member companies want to publish their own data.
以下に、本願に係る情報処理装置、情報処理方法及び情報処理プログラムを実施するための形態(以下、「実施形態」と記載する)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法及び情報処理プログラムが限定されるものではない。また、以下の実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Embodiments for implementing an information processing apparatus, an information processing method, and an information processing program according to the present application (hereinafter referred to as "embodiments") will be described in detail below with reference to the drawings. The information processing apparatus, information processing method, and information processing program according to the present application are not limited to this embodiment. Also, in the following embodiments, the same parts are denoted by the same reference numerals, and overlapping descriptions are omitted.
〔1.情報処理方法の概要〕
まず、図1を参照し、実施形態に係る情報処理装置が行う情報処理方法の概要について説明する。図1は、実施形態に係る情報処理方法の概要を示す説明図である。なお、図1では、データ圏加盟企業が自社のデータを出したくなる仕組みを提供する場合を例に挙げて説明する。
[1. Outline of information processing method]
First, an outline of an information processing method performed by an information processing apparatus according to an embodiment will be described with reference to FIG. FIG. 1 is an explanatory diagram showing an outline of an information processing method according to an embodiment. In FIG. 1, a case where data zone member companies provide a system that makes them want to release their own data will be explained as an example.
図1に示すように、実施形態に係る情報処理システム1は、クライアント端末10と、マザーサーバ100とを含む。クライアント端末10とマザーサーバ100とは、それぞれネットワークNを介して、有線又は無線によりで互いに通信可能に接続される。ネットワークNは、例えば、LAN(Local Area Network)や、インターネット等のWAN(Wide Area Network)である。
As shown in FIG. 1, an
また、かかるクライアント端末10は、LTE(Long Term Evolution)、4G(4th Generation)、5G(5th Generation:第5世代移動通信システム)等の無線通信網や、Bluetooth(登録商標)、無線LAN(Local Area Network)等の近距離無線通信を介してネットワークNに接続し、マザーサーバ100と通信することができる。
In addition, the
クライアント端末10は、クライアント側の各企業(データ圏加盟企業)によって使用される情報処理装置である。例えば、クライアント端末10は、PC(Personal Computer)やサーバ装置、あるいはスマートフォンやタブレット端末等のスマートデバイス等である。なお、クライアント側の各企業は、異業種の企業であると好ましい。無論、データ圏加盟企業の中に、競合企業(同業他社)が含まれていてもよい。
The
各企業のクライアント端末10は、自社の顧客(Customer)である各利用者U(ユーザ)に関する顧客データを収集する。例えば、各企業のクライアント端末10は、自社の製品を購入/サービスを利用した各利用者Uの登録情報や来店記録、製品購入履歴/サービス利用履歴、アンケート回答等を顧客データとして収集する。
The
図1に示す例では、識別のため、A社によって使用されるクライアント端末10を「クライアント端末10A」、B社によって使用されるクライアント端末10を「クライアント端末10B」、C社によって使用されるクライアント端末10を「クライアント端末10C」と称する。
In the example shown in FIG. 1, for identification, the
マザーサーバ100は、例えばPCやサーバ装置、あるいはメインフレーム又はワークステーション等である。なお、マザーサーバ100は、クラウドコンピューティングにより実現されてもよい。また、マザーサーバ100は、各企業のクライアント端末10とは別に、マザー側のサービスを利用する顧客としての各利用者Uに関する顧客データ(マザー側のデータ)を収集してもよい。
The
例えば、マザーサーバ100は、各利用者Uの端末装置と連携し、各利用者Uの端末装置に対して、各種アプリケーション(以下、アプリ)等に対するAPI(Application Programming Interface)サービス等と、各種データを提供してもよい。
For example, the
また、マザーサーバ100は、各利用者Uの端末装置に対して、オンラインで何らかのWebサービスを提供する情報処理装置であってもよい。例えば、マザーサーバ100は、Webサービスとして、インターネット接続、検索サービス、SNS(Social Networking Service)、電子商取引、電子決済、オンラインゲーム、オンラインバンキング、オンライントレーディング、宿泊・チケット予約、動画・音楽配信、ニュース、地図、ルート検索、経路案内、路線情報、運行情報、天気予報等のサービスを提供してもよい。実際には、マザーサーバ100は、上記のようなWebサービスを提供する各種サーバと連携し、Webサービスを仲介してもよいし、Webサービスの処理を担当してもよい。
Also, the
なお、マザーサーバ100は、利用者Uに関する利用者情報を取得可能である。例えば、マザーサーバ100は、利用者Uの性別、年代、居住地域といった利用者Uの属性に関する情報を取得する。そして、マザーサーバ100は、利用者Uを示す識別情報(利用者ID等)とともに利用者Uの属性に関する情報を記憶して管理する。
Note that the
また、マザーサーバ100は、利用者Uの端末装置から、あるいは利用者ID等に基づいて各種サーバ等から、利用者Uの行動を示す各種の履歴情報(ログデータ)を取得する。例えば、マザーサーバ100は、利用者Uの位置や日時の履歴である位置履歴を端末装置から取得する。また、マザーサーバ100は、利用者Uが入力した検索クエリの履歴である検索履歴を検索サーバ(検索エンジン)から取得する。また、マザーサーバ100は、利用者Uが閲覧したコンテンツの履歴である閲覧履歴をコンテンツサーバから取得する。また、マザーサーバ100は、利用者Uの商品購入や決済処理の履歴である購入履歴(決済履歴)を電子商取引サーバや決済処理サーバから取得する。また、マザーサーバ100は、利用者Uのマーケットプレイスへの出品の履歴である出品履歴や販売履歴を電子商取引サーバや決済サーバから取得してもよい。また、マザーサーバ100は、利用者Uの投稿の履歴である投稿履歴を口コミの投稿サービスを提供する投稿サーバやSNSサーバから取得する。
Also, the
なお、図1に示す情報処理システム1に含まれる各装置の数は図示したものに限られない。例えば、図1では、図示の簡略化のため、クライアント端末10を3台のみ示したが、これはあくまでも例示であって限定されるものではなく、4台以上であってもよい。また、マザーサーバ100も、複数のサーバ装置に分散していてもよい。
Note that the number of devices included in the
例えば、図1に示すように、マザーサーバ100は、事前(各企業のデータ圏加盟時等)に、ネットワークNを介して、データ圏に加盟する各企業のクライアント端末10(10A、10B,10C、・・・)に対して、顧客データを匿名化(ベクトル化)するためのAI(Artificial Intelligence:人工知能)を配布する(ステップS1)。
For example, as shown in FIG. 1, the
このとき、マザーサーバ100は、企業ごとにAIをカスタマイズしてもよい。すなわち、マザーサーバ100は、各企業に対してそれぞれ異なるAIを配布してもよい。企業の業種・業態によって顧客データとして取得する情報の内容が異なることもあり得るため、取得される顧客データの内容に合わせてAIの仕様を変更することは可能であり、一律に同じAIでなくてもよい。マザーサーバ100(サーバ側)が各企業に配布したAIの仕様を把握・管理していれば十分である。
At this time, the
続いて、マザーサーバ100は、データ圏に加盟する各企業のクライアント端末10から、AIにより各企業の顧客データを匿名化(ベクトル化)した匿名情報を収集する(ステップS2)。
Subsequently, the
本実施形態では、各企業のクライアント端末10は、自社の顧客に関する顧客データを取得し、AIにより、取得された顧客データをベクトルに変換(ベクトル化)した匿名情報を生成する。このとき、クライアント端末10は、いわゆるエンベディング(embedding:埋め込み)を行い、匿名情報として、顧客データに基づくエンベディングベクトル(埋め込みベクトル)を生成してもよい。そして、各企業のクライアント端末10は、マザーサーバ100からの要求に応じて、又は自発的に、顧客データを匿名化(ベクトル化)した匿名情報をマザーサーバ100に送信する。
In the present embodiment, the
例えば、クライアント端末10は、AIにより、マザーサーバ100(サーバ側)でニューラルネットワークによる機械学習の手法等を用いて構築されたベクトル変換モデルに顧客データを入力して、顧客データを多次元からなる実数値ベクトルへと変換する。あるいは、クライアント端末10は、所定の変換規則(ルール)に従って(ルールベースで)、顧客データをベクトルに変換してもよい。
For example, the
なお、匿名情報は不可逆な情報であり、匿名情報のベクトル値から元の顧客データを復元することはできない。ここで、「復元することができない」とは、ベクトル値から確定的に元のデータを算出することができないといった概念のみならず、推定することができないもの等、元のデータ、すなわち、顧客データがどのようなものであったかを算出若しくは推定することが困難であるといった概念も含むものである。すなわち、匿名情報は、暗号化されたデータのように復号することはできない。例えば、顧客データを匿名化(ベクトル化)する際に、共通の属性等によって所定のグループやセグメントに配置することや、端数処理(四捨五入や切捨て等)を行って数値を「丸める」こともできる。また、顧客データとベクトル値とは、同一のデータから同一のベクトル値が得られる1対1の関係に限らず、異なるデータから同一のベクトル値が得られる多対1の関係や、一部に同じデータを含んでいてもデータの組み合わせによって異なるベクトル値が得られる多対多の関係の場合もある。さらに、企業ごとに異なるAIを配布する場合、企業によってベクトル値の意味自体が異なることもある。したがって、1つのベクトル値が同一のデータに基づいているとは限らない。また、マザーサーバ100(サーバ側)が必要とするのは、ベクトル値であって、ベクトル値の根拠(元)となった顧客データではない。 The anonymous information is irreversible information, and the original customer data cannot be restored from the vector value of the anonymous information. Here, "cannot be restored" means not only the concept that the original data cannot be deterministically calculated from the vector value, but also the original data such as those that cannot be estimated, that is, the customer data It also includes the concept that it is difficult to calculate or estimate what it was like. That is, anonymous information cannot be decrypted like encrypted data. For example, when customer data is anonymized (vectorized), it is possible to place it in predetermined groups or segments based on common attributes, etc., or to "round" numbers by performing rounding (rounding off, rounding down, etc.). . Moreover, customer data and vector values are not limited to a one-to-one relationship in which the same vector value is obtained from the same data, but a many-to-one relationship in which the same vector value is obtained from different data. There is also a many-to-many relationship in which different vector values are obtained depending on the combination of data even if the same data is included. Furthermore, when different AIs are distributed to different companies, the meaning of the vector value itself may differ depending on the company. Therefore, one vector value is not necessarily based on the same data. Also, what the mother server 100 (server side) needs is the vector value, not the customer data that is the basis (source) of the vector value.
また、匿名情報のベクトル値及びそれが意味する内容を定義するのはAIを配布するマザーサーバ100(サーバ側)であるため、各企業及び第三者が匿名情報のベクトル値だけを見ても、そのベクトル値が何を意味しているのか理解できないので、仮に匿名情報が流出したとしても、顧客データが漏洩することはないため安全である。なお、ベクトルは作成する度に同一ユーザのベクトルであっても異なるベクトルとなり、毎回同一とは限らない。 In addition, since it is the mother server 100 (server side) that distributes AI that defines the vector value of anonymous information and the content that it means, even if each company or third party sees only the vector value of anonymous information, , it is not possible to understand what the vector values mean, so even if anonymous information leaks out, customer data will not be leaked, so it is safe. Note that each time a vector is created, even if it is for the same user, it becomes a different vector, and the vector is not necessarily the same each time.
続いて、マザーサーバ100は、各企業のクライアント端末10から収集した全ての匿名情報を用いて目的設定データを正解として学習する(ステップS3)。例えば、マザーサーバ100は、データ圏に参加する全企業の全顧客の匿名情報を用いて機械学習を行い、顧客評価モデルを生成する。このとき、マザーサーバ100は、全ての匿名情報に加えて、さらにマザー側で独自に取得した顧客データ(マザー側データ)を用いて学習してもよい。なお、マザーサーバ100は、AIにより、マザー側データを匿名化(ベクトル化)した匿名情報を生成してもよい。
Subsequently, the
続いて、マザーサーバ100は、学習結果から企業ごとに推論を行う(ステップS4)。例えば、マザーサーバ100は、各企業のクライアント端末10から収集した全ての匿名情報を用いて学習した結果に基づき、特定企業の特定商品を購入する可能性がある顧客のリストを生成する。このとき、マザーサーバ100は、特定企業からの匿名情報を顧客評価モデルに入力し、出力として特定企業の特定商品を購入する可能性がある顧客のリストを取得してもよい。
Subsequently, the
続いて、マザーサーバ100は、ネットワークNを介して、各企業のクライアント端末10に対して、各企業に対応する推論の結果、及び推論の結果に基づく情報を提供する(ステップS5)。例えば、マザーサーバ100は、特定企業のクライアント端末10に対して、特定企業の特定商品を購入する可能性がある顧客のリストを提供する。
Subsequently, the
〔1-1.サーバ側でのAI学習〕
次に、図2を用いて、本実施形態に係るマザーサーバ100(サーバ側)でのAI学習について説明する。図2は、サーバ側でのAI学習の概要を示す説明図である。
[1-1. AI learning on the server side]
Next, AI learning in the mother server 100 (server side) according to this embodiment will be described with reference to FIG. FIG. 2 is an explanatory diagram showing an outline of AI learning on the server side.
図2に示すように、データ圏は、クライアント側のCDP(Customer Data Platform)と、マザー側のサーバという構成である。すなわち、各企業のクライアント端末10と、マザーサーバ100という構成である。
As shown in FIG. 2, the data area consists of a CDP (Customer Data Platform) on the client side and a server on the mother side. That is, the configuration consists of the
クライアント側のCDPにおいて、各企業のクライアント端末10は、AIにより、自社が持つ顧客データ(1st partyデータ)をベクトルに変換(ベクトル化)した匿名情報を生成する。このとき、各企業のクライアント端末10は、匿名情報として、自社のID毎のベクトルを生成する。すなわち、各企業の顧客IDとベクトルデータとの組合せを生成する。
In the CDP on the client side, the
なお、各企業が持つ顧客データは、企業ごとに異なる。例えば、A社は、「来店」、「購入」、「商談時の要望・会話」等の情報を顧客データとして収集する。B社は、「商品購入」、「アンケート回答」、「WEB広告接触」等の情報を顧客データとして収集する。C社は、「検索」、「ニュース接触」、「購買商品」等の情報を顧客データとして収集する。但し、これらは一例に過ぎない。 The customer data held by each company differs from company to company. For example, Company A collects information such as "visit", "purchase", and "requests/conversations during business negotiations" as customer data. Company B collects information such as "product purchase", "questionnaire response", and "web advertisement exposure" as customer data. Company C collects information such as "search", "news contact", and "purchased products" as customer data. However, these are only examples.
そして、各企業のクライアント端末10は、マザーサーバ100からの要求に応じて、又は自発的に、生成された匿名情報を送信データとしてマザーサーバ100(サーバ側)に送信する。なお、各企業のクライアント端末10は、セキュリティ上、生成された匿名情報をさらに暗号化してマザーサーバ100(サーバ側)に送信してもよい。データを暗号化して伝送すること自体は、技術常識の範疇で可能である。また、トンネリング(tunneling)により、マザー側とクライアント側との間に閉じられた仮想的な直結回線を確立してもよい。例えば、マザー側とクライアント側との間にVPN(Virtual Private Network)を構築してもよい。
Then, the
このとき、各企業のクライアント端末10は、匿名情報として、共通IDと紐づけたベクトルデータのみ送信する。共通IDは、データ圏で共通の顧客IDである。共通IDと紐づけたベクトルデータとは、データ圏へのデータ供出を許諾した顧客のベクトルデータである。全体を通して、マザー側とクライアント側との間の連携は、共通ID連携を許諾したユーザのみのベクトルデータのやりとりである。なお、送信するのは、あくまでベクトルデータ(匿名情報)であり、顧客データ自体の送信はない。ベクトル化したものであっても個人情報と解釈される場合もあるが、生の個人情報データと比較すると圧倒的に安全性が高い。共通IDにより同一人物であることはわかるが、居住地・年齢・性別等の個人に関する情報等は含まれていないか匿名化(ベクトル化)されていて判別できない。
At this time, the
また、全顧客のベクトルデータについて共通IDとの紐づけをしなくてもよい。例えば、個々の顧客にデータ圏内でのデータの利用許諾をとらず、企業がデータ圏に参加しただけであれば、共通IDと顧客のベクトルデータとの紐づけをしなくてもよい。 Moreover, it is not necessary to associate the vector data of all customers with the common ID. For example, if a company only participates in the data zone without obtaining individual customers' permission to use data within the data zone, there is no need to associate the common ID with the customer's vector data.
本実施形態では、共通IDでのID統合(ID Connect)を「任意」とする。すなわち、共通IDでのID統合(ID Connect)を「しない」顧客がいても、全体としては機能するような設計とする。 In this embodiment, the ID integration (ID Connect) with the common ID is set to "arbitrary". In other words, even if there is a customer who "does not" integrate IDs (ID Connect) with a common ID, the design should function as a whole.
また、データ圏に加盟した企業から、「生の顧客データ(個人情報)をマザーサーバに送信しない」で、目的を達成できるような設計とする。すなわち、各企業が有する生の顧客データ(個人情報)は、マザーサーバ100には送信されない。各企業が有する生の顧客データ(個人情報)は、匿名化(ベクトル化)され、IDとセットでマザーサーバ100に送信される。
In addition, it will be designed so that the purpose can be achieved by not sending raw customer data (personal information) to the mother server from companies that have joined the data zone. That is, raw customer data (personal information) owned by each company is not sent to the
また、自社データのみを使って、自社顧客データを匿名化(ベクトル化)する分散側AIを導入することで、自社のデータを質、量ともに多く出さないと、自社のターゲティング精度が上がらない仕組みとする。これにより、自社データを出さずに他社データのみ利用するフリーライドを防ぐ。 In addition, by introducing decentralized AI that anonymizes (vectorizes) the company's customer data using only the company's own data, the company's targeting accuracy does not improve unless the company's data is produced in both quality and quantity. and This prevents free rides that use only other companies' data without releasing their own data.
なお、自社の顧客データの量と質が多いほど、自社が受けるメリットが大きくなる。すなわち、顧客単位でデータ圏内でのデータの利用許諾をとり、共通IDと紐づけしたベクトルデータが多いほど精度が向上する。 It should be noted that the greater the quantity and quality of the company's customer data, the greater the benefits it receives. In other words, the more vector data linked with the common ID, the higher the accuracy, as the use permission for data within the data area is obtained on a customer-by-customer basis.
各顧客は、「自身に関する顧客データが匿名化(ベクトル化)されデータ圏内で利用されること」を許諾する。なお、各企業は、各顧客の許諾に対してインセンティブや特典を与えてもよい。例えば、各顧客が許諾した場合、データ圏内の各企業からお得なクーポン等が送られてくる。また、許諾した顧客には、データ圏内での活動(データ圏参加企業の製品購入/サービス利用、広告接触、アンケート回答等)等に応じて報酬(リワード)が発行される。 Each customer consents to "anonymization (vectorization) of customer data concerning itself and use within the data area". In addition, each company may give an incentive or privilege to each customer's approval. For example, if each customer approves, a discount coupon or the like is sent from each company within the data area. In addition, licensed customers will be issued rewards according to their activities within the data zone (purchasing products/services of companies participating in the data zone, contacting advertisements, answering questionnaires, etc.).
マザーサーバ100(サーバ側)は、各企業のCDPから過去の製品購入者ID一覧を正解データとして設定してAI学習を実施する。例えば、A社が自社の製品Xの購入確率の高い顧客のリストである製品購入確率リスト(レコメンドリスト)を作りたい場合、マザーサーバ100(サーバ側)は、A社のCDPから過去の製品Xの購入者のID一覧を正解データとして目的設定してAI学習を実施する。 The mother server 100 (server side) implements AI learning by setting a list of past product purchaser IDs from each company's CDP as correct data. For example, when company A wants to create a product purchase probability list (recommendation list), which is a list of customers who are likely to purchase product X of its own company, the mother server 100 (server side) obtains past product X from company A's CDP. AI learning is performed by setting the purchaser's ID list as correct data as the purpose.
ここで、図3を参照して、キャンペーン目的から学習する事例について説明する。図3は、キャンペーン目的から学習する事例を示す説明図である。なお、AI学習は、キャンペーン毎に実施するものとする。図3に示すように、マザーサーバ100(サーバ側)は、A社のデータから過去の製品Xの購入者のID一覧を目的設定してAI学習を実施する。 Now, with reference to FIG. 3, an example of learning from campaign objectives will be described. FIG. 3 is an explanatory diagram showing an example of learning from the campaign purpose. In addition, AI learning shall be implemented for every campaign. As shown in FIG. 3, the mother server 100 (server side) implements AI learning by setting a list of IDs of past purchasers of product X from company A's data.
このとき、マザーサーバ100(サーバ側)は、各企業の匿名情報とは別に自身が保有する顧客データ(マザー側のデータ)も正解データに加味して設定してもよい。例えば、マザーサーバ100(サーバ側)は、A社が自動車メーカーで、製品Xが特定の車両である場合、マザー側のデータとして、「ゴルフに興味がある人」の顧客データを正解データに加味して設定してもよい。 At this time, the mother server 100 (server side) may set customer data (mother side data) owned by itself separately from each company's anonymous information in consideration of the correct data. For example, if company A is an automobile manufacturer and product X is a specific vehicle, the mother server 100 (server side) adds customer data of "persons interested in golf" to correct data as mother side data. can be set as
そして、マザーサーバ100(サーバ側)は、正解データを与えた当該企業の顧客データの全レコードと、当該企業の顧客データの全レコードのうち共通IDで紐づいている他の加盟企業の全レコードとを学習データとして、AI学習を実施する。 Then, the mother server 100 (server side) provides all records of the customer data of the company to which the correct data is given, and all records of other member companies linked by the common ID among all records of the customer data of the company. is used as learning data, AI learning is performed.
〔1-2.顧客データのベクトル化〕
次に、図4を用いて、本実施形態に係る顧客データのベクトル化について説明する。図4は、顧客データのベクトル化の概要を示す説明図である。本実施形態では、各企業の各顧客の個人情報をベクトル化することで、個人情報ではなくし、しかし、顧客特性を処理できるようにする。
[1-2. Vectorization of customer data]
Next, vectorization of customer data according to this embodiment will be described with reference to FIG. FIG. 4 is an explanatory diagram showing an outline of vectorization of customer data. In this embodiment, the personal information of each customer of each company is vectorized so that it is not personal information, but the customer characteristics can be processed.
図4に示すように、例えば、A社が自動車メーカーで、製品Xが特定の車両である場合、A社のクライアント端末10は、顧客データとして、購入商品、来店・会話内容、問い合わせ・カタログ請求、オウンドWEBログ、広告接触、販促接触等の情報を収集する。
As shown in FIG. 4, for example, when company A is an automobile manufacturer and product X is a specific vehicle, the
また、A社のクライアント端末10は、顧客データのベクトル化の手法として、下記の(1)、(2)のうちいずれかの手法を用いる。
In addition, the
(1)A社のクライアント端末10は、顧客が同時に商談や購入する商品(車だと車種)は目的が近しい商品と仮定して、当該商品をベクトル化する。次に、商品ベクトルを用いて、顧客2名をランダムに抽出し、商品ベクトルの近遠を正例、負例として学習する。
(1) The
(2)A社のクライアント端末10は、BERT(Bidirectional Encoder Representations from Transformers)モデルで穴埋め問題的に学習し、エンベディング(Embedding)層から取得する。なお、BERTは、自然言語処理(NLP:Natural Language Processing)の事前学習用ためのTransformerベースの機械学習手法である。実際には、BERTに限らず、他の自然言語処理であってもよい。例えば、Word2Vec等の分散表現(単語ベクトル)であってもよい。分散表現とは、文字・単語をベクトル空間に埋め込み、その空間上のひとつの点として捉えることであり、単語埋め込み(Word Embedding)とも呼ばれる。
(2) The
図4に、A社の顧客データの匿名化(ベクトル化)の例を示す。ここでは、説明の簡略化のため、ベクトルの次元を2次元で表現し、ベクトルの近遠により、ベクトル群をいくつかのセグメントに分類する。例えば、「高級スポーツカー指向」、「高級SUV指向」、「低価格帯指向」等のセグメントに分類する。 FIG. 4 shows an example of anonymization (vectorization) of company A's customer data. Here, for simplification of explanation, the dimension of the vector is expressed in two dimensions, and the vector group is classified into several segments according to the nearness and farness of the vector. For example, they are classified into segments such as "luxury sports car oriented", "luxury SUV oriented", and "low price range oriented".
なお、図4に示したA社の顧客データの匿名化(ベクトル化)の例では、ベクトルの次元を2次元で表現しているが、実際のベクトルの次元は2次元に限らず、100次元等であらゆる要素が加味された多次元により各顧客を表現する。 In the example of the anonymization (vectorization) of customer data of company A shown in FIG. Each customer is expressed in a multi-dimensional manner with all elements taken into consideration.
〔1-3.サーバ側での推論〕
次に、図5及び図6を用いて、本実施形態に係るサーバ側での推論について説明する。図5は、サーバ側での推論の概要を示す説明図である。図6は、サーバ側での推論を簡略化した模式図である。なお、サーバ側での推論は、サーバ側でのAI学習の後であってもよいし、同時であってもよい。
[1-3. Inference on the server side]
Next, inference on the server side according to this embodiment will be described with reference to FIGS. 5 and 6. FIG. FIG. 5 is an explanatory diagram showing an outline of inference on the server side. FIG. 6 is a schematic diagram that simplifies inference on the server side. Inference on the server side may be performed after or at the same time as AI learning on the server side.
図5に示すように、マザーサーバ100(サーバ側)は、各企業の顧客データのベクトル(匿名情報)を、マザー側のAIに投入し、各企業の各顧客の製品購入確率リスト(レコメンドリスト)を取得する。 As shown in FIG. 5, the mother server 100 (server side) inputs the customer data vector (anonymous information) of each company to AI on the mother side, and creates a product purchase probability list (recommendation list) for each customer of each company. ).
このとき、マザーサーバ100(サーバ側)は、特定企業の顧客のみ対象とした特定企業のIDによる特定製品の購入確率リスト(例えば製品X購入確率A社IDリスト)と、全企業の顧客を対象とした共通IDによる特定製品の購入確率リスト(例えば製品X購入確率共通IDリスト)とを取得する。 At this time, the mother server 100 (server side) provides a purchase probability list of a specific product by ID of a specific company (for example, product X purchase probability A company ID list) for only customers of a specific company, and a list for customers of all companies. A list of purchase probabilities of specific products (for example, a list of common IDs for product X purchase probabilities) based on common IDs such as product X is obtained.
そして、マザーサーバ100(サーバ側)は、特定企業の顧客のみを対象とした特定企業のIDによる特定製品の購入確率リストを、当該特定企業のクライアント端末10にのみ送信する。このとき、特定企業のクライアント端末10は、特定企業の顧客のみを対象とした特定企業のIDによる特定製品の購入確率リストを基に、後述するベクトル近傍顧客拡張の処理を実施する。
Then, the mother server 100 (server side) transmits the purchase probability list of the specific product by the ID of the specific company targeted only for the customers of the specific company only to the
また、マザーサーバ100(サーバ側)は、全企業の顧客を対象とした共通IDによる特定製品の購入確率リストを基に、全企業の顧客を対象とした広告配信やSNSでのクーポン券配布等をすることができる。 In addition, the mother server 100 (server side) distributes advertisements to customers of all companies, distributes coupons on SNS, etc., based on the purchase probability list of a specific product with a common ID for customers of all companies. can do
図6に示すように、A社が自社の製品Xを購入してくれる確率の高い顧客のリストを所望している場合、マザーサーバ100(サーバ側)は、過去にA社の製品Xを購入した顧客のうち、共通ID連携を許諾している顧客の情報を正解データとして、マザー側のAIに投入し、A社の製品Xの購入確率リスト(レコメンドリスト)を取得する。そして、マザーサーバ100(サーバ側)は、製品Xの購入確率リストを基に、広告配信やSNSでのクーポン券配布等を実施する。また、マザーサーバ100(サーバ側)は、A社のCRM(Customer Relationship Management)にリストを戻して、A社のCDP内等でベクトル近傍拡張をする場合もあり、ベクトル近傍拡張をした後、A社のCRMでマーケティング活動を行うことを可能にする。 As shown in FIG. 6, when Company A desires a list of customers with a high probability of purchasing Company A's product X, the mother server 100 (on the server side) has purchased Company A's product X in the past. Among the customers who have accepted the common ID, the information of the customers who have approved the shared ID cooperation is input to AI on the mother side as correct data, and a purchase probability list (recommendation list) of product X of company A is acquired. Then, the mother server 100 (server side) carries out advertisement distribution, coupon distribution on SNS, etc., based on the purchase probability list of product X. FIG. In addition, the mother server 100 (server side) may return the list to Company A's CRM (Customer Relationship Management) and perform vector neighborhood expansion in Company A's CDP or the like. Allows you to conduct marketing activities in your company's CRM.
〔1-4.ベクトル近傍顧客拡張〕
次に、図7を用いて、本実施形態に係るベクトル近傍顧客拡張について説明する。図7は、ベクトル近傍顧客拡張の概要を示す説明図である。
[1-4. Vector Neighborhood Customer Extension]
Next, vector neighborhood customer expansion according to the present embodiment will be described with reference to FIG. FIG. 7 is an explanatory diagram showing an outline of vector neighborhood customer extension.
マザーサーバ100(サーバ側)で正解データを推論する際には、マザー側にあるベクトルデータ(ID Connectされた顧客のベクトルデータ)のみを元にするので、クライアント側CDPに戻した際に、そこで自社内のデータのベクトルで近傍拡張を行う。 When inferring the correct data on the mother server 100 (server side), only vector data on the mother side (vector data of customers who are ID Connected) is used as the basis, so when returning to the client side CDP, Perform neighborhood expansion on vectors of in-house data.
例えば、A社のクライアント端末10は、A社の顧客データから、顧客である利用者U1、U2が製品Xを購入する候補だと仮定する。そして、A社のクライアント端末10は、A社のCDP内でベクトル化の学習処理を実行する(図7の「A社 顧客ベクトル」参照)。
For example, the
このとき、マザーサーバ100(サーバ側)は、利用者U1~U4のうち、共通IDでのID統合(ID Connect)をしている利用者U1、U4のデータを活用してマザー側のAIで学習する。ここでは、利用者U1~U4を例に説明しているが、実際には、他社の顧客(ID Connectされたユーザ)も含めデータ数はもっと膨大である。 At this time, the mother server 100 (server side) utilizes the data of the users U1 and U4, among the users U1 to U4, who are performing ID integration (ID Connect) with the common ID, and uses the AI on the mother side to learn. Here, users U1 to U4 are explained as an example, but in reality, the number of data including other companies' customers (ID Connected users) is much larger.
マザーサーバ100(サーバ側)は、マザー側の全企業の全顧客のベクトルから、A社の製品Xの購入確率が高い人を推論する。このとき、A社のデータ内からは利用者U1が抽出される(利用者U2はID Connectしてない)。 The mother server 100 (server side) infers a person who has a high probability of purchasing product X of company A from the vectors of all customers of all companies on the mother side. At this time, user U1 is extracted from the data of company A (user U2 is not ID-connected).
そして、マザーサーバ100(サーバ側)は、A社のCDPに製品X購入候補としてU1をフィードバックする。そこで、A社のクライアント端末10は、マザー側からのフィードバックに応じて、ベクトル近傍顧客拡張を行う。具体的には、A社のクライアント端末10は、図7の「A社 顧客ベクトル」に示すように、A社内の顧客データのベクトルでは、利用者U1の近傍には利用者U2が存在するので、利用者U2も製品Xの購入候補とする。
Then, the mother server 100 (server side) feeds back U1 to the CDP of company A as a product X purchase candidate. Therefore, the
〔1-5.1stPartyデータ圏構想〕
上記のように、各企業は、1stPartyデータ圏構想に加盟すると、極めて高精度のパーソナルマーケテイングが可能となる。図8は、1stPartyデータ圏構想のイメージを示す概念図である。
[1-5. 1stParty data zone concept]
As mentioned above, when each company joins the 1stParty data zone concept, extremely high-precision personal marketing becomes possible. FIG. 8 is a conceptual diagram showing an image of the 1stParty data zone concept.
例えば、データ圏に加盟する全企業の共通ID Connectを承諾した全顧客データを学習したAIでターゲティングをすることができる(高精度のターゲティング)。 For example, targeting can be done with AI that has learned all customer data that has accepted the common ID Connect of all companies that join the data zone (high-precision targeting).
また、各企業の顧客データ自体は、他社やマザー側に渡らない。各企業の顧客データは数値の羅列に変換(ベクトル化)された匿名情報の状態で、マザー側のAIで学習される(自社の顧客データ自体は出さないでOK)。 In addition, the customer data of each company will not be passed on to other companies or the mother side. The customer data of each company is converted into a list of numbers (vectorized), and in the state of anonymous information, AI is learned on the mother side (the company's customer data itself is OK).
また、自社のベクトルデータ(自社の顧客データに基づく匿名情報)の量と質が高いほど、自社のターゲティング精度が上がる。そのため、1stPartyデータ圏に提供した自社のベクトルデータの件数が多くなるほど精度が向上する。反対に、自社のベクトルデータの件数が少ないほど精度は低くなる(フリーライドできない仕組み)。 Also, the higher the quantity and quality of the company's vector data (anonymous information based on the company's customer data), the higher the company's targeting accuracy. Therefore, the more the company's vector data provided to the 1stParty data zone, the higher the accuracy. Conversely, the smaller the number of company vector data, the lower the accuracy (a mechanism that cannot be free-rided).
仮に自社のベクトルデータを全く提供しなければ、データ圏には内容のわからない他社のベクトルデータが存在するだけであり、自社の顧客データや自社のベクトルデータとの関係は不明である。自社のベクトルデータを提供することで、自社のベクトルデータと他社のベクトルデータとを連結させてターゲティングをすることができる。また、自社のベクトルデータの内容や件数が増えるほど、他社のベクトルデータとのつながりが増え、データ圏からより多くの情報を得ることができる。 If you do not provide your company's vector data at all, there will only be vector data of other companies whose content is unknown in the data area, and the relationship between your company's customer data and your company's vector data is unknown. By providing your company's vector data, you can target by linking your company's vector data with the vector data of other companies. In addition, the more the content and number of the company's vector data increases, the more connections there are with the vector data of other companies, and the more information can be obtained from the data area.
自社のターゲティング精度を向上させるため、各企業が自社のベクトルデータを積極的に提供することで、大量のベクトルデータが自然とマザー側に集まるという好循環が生まれる。 In order to improve their own targeting accuracy, each company actively provides its own vector data, creating a virtuous cycle in which a large amount of vector data naturally gathers on the mother side.
本実施形態によれば、各企業が生の個人情報を出すことなく、データ圏連携、ターゲティング精度を向上できる。また、フリーライドできない仕組みがあるので全体としての精度が相乗効果的に向上していく。また、各企業から見たときに、データ圏に乗っかっても、自社のデータや状況が他社に見られない(例えば、A社からみて自社の店舗に顧客がどれくらい訪問しているか等を、B社には知られない)。また、マザー側が多数のサービスを展開している場合(ポータルサイトなど)、広告配信やSNSなど、マスマーケティングにも使える。 According to this embodiment, data area cooperation and targeting accuracy can be improved without each company providing raw personal information. In addition, since there is a mechanism that prevents free riding, the accuracy as a whole improves synergistically. In addition, when viewed from the perspective of each company, even if it is in the data zone, other companies cannot see their company's data and situation (for example, from the perspective of company A, how many customers have visited their own store, etc. unknown to the company). In addition, if the mother side is developing a large number of services (portal site, etc.), it can also be used for mass marketing such as advertisement distribution and SNS.
〔2.マザーサーバの構成例〕
次に、図9を用いて、実施形態に係るマザーサーバ100の構成について説明する。図9は、実施形態に係るマザーサーバ100の構成例を示す図である。図9に示すように、マザーサーバ100は、通信部110と、記憶部120と、制御部130とを有する。
[2. Mother server configuration example]
Next, the configuration of the
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。また、通信部110は、ネットワークNと有線又は無線で接続される。
(Communication unit 110)
The communication unit 110 is realized by, for example, a NIC (Network Interface Card) or the like. Also, the communication unit 110 is connected to the network N by wire or wirelessly.
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置によって実現される。図9に示すように、記憶部120は、利用者情報データベース121と、履歴情報データベース122と、匿名情報データベース123とを有する。
(storage unit 120)
The
(利用者情報データベース121)
利用者情報データベース121は、マザーサーバ100が独自に収集した利用者U(ユーザ)に関する利用者情報を記憶する。例えば、利用者情報データベース121は、利用者Uの属性等の種々の情報を記憶する。図10は、利用者情報データベース121の一例を示す図である。図10に示した例では、利用者情報データベース121は、「利用者ID(Identifier)」、「年齢」、「性別」、「自宅」、「勤務地」、「興味」といった項目を有する。
(User information database 121)
The
「利用者ID」は、利用者Uを識別するための識別情報を示す。なお、「利用者ID」は、利用者Uの連絡先(電話番号、メールアドレス等)であってもよいし、利用者Uのクライアント端末10を識別するための識別情報であってもよい。
“User ID” indicates identification information for identifying the user U. The “user ID” may be the user U's contact information (telephone number, e-mail address, etc.), or may be identification information for identifying the user U's
また、「年齢」は、利用者IDにより識別される利用者Uの年齢を示す。なお、「年齢」は、利用者Uの具体的な年齢(例えば35歳など)を示す情報であってもよいし、利用者Uの年代(例えば30代など)を示す情報であってもよい。あるいは、「年齢」は、利用者Uの生年月日を示す情報であってもよいし、利用者Uの世代(例えば80年代生まれなど)を示す情報であってもよい。また、「性別」は、利用者IDにより識別される利用者Uの性別を示す。 "Age" indicates the age of the user U identified by the user ID. Note that the "age" may be information indicating a specific age of the user U (for example, 35 years old) or information indicating the age of the user U (for example, 30's). . Alternatively, the "age" may be information indicating the date of birth of the user U, or information indicating the generation of the user U (for example, born in the 80's). "Gender" indicates the gender of the user U identified by the user ID.
また、「自宅」は、利用者IDにより識別される利用者Uの自宅の位置情報を示す。なお、図10に示す例では、「自宅」は、「LC11」といった抽象的な符号を図示するが、緯度経度情報等であってもよい。また、例えば、「自宅」は、地域名や住所であってもよい。 "Home" indicates location information of the home of the user U identified by the user ID. In the example shown in FIG. 10, "home" is represented by an abstract code such as "LC11", but may be latitude/longitude information or the like. Also, for example, "home" may be an area name or an address.
また、「勤務地」は、利用者IDにより識別される利用者Uの勤務地(学生の場合は学校)の位置情報を示す。なお、図10に示す例では、「勤務地」は、「LC12」といった抽象的な符号を図示するが、緯度経度情報等であってもよい。また、例えば、「勤務地」は、地域名や住所であってもよい。 "Place of work" indicates location information of the place of work (school in the case of a student) of the user U identified by the user ID. In the example shown in FIG. 10, the "place of work" is illustrated as an abstract code such as "LC12", but may be latitude/longitude information or the like. Also, for example, the "place of work" may be an area name or an address.
また、「興味」は、利用者IDにより識別される利用者Uの興味を示す。すなわち、「興味」は、利用者IDにより識別される利用者Uが関心の高い対象を示す。例えば、「興味」は、利用者Uが検索エンジンに入力して検索した検索クエリ(キーワード)等であってもよい。なお、図10に示す例では、「興味」は、各利用者Uに1つずつ図示するが、複数であってもよい。 "Interest" indicates the interest of the user U identified by the user ID. That is, "interest" indicates an object in which the user U identified by the user ID is highly interested. For example, the "interest" may be a search query (keyword) that the user U has entered into a search engine and searched for. In the example shown in FIG. 10, one "interest" is shown for each user U, but there may be more than one.
例えば、図10に示す例において、利用者ID「U1」により識別される利用者Uの年齢は、「20代」であり、性別は、「男性」であることを示す。また、例えば、利用者ID「U1」により識別される利用者Uは、自宅が「LC11」であることを示す。また、例えば、利用者ID「U1」により識別される利用者Uは、勤務地が「LC12」であることを示す。また、例えば、利用者ID「U1」により識別される利用者Uは、「スポーツ」に興味があることを示す。 For example, in the example shown in FIG. 10, the age of the user U identified by the user ID "U1" is "twenties" and the gender is "male". Also, for example, the user U identified by the user ID "U1" indicates that the home is "LC11". Also, for example, the user U identified by the user ID "U1" indicates that the place of work is "LC12". Also, for example, the user U identified by the user ID "U1" indicates that he is interested in "sports".
ここで、図10に示す例では、「U1」、「LC11」及び「LC12」といった抽象的な値を用いて図示するが、「U1」、「LC11」及び「LC12」には、具体的な文字列や数値等の情報が記憶されるものとする。以下、他の情報に関する図においても、抽象的な値を図示する場合がある。 Here, in the example shown in FIG. 10, abstract values such as “U1”, “LC11” and “LC12” are used, but “U1”, “LC11” and “LC12” are concrete values. It is assumed that information such as character strings and numerical values is stored. Hereinafter, abstract values may also be illustrated in diagrams relating to other information.
なお、利用者情報データベース121は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、利用者情報データベース121は、利用者Uのクライアント端末10に関する各種情報を記憶してもよい。また、利用者情報データベース121は、利用者Uのデモグラフィック(人口統計学的属性)、サイコグラフィック(心理学的属性)、ジオグラフィック(地理学的属性)、ベヘイビオラル(行動学的属性)等の属性に関する情報を記憶してもよい。例えば、利用者情報データベース121は、氏名、家族構成、出身地(地元)、職業、職位、収入、資格、居住形態(戸建、マンション等)、車の有無、通学・通勤時間、通学・通勤経路、定期券区間(駅、路線等)、利用頻度の高い駅(自宅・勤務地の最寄駅以外)、習い事(場所、時間帯等)、趣味、興味、ライフスタイル等の情報を記憶してもよい。
The
(履歴情報データベース122)
履歴情報データベース122は、マザーサーバ100が独自に収集した利用者Uの行動を示す履歴情報(ログデータ)に関する各種情報を記憶する。図11は、履歴情報データベース122の一例を示す図である。図11に示した例では、履歴情報データベース122は、「利用者ID」、「位置履歴」、「検索履歴」、「閲覧履歴」、「購買履歴」、「投稿履歴」といった項目を有する。
(History information database 122)
The
「利用者ID」は、利用者Uを識別するための識別情報を示す。また、「位置履歴」は、利用者Uの位置や移動の履歴である位置履歴を示す。また、「検索履歴」は、利用者Uが入力した検索クエリの履歴である検索履歴を示す。また、「閲覧履歴」は、利用者Uが閲覧したコンテンツの履歴である閲覧履歴を示す。また、「購買履歴」は、利用者Uによる購買の履歴である購買履歴を示す。また、「投稿履歴」は、利用者Uによる投稿の履歴である投稿履歴を示す。なお、「投稿履歴」は、利用者Uの所有物に関する質問を含んでいてもよい。 “User ID” indicates identification information for identifying the user U. "Position history" indicates a position history, which is a history of the user's U position and movement. Also, "search history" indicates a search history that is a history of search queries input by the user U. FIG. "Browsing history" indicates a browsing history that is a history of contents browsed by the user U. FIG. "Purchase history" indicates the purchase history of the user U's purchases. In addition, “posting history” indicates a posting history that is a history of posts by the user U. FIG. In addition, the “posting history” may include questions about user U's property.
例えば、図11に示す例において、利用者ID「U1」により識別される利用者Uは、「位置履歴#1」の通りに移動し、「検索履歴#1」の通りに検索し、「閲覧履歴#1」の通りにコンテンツを閲覧し、「購買履歴#1」の通りに所定の店舗等で所定の商品等を購入し、「投稿履歴」の通りに投稿したことを示す。
For example, in the example shown in FIG. 11, the user U identified by the user ID "U1" moves along the "
ここで、図11に示す例では、「U1」、「位置履歴#1」、「検索履歴#1」、「閲覧履歴#1」、「購買履歴#1」及び「投稿履歴#1」といった抽象的な値を用いて図示するが、「U1」、「位置履歴#1」、「検索履歴#1」、「閲覧履歴#1」、「購買履歴#1」及び「投稿履歴#1」には、具体的な文字列や数値等の情報が記憶されるものとする。
Here, in the example shown in FIG. 11, abstract history such as "U1", "
なお、履歴情報データベース122は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、履歴情報データベース122は、利用者Uの所定のサービスの利用履歴等を記憶してもよい。また、履歴情報データベース122は、利用者Uの実店舗の来店履歴又は施設の訪問履歴等を記憶してもよい。また、履歴情報データベース122は、利用者Uのクライアント端末10を用いた決済(電子決済)での決済履歴等を記憶してもよい。
Note that the
(匿名情報データベース123)
匿名情報データベース123は、利用者Uの匿名情報(ベクトルデータ)に関する各種情報を記憶する。図12は、匿名情報データベース123の一例を示す図である。図12に示した例では、匿名情報データベース123は、「共通ID」、「企業別ID」、「企業」、「ベクトル」、「推論」といった項目を有する。
(Anonymous information database 123)
The
「共通ID」は、データ圏で共通の顧客IDを示す。また、「企業別ID」は、企業ごとの独自の顧客IDを示す。また、「企業」は、当該匿名情報(ベクトルデータ)を提供した企業を示す。 "Common ID" indicates a common customer ID in the data area. "Company ID" indicates a unique customer ID for each company. "Company" indicates the company that provided the anonymous information (vector data).
また、「ベクトル」は、企業ごとの顧客データを匿名化(ベクトル化)したベクトル値を示す。「ベクトル」は、多次元であってもよい。すなわち、「ベクトル」は、複数のベクトル値の集合であってもよい。 "Vector" indicates a vector value obtained by anonymizing (vectorizing) customer data for each company. A "vector" may be multi-dimensional. That is, a "vector" may be a set of vector values.
また、「推論」は、ベクトルに基づく推論の結果を示す。例えば、「推論」は、各企業の各顧客の製品購入確率リスト(レコメンドリスト)であってもよい。なお、「推論」は、企業ごと(企業別ID毎)の推論の結果に限らず、全企業に共通(共通ID)の推論の結果も含まれる。 Also, "inference" indicates the result of inference based on vectors. For example, the “inference” may be a product purchase probability list (recommendation list) of each customer of each company. Note that "inference" is not limited to the result of inference for each company (for each company ID), but also includes the result of inference common to all companies (common ID).
例えば、図12に示す例において、共通ID「U1」により識別される利用者Uは、企業別ID「U1A」により「A社」の顧客データで管理されており、顧客データを匿名化(ベクトル化)した「ベクトルA1」に基づいて「推論A1」が得られることを示す。 For example, in the example shown in FIG. 12, the user U identified by the common ID "U1" is managed by the customer data of "A company" by the company ID "U1A", and the customer data is anonymized (vector It shows that the "inference A1" can be obtained based on the "vector A1" converted into
ここで、図12に示す例では、「U1」、「U1A」、「A社」、「ベクトルA1」及び「推論A1」といった抽象的な値を用いて図示するが、「U1」、「U1A」、「A社」、「ベクトルA1」及び「推論A1」には、具体的な文字列や数値等の情報が記憶されるものとする。以下、他の情報に関する図においても、抽象的な値を図示する場合がある。 Here, in the example shown in FIG. 12, abstract values such as "U1", "U1A", "A company", "vector A1" and "inference A1" are used. ”, “Company A”, “Vector A1”, and “Inference A1” store information such as specific character strings and numerical values. Hereinafter, abstract values may also be illustrated in diagrams relating to other information.
なお、匿名情報データベース123は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、匿名情報データベース123は、クライアント側及びマザー側のAIに関する情報等を記憶してもよい。また、匿名情報データベース123は、AI学習や推論の手法に関する情報等を記憶してもよい。
It should be noted that the
(制御部130)
図9に戻り、説明を続ける。制御部130は、コントローラ(Controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等によって、マザーサーバ100の内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAM等の記憶領域を作業領域として実行されることにより実現される。図9に示す例では、制御部130は、取得部131と、学習部132と、推定部133と、提供部134とを有する。
(control unit 130)
Returning to FIG. 9, the description is continued. The control unit 130 is a controller, and for example, a CPU (Central Processing Unit), an MPU (Micro Processing Unit), an ASIC (Application Specific Integrated Circuit), an FPGA (Field Programmable Gate Array), etc., controls the
(取得部131)
取得部131は、利用者Uにより入力された検索クエリを取得する。例えば、取得部131は、利用者Uが検索エンジン等に検索クエリを入力してキーワード検索を行った際に、通信部110を介して、当該検索クエリを取得する。
(Acquisition unit 131)
The
また、取得部131は、通信部110を介して、利用者Uに関する利用者情報を取得する。例えば、取得部131は、利用者Uのクライアント端末10から、利用者Uを示す識別情報(利用者ID等)や、利用者Uの位置情報、利用者Uの属性情報等を取得する。また、取得部131は、利用者Uのユーザ登録時に、利用者Uを示す識別情報や、利用者Uの属性情報等を取得してもよい。そして、取得部131は、利用者情報を、記憶部120の利用者情報データベース121に登録する。
The
また、取得部131は、通信部110を介して、利用者Uの行動を示す各種の履歴情報(ログデータ)を取得する。例えば、取得部131は、利用者Uのクライアント端末10から、あるいは利用者ID等に基づいて各種サーバ等から、利用者Uの行動を示す各種の履歴情報を取得する。そして、取得部131は、各種の履歴情報を、記憶部120の履歴情報データベース122に登録する。
In addition, the
また、取得部131は、通信部110を介して、データ圏に参加する各企業のクライアント端末10から、顧客データを匿名化(ベクトル化)した匿名情報を取得する。例えば、取得部131は、通信部110を介して、各企業のクライアント端末10から、クライアント側AIにより顧客データを匿名化(ベクトル化)した匿名情報を取得する。
Also, the
このとき、取得部131は、業種が異なる複数の企業の各々のクライアント端末10から、顧客データを匿名化(ベクトル化)した匿名情報を取得する。なお、複数の企業の中に、競合企業(同業他社)が含まれていてもよい。
At this time, the
なお、匿名情報は、顧客データをベクトル化した多次元のベクトルデータであり、顧客データを復元する手段が存在しない不可逆な情報である。すなわち、匿名情報は、顧客データを暗号化したデータではなく、復号できない。 Anonymous information is multidimensional vector data obtained by vectorizing customer data, and is irreversible information for which there is no means for restoring customer data. In other words, anonymous information is not encrypted customer data and cannot be decrypted.
(学習部132)
学習部132は、各企業のクライアント端末10からの匿名情報を用いてAIの機械学習をする。このとき、学習部132は、各企業のクライアント端末10からの匿名情報に、各企業とは別にマザーサーバ100が独自に収集した顧客データ(マザー側のデータ)を匿名化(ベクトル化)した匿名情報を加えてAIの機械学習をしてもよい。
(learning unit 132)
The learning unit 132 performs AI machine learning using anonymous information from the
また、学習部132は、AIの機械学習の際に、各企業のクライアント端末10からの匿名情報のうち目的に対応するデータを正解データとして特定企業の目的設定を行う。このとき、学習部132は、各企業のクライアント端末10からの匿名情報のうち目的に対応するデータに、各企業とは別にマザーサーバ100が独自に収集した顧客データを加味したデータを正解データとして特定企業の目的設定を行うようにしてもよい。また、マザー側AIもクライアント側AIと同様に顧客データを匿名化(匿名化(ベクトル化))して匿名情報に変換できる場合、マザーサーバ100が独自に収集した顧客データをそのままマザー側のAIに入力してもよい。
Also, the learning unit 132 sets the purpose of a specific company by using, as correct data, data corresponding to the purpose among the anonymous information from the
(推定部133)
推定部133は、学習部132による機械学習を経たAIにより、複数の企業のうち特定企業の目的に適合する顧客を推定する。
(Estimation unit 133)
The estimating
なお、推定部133は、複数の企業のうち、特定企業からの匿名情報の件数が多くなるほど、特定企業の目的に適合する顧客をより高精度に推定する。裏を返せば、特定企業からの匿名情報の件数が少ないほど、特定企業の目的に適合する顧客を推定する精度が低くなる。
It should be noted that the
また、推定部133は、複数の企業のうち特定企業の特定商品の購入確率が高い顧客を推定し、該顧客をリスト化した商品購入確率リストを生成する。
Also, the
(提供部134)
提供部134は、通信部110を介して、顧客データを匿名化(ベクトル化)するためのクライアント側AIを複数の企業の各々のクライアント端末10に提供する。
(Providing unit 134)
The providing
また、提供部134は、通信部110を介して、推定部133による推定結果に基づく情報を提供する。例えば、提供部134は、通信部110を介して、特定企業の特定商品の購入確率が高い顧客をリスト化した商品購入確率リストを特定企業のクライアント端末10に提供する。これにより、特定企業(クライアント側)が、マザー側からのリストに掲載された顧客に対して広告配信やクーポンの配布を実施して、その結果、新たな顧客を獲得し、新たな顧客に関する匿名情報をマザー側に提供することで、AIの推論の精度がさらに向上する。
Also, the providing
また、提供部134は、通信部110を介して、商品購入確率リストに掲載された顧客に対して、特定企業の特定商品に関する広告配信及びクーポン配布を行う。その結果、特定企業(クライアント側)が新たな顧客を獲得し、新たな顧客に関する匿名情報をマザー側に提供することで、AIの推論の精度がさらに向上する。
Also, the providing
〔3.処理手順〕
次に、図13を用いて実施形態に係るマザーサーバ100による処理手順について説明する。図13は、実施形態に係る処理手順を示すフローチャートである。なお、以下に示す処理手順は、マザーサーバ100の制御部130によって繰り返し実行される。
[3. Processing procedure]
Next, a processing procedure by the
図13に示すように、提供部134は、通信部110を介して、顧客データを匿名化(ベクトル化)するためのクライアント側AIを複数の企業の各々のクライアント端末10に提供する(ステップS101)。
As shown in FIG. 13, the providing
続いて、マザーサーバ100の取得部131は、通信部110を介して、データ圏に参加する各企業のクライアント端末10から、クライアント側AIにより顧客データを匿名化(ベクトル化)した匿名情報を取得する(ステップS102)。データ圏に参加する各企業には、競合や異業種の企業も含まれる。
Subsequently, the
続いて、マザーサーバ100の学習部132は、各企業のクライアント端末10からの匿名情報を用いてAIの機械学習をする(ステップS103)。このとき、学習部132は、各企業のクライアント端末10からの匿名情報と、各企業とは別にマザーサーバ100が独自に収集した顧客データ(マザー側のデータ)を匿名化(ベクトル化)した匿名情報戸を用いてAIの機械学習をする。
Subsequently, the learning unit 132 of the
続いて、マザーサーバ100の学習部132は、AIの機械学習の際に、各企業のクライアント端末10からの匿名情報のうち目的に対応するデータに、各企業とは別にマザーサーバ100が独自に収集した顧客データを加味したデータを正解データとして特定企業の目的設定を行う(ステップS104)。なお、マザー側の顧客データを加味するかは任意である。無論、各企業のクライアント端末10からの匿名情報のうち目的に対応するデータのみを正解データとしても問題ない。
Next, during AI machine learning, the learning unit 132 of the
続いて、マザーサーバ100の推定部133は、学習部132による機械学習を経たAIにより、複数の企業のうち、特定企業の目的に適合する顧客を推定する(ステップS105)。なお、推定部133は、複数の企業のうち、特定企業からの匿名情報の件数が多くなるほど、特定企業の目的に適合する顧客をより高精度に推定する。
Subsequently, the estimating
続いて、マザーサーバ100の推定部133は、特定企業の目的に適合する顧客のリストを生成する(ステップS106)。例えば、推定部133は、特定企業の特定商品の購入確率が高い顧客をリスト化した商品購入確率リストを生成する。
Subsequently, the
続いて、マザーサーバ100の提供部134は、通信部110を介して、特定企業の目的に適合する顧客のリストを特定企業のクライアント端末10に提供する(ステップS107)。例えば、提供部134は、通信部110を介して、特定企業の特定商品の購入確率が高い顧客をリスト化した商品購入確率リストを特定企業のクライアント端末10に提供する。
Subsequently, the
続いて、マザーサーバ100の提供部134は、通信部110を介して、特定企業の目的に適合する顧客に対して、特定企業の目的に沿った情報提供を行う(ステップS108)。例えば、提供部134は、通信部110を介して、商品購入確率リストに掲載された顧客に対して、特定商品に関する広告配信及びクーポン配布を行う。
Subsequently, the providing
〔4.変形例〕
上述したクライアント端末10及びマザーサーバ100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、実施形態の変形例について説明する。
[4. Modification]
The
(スタンドアローン)
上記の実施形態において、マザーサーバ100が実行している処理の一部又は全部は、実際には、クライアント端末10が実行してもよい。例えば、スタンドアローン(Stand-alone)で(クライアント端末10単体で)処理が完結してもよい。この場合、クライアント端末10に、上記の実施形態におけるマザーサーバ100の機能が備わっているものとする。また、上記の実施形態では、クライアント端末10はマザーサーバ100と連携しているため、利用者Uから見れば、マザーサーバ100の処理もクライアント端末10が実行しているように見える。すなわち、他の観点では、クライアント端末10は、マザーサーバ100を備えているともいえる。また、マザーサーバ100も、複数のクライアント端末10のうちの1台であってもよい。
(standalone)
In the above embodiment, part or all of the processing executed by the
(基底ベクトル)
また、上記の実施形態において、さらに匿名情報の匿名性を高めるために、マザーサーバ100は、基底ベクトルをあらかじめ決めておき、クライアント端末10から匿名情報として基底ベクトルとの差分データを収集するようにしてもよい。この場合、クライアント端末10からマザーサーバ100へ送信されるのはベクトルの差分データのみである。
(basis vector)
In the above-described embodiment, in order to further improve the anonymity of the anonymous information, the
(企業ごとに匿名情報の様式変更)
また、上記の実施形態において、企業ごとに匿名情報の様式を変えてもよい。例えば、匿名情報が多次元のベクトルデータである場合に、A社のベクトルデータと、B社のベクトルデータとで同じ次元に同種のデータが配置される必要はない。もし、同じ内容の情報であっても、A社のベクトルデータと、B社のベクトルデータとで、異なる次元に配置してもよい。各企業の多次元のベクトルデータのどの次元にどのデータが配置されているかは、マザー側のAIだけ認識できれば十分である。この場合、マザー側のAIは、学習や推論に先立って、各企業のベクトルデータの整合性を取る(整合させる)ようにしてもよい。例えば、各企業のベクトルデータを共通の様式のベクトルデータに変換して、学習や推論を実施する。
(The format of anonymous information changes for each company)
Also, in the above embodiment, the format of the anonymous information may be changed for each company. For example, when the anonymous information is multi-dimensional vector data, the vector data of company A and the vector data of company B do not need to be arranged in the same dimension. Even if the information has the same content, the vector data of Company A and the vector data of Company B may be arranged in different dimensions. It is sufficient if only the AI on the mother side can recognize which data is arranged in which dimension of the multidimensional vector data of each company. In this case, the AI on the mother side may match (match) the vector data of each company prior to learning and inference. For example, vector data of each company is converted into vector data in a common format for learning and inference.
(クライアント側でのAI学習)
また、上記の実施形態において、マザーサーバ100が各企業のクライアント端末10にAIを配布しているが、実際には、各企業のクライアント端末10が、自社で使用するAIを独自に生成し、生成されたAIの仕様に関する情報(ベクトル変換規則等)又はAI自体(ベクトル変換モデル等)をマザーサーバ100に提供してもよい。
(AI learning on the client side)
In the above embodiment, the
例えば、クライアント端末10は、顧客データとベクトル値とをデータセットとして、ニューラルネットワークによる機械学習の手法等を用いて学習モデルを構築する。そして、クライアント端末10は、構築された学習モデルに顧客データを入力して、顧客データを多次元からなる実数値ベクトルへと変換する。すなわち、クライアント端末10は、例えば複数層の全結合層、VAE(Variational Autoencoder)、RNN(Recurrent Neural Network)やLSTM(Long short-term memory)、Transformer、BERT等を用いた機械学習を経て生成されるベクトル変換モデルに顧客データを入力し、出力として顧客データを匿名化(ベクトル化)した匿名情報を取得する。
For example, the
なお、RNNやLSTMは、アテンション(Attention)の仕組みに基づくニューラルネットワークであってもよい。アテンションは、文章のような前後の並びが重要なデータを扱うことができる。また、クライアント端末10は、同様の自然言語処理モデルを用いてもよい。このようなモデルを用いて、顧客データからベクトル値を生成することにより、より情報の順序に重点を置いたベクトル値の生成を実現することができる。
Note that the RNN and LSTM may be neural networks based on an attention mechanism. Attention can handle data such as sentences in which the sequence is important. Also, the
そして、各企業のクライアント端末10は、マザーサーバ100からの要求に応じて、又は自発的に、顧客データを匿名化(ベクトル化)した匿名情報をマザーサーバ100に送信する際、又は任意のタイミングで、各企業のクライアント端末10は、学習済みのベクトル変換モデルの差分データ(又はモデル自体)をマザーサーバ100に送信する。
In response to a request from the
また、各企業のクライアント端末10は、フェデレーテッドラーニング(Federated Learning:連合学習)等の手法を用いて、顧客データをベクトルに変換するためのベクトル変換モデルを生成してもよい。フェデレーテッドラーニングは、データを自社外に出さずに共同で学習モデルを構築する機械学習の手法である。例えば、フェデレーテッドラーニングでは、各企業のクライアント端末10は、ベクトル変換モデルに対し、それぞれ顧客データを学習データとして機械学習を行い、元のモデルと学習後のモデルとの差分データをマザーサーバ100に送信する。マザーサーバ100は、差分データを各クライアント端末10から受信し、これらを統合して学習し、共通モデルを生成する。そして、マザーサーバ100は、生成された共通モデルのパラメータ等を各クライアント端末10に提供する。このように、フェデレーテッドラーニングを用いることで、学習データである顧客データをクライアント側からサーバ側に提供することなく学習を行うことが可能であるため、顧客の個人情報やプライバシーに配慮することができる。
Also, the
〔5.効果〕
上述してきたように、本願に係る情報処理装置(マザーサーバ100)は、複数の企業の各々から顧客データをベクトル化した匿名情報を取得する取得部と、各企業からの匿名情報を用いてAIの機械学習をする学習部と、機械学習を経たAIにより、複数の企業のうち特定企業の目的に適合する顧客を推定する推定部と、推定部による推定結果に基づく情報を提供する提供部とを備える。
[5. effect〕
As described above, the information processing apparatus (mother server 100) according to the present application includes an acquisition unit that acquires anonymous information obtained by vectorizing customer data from each of a plurality of companies, and an AI using anonymous information from each company. a learning unit that performs machine learning, an estimation unit that estimates customers who match the purpose of a specific company among multiple companies by AI that has undergone machine learning, and a provision unit that provides information based on the estimation results of the estimation unit. Prepare.
なお、匿名情報は、顧客データをベクトル化した多次元のベクトルデータであり、顧客データを復元する手段が存在しない不可逆な情報である。 Anonymous information is multidimensional vector data obtained by vectorizing customer data, and is irreversible information for which there is no means for restoring customer data.
また、推定部は、複数の企業のうち、特定企業からの匿名情報の件数が多くなるほど、特定企業の目的に適合する顧客をより高精度に推定する。 Further, the estimating unit more accurately estimates the customer who matches the purpose of the specific company as the number of anonymous information items from the specific company increases among the plurality of companies.
また、提供部は、顧客データをベクトル化するためのクライアント側AIを複数の企業の各々に提供する。そして、取得部は、複数の企業の各々からクライアント側AIにより顧客データをベクトル化した匿名情報を取得する。 Also, the providing unit provides client-side AI for vectorizing customer data to each of the plurality of companies. Then, the acquisition unit acquires anonymous information obtained by vectorizing customer data from each of the plurality of companies using the client-side AI.
また、学習部は、各企業からの匿名情報に、各企業とは別に当該情報処理装置が独自に収集した顧客データをベクトル化した匿名情報を加えてAIの機械学習をする。 In addition, the learning unit performs AI machine learning by adding anonymous information obtained by vectorizing customer data independently collected by the information processing device independently of each company to the anonymous information from each company.
また、学習部は、各企業からの匿名情報のうち目的に対応するデータに、各企業とは別に該情報処理装置が独自に収集した顧客データを加味した特定企業の目的設定を行い、AIの機械学習をする。 In addition, the learning unit sets the purpose of a specific company by adding customer data independently collected by the information processing device separately from each company to the data corresponding to the purpose among the anonymous information from each company, and sets the purpose of AI. Do machine learning.
また、推定部は、複数の企業のうち特定企業の特定商品の購入確率が高い顧客を推定し、該顧客をリスト化した商品購入確率リストを生成する。そして、提供部は、商品購入確率リストを特定企業に提供する。 In addition, the estimation unit estimates a customer who has a high probability of purchasing a specific product from a specific company among a plurality of companies, and generates a product purchase probability list in which the customers are listed. Then, the providing unit provides the product purchase probability list to the specific company.
また、提供部は、商品購入確率リストに掲載された顧客に対して、特定商品に関する広告配信及びクーポン配布を行う。 In addition, the providing unit distributes advertisements and coupons relating to specific products to customers listed on the product purchase probability list.
また、取得部は、業種が異なる複数の企業の各々から顧客データをベクトル化した匿名情報を取得する。 Also, the acquisition unit acquires anonymous information obtained by vectorizing customer data from each of a plurality of companies in different industries.
上述した各処理のいずれかもしくは組合せにより、本願に係る情報処理装置は、データ圏加盟企業が自社のデータを出したくなる仕組みを提供することができる。もちろん、ベクトル化した匿名情報に対して暗号化を行うことで、さらにセキュリティを高めることもできる。これにより、各企業が生の個人情報を出すことなく、データ圏連携、ターゲティング精度を向上できる。また、フリーライドできない仕組みがあるので全体としての精度が相乗効果的に向上していく。また、各企業から見たときに、データ圏に乗っかっても、自社のデータや状況が他社に見られない(例えば、A社からみて自社の店舗に顧客がどれくらい訪問しているか等を、B社には知られない)。また、マザー側が多数のサービスを展開している場合(ポータルサイトなど)、広告配信やSNSなど、マスマーケティングにも使える。 The information processing apparatus according to the present application can provide a mechanism that makes data area member companies want to output their own data by any one or combination of the above-described processes. Of course, the security can be further improved by encrypting the vectorized anonymous information. As a result, each company can improve data area cooperation and targeting accuracy without disclosing raw personal information. In addition, since there is a mechanism that prevents free riding, the accuracy as a whole improves synergistically. In addition, when viewed from the perspective of each company, even if it is in the data zone, other companies cannot see their company's data and situation (for example, from the perspective of company A, how many customers have visited their own store, etc. unknown to the company). In addition, if the mother side is developing a large number of services (portal site, etc.), it can also be used for mass marketing such as advertisement distribution and SNS.
〔6.ハードウェア構成〕
また、上述した実施形態に係るクライアント端末10やマザーサーバ100は、例えば図14に示すような構成のコンピュータ1000によって実現される。以下、マザーサーバ100を例に挙げて説明する。図14は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力I/F(Interface)1060、入力I/F1070、ネットワークI/F1080がバス1090により接続された形態を有する。
[6. Hardware configuration]
Also, the
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。演算装置1030は、例えばCPU(Central Processing Unit)、GPU、TPU、MPU(Micro Processing Unit)、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等により実現される。
The
一次記憶装置1040は、RAM(Random Access Memory)等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等により実現される。二次記憶装置1050は、内蔵ストレージであってもよいし、外付けストレージであってもよい。また、二次記憶装置1050は、USB(Universal Serial Bus)メモリやSD(Secure Digital)メモリカード等の取り外し可能な記憶媒体であってもよい。また、二次記憶装置1050は、クラウドストレージ(オンラインストレージ)やNAS(Network Attached Storage)、ファイルサーバ等であってもよい。
The primary storage device 1040 is a memory device such as a RAM (Random Access Memory) that temporarily stores data used for various calculations by the
出力I/F1060は、ディスプレイ、プロジェクタ、及びプリンタ等といった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインターフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力I/F1070は、マウス、キーボード、キーパッド、ボタン、及びスキャナ等といった各種の入力装置1020から情報を受信するためのインターフェースであり、例えば、USB等により実現される。
The output I/
また、出力I/F1060及び入力I/F1070はそれぞれ出力装置1010及び入力装置1020と無線で接続してもよい。すなわち、出力装置1010及び入力装置1020は、ワイヤレス機器であってもよい。
Also, the output I/
また、出力装置1010及び入力装置1020は、タッチパネルのように一体化していてもよい。この場合、出力I/F1060及び入力I/F1070も、入出力I/Fとして一体化していてもよい。
Also, the output device 1010 and the
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、又は半導体メモリ等から情報を読み出す装置であってもよい。
Note that the
ネットワークI/F1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
Network I/
演算装置1030は、出力I/F1060や入力I/F1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
例えば、コンピュータ1000がマザーサーバ100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、コンピュータ1000の演算装置1030は、ネットワークI/F1080を介して他の機器から取得したプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行してもよい。また、コンピュータ1000の演算装置1030は、ネットワークI/F1080を介して他の機器と連携し、プログラムの機能やデータ等を他の機器の他のプログラムから呼び出して利用してもよい。
For example, when the computer 1000 functions as the
〔7.その他〕
以上、本願の実施形態を説明したが、これら実施形態の内容により本発明が限定されるものではない。また、前述した構成要素には、当業者が容易に想定できるもの、実質的に同一のもの、いわゆる均等の範囲のものが含まれる。さらに、前述した構成要素は適宜組み合わせることが可能である。さらに、前述した実施形態の要旨を逸脱しない範囲で構成要素の種々の省略、置換又は変更を行うことができる。
[7. others〕
Although the embodiments of the present application have been described above, the present invention is not limited by the contents of these embodiments. In addition, the components described above include those that can be easily assumed by those skilled in the art, those that are substantially the same, and those within the so-called equivalent range. Furthermore, the components described above can be combined as appropriate. Furthermore, various omissions, replacements, or modifications of components can be made without departing from the gist of the above-described embodiments.
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。 Further, among the processes described in the above embodiments, all or part of the processes described as being automatically performed can be manually performed, or the processes described as being performed manually can be performed manually. All or part of this can also be done automatically by known methods. In addition, information including processing procedures, specific names, various data and parameters shown in the above documents and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each drawing is not limited to the illustrated information.
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。 Also, each component of each device illustrated is functionally conceptual, and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution and integration of each device is not limited to the illustrated one, and all or part of them can be functionally or physically distributed and integrated in arbitrary units according to various loads and usage conditions. Can be integrated and configured.
例えば、上述したマザーサーバ100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティング等で呼び出して実現するなど、構成は柔軟に変更できる。
For example, the above-described
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 Also, the above-described embodiments and modifications can be appropriately combined within a range that does not contradict the processing content.
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。 Also, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the acquisition unit can be read as acquisition means or an acquisition circuit.
1 情報処理システム
10 クライアント端末
100 マザーサーバ
110 通信部
120 記憶部
121 利用者情報データベース
122 履歴情報データベース
123 匿名情報データベース
130 制御部
131 取得部
132 学習部
133 推定部
134 提供部
1
Claims (11)
前記各企業からの匿名情報を用いてAIの機械学習をする学習部と、
前記機械学習を経たAIにより、前記複数の企業のうち特定企業の目的に適合する顧客を推定する推定部と、
前記推定部による推定結果に基づく情報を提供する提供部と
を備えることを特徴とする情報処理装置。 an acquisition unit that acquires anonymous information obtained by vectorizing customer data from each of a plurality of companies;
A learning unit that performs AI machine learning using anonymous information from each company;
an estimating unit that estimates a customer who meets the purpose of a specific company among the plurality of companies by the AI that has undergone machine learning;
and a providing unit that provides information based on the result of estimation by the estimating unit.
ことを特徴とする請求項1に記載の情報処理装置。 The information processing apparatus according to claim 1, wherein the anonymous information is multidimensional vector data obtained by vectorizing the customer data, and is irreversible information for which there is no means for restoring the customer data.
ことを特徴とする請求項1又は2に記載の情報処理装置。 2. The estimating unit, among the plurality of companies, more accurately estimates the customer who meets the purpose of the specific company as the number of anonymous information from the specific company increases. 3. The information processing device according to 2.
前記取得部は、前記複数の企業の各々から前記クライアント側AIにより顧客データをベクトル化した匿名情報を取得する
ことを特徴とする請求項1~3のうちいずれか1つに記載の情報処理装置。 The providing unit provides client-side AI for vectorizing the customer data to each of the plurality of companies,
The information processing apparatus according to any one of claims 1 to 3, wherein the acquisition unit acquires anonymous information obtained by vectorizing customer data from each of the plurality of companies by the client-side AI. .
ことを特徴とする請求項1~4のうちいずれか1つに記載の情報処理装置。 The learning unit performs machine learning of the AI by adding anonymous information obtained by vectorizing customer data independently collected by the information processing device separately from each company to anonymous information from each company. The information processing apparatus according to any one of claims 1 to 4.
ことを特徴とする請求項5に記載の情報処理装置。 During the machine learning of the AI, the learning unit adds customer data independently collected by the information processing device separately from the companies to the data corresponding to the purpose among the anonymous information from the companies. 6. The information processing apparatus according to claim 5, wherein the data is used as correct data to set the purpose of the specific company.
前記提供部は、前記商品購入確率リストを前記特定企業に提供する
ことを特徴とする請求項1~6のうちいずれか1つに記載の情報処理装置。 The estimating unit estimates a customer with a high probability of purchasing a specific product from the specific company among the plurality of companies, and generates a product purchase probability list listing the customers,
The information processing apparatus according to any one of claims 1 to 6, wherein the providing unit provides the product purchase probability list to the specific company.
ことを特徴とする請求項7に記載の情報処理装置。 8. The information processing apparatus according to claim 7, wherein said providing unit distributes advertisements and coupons relating to said specific product to customers listed on said product purchase probability list.
ことを特徴とする請求項1~8のうちいずれか1つに記載の情報処理装置。 The information processing apparatus according to any one of claims 1 to 8, wherein the acquisition unit acquires anonymous information obtained by vectorizing customer data from each of a plurality of companies in different industries.
複数の企業の各々から顧客データをベクトル化した匿名情報を取得する取得工程と、
前記各企業からの匿名情報を用いてAIの機械学習をする学習工程と、
前記機械学習を経たAIにより、前記複数の企業のうち特定企業の目的に適合する顧客を推定する推定工程と、
前記推定工程による推定結果に基づく情報を提供する提供工程と
を含むことを特徴とする情報処理方法。 An information processing method executed by an information processing device,
an acquisition step of acquiring anonymous information obtained by vectorizing customer data from each of a plurality of companies;
A learning step of AI machine learning using anonymous information from each company;
an estimation step of estimating a customer who meets the purpose of a specific company among the plurality of companies by the AI that has undergone machine learning;
and a provision step of providing information based on the estimation result of the estimation step.
前記各企業からの匿名情報を用いてAIの機械学習をする学習手順と、
前記機械学習を経たAIにより、前記複数の企業のうち特定企業の目的に適合する顧客を推定する推定手順と、
前記推定手順による推定結果に基づく情報を提供する提供手順と
をコンピュータに実行させるための情報処理プログラム。 an acquisition procedure for acquiring anonymous information obtained by vectorizing customer data from each of a plurality of companies;
A learning procedure for AI machine learning using anonymous information from each company;
an estimation procedure for estimating a customer who meets the purpose of a specific company among the plurality of companies by the AI that has undergone machine learning;
An information processing program for causing a computer to execute a provision procedure for providing information based on the estimation results of the estimation procedure.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022109850A JP2023001109A (en) | 2021-06-17 | 2022-07-07 | Information processing device, information processing method, and information processing program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021100861A JP7104219B1 (en) | 2021-06-17 | 2021-06-17 | Information processing equipment, information processing methods and information processing programs |
JP2022109850A JP2023001109A (en) | 2021-06-17 | 2022-07-07 | Information processing device, information processing method, and information processing program |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021100861A Division JP7104219B1 (en) | 2021-06-17 | 2021-06-17 | Information processing equipment, information processing methods and information processing programs |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023001109A true JP2023001109A (en) | 2023-01-04 |
Family
ID=82482451
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021100861A Active JP7104219B1 (en) | 2021-06-17 | 2021-06-17 | Information processing equipment, information processing methods and information processing programs |
JP2022109850A Pending JP2023001109A (en) | 2021-06-17 | 2022-07-07 | Information processing device, information processing method, and information processing program |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021100861A Active JP7104219B1 (en) | 2021-06-17 | 2021-06-17 | Information processing equipment, information processing methods and information processing programs |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP7104219B1 (en) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003248780A (en) * | 2002-02-25 | 2003-09-05 | Fujitsu Ltd | Purchase information management system, purchase information anonymization server, and purchase information management method |
JP5914549B2 (en) * | 2014-03-04 | 2016-05-11 | 株式会社野村総合研究所 | Information processing apparatus and information analysis method |
CN105760932B (en) * | 2016-02-17 | 2018-04-06 | 第四范式(北京)技术有限公司 | Method for interchanging data, DEU data exchange unit and computing device |
JP6253744B1 (en) * | 2016-11-04 | 2017-12-27 | ヤフー株式会社 | Information analysis apparatus, information analysis method, and information analysis program |
WO2019142597A1 (en) * | 2018-01-19 | 2019-07-25 | ソニー株式会社 | Information processing device, information processing method and program |
JP7102999B2 (en) * | 2018-07-12 | 2022-07-20 | コニカミノルタ株式会社 | Information collection processing equipment, information collection processing method and program |
US20220169144A1 (en) * | 2019-03-29 | 2022-06-02 | Honda Motor Co., Ltd. | Information generation device, information generation method,program, and recording medium |
US10825074B1 (en) * | 2020-02-06 | 2020-11-03 | Capital One Services, Llc | Methods and systems for anonymizing and providing access to transaction data |
-
2021
- 2021-06-17 JP JP2021100861A patent/JP7104219B1/en active Active
-
2022
- 2022-07-07 JP JP2022109850A patent/JP2023001109A/en active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2023000186A (en) | 2023-01-04 |
JP7104219B1 (en) | 2022-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10509806B2 (en) | Recommendation engine for aggregated platform data | |
Moorthy et al. | What drives the adoption of mobile payment? A Malaysian perspective | |
Knijnenburg et al. | Inspectability and control in social recommenders | |
US20190102802A1 (en) | Predicting psychometric profiles from behavioral data using machine-learning while maintaining user anonymity | |
Boon-Long et al. | Social media marketing evaluation using social network comments as an indicator for identifying consumer purchasing decision effectiveness | |
Li et al. | Who is talking? An ontology-based opinion leader identification framework for word-of-mouth marketing in online social blogs | |
Tan et al. | Metaverse in marketing and logistics: the state of the art and the path forward | |
Lee | Usefulness, funniness, and coolness votes of viewers: An analysis of social shoppers’ online reviews | |
Alshare et al. | The impact of trust, security, and privacy on individual's use of the internet for online shopping and social media: a multi-cultural study | |
Human-Van Eck et al. | Influencers on Instagram: The influence of disclosure, followers and authority heuristic on source credibility | |
Park et al. | Cultural differences in tourism web communication: A preliminary study | |
Zarmpou et al. | Examining behavioral intention toward mobile services: An empirical investigation in Greece | |
Golden | Differences in the use of AI assistants: how human values influence AI assistant use or disuse | |
JP7104219B1 (en) | Information processing equipment, information processing methods and information processing programs | |
JP7212103B2 (en) | Information processing device, information processing method and information processing program | |
Chatterjee | Effect of construal level on the drivers of online-review-helpfulness | |
JP7174743B2 (en) | Information selection device, information selection method and information selection program | |
Łysik et al. | Social Collaboration Solutions as a Catalyst of Consumer Trust in Service Management Platforms-A Research Study | |
Ribeiro et al. | Digital Presence of Companies: Consumer Social Interaction and the Purchase Decision | |
JP2021125128A (en) | Information processing device, information management method, and information processing program | |
Pauchard | A Comparison of the Different Types of Risk Perceived by Users that Are Hindering the Adoption of Mobile Payment | |
Grifoni et al. | CREMOR: CREdibility Model on Online Reviews-How people Consider Online Reviews Believable | |
JP7422113B2 (en) | Information processing device, information processing method, and information processing program | |
Em et al. | Marketing Activities among Social Media Users in Cambodia: Mixed Method Research. | |
JP7407779B2 (en) | Information processing device, information processing method, and information processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20231026 |