JP2023001109A - Information processing device, information processing method, and information processing program - Google Patents

Information processing device, information processing method, and information processing program Download PDF

Info

Publication number
JP2023001109A
JP2023001109A JP2022109850A JP2022109850A JP2023001109A JP 2023001109 A JP2023001109 A JP 2023001109A JP 2022109850 A JP2022109850 A JP 2022109850A JP 2022109850 A JP2022109850 A JP 2022109850A JP 2023001109 A JP2023001109 A JP 2023001109A
Authority
JP
Japan
Prior art keywords
company
data
information
customer
companies
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022109850A
Other languages
Japanese (ja)
Inventor
貴之 山本
Takayuki Yamamoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2022109850A priority Critical patent/JP2023001109A/en
Publication of JP2023001109A publication Critical patent/JP2023001109A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a mechanism in which a data zone affiliated enterprise wants to provide its own data.
SOLUTION: An information processing device comprises: an acquisition unit which acquires anonymous information obtained by vectorizing customer data from each of a plurality of enterprises; a learning unit which performs machine learning of AI using anonymous information from each enterprise; an estimation unit which estimates a customer suited to the objective of a specific enterprise among a plurality of enterprises by the AI which has experienced the machine learning; and a provision unit which provides information based on a result of the estimation made by the estimation unit.
SELECTED DRAWING: Figure 1
COPYRIGHT: (C)2023,JPO&INPIT

Description

本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program.

データ共有システムにおいて、各社が保有するデータの内容を他社に開示することなく、安全に活用する技術が開示されている。 In a data sharing system, a technology is disclosed for safely using the data held by each company without disclosing it to other companies.

特許第6803598号公報Japanese Patent No. 6803598

しかしながら、上記の従来技術は、データ共有システムに参加する組織等から提供される機微データを、所定の暗号方式(暗号化状態のまま、検索や分析等を含む演算を行うことができる暗号方式)で暗号化してデータ処理する一方、暗号化及び復号に用いる鍵は、当該機微データを提供した各組織において管理するというものに過ぎない。 However, the above-described conventional technology uses a predetermined cryptographic method (a cryptographic method that allows operations including search and analysis to be performed in an encrypted state) for sensitive data provided by organizations participating in a data sharing system. However, the key used for encryption and decryption is simply managed by each organization that provided the sensitive data.

また、共通IDでのID統合(ID Connect)を全クライアントに強制するとデータ圏加盟企業が増えないという問題がある。また、データ圏に企業が加盟したとしても、各企業から全顧客データ(個人情報)を、マザーサーバ側に送信してもらうのは非現実的(これに賛同できない企業が多いはず)である。そのため、データ圏加盟企業が、自社のデータをあまり出さず、他社のデータのみに頼ってマーケティング活用できないような設計が必要である。すなわち、フリーライド(ただ乗り)できない仕組みや、自社のデータを出したくなる仕組みが必要である。 In addition, there is a problem that if all clients are forced to integrate IDs (ID Connect) using a common ID, the number of companies participating in the data area will not increase. Also, even if companies join the data sphere, it would be unrealistic to have each company send all customer data (personal information) to the mother server side (many companies would not agree with this). Therefore, it is necessary to design so that the member companies of the data zone do not release much of their own data and cannot rely only on the data of other companies for marketing purposes. In other words, it is necessary to have a mechanism that prevents free riding and a mechanism that makes people want to release their company's data.

本願は、上記に鑑みてなされたものであって、データ圏加盟企業が自社のデータを出したくなる仕組みを提供することを目的とする。 The present application has been made in view of the above, and aims to provide a mechanism that makes data area member companies want to publish their own data.

本願に係る情報処理装置は、複数の企業の各々から顧客データをベクトル化した匿名情報を取得する取得部と、前記各企業からの匿名情報を用いてAIの機械学習をする学習部と、前記機械学習を経たAIにより、前記複数の企業のうち特定企業の目的に適合する顧客を推定する推定部と、前記推定部による推定結果に基づく情報を提供する提供部とを備えることを特徴とする。 An information processing apparatus according to the present application includes an acquisition unit that acquires anonymous information obtained by vectorizing customer data from each of a plurality of companies, a learning unit that performs AI machine learning using the anonymous information from each company, and An estimating unit for estimating a customer suitable for the purpose of a specific company among the plurality of companies by AI that has undergone machine learning, and a providing unit for providing information based on the estimation result of the estimating unit. .

実施形態の一態様によれば、データ圏加盟企業が自社のデータを出したくなる仕組みを提供することができる。 According to one aspect of the embodiments, it is possible to provide a mechanism that makes data zone member companies want to publish their own data.

図1は、実施形態に係る情報処理方法の概要を示す説明図である。FIG. 1 is an explanatory diagram showing an outline of an information processing method according to an embodiment. 図2は、サーバ側でのAI学習の概要を示す説明図である。FIG. 2 is an explanatory diagram showing an outline of AI learning on the server side. 図3は、キャンペーン目的から学習する事例を示す説明図である。FIG. 3 is an explanatory diagram showing an example of learning from the campaign purpose. 図4は、顧客データのベクトル化の概要を示す説明図である。FIG. 4 is an explanatory diagram showing an outline of vectorization of customer data. 図5は、サーバ側での推論の概要を示す説明図である。FIG. 5 is an explanatory diagram showing an outline of inference on the server side. 図6は、サーバ側での推論を簡略化した模式図である。FIG. 6 is a schematic diagram that simplifies inference on the server side. 図7は、ベクトル近傍顧客拡張の概要を示す説明図である。FIG. 7 is an explanatory diagram showing an outline of vector neighborhood customer extension. 図8は、1stPartyデータ圏構想のイメージを示す概念図である。FIG. 8 is a conceptual diagram showing an image of the 1stParty data zone concept. 図9は、実施形態に係るマザーサーバの構成例を示す図である。FIG. 9 is a diagram illustrating a configuration example of a mother server according to the embodiment; 図10は、利用者情報データベースの一例を示す図である。FIG. 10 is a diagram showing an example of a user information database. 図11は、履歴情報データベースの一例を示す図である。FIG. 11 is a diagram showing an example of the history information database. 図12は、匿名情報データベースの一例を示す図である。FIG. 12 is a diagram showing an example of an anonymous information database. 図13は、実施形態に係る処理手順を示すフローチャートである。FIG. 13 is a flowchart illustrating a processing procedure according to the embodiment; 図14は、ハードウェア構成の一例を示す図である。FIG. 14 is a diagram illustrating an example of a hardware configuration;

以下に、本願に係る情報処理装置、情報処理方法及び情報処理プログラムを実施するための形態(以下、「実施形態」と記載する)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法及び情報処理プログラムが限定されるものではない。また、以下の実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Embodiments for implementing an information processing apparatus, an information processing method, and an information processing program according to the present application (hereinafter referred to as "embodiments") will be described in detail below with reference to the drawings. The information processing apparatus, information processing method, and information processing program according to the present application are not limited to this embodiment. Also, in the following embodiments, the same parts are denoted by the same reference numerals, and overlapping descriptions are omitted.

〔1.情報処理方法の概要〕
まず、図1を参照し、実施形態に係る情報処理装置が行う情報処理方法の概要について説明する。図1は、実施形態に係る情報処理方法の概要を示す説明図である。なお、図1では、データ圏加盟企業が自社のデータを出したくなる仕組みを提供する場合を例に挙げて説明する。
[1. Outline of information processing method]
First, an outline of an information processing method performed by an information processing apparatus according to an embodiment will be described with reference to FIG. FIG. 1 is an explanatory diagram showing an outline of an information processing method according to an embodiment. In FIG. 1, a case where data zone member companies provide a system that makes them want to release their own data will be explained as an example.

図1に示すように、実施形態に係る情報処理システム1は、クライアント端末10と、マザーサーバ100とを含む。クライアント端末10とマザーサーバ100とは、それぞれネットワークNを介して、有線又は無線によりで互いに通信可能に接続される。ネットワークNは、例えば、LAN(Local Area Network)や、インターネット等のWAN(Wide Area Network)である。 As shown in FIG. 1, an information processing system 1 according to the embodiment includes a client terminal 10 and a mother server 100. The client terminal 10 and the mother server 100 are connected to each other via a network N by wire or wirelessly so that they can communicate with each other. The network N is, for example, a LAN (Local Area Network) or a WAN (Wide Area Network) such as the Internet.

また、かかるクライアント端末10は、LTE(Long Term Evolution)、4G(4th Generation)、5G(5th Generation:第5世代移動通信システム)等の無線通信網や、Bluetooth(登録商標)、無線LAN(Local Area Network)等の近距離無線通信を介してネットワークNに接続し、マザーサーバ100と通信することができる。 In addition, the client terminal 10 can be a wireless communication network such as LTE (Long Term Evolution), 4G (4th Generation), 5G (5th Generation: fifth generation mobile communication system), Bluetooth (registered trademark), wireless LAN (Local It is possible to connect to the network N via short-range wireless communication such as Area Network) and communicate with the mother server 100 .

クライアント端末10は、クライアント側の各企業(データ圏加盟企業)によって使用される情報処理装置である。例えば、クライアント端末10は、PC(Personal Computer)やサーバ装置、あるいはスマートフォンやタブレット端末等のスマートデバイス等である。なお、クライアント側の各企業は、異業種の企業であると好ましい。無論、データ圏加盟企業の中に、競合企業(同業他社)が含まれていてもよい。 The client terminal 10 is an information processing device used by each company on the client side (data zone member company). For example, the client terminal 10 is a PC (Personal Computer), a server device, or a smart device such as a smart phone or a tablet terminal. It should be noted that each company on the client side is preferably a company in a different industry. Of course, competing companies (companies in the same industry) may be included in the data area member companies.

各企業のクライアント端末10は、自社の顧客(Customer)である各利用者U(ユーザ)に関する顧客データを収集する。例えば、各企業のクライアント端末10は、自社の製品を購入/サービスを利用した各利用者Uの登録情報や来店記録、製品購入履歴/サービス利用履歴、アンケート回答等を顧客データとして収集する。 The client terminal 10 of each company collects customer data on each user U (user) who is a customer of the company. For example, the client terminal 10 of each company collects, as customer data, registration information, store visit records, product purchase history/service usage history, questionnaire responses, etc. of each user U who purchased products/services of the company.

図1に示す例では、識別のため、A社によって使用されるクライアント端末10を「クライアント端末10A」、B社によって使用されるクライアント端末10を「クライアント端末10B」、C社によって使用されるクライアント端末10を「クライアント端末10C」と称する。 In the example shown in FIG. 1, for identification, the client terminal 10 used by company A is "client terminal 10A", the client terminal 10 used by company B is "client terminal 10B", and the client terminal 10 used by company C is "client terminal 10A". The terminal 10 is called a "client terminal 10C".

マザーサーバ100は、例えばPCやサーバ装置、あるいはメインフレーム又はワークステーション等である。なお、マザーサーバ100は、クラウドコンピューティングにより実現されてもよい。また、マザーサーバ100は、各企業のクライアント端末10とは別に、マザー側のサービスを利用する顧客としての各利用者Uに関する顧客データ(マザー側のデータ)を収集してもよい。 The mother server 100 is, for example, a PC, a server device, a mainframe, a workstation, or the like. Note that the mother server 100 may be realized by cloud computing. Also, the mother server 100 may collect customer data (mother-side data) on each user U as a customer who uses the mother-side service, separately from the client terminals 10 of each company.

例えば、マザーサーバ100は、各利用者Uの端末装置と連携し、各利用者Uの端末装置に対して、各種アプリケーション(以下、アプリ)等に対するAPI(Application Programming Interface)サービス等と、各種データを提供してもよい。 For example, the mother server 100 cooperates with the terminal device of each user U, and provides API (Application Programming Interface) services for various applications (hereinafter referred to as apps), etc., and various data may be provided.

また、マザーサーバ100は、各利用者Uの端末装置に対して、オンラインで何らかのWebサービスを提供する情報処理装置であってもよい。例えば、マザーサーバ100は、Webサービスとして、インターネット接続、検索サービス、SNS(Social Networking Service)、電子商取引、電子決済、オンラインゲーム、オンラインバンキング、オンライントレーディング、宿泊・チケット予約、動画・音楽配信、ニュース、地図、ルート検索、経路案内、路線情報、運行情報、天気予報等のサービスを提供してもよい。実際には、マザーサーバ100は、上記のようなWebサービスを提供する各種サーバと連携し、Webサービスを仲介してもよいし、Webサービスの処理を担当してもよい。 Also, the mother server 100 may be an information processing device that provides some kind of web service online to each user U's terminal device. For example, the mother server 100 provides web services such as Internet connection, search service, SNS (Social Networking Service), electronic commerce, electronic payment, online games, online banking, online trading, accommodation/ticket reservation, video/music distribution, news, etc. , maps, route search, route guidance, route information, operation information, weather forecast, and other services. In practice, the mother server 100 may cooperate with various servers that provide web services as described above, mediate the web services, or take charge of the processing of the web services.

なお、マザーサーバ100は、利用者Uに関する利用者情報を取得可能である。例えば、マザーサーバ100は、利用者Uの性別、年代、居住地域といった利用者Uの属性に関する情報を取得する。そして、マザーサーバ100は、利用者Uを示す識別情報(利用者ID等)とともに利用者Uの属性に関する情報を記憶して管理する。 Note that the mother server 100 can acquire user information about the user U. FIG. For example, the mother server 100 acquires information about attributes of the user U, such as the user U's sex, age, and area of residence. The mother server 100 stores and manages identification information indicating the user U (user ID, etc.) and information about the attributes of the user U. FIG.

また、マザーサーバ100は、利用者Uの端末装置から、あるいは利用者ID等に基づいて各種サーバ等から、利用者Uの行動を示す各種の履歴情報(ログデータ)を取得する。例えば、マザーサーバ100は、利用者Uの位置や日時の履歴である位置履歴を端末装置から取得する。また、マザーサーバ100は、利用者Uが入力した検索クエリの履歴である検索履歴を検索サーバ(検索エンジン)から取得する。また、マザーサーバ100は、利用者Uが閲覧したコンテンツの履歴である閲覧履歴をコンテンツサーバから取得する。また、マザーサーバ100は、利用者Uの商品購入や決済処理の履歴である購入履歴(決済履歴)を電子商取引サーバや決済処理サーバから取得する。また、マザーサーバ100は、利用者Uのマーケットプレイスへの出品の履歴である出品履歴や販売履歴を電子商取引サーバや決済サーバから取得してもよい。また、マザーサーバ100は、利用者Uの投稿の履歴である投稿履歴を口コミの投稿サービスを提供する投稿サーバやSNSサーバから取得する。 Also, the mother server 100 acquires various types of history information (log data) indicating the actions of the user U from the terminal device of the user U or from various servers based on the user ID or the like. For example, the mother server 100 acquires a location history, which is a history of the location and date and time of the user U, from the terminal device. The mother server 100 also acquires a search history, which is a history of search queries input by the user U, from a search server (search engine). Also, the mother server 100 acquires a viewing history, which is a history of content viewed by the user U, from the content server. The mother server 100 also acquires the purchase history (payment history), which is the history of user U's product purchases and payment processing, from the electronic commerce server and the payment processing server. Further, the mother server 100 may acquire the exhibition history and sales history, which are the history of the user U's exhibition in the marketplace, from the electronic commerce server or the payment server. In addition, the mother server 100 acquires the posting history, which is the posting history of the user U, from a posting server that provides a word-of-mouth posting service or an SNS server.

なお、図1に示す情報処理システム1に含まれる各装置の数は図示したものに限られない。例えば、図1では、図示の簡略化のため、クライアント端末10を3台のみ示したが、これはあくまでも例示であって限定されるものではなく、4台以上であってもよい。また、マザーサーバ100も、複数のサーバ装置に分散していてもよい。 Note that the number of devices included in the information processing system 1 shown in FIG. 1 is not limited to that illustrated. For example, in FIG. 1, only three client terminals 10 are shown for simplification of illustration, but this is only an example and is not limited, and may be four or more. Also, the mother server 100 may be distributed among a plurality of server devices.

例えば、図1に示すように、マザーサーバ100は、事前(各企業のデータ圏加盟時等)に、ネットワークNを介して、データ圏に加盟する各企業のクライアント端末10(10A、10B,10C、・・・)に対して、顧客データを匿名化(ベクトル化)するためのAI(Artificial Intelligence:人工知能)を配布する(ステップS1)。 For example, as shown in FIG. 1, the mother server 100 pre-connects the client terminals 10 (10A, 10B, 10C) of each company participating in the data area via the network N in advance (when each company joins the data area, etc.). , . . . ) for anonymizing (vectorizing) customer data (step S1).

このとき、マザーサーバ100は、企業ごとにAIをカスタマイズしてもよい。すなわち、マザーサーバ100は、各企業に対してそれぞれ異なるAIを配布してもよい。企業の業種・業態によって顧客データとして取得する情報の内容が異なることもあり得るため、取得される顧客データの内容に合わせてAIの仕様を変更することは可能であり、一律に同じAIでなくてもよい。マザーサーバ100(サーバ側)が各企業に配布したAIの仕様を把握・管理していれば十分である。 At this time, the mother server 100 may customize AI for each company. That is, the mother server 100 may distribute different AIs to each company. Since the content of information acquired as customer data may differ depending on the type of business and business type of the company, it is possible to change the specifications of the AI according to the content of the customer data acquired, and it is not possible to use the same AI uniformly. may It is sufficient if the mother server 100 (server side) comprehends and manages the AI specifications distributed to each company.

続いて、マザーサーバ100は、データ圏に加盟する各企業のクライアント端末10から、AIにより各企業の顧客データを匿名化(ベクトル化)した匿名情報を収集する(ステップS2)。 Subsequently, the mother server 100 collects anonymous information obtained by anonymizing (vectorizing) the customer data of each company by AI from the client terminals 10 of each company participating in the data zone (step S2).

本実施形態では、各企業のクライアント端末10は、自社の顧客に関する顧客データを取得し、AIにより、取得された顧客データをベクトルに変換(ベクトル化)した匿名情報を生成する。このとき、クライアント端末10は、いわゆるエンベディング(embedding:埋め込み)を行い、匿名情報として、顧客データに基づくエンベディングベクトル(埋め込みベクトル)を生成してもよい。そして、各企業のクライアント端末10は、マザーサーバ100からの要求に応じて、又は自発的に、顧客データを匿名化(ベクトル化)した匿名情報をマザーサーバ100に送信する。 In the present embodiment, the client terminal 10 of each company acquires customer data relating to the company's customers, and generates anonymous information by converting (vectoring) the acquired customer data into a vector using AI. At this time, the client terminal 10 may perform so-called embedding to generate an embedding vector based on customer data as anonymous information. Then, the client terminal 10 of each company transmits anonymous information obtained by anonymizing (vectorizing) customer data to the mother server 100 in response to a request from the mother server 100 or voluntarily.

例えば、クライアント端末10は、AIにより、マザーサーバ100(サーバ側)でニューラルネットワークによる機械学習の手法等を用いて構築されたベクトル変換モデルに顧客データを入力して、顧客データを多次元からなる実数値ベクトルへと変換する。あるいは、クライアント端末10は、所定の変換規則(ルール)に従って(ルールベースで)、顧客データをベクトルに変換してもよい。 For example, the client terminal 10 uses AI to input customer data into a vector conversion model constructed using a machine learning technique using a neural network on the mother server 100 (server side), and transforms the customer data into a multidimensional model. Convert to a real-valued vector. Alternatively, the client terminal 10 may convert customer data into a vector according to a predetermined conversion rule (rule base).

なお、匿名情報は不可逆な情報であり、匿名情報のベクトル値から元の顧客データを復元することはできない。ここで、「復元することができない」とは、ベクトル値から確定的に元のデータを算出することができないといった概念のみならず、推定することができないもの等、元のデータ、すなわち、顧客データがどのようなものであったかを算出若しくは推定することが困難であるといった概念も含むものである。すなわち、匿名情報は、暗号化されたデータのように復号することはできない。例えば、顧客データを匿名化(ベクトル化)する際に、共通の属性等によって所定のグループやセグメントに配置することや、端数処理(四捨五入や切捨て等)を行って数値を「丸める」こともできる。また、顧客データとベクトル値とは、同一のデータから同一のベクトル値が得られる1対1の関係に限らず、異なるデータから同一のベクトル値が得られる多対1の関係や、一部に同じデータを含んでいてもデータの組み合わせによって異なるベクトル値が得られる多対多の関係の場合もある。さらに、企業ごとに異なるAIを配布する場合、企業によってベクトル値の意味自体が異なることもある。したがって、1つのベクトル値が同一のデータに基づいているとは限らない。また、マザーサーバ100(サーバ側)が必要とするのは、ベクトル値であって、ベクトル値の根拠(元)となった顧客データではない。 The anonymous information is irreversible information, and the original customer data cannot be restored from the vector value of the anonymous information. Here, "cannot be restored" means not only the concept that the original data cannot be deterministically calculated from the vector value, but also the original data such as those that cannot be estimated, that is, the customer data It also includes the concept that it is difficult to calculate or estimate what it was like. That is, anonymous information cannot be decrypted like encrypted data. For example, when customer data is anonymized (vectorized), it is possible to place it in predetermined groups or segments based on common attributes, etc., or to "round" numbers by performing rounding (rounding off, rounding down, etc.). . Moreover, customer data and vector values are not limited to a one-to-one relationship in which the same vector value is obtained from the same data, but a many-to-one relationship in which the same vector value is obtained from different data. There is also a many-to-many relationship in which different vector values are obtained depending on the combination of data even if the same data is included. Furthermore, when different AIs are distributed to different companies, the meaning of the vector value itself may differ depending on the company. Therefore, one vector value is not necessarily based on the same data. Also, what the mother server 100 (server side) needs is the vector value, not the customer data that is the basis (source) of the vector value.

また、匿名情報のベクトル値及びそれが意味する内容を定義するのはAIを配布するマザーサーバ100(サーバ側)であるため、各企業及び第三者が匿名情報のベクトル値だけを見ても、そのベクトル値が何を意味しているのか理解できないので、仮に匿名情報が流出したとしても、顧客データが漏洩することはないため安全である。なお、ベクトルは作成する度に同一ユーザのベクトルであっても異なるベクトルとなり、毎回同一とは限らない。 In addition, since it is the mother server 100 (server side) that distributes AI that defines the vector value of anonymous information and the content that it means, even if each company or third party sees only the vector value of anonymous information, , it is not possible to understand what the vector values mean, so even if anonymous information leaks out, customer data will not be leaked, so it is safe. Note that each time a vector is created, even if it is for the same user, it becomes a different vector, and the vector is not necessarily the same each time.

続いて、マザーサーバ100は、各企業のクライアント端末10から収集した全ての匿名情報を用いて目的設定データを正解として学習する(ステップS3)。例えば、マザーサーバ100は、データ圏に参加する全企業の全顧客の匿名情報を用いて機械学習を行い、顧客評価モデルを生成する。このとき、マザーサーバ100は、全ての匿名情報に加えて、さらにマザー側で独自に取得した顧客データ(マザー側データ)を用いて学習してもよい。なお、マザーサーバ100は、AIにより、マザー側データを匿名化(ベクトル化)した匿名情報を生成してもよい。 Subsequently, the mother server 100 uses all the anonymous information collected from the client terminals 10 of each company to learn the purpose setting data as correct answers (step S3). For example, the mother server 100 performs machine learning using anonymous information of all customers of all companies participating in the data zone to generate a customer evaluation model. At this time, the mother server 100 may learn using customer data (mother-side data) independently acquired by the mother side in addition to all anonymous information. Note that the mother server 100 may generate anonymous information by anonymizing (vectorizing) the mother-side data using AI.

続いて、マザーサーバ100は、学習結果から企業ごとに推論を行う(ステップS4)。例えば、マザーサーバ100は、各企業のクライアント端末10から収集した全ての匿名情報を用いて学習した結果に基づき、特定企業の特定商品を購入する可能性がある顧客のリストを生成する。このとき、マザーサーバ100は、特定企業からの匿名情報を顧客評価モデルに入力し、出力として特定企業の特定商品を購入する可能性がある顧客のリストを取得してもよい。 Subsequently, the mother server 100 makes an inference for each company from the learning result (step S4). For example, the mother server 100 generates a list of customers who are likely to purchase a specific product from a specific company based on the results of learning using all anonymous information collected from the client terminals 10 of each company. At this time, the mother server 100 may input anonymous information from a specific company into the customer evaluation model, and obtain a list of customers who are likely to purchase a specific product of the specific company as an output.

続いて、マザーサーバ100は、ネットワークNを介して、各企業のクライアント端末10に対して、各企業に対応する推論の結果、及び推論の結果に基づく情報を提供する(ステップS5)。例えば、マザーサーバ100は、特定企業のクライアント端末10に対して、特定企業の特定商品を購入する可能性がある顧客のリストを提供する。 Subsequently, the mother server 100 provides the client terminal 10 of each company with the inference result corresponding to each company and information based on the inference result via the network N (step S5). For example, the mother server 100 provides the client terminal 10 of a specific company with a list of customers who are likely to purchase a specific product of a specific company.

〔1-1.サーバ側でのAI学習〕
次に、図2を用いて、本実施形態に係るマザーサーバ100(サーバ側)でのAI学習について説明する。図2は、サーバ側でのAI学習の概要を示す説明図である。
[1-1. AI learning on the server side]
Next, AI learning in the mother server 100 (server side) according to this embodiment will be described with reference to FIG. FIG. 2 is an explanatory diagram showing an outline of AI learning on the server side.

図2に示すように、データ圏は、クライアント側のCDP(Customer Data Platform)と、マザー側のサーバという構成である。すなわち、各企業のクライアント端末10と、マザーサーバ100という構成である。 As shown in FIG. 2, the data area consists of a CDP (Customer Data Platform) on the client side and a server on the mother side. That is, the configuration consists of the client terminal 10 of each company and the mother server 100 .

クライアント側のCDPにおいて、各企業のクライアント端末10は、AIにより、自社が持つ顧客データ(1st partyデータ)をベクトルに変換(ベクトル化)した匿名情報を生成する。このとき、各企業のクライアント端末10は、匿名情報として、自社のID毎のベクトルを生成する。すなわち、各企業の顧客IDとベクトルデータとの組合せを生成する。 In the CDP on the client side, the client terminal 10 of each company generates anonymous information by converting (vectoring) customer data (1st party data) owned by the company into vectors using AI. At this time, the client terminal 10 of each company generates a vector for each ID of the company as anonymous information. That is, a combination of the customer ID of each company and the vector data is generated.

なお、各企業が持つ顧客データは、企業ごとに異なる。例えば、A社は、「来店」、「購入」、「商談時の要望・会話」等の情報を顧客データとして収集する。B社は、「商品購入」、「アンケート回答」、「WEB広告接触」等の情報を顧客データとして収集する。C社は、「検索」、「ニュース接触」、「購買商品」等の情報を顧客データとして収集する。但し、これらは一例に過ぎない。 The customer data held by each company differs from company to company. For example, Company A collects information such as "visit", "purchase", and "requests/conversations during business negotiations" as customer data. Company B collects information such as "product purchase", "questionnaire response", and "web advertisement exposure" as customer data. Company C collects information such as "search", "news contact", and "purchased products" as customer data. However, these are only examples.

そして、各企業のクライアント端末10は、マザーサーバ100からの要求に応じて、又は自発的に、生成された匿名情報を送信データとしてマザーサーバ100(サーバ側)に送信する。なお、各企業のクライアント端末10は、セキュリティ上、生成された匿名情報をさらに暗号化してマザーサーバ100(サーバ側)に送信してもよい。データを暗号化して伝送すること自体は、技術常識の範疇で可能である。また、トンネリング(tunneling)により、マザー側とクライアント側との間に閉じられた仮想的な直結回線を確立してもよい。例えば、マザー側とクライアント側との間にVPN(Virtual Private Network)を構築してもよい。 Then, the client terminal 10 of each company transmits the generated anonymous information as transmission data to the mother server 100 (server side) in response to a request from the mother server 100 or spontaneously. For security reasons, the client terminal 10 of each company may further encrypt the generated anonymous information and transmit it to the mother server 100 (server side). Encrypting and transmitting data itself is possible within the scope of common technical knowledge. Alternatively, tunneling may be used to establish a closed virtual direct line between the mother side and the client side. For example, a VPN (Virtual Private Network) may be constructed between the mother side and the client side.

このとき、各企業のクライアント端末10は、匿名情報として、共通IDと紐づけたベクトルデータのみ送信する。共通IDは、データ圏で共通の顧客IDである。共通IDと紐づけたベクトルデータとは、データ圏へのデータ供出を許諾した顧客のベクトルデータである。全体を通して、マザー側とクライアント側との間の連携は、共通ID連携を許諾したユーザのみのベクトルデータのやりとりである。なお、送信するのは、あくまでベクトルデータ(匿名情報)であり、顧客データ自体の送信はない。ベクトル化したものであっても個人情報と解釈される場合もあるが、生の個人情報データと比較すると圧倒的に安全性が高い。共通IDにより同一人物であることはわかるが、居住地・年齢・性別等の個人に関する情報等は含まれていないか匿名化(ベクトル化)されていて判別できない。 At this time, the client terminal 10 of each company transmits only the vector data associated with the common ID as anonymous information. Common ID is a common customer ID in the data area. The vector data associated with the common ID is the vector data of the customer who has given permission to provide data to the data area. As a whole, cooperation between the mother side and the client side is exchange of vector data only for users who have permitted common ID cooperation. It should be noted that only vector data (anonymous information) is transmitted, and customer data itself is not transmitted. Even if it is vectorized, it may be interpreted as personal information, but it is overwhelmingly safer than raw personal information data. Although it is known from the common ID that they are the same person, it is impossible to distinguish them because information about individuals such as place of residence, age, and sex is not included or is anonymized (vectorized).

また、全顧客のベクトルデータについて共通IDとの紐づけをしなくてもよい。例えば、個々の顧客にデータ圏内でのデータの利用許諾をとらず、企業がデータ圏に参加しただけであれば、共通IDと顧客のベクトルデータとの紐づけをしなくてもよい。 Moreover, it is not necessary to associate the vector data of all customers with the common ID. For example, if a company only participates in the data zone without obtaining individual customers' permission to use data within the data zone, there is no need to associate the common ID with the customer's vector data.

本実施形態では、共通IDでのID統合(ID Connect)を「任意」とする。すなわち、共通IDでのID統合(ID Connect)を「しない」顧客がいても、全体としては機能するような設計とする。 In this embodiment, the ID integration (ID Connect) with the common ID is set to "arbitrary". In other words, even if there is a customer who "does not" integrate IDs (ID Connect) with a common ID, the design should function as a whole.

また、データ圏に加盟した企業から、「生の顧客データ(個人情報)をマザーサーバに送信しない」で、目的を達成できるような設計とする。すなわち、各企業が有する生の顧客データ(個人情報)は、マザーサーバ100には送信されない。各企業が有する生の顧客データ(個人情報)は、匿名化(ベクトル化)され、IDとセットでマザーサーバ100に送信される。 In addition, it will be designed so that the purpose can be achieved by not sending raw customer data (personal information) to the mother server from companies that have joined the data zone. That is, raw customer data (personal information) owned by each company is not sent to the mother server 100 . Raw customer data (personal information) owned by each company is anonymized (vectorized) and sent to the mother server 100 together with an ID.

また、自社データのみを使って、自社顧客データを匿名化(ベクトル化)する分散側AIを導入することで、自社のデータを質、量ともに多く出さないと、自社のターゲティング精度が上がらない仕組みとする。これにより、自社データを出さずに他社データのみ利用するフリーライドを防ぐ。 In addition, by introducing decentralized AI that anonymizes (vectorizes) the company's customer data using only the company's own data, the company's targeting accuracy does not improve unless the company's data is produced in both quality and quantity. and This prevents free rides that use only other companies' data without releasing their own data.

なお、自社の顧客データの量と質が多いほど、自社が受けるメリットが大きくなる。すなわち、顧客単位でデータ圏内でのデータの利用許諾をとり、共通IDと紐づけしたベクトルデータが多いほど精度が向上する。 It should be noted that the greater the quantity and quality of the company's customer data, the greater the benefits it receives. In other words, the more vector data linked with the common ID, the higher the accuracy, as the use permission for data within the data area is obtained on a customer-by-customer basis.

各顧客は、「自身に関する顧客データが匿名化(ベクトル化)されデータ圏内で利用されること」を許諾する。なお、各企業は、各顧客の許諾に対してインセンティブや特典を与えてもよい。例えば、各顧客が許諾した場合、データ圏内の各企業からお得なクーポン等が送られてくる。また、許諾した顧客には、データ圏内での活動(データ圏参加企業の製品購入/サービス利用、広告接触、アンケート回答等)等に応じて報酬(リワード)が発行される。 Each customer consents to "anonymization (vectorization) of customer data concerning itself and use within the data area". In addition, each company may give an incentive or privilege to each customer's approval. For example, if each customer approves, a discount coupon or the like is sent from each company within the data area. In addition, licensed customers will be issued rewards according to their activities within the data zone (purchasing products/services of companies participating in the data zone, contacting advertisements, answering questionnaires, etc.).

マザーサーバ100(サーバ側)は、各企業のCDPから過去の製品購入者ID一覧を正解データとして設定してAI学習を実施する。例えば、A社が自社の製品Xの購入確率の高い顧客のリストである製品購入確率リスト(レコメンドリスト)を作りたい場合、マザーサーバ100(サーバ側)は、A社のCDPから過去の製品Xの購入者のID一覧を正解データとして目的設定してAI学習を実施する。 The mother server 100 (server side) implements AI learning by setting a list of past product purchaser IDs from each company's CDP as correct data. For example, when company A wants to create a product purchase probability list (recommendation list), which is a list of customers who are likely to purchase product X of its own company, the mother server 100 (server side) obtains past product X from company A's CDP. AI learning is performed by setting the purchaser's ID list as correct data as the purpose.

ここで、図3を参照して、キャンペーン目的から学習する事例について説明する。図3は、キャンペーン目的から学習する事例を示す説明図である。なお、AI学習は、キャンペーン毎に実施するものとする。図3に示すように、マザーサーバ100(サーバ側)は、A社のデータから過去の製品Xの購入者のID一覧を目的設定してAI学習を実施する。 Now, with reference to FIG. 3, an example of learning from campaign objectives will be described. FIG. 3 is an explanatory diagram showing an example of learning from the campaign purpose. In addition, AI learning shall be implemented for every campaign. As shown in FIG. 3, the mother server 100 (server side) implements AI learning by setting a list of IDs of past purchasers of product X from company A's data.

このとき、マザーサーバ100(サーバ側)は、各企業の匿名情報とは別に自身が保有する顧客データ(マザー側のデータ)も正解データに加味して設定してもよい。例えば、マザーサーバ100(サーバ側)は、A社が自動車メーカーで、製品Xが特定の車両である場合、マザー側のデータとして、「ゴルフに興味がある人」の顧客データを正解データに加味して設定してもよい。 At this time, the mother server 100 (server side) may set customer data (mother side data) owned by itself separately from each company's anonymous information in consideration of the correct data. For example, if company A is an automobile manufacturer and product X is a specific vehicle, the mother server 100 (server side) adds customer data of "persons interested in golf" to correct data as mother side data. can be set as

そして、マザーサーバ100(サーバ側)は、正解データを与えた当該企業の顧客データの全レコードと、当該企業の顧客データの全レコードのうち共通IDで紐づいている他の加盟企業の全レコードとを学習データとして、AI学習を実施する。 Then, the mother server 100 (server side) provides all records of the customer data of the company to which the correct data is given, and all records of other member companies linked by the common ID among all records of the customer data of the company. is used as learning data, AI learning is performed.

〔1-2.顧客データのベクトル化〕
次に、図4を用いて、本実施形態に係る顧客データのベクトル化について説明する。図4は、顧客データのベクトル化の概要を示す説明図である。本実施形態では、各企業の各顧客の個人情報をベクトル化することで、個人情報ではなくし、しかし、顧客特性を処理できるようにする。
[1-2. Vectorization of customer data]
Next, vectorization of customer data according to this embodiment will be described with reference to FIG. FIG. 4 is an explanatory diagram showing an outline of vectorization of customer data. In this embodiment, the personal information of each customer of each company is vectorized so that it is not personal information, but the customer characteristics can be processed.

図4に示すように、例えば、A社が自動車メーカーで、製品Xが特定の車両である場合、A社のクライアント端末10は、顧客データとして、購入商品、来店・会話内容、問い合わせ・カタログ請求、オウンドWEBログ、広告接触、販促接触等の情報を収集する。 As shown in FIG. 4, for example, when company A is an automobile manufacturer and product X is a specific vehicle, the client terminal 10 of company A stores, as customer data, purchased products, store visit/conversation content, inquiry/catalog request , Owned WEB logs, contact with advertisements, contact with sales promotions, etc.

また、A社のクライアント端末10は、顧客データのベクトル化の手法として、下記の(1)、(2)のうちいずれかの手法を用いる。 In addition, the client terminal 10 of Company A uses one of the following methods (1) and (2) as a method of vectorizing customer data.

(1)A社のクライアント端末10は、顧客が同時に商談や購入する商品(車だと車種)は目的が近しい商品と仮定して、当該商品をベクトル化する。次に、商品ベクトルを用いて、顧客2名をランダムに抽出し、商品ベクトルの近遠を正例、負例として学習する。 (1) The client terminal 10 of Company A assumes that the products (models of cars in the case of cars) that the customer negotiates with or purchases at the same time are products with similar purposes, and vectorizes the products. Next, using the product vector, two customers are randomly extracted, and learning is performed using the product vector near and far as a positive example and a negative example.

(2)A社のクライアント端末10は、BERT(Bidirectional Encoder Representations from Transformers)モデルで穴埋め問題的に学習し、エンベディング(Embedding)層から取得する。なお、BERTは、自然言語処理(NLP:Natural Language Processing)の事前学習用ためのTransformerベースの機械学習手法である。実際には、BERTに限らず、他の自然言語処理であってもよい。例えば、Word2Vec等の分散表現(単語ベクトル)であってもよい。分散表現とは、文字・単語をベクトル空間に埋め込み、その空間上のひとつの点として捉えることであり、単語埋め込み(Word Embedding)とも呼ばれる。 (2) The client terminal 10 of Company A learns from a fill-in-the-blank problem using a BERT (Bidirectional Encoder Representations from Transformers) model and acquires from the embedding layer. Note that BERT is a Transformer-based machine learning technique for pre-training of Natural Language Processing (NLP). Actually, it is not limited to BERT, and other natural language processing may be used. For example, it may be a distributed representation (word vector) such as Word2Vec. Distributed representation is to embed characters/words in a vector space and treat them as one point in the space, and is also called word embedding.

図4に、A社の顧客データの匿名化(ベクトル化)の例を示す。ここでは、説明の簡略化のため、ベクトルの次元を2次元で表現し、ベクトルの近遠により、ベクトル群をいくつかのセグメントに分類する。例えば、「高級スポーツカー指向」、「高級SUV指向」、「低価格帯指向」等のセグメントに分類する。 FIG. 4 shows an example of anonymization (vectorization) of company A's customer data. Here, for simplification of explanation, the dimension of the vector is expressed in two dimensions, and the vector group is classified into several segments according to the nearness and farness of the vector. For example, they are classified into segments such as "luxury sports car oriented", "luxury SUV oriented", and "low price range oriented".

なお、図4に示したA社の顧客データの匿名化(ベクトル化)の例では、ベクトルの次元を2次元で表現しているが、実際のベクトルの次元は2次元に限らず、100次元等であらゆる要素が加味された多次元により各顧客を表現する。 In the example of the anonymization (vectorization) of customer data of company A shown in FIG. Each customer is expressed in a multi-dimensional manner with all elements taken into consideration.

〔1-3.サーバ側での推論〕
次に、図5及び図6を用いて、本実施形態に係るサーバ側での推論について説明する。図5は、サーバ側での推論の概要を示す説明図である。図6は、サーバ側での推論を簡略化した模式図である。なお、サーバ側での推論は、サーバ側でのAI学習の後であってもよいし、同時であってもよい。
[1-3. Inference on the server side]
Next, inference on the server side according to this embodiment will be described with reference to FIGS. 5 and 6. FIG. FIG. 5 is an explanatory diagram showing an outline of inference on the server side. FIG. 6 is a schematic diagram that simplifies inference on the server side. Inference on the server side may be performed after or at the same time as AI learning on the server side.

図5に示すように、マザーサーバ100(サーバ側)は、各企業の顧客データのベクトル(匿名情報)を、マザー側のAIに投入し、各企業の各顧客の製品購入確率リスト(レコメンドリスト)を取得する。 As shown in FIG. 5, the mother server 100 (server side) inputs the customer data vector (anonymous information) of each company to AI on the mother side, and creates a product purchase probability list (recommendation list) for each customer of each company. ).

このとき、マザーサーバ100(サーバ側)は、特定企業の顧客のみ対象とした特定企業のIDによる特定製品の購入確率リスト(例えば製品X購入確率A社IDリスト)と、全企業の顧客を対象とした共通IDによる特定製品の購入確率リスト(例えば製品X購入確率共通IDリスト)とを取得する。 At this time, the mother server 100 (server side) provides a purchase probability list of a specific product by ID of a specific company (for example, product X purchase probability A company ID list) for only customers of a specific company, and a list for customers of all companies. A list of purchase probabilities of specific products (for example, a list of common IDs for product X purchase probabilities) based on common IDs such as product X is obtained.

そして、マザーサーバ100(サーバ側)は、特定企業の顧客のみを対象とした特定企業のIDによる特定製品の購入確率リストを、当該特定企業のクライアント端末10にのみ送信する。このとき、特定企業のクライアント端末10は、特定企業の顧客のみを対象とした特定企業のIDによる特定製品の購入確率リストを基に、後述するベクトル近傍顧客拡張の処理を実施する。 Then, the mother server 100 (server side) transmits the purchase probability list of the specific product by the ID of the specific company targeted only for the customers of the specific company only to the client terminal 10 of the specific company. At this time, the client terminal 10 of the specific company performs processing of vector neighborhood customer expansion, which will be described later, based on the purchase probability list of the specific product by the ID of the specific company targeted only for the customers of the specific company.

また、マザーサーバ100(サーバ側)は、全企業の顧客を対象とした共通IDによる特定製品の購入確率リストを基に、全企業の顧客を対象とした広告配信やSNSでのクーポン券配布等をすることができる。 In addition, the mother server 100 (server side) distributes advertisements to customers of all companies, distributes coupons on SNS, etc., based on the purchase probability list of a specific product with a common ID for customers of all companies. can do

図6に示すように、A社が自社の製品Xを購入してくれる確率の高い顧客のリストを所望している場合、マザーサーバ100(サーバ側)は、過去にA社の製品Xを購入した顧客のうち、共通ID連携を許諾している顧客の情報を正解データとして、マザー側のAIに投入し、A社の製品Xの購入確率リスト(レコメンドリスト)を取得する。そして、マザーサーバ100(サーバ側)は、製品Xの購入確率リストを基に、広告配信やSNSでのクーポン券配布等を実施する。また、マザーサーバ100(サーバ側)は、A社のCRM(Customer Relationship Management)にリストを戻して、A社のCDP内等でベクトル近傍拡張をする場合もあり、ベクトル近傍拡張をした後、A社のCRMでマーケティング活動を行うことを可能にする。 As shown in FIG. 6, when Company A desires a list of customers with a high probability of purchasing Company A's product X, the mother server 100 (on the server side) has purchased Company A's product X in the past. Among the customers who have accepted the common ID, the information of the customers who have approved the shared ID cooperation is input to AI on the mother side as correct data, and a purchase probability list (recommendation list) of product X of company A is acquired. Then, the mother server 100 (server side) carries out advertisement distribution, coupon distribution on SNS, etc., based on the purchase probability list of product X. FIG. In addition, the mother server 100 (server side) may return the list to Company A's CRM (Customer Relationship Management) and perform vector neighborhood expansion in Company A's CDP or the like. Allows you to conduct marketing activities in your company's CRM.

〔1-4.ベクトル近傍顧客拡張〕
次に、図7を用いて、本実施形態に係るベクトル近傍顧客拡張について説明する。図7は、ベクトル近傍顧客拡張の概要を示す説明図である。
[1-4. Vector Neighborhood Customer Extension]
Next, vector neighborhood customer expansion according to the present embodiment will be described with reference to FIG. FIG. 7 is an explanatory diagram showing an outline of vector neighborhood customer extension.

マザーサーバ100(サーバ側)で正解データを推論する際には、マザー側にあるベクトルデータ(ID Connectされた顧客のベクトルデータ)のみを元にするので、クライアント側CDPに戻した際に、そこで自社内のデータのベクトルで近傍拡張を行う。 When inferring the correct data on the mother server 100 (server side), only vector data on the mother side (vector data of customers who are ID Connected) is used as the basis, so when returning to the client side CDP, Perform neighborhood expansion on vectors of in-house data.

例えば、A社のクライアント端末10は、A社の顧客データから、顧客である利用者U1、U2が製品Xを購入する候補だと仮定する。そして、A社のクライアント端末10は、A社のCDP内でベクトル化の学習処理を実行する(図7の「A社 顧客ベクトル」参照)。 For example, the client terminal 10 of company A assumes that users U1 and U2 who are customers are candidates for purchasing product X, based on company A's customer data. Then, the client terminal 10 of Company A executes vectorization learning processing within the CDP of Company A (see "Customer Vector of Company A" in FIG. 7).

このとき、マザーサーバ100(サーバ側)は、利用者U1~U4のうち、共通IDでのID統合(ID Connect)をしている利用者U1、U4のデータを活用してマザー側のAIで学習する。ここでは、利用者U1~U4を例に説明しているが、実際には、他社の顧客(ID Connectされたユーザ)も含めデータ数はもっと膨大である。 At this time, the mother server 100 (server side) utilizes the data of the users U1 and U4, among the users U1 to U4, who are performing ID integration (ID Connect) with the common ID, and uses the AI on the mother side to learn. Here, users U1 to U4 are explained as an example, but in reality, the number of data including other companies' customers (ID Connected users) is much larger.

マザーサーバ100(サーバ側)は、マザー側の全企業の全顧客のベクトルから、A社の製品Xの購入確率が高い人を推論する。このとき、A社のデータ内からは利用者U1が抽出される(利用者U2はID Connectしてない)。 The mother server 100 (server side) infers a person who has a high probability of purchasing product X of company A from the vectors of all customers of all companies on the mother side. At this time, user U1 is extracted from the data of company A (user U2 is not ID-connected).

そして、マザーサーバ100(サーバ側)は、A社のCDPに製品X購入候補としてU1をフィードバックする。そこで、A社のクライアント端末10は、マザー側からのフィードバックに応じて、ベクトル近傍顧客拡張を行う。具体的には、A社のクライアント端末10は、図7の「A社 顧客ベクトル」に示すように、A社内の顧客データのベクトルでは、利用者U1の近傍には利用者U2が存在するので、利用者U2も製品Xの購入候補とする。 Then, the mother server 100 (server side) feeds back U1 to the CDP of company A as a product X purchase candidate. Therefore, the client terminal 10 of company A performs vector neighborhood customer expansion according to the feedback from the mother side. Specifically, the client terminal 10 of company A has user U2 in the vicinity of user U1 in the customer data vector of company A, as shown in "A company customer vector" in FIG. , user U2 is also a purchase candidate for product X.

〔1-5.1stPartyデータ圏構想〕
上記のように、各企業は、1stPartyデータ圏構想に加盟すると、極めて高精度のパーソナルマーケテイングが可能となる。図8は、1stPartyデータ圏構想のイメージを示す概念図である。
[1-5. 1stParty data zone concept]
As mentioned above, when each company joins the 1stParty data zone concept, extremely high-precision personal marketing becomes possible. FIG. 8 is a conceptual diagram showing an image of the 1stParty data zone concept.

例えば、データ圏に加盟する全企業の共通ID Connectを承諾した全顧客データを学習したAIでターゲティングをすることができる(高精度のターゲティング)。 For example, targeting can be done with AI that has learned all customer data that has accepted the common ID Connect of all companies that join the data zone (high-precision targeting).

また、各企業の顧客データ自体は、他社やマザー側に渡らない。各企業の顧客データは数値の羅列に変換(ベクトル化)された匿名情報の状態で、マザー側のAIで学習される(自社の顧客データ自体は出さないでOK)。 In addition, the customer data of each company will not be passed on to other companies or the mother side. The customer data of each company is converted into a list of numbers (vectorized), and in the state of anonymous information, AI is learned on the mother side (the company's customer data itself is OK).

また、自社のベクトルデータ(自社の顧客データに基づく匿名情報)の量と質が高いほど、自社のターゲティング精度が上がる。そのため、1stPartyデータ圏に提供した自社のベクトルデータの件数が多くなるほど精度が向上する。反対に、自社のベクトルデータの件数が少ないほど精度は低くなる(フリーライドできない仕組み)。 Also, the higher the quantity and quality of the company's vector data (anonymous information based on the company's customer data), the higher the company's targeting accuracy. Therefore, the more the company's vector data provided to the 1stParty data zone, the higher the accuracy. Conversely, the smaller the number of company vector data, the lower the accuracy (a mechanism that cannot be free-rided).

仮に自社のベクトルデータを全く提供しなければ、データ圏には内容のわからない他社のベクトルデータが存在するだけであり、自社の顧客データや自社のベクトルデータとの関係は不明である。自社のベクトルデータを提供することで、自社のベクトルデータと他社のベクトルデータとを連結させてターゲティングをすることができる。また、自社のベクトルデータの内容や件数が増えるほど、他社のベクトルデータとのつながりが増え、データ圏からより多くの情報を得ることができる。 If you do not provide your company's vector data at all, there will only be vector data of other companies whose content is unknown in the data area, and the relationship between your company's customer data and your company's vector data is unknown. By providing your company's vector data, you can target by linking your company's vector data with the vector data of other companies. In addition, the more the content and number of the company's vector data increases, the more connections there are with the vector data of other companies, and the more information can be obtained from the data area.

自社のターゲティング精度を向上させるため、各企業が自社のベクトルデータを積極的に提供することで、大量のベクトルデータが自然とマザー側に集まるという好循環が生まれる。 In order to improve their own targeting accuracy, each company actively provides its own vector data, creating a virtuous cycle in which a large amount of vector data naturally gathers on the mother side.

本実施形態によれば、各企業が生の個人情報を出すことなく、データ圏連携、ターゲティング精度を向上できる。また、フリーライドできない仕組みがあるので全体としての精度が相乗効果的に向上していく。また、各企業から見たときに、データ圏に乗っかっても、自社のデータや状況が他社に見られない(例えば、A社からみて自社の店舗に顧客がどれくらい訪問しているか等を、B社には知られない)。また、マザー側が多数のサービスを展開している場合(ポータルサイトなど)、広告配信やSNSなど、マスマーケティングにも使える。 According to this embodiment, data area cooperation and targeting accuracy can be improved without each company providing raw personal information. In addition, since there is a mechanism that prevents free riding, the accuracy as a whole improves synergistically. In addition, when viewed from the perspective of each company, even if it is in the data zone, other companies cannot see their company's data and situation (for example, from the perspective of company A, how many customers have visited their own store, etc. unknown to the company). In addition, if the mother side is developing a large number of services (portal site, etc.), it can also be used for mass marketing such as advertisement distribution and SNS.

〔2.マザーサーバの構成例〕
次に、図9を用いて、実施形態に係るマザーサーバ100の構成について説明する。図9は、実施形態に係るマザーサーバ100の構成例を示す図である。図9に示すように、マザーサーバ100は、通信部110と、記憶部120と、制御部130とを有する。
[2. Mother server configuration example]
Next, the configuration of the mother server 100 according to the embodiment will be described using FIG. FIG. 9 is a diagram showing a configuration example of the mother server 100 according to the embodiment. As shown in FIG. 9, the mother server 100 has a communication section 110, a storage section 120, and a control section .

(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。また、通信部110は、ネットワークNと有線又は無線で接続される。
(Communication unit 110)
The communication unit 110 is realized by, for example, a NIC (Network Interface Card) or the like. Also, the communication unit 110 is connected to the network N by wire or wirelessly.

(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置によって実現される。図9に示すように、記憶部120は、利用者情報データベース121と、履歴情報データベース122と、匿名情報データベース123とを有する。
(storage unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory device such as a RAM (Random Access Memory) or flash memory, or a storage device such as a hard disk or an optical disk. As shown in FIG. 9 , storage unit 120 has user information database 121 , history information database 122 , and anonymous information database 123 .

(利用者情報データベース121)
利用者情報データベース121は、マザーサーバ100が独自に収集した利用者U(ユーザ)に関する利用者情報を記憶する。例えば、利用者情報データベース121は、利用者Uの属性等の種々の情報を記憶する。図10は、利用者情報データベース121の一例を示す図である。図10に示した例では、利用者情報データベース121は、「利用者ID(Identifier)」、「年齢」、「性別」、「自宅」、「勤務地」、「興味」といった項目を有する。
(User information database 121)
The user information database 121 stores user information about users U (users) that the mother server 100 independently collects. For example, the user information database 121 stores various information such as user U attributes. FIG. 10 is a diagram showing an example of the user information database 121. As shown in FIG. In the example shown in FIG. 10, the user information database 121 has items such as "user ID (Identifier)", "age", "gender", "home", "place of work", and "interest".

「利用者ID」は、利用者Uを識別するための識別情報を示す。なお、「利用者ID」は、利用者Uの連絡先(電話番号、メールアドレス等)であってもよいし、利用者Uのクライアント端末10を識別するための識別情報であってもよい。 “User ID” indicates identification information for identifying the user U. The “user ID” may be the user U's contact information (telephone number, e-mail address, etc.), or may be identification information for identifying the user U's client terminal 10 .

また、「年齢」は、利用者IDにより識別される利用者Uの年齢を示す。なお、「年齢」は、利用者Uの具体的な年齢(例えば35歳など)を示す情報であってもよいし、利用者Uの年代(例えば30代など)を示す情報であってもよい。あるいは、「年齢」は、利用者Uの生年月日を示す情報であってもよいし、利用者Uの世代(例えば80年代生まれなど)を示す情報であってもよい。また、「性別」は、利用者IDにより識別される利用者Uの性別を示す。 "Age" indicates the age of the user U identified by the user ID. Note that the "age" may be information indicating a specific age of the user U (for example, 35 years old) or information indicating the age of the user U (for example, 30's). . Alternatively, the "age" may be information indicating the date of birth of the user U, or information indicating the generation of the user U (for example, born in the 80's). "Gender" indicates the gender of the user U identified by the user ID.

また、「自宅」は、利用者IDにより識別される利用者Uの自宅の位置情報を示す。なお、図10に示す例では、「自宅」は、「LC11」といった抽象的な符号を図示するが、緯度経度情報等であってもよい。また、例えば、「自宅」は、地域名や住所であってもよい。 "Home" indicates location information of the home of the user U identified by the user ID. In the example shown in FIG. 10, "home" is represented by an abstract code such as "LC11", but may be latitude/longitude information or the like. Also, for example, "home" may be an area name or an address.

また、「勤務地」は、利用者IDにより識別される利用者Uの勤務地(学生の場合は学校)の位置情報を示す。なお、図10に示す例では、「勤務地」は、「LC12」といった抽象的な符号を図示するが、緯度経度情報等であってもよい。また、例えば、「勤務地」は、地域名や住所であってもよい。 "Place of work" indicates location information of the place of work (school in the case of a student) of the user U identified by the user ID. In the example shown in FIG. 10, the "place of work" is illustrated as an abstract code such as "LC12", but may be latitude/longitude information or the like. Also, for example, the "place of work" may be an area name or an address.

また、「興味」は、利用者IDにより識別される利用者Uの興味を示す。すなわち、「興味」は、利用者IDにより識別される利用者Uが関心の高い対象を示す。例えば、「興味」は、利用者Uが検索エンジンに入力して検索した検索クエリ(キーワード)等であってもよい。なお、図10に示す例では、「興味」は、各利用者Uに1つずつ図示するが、複数であってもよい。 "Interest" indicates the interest of the user U identified by the user ID. That is, "interest" indicates an object in which the user U identified by the user ID is highly interested. For example, the "interest" may be a search query (keyword) that the user U has entered into a search engine and searched for. In the example shown in FIG. 10, one "interest" is shown for each user U, but there may be more than one.

例えば、図10に示す例において、利用者ID「U1」により識別される利用者Uの年齢は、「20代」であり、性別は、「男性」であることを示す。また、例えば、利用者ID「U1」により識別される利用者Uは、自宅が「LC11」であることを示す。また、例えば、利用者ID「U1」により識別される利用者Uは、勤務地が「LC12」であることを示す。また、例えば、利用者ID「U1」により識別される利用者Uは、「スポーツ」に興味があることを示す。 For example, in the example shown in FIG. 10, the age of the user U identified by the user ID "U1" is "twenties" and the gender is "male". Also, for example, the user U identified by the user ID "U1" indicates that the home is "LC11". Also, for example, the user U identified by the user ID "U1" indicates that the place of work is "LC12". Also, for example, the user U identified by the user ID "U1" indicates that he is interested in "sports".

ここで、図10に示す例では、「U1」、「LC11」及び「LC12」といった抽象的な値を用いて図示するが、「U1」、「LC11」及び「LC12」には、具体的な文字列や数値等の情報が記憶されるものとする。以下、他の情報に関する図においても、抽象的な値を図示する場合がある。 Here, in the example shown in FIG. 10, abstract values such as “U1”, “LC11” and “LC12” are used, but “U1”, “LC11” and “LC12” are concrete values. It is assumed that information such as character strings and numerical values is stored. Hereinafter, abstract values may also be illustrated in diagrams relating to other information.

なお、利用者情報データベース121は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、利用者情報データベース121は、利用者Uのクライアント端末10に関する各種情報を記憶してもよい。また、利用者情報データベース121は、利用者Uのデモグラフィック(人口統計学的属性)、サイコグラフィック(心理学的属性)、ジオグラフィック(地理学的属性)、ベヘイビオラル(行動学的属性)等の属性に関する情報を記憶してもよい。例えば、利用者情報データベース121は、氏名、家族構成、出身地(地元)、職業、職位、収入、資格、居住形態(戸建、マンション等)、車の有無、通学・通勤時間、通学・通勤経路、定期券区間(駅、路線等)、利用頻度の高い駅(自宅・勤務地の最寄駅以外)、習い事(場所、時間帯等)、趣味、興味、ライフスタイル等の情報を記憶してもよい。 The user information database 121 is not limited to the above, and may store various types of information depending on the purpose. For example, the user information database 121 may store various information about the client terminal 10 of the user U. FIG. In addition, the user information database 121 stores user U's demographics (demographic attributes), psychographics (psychological attributes), geographics (geographical attributes), behavioral attributes (behavioral attributes), etc. Information about attributes may be stored. For example, the user information database 121 includes name, family structure, hometown (local), occupation, position, income, qualification, residence type (detached house, condominium, etc.), presence or absence of car, commuting time, commuting time, commuting time. Information such as routes, commuter pass sections (stations, lines, etc.), frequently used stations (other than the nearest station to your home or place of work), lessons (places, time zones, etc.), hobbies, interests, lifestyle, etc. may

(履歴情報データベース122)
履歴情報データベース122は、マザーサーバ100が独自に収集した利用者Uの行動を示す履歴情報(ログデータ)に関する各種情報を記憶する。図11は、履歴情報データベース122の一例を示す図である。図11に示した例では、履歴情報データベース122は、「利用者ID」、「位置履歴」、「検索履歴」、「閲覧履歴」、「購買履歴」、「投稿履歴」といった項目を有する。
(History information database 122)
The history information database 122 stores various types of information related to history information (log data) indicating the behavior of the user U, which the mother server 100 independently collects. FIG. 11 is a diagram showing an example of the history information database 122. As shown in FIG. In the example shown in FIG. 11, the history information database 122 has items such as "user ID", "location history", "search history", "browsing history", "purchase history", and "posting history".

「利用者ID」は、利用者Uを識別するための識別情報を示す。また、「位置履歴」は、利用者Uの位置や移動の履歴である位置履歴を示す。また、「検索履歴」は、利用者Uが入力した検索クエリの履歴である検索履歴を示す。また、「閲覧履歴」は、利用者Uが閲覧したコンテンツの履歴である閲覧履歴を示す。また、「購買履歴」は、利用者Uによる購買の履歴である購買履歴を示す。また、「投稿履歴」は、利用者Uによる投稿の履歴である投稿履歴を示す。なお、「投稿履歴」は、利用者Uの所有物に関する質問を含んでいてもよい。 “User ID” indicates identification information for identifying the user U. "Position history" indicates a position history, which is a history of the user's U position and movement. Also, "search history" indicates a search history that is a history of search queries input by the user U. FIG. "Browsing history" indicates a browsing history that is a history of contents browsed by the user U. FIG. "Purchase history" indicates the purchase history of the user U's purchases. In addition, “posting history” indicates a posting history that is a history of posts by the user U. FIG. In addition, the “posting history” may include questions about user U's property.

例えば、図11に示す例において、利用者ID「U1」により識別される利用者Uは、「位置履歴#1」の通りに移動し、「検索履歴#1」の通りに検索し、「閲覧履歴#1」の通りにコンテンツを閲覧し、「購買履歴#1」の通りに所定の店舗等で所定の商品等を購入し、「投稿履歴」の通りに投稿したことを示す。 For example, in the example shown in FIG. 11, the user U identified by the user ID "U1" moves along the "location history #1", searches along the "search history #1", It indicates that the content was browsed according to the "Purchase history #1", the predetermined product etc. was purchased at the predetermined store etc. according to the "Purchase history #1", and the content was posted according to the "Posting history".

ここで、図11に示す例では、「U1」、「位置履歴#1」、「検索履歴#1」、「閲覧履歴#1」、「購買履歴#1」及び「投稿履歴#1」といった抽象的な値を用いて図示するが、「U1」、「位置履歴#1」、「検索履歴#1」、「閲覧履歴#1」、「購買履歴#1」及び「投稿履歴#1」には、具体的な文字列や数値等の情報が記憶されるものとする。 Here, in the example shown in FIG. 11, abstract history such as "U1", "location history #1", "search history #1", "browsing history #1", "purchase history #1", and "posting history #1" "U1", "location history #1", "search history #1", "browsing history #1", "purchase history #1" and "posting history #1" , information such as specific character strings and numerical values are stored.

なお、履歴情報データベース122は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、履歴情報データベース122は、利用者Uの所定のサービスの利用履歴等を記憶してもよい。また、履歴情報データベース122は、利用者Uの実店舗の来店履歴又は施設の訪問履歴等を記憶してもよい。また、履歴情報データベース122は、利用者Uのクライアント端末10を用いた決済(電子決済)での決済履歴等を記憶してもよい。 Note that the history information database 122 may store various types of information, not limited to the above, depending on the purpose. For example, the history information database 122 may store the user U's usage history of a predetermined service. In addition, the history information database 122 may store the user U's store visit history, facility visit history, and the like. Also, the history information database 122 may store a payment history of payment (electronic payment) using the client terminal 10 of the user U, and the like.

(匿名情報データベース123)
匿名情報データベース123は、利用者Uの匿名情報(ベクトルデータ)に関する各種情報を記憶する。図12は、匿名情報データベース123の一例を示す図である。図12に示した例では、匿名情報データベース123は、「共通ID」、「企業別ID」、「企業」、「ベクトル」、「推論」といった項目を有する。
(Anonymous information database 123)
The anonymous information database 123 stores various types of information regarding user U's anonymous information (vector data). FIG. 12 is a diagram showing an example of the anonymous information database 123. As shown in FIG. In the example shown in FIG. 12, the anonymous information database 123 has items such as "common ID", "company ID", "company", "vector", and "inference".

「共通ID」は、データ圏で共通の顧客IDを示す。また、「企業別ID」は、企業ごとの独自の顧客IDを示す。また、「企業」は、当該匿名情報(ベクトルデータ)を提供した企業を示す。 "Common ID" indicates a common customer ID in the data area. "Company ID" indicates a unique customer ID for each company. "Company" indicates the company that provided the anonymous information (vector data).

また、「ベクトル」は、企業ごとの顧客データを匿名化(ベクトル化)したベクトル値を示す。「ベクトル」は、多次元であってもよい。すなわち、「ベクトル」は、複数のベクトル値の集合であってもよい。 "Vector" indicates a vector value obtained by anonymizing (vectorizing) customer data for each company. A "vector" may be multi-dimensional. That is, a "vector" may be a set of vector values.

また、「推論」は、ベクトルに基づく推論の結果を示す。例えば、「推論」は、各企業の各顧客の製品購入確率リスト(レコメンドリスト)であってもよい。なお、「推論」は、企業ごと(企業別ID毎)の推論の結果に限らず、全企業に共通(共通ID)の推論の結果も含まれる。 Also, "inference" indicates the result of inference based on vectors. For example, the “inference” may be a product purchase probability list (recommendation list) of each customer of each company. Note that "inference" is not limited to the result of inference for each company (for each company ID), but also includes the result of inference common to all companies (common ID).

例えば、図12に示す例において、共通ID「U1」により識別される利用者Uは、企業別ID「U1A」により「A社」の顧客データで管理されており、顧客データを匿名化(ベクトル化)した「ベクトルA1」に基づいて「推論A1」が得られることを示す。 For example, in the example shown in FIG. 12, the user U identified by the common ID "U1" is managed by the customer data of "A company" by the company ID "U1A", and the customer data is anonymized (vector It shows that the "inference A1" can be obtained based on the "vector A1" converted into

ここで、図12に示す例では、「U1」、「U1A」、「A社」、「ベクトルA1」及び「推論A1」といった抽象的な値を用いて図示するが、「U1」、「U1A」、「A社」、「ベクトルA1」及び「推論A1」には、具体的な文字列や数値等の情報が記憶されるものとする。以下、他の情報に関する図においても、抽象的な値を図示する場合がある。 Here, in the example shown in FIG. 12, abstract values such as "U1", "U1A", "A company", "vector A1" and "inference A1" are used. ”, “Company A”, “Vector A1”, and “Inference A1” store information such as specific character strings and numerical values. Hereinafter, abstract values may also be illustrated in diagrams relating to other information.

なお、匿名情報データベース123は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、匿名情報データベース123は、クライアント側及びマザー側のAIに関する情報等を記憶してもよい。また、匿名情報データベース123は、AI学習や推論の手法に関する情報等を記憶してもよい。 It should be noted that the anonymous information database 123 may store various types of information, not limited to the above, depending on the purpose. For example, the anonymous information database 123 may store information about AI on the client side and the mother side. The anonymous information database 123 may also store information about AI learning and inference techniques.

(制御部130)
図9に戻り、説明を続ける。制御部130は、コントローラ(Controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等によって、マザーサーバ100の内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAM等の記憶領域を作業領域として実行されることにより実現される。図9に示す例では、制御部130は、取得部131と、学習部132と、推定部133と、提供部134とを有する。
(control unit 130)
Returning to FIG. 9, the description is continued. The control unit 130 is a controller, and for example, a CPU (Central Processing Unit), an MPU (Micro Processing Unit), an ASIC (Application Specific Integrated Circuit), an FPGA (Field Programmable Gate Array), etc., controls the mother server 100. Various programs (corresponding to an example of an information processing program) stored in an internal storage device are executed by using a storage area such as a RAM as a work area. In the example illustrated in FIG. 9 , the control unit 130 has an acquisition unit 131 , a learning unit 132 , an estimation unit 133 and a provision unit 134 .

(取得部131)
取得部131は、利用者Uにより入力された検索クエリを取得する。例えば、取得部131は、利用者Uが検索エンジン等に検索クエリを入力してキーワード検索を行った際に、通信部110を介して、当該検索クエリを取得する。
(Acquisition unit 131)
The acquisition unit 131 acquires a search query input by the user U. For example, the acquisition unit 131 acquires the search query via the communication unit 110 when the user U inputs a search query into a search engine or the like and performs a keyword search.

また、取得部131は、通信部110を介して、利用者Uに関する利用者情報を取得する。例えば、取得部131は、利用者Uのクライアント端末10から、利用者Uを示す識別情報(利用者ID等)や、利用者Uの位置情報、利用者Uの属性情報等を取得する。また、取得部131は、利用者Uのユーザ登録時に、利用者Uを示す識別情報や、利用者Uの属性情報等を取得してもよい。そして、取得部131は、利用者情報を、記憶部120の利用者情報データベース121に登録する。 The acquisition unit 131 also acquires user information about the user U via the communication unit 110 . For example, the acquisition unit 131 acquires, from the client terminal 10 of the user U, identification information (user ID, etc.) indicating the user U, location information of the user U, attribute information of the user U, and the like. Further, the acquisition unit 131 may acquire identification information indicating the user U, attribute information of the user U, and the like when the user U is registered as a user. Acquisition unit 131 then registers the user information in user information database 121 of storage unit 120 .

また、取得部131は、通信部110を介して、利用者Uの行動を示す各種の履歴情報(ログデータ)を取得する。例えば、取得部131は、利用者Uのクライアント端末10から、あるいは利用者ID等に基づいて各種サーバ等から、利用者Uの行動を示す各種の履歴情報を取得する。そして、取得部131は、各種の履歴情報を、記憶部120の履歴情報データベース122に登録する。 In addition, the acquisition unit 131 acquires various types of history information (log data) indicating actions of the user U via the communication unit 110 . For example, the acquisition unit 131 acquires various types of history information indicating actions of the user U from the client terminal 10 of the user U or from various servers based on the user ID or the like. The acquisition unit 131 then registers various types of history information in the history information database 122 of the storage unit 120 .

また、取得部131は、通信部110を介して、データ圏に参加する各企業のクライアント端末10から、顧客データを匿名化(ベクトル化)した匿名情報を取得する。例えば、取得部131は、通信部110を介して、各企業のクライアント端末10から、クライアント側AIにより顧客データを匿名化(ベクトル化)した匿名情報を取得する。 Also, the acquisition unit 131 acquires anonymous information obtained by anonymizing (vectorizing) customer data from the client terminals 10 of each company participating in the data zone via the communication unit 110 . For example, the acquisition unit 131 acquires anonymous information obtained by anonymizing (vectorizing) customer data by the client-side AI from the client terminal 10 of each company via the communication unit 110 .

このとき、取得部131は、業種が異なる複数の企業の各々のクライアント端末10から、顧客データを匿名化(ベクトル化)した匿名情報を取得する。なお、複数の企業の中に、競合企業(同業他社)が含まれていてもよい。 At this time, the acquisition unit 131 acquires anonymous information obtained by anonymizing (vectorizing) customer data from each of the client terminals 10 of a plurality of companies in different industries. Competitors (other companies in the same industry) may be included in the plurality of companies.

なお、匿名情報は、顧客データをベクトル化した多次元のベクトルデータであり、顧客データを復元する手段が存在しない不可逆な情報である。すなわち、匿名情報は、顧客データを暗号化したデータではなく、復号できない。 Anonymous information is multidimensional vector data obtained by vectorizing customer data, and is irreversible information for which there is no means for restoring customer data. In other words, anonymous information is not encrypted customer data and cannot be decrypted.

(学習部132)
学習部132は、各企業のクライアント端末10からの匿名情報を用いてAIの機械学習をする。このとき、学習部132は、各企業のクライアント端末10からの匿名情報に、各企業とは別にマザーサーバ100が独自に収集した顧客データ(マザー側のデータ)を匿名化(ベクトル化)した匿名情報を加えてAIの機械学習をしてもよい。
(learning unit 132)
The learning unit 132 performs AI machine learning using anonymous information from the client terminal 10 of each company. At this time, the learning unit 132 anonymizes (vectorizes) customer data (mother-side data) independently collected by the mother server 100 separately from each company to the anonymous information from the client terminal 10 of each company. AI may be machine-learned by adding information.

また、学習部132は、AIの機械学習の際に、各企業のクライアント端末10からの匿名情報のうち目的に対応するデータを正解データとして特定企業の目的設定を行う。このとき、学習部132は、各企業のクライアント端末10からの匿名情報のうち目的に対応するデータに、各企業とは別にマザーサーバ100が独自に収集した顧客データを加味したデータを正解データとして特定企業の目的設定を行うようにしてもよい。また、マザー側AIもクライアント側AIと同様に顧客データを匿名化(匿名化(ベクトル化))して匿名情報に変換できる場合、マザーサーバ100が独自に収集した顧客データをそのままマザー側のAIに入力してもよい。 Also, the learning unit 132 sets the purpose of a specific company by using, as correct data, data corresponding to the purpose among the anonymous information from the client terminal 10 of each company during AI machine learning. At this time, the learning unit 132 selects the data corresponding to the purpose among the anonymous information from the client terminal 10 of each company and the customer data collected independently by the mother server 100 separately from each company as correct data. You may make it set the objective of a specific company. In addition, if the mother-side AI can also anonymize (anonymize (vectorize)) customer data and convert it into anonymous information in the same way as the client-side AI, the customer data collected independently by the mother server 100 can be directly used by the mother-side AI. can be entered in

(推定部133)
推定部133は、学習部132による機械学習を経たAIにより、複数の企業のうち特定企業の目的に適合する顧客を推定する。
(Estimation unit 133)
The estimating unit 133 estimates a customer who matches the purpose of a specific company among a plurality of companies by AI that has undergone machine learning by the learning unit 132 .

なお、推定部133は、複数の企業のうち、特定企業からの匿名情報の件数が多くなるほど、特定企業の目的に適合する顧客をより高精度に推定する。裏を返せば、特定企業からの匿名情報の件数が少ないほど、特定企業の目的に適合する顧客を推定する精度が低くなる。 It should be noted that the estimation unit 133 more accurately estimates a customer who meets the purpose of a specific company among a plurality of companies as the number of anonymous information items from the specific company increases. Conversely, the smaller the number of anonymous information from a specific company, the lower the accuracy of estimating customers who meet the purpose of the specific company.

また、推定部133は、複数の企業のうち特定企業の特定商品の購入確率が高い顧客を推定し、該顧客をリスト化した商品購入確率リストを生成する。 Also, the estimation unit 133 estimates a customer who has a high probability of purchasing a specific product from a specific company among a plurality of companies, and generates a product purchase probability list in which the customers are listed.

(提供部134)
提供部134は、通信部110を介して、顧客データを匿名化(ベクトル化)するためのクライアント側AIを複数の企業の各々のクライアント端末10に提供する。
(Providing unit 134)
The providing unit 134 provides client-side AI for anonymizing (vectorizing) customer data to the client terminals 10 of each of the plurality of companies via the communication unit 110 .

また、提供部134は、通信部110を介して、推定部133による推定結果に基づく情報を提供する。例えば、提供部134は、通信部110を介して、特定企業の特定商品の購入確率が高い顧客をリスト化した商品購入確率リストを特定企業のクライアント端末10に提供する。これにより、特定企業(クライアント側)が、マザー側からのリストに掲載された顧客に対して広告配信やクーポンの配布を実施して、その結果、新たな顧客を獲得し、新たな顧客に関する匿名情報をマザー側に提供することで、AIの推論の精度がさらに向上する。 Also, the providing unit 134 provides information based on the estimation result by the estimating unit 133 via the communication unit 110 . For example, the providing unit 134 provides the client terminal 10 of the specific company with a product purchase probability list in which customers with a high probability of purchasing the specific product of the specific company are listed via the communication unit 110 . As a result, a specific company (client side) distributes advertisements and coupons to customers listed on the list from the mother side, and as a result acquires new customers. By providing information to the mother side, the accuracy of AI's inference will be further improved.

また、提供部134は、通信部110を介して、商品購入確率リストに掲載された顧客に対して、特定企業の特定商品に関する広告配信及びクーポン配布を行う。その結果、特定企業(クライアント側)が新たな顧客を獲得し、新たな顧客に関する匿名情報をマザー側に提供することで、AIの推論の精度がさらに向上する。 Also, the providing unit 134 distributes advertisements and coupons relating to specific products of specific companies to customers listed on the product purchase probability list via the communication unit 110 . As a result, the specific company (client side) acquires new customers and provides anonymous information on the new customers to the mother side, further improving the accuracy of AI's inference.

〔3.処理手順〕
次に、図13を用いて実施形態に係るマザーサーバ100による処理手順について説明する。図13は、実施形態に係る処理手順を示すフローチャートである。なお、以下に示す処理手順は、マザーサーバ100の制御部130によって繰り返し実行される。
[3. Processing procedure]
Next, a processing procedure by the mother server 100 according to the embodiment will be described with reference to FIG. 13 . FIG. 13 is a flowchart illustrating a processing procedure according to the embodiment; Note that the processing procedure described below is repeatedly executed by the control unit 130 of the mother server 100 .

図13に示すように、提供部134は、通信部110を介して、顧客データを匿名化(ベクトル化)するためのクライアント側AIを複数の企業の各々のクライアント端末10に提供する(ステップS101)。 As shown in FIG. 13, the providing unit 134 provides client-side AI for anonymizing (vectorizing) customer data to the client terminals 10 of each of a plurality of companies via the communication unit 110 (step S101). ).

続いて、マザーサーバ100の取得部131は、通信部110を介して、データ圏に参加する各企業のクライアント端末10から、クライアント側AIにより顧客データを匿名化(ベクトル化)した匿名情報を取得する(ステップS102)。データ圏に参加する各企業には、競合や異業種の企業も含まれる。 Subsequently, the acquisition unit 131 of the mother server 100 acquires anonymous information obtained by anonymizing (vectorizing) customer data using the client-side AI from the client terminals 10 of each company participating in the data area via the communication unit 110. (step S102). Each company participating in the data sphere includes competitors and companies in other industries.

続いて、マザーサーバ100の学習部132は、各企業のクライアント端末10からの匿名情報を用いてAIの機械学習をする(ステップS103)。このとき、学習部132は、各企業のクライアント端末10からの匿名情報と、各企業とは別にマザーサーバ100が独自に収集した顧客データ(マザー側のデータ)を匿名化(ベクトル化)した匿名情報戸を用いてAIの機械学習をする。 Subsequently, the learning unit 132 of the mother server 100 performs AI machine learning using anonymous information from the client terminals 10 of each company (step S103). At this time, the learning unit 132 anonymizes (vectorizes) anonymous information from the client terminal 10 of each company and customer data (mother-side data) independently collected by the mother server 100 separately from each company. AI machine learning using information doors.

続いて、マザーサーバ100の学習部132は、AIの機械学習の際に、各企業のクライアント端末10からの匿名情報のうち目的に対応するデータに、各企業とは別にマザーサーバ100が独自に収集した顧客データを加味したデータを正解データとして特定企業の目的設定を行う(ステップS104)。なお、マザー側の顧客データを加味するかは任意である。無論、各企業のクライアント端末10からの匿名情報のうち目的に対応するデータのみを正解データとしても問題ない。 Next, during AI machine learning, the learning unit 132 of the mother server 100 adds data corresponding to the purpose of the anonymous information from the client terminals 10 of each company to the mother server 100 independently of each company. The purpose of the specific company is set by using the collected customer data as correct data (step S104). It is optional whether or not to add customer data on the mother side. Of course, there is no problem even if only the data corresponding to the purpose among the anonymous information from the client terminal 10 of each company is used as the correct data.

続いて、マザーサーバ100の推定部133は、学習部132による機械学習を経たAIにより、複数の企業のうち、特定企業の目的に適合する顧客を推定する(ステップS105)。なお、推定部133は、複数の企業のうち、特定企業からの匿名情報の件数が多くなるほど、特定企業の目的に適合する顧客をより高精度に推定する。 Subsequently, the estimating unit 133 of the mother server 100 estimates a customer who matches the purpose of a specific company among a plurality of companies by AI that has undergone machine learning by the learning unit 132 (step S105). It should be noted that the estimation unit 133 more accurately estimates a customer who meets the purpose of a specific company among a plurality of companies as the number of anonymous information items from the specific company increases.

続いて、マザーサーバ100の推定部133は、特定企業の目的に適合する顧客のリストを生成する(ステップS106)。例えば、推定部133は、特定企業の特定商品の購入確率が高い顧客をリスト化した商品購入確率リストを生成する。 Subsequently, the estimation unit 133 of the mother server 100 generates a list of customers who meet the purpose of the specific company (step S106). For example, the estimation unit 133 generates a product purchase probability list in which customers with a high probability of purchasing a specific product of a specific company are listed.

続いて、マザーサーバ100の提供部134は、通信部110を介して、特定企業の目的に適合する顧客のリストを特定企業のクライアント端末10に提供する(ステップS107)。例えば、提供部134は、通信部110を介して、特定企業の特定商品の購入確率が高い顧客をリスト化した商品購入確率リストを特定企業のクライアント端末10に提供する。 Subsequently, the provision unit 134 of the mother server 100 provides the client terminal 10 of the specific company with a list of customers who meet the purpose of the specific company via the communication unit 110 (step S107). For example, the providing unit 134 provides the client terminal 10 of the specific company with a product purchase probability list in which customers with a high probability of purchasing the specific product of the specific company are listed via the communication unit 110 .

続いて、マザーサーバ100の提供部134は、通信部110を介して、特定企業の目的に適合する顧客に対して、特定企業の目的に沿った情報提供を行う(ステップS108)。例えば、提供部134は、通信部110を介して、商品購入確率リストに掲載された顧客に対して、特定商品に関する広告配信及びクーポン配布を行う。 Subsequently, the providing unit 134 of the mother server 100 provides information in line with the purpose of the specific company to customers who meet the purpose of the specific company via the communication unit 110 (step S108). For example, the provision unit 134 distributes advertisements and coupons regarding specific products to customers listed on the product purchase probability list via the communication unit 110 .

〔4.変形例〕
上述したクライアント端末10及びマザーサーバ100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、実施形態の変形例について説明する。
[4. Modification]
The client terminal 10 and the mother server 100 described above may be implemented in various different forms other than the above embodiments. So, below, the modification of embodiment is demonstrated.

(スタンドアローン)
上記の実施形態において、マザーサーバ100が実行している処理の一部又は全部は、実際には、クライアント端末10が実行してもよい。例えば、スタンドアローン(Stand-alone)で(クライアント端末10単体で)処理が完結してもよい。この場合、クライアント端末10に、上記の実施形態におけるマザーサーバ100の機能が備わっているものとする。また、上記の実施形態では、クライアント端末10はマザーサーバ100と連携しているため、利用者Uから見れば、マザーサーバ100の処理もクライアント端末10が実行しているように見える。すなわち、他の観点では、クライアント端末10は、マザーサーバ100を備えているともいえる。また、マザーサーバ100も、複数のクライアント端末10のうちの1台であってもよい。
(standalone)
In the above embodiment, part or all of the processing executed by the mother server 100 may actually be executed by the client terminal 10 . For example, the processing may be completed stand-alone (by the client terminal 10 alone). In this case, it is assumed that the client terminal 10 has the functions of the mother server 100 in the above embodiment. In addition, in the above embodiment, the client terminal 10 cooperates with the mother server 100, so from the user U's point of view, it appears that the client terminal 10 is executing the processing of the mother server 100 as well. That is, from another point of view, it can be said that the client terminal 10 includes the mother server 100 . Also, the mother server 100 may be one of the plurality of client terminals 10 .

(基底ベクトル)
また、上記の実施形態において、さらに匿名情報の匿名性を高めるために、マザーサーバ100は、基底ベクトルをあらかじめ決めておき、クライアント端末10から匿名情報として基底ベクトルとの差分データを収集するようにしてもよい。この場合、クライアント端末10からマザーサーバ100へ送信されるのはベクトルの差分データのみである。
(basis vector)
In the above-described embodiment, in order to further improve the anonymity of the anonymous information, the mother server 100 predetermines the base vector and collects the difference data from the base vector as anonymous information from the client terminal 10. may In this case, only vector difference data is transmitted from the client terminal 10 to the mother server 100 .

(企業ごとに匿名情報の様式変更)
また、上記の実施形態において、企業ごとに匿名情報の様式を変えてもよい。例えば、匿名情報が多次元のベクトルデータである場合に、A社のベクトルデータと、B社のベクトルデータとで同じ次元に同種のデータが配置される必要はない。もし、同じ内容の情報であっても、A社のベクトルデータと、B社のベクトルデータとで、異なる次元に配置してもよい。各企業の多次元のベクトルデータのどの次元にどのデータが配置されているかは、マザー側のAIだけ認識できれば十分である。この場合、マザー側のAIは、学習や推論に先立って、各企業のベクトルデータの整合性を取る(整合させる)ようにしてもよい。例えば、各企業のベクトルデータを共通の様式のベクトルデータに変換して、学習や推論を実施する。
(The format of anonymous information changes for each company)
Also, in the above embodiment, the format of the anonymous information may be changed for each company. For example, when the anonymous information is multi-dimensional vector data, the vector data of company A and the vector data of company B do not need to be arranged in the same dimension. Even if the information has the same content, the vector data of Company A and the vector data of Company B may be arranged in different dimensions. It is sufficient if only the AI on the mother side can recognize which data is arranged in which dimension of the multidimensional vector data of each company. In this case, the AI on the mother side may match (match) the vector data of each company prior to learning and inference. For example, vector data of each company is converted into vector data in a common format for learning and inference.

(クライアント側でのAI学習)
また、上記の実施形態において、マザーサーバ100が各企業のクライアント端末10にAIを配布しているが、実際には、各企業のクライアント端末10が、自社で使用するAIを独自に生成し、生成されたAIの仕様に関する情報(ベクトル変換規則等)又はAI自体(ベクトル変換モデル等)をマザーサーバ100に提供してもよい。
(AI learning on the client side)
In the above embodiment, the mother server 100 distributes AI to the client terminals 10 of each company. The mother server 100 may be provided with information on the specifications of the generated AI (vector conversion rules, etc.) or the AI itself (vector conversion model, etc.).

例えば、クライアント端末10は、顧客データとベクトル値とをデータセットとして、ニューラルネットワークによる機械学習の手法等を用いて学習モデルを構築する。そして、クライアント端末10は、構築された学習モデルに顧客データを入力して、顧客データを多次元からなる実数値ベクトルへと変換する。すなわち、クライアント端末10は、例えば複数層の全結合層、VAE(Variational Autoencoder)、RNN(Recurrent Neural Network)やLSTM(Long short-term memory)、Transformer、BERT等を用いた機械学習を経て生成されるベクトル変換モデルに顧客データを入力し、出力として顧客データを匿名化(ベクトル化)した匿名情報を取得する。 For example, the client terminal 10 uses customer data and vector values as a data set to construct a learning model using a machine learning technique using a neural network. Then, the client terminal 10 inputs customer data into the constructed learning model and converts the customer data into a multidimensional real-value vector. That is, the client terminal 10 is generated through machine learning using, for example, a plurality of fully connected layers, VAE (Variational Autoencoder), RNN (Recurrent Neural Network), LSTM (Long short-term memory), Transformer, BERT, and the like. Customer data is input to the vector conversion model that is used, and anonymous information obtained by anonymizing (vectorizing) the customer data is obtained as output.

なお、RNNやLSTMは、アテンション(Attention)の仕組みに基づくニューラルネットワークであってもよい。アテンションは、文章のような前後の並びが重要なデータを扱うことができる。また、クライアント端末10は、同様の自然言語処理モデルを用いてもよい。このようなモデルを用いて、顧客データからベクトル値を生成することにより、より情報の順序に重点を置いたベクトル値の生成を実現することができる。 Note that the RNN and LSTM may be neural networks based on an attention mechanism. Attention can handle data such as sentences in which the sequence is important. Also, the client terminal 10 may use a similar natural language processing model. By generating vector values from customer data using such a model, it is possible to generate vector values that place more importance on the order of information.

そして、各企業のクライアント端末10は、マザーサーバ100からの要求に応じて、又は自発的に、顧客データを匿名化(ベクトル化)した匿名情報をマザーサーバ100に送信する際、又は任意のタイミングで、各企業のクライアント端末10は、学習済みのベクトル変換モデルの差分データ(又はモデル自体)をマザーサーバ100に送信する。 In response to a request from the mother server 100 or voluntarily, the client terminal 10 of each company transmits anonymous information obtained by anonymizing (vectorizing) customer data to the mother server 100, or at any time. Then, the client terminal 10 of each company transmits difference data (or the model itself) of the learned vector conversion model to the mother server 100 .

また、各企業のクライアント端末10は、フェデレーテッドラーニング(Federated Learning:連合学習)等の手法を用いて、顧客データをベクトルに変換するためのベクトル変換モデルを生成してもよい。フェデレーテッドラーニングは、データを自社外に出さずに共同で学習モデルを構築する機械学習の手法である。例えば、フェデレーテッドラーニングでは、各企業のクライアント端末10は、ベクトル変換モデルに対し、それぞれ顧客データを学習データとして機械学習を行い、元のモデルと学習後のモデルとの差分データをマザーサーバ100に送信する。マザーサーバ100は、差分データを各クライアント端末10から受信し、これらを統合して学習し、共通モデルを生成する。そして、マザーサーバ100は、生成された共通モデルのパラメータ等を各クライアント端末10に提供する。このように、フェデレーテッドラーニングを用いることで、学習データである顧客データをクライアント側からサーバ側に提供することなく学習を行うことが可能であるため、顧客の個人情報やプライバシーに配慮することができる。 Also, the client terminal 10 of each company may generate a vector conversion model for converting customer data into a vector using a method such as federated learning. Federated learning is a machine learning method that jointly builds a learning model without exposing the data to outside the company. For example, in federated learning, the client terminal 10 of each company performs machine learning on the vector conversion model using customer data as learning data, and the difference data between the original model and the model after learning is transferred to the mother server 100. Send to The mother server 100 receives the difference data from each client terminal 10, integrates and learns them, and generates a common model. Then, the mother server 100 provides each client terminal 10 with the parameters of the generated common model. In this way, by using federated learning, it is possible to perform learning without providing customer data, which is learning data, from the client side to the server side, so it is possible to consider the customer's personal information and privacy. can be done.

〔5.効果〕
上述してきたように、本願に係る情報処理装置(マザーサーバ100)は、複数の企業の各々から顧客データをベクトル化した匿名情報を取得する取得部と、各企業からの匿名情報を用いてAIの機械学習をする学習部と、機械学習を経たAIにより、複数の企業のうち特定企業の目的に適合する顧客を推定する推定部と、推定部による推定結果に基づく情報を提供する提供部とを備える。
[5. effect〕
As described above, the information processing apparatus (mother server 100) according to the present application includes an acquisition unit that acquires anonymous information obtained by vectorizing customer data from each of a plurality of companies, and an AI using anonymous information from each company. a learning unit that performs machine learning, an estimation unit that estimates customers who match the purpose of a specific company among multiple companies by AI that has undergone machine learning, and a provision unit that provides information based on the estimation results of the estimation unit. Prepare.

なお、匿名情報は、顧客データをベクトル化した多次元のベクトルデータであり、顧客データを復元する手段が存在しない不可逆な情報である。 Anonymous information is multidimensional vector data obtained by vectorizing customer data, and is irreversible information for which there is no means for restoring customer data.

また、推定部は、複数の企業のうち、特定企業からの匿名情報の件数が多くなるほど、特定企業の目的に適合する顧客をより高精度に推定する。 Further, the estimating unit more accurately estimates the customer who matches the purpose of the specific company as the number of anonymous information items from the specific company increases among the plurality of companies.

また、提供部は、顧客データをベクトル化するためのクライアント側AIを複数の企業の各々に提供する。そして、取得部は、複数の企業の各々からクライアント側AIにより顧客データをベクトル化した匿名情報を取得する。 Also, the providing unit provides client-side AI for vectorizing customer data to each of the plurality of companies. Then, the acquisition unit acquires anonymous information obtained by vectorizing customer data from each of the plurality of companies using the client-side AI.

また、学習部は、各企業からの匿名情報に、各企業とは別に当該情報処理装置が独自に収集した顧客データをベクトル化した匿名情報を加えてAIの機械学習をする。 In addition, the learning unit performs AI machine learning by adding anonymous information obtained by vectorizing customer data independently collected by the information processing device independently of each company to the anonymous information from each company.

また、学習部は、各企業からの匿名情報のうち目的に対応するデータに、各企業とは別に該情報処理装置が独自に収集した顧客データを加味した特定企業の目的設定を行い、AIの機械学習をする。 In addition, the learning unit sets the purpose of a specific company by adding customer data independently collected by the information processing device separately from each company to the data corresponding to the purpose among the anonymous information from each company, and sets the purpose of AI. Do machine learning.

また、推定部は、複数の企業のうち特定企業の特定商品の購入確率が高い顧客を推定し、該顧客をリスト化した商品購入確率リストを生成する。そして、提供部は、商品購入確率リストを特定企業に提供する。 In addition, the estimation unit estimates a customer who has a high probability of purchasing a specific product from a specific company among a plurality of companies, and generates a product purchase probability list in which the customers are listed. Then, the providing unit provides the product purchase probability list to the specific company.

また、提供部は、商品購入確率リストに掲載された顧客に対して、特定商品に関する広告配信及びクーポン配布を行う。 In addition, the providing unit distributes advertisements and coupons relating to specific products to customers listed on the product purchase probability list.

また、取得部は、業種が異なる複数の企業の各々から顧客データをベクトル化した匿名情報を取得する。 Also, the acquisition unit acquires anonymous information obtained by vectorizing customer data from each of a plurality of companies in different industries.

上述した各処理のいずれかもしくは組合せにより、本願に係る情報処理装置は、データ圏加盟企業が自社のデータを出したくなる仕組みを提供することができる。もちろん、ベクトル化した匿名情報に対して暗号化を行うことで、さらにセキュリティを高めることもできる。これにより、各企業が生の個人情報を出すことなく、データ圏連携、ターゲティング精度を向上できる。また、フリーライドできない仕組みがあるので全体としての精度が相乗効果的に向上していく。また、各企業から見たときに、データ圏に乗っかっても、自社のデータや状況が他社に見られない(例えば、A社からみて自社の店舗に顧客がどれくらい訪問しているか等を、B社には知られない)。また、マザー側が多数のサービスを展開している場合(ポータルサイトなど)、広告配信やSNSなど、マスマーケティングにも使える。 The information processing apparatus according to the present application can provide a mechanism that makes data area member companies want to output their own data by any one or combination of the above-described processes. Of course, the security can be further improved by encrypting the vectorized anonymous information. As a result, each company can improve data area cooperation and targeting accuracy without disclosing raw personal information. In addition, since there is a mechanism that prevents free riding, the accuracy as a whole improves synergistically. In addition, when viewed from the perspective of each company, even if it is in the data zone, other companies cannot see their company's data and situation (for example, from the perspective of company A, how many customers have visited their own store, etc. unknown to the company). In addition, if the mother side is developing a large number of services (portal site, etc.), it can also be used for mass marketing such as advertisement distribution and SNS.

〔6.ハードウェア構成〕
また、上述した実施形態に係るクライアント端末10やマザーサーバ100は、例えば図14に示すような構成のコンピュータ1000によって実現される。以下、マザーサーバ100を例に挙げて説明する。図14は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力I/F(Interface)1060、入力I/F1070、ネットワークI/F1080がバス1090により接続された形態を有する。
[6. Hardware configuration]
Also, the client terminal 10 and the mother server 100 according to the above-described embodiments are implemented by a computer 1000 configured as shown in FIG. 14, for example. The mother server 100 will be described below as an example. FIG. 14 is a diagram illustrating an example of a hardware configuration; The computer 1000 is connected to an output device 1010 and an input device 1020, and an arithmetic device 1030, a primary storage device 1040, a secondary storage device 1050, an output I/F (Interface) 1060, an input I/F 1070, and a network I/F 1080 are buses. It has a form connected by 1090.

演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。演算装置1030は、例えばCPU(Central Processing Unit)、GPU、TPU、MPU(Micro Processing Unit)、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等により実現される。 The arithmetic device 1030 operates based on programs stored in the primary storage device 1040 and the secondary storage device 1050, programs read from the input device 1020, and the like, and executes various processes. The arithmetic unit 1030 is implemented by, for example, a CPU (Central Processing Unit), GPU, TPU, MPU (Micro Processing Unit), ASIC (Application Specific Integrated Circuit), FPGA (Field Programmable Gate Array), or the like.

一次記憶装置1040は、RAM(Random Access Memory)等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等により実現される。二次記憶装置1050は、内蔵ストレージであってもよいし、外付けストレージであってもよい。また、二次記憶装置1050は、USB(Universal Serial Bus)メモリやSD(Secure Digital)メモリカード等の取り外し可能な記憶媒体であってもよい。また、二次記憶装置1050は、クラウドストレージ(オンラインストレージ)やNAS(Network Attached Storage)、ファイルサーバ等であってもよい。 The primary storage device 1040 is a memory device such as a RAM (Random Access Memory) that temporarily stores data used for various calculations by the arithmetic device 1030 . The secondary storage device 1050 is a storage device in which data used for various calculations by the arithmetic device 1030 and various databases are registered. State Drive), flash memory, or the like. The secondary storage device 1050 may be an internal storage or an external storage. Also, the secondary storage device 1050 may be a removable storage medium such as a USB (Universal Serial Bus) memory or an SD (Secure Digital) memory card. Also, the secondary storage device 1050 may be a cloud storage (online storage), a NAS (Network Attached Storage), a file server, or the like.

出力I/F1060は、ディスプレイ、プロジェクタ、及びプリンタ等といった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインターフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力I/F1070は、マウス、キーボード、キーパッド、ボタン、及びスキャナ等といった各種の入力装置1020から情報を受信するためのインターフェースであり、例えば、USB等により実現される。 The output I/F 1060 is an interface for transmitting information to be output to the output device 1010 that outputs various information such as a display, a projector, and a printer. (Digital Visual Interface), HDMI (registered trademark) (High Definition Multimedia Interface), and other standardized connectors. Also, the input I/F 1070 is an interface for receiving information from various input devices 1020 such as a mouse, keyboard, keypad, buttons, scanner, etc., and is realized by, for example, USB.

また、出力I/F1060及び入力I/F1070はそれぞれ出力装置1010及び入力装置1020と無線で接続してもよい。すなわち、出力装置1010及び入力装置1020は、ワイヤレス機器であってもよい。 Also, the output I/F 1060 and the input I/F 1070 may be wirelessly connected to the output device 1010 and the input device 1020, respectively. That is, the output device 1010 and the input device 1020 may be wireless devices.

また、出力装置1010及び入力装置1020は、タッチパネルのように一体化していてもよい。この場合、出力I/F1060及び入力I/F1070も、入出力I/Fとして一体化していてもよい。 Also, the output device 1010 and the input device 1020 may be integrated like a touch panel. In this case, the output I/F 1060 and the input I/F 1070 may also be integrated as an input/output I/F.

なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、又は半導体メモリ等から情報を読み出す装置であってもよい。 Note that the input device 1020 includes, for example, optical recording media such as CDs (Compact Discs), DVDs (Digital Versatile Discs), PDs (Phase change rewritable discs), magneto-optical recording media such as MOs (Magneto-Optical discs), and tapes. It may be a device that reads information from a medium, a magnetic recording medium, a semiconductor memory, or the like.

ネットワークI/F1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。 Network I/F 1080 receives data from other devices via network N and sends the data to arithmetic device 1030, and also transmits data generated by arithmetic device 1030 via network N to other devices.

演算装置1030は、出力I/F1060や入力I/F1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。 Arithmetic device 1030 controls output device 1010 and input device 1020 via output I/F 1060 and input I/F 1070 . For example, arithmetic device 1030 loads a program from input device 1020 or secondary storage device 1050 onto primary storage device 1040 and executes the loaded program.

例えば、コンピュータ1000がマザーサーバ100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、コンピュータ1000の演算装置1030は、ネットワークI/F1080を介して他の機器から取得したプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行してもよい。また、コンピュータ1000の演算装置1030は、ネットワークI/F1080を介して他の機器と連携し、プログラムの機能やデータ等を他の機器の他のプログラムから呼び出して利用してもよい。 For example, when the computer 1000 functions as the mother server 100 , the computing device 1030 of the computer 1000 implements the functions of the control unit 130 by executing programs loaded on the primary storage device 1040 . Further, arithmetic device 1030 of computer 1000 may load a program acquired from another device via network I/F 1080 onto primary storage device 1040 and execute the loaded program. Further, the arithmetic unit 1030 of the computer 1000 may cooperate with another device via the network I/F 1080, and call functions, data, etc. of the program from another program of the other device for use.

〔7.その他〕
以上、本願の実施形態を説明したが、これら実施形態の内容により本発明が限定されるものではない。また、前述した構成要素には、当業者が容易に想定できるもの、実質的に同一のもの、いわゆる均等の範囲のものが含まれる。さらに、前述した構成要素は適宜組み合わせることが可能である。さらに、前述した実施形態の要旨を逸脱しない範囲で構成要素の種々の省略、置換又は変更を行うことができる。
[7. others〕
Although the embodiments of the present application have been described above, the present invention is not limited by the contents of these embodiments. In addition, the components described above include those that can be easily assumed by those skilled in the art, those that are substantially the same, and those within the so-called equivalent range. Furthermore, the components described above can be combined as appropriate. Furthermore, various omissions, replacements, or modifications of components can be made without departing from the gist of the above-described embodiments.

また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。 Further, among the processes described in the above embodiments, all or part of the processes described as being automatically performed can be manually performed, or the processes described as being performed manually can be performed manually. All or part of this can also be done automatically by known methods. In addition, information including processing procedures, specific names, various data and parameters shown in the above documents and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each drawing is not limited to the illustrated information.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。 Also, each component of each device illustrated is functionally conceptual, and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution and integration of each device is not limited to the illustrated one, and all or part of them can be functionally or physically distributed and integrated in arbitrary units according to various loads and usage conditions. Can be integrated and configured.

例えば、上述したマザーサーバ100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティング等で呼び出して実現するなど、構成は柔軟に変更できる。 For example, the above-described mother server 100 may be realized by a plurality of server computers, and some functions may be realized by calling an external platform or the like using an API (Application Programming Interface), network computing, or the like. Flexible to change.

また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 Also, the above-described embodiments and modifications can be appropriately combined within a range that does not contradict the processing content.

また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。 Also, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the acquisition unit can be read as acquisition means or an acquisition circuit.

1 情報処理システム
10 クライアント端末
100 マザーサーバ
110 通信部
120 記憶部
121 利用者情報データベース
122 履歴情報データベース
123 匿名情報データベース
130 制御部
131 取得部
132 学習部
133 推定部
134 提供部
1 information processing system 10 client terminal 100 mother server 110 communication unit 120 storage unit 121 user information database 122 history information database 123 anonymous information database 130 control unit 131 acquisition unit 132 learning unit 133 estimation unit 134 provision unit

Claims (11)

複数の企業の各々から顧客データをベクトル化した匿名情報を取得する取得部と、
前記各企業からの匿名情報を用いてAIの機械学習をする学習部と、
前記機械学習を経たAIにより、前記複数の企業のうち特定企業の目的に適合する顧客を推定する推定部と、
前記推定部による推定結果に基づく情報を提供する提供部と
を備えることを特徴とする情報処理装置。
an acquisition unit that acquires anonymous information obtained by vectorizing customer data from each of a plurality of companies;
A learning unit that performs AI machine learning using anonymous information from each company;
an estimating unit that estimates a customer who meets the purpose of a specific company among the plurality of companies by the AI that has undergone machine learning;
and a providing unit that provides information based on the result of estimation by the estimating unit.
前記匿名情報は、前記顧客データをベクトル化した多次元のベクトルデータであり、前記顧客データを復元する手段が存在しない不可逆な情報である
ことを特徴とする請求項1に記載の情報処理装置。
The information processing apparatus according to claim 1, wherein the anonymous information is multidimensional vector data obtained by vectorizing the customer data, and is irreversible information for which there is no means for restoring the customer data.
前記推定部は、前記複数の企業のうち、前記特定企業からの匿名情報の件数が多くなるほど、前記特定企業の目的に適合する顧客をより高精度に推定する
ことを特徴とする請求項1又は2に記載の情報処理装置。
2. The estimating unit, among the plurality of companies, more accurately estimates the customer who meets the purpose of the specific company as the number of anonymous information from the specific company increases. 3. The information processing device according to 2.
前記提供部は、前記顧客データをベクトル化するためのクライアント側AIを前記複数の企業の各々に提供し、
前記取得部は、前記複数の企業の各々から前記クライアント側AIにより顧客データをベクトル化した匿名情報を取得する
ことを特徴とする請求項1~3のうちいずれか1つに記載の情報処理装置。
The providing unit provides client-side AI for vectorizing the customer data to each of the plurality of companies,
The information processing apparatus according to any one of claims 1 to 3, wherein the acquisition unit acquires anonymous information obtained by vectorizing customer data from each of the plurality of companies by the client-side AI. .
前記学習部は、前記各企業からの匿名情報に、前記各企業とは別に該情報処理装置が独自に収集した顧客データをベクトル化した匿名情報を加えて前記AIの機械学習をする
ことを特徴とする請求項1~4のうちいずれか1つに記載の情報処理装置。
The learning unit performs machine learning of the AI by adding anonymous information obtained by vectorizing customer data independently collected by the information processing device separately from each company to anonymous information from each company. The information processing apparatus according to any one of claims 1 to 4.
前記学習部は、前記AIの機械学習の際に、前記各企業からの匿名情報のうち目的に対応するデータに、前記各企業とは別に該情報処理装置が独自に収集した顧客データを加味したデータを正解データとして前記特定企業の目的設定を行う
ことを特徴とする請求項5に記載の情報処理装置。
During the machine learning of the AI, the learning unit adds customer data independently collected by the information processing device separately from the companies to the data corresponding to the purpose among the anonymous information from the companies. 6. The information processing apparatus according to claim 5, wherein the data is used as correct data to set the purpose of the specific company.
前記推定部は、前記複数の企業のうち前記特定企業の特定商品の購入確率が高い顧客を推定し、該顧客をリスト化した商品購入確率リストを生成し、
前記提供部は、前記商品購入確率リストを前記特定企業に提供する
ことを特徴とする請求項1~6のうちいずれか1つに記載の情報処理装置。
The estimating unit estimates a customer with a high probability of purchasing a specific product from the specific company among the plurality of companies, and generates a product purchase probability list listing the customers,
The information processing apparatus according to any one of claims 1 to 6, wherein the providing unit provides the product purchase probability list to the specific company.
前記提供部は、前記商品購入確率リストに掲載された顧客に対して、前記特定商品に関する広告配信及びクーポン配布を行う
ことを特徴とする請求項7に記載の情報処理装置。
8. The information processing apparatus according to claim 7, wherein said providing unit distributes advertisements and coupons relating to said specific product to customers listed on said product purchase probability list.
前記取得部は、業種が異なる複数の企業の各々から顧客データをベクトル化した匿名情報を取得する
ことを特徴とする請求項1~8のうちいずれか1つに記載の情報処理装置。
The information processing apparatus according to any one of claims 1 to 8, wherein the acquisition unit acquires anonymous information obtained by vectorizing customer data from each of a plurality of companies in different industries.
情報処理装置が実行する情報処理方法であって、
複数の企業の各々から顧客データをベクトル化した匿名情報を取得する取得工程と、
前記各企業からの匿名情報を用いてAIの機械学習をする学習工程と、
前記機械学習を経たAIにより、前記複数の企業のうち特定企業の目的に適合する顧客を推定する推定工程と、
前記推定工程による推定結果に基づく情報を提供する提供工程と
を含むことを特徴とする情報処理方法。
An information processing method executed by an information processing device,
an acquisition step of acquiring anonymous information obtained by vectorizing customer data from each of a plurality of companies;
A learning step of AI machine learning using anonymous information from each company;
an estimation step of estimating a customer who meets the purpose of a specific company among the plurality of companies by the AI that has undergone machine learning;
and a provision step of providing information based on the estimation result of the estimation step.
複数の企業の各々から顧客データをベクトル化した匿名情報を取得する取得手順と、
前記各企業からの匿名情報を用いてAIの機械学習をする学習手順と、
前記機械学習を経たAIにより、前記複数の企業のうち特定企業の目的に適合する顧客を推定する推定手順と、
前記推定手順による推定結果に基づく情報を提供する提供手順と
をコンピュータに実行させるための情報処理プログラム。
an acquisition procedure for acquiring anonymous information obtained by vectorizing customer data from each of a plurality of companies;
A learning procedure for AI machine learning using anonymous information from each company;
an estimation procedure for estimating a customer who meets the purpose of a specific company among the plurality of companies by the AI that has undergone machine learning;
An information processing program for causing a computer to execute a provision procedure for providing information based on the estimation results of the estimation procedure.
JP2022109850A 2021-06-17 2022-07-07 Information processing device, information processing method, and information processing program Pending JP2023001109A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022109850A JP2023001109A (en) 2021-06-17 2022-07-07 Information processing device, information processing method, and information processing program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021100861A JP7104219B1 (en) 2021-06-17 2021-06-17 Information processing equipment, information processing methods and information processing programs
JP2022109850A JP2023001109A (en) 2021-06-17 2022-07-07 Information processing device, information processing method, and information processing program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2021100861A Division JP7104219B1 (en) 2021-06-17 2021-06-17 Information processing equipment, information processing methods and information processing programs

Publications (1)

Publication Number Publication Date
JP2023001109A true JP2023001109A (en) 2023-01-04

Family

ID=82482451

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021100861A Active JP7104219B1 (en) 2021-06-17 2021-06-17 Information processing equipment, information processing methods and information processing programs
JP2022109850A Pending JP2023001109A (en) 2021-06-17 2022-07-07 Information processing device, information processing method, and information processing program

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2021100861A Active JP7104219B1 (en) 2021-06-17 2021-06-17 Information processing equipment, information processing methods and information processing programs

Country Status (1)

Country Link
JP (2) JP7104219B1 (en)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003248780A (en) * 2002-02-25 2003-09-05 Fujitsu Ltd Purchase information management system, purchase information anonymization server, and purchase information management method
JP5914549B2 (en) * 2014-03-04 2016-05-11 株式会社野村総合研究所 Information processing apparatus and information analysis method
CN105760932B (en) * 2016-02-17 2018-04-06 第四范式(北京)技术有限公司 Method for interchanging data, DEU data exchange unit and computing device
JP6253744B1 (en) * 2016-11-04 2017-12-27 ヤフー株式会社 Information analysis apparatus, information analysis method, and information analysis program
WO2019142597A1 (en) * 2018-01-19 2019-07-25 ソニー株式会社 Information processing device, information processing method and program
JP7102999B2 (en) * 2018-07-12 2022-07-20 コニカミノルタ株式会社 Information collection processing equipment, information collection processing method and program
US20220169144A1 (en) * 2019-03-29 2022-06-02 Honda Motor Co., Ltd. Information generation device, information generation method,program, and recording medium
US10825074B1 (en) * 2020-02-06 2020-11-03 Capital One Services, Llc Methods and systems for anonymizing and providing access to transaction data

Also Published As

Publication number Publication date
JP2023000186A (en) 2023-01-04
JP7104219B1 (en) 2022-07-20

Similar Documents

Publication Publication Date Title
US10509806B2 (en) Recommendation engine for aggregated platform data
Moorthy et al. What drives the adoption of mobile payment? A Malaysian perspective
Knijnenburg et al. Inspectability and control in social recommenders
US20190102802A1 (en) Predicting psychometric profiles from behavioral data using machine-learning while maintaining user anonymity
Boon-Long et al. Social media marketing evaluation using social network comments as an indicator for identifying consumer purchasing decision effectiveness
Li et al. Who is talking? An ontology-based opinion leader identification framework for word-of-mouth marketing in online social blogs
Tan et al. Metaverse in marketing and logistics: the state of the art and the path forward
Lee Usefulness, funniness, and coolness votes of viewers: An analysis of social shoppers’ online reviews
Alshare et al. The impact of trust, security, and privacy on individual's use of the internet for online shopping and social media: a multi-cultural study
Human-Van Eck et al. Influencers on Instagram: The influence of disclosure, followers and authority heuristic on source credibility
Park et al. Cultural differences in tourism web communication: A preliminary study
Zarmpou et al. Examining behavioral intention toward mobile services: An empirical investigation in Greece
Golden Differences in the use of AI assistants: how human values influence AI assistant use or disuse
JP7104219B1 (en) Information processing equipment, information processing methods and information processing programs
JP7212103B2 (en) Information processing device, information processing method and information processing program
Chatterjee Effect of construal level on the drivers of online-review-helpfulness
JP7174743B2 (en) Information selection device, information selection method and information selection program
Łysik et al. Social Collaboration Solutions as a Catalyst of Consumer Trust in Service Management Platforms-A Research Study
Ribeiro et al. Digital Presence of Companies: Consumer Social Interaction and the Purchase Decision
JP2021125128A (en) Information processing device, information management method, and information processing program
Pauchard A Comparison of the Different Types of Risk Perceived by Users that Are Hindering the Adoption of Mobile Payment
Grifoni et al. CREMOR: CREdibility Model on Online Reviews-How people Consider Online Reviews Believable
JP7422113B2 (en) Information processing device, information processing method, and information processing program
Em et al. Marketing Activities among Social Media Users in Cambodia: Mixed Method Research.
JP7407779B2 (en) Information processing device, information processing method, and information processing program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20231026