JP6885525B1 - データ連携システム、学習装置、および、推定装置 - Google Patents

データ連携システム、学習装置、および、推定装置 Download PDF

Info

Publication number
JP6885525B1
JP6885525B1 JP2021503071A JP2021503071A JP6885525B1 JP 6885525 B1 JP6885525 B1 JP 6885525B1 JP 2021503071 A JP2021503071 A JP 2021503071A JP 2021503071 A JP2021503071 A JP 2021503071A JP 6885525 B1 JP6885525 B1 JP 6885525B1
Authority
JP
Japan
Prior art keywords
domain
user
history
score
behavior history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021503071A
Other languages
English (en)
Other versions
JPWO2021245927A1 (ja
Inventor
元紀 草野
元紀 草野
昌史 小山田
昌史 小山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Application granted granted Critical
Publication of JP6885525B1 publication Critical patent/JP6885525B1/ja
Publication of JPWO2021245927A1 publication Critical patent/JPWO2021245927A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/52Network services specially adapted for the location of the user terminal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

データ連携システム90は、第一のドメインに行動履歴を有するユーザと、第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を生成する学習装置70と、第一のドメインと第二のドメインで一致するユーザを推定する推定装置80とを備えている。スコア算出手段82は、第一のドメインに行動履歴を有するユーザと第二のドメインに行動履歴を有するユーザのペアに対するスコアをスコア関数を用いて算出する。マッチング手段83は、算出されたスコアの大きさに基づいて、第一のドメインのユーザと同一のユーザを、第二のドメインのユーザの中から推定する。

Description

本発明は、ユーザに関連付けられた異なるドメイン間のデータの連携を行うためのデータ連携システム、学習装置、推定装置、データ連携方法、スコア関数生成方法、推定方法、学習プログラムおよび推定プログラムに関する。
各企業が保有する顧客データには、それぞれ異なる顧客ID(Identification)が設定されることが通常である。また、個人情報保護の観点から、氏名などの個人情報は開示できない。そのため、異なるドメイン間での同一ユーザのデータの連携(以下、ID連携(ID-Synchronization)と記す。)を行う方法が各種提案されている。例えば、web広告と通信販売サイトとのID連携を行う方法として、Cookieを用いる方法が実用化されている。
他にも、非特許文献1には、ソーシャルタグシステム全体でユーザを識別する方法が記載されている。具体的には、非特許文献1に記載された方法では、二つのSNS(Social Networking Service )のユーザが情報を投稿する際に付与したタグをもとに、ID連携が行われる。
また、非特許文献2には、ディープニューラルネットワークを用いて異なる種類のモビリティデータのユーザIDを紐づける方法が記載されている。具体的には、非特許文献2に記載された方法では、二つのSNSで投稿された位置情報をもとに、ID連携が行われる。
なお、非特許文献3には、非匿名化(De-anonymization)について記載されている。具体的には、非特許文献3には、匿名化処理された実験用データと映画評価の公開データベース情報を照合することで、ユーザを特定可能であることが記載されている。
また、特許文献1には、行動履歴を用いた本人認証方法が記載されている。特許文献1に記載された方法では、個人を特定するための行動情報として携帯端末のGPS(Global Positioning System )情報を利用し、過去の行動と現在の行動とから本人確率を計算する。また、特許文献2には、電子チケットの不正転売を低減または防止する方法が記載されている。
なお、非特許文献4には、安定マッチングに利用されるGale−Shapleyアルゴリズムについて記載されている。
特開2019−109556号公報 国際公開第2019/202857号公報
Iofciu. T, Fankhauser. P, Abel. F, Bischoff. K, "Identifying users across social tagging systems", Proceedings of the fifth international conference on weblogs and social media, 2011. Feng. J, Zhang. M, Wang. H, Yang. Z, Zhang. C, Li. Y, Jin .D, "DPLink: User identity linkage via deep neural network from heterogeneous mobility data", WWW 2019, pp. 459-469. Narayanan. A, Shmatikov. V, "Robust De-anonymization of large sparse datasets", In 2008 IEEE symposium on security andprivacy (S&P 2008), pp. 111-125, 2008. D. Gale, L. S. Shapley, "College Admissions and the Stability of Marriage", The American Mathematical Monthly, Vol. 69, No. 1, pp. 9-15, 1962.
一方、Cookieの使用に規制の動きがあることから、Cookieを用いたID連携ができない場合もある。また、実店舗のデータはオフラインで用いられるため、そもそもCookieが存在しない。
また、上述する各特許文献および非特許文献に記載された方法では、連携させる二つのデータセットの性質に制約がある。例えば、各非特許文献に記載された方法では、連携させる二つのデータセットが、同じドメインの(すなわち、行動に共通性がある)データで構成される状況を想定している。例えば、2つのSNSにおいて、一方のSNSでユーザがタグ付けした場所と、他方のSNSでタグ付けされた場所とを利用してID連携が行われる。
さらに、上述する各非特許文献に記載された方法では、連携させる二つのデータセットの特性として、同一のユーザが似た行動を行ったデータで構成される状況を想定している。例えば、一方のSNSにおいて、あるユーザがある場所で投稿を行った場合に、他方のSNSにおいて、同時刻に上記場所と近い場所で投稿を行うような状況である。
例えば、スーパーマーケットにおける広告の効果を測定する状況を考える。この場合、広告会社では、広告を行った履歴を有する。一方、スーパーマーケットでは、販売した商品の履歴を有する。すなわち、広告会社とスーパーマーケットは、それぞれ異なるドメインのデータセットを有していると言える。さらに、スーパーマーケットは、広告を行った履歴を有しておらず、逆に、広告会社は、商品の販売履歴を有していない。そこで、広告の効果を測定するためには、これら二つの異なるドメインのデータセットについてID連携させる必要がある。
しかし、このような状況において、仮に広告と商品を同一視したとしても、ある広告を参照したユーザが必ずしもその広告で宣伝された商品を購入するとは限らない。このように、同一のユーザであっても、別々の行動を行うことが想定される。そのため、異なるドメイン間のデータであっても、同一ユーザを適切に特定して、データ連携できることが好ましい。
そこで、本発明は、ユーザに関連付けられた異なるドメイン間のデータを連携させることができるデータ連携システム、学習装置、推定装置、データ連携方法、スコア関数生成方法、推定方法、学習プログラムおよび推定プログラムを提供することを目的とする。
本発明によるデータ連携システムは、第一のドメインに行動履歴を有するユーザと、第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を生成する学習装置と、第一のドメインと第二のドメインで一致するユーザを推定する推定装置とを備え、学習装置が、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されているユーザの第一のドメインの行動履歴と、第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、第一のドメインにおけるユーザの行動履歴と、第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、生成された変換器を用いて、第一のドメインの行動履歴を第一のドメインベクトルに変換し、第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、第一のドメインベクトルと、第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、生成された類似度関数を用いて、スコア関数を定義するスコア関数定義手段とを含み、推定装置が、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない第一のドメインのユーザの行動履歴と、第二のドメインのユーザの行動履歴との入力を受け付けるユーザ集合入力手段と、スコア関数を用いて、受け付けた第一のドメインに行動履歴を有するユーザと第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出するスコア算出手段と、算出されたスコアの大きさに基づいて、第一のドメインのユーザと同一のユーザを、第二のドメインのユーザの中から推定するマッチング手段とを含むことを特徴とする。
本発明による学習装置は、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されているユーザの第一のドメインの行動履歴と、第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、第一のドメインにおけるユーザの行動履歴と、第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、生成された変換器を用いて、第一のドメインの行動履歴を第一のドメインベクトルに変換し、第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、第一のドメインベクトルと、第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、生成された類似度関数を用いて、第一のドメインに行動履歴を有するユーザと、第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を定義するスコア関数定義手段とを備えたことを特徴とする。
本発明による推定装置は、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない第一のドメインのユーザの行動履歴と、第二のドメインのユーザの行動履歴との入力を受け付けるユーザ集合入力手段と、第一のドメインに行動履歴を有するユーザと第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を用いて、受け付けた第一のドメインに行動履歴を有するユーザと第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出するスコア算出手段と、算出されたスコアの大きさに基づいて、第一のドメインのユーザと同一のユーザを、第二のドメインのユーザの中から推定するマッチング手段とを備え、スコア関数は学習装置によって生成され、学習装置は、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されているユーザの第一のドメインの行動履歴と、第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、第一のドメインにおけるユーザの行動履歴と、第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、生成された変換器を用いて、第一のドメインの行動履歴を第一のドメインベクトルに変換し、第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、第一のドメインベクトルと、第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、生成された類似度関数を用いて、スコア関数を定義するスコア関数定義手段とを備えたことを特徴とする。
本発明によるデータ連携方法は、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されているユーザの第一のドメインの行動履歴と、第二のドメインの行動履歴との入力を受け付け、第一のドメインにおけるユーザの行動履歴と、第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成し、結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成し、生成された変換器を用いて、第一のドメインの行動履歴を第一のドメインベクトルに変換し、第二のドメインの行動履歴を第二のドメインベクトルに変換し、第一のドメインベクトルと、第二のドメインベクトルとの類似度を導出する類似度関数を生成し、生成された類似度関数を用いて、第一のドメインに行動履歴を有するユーザと、第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を定義し、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない第一のドメインのユーザの行動履歴と、第二のドメインのユーザの行動履歴との入力を受け付け、スコア関数を用いて、受け付けた第一のドメインに行動履歴を有するユーザと第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出し、算出されたスコアの大きさに基づいて、第一のドメインのユーザと同一のユーザを、第二のドメインのユーザの中から推定することを特徴とする。
本発明によるスコア関数生成方法は、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されているユーザの第一のドメインの行動履歴と、第二のドメインの行動履歴との入力を受け付け、第一のドメインにおけるユーザの行動履歴と、第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成し、結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成し、生成された変換器を用いて、第一のドメインの行動履歴を第一のドメインベクトルに変換し、第二のドメインの行動履歴を第二のドメインベクトルに変換し、第一のドメインベクトルと、第二のドメインベクトルとの類似度を導出する類似度関数を生成し、生成された類似度関数を用いて、第一のドメインに行動履歴を有するユーザと、第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を定義することを特徴とする。
本発明による推定方法は、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない第一のドメインのユーザの行動履歴と、第二のドメインのユーザの行動履歴との入力を受け付け、第一のドメインに行動履歴を有するユーザと第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を用いて、受け付けた第一のドメインに行動履歴を有するユーザと第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出し、算出されたスコアの大きさに基づいて、第一のドメインのユーザと同一のユーザを、第二のドメインのユーザの中から推定し、スコア関数は学習装置によって生成され、学習装置は、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されているユーザの第一のドメインの行動履歴と、第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、第一のドメインにおけるユーザの行動履歴と、第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、生成された変換器を用いて、第一のドメインの行動履歴を第一のドメインベクトルに変換し、第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、第一のドメインベクトルと、第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、生成された類似度関数を用いて、スコア関数を定義するスコア関数定義手段とを備えたことを特徴とする。
本発明による学習プログラムは、コンピュータに、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されているユーザの第一のドメインの行動履歴と、第二のドメインの行動履歴との入力を受け付ける行動履歴入力処理、第一のドメインにおけるユーザの行動履歴と、第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合処理、結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成処理、生成された変換器を用いて、第一のドメインの行動履歴を第一のドメインベクトルに変換し、第二のドメインの行動履歴を第二のドメインベクトルに変換する変換処理、第一のドメインベクトルと、第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成処理、および、生成された類似度関数を用いて、第一のドメインに行動履歴を有するユーザと、第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を定義するスコア関数定義処理を実行させることを特徴とする。
本発明による推定プログラムは、第一のコンピュータに、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない第一のドメインのユーザの行動履歴と、第二のドメインのユーザの行動履歴との入力を受け付けるユーザ集合入力処理、第一のドメインに行動履歴を有するユーザと第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を用いて、受け付けた第一のドメインに行動履歴を有するユーザと第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出するスコア算出処理、および、算出されたスコアの大きさに基づいて、第一のドメインのユーザと同一のユーザを、第二のドメインのユーザの中から推定するマッチング処理を実行させ、スコア関数は第二のコンピュータによって生成され、第二のコンピュータは、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されているユーザの第一のドメインの行動履歴と、第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、第一のドメインにおけるユーザの行動履歴と、第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、生成された変換器を用いて、第一のドメインの行動履歴を第一のドメインベクトルに変換し、第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、第一のドメインベクトルと、第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、生成された類似度関数を用いて、スコア関数を定義するスコア関数定義手段とを備えたことを特徴とする。
本発明によれば、ユーザに関連付けられた異なるドメイン間のデータを連携させることができる。
本発明によるデータ連携システムの一実施形態の構成例を示すブロック図である。 ユーザの行動履歴の例を示す説明図である。 データ連携システムの動作例を示すフローチャートである。 学習装置の動作例を示すフローチャートである。 推定装置の動作例を示すフローチャートである。 本発明によるデータ連携システムの概要を示すブロック図である。 本発明による学習装置の概要を示すブロック図である。 本発明による推定装置の概要を示すブロック図である。 少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
以下、本発明の実施形態を図面を参照して説明する。
図1は、本発明によるデータ連携システムの一実施形態の構成例を示すブロック図である。本実施形態のデータ連携システムは、ユーザに関連付けられた二つのドメインのデータセットから、同一のユーザを特定するシステムである。以下の説明では、上述するように、ドメイン間での同一ユーザの特定処理をID連携と記すこともある。
特に、本実施形態では、異なる二つのドメインにおけるID連携を中心に説明する。具体的には、広告の効果(購買への影響)を測定する場面を想定し、第一のドメインとして広告会社によるユーザへの広告履歴を例示し、第二のドメインとして、スーパーマーケットにおけるユーザの購買履歴を例示する。ただし、以下の例示は、本実施形態のデータ連携システム100による類似ドメインのID連携を排除する趣旨ではなく、任意の性質を有する二つのドメインのデータセットを用いることが可能である。
本実施形態において、ユーザに関連付けられたデータは、各ドメインにおける行動履歴である。行動履歴は、一人のユーザに関わる行動実績と、その行動を行った日時のペアの集合で表わされる。例えば、第一のドメインにおける行動履歴は、広告会社がユーザへ広告を行ったという行動実績の履歴であり、第二のドメインにおける行動履歴は、スーパーマーケットにおいてユーザが商品を購入したという行動実績の履歴である。
以下の説明では、各ドメインにおける行動実績をアイテムと記すこともある。すなわち、行動履歴は、アイテムの時系列と言うことができる。また、アイテムをaとし、時刻をtとすると、ユーザの行動履歴uは、u={(a,t),…,(a,t)}と表わされる。
本実施形態のデータ連携システム100は、学習装置10と、推定装置20とを備えている。
学習装置10は、第一のドメインに行動履歴を有するユーザと、第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数(以下、スコア関数と記す。)を生成する装置である。学習装置10は、記憶部11と、行動履歴入力部12と、行動履歴結合部13と、変換器生成部14と、変換部15と、類似度関数生成部16と、スコア関数定義部17とを含む。
記憶部11は、学習装置10が処理に用いる各種情報を記憶する。具体的には、記憶部11は、二つのドメインにおけるユーザの行動履歴を記憶してもよい。なお、通信回線を介して接続されたストレージ(図示せず)に二つのドメインにおけるユーザの行動履歴が記憶されている場合、記憶部11は、この行動履歴を記憶していなくてもよい。記憶部11は、例えば、磁気ディスク等により実現される。
図2は、ユーザの行動履歴の例を示す説明図である。図2に示す例では、第一のドメインsのユーザの行動履歴D1として、ユーザs001,s002,s003,s101およびs102の行動履歴が含まれ、第二のドメインtのユーザの行動履歴D2として、ユーザt001,t002,t003,t101およびt102の行動履歴が含まれていることを示す。
また、図2に示す例では、ユーザs001の行動履歴として、R1/5/5(2019/5/5)に広告a1を参照し、R1/8/1(2019/8/1)に広告c3を参照し、R2/6/10(2020/6/10)に広告d2を参照したことを示す。同様に、ユーザt002の行動履歴として、R1/10/1(2019/10/1)に商品z2を購入し、R2/7/1(2020/7/1)に商品x3を購入したことを示す。その他の行動履歴についても同様である。
行動履歴入力部12は、二つのドメインにおけるユーザの行動履歴(具体的には、第一のドメインにおけるユーザの行動履歴と、第二のドメインにおけるユーザの行動履歴)の入力を受け付ける。受け付けた各ドメインにおけるユーザの行動履歴の集合のことを、データセットと記すこともある。本実施形態では、行動履歴入力部12は、各ドメインにおけるユーザの行動履歴のうち、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されているユーザの行動履歴の入力を受け付ける。
なお、以下の説明では、各ドメイン間で同一のユーザによる行動履歴であると特定されているユーザの集合を、ID連携が判明しているユーザ集合Ptrainと記すこともある。図2に示す例において、s001〜s003およびt001〜t003が、それぞれID連携が判明しているユーザであるとする。具体的には、第一のドメインのユーザs001と第二のドメインのユーザt002が同一のユーザAであり、第一のドメインのユーザs002と第二のドメインのユーザt003が同一のユーザBであるとする。このとき、Ptrain={ユーザA(=s001=t002),ユーザB(=s002=t003)}である。
図2に示す例では、行動履歴入力部12は、ID連携が判明しているユーザの第一のドメインの行動履歴(ユーザs001〜s003の行動履歴)と、第二のドメインの行動履歴(ユーザt001〜t003の行動履歴)の入力を受け付ける。
以下の説明では、行動履歴入力部12が受け付けた第一のドメインの個々のユーザの行動履歴をu と記し、その行動履歴の集合をDs,trainと記す。同様に、行動履歴入力部12が受け付けた第二のドメインの個々のユーザの行動履歴をu と記し、その行動履歴の集合をDt,trainと記す。すなわち、
Figure 0006885525
である。
行動履歴結合部13は、入力を受け付けた第一のドメインにおけるユーザの行動履歴と、第二のドメインにおけるユーザの行動履歴とを結合させたデータ(以下、結合データ)の集合を生成する。各ドメインにおける行動履歴を結合することで、異なるドメイン(二つのデータセット)でのアイテムの共起関係を表わすことが可能になる。結合データの集合をDfusion,trainとすると、
Figure 0006885525
である。
なお、行動履歴結合部13がユーザの行動履歴を結合する方法は任意である。行動履歴結合部13は、例えば、両方のデータセットを跨いだ行動履歴を捉えられるように、同一ユーザの二つドメインの行動履歴の和集合を結合データとして生成してもよい。すなわち、
Figure 0006885525
である。他にも、行動履歴結合部13は、ドメインごとの行動履歴を纏めて取り扱うことができるように、単にデータセットの和集合を結合データとして生成してもよい。すなわち、
Figure 0006885525
である。さらに、行動履歴結合部13は、これらの効果を同時に得られるように、上記のデータセットの和集合を結合データとして生成してもよい。すなわち、
Figure 0006885525
である。
言い換えると、行動履歴結合部13は、同一のユーザの行動履歴のみを結合させて結合データの集合を生成してもよく、ID連携が判明しているユーザ集合に含まれる同一のまたは異なるユーザの行動履歴をそれぞれ結合させて結合データの集合を生成してもよい。いずれの方法においても、異なるドメインのアイテムを一つの結合データとして表わすことが可能になる。
例えば、Ptrain={(ユーザ)A,(ユーザ)B}の場合、行動履歴結合部13は、結合データの集合として、Dfusion,train={(u ,u ),(u ,u )}を生成してもよく、Dfusion,train={(u ,u ),(u ,u ),(u ,u ),(u ,u )}を生成してもよい。異なるユーザの行動履歴を結合した結合データの集合を生成することで、後述する変換器生成部14が学習を行う際に用いるデータ量を増やすことが可能になる。
変換器生成部14は、行動履歴結合部13によって生成された結合データの集合を用いて、行動履歴をベクトルに変換する対応vを学習する。つまり、行動履歴uに対して、v(u)がそのベクトルである。具体的には、変換器生成部14は、行動履歴結合部13によって生成された結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器v(ベクトル変換器)を生成する。
ここで、本発明者は、アイテムを単語とみなすことで、行動履歴を文章として扱うことができるとの着想を得た。すなわち、アイテムを単語とみなすことで、行動履歴を文章として扱うことが可能になる。そこで、変換器生成部14は、行動履歴のアイテムを時間順に並び替え、アイテムを単語とみなして、行動履歴を文章化する。そして、変換器生成部14は、ユーザの潜在的な行動履歴を分析しやすい数値ベクトルに変換する変換器を生成する。
変換器生成部14が、行動履歴(具体的には、文章化された行動履歴)をベクトルに変換する変換器を生成する方法は任意である。変換器生成部14は、例えば、Doc2Vecや、BM25、TF−IDF(Term Frequency - Inverse Document Frequency)、Bag−of−Words、LDA(Latent Dirichlet Allocation )、Word2vecの平均、などの手法を用いて変換器を生成してもよい。
変換部15は、変換器生成部14によって生成された変換器を用いて、各ドメインの行動履歴をベクトルに変換する。以下、第一のドメインの行動履歴から変換されたベクトルを第一のドメインベクトルv と記し、第二のドメインの行動履歴から変換されたベクトルを第二のドメインベクトルv と記す。すなわち、変換部15は、変換器生成部14によって生成された変換器を用いて、第一のドメインの行動履歴を第一のドメインベクトルに変換し、第二のドメインの行動履歴を第二のドメインベクトルに変換する。
ここで、第一のドメインベクトルv の集合をVs,trainと記し、第二のドメインベクトルv の集合をVt,trainと記すと、
Figure 0006885525
である。なお、v()は、生成された変換器による変換である。
類似度関数生成部16は、ベクトル同士の類似度を導出する関数(以下、類似度関数)を生成する。具体的には、類似度関数生成部16は、第一のドメインベクトルと、第二のドメインベクトルとの類似度を導出する類似度関数sim(v ,v )を生成する。
類似度関数生成部16が類似度関数を生成する方法は任意である。例えば、同一ユーザの異なるドメイン間の行動履歴(データセット)の対応fを回帰と捉えることができる。そこで、類似度関数生成部16は、この回帰式に基づいて変換された第一のドメインベクトルf(v )と、第二のドメインベクトルv との類似度(例えば、コサイン類似度やガウス関数、誤差の符号反転など)を導出する関数を、類似度関数として生成してもよい。
なお、ここで用いられる回帰式の内容も任意である。類似度関数生成部16は、ルールベースで任意に定めた写像を回帰式として用いてもよい。また、類似度関数生成部16は、単純に恒等写像を回帰式とみなして、第一のドメインベクトルそのものと、第二のドメインベクトルとの類似度(コサイン類似度やガウス関数など)を導出する関数を、類似度関数として生成してもよい。また、類似度関数生成部16は、線形回帰やカーネル回帰、ニューラルネットワークなどの教師あり学習を行うことで、回帰式を生成してもよい。
他にも、類似度関数生成部16は、行動履歴のペアが同一ユーザの場合に、より大きい類似度を返し、行動履歴のペアが異なるユーザの場合に、より小さい類似度を返すような類似度関数を学習してもよい。この場合、例えば学習データとして、同一ユーザの行動履歴のペアには、より高い値を目的変数に設定したデータを使用し、異なるユーザの行動履歴のペアには、より低い値を目的変数に設定したデータを使用すればよい。
他にも、類似度関数生成部16は、結合データに含まれる各ドメインの行動履歴が同一ユーザの行動履歴である場合に1を返し、異なるユーザの行動履歴である場合に0を返す二値分類(f((v ,v ))=1,f((v ,v ))=0 (iとjは異なる))を学習してもよい。そして、類似度関数生成部16は、第一のドメインベクトルと第二のドメインベクトルとのペアに対する二値分類の分類スコア(例えば、クラス所属確率など)を類似度とする類似度関数を生成してもよい。
スコア関数定義部17は、生成された類似度関数を用いて、上述するスコア関数score(u ,u )(すなわち、第一のドメインに行動履歴を有するユーザと、第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数)を定義する。具体的には、スコア関数定義部17は、第一のドメインにおけるユーザの行動履歴を変換した第一ドメインベクトルおよび第二のドメインにおけるユーザの行動履歴を変換した第二ドメインベクトルを、類似度関数の引数とする関数としてスコア関数を定義する。すなわち、
Figure 0006885525
である。
なお、スコア関数定義部17は、定義したスコア関数を推定装置20に出力してもよい。
行動履歴入力部12と、行動履歴結合部13と、変換器生成部14と、変換部15と、類似度関数生成部16と、スコア関数定義部17とは、プログラム(学習プログラム)に従って動作するコンピュータのプロセッサ(例えば、CPU(Central Processing Unit )、GPU(Graphics Processing Unit))によって実現される。
例えば、プログラムは、学習装置10の記憶部11に記憶され、プロセッサは、そのプログラムを読み込み、プログラムに従って、行動履歴入力部12、行動履歴結合部13、変換器生成部14、変換部15、類似度関数生成部16およびスコア関数定義部17として動作してもよい。また、行動履歴入力部12、行動履歴結合部13、変換器生成部14、変換部15、類似度関数生成部16およびスコア関数定義部17の各機能がSaaS(Software as a Service )形式で提供されてもよい。
また、行動履歴入力部12と、行動履歴結合部13と、変換器生成部14と、変換部15と、類似度関数生成部16と、スコア関数定義部17とは、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組合せによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。
また、行動履歴入力部12、行動履歴結合部13、変換器生成部14、変換部15、類似度関数生成部16およびスコア関数定義部17の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
図1に戻り、推定装置20は、記憶部21と、ユーザ集合入力部22と、スコア算出部23と、マッチング部24と、出力部25とを含む。
記憶部21は、推定装置20が処理に用いる各種情報を記憶する。具体的には、記憶部21は、スコア関数定義部17によって生成されたスコア関数を記憶してもよい。また、記憶部21は、記憶部11と同様、二つのドメインにおけるユーザの行動履歴を記憶してもよい。なお、通信回線を介して接続されたストレージ(図示せず)に二つのドメインにおけるユーザの行動履歴が記憶されている場合、記憶部21は、この行動履歴を記憶していなくてもよい。記憶部21は、例えば、磁気ディスク等により実現される。
ユーザ集合入力部22は、各ドメインにおけるユーザの行動履歴のうち、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されていないユーザ(すなわち、ID連携が判明していないユーザ)の行動履歴の入力を受け付ける。以下の説明では、各ドメイン間で同一のユーザによる行動履歴であると特定されていないユーザの集合のうち、一方のドメインのユーザの集合をPtestと記し、他方のドメインのユーザの集合をPcandiと記す。
なお、二つのドメインのうち、どちらのドメインのユーザの集合をPtestとするか、Pcandiとするかは任意である。以下の説明では、Ptestに含まれるユーザの集合を、それぞれ、Pcandiに含まれる各ユーザと連携させることを想定する。ここで、Ptestに含まれるユーザの全てをPcandiに含まれる各ユーザと連携させると想定した場合、Pcandi⊃Ptestである。なお、一部のユーザのみ連携させればよい場合、PcandiとPtestの包含関係は任意である。以下、第一のドメインのユーザをPcandiとし、第二のドメインのユーザをPtestとして説明する。
例えば、図2に示す例において、s101〜s102およびt101〜t102が、それぞれID連携が判明していないユーザであるとする。この場合、ユーザ集合入力部22は、ID連携が判明していないユーザの第一のドメインの行動履歴(ユーザs101〜s102の行動履歴)と、第二のドメインの行動履歴(ユーザt101〜t102の行動履歴)の入力を受け付ける。
以下の説明では、ユーザ集合入力部22が受け付けた第一のドメインの個々のユーザの行動履歴をu と記し、その行動履歴の集合をDs,testと記す。同様に、ユーザ集合入力部22が受け付けた第二のドメインの個々のユーザの行動履歴をu と記し、その行動履歴の集合をDt,candiと記す。すなわち、
Figure 0006885525
である。
スコア算出部23は、スコア関数定義部17により定義されたスコア関数を用いて、受け付けた第一のドメインに行動履歴を有するユーザと第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出する。具体的には、スコア算出部23は、受け付けた第一のドメインのユーザと第二のドメインのユーザの全てのペアに対するスコアの集合Sを算出する。すなわち、
Figure 0006885525
である。
マッチング部24は、スコア算出部23によって算出されたスコアの大きさに基づいて、両ドメインで一致するユーザを推定する。具体的には、マッチング部24は、第一のドメインのユーザPtestと同一のユーザを、第二のドメインのユーザPcandiから推定する。マッチング部24は、例えば、第一のドメインのユーザとのペアにより算出されるスコア関数のスコアがより大きい第二のドメインのユーザを、第一のドメインと同一のユーザとして推定してもよい。ここで、「より大きい」とは、「最も大きい」、または、「重複しないユーザの中で最も大きい」ことを意味する。
マッチング部24は、例えば、連携させる対象のユーザp∈Ptestに対応する他のドメインのユーザのスコアが一番大きいユーザp^(pの上付きハット)を同一のユーザと推定してもよい。すなわち、マッチング部24は、以下に例示する式1に基づいて、第一のドメインのユーザとのペアにより算出されるスコア関数のスコアが最も大きい第二のドメインのユーザを、その第一のドメインと同一のユーザとして推定してもよい。
Figure 0006885525
また、マッチング部24は、連携させるユーザが重複しないように同一のユーザを推定してもよい。マッチング部24は、例えば、安定マッチング問題と同様の方法で同一のユーザを推定してもよい。具体的には、マッチング部24は、第一のドメインのユーザをPtestとし、第二のドメインのユーザをPcandiとして算出されるスコアを第一の希望順とし、逆に、第二のドメインのユーザをPtestとし、第一のドメインのユーザをPcandiとして算出されるスコアを第二の希望順とする。そして、マッチング部24は、第一の希望順および第二の希望順を用いて、非特許文献4に記載されているGale−Shapleyアルゴリズムにより、ドメイン間でユーザが重複しないようにドメイン間で同一のユーザを推定してもよい。
出力部25は、同一と推定されたユーザを出力する。出力部25は、例えば、同一と推定された第一のドメインのユーザと、第二のドメインのユーザとを対応付けて出力してもよい。
なお、ユーザ集合入力部22と、スコア算出部23と、マッチング部24と、出力部25とは、プログラム(推定プログラム)に従って動作するコンピュータのプロセッサによって実現される。
次に、本実施形態のデータ連携システムの動作を説明する。図3は、本実施形態のデータ連携システム100の動作例を示すフローチャートである。
行動履歴入力部12は、ID連携が判明しているユーザの各ドメインの行動履歴の入力を受け付ける(ステップS11)。行動履歴結合部13は、各ドメインのユーザの行動履歴を結合させた結合データの集合を生成する(ステップS12)。変換器生成部14は、結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する(ステップS13)。変換部15は、生成された変換器を用いて、各ドメインの行動履歴をベクトルに変換する(ステップS14)。類似度関数生成部16は、類似度関数を生成し(ステップS15)、スコア関数定義部17は、生成された類似度関数を用いてスコア関数を定義する(ステップS16)。
推定装置20のユーザ集合入力部22は、ID連携が判明していないユーザの各ドメインの行動履歴の入力を受け付ける(ステップS17)。スコア算出部23は、スコア関数を用いて、各ドメインのユーザのペアに対するスコアを算出する(ステップS18)。マッチング部24は、算出されたスコアの大きさに基づいて、一方のドメインのユーザと同一のユーザを、他のドメインのユーザの中から推定する(ステップS19)。
図4は、本実施形態の学習装置10の動作例を示すフローチャートである。行動履歴入力部12は、ID連携済みの二つのデータセット(各ドメインの行動履歴)を教師データとして入力する(ステップS21)。行動履歴結合部13は、二つのデータセットを一つの結合データに結合する(ステップS22)。変換器生成部14は、行動履歴のベクトル変換器を生成する(ステップS23)。変換部15は、データセット内の行動履歴をベクトルに変換する(ステップS24)。類似度関数生成部16およびスコア関数定義部17は、二つのベクトル化された行動履歴のスコアを返すスコア関数を作成し(ステップS25)、作成したスコア関数を記憶部11に保存する(ステップS26)。
図5は、本実施形態の推定装置20の動作例を示すフローチャートである。ユーザ集合入力部22は、テストユーザの集合Ptestを入力する(ステップS31)。また、ユーザ集合入力部22は、テストユーザとID連携する対象の候補ユーザの集合Pcandiを入力し、その範囲を定める(ステップS32)。スコア算出部23は、テストユーザとID連携候補ユーザの全てのペアのスコアを算出する(ステップS33)。そして、マッチング部24は、テストユーザに対応するユーザをID連携候補のユーザから推定し、選択する(ステップS34)。
以上のように、本実施形態では、学習装置10の行動履歴入力部12が、ID連携が判明しているユーザの各ドメインの行動履歴の入力を受け付け、行動履歴結合部13が各ドメインのユーザの行動履歴を結合させた結合データの集合を生成する。そして、変換器生成部14が結合データの集合を用いた学習により行動履歴をベクトルに変換する変換器を生成し、変換部15が、生成された変換器を用いて各ドメインの行動履歴をベクトルに変換する。その後、類似度関数生成部16が類似度関数を生成し、スコア関数定義部17が生成された類似度関数を用いてスコア関数を定義する。
一方、推定装置20のユーザ集合入力部22が、ID連携が判明していないユーザの各ドメインの行動履歴の入力を受け付け、スコア算出部23が、スコア関数を用いて各ドメインのユーザのペアに対するスコアを算出する。そして、マッチング部24が、算出されたスコアの大きさに基づいて、一方のドメインのユーザと同一のユーザを、他のドメインのユーザの中から推定する。よって、ユーザに関連付けられた異なるドメイン間のデータを連携させることができる。
また、このように連携させたデータを用いることで、新たな価値を見出すことができる。例えば、一つのデータセットだけでは得られなかった知見を、二つのデータセットを俯瞰することで得ることができる。また、片方のデータセットにしか現れないユーザのもう一方のデータセットでの振る舞いを予測することも可能になる。
次に、本実施形態のデータ連携システム100を用いてオフラインで広告の効果測定を実施する具体例を、上述する実施形態の変数に対応させて説明する。具体的には、Dは、広告会社が保有する顧客の広告閲覧履歴データに対応し、Dは、スーパーマーケットが保有する顧客の商品購入データに対応する。また、Ptrainは、ID連携されたユーザの集合であり、例えば、何の広告を見て何の商品を買ったかを伝えてくれるモニターなどに対応する。
そして、Ptestが広告を閲覧したことがあるユーザの集合に対応し、Pcandiがスーパーマーケットで商品を購入したことがあるユーザの集合に対応する。なお、Pcandiの範囲は、全ユーザであってもよく、所定の基準を満たすユーザのみであってもよい。また、ユーザの行動履歴u={(a,t),…,(a,t)}について、u∈Dの場合、aは行われた広告であり、u∈Dの場合、aは購入された商品である。
行動履歴結合部13は、モニターの行動履歴を結合した結合データのセットを作成する。結合データuは、例えば、u={(広告a1,R2/3/5),(商品x3,R2/4/13),(広告c3,R1/8/1),…}∈Dfusion,trainである。次に、変換器生成部14は、行動履歴を時間順に並び替え、アイテムを単語とみなし、Dfusion,trainを基にDoc2Vecを学習する。ここで学習されたベクトル変換をvと記す。
変換部15は、モニターの二つの(ドメインの)行動履歴を、それぞれベクトルに変換する。類似度関数生成部16は、例えば、ニューラルネットワークで回帰fを学習する。スコア関数定義部17は、スコア関数を以下のように定義する。類似度関数simは、例えば、コサイン類似度である。
Figure 0006885525
スコア算出部23は、スコア関数を用いて、広告のユーザ(Ptest)とスーパーマーケットのユーザ(Pcandi)とのペアのスコアを算出する。マッチング部24は、算出されたスコアを用いて、Gale−Shapleyアルゴリズムに基づき、テストユーザに対するユーザのペアを推定する。出力部25は、推定されたユーザのペアの集合
Figure 0006885525
を出力する。
このように、本実施形態のデータ連携システムを、広告の効果測定に応用できる。他にも、本実施形態のデータ連携システムを、因果分析や推薦などの分析に活用できる。例えば、広告の影響度合いの因果分析や、ネットショップにおける商品の推薦などに応用できる。
次に、本発明の概要を説明する。図6は、本発明によるデータ連携システムの概要を示すブロック図である。本発明によるデータ連携システム90(例えば、データ連携システム100)は、第一のドメインに行動履歴を有するユーザと、第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数(例えば、score(u ,u ))を生成する学習装置70(例えば、学習装置10)と、第一のドメインと第二のドメインで一致するユーザを推定する推定装置80(例えば、推定装置20)とを備えている。
学習装置70は、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されている(すなわち、ユーザ連携が判明している)ユーザ(例えば、Ptrain)の第一のドメインの行動履歴(例えば、Ds,train)と、第二のドメインの行動履歴(例えば、Dt,train)との入力を受け付ける行動履歴入力手段71(例えば、行動履歴入力部12)と、第一のドメインにおけるユーザの行動履歴と、第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合(例えば、Dfusion,train)を生成する行動履歴結合手段72(例えば、行動履歴結合部13)と、結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段73(例えば、変換器生成部14)と、生成された変換器を用いて、第一のドメインの行動履歴を第一のドメインベクトル(例えば、Vs,train)に変換し、第二のドメインの行動履歴を第二のドメインベクトル(例えば、Vt,train)に変換する変換手段74(例えば、変換部15)と、第一のドメインベクトルと、第二のドメインベクトルとの類似度を導出する類似度関数(例えば、sim(v ,v ))を生成する類似度関数生成手段75(例えば、類似度関数生成部16)と、生成された類似度関数を用いて、スコア関数を定義するスコア関数定義手段76(例えば、スコア関数定義部17)とを含む。
推定装置80は、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない(すなわち、ユーザ連携が判明していない)第一のドメインのユーザ(例えば、Ptest)の行動履歴と、第二のドメインのユーザ(例えば、Pcandi)の行動履歴との入力を受け付けるユーザ集合入力手段81(例えば、ユーザ集合入力部22)と、スコア関数を用いて、受け付けた第一のドメインに行動履歴を有するユーザと第二のドメインに行動履歴を有するユーザのペアに対するスコア(例えば、S)を算出するスコア算出手段82(例えば、スコア算出部23)と、算出されたスコアの大きさに基づいて、第一のドメインのユーザと同一のユーザを、第二のドメインのユーザの中から推定するマッチング手段83(例えば、マッチング部24)とを含む。
そのような構成により、ユーザに関連付けられた異なるドメイン間のデータを連携させることができる。
また、類似度関数生成手段75は、同一ユーザの異なるドメイン間の行動履歴の対応を表わす回帰式に基づいて変換された第一のドメインベクトルと、第二のドメインベクトルとの類似度を導出する関数を、類似度関数として生成してもよい。
他にも、類似度関数生成手段75は、結合データに含まれる各ドメインの行動履歴が同一ユーザの行動履歴である場合に1を返し、異なるユーザの行動履歴である場合に0を返す二値分類を学習し、第一のドメインベクトルと第二のドメインベクトルとのペアに対する二値分類の分類スコアを類似度とする類似度関数を生成してもよい。
また、スコア関数定義手段76は、第一のドメインにおけるユーザの行動履歴を変換した第一ドメインベクトルおよび第二のドメインにおけるユーザの行動履歴を変換した第二ドメインベクトルを、類似度関数の引数とする関数としてスコア関数を定義してもよい。
また、マッチング手段83は、第一のドメインのユーザとのペアにより算出されるスコア関数のスコアがより大きい第二のドメインのユーザを、第一のドメインと同一のユーザとして推定してもよい。
また、変換器生成手段73は、行動履歴が示す行動実績を単語とみなしてその行動履歴を文章化し、文章化された行動履歴を数値ベクトルに変換する変換器を生成してもよい。
図7は、本発明による学習装置の概要を示すブロック図である。本発明による学習装置70は、行動履歴入力手段71と、行動履歴結合手段72と、変換器生成手段73と、変換手段74と、類似度関数生成手段75と、スコア関数定義手段76とを備えている。なお、学習装置70が備える各構成の内容は、図6に例示する学習装置70が備える構成と同様である。
また、図8は、本発明による推定装置の概要を示すブロック図である。本発明による推定装置80は、ユーザ集合入力手段81と、スコア算出手段82と、マッチング手段83とを備えている。なお、推定装置80が備える各構成の内容は、図6に例示する推定装置80が備える構成と同様である。
図9は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。コンピュータ1000は、プロセッサ1001、主記憶装置1002、補助記憶装置1003、インタフェース1004を備える。
上述の学習装置70および推定装置80は、それぞれコンピュータ1000に実装される。そして、上述した各処理部の動作は、プログラム(学習プログラム、推定プログラム)の形式で補助記憶装置1003に記憶されている。プロセッサ1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、当該プログラムに従って上記処理を実行する。
なお、少なくとも1つの実施形態において、補助記憶装置1003は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD−ROM(Compact Disc Read-only memory )、DVD−ROM(Read-only memory)、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000が当該プログラムを主記憶装置1002に展開し、上記処理を実行してもよい。
また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、当該プログラムは、前述した機能を補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であってもよい。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)第一のドメインに行動履歴を有するユーザと、第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を生成する学習装置と、前記第一のドメインと前記第二のドメインで一致するユーザを推定する推定装置とを備え、前記学習装置は、前記第一のドメインと前記第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、生成された前記類似度関数を用いて、前記スコア関数を定義するスコア関数定義手段とを含み、前記推定装置は、前記第一のドメインと前記第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない当該第一のドメインのユーザの行動履歴と、当該第二のドメインのユーザの行動履歴との入力を受け付けるユーザ集合入力手段と、前記スコア関数を用いて、受け付けた前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出するスコア算出手段と、算出された前記スコアの大きさに基づいて、前記第一のドメインのユーザと同一のユーザを、前記第二のドメインのユーザの中から推定するマッチング手段とを含むことを特徴とするデータ連携システム。
(付記2)類似度関数生成手段は、同一ユーザの異なるドメイン間の行動履歴の対応を表わす回帰式に基づいて変換された第一のドメインベクトルと、第二のドメインベクトルとの類似度を導出する関数を、類似度関数として生成する付記1記載のデータ連携システム。
(付記3)類似度関数生成手段は、結合データに含まれる各ドメインの行動履歴が同一ユーザの行動履歴である場合に1を返し、異なるユーザの行動履歴である場合に0を返す二値分類を学習し、第一のドメインベクトルと第二のドメインベクトルとのペアに対する当該二値分類の分類スコアを類似度とする類似度関数を生成する付記1記載のデータ連携システム。
(付記4)スコア関数定義手段は、第一のドメインにおけるユーザの行動履歴を変換した第一ドメインベクトルおよび第二のドメインにおけるユーザの行動履歴を変換した第二ドメインベクトルを、類似度関数の引数とする関数としてスコア関数を定義する付記1から付記3のうちのいずれか1つに記載のデータ連携システム。
(付記5)マッチング手段は、第一のドメインのユーザとのペアにより算出されるスコア関数のスコアがより大きい第二のドメインのユーザを、当該第一のドメインと同一のユーザとして推定する付記1から付記4のうちのいずれか1つに記載のデータ連携システム。
(付記6)変換器生成手段は、行動履歴が示す行動実績を単語とみなして当該行動履歴を文章化し、文章化された行動履歴を数値ベクトルに変換する変換器を生成する付記1から付記5のうちのいずれか1つに記載のデータ連携システム。
(付記7)第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、生成された前記類似度関数を用いて、前記第一のドメインに行動履歴を有するユーザと、前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を定義するスコア関数定義手段とを備えたことを特徴とする学習装置。
(付記8)第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない当該第一のドメインのユーザの行動履歴と、当該第二のドメインのユーザの行動履歴との入力を受け付けるユーザ集合入力手段と、前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を用いて、受け付けた前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出するスコア算出手段と、算出された前記スコアの大きさに基づいて、前記第一のドメインのユーザと同一のユーザを、前記第二のドメインのユーザの中から推定するマッチング手段とを備え、前記スコア関数は学習装置によって生成され、前記学習装置は、前記第一のドメインと前記第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、生成された前記類似度関数を用いて、前記スコア関数を定義するスコア関数定義手段とを備えたことを特徴とする推定装置。
(付記9)第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付け、前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成し、前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成し、生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換し、前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成し、生成された前記類似度関数を用いて、前記第一のドメインに行動履歴を有するユーザと、前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を定義し、前記第一のドメインと前記第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない当該第一のドメインのユーザの行動履歴と、当該第二のドメインのユーザの行動履歴との入力を受け付け、前記スコア関数を用いて、受け付けた前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出し、算出された前記スコアの大きさに基づいて、前記第一のドメインのユーザと同一のユーザを、前記第二のドメインのユーザの中から推定することを特徴とするデータ連携方法。
(付記10)第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付け、前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成し、前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成し、生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換し、前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成し、生成された前記類似度関数を用いて、前記第一のドメインに行動履歴を有するユーザと、前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を定義することを特徴とするスコア関数生成方法。
(付記11)第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない当該第一のドメインのユーザの行動履歴と、当該第二のドメインのユーザの行動履歴との入力を受け付け、前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を用いて、受け付けた前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出し、算出された前記スコアの大きさに基づいて、前記第一のドメインのユーザと同一のユーザを、前記第二のドメインのユーザの中から推定し、前記スコア関数は学習装置によって生成され、前記学習装置は、前記第一のドメインと前記第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、生成された前記類似度関数を用いて、前記スコア関数を定義するスコア関数定義手段とを備えたことを特徴とする推定方法。
(付記12)コンピュータに、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付ける行動履歴入力処理、前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合処理、前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成処理、生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換する変換処理、前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成処理、および、生成された前記類似度関数を用いて、前記第一のドメインに行動履歴を有するユーザと、前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を定義するスコア関数定義処理を実行させるための学習プログラムを記憶するプログラム記憶媒体。
(付記13)第一のコンピュータに、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない当該第一のドメインのユーザの行動履歴と、当該第二のドメインのユーザの行動履歴との入力を受け付けるユーザ集合入力処理、前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を用いて、受け付けた前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出するスコア算出処理、および、算出された前記スコアの大きさに基づいて、前記第一のドメインのユーザと同一のユーザを、前記第二のドメインのユーザの中から推定するマッチング処理を実行させ、前記スコア関数は第二のコンピュータによって生成され、前記第二のコンピュータは、前記第一のドメインと前記第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、生成された前記類似度関数を用いて、前記スコア関数を定義するスコア関数定義手段とを備えたことを特徴とする推定プログラムを記憶するプログラム記憶媒体。
(付記14)コンピュータに、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付ける行動履歴入力処理、前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合処理、前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成処理、生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換する変換処理、前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成処理、および、生成された前記類似度関数を用いて、前記第一のドメインに行動履歴を有するユーザと、前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を定義するスコア関数定義処理を実行させるための学習プログラム。
(付記15)第一のコンピュータに、第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない当該第一のドメインのユーザの行動履歴と、当該第二のドメインのユーザの行動履歴との入力を受け付けるユーザ集合入力処理、前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を用いて、受け付けた前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出するスコア算出処理、および、算出された前記スコアの大きさに基づいて、前記第一のドメインのユーザと同一のユーザを、前記第二のドメインのユーザの中から推定するマッチング処理を実行させ、前記スコア関数は第二のコンピュータによって生成され、前記第二のコンピュータは、前記第一のドメインと前記第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、生成された前記類似度関数を用いて、前記スコア関数を定義するスコア関数定義手段とを備えたことを特徴とする推定プログラム。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
10 学習装置
11 記憶部
12 行動履歴入力部
13 行動履歴結合部
14 変換器生成部
15 変換部
16 類似度関数生成部
17 スコア関数定義部
20 推定装置
21 記憶部
22 ユーザ集合入力部
23 スコア算出部
24 マッチング部
25 出力部
100 データ連携システム

Claims (13)

  1. 第一のドメインに行動履歴を有するユーザと、第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を生成する学習装置と、
    前記第一のドメインと前記第二のドメインで一致するユーザを推定する推定装置とを備え、
    前記学習装置は、
    前記第一のドメインと前記第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、
    前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、
    前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、
    生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、
    前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、
    生成された前記類似度関数を用いて、前記スコア関数を定義するスコア関数定義手段とを含み、
    前記推定装置は、
    前記第一のドメインと前記第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない当該第一のドメインのユーザの行動履歴と、当該第二のドメインのユーザの行動履歴との入力を受け付けるユーザ集合入力手段と、
    前記スコア関数を用いて、受け付けた前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出するスコア算出手段と、
    算出された前記スコアの大きさに基づいて、前記第一のドメインのユーザと同一のユーザを、前記第二のドメインのユーザの中から推定するマッチング手段とを含む
    ことを特徴とするデータ連携システム。
  2. 類似度関数生成手段は、同一ユーザの異なるドメイン間の行動履歴の対応を表わす回帰式に基づいて変換された第一のドメインベクトルと、第二のドメインベクトルとの類似度を導出する関数を、類似度関数として生成する
    請求項1記載のデータ連携システム。
  3. 類似度関数生成手段は、結合データに含まれる各ドメインの行動履歴が同一ユーザの行動履歴である場合に1を返し、異なるユーザの行動履歴である場合に0を返す二値分類を学習し、第一のドメインベクトルと第二のドメインベクトルとのペアに対する当該二値分類の分類スコアを類似度とする類似度関数を生成する
    請求項1記載のデータ連携システム。
  4. スコア関数定義手段は、第一のドメインにおけるユーザの行動履歴を変換した第一ドメインベクトルおよび第二のドメインにおけるユーザの行動履歴を変換した第二ドメインベクトルを、類似度関数の引数とする関数としてスコア関数を定義する
    請求項1から請求項3のうちのいずれか1項に記載のデータ連携システム。
  5. マッチング手段は、第一のドメインのユーザとのペアにより算出されるスコア関数のスコアがより大きい第二のドメインのユーザを、当該第一のドメインと同一のユーザとして推定する
    請求項1から請求項4のうちのいずれか1項に記載のデータ連携システム。
  6. 変換器生成手段は、行動履歴が示す行動実績を単語とみなして当該行動履歴を文章化し、文章化された行動履歴を数値ベクトルに変換する変換器を生成する
    請求項1から請求項5のうちのいずれか1項に記載のデータ連携システム。
  7. 第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、
    前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、
    前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、
    生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、
    前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、
    生成された前記類似度関数を用いて、前記第一のドメインに行動履歴を有するユーザと、前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を定義するスコア関数定義手段とを備えた
    ことを特徴とする学習装置。
  8. 第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない当該第一のドメインのユーザの行動履歴と、当該第二のドメインのユーザの行動履歴との入力を受け付けるユーザ集合入力手段と、
    前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を用いて、受け付けた前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出するスコア算出手段と、
    算出された前記スコアの大きさに基づいて、前記第一のドメインのユーザと同一のユーザを、前記第二のドメインのユーザの中から推定するマッチング手段とを備え、
    前記スコア関数は学習装置によって生成され、
    前記学習装置は、
    前記第一のドメインと前記第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、
    前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、
    前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、
    生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、
    前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、
    生成された前記類似度関数を用いて、前記スコア関数を定義するスコア関数定義手段とを備えた
    ことを特徴とする推定装置。
  9. 第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付け、
    前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成し、
    前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成し、
    生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換し、
    前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成し、
    生成された前記類似度関数を用いて、前記第一のドメインに行動履歴を有するユーザと、前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を定義し、
    前記第一のドメインと前記第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない当該第一のドメインのユーザの行動履歴と、当該第二のドメインのユーザの行動履歴との入力を受け付け、
    前記スコア関数を用いて、受け付けた前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出し、
    算出された前記スコアの大きさに基づいて、前記第一のドメインのユーザと同一のユーザを、前記第二のドメインのユーザの中から推定する
    ことを特徴とするデータ連携方法。
  10. 第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付け、
    前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成し、
    前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成し、
    生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換し、
    前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成し、
    生成された前記類似度関数を用いて、前記第一のドメインに行動履歴を有するユーザと、前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を定義する
    ことを特徴とするスコア関数生成方法。
  11. 第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない当該第一のドメインのユーザの行動履歴と、当該第二のドメインのユーザの行動履歴との入力を受け付け、
    前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を用いて、受け付けた前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出し、
    算出された前記スコアの大きさに基づいて、前記第一のドメインのユーザと同一のユーザを、前記第二のドメインのユーザの中から推定し、
    前記スコア関数は学習装置によって生成され、
    前記学習装置は、
    前記第一のドメインと前記第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、
    前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、
    前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、
    生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、
    前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、
    生成された前記類似度関数を用いて、前記スコア関数を定義するスコア関数定義手段とを備えた
    ことを特徴とする推定方法。
  12. コンピュータに、
    第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付ける行動履歴入力処理、
    前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合処理、
    前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成処理、
    生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換する変換処理、
    前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成処理、および、
    生成された前記類似度関数を用いて、前記第一のドメインに行動履歴を有するユーザと、前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を定義するスコア関数定義処理
    を実行させるための学習プログラム。
  13. 第一のコンピュータに、
    第一のドメインと第二のドメインとの間で同一のユーザによる行動履歴であると特定されていない当該第一のドメインのユーザの行動履歴と、当該第二のドメインのユーザの行動履歴との入力を受け付けるユーザ集合入力処理、
    前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザとの近さをスコアで表わす関数であるスコア関数を用いて、受け付けた前記第一のドメインに行動履歴を有するユーザと前記第二のドメインに行動履歴を有するユーザのペアに対するスコアを算出するスコア算出処理、および、
    算出された前記スコアの大きさに基づいて、前記第一のドメインのユーザと同一のユーザを、前記第二のドメインのユーザの中から推定するマッチング処理を実行させ、
    前記スコア関数は第二のコンピュータによって生成され、
    前記第二のコンピュータは、
    前記第一のドメインと前記第二のドメインとの間で同一のユーザによる行動履歴であると特定されている当該ユーザの前記第一のドメインの行動履歴と、前記第二のドメインの行動履歴との入力を受け付ける行動履歴入力手段と、
    前記第一のドメインにおけるユーザの行動履歴と、前記第二のドメインにおけるユーザの行動履歴とを結合させた結合データの集合を生成する行動履歴結合手段と、
    前記結合データの集合を用いた学習により、行動履歴をベクトルに変換する変換器を生成する変換器生成手段と、
    生成された前記変換器を用いて、前記第一のドメインの行動履歴を第一のドメインベクトルに変換し、前記第二のドメインの行動履歴を第二のドメインベクトルに変換する変換手段と、
    前記第一のドメインベクトルと、前記第二のドメインベクトルとの類似度を導出する類似度関数を生成する類似度関数生成手段と、
    生成された前記類似度関数を用いて、前記スコア関数を定義するスコア関数定義手段とを備えた
    ことを特徴とする推定プログラム。
JP2021503071A 2020-06-05 2020-06-05 データ連携システム、学習装置、および、推定装置 Active JP6885525B1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/022371 WO2021245927A1 (ja) 2020-06-05 2020-06-05 データ連携システム、学習装置、および、推定装置

Publications (2)

Publication Number Publication Date
JP6885525B1 true JP6885525B1 (ja) 2021-06-16
JPWO2021245927A1 JPWO2021245927A1 (ja) 2021-12-09

Family

ID=76310124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021503071A Active JP6885525B1 (ja) 2020-06-05 2020-06-05 データ連携システム、学習装置、および、推定装置

Country Status (3)

Country Link
US (1) US11977583B2 (ja)
JP (1) JP6885525B1 (ja)
WO (1) WO2021245927A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015106178A (ja) * 2013-11-28 2015-06-08 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理方法、及び、プログラム
JP2018181326A (ja) * 2017-04-06 2018-11-15 ネイバー コーポレーションNAVER Corporation ディープラーニングを活用した個人化商品推薦
JP2020060931A (ja) * 2018-10-10 2020-04-16 株式会社エクサウィザーズ 情報処理装置及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6865152B2 (ja) 2017-12-15 2021-04-28 株式会社日立製作所 行動履歴を用いた本人認証方法
JP6993498B2 (ja) 2018-04-16 2022-01-13 株式会社Nttドコモ 移動端末装置
US11941012B2 (en) * 2019-01-17 2024-03-26 Sri International User action sequence recognition using action models

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015106178A (ja) * 2013-11-28 2015-06-08 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、情報処理方法、及び、プログラム
JP2018181326A (ja) * 2017-04-06 2018-11-15 ネイバー コーポレーションNAVER Corporation ディープラーニングを活用した個人化商品推薦
JP2020060931A (ja) * 2018-10-10 2020-04-16 株式会社エクサウィザーズ 情報処理装置及びプログラム

Also Published As

Publication number Publication date
WO2021245927A1 (ja) 2021-12-09
US11977583B2 (en) 2024-05-07
JPWO2021245927A1 (ja) 2021-12-09
US20230229709A1 (en) 2023-07-20

Similar Documents

Publication Publication Date Title
Zheng et al. Capturing the essence of word-of-mouth for social commerce: Assessing the quality of online e-commerce reviews by a semi-supervised approach
WO2019196545A1 (zh) 保险欺诈识别的数据处理方法、装置、设备及服务器
TWI686760B (zh) 保險欺詐識別的資料處理方法、裝置、設備及伺服器
WO2019114434A1 (zh) 一种基于图结构模型的交易风险控制方法、装置以及设备
WO2019114412A1 (zh) 一种基于图结构模型的信用风险控制方法、装置以及设备
WO2017157149A1 (zh) 基于社交网络的推荐方法、装置、服务器及存储介质
US20130086072A1 (en) Method and system for extracting and classifying geolocation information utilizing electronic social media
JP6436440B2 (ja) 生成装置、生成方法、及び、プログラム
US20190080352A1 (en) Segment Extension Based on Lookalike Selection
JP5914549B2 (ja) 情報処理装置および情報分析方法
CN112801425B (zh) 信息点击率的确定方法、装置、计算机设备和存储介质
Wang et al. Webpage depth viewability prediction using deep sequential neural networks
Jadon et al. A BigData approach for sentiment analysis of twitter data using Naive Bayes and SVM Algorithm
CN113779276A (zh) 用于检测评论的方法和装置
Shi et al. An Integrated machine learning and DEA-predefined performance outcome prediction framework with high-dimensional imbalanced data
JP6885525B1 (ja) データ連携システム、学習装置、および、推定装置
Wang et al. RLRecommender: a representation-learning-based recommendation method for business process modeling
CN114168804B (zh) 一种基于异质子图神经网络的相似信息检索方法和系统
Majhi et al. Development and performance evaluation of neural network classifiers for Indian internet shoppers
CN105528704A (zh) 一种基于阶段的动态产品推荐方法
Coba et al. Replicating and improving Top-N recommendations in open source packages
Ghildiyal et al. Analyze of different algorithms of machine learning for loan approval
Rosolia et al. Analyzing deep generated financial time series for various asset classes
Suthanthiradevi et al. Modelling a Behavioral scoring system for lending loans using twitter
JP2018067215A (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210119

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210119

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210119

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20210323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210413

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210426

R150 Certificate of patent or registration of utility model

Ref document number: 6885525

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150