JP7227412B1 - 情報処理システム、コンピュータプログラム、及び情報処理方法 - Google Patents

情報処理システム、コンピュータプログラム、及び情報処理方法 Download PDF

Info

Publication number
JP7227412B1
JP7227412B1 JP2022048893A JP2022048893A JP7227412B1 JP 7227412 B1 JP7227412 B1 JP 7227412B1 JP 2022048893 A JP2022048893 A JP 2022048893A JP 2022048893 A JP2022048893 A JP 2022048893A JP 7227412 B1 JP7227412 B1 JP 7227412B1
Authority
JP
Japan
Prior art keywords
entities
feature vectors
group
data set
low
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022048893A
Other languages
English (en)
Other versions
JP2023070618A (ja
Inventor
雄介 熊谷
龍 道本
悠哉 野沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hakuhodo DY Holdings Inc
Original Assignee
Hakuhodo DY Holdings Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hakuhodo DY Holdings Inc filed Critical Hakuhodo DY Holdings Inc
Priority to PCT/JP2022/041591 priority Critical patent/WO2023085279A1/ja
Priority to TW111142613A priority patent/TW202336607A/zh
Application granted granted Critical
Publication of JP7227412B1 publication Critical patent/JP7227412B1/ja
Publication of JP2023070618A publication Critical patent/JP2023070618A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)

Abstract

【課題】共通変数によらずに、エンティティ間の対応付けを実現可能な技術を提供する。【解決手段】情報処理システム1では、複数の第一のエンティティに関する第一のデータセットが取得される(S110)。複数の第二のエンティティに関する第二のデータセットが取得される(S120)。第一のデータセットから特定される第一の特徴ベクトルの一群、及び、第二のデータセットから特定される第二の特徴ベクトルの一群に対する次元削減処理が実行される(S130,S140)。それにより、第一の特徴ベクトルの一群に対応する第一の低次元特徴ベクトルの一群、及び、第二の特徴ベクトルの一群に対応する第二の低次元特徴ベクトルの一群が生成される。第一の低次元特徴ベクトルの一群、及び、第二の低次元特徴ベクトルの一群に基づき、第一のエンティティのそれぞれが、第二のエンティティの少なくとも一つに対応付けられる(S150~S180)。【選択図】図2

Description

本開示は、情報処理システム及び情報処理方法に関する。
従来、商品の販売データに基づき顧客の購買行動を分析することが行われている。顧客によるマスメディアやネットワークコンテンツへの接触行動を分析することも行われている。この他、アンケート形式や対面での質問形式により、顧客に関する多様な情報を収集することが行われている。
異なる手段で収集した複数のデータを共通変数に基づいて結合するデータフュージョン技術も知られている。例えば、出願人は、第一の顧客群に関する第一の特徴を表す第一のデータセットと、第二の顧客群に関する第二の特徴を表す第二のデータセットとを、第一のデータセットと第二のデータセットとの間で共通する変数、例えば、顧客のデモグラフィック属性に基づいて、近しい顧客の第一のデータと第二のデータとを結合するように、結合する技術を既に開示している(例えば、特許文献1参照)。
特開2016-126609号公報
しかしながら、従来のデータフュージョン技術では、共通変数を用いて近しい顧客を判別するために、結合対象の第一のデータセットと第二のデータセットとの間に、顧客に関する共通変数が必要である。従って、従来技術では、共通変数のないデータ同士を結合することができない。
そこで、本開示の一側面によれば、共通変数によらずに、複数の第一のエンティティに関する第一のデータセットと、複数の第二のエンティティに関する第二のデータセットとに基づいて、第一のエンティティと第二のエンティティとの対応付けを実現可能な技術を提供できることが望ましい。
本開示の一側面によれば、情報処理システムが提供される。情報処理システムは、第一取得部と、第二取得部と、次元削減部と、対応付け部と、を備える。第一取得部は、複数の第一のエンティティに関する第一のデータセットを取得するように構成される。第一のデータセットは、複数の第一のエンティティのそれぞれの特徴を記述し得る。
第二取得部は、複数の第二のエンティティに関する第二のデータセットを取得するように構成される。第二のデータセットは、複数の第二のエンティティのそれぞれの特徴を記述し得る。
次元削減部は、第一のデータセットから特定される第一の特徴ベクトルの一群、及び、第二のデータセットから特定される第二の特徴ベクトルの一群に対する次元削減処理を実行することによって、第一の特徴ベクトルの一群に対応する第一の低次元特徴ベクトルの一群、及び、第二の特徴ベクトルの一群に対応する第二の低次元特徴ベクトルの一群を生成するように構成される。第二の低次元特徴ベクトルの一群は、第一の低次元特徴ベクトルの一群と同一次元数の特徴ベクトルの一群であり得る。
第一の特徴ベクトルのそれぞれは、複数の第一のエンティティのうちの対応する一つの特徴を表し得る。第二の特徴ベクトルのそれぞれは、複数の第二のエンティティのうちの対応する一つの特徴を表し得る。
対応付け部は、第一の低次元特徴ベクトルの一群、及び、第二の低次元特徴ベクトルの一群に基づき、複数の第一のエンティティのそれぞれを、複数の第二のエンティティの少なくとも一つに対応付けるように構成される。
第一のエンティティの集合及び第二のエンティティの集合が互いに共通する母集団又は互いに関係する母集団からの部分集合である場合には、第一の特徴ベクトルと第二の特徴ベクトルとの間に共通変数が存在しなくても、次元削減によって、第一のエンティティの特徴及び第二のエンティティの特徴を、互いに共通する又は関係する成分の組合せで表現することができる。
すなわち、次元削減によれば、第一の特徴ベクトル及び第二の特徴ベクトルから互いに共通する又は関係する主要な特徴成分を抽出することができる。従って、低次元特徴ベクトルの比較によれば、第一のエンティティと第二のエンティティとの間の適合度を、適切に判別することができる。
従って、本開示の一側面によれば、共通変数によらずに、複数の第一のエンティティに関する第一のデータセットと、複数の第二のエンティティに関する第二のデータセットとに基づいて、第一のエンティティと第二のエンティティとの対応付けを適切に行うことができる。
本開示の一側面によれば、対応付け部は、第一の低次元特徴ベクトルの一群から特定される第一のエンティティ間の類似度、及び、第二の低次元特徴ベクトルの一群から特定される第二のエンティティ間の類似度に基づき、類似度に関する第一のエンティティ間の相互関係が第二のエンティティ間の相互関係に適合するように、複数の第一のエンティティのそれぞれを、複数の第二のエンティティの少なくとも一つに対応付けることができる。
第一のエンティティの集合、及び、第二のエンティティの集合が共通する母集団又は互いに関係する母集団からの部分集合である場合には、エンティティ間の類似度に関する相互関係が、母集団と同様に、第一のエンティティの集合と、第二のエンティティの集合との間で、およそ互いに共通する又は関係する。
従って、類似度に関する第一のエンティティ間の相互関係が第二のエンティティ間の相互関係に適合するように、複数の第一のエンティティのそれぞれを、複数の第二のエンティティの少なくとも一つに対応付けることによれば、第一のエンティティのそれぞれを、同一性の高い又は関係性の強い適切な第二のエンティティに対応付けることができる。
本開示の一側面によれば、第一の低次元特徴ベクトルは、第一の特徴空間によって定義され得る。第二の低次元特徴ベクトルは、第二の特徴空間によって定義され得る。対応付け部は、第一の低次元特徴ベクトルの一群から特定される第一の特徴空間における複数の第一のエンティティの分布が、第二の低次元特徴ベクトルの一群から特定される第二の特徴空間における複数の第二のエンティティの分布に適合するように、第一の特徴空間上の複数の第一のエンティティを第二の特徴空間にマッピングするための写像を探索し得る。
対応付け部は、写像に基づいて、複数の第一のエンティティのそれぞれを、複数の第二のエンティティの少なくとも一つに対応付けるように構成され得る。
本開示の一側面によれば、対応付け部は、行列K、行列L、及び行列Hを含む式
Figure 0007227412000002
に従う値Z(Ω)を最大化する行列Ωを行列Ωとして探索し、行列Ωに基づいて、複数の第一のエンティティのそれぞれを、複数の第二のエンティティの少なくとも一つに対応付けるように構成され得る。Tは、転置記号である。trace(X)は、行列Xの対角和である。
行列Kは、N行N列の行列であり得る。第一のエンティティの数は、Nであり得る。第二のエンティティの数は、第一のエンティティと同じであり得る。行列Kは、第i行第j列の要素の値が、複数の第一のエンティティのうちのi番目のエンティティとj番目のエンティティとの間の類似度を表す第一の類似度行列であり得る。
行列Kにおける第i行第j列の要素の値は、複数の第一のエンティティのうちのi番目のエンティティの第一の低次元特徴ベクトルと、複数の第一のエンティティのうちのj番目のエンティティの第一の低次元特徴ベクトルと、に基づいて算出され得る。
行列Lは、N行N列の行列であり得る。行列Lは、第i行第j列の要素の値が、複数の第二のエンティティのうちのi番目のエンティティとj番目のエンティティとの間の類似度を表す第二の類似度行列である。
行列Lにおける第i行第j列の要素の値は、複数の第二のエンティティのうちのi番目のエンティティの第二の低次元特徴ベクトルと、複数の第二のエンティティのうちのj番目のエンティティの第二の低次元特徴ベクトルと、に基づいて算出され得る。
行列Hは、N行N列の行列であり得る。行列Hは、第i行第j列の要素の値が、i=jであるとき値1-1/Nを示し、i≠jであるとき値0を示す行列であり得る。
本開示の一側面によれば、対応付け部は、行列Ωに基づいて、次元削減処理での次元削減方式を変更してもよい。例えば、対応付け部は、第一の低次元特徴ベクトルの一群及び第二の低次元特徴ベクトルの一群のうち、互いに対応する第一の低次元特徴ベクトルと第二の低次元特徴ベクトルとの間の特徴空間上の距離が短くなるように、次元削減処理での次元削減方式を変更してもよい。
本開示の一側面によれば、対応付け部は、行列Ωに基づいて、次元削減処理での次元削減方式を変更し、変更後の次元削減方式での次元削減処理を、次元削減部に実行させ、それにより新たに得られた第一の低次元特徴ベクトルの一群及び第二の低次元特徴ベクトルの一群に基づいて、値Z(Ω)を最大化する行列Ωを行列Ωとして探索する再探索処理を、所定条件が満足されるまで繰返し実行することにより、行列Ωを改善し、改善された行列Ωに基づいて、複数の第一のエンティティのそれぞれを、複数の第二のエンティティの少なくとも一つに対応付けるように構成されてもよい。
対応付け部がこのように構成される情報処理システムによれば、第一のエンティティと第二のエンティティとの間の対応付けを、高精度に実行することができる。
本開示の一側面によれば、第一のデータセットは、複数の第一の特徴データを含み得る。複数の第一の特徴データのそれぞれは、複数の第一のエンティティのうちの対応する一つの特徴を表し得る。第二のデータセットは、複数の第二の特徴データを含み得る。複数の第二の特徴データのそれぞれは、複数の第二のエンティティのうちの対応する一つの特徴を表し得る。
本開示の一側面によれば、情報処理システムは、データフュージョン部を更に備え得る。データフュージョン部は、対応付け部による対応付けに基づき、第一のデータセットに含まれる複数の第一の特徴データのそれぞれに、第二のデータセットに含まれる複数の第二の特徴データのうちの一つを結合することによって、拡張データセットを生成するように構成され得る。拡張データセットは、複数の拡張データを備え得る。複数の拡張データのそれぞれは、対応する一つの第一の特徴データと第二の特徴データとの結合データであり得る。
こうした情報処理システムによれば、複数のデータセットを結合した情報量の多いデータセットを生成することが可能である。
本開示の一側面によれば、第一のエンティティは、人であり得る。第二のエンティティは、人であり得る。第一のデータセットは、第一の集団に属する複数の人のそれぞれの第一の特徴を記述するデータセットであり得る。第二のデータセットは、第二の集団の属する複数の人のそれぞれの第二の特徴を記述するデータセットであり得る。
人の行動や関心等に関する特徴は、デモグラフィック属性に大きく影響し、異なる人の集団の間でも、デモグラフィック属性に応じた特徴分布は、大きく変わらないと考えられる。従って、本開示の一側面に係る情報処理システムによれば、共通変数なしで、異なる集団間の人に関する対応付けを、適切に行うことが可能である。
本開示の一側面によれば、第一の特徴と第二の特徴との組合せは、購買行動に関する特徴と、オンライン空間及びオフライン空間の少なくとも一方の空間における移動に関する特徴、及び/又は、空間上の複数の地点への訪問に関する特徴と、の組合せであり得る。こうした特徴に関係するデータセットに基づいたエンティティの対応付けは、更には、データフュージョンは、人の行動分析に役立つ。
本開示の一側面によれば、第二のデータセットには、複数の第二のエンティティのそれぞれに対応する情報端末の識別情報が関連付けられていてもよい。
本開示の一側面によれば、情報処理システムは、上記識別情報に基づいて、複数の第二のエンティティのうち、情報コンテンツの配信先として選択された第二のエンティティの集合に対応する情報端末の集合に、情報コンテンツを配信するように構成される配信部を備えていてもよい。
本開示の一側面によれば、情報処理システムは、対応付け部により複数の第一のエンティティのいずれかと対応付けられた第二のエンティティの集合の少なくとも一部を、情報コンテンツの配信先に選択する選択部を備えていてもよい。
この情報処理システムは、第一のエンティティ及び第二のエンティティが人であるときに有意義に機能する。上述の配信方式によれば、第一のエンティティと情報端末との対応関係が不明であるときにも、第二のエンティティに関連付けられた情報端末の識別情報を活用して、第一のエンティティに対応する第二のエンティティの情報端末に適切に情報コンテンツを配信することができる。
本開示の一側面によれば、選択部は、対応付け部により複数の第一のエンティティのいずれかと対応付けられた第二のエンティティの集合である第一の集合と、複数の第二のエンティティのうち、第一の集合と特徴が類似する第二の集合と、を情報コンテンツの配信先に選択するように構成されてもよい。こうした配信先の選択によれば、第二のデータセットに基づいて、配信先を適切な範囲で拡張して、情報コンテンツを配信することができる。
本開示の一側面によれば、第二のデータセットは、複数の第二のエンティティのそれぞれの行動に関する特徴を記述するデータセットであってもよい。この場合、情報処理システムは、複数の第一のエンティティの少なくとも一部のエンティティに関して、エンティティ毎に、第二のデータセットから特定される対応付け部によって当該エンティティに対応付けられた複数の第二のエンティティの少なくとも一つの行動に関する特徴に基づき、当該エンティティの行動に関する推定値を算出する推定部を備えていてもよい。この場合、第一のエンティティ及び第二のエンティティは、人であり得る。
上述の推定部を備える情報処理システムによれば、第一のデータセットだけでは判別できない第一のエンティティの行動を、第二のデータセットを通じて推定することが可能である。推定は、予測であってもよい。
本開示の一側面によれば、上述した情報処理システムにおける第一取得部、第二取得部、次元削減部、及び、対応付け部の少なくとも一部として、コンピュータを機能させるためのコンピュータプログラムが提供されてもよい。
本開示の一側面によれば、上述した情報処理システムにおける第一取得部、第二取得部、次元削減部、対応付け部、配信部、及び、選択部の少なくとも一部として、コンピュータを機能させるためのコンピュータプログラムが提供されてもよい。
本開示の一側面によれば、上述した情報処理システムにおける第一取得部、第二取得部、次元削減部、対応付け部、及び、推定部の少なくとも一部として、コンピュータを機能させるためのコンピュータプログラムが提供されてもよい。これらのコンピュータプログラムは、記録媒体に記録されて、提供されてもよい。
本開示の一側面によれば、上述した情報処理システムが実行する方法に対応する情報処理方法が提供されてもよい。本開示の一側面によれば、コンピュータにより実行される情報処理方法が提供されてもよい。情報処理方法は、複数の第一のエンティティに関する第一のデータセットであって、複数の第一のエンティティのそれぞれの特徴を記述する第一のデータセットを取得することを含み得る。
情報処理方法は、複数の第二のエンティティに関する第二のデータセットであって、複数の第二のエンティティのそれぞれの特徴を記述する第二のデータセットを取得することを含み得る。
情報処理方法は、第一のデータセットから特定される第一の特徴ベクトルの一群、及び、第二のデータセットから特定される第二の特徴ベクトルの一群に対する次元削減処理を実行することによって、第一の特徴ベクトルの一群に対応する第一の低次元特徴ベクトルの一群、及び、第二の特徴ベクトルの一群に対応する第二の低次元特徴ベクトルの一群を生成することを含み得る。第二の低次元特徴ベクトルの一群は、第一の低次元特徴ベクトルの一群と同一次元数の特徴ベクトルの一群であり得る。
第一の特徴ベクトルのそれぞれは、複数の第一のエンティティのうちの対応する一つの特徴を表し得る。第二の特徴ベクトルのそれぞれは、複数の第二のエンティティのうちの対応する一つの特徴を表し得る。
情報処理方法は、第一の低次元特徴ベクトルの一群、及び、第二の低次元特徴ベクトルの一群に基づき、複数の第一のエンティティのそれぞれを、複数の第二のエンティティの少なくとも一つに対応付けることを含み得る。
本開示の一側面によれば、対応付けることは、第一の低次元特徴ベクトルの一群から特定される第一のエンティティ間の類似度、及び、第二の低次元特徴ベクトルの一群から特定される第二のエンティティ間の類似度に基づき、類似度に関する第一のエンティティ間の相互関係が第二のエンティティ間の相互関係に適合するように、複数の第一のエンティティのそれぞれを、複数の第二のエンティティの一つに対応付けることを含み得る。
こうした情報処理方法によれば、上述した情報処理システムと同様に、共通変数によらずに、複数の第一のエンティティに関する第一のデータセットと、複数の第二のエンティティに関する第二のデータセットとに基づいて、第一のエンティティと第二のエンティティとの対応付けを実現可能である。
情報処理システムの構成を表すブロック図である。 プロセッサが実行する分析処理を表すフローチャートである。 図3Aは、第一のデータセットの構成を例示する図であり、図3Bは、第二のデータセットの構成を例示する図である。 図4A及び図4Bは、行列Ωの探索手法を説明する図である。 プロセッサにより生成される対応表の構成を例示する図である。 プロセッサにより生成される拡張データセットの構成を例示する図である。 第二実施形態でプロセッサが実行する分析処理を表すフローチャートである。 第三実施形態でプロセッサが実行する評価処理を表すフローチャートである。 第三実施形態でプロセッサが実行する選択処理を表すフローチャートである。 第四実施形態の配信システムの構成を表すブロック図である。 第四実施形態における内部データセットの構成を例示する図である。 第四実施形態でプロセッサが実行する配信制御処理を表すフローチャートである。 第五実施形態でプロセッサが実行する配信制御処理を表すフローチャートである。 第六実施形態でプロセッサが実行する予測処理を表すフローチャートである。
以下に本開示の例示的実施形態を、図面を参照しながら説明する。
<第一実施形態>
本実施形態の情報処理システム1は、汎用コンピュータに専用のコンピュータプログラムPrがインストールされて構成される。情報処理システム1は、図1に示すように、プロセッサ11と、メモリ13と、ストレージ15と、ユーザインタフェース17と、通信インタフェース19とを備える。
プロセッサ11は、ストレージ15に格納されたコンピュータプログラムPrに従う処理を実行する。メモリ13は、RAMを備える一次記憶装置であり、プロセッサ11による処理の実行時に作業エリアとして使用される。
ストレージ15は、例えばハードディスクドライブ又はソリッドステートドライブを備える二次記憶装置であり、コンピュータプログラムPrの他、コンピュータプログラムPrに従う処理の実行時に供される各種データを記憶する。
ユーザインタフェース17は、情報処理システム1を操作するユーザからの操作信号をプロセッサ11に入力するための入力デバイスと、ユーザに対して各種情報を表示するためのディスプレイと、を備える。入力デバイスの例には、キーボード及びポインティングデバイスが含まれる。
通信インタフェース19は、LAN(ローカルエリアネットワーク)インタフェース及びUSB(ユニバーサル・シリアル・シリアル)インタフェースを含み、外部装置との通信に使用される。情報処理システム1は、通信インタフェース19を通じて外部装置との間でデータ送受する。
情報処理システム1におけるプロセッサ11は、コンピュータプログラムPrに従う処理の実行により、通信インタフェース19を通じて外部装置から取得した第一のデータセット15Aを、第二のデータセット15Bを用いて拡張した拡張データセット15Cを生成する。
拡張データセット15Cは、第一のデータセット15Aに対して、第二のデータセット15Bが備える情報を付加したデータセットである。拡張により、第一のデータセット15Aが記述する各エンティティの情報量は増大する。エンティティは、例えば人である。情報量の増大は、拡張データセット15Cに基づいた人の行動分析や広告配信のために行われる。
具体的に、情報処理システム1のプロセッサ11は、ユーザインタフェース17を通じてユーザからの実行指令が入力されると、図2に示す分析処理を実行する。図2に示す分析処理を開始すると、プロセッサ11は、データフュージョン対象の第一のデータセット15Aと第二のデータセット15Bとを取得する(S110,S120)。
S110,S120において、プロセッサ11は、ストレージ15に予め格納された第一のデータセット15A及び第二のデータセット15Bを、ストレージ15から読み出す。これにより、プロセッサ11は、第一のデータセット15A及び第二のデータセット15Bを取得する。
取得すべき第一のデータセット15A及び第二のデータセット15Bは、ユーザから指定され得る。ユーザは、データフュージョン対象の第一のデータセット15A及び第二のデータセット15Bを予め収集してストレージ15に格納することができる。
あるいは、プロセッサ11は、通信インタフェース19を用いた通信により、第一の外部装置から第一のデータセット15Aを取得し、第二の外部装置から第二のデータセット15Bを取得することができる。
具体的に、第一のデータセット15Aは、複数の第一のエンティティに関するデータセットであって、第一のエンティティのそれぞれの第一の特徴を記述するデータセットである。第一のデータセット15Aは、第一の特徴データの集合であり、第一の特徴データのそれぞれは、複数の第一のエンティティのうちの対応する一つのエンティティの第一の特徴を表す。
第二のデータセット15Bは、複数の第二のエンティティに関するデータセットであって、第二のエンティティのそれぞれの第二の特徴を記述するデータセットである。第二の特徴は、第一の特徴とは異なる特徴であり得る。具体的に、第二のデータセット15Bは、第二の特徴データの集合であり、第二の特徴データのそれぞれは、複数の第二のエンティティのうちの対応する一つのエンティティの第二の特徴を表す。
第一のエンティティの集合、及び、第二のエンティティの集合は、例えば、互いに共通する母集団における異なる部分集合である。母集団は、人の集合、又は、消費者の集合であり得る。例えば第一のエンティティの集合は、第一の企業の顧客に対応する人の集合であり得て、第二のエンティティの集合は、第一の企業とは異なる第二の企業の顧客に対応する人の集合であり得る。
あるいは、第一のエンティティの集合は、第一の行動の収集対象とされる人の集合であり得て、第二のエンティティの集合は、第二の行動の収集対象とされる人の集合であり得る。
図3Aに示される第一のデータセット15Aは、第一の人の集合に関するデータであり、人毎の購買行動に関する特徴データを備える。各特徴データは、対応する人のIDに関連付けて、複数の商品P1,P2,P3,…のそれぞれを、対応する人が購入したかを1又は0の2値で表す。
図3Bに示される第二のデータセット15Bは、第二の人の集合に関するデータであり、人毎のウェブコンテンツの閲覧行動に関する特徴データを備える。各特徴データは、対応する人のIDに関連付けて、複数のウェブサイトS1,S2,S3,…のそれぞれについて、対応するウェブサイトを、対応する人が訪問してウェブコンテンツを閲覧したか否かを1又は0の2値で表す。
プロセッサ11は、S110において、取得した第一のデータセット15Aに含まれる第一のエンティティ毎の第一の特徴データに基づいて、第一のエンティティ毎のM1次元特徴ベクトルx=(x1,x2,x3,…)を生成する。一例によれば、特徴ベクトルxの要素x1,x2,x3,…は、それぞれ、対応する人の商品P1,P2,P3,…の購買の有無を表し得る。
同様に、プロセッサ11は、S120において、取得した第二のデータセット15Bに含まれる第二のエンティティ毎の第二の特徴データに基づいて、第二のエンティティ毎のM2次元特徴ベクトルy=(y1,y2,y3,…)を生成する。一例によれば、特徴ベクトルyの要素y1,y2,y3,…は、それぞれ、対応する人のウェブサイトS1,S2,S3,…でのウェブコンテンツの閲覧有無を表し得る。
その後、プロセッサ11は、特徴ベクトルxの一群に対する次元削減処理(S130)により、各特徴ベクトルxを、M1次元特徴ベクトルから、それより小さいM次元の特徴ベクトルである低次元特徴ベクトルDx=(Dx1,Dx2,…)に変換する。これにより、プロセッサ11は、特徴ベクトルxの一群に対応する低次元特徴ベクトルDxの一群を生成する。図3Aの右下領域は、低次元特徴ベクトルDxの例を、テーブルにより示す。
プロセッサ11は更に、特徴ベクトルyの一群に対する次元削減処理(S140)により、各特徴ベクトルyを、M2次元特徴ベクトルから、それより小さいM次元の特徴ベクトルである低次元特徴ベクトルDy=(Dy1,Dy2,…)に変換する。これにより、プロセッサ11は、特徴ベクトルyの一群に対応する低次元特徴ベクトルDyの一群を生成する。低次元特徴ベクトルDyは、低次元特徴ベクトルDxと同一次元数Mの特徴ベクトルである。図3Bの右下領域は、低次元特徴ベクトルDyの例を、テーブルにより示す。
低次元空間への写像を実現するためのアルゴリズムの例としては、非負値行列分解(Nonnegative Matrix Factorization)、潜在的ディリクレ分配(latent dirichlet allocation )、特異値分解(singular value decomposition)、及び、確率的潜在意味解析(Probabilistic Latent Semantic Analysis)が知られている。S130,S140における次元削減処理は、これらのアルゴリズムの一つを用いて実行され得る。
上述したアルゴリズムによれば、特徴ベクトルは、エンティティの個々を強く特徴付ける主要な特徴成分が抽出されるように、あるいは、エンティティの個々を区別するための情報の損失が少ない形式で、低次元化される。
その後、プロセッサ11は、低次元特徴ベクトルDxの一群と、低次元特徴ベクトルDyの一群と、に基づいて、第一のエンティティのそれぞれと、第二のエンティティのそれぞれとの対応関係を計算するアライメント処理を行う(S150-S180)。
アライメント処理は、カーネライズドソーティング(Kernelized Sorting)の技術を用いて行われる。以下には、カーネライズドソーティングを用いたアライメント処理の詳細を説明するが、アライメント処理は、敵対的学習、Gromov-Wasserstein Alignment技術、又は、不均衡最適輸送(Unbalanced Optimal Transport)技術を用いて実現されてもよい。
S150において、プロセッサ11は、低次元特徴ベクトルDxの一群を用いて、第一のエンティティの集合に関する類似度行列Kを生成する。類似度行列Kは、N行N列の正方行列である。ここで、Nは、低次元特徴ベクトルDxの個数、換言すれば、第一のエンティティの数である。
類似度行列Kは、第i行第j列の要素の値Kijが、第一のエンティティの集合におけるi番目のエンティティとj番目のエンティティとの間の類似度を表す行列として定義される。
すなわち、類似度行列Kは、第一のエンティティの集合に関して、エンティティ間の類似度の分布を説明する行列として定義される。換言すれば、類似度行列Kは、第一のエンティティの集合に関して、特徴空間上のエンティティの分布を、エンティティ間の近しさの尺度を用いて説明する行列として定義される。
具体的に、類似度は、i番目のエンティティの低次元特徴ベクトルDxである低次元特徴ベクトルDx[i]と、j番目のエンティティの低次元特徴ベクトルDxである低次元特徴ベクトルDx[j]と、をカーネル関数k(a,b)に代入した値k(Dx[i],Dx[j])として算出される。すなわち、Kij=k(Dx[i],Dx[j])である。
カーネル関数k(a,b)の例には、次式で表されるガウシアンRBF(動径基底関数)カーネルが含まれる。このカーネル関数k(a,b)を用いて算出される類似度は、値0から値1までの範囲の値を採る。
Figure 0007227412000003
上記カーネル関数k(a,b)によれば、類似度行列Kの要素の値Kijは、0<Kij≦1である。
S160において、プロセッサ11は、低次元特徴ベクトルDyの一群を用いて、第二のエンティティの集合に関する類似度行列Lを生成する。類似度行列Lは、N行N列の正方行列である。ここで、Nは、低次元特徴ベクトルDyの個数、換言すれば、第二のエンティティの数である。すなわち、第一のエンティティの数と、第二のエンティティの数は、同一である。
類似度行列Lは、類似度行列Kと同様に、第i行第j列の要素の値Lijが第二のエンティティの集合のうち、i番目のエンティティとj番目のエンティティとの間の類似度を表す行列として定義される。すなわち、第i行第j列の要素の値Lij=k(Dy[i],Dy[j])である。
続くS170において、プロセッサ11は、類似度行列K及び類似度行列Lを用いて、次式に従う値Z(Ω)を最大化する行列Ωを行列Ωとして探索する。
Figure 0007227412000004
ここで、行列Hは、N行N列の行列であって、第i行第j列の要素の値が、i=jであるとき値1-1/Nを示し、i≠jであるとき値0を示す対角行列である。Tは、転置記号である。trace(X)は、行列Xの対角和である。類似度行列K,Lは、対称行列である。行列ΩL’Ωが行列K’の転置行列となるような理想的なΩが見つかるとき、値Z(Ω)は、最大化する。
行列Ωを探索することは、低次元特徴ベクトルDxの一群から特定される第一のエンティティ間の類似度、及び、低次元特徴ベクトルDyの一群から特定される第二のエンティティ間の類似度に基づき、類似度に関する第一のエンティティ間の相互関係が第二のエンティティ間の相互関係に適合するように、複数の第一のエンティティのそれぞれを、複数の第二のエンティティの少なくとも一つに対応付けることに対応する。
換言すれば、行列Ωを探索することは、低次元特徴ベクトルDxの一群から特定される第一のM次元特徴空間における第一のエンティティの分布であって、エンティティ間の類似度で定義される第一のエンティティの分布が、低次元特徴ベクトルDyの一群から特定される第二のM次元特徴空間における第二のエンティティの分布に適合するように、第一のM次元特徴空間上の複数の第一のエンティティを第二のM次元特徴空間にマッピングするための写像を探索することに対応する。
図4Aの左グラフは、第一のエンティティの分布を概念的に表し、図4Bの左グラフは、第二のエンティティの分布を概念的に表す。図4A及び図4Bに示す例は、技術説明のためだけに、2次元の低次元特徴ベクトルDx,Dyを定義している。符号E11,E12,E13,E14,E15,E16,E17が付された各点は、第一のエンティティのそれぞれの特徴空間上の位置を示す。符号E21,E22,E23,E24,E25,E26,E27が付された各点は、第二のエンティティのそれぞれの特徴空間上の位置を示す。
図4Bから理解できるように、この例によれば、低次元特徴ベクトルDyの成分Dy1は、低次元特徴ベクトルDxの成分Dx2に対応し、低次元特徴ベクトルDyの成分Dy2は、低次元特徴ベクトルDxの成分Dx1に対応する。
すなわち、図4Aに示す例によれば、第一のエンティティの一群と、第二のエンティティの一群とは、エンティティの配列及び次元の順序が、類似度行列Kと類似度行列Lとの間で異なる形で定義されているだけであり、実質、同じエンティティの集合の類似度分布を示す。
第一のエンティティの一群と、第二のエンティティの一群とが、母集団が同じであるなどの理由により、相互に共通する又は関係する集団的性質を有するときには、特徴ベクトルx,yの低次元化により、情報源の第一のデータセット15Aと第二のデータセット15Bとの間に共通変数がなくとも、各エンティティに本質的な共通する特徴成分を抽出することができる。
但し、このような低次元化によっても、低次元特徴ベクトルDx,Dyが、同じ特徴成分を有するだけで、特徴成分の配列を揃えることはできない。また、第一のデータセット15Aと第二のデータセット15Bとの間でエンティティの配列は揃っていない。
行列Ωの探索は、このようにエンティティの配列及び次元の配列の点で、不ぞろいな特徴ベクトルDx,Dyの対応関係を、類似度分布の同一性を手掛かりに、探索する作業に対応する。
続くS180において、プロセッサ11は、行列Ωに基づいて、第一のエンティティのそれぞれを、第二のエンティティの少なくとも一つに対応付ける。行列Ωにおける第i行第j列の要素値は、類似度の分布によれば、第一のエンティティの集合のうちi番目のエンティティと、第二のエンティティの集合のうちのj番目のエンティティと、が対応する程度又は可能性の大きさを表す。
行列Ωの各要素は、理想的には0又は1を採り、各行について、一行の要素値の合計が1になり、各列について、一列の要素値の合計が1になる。行列Ωが、こうした理想的な行列であるときには、値が1である要素の行番号の第一のエンティティと、列番号の第二のエンティティとが、互いに対応する。
すなわち、行列Ωにおける第i行第j列の要素が、値1であるとき、第一のエンティティの集合のうちi番目のエンティティと、第二のエンティティの集合のうちのj番目のエンティティと、が互いに対応することを示す。
但し、数値計算上において、行列Ωが、こうした理想的な行列になることはまれである。従って、S180では、次のいずれかの手法で、複数の第一のエンティティのそれぞれを、第二のエンティティの少なくとも一つに対応付ける。
(手法1)行列Ωの第i行において、値が最大の要素を探索する。値が最大の要素が第c列である場合には、第一のエンティティの集合のうちi番目のエンティティを、第二のエンティティの集合のうちc番目のエンティティに対応付ける。これを全ての行について行う。
この手法では、第二のエンティティの一つに、複数の第一のエンティティが対応付けられる可能性がある。これを緩和するために、近傍検索が行われてもよい。近傍検索の例としては、Contextual Dissimilarity measureが知られている。
(手法2)厳密な一対一の対応付けを行うために、行列Ωを入力とした最適割当問題を解くことにより、複数の第一のエンティティのそれぞれを、重複しない第二のエンティティの一つに対応付ける。
S180において、プロセッサ11は更に、第一のエンティティと第二のエンティティの対応関係を説明するテーブルとして、図5に示す対応表を出力することができる。すなわち、第一のエンティティのそれぞれのIDに関連付けて、第二のエンティティのIDを記述する対応表を出力して、ストレージ15に記憶することができる。
更にプロセッサ11は、上記対応付けの結果、又は上記対応表に基づいて、第一のデータセット15Aと、第二のデータセット15Bとを結合して、拡張データセット15Cを生成するデータフュージョン処理を実行する(S190)。
拡張データセット15Cは、複数の拡張データを備える。図6に示すように、複数の拡張データのそれぞれは、対応する一つの第一の特徴データと第二の特徴データとの結合データである。
すなわち、プロセッサ11は、対応表が示す対応関係に基づき、第一のデータセット15Aに含まれる複数の第一の特徴データのそれぞれに、第二のデータセット15Bに含まれる複数の第二の特徴データのうちの一つを結合することによって、拡張データセット15Cを生成する。
プロセッサ11は、対応表によれば、第一のエンティティの集合のうちのi番目のエンティティと、第二のエンティティの集合のうちj番目のエンティティとが対応付けられているとき、第一のエンティティの集合のうちのi番目のエンティティの特徴を説明する第一の特徴データと、第二のエンティティの集合のうちのj番目のエンティティの特徴を説明する第二の特徴データとを結合して、上記i番目のエンティティの拡張データを生成する。
このようにして生成された拡張データセット15Cは、ストレージ15に格納される。ストレージ15に格納された拡張データセット15Cは、例えばユーザインタフェース17を通じて入力されるユーザからの指令に基づき、通信インタフェース19を通じて別のシステムに転送される。
別のシステムは、例えば広告配信システムであり得る。広告配信システムは、拡張データセット15Cに基づき、広告配信先のエンティティを判別し、対応するエンティティに広告配信することができる。
S190において、データフュージョン処理を終了すると、プロセッサ11は、図2に示す分析処理を終了する。
以上に説明したように、本実施形態の情報処理システム1によれば、第一のデータセット15Aと、第二のデータセット15Bとの間に共通変数が存在しなくとも、第一のエンティティのそれぞれと、第二のエンティティのそれぞれと、を類似度の分布から適切に対応付けることができる。
本実施形態の技術に基づいて、類似度の分布に基づいて適切に対応付けるためには、第一のエンティティの集合と、第二のエンティティの集合との間において、その類似度分布が、相互に一致する、類似する、又は、関係するのが好ましい条件である。
第一のエンティティの集合と、第二のエンティティの集合とが、同じ母集団からの部分集合であるとき、このような好ましい条件はおよそ満足される。従って、例えば、第一のエンティティ及び第二のエンティティが人であるとき、すなわち、第一のデータセット15A及び第二のデータセット15Bとして、人に関する特徴を表すデータセットが取り扱われるとき、本実施形態の技術は、有意義に機能する。
人の行動は、特にデモグラフィック属性に応じた傾向を示すことが多い。従って、第一のデータセット15A及び第二のデータセット15Bが、デモグラフィック属性の分布が互いに類似すると推定される集団からの収集データに基づいたデータセットであるときには、第一のデータセット15A及び第二のデータセット15Bが、共通変数の存在しない、互いに異なる集団に属する人の特徴を説明するデータセットであったり、異なる行動の特徴を説明するデータセットであったりしても、適切に、エンティティ間の対応付けを行い、拡張データセット15Cとして、人の心理・行動分析に役立つデータセットを生成することができる。
上述した例によれば、第一のデータセット15Aは、第一の集団に属する複数の人のそれぞれの購買行動に関する特徴を記述するデータセットであり、第二のデータセット15Bは、第二の集団に属する複数の人のそれぞれのウェブサイト訪問行動/ウェブコンテンツ閲覧行動に関する特徴を記述するデータセットである。
しかしながら、第一のデータセット15A及び第二のデータセット15Bの一方には、テレビ視聴行動などの人のメディア接触行動に関する特徴を記述するデータセットが用いられてもよいし、スマートフォン等の携帯端末の使用状況に関する特徴を記述するデータセットが用いられてもよい。
更に言えば、第一のデータセット15A及び第二のデータセット15Bの一方には、オフライン空間(すなわち現実空間)における人の移動、例えば複数の場所への訪問、移動経路、及び移動手段に関する特徴を記述するデータセットが用いられてもよいし、オンライン空間における人の移動、具体的には仮想現実(VR)空間の移動やネットサ―フィンに関する特徴を記述するデータセットが用いられてもよい。更に言えば、第一のデータセット15A及び第二のデータセット15Bの一方には、アンケートにより収集されたデータに基づくデータセットが使用されてもよい。
第一のデータセット15Aと第二のデータセット15Bとの組合せとしては、アンケートにより収集されたデータセットと、テレビ視聴行動に関するデータセットとの組合せ、移動履歴に関するデータセットと、購買に関するデータセットとの組合せなども考えられる。
この他、上述した実施形態において、低次元特徴ベクトルDx,Dyの一群に対しては、ZCA白色化、正規化、及び、標準化などの処理が行われてもよい。
また、上記実施形態では、低次元特徴ベクトルDx,Dyの次元数Mが、設計者又はユーザにより定められるが、最適な次元数Mを探索するように、情報処理システム1は構成されてもよい。例えば、情報処理システム1は、図2に示す分析処理を、同一のデータセット15A,15Bについて次元数Mを変更しながら繰返し実行して、Z(Ω)の最大値を指標に、最適な次元数Mを自動選定するように構成されてもよい。
<第二実施形態>
第二実施形態の情報処理システム1は、プロセッサ11が図2に示す分析処理に代えて、図7に示す分析処理を実行するように構成される。以下では、第二実施形態の説明として、プロセッサ11が実行する分析処理の詳細を選択的に説明する。本実施形態において言及されない情報処理システム1の構成は、第一実施形態と同じであると理解されてよい。
プロセッサ11は、図7に示す分析処理を開始すると、第一実施形態と同様に、データフュージョン対象の第一のデータセット15Aと第二のデータセット15Bとを取得する(S310,S320)。
プロセッサ11は、S110での処理と同様に、第一のデータセット15Aに基づいて、第一のエンティティ毎の特徴ベクトルxを生成する(S310)。プロセッサ11は、S120での処理と同様に、第二のデータセット15Bに基づいて、第二のエンティティ毎の特徴ベクトルyを生成する(S320)。
更に、プロセッサ11は、S130,S140での処理と同様に、次元削減処理によって、特徴ベクトルxの一群に対応する低次元特徴ベクトルDxの一群を生成し、特徴ベクトルyの一群に対応する低次元特徴ベクトルDyの一群を生成する(S330)。
続くS340において、プロセッサ11は、S150,S160,S170での処理と同様の処理を実行する。すなわち、プロセッサ11は、低次元特徴ベクトルDxの一群を用いて、第一のエンティティの集合に関する類似度行列Kを生成し、低次元特徴ベクトルDyの一群を用いて、第二のエンティティの集合に関する類似度行列Lを生成する。
更に、プロセッサ11は、類似度行列K及び類似度行列Lを用いて、第一実施形態で説明した値Z(Ω)を最大化する行列Ωを行列Ωとして探索する(S340)。ここでは、探索された行列Ωのことを、対応関係行列Ωと表現する。
その後、プロセッサ11は、繰返し終了条件が満足されたか否かを判断する(S350)。繰返し終了条件が満足されていないと判断すると(S350でNo)、プロセッサ11は、S360の処理を実行する。
S360において、プロセッサ11は、S340で探索された対応関係行列Ωを固定した状態で、Gromov-Wasserstein距離のコストを最小化する次元削減方式を探索する。
対応関係行列Ωを固定した状態は、第一のエンティティと第二のエンティティとの間の対応関係を固定した状態に対応する。上述したように値Z(Ω)を最大化する行列Ωを対応関係行列Ωとして探索することは、第二の特徴空間における第二のエンティティの分布に適合するように、第一の特徴空間上の複数の第一のエンティティを第二の特徴空間にマッピングするための写像を探索することに対応する。
Gromov-Wasserstein距離のコストは、第一のエンティティの集合を、第二の特徴空間にマッピングしたときの第一のエンティティと第二のエンティティとの間の最適輸送問題における輸送コストに対応する。
Gromov-Wasserstein距離のコストは、類似度行列K,L及び対応関係行列Ωを用いて算出可能である。類似度行列Kは、上述の通り、次元削減後の低次元特徴ベクトルDxに基づいて算出された第一のエンティティ間の類似度を要素に含む行列である。類似度行列Lは、次元削減後の低次元特徴ベクトルDyに基づいて算出された第二のエンティティ間の類似度を要素に含む行列である。
Gromov-Wasserstein距離のコストを最小化する次元削減方式を探索することは、対応関係行列Ωで示される第一のエンティティと第二のエンティティとの間の対応関係を最もよく正当化する低次元特徴ベクトルDx,Dyを生成するための次元削減方式を探索することに対応する。
コストの最小化は、対応関係行列Ωによれば、互いに対応する第一のエンティティと第二のエンティティとの間の特徴空間上の距離、換言すれば、第一のエンティティの低次元特徴ベクトルDxと、第二のエンティティの低次元特徴ベクトルDyとの間の特徴空間上の距離が短くなるように、次元削減方式を探索することに対応する。
例えば、M1次元の特徴ベクトルxを、M次元の低次元特徴ベクトルDxに変換する場合には、特徴ベクトルxにM行M1列の変換行列Txを作用させる。M2次元の特徴ベクトルyを、M次元の低次元特徴ベクトルDyに変換する場合には、特徴ベクトルyにM行M2列の変換行列Tyを作用させる。このとき、変換行列Tx,Tyを構成するパラメータmの数は、(M*M1+M*M2)個である。
次元削減方式の探索は、例えば変換行列Tx,Yyのパラメータmとして、上述のコストを最小化するパラメータmを、勾配法等を用いて探索することにより実現される。
その後、プロセッサ11は、探索された次元削減方式(例えば変換行列Tx,Ty)で特徴ベクトルx,yを低次元化し、新たな低次元特徴ベクトルDx,Dyを算出する(S370)。
プロセッサ11は、新たな低次元特徴ベクトルDxに基づく類似度行列K、及び、新たな低次元特徴ベクトルDyに基づく類似度行列Lを用いて、値Z(Ω)を最大化する行列Ωを、新たな対応関係行列Ωとして探索する(S340)。
プロセッサ11は、このようにS360,S370,S340の処理を繰返し実行することによって、マッチング精度の高い対応関係行列Ωを、より良い次元削減方式と共に再探索する。
プロセッサ11は、繰返し終了条件が満足されると(S350でYes)、S380の処理を実行する。繰返し終了条件は、例えば、S340の処理が所定回実行された場合に、あるいは、再探索による対応関係行列Ωの変化量が一定未満になった場合に満足される。
S380において、プロセッサ11は、第一実施形態におけるS180の処理と同様に、繰返し処理の最後に算出された対応関係行列Ωに基づいて、第一のエンティティのそれぞれを、第二のエンティティの少なくとも一つに対応付ける。プロセッサ11は更に、第一のエンティティと第二のエンティティの対応関係を説明する対応表を記憶及び出力することができる。
その後、プロセッサ11は、S190での処理と同様に、第一のデータセット15Aと、第二のデータセット15Bとを結合して、拡張データセット15Cを生成するデータフュージョン処理を実行し、生成した拡張データセット15Cをストレージ15に格納する(S390)。
以上に説明した第二実施形態の情報処理システム1は、上述の繰返し処理によって、更に精度よく、第一のエンティティと第二のエンティティとの間の対応付けを行うことができる。従って、対応付けの正しい精度の良い拡張データセット15Cを生成することが可能である。
<第三実施形態>
第三実施形態の情報処理システム1は、ユーザインタフェース17を通じたユーザからの実行指示に基づき、プロセッサ11が図8に示す評価処理を実行するように構成される。以下では、第三実施形態の説明として、プロセッサ11が実行する評価処理の詳細を説明する。本実施形態において言及されない情報処理システム1の構成は、第一又は第二実施形態と同じであると理解されてよい。
評価処理は、評価対象のデータセットが、図2又は図7に示す分析処理での対応付け及びデータフュージョンを高精度に実行可能な優良なデータセットであるか否かを評価するために実行される。評価対象のデータセットは、分析処理で、第一のデータセット15A又は第二のデータセット15Bとして使用され得るデータセットに対応する。
プロセッサ11は、評価処理を開始すると、ユーザから実行指示と共に指定された評価対象のデータセットを取得する(S410)。プロセッサ11は、ストレージ15から指定された評価対象のデータセットを取得することができる。
その後、プロセッサ11は、評価対象のデータセットに基づき、エンティティ毎に、第一の特徴ベクトルx_1と、第二の特徴ベクトルx_2と、を生成する(S420)。評価対象のデータセットは、エンティティ毎に、対応するエンティティの特徴を(Q1+Q2)個の要素で表す特徴データを備えることができる。
プロセッサ11は、(Q1+Q2)個の要素を、Q1個の要素からなる第一の要素群と、Q2個の要素からなる第二の要素群と、に分割することができる。(Q1+Q2)個の要素のそれぞれは、ランダムに、第一の要素群及び第二の要素群のいずれかに分類され得る。
プロセッサ11は、評価対象のデータセットに基づいて、エンティティ毎に、対応するエンティティの第一の要素群に関する特徴を記述した第一の特徴ベクトルx_1と、対応するエンティティの第二の要素群に関する特徴を記述した第二の特徴ベクトルx_2と、を生成することができる。
例えば、評価対象のデータセットが、S110,S120,S310,又はS320で特徴ベクトルv=(v[1],v[2],v[3],…,v[Q])が生成され得る要素数Q=(Q1+Q2)の特徴データをエンティティ毎に備える場合、Q1個の要素を含む第一の特徴ベクトルx_1=(v[1],v[2],…,v[Q1])及びQ2個の要素を含む第二の特徴ベクトルx_2=(v[Q1+1],v[Q1+2],…,v[Q1+Q2])が生成され得る。
第一の特徴ベクトルx_1は、第一のエンティティの集合におけるエンティティ毎の特徴ベクトルxに対応し、第二の特徴ベクトルx_2は、第一のエンティティの集合と同一の第二のエンティティの集合におけるエンティティ毎の特徴ベクトルyに対応する。
その後、プロセッサ11は、S130~S170で実行される処理と同様の処理を、S430,S440において、第一の特徴ベクトルx_1及び第二の特徴ベクトルx_2に対して実行する。
S430において、プロセッサ11は、S130,S140での処理と同様に、第一のエンティティ毎の第一の特徴ベクトルx_1及び第二のエンティティ毎の第二の特徴ベクトルx_2に対する次元削減処理を実行して、同次元数の低次元特徴ベクトルDx_1及び低次元特徴ベクトルDx_2を生成する。
プロセッサ11は、第一のエンティティ毎の低次元特徴ベクトルDx_1に基づき、類似度行列Kに対応する第一のエンティティ間の低次元特徴ベクトルDx_1の類似度を表す類似度行列を生成する。プロセッサ11は更に、第二のエンティティ毎の低次元特徴ベクトルDx_2に基づき、類似度行列Lに対応する第二のエンティティ間の低次元特徴ベクトルDx_2の類似度を表す類似度行列を生成する。
プロセッサ11は、これらの類似度行列に基づき、値Z(Ω)を最大化する行列Ωを対応関係行列Ωとして探索する(S440)。
その後、プロセッサ11は、低次元特徴ベクトルDx_1の一群に対応する第一のエンティティの集合と、低次元特徴ベクトルDx_2の一群に対応する第二のエンティティの集合とに関して、対応関係行列Ωが、第一のエンティティと第二のエンティティとの間の対応関係を正しく表している程度をスコアとして算出する(S450)。
これにより、プロセッサ11は、評価対象のデータセットが分析処理による対応付け及びデータフュージョンを高精度に実行可能な優良なデータセットであるか否かを評価する(S450)。
プロセッサ11は、予めS420で第一のエンティティ毎の特徴ベクトルx_1及び第二のエンティティ毎の特徴ベクトルx_2を生成する際に、第一のエンティティと第二のエンティティとの間の正しい対応関係を記憶しておくことができる。
プロセッサ11は、このように対応関係の正解を記憶した環境で、S430,S440において分析処理と同様の処理を実行して対応関係行列Ωを算出し、対応関係行列Ωから特定される対応関係を正解と比較する。
例えば、プロセッサ11は、対応関係行列Ωに基づいて、第一のエンティティのそれぞれを、第二のエンティティの一つと対応付ける処理を、S180,S380での処理と同様に実行する。
プロセッサ11は、対応関係行列Ωに基づいて対応付けられた第一のエンティティと第二のエンティティとが、評価対象のデータセットにおいて同一のエンティティである場合には、対応付けに成功したと判別し、同一のエンティティではない場合には、対応付けに失敗したと判別する。
プロセッサ11は、エンティティ全体のうち、対応付けに成功した割合を、評価対象のデータセットのスコアとして算出することができる(S450)。その後、プロセッサ11は、算出したスコアを評価結果として出力し(S460)、評価処理を終了する。
一つのデータセットに基づく対応付け及びデータフュージョンを高精度に実行できない場合には、そのデータセットが、集合の特徴に関して高精度な対応付け及びデータフュージョンを実現するために十分な情報又はデータ構造を有していないと推測できる。
この情報不足は、二つの異なるデータセットに関して分析処理を実行して、対応付け及びデータフュージョンを行う場合の精度にも影響する。従って、上記評価処理によれば、評価対象のデータセットが、共通変数なしのデータフュージョンを高精度に実行可能なデータセットであるかを、事前に推測することができる。
プロセッサ11は、S460において、スコアの出力により、評価対象のデータセットが優良なデータセットであるか否かを情報処理システム1のユーザに伝達することができる。これにより、ユーザは、分析処理に、適切な第一のデータセット15A及び第二のデータセット15Bの組合せを採用して、信頼性の高い拡張データセット15Cを得ることができる。
また、所望の拡張データセット15Cを得るために、第二のデータセット15Bに結合する第一のデータセット15Aとして、互いに類似する複数のデータセットのいずれかを採用すれば十分である環境が考えられる。
例えば、購買行動に関する第一のデータセット15Aと、ウェブサイト訪問行動/ウェブコンテンツ閲覧行動に関する第二のデータセット15Bとを、結合して、拡張データセット15Cを生成することを考える。この場合、第一のデータセット15Aとして、複数の流通組織のいずれか一組織の顧客の購買行動に関するデータセットを用いて、拡張データセット15Cを生成すれば十分であることが考えられる。
複数の流通組織の例には、複数のコンビニエンスストアチェーンが含まれる。各コンビニストアチェーンの購買に関するデータセットには、消費者の購買行動として、同種の購買行動に関する情報が含まれ得る。
従って、第一のデータセット15Aとしては、複数のコンビニエンスストアチェーンのうちのいずれか一つの顧客の購買行動に関するデータセットを用いて、拡張データセット15Cを生成すれば十分であることが考えられる。
上述の評価処理は、第一のデータセット15A(又は第二のデータセット15B)の候補として、複数のデータセットが存在する場合に、これらの複数のデータセットから、対応付け及びデータフュージョンの精度の観点で最適なデータセットを、第一のデータセット15A(又は第二のデータセット15B)として選択するために利用することができる。
例えば、プロセッサ11は、S110,S120,S310,S320のいずれかの処理において、必要に応じて、図9に示す選択処理を実行することにより、データフュージョン対象のデータセットの複数の候補から、一つの候補を、データフュージョン対象のデータセットとして採用することができる。S110,S310におけるデータフュージョン対象のデータセットは、第一のデータセット15Aに対応し、S120,S320におけるデータフュージョン対象のデータセットは、第二のデータセット15Bに対応する。
図9に示す選択処理を開始すると、プロセッサ11は、データフュージョン対象のデータセットの複数の候補として、複数のデータセットを取得する(S510)。プロセッサ11は、ユーザから指定された複数のデータセットを、ストレージ15から取得することができる。
その後、プロセッサ11は、複数のデータセットのうちの一つを、評価対象のデータセットに設定して(S520)、図8に示す評価処理を実行する(S530)。プロセッサ11は、複数のデータセットのすべてに関する評価処理を実行するまで(S540でYes)、データセット毎に、これを評価対象のデータセットに設定して(S520)、評価処理(S530)を実行する処理を繰り返す。これにより、データセット毎に、S450で算出されるスコアを取得する。
複数のデータセットのすべてに関して評価処理を実行し、スコアを取得すると(S540でYes)、プロセッサ11は、複数のデータセットのうち、最もスコアの高いデータセットを、データフュージョン対象のデータセットに採用する(S550)。その後、選択処理を終了する。S110,S120,S310,S320において、プロセッサ11は、採用されたデータフュージョン対象のデータセットに基づく特徴ベクトル(x又はy)を生成することができる。
このように選択処理を実行して、複数の候補の中から最適なデータセットを選択することによれば、精度の高い拡張データセット15Cを生成することが可能である。
付言すると、購買行動の例において、データフュージョン対象のデータセットの複数の候補には、消費者の購買行動を異なるパラメータで表すデータセットが含まれ得る。例えば、第一の候補は、エンティティ(消費者)毎に、商品毎の購入個数を要素に含む特徴ベクトルを生成可能なデータセットであり得る。第二の候補は、エンティティ(消費者)毎に、商品毎の購入金額を要素に含む特徴ベクトルを生成可能なデータセットであり得る。
こうした同種の特徴を異なるパラメータで説明する複数のデータセットを用意して、データフュージョンに適したデータセットを選択することは、より良い拡張データセット15Cの生成に繋がる。
<第四実施形態>
図10に示す第四実施形態の配信システム30は、第一実施形態又は第二実施形態のデータフュージョン技術を用いて、外部から提供されるデータセットである外部データセット35Aと、内部に保持するデータセットである内部データセット35Bとを結合し、それにより生成される拡張データセット35Cに基づいて、広告配信を行うシステムである。
配信システム30は、図10に示すように、プロセッサ31と、メモリ33と、ストレージ35と、通信インタフェース39とを備える。プロセッサ31は、ストレージ35に格納されたコンピュータプログラムPr1に従う処理を実行する。ストレージ35は、更に、内部データセット35Bを備える。
内部データセット35Bは、図11に示すように、ユーザ毎に、対応するユーザの広告IDに関連付けて、対応するユーザのオンライン行動の特徴を説明する特徴データを備える。広告IDは、良く知られるように、広告のために使用される識別コードであって、情報端末に固有のIDである。
広告IDに関連付けられた特徴データは、対応する広告IDが割り当てられた情報端末を通じて観測されたユーザのオンライン行動の特徴を説明する。オンライン行動には、ウェブサイト訪問行動及びウェブコンテンツ閲覧行動が含まれる。
配信システム30は、通信インタフェース39を通じて広域ネットワークと接続され、広域ネットワークを介して、広告配信サービスを提供する。広告配信サービスを利用するサービス利用企業側システム40は、配信システム30に対して、配信対象の広告コンテンツと共に、配信指定情報を提供する。広告コンテンツは、広告用の情報コンテンツである。配信指定情報には、配信ターゲットを指定するターゲット指定情報、及び、配信数を指定する配信数指定情報が含まれる。
サービス利用企業側システム40は更に、配信システム30に対し、外部データセット35Aとして、配信先候補に対応する顧客の特徴を説明するデータセットである顧客データセットを提供する。
顧客データセットは、例えば、サービス利用企業が運営する店舗を利用する顧客の購買行動に関する特徴を説明するデータセットであり得る。例えば、顧客データセットは、顧客毎の特徴データとして、複数の商品に関する、対応する顧客の商品毎の購買量を説明する特徴データを備えることができる。
プロセッサ31は、通信インタフェース39を通じてサービス利用企業側システム40から配信要求が入力されると、コンピュータプログラムPr1に基づいて図12に示す配信制御処理を実行する。
配信制御処理を開始すると、プロセッサ31は、サービス利用企業側システム40から、配信対象の広告コンテンツと共に、ターゲット指定情報及び配信数指定情報を含む配信指定情報、外部データセット35Aとしての顧客データセットを取得する(S610)。
その後、プロセッサ31は、第一のデータセット15Aとして外部データセット35Aを用いて、更には、第二のデータセット15Aとして内部データセット35Bを用いて、分析処理におけるS110~S190の処理と同様の処理を実行することにより、外部データセット35Aと内部データセット35Bとを結合し、拡張データセット35Cを生成する(S620)。
外部データセット35Aと内部データセット35Bとの結合により、外部データセット35Aに含まれる顧客毎の特徴データには、内部データセット35Bに含まれる顧客と同一人物である可能性の高いユーザの広告IDが関連付けられる。
拡張データセット35Cは、エンティティ毎に、対応する顧客の外部データセット35Aが有する特徴データと、対応するユーザの内部データセット35Bが有する特徴データとが結合された拡張データを備える。各拡張データには、内部データセット35Bが有する対応するユーザの広告IDが関連付けられる。
ここでいうエンティティは、データフュージョンにより互いに対応付けられた顧客とユーザとの組合せのことである。データフュージョンでは、顧客とユーザとが一対一で対応付けられる。例えば、拡張データセット35Cは、図6に示す拡張データセット15Cにおいて図示される「ID2_1」「ID2_2」「ID2_3」の列に、広告IDが記述された構成にされ得る。
プロセッサ31は、その後、拡張データセット35C内の各エンティティが配信ターゲットである可能性に関するスコアを算出する(S630)。例えば、外部データセット35Aが顧客の購買行動に関するデータセットであり、内部データセット35Bがユーザのオンライン行動に関するデータセットである場合、プロセッサ31は、拡張データセット35C内の各エンティティの購買行動に関する特徴データとオンライン行動に関する特徴データとを所定の関数に入力して、対応するエンティティが配信ターゲットである可能性を数値化したスコアを算出する。
配信ターゲットは、性別、年齢、購買傾向、オンライン行動傾向、興味、及び関心等の消費者を特徴付けるパラメータにより絞り込まれる配信先の消費者群であり、ターゲット指定情報を通じて指定される。
S630におけるスコア算出後、プロセッサ31は、広告IDが関連付けられているエンティティの一群(換言すれば顧客の一群)のうち、算出されたスコアが高い順に、サービス利用企業側システム40から指定された配信数に対応する数のエンティティを、コンテンツ配信先に決定する(S640)。このようにして、プロセッサ31は、外部データセット35Aに対応する複数の顧客のいずれかと対応付けられた内部データセット35Bに対応する複数のユーザの少なくとも一部を、広告コンテンツの配信先に選択する。
その後、プロセッサ31は、決定したコンテンツ配信先の情報端末に、サービス利用企業側システム40から提供された広告コンテンツを、広域ネットワークを通じて送信する(S650)。広告コンテンツは、コンテンツ配信先の広告IDから識別される情報端末に配信される。その後プロセッサ31は、配信制御処理を終了する。
以上に説明した第四実施形態の配信システム30によれば、共通変数なしのデータフォージョン技術を用いて、外部データセット35Aと内部データセット35Bとを結合することにより、広告IDが不明な顧客の特徴データに対して広告IDを関連付けることができる。これにより、広告IDが不明な外部データセット35Aの顧客に対して、広告コンテンツを適切に配信することができる。
<第五実施形態>
第五実施形態の配信システム30は、プロセッサ31が図12に示す配信制御処理に代えて、図13に示す配信制御処理を実行するように構成される。以下では、第五実施形態の説明として、プロセッサ31が実行する配信制御処理の詳細を選択的に説明する。本実施形態において言及されない配信システム30の構成は、第四実施形態と同じであると理解されてよい。
本実施形態において、プロセッサ31は、通信インタフェース39を通じてサービス利用企業側システム40から、配信要求が入力されると、図13に示す配信制御処理を実行する。
配信制御処理を開始すると、プロセッサ31は、サービス利用企業側システム40から、配信対象の広告コンテンツと共に、配信指定情報、外部データセット35Aとしての顧客データセットを取得する(S710)。
但し、ここで取得される配信指定情報は、ターゲット指定情報を含まず、配信数指定情報のみを含む。また、外部データセット35Aとして取得される顧客データセットは、サービス提供企業が絞り込んだ配信ターゲットに対応する顧客群の特徴を説明する特定顧客データセットである。
その後、プロセッサ31は、S620での処理と同様に、外部データセット35Aと内部データセット35Bとを結合し、拡張データセット35Cを生成する(S720)。拡張データセット35Cは、エンティティ毎に、対応する顧客の外部データセット35Aが有する特徴データと、対応するユーザの内部データセット35Bが有する特徴データとが結合された拡張データを備える。
但し、本実施形態では、内部データセット35Bのユーザのすべてに対して外部データセット35Aの顧客が対応付けられることにはならない。本実施形態の拡張データセット35Cは、サービス利用企業側の顧客と対応付けられていないユーザの特徴データも、一つのエンティティの拡張データとして含む。この拡張データは、実質的には拡張されていない内部データセット35Bが有する該当ユーザの特徴データである。
本実施形態では、拡張データセット35Cに対応するエンティティの一群のうち、外部データセット35Aに対応する顧客群に対応付けられたエンティティ群のことをシードと表現し、それ以外のエンティティの一群のことを、非シードと表現する。
S720の処理後、プロセッサ31は、拡張データセット35Cに基づいて、非シードの各エンティティと、シードの各エンティティとの間の内部データセット35Bが示す特徴の類似度を算出する(S730)。類似度は、非シードの各エンティティと、シードの各エンティティとの間の特徴空間上の距離によって算出され得る。
類似度の算出後、プロセッサ31は、類似度の高い順に、配信指定情報で指定された配信数に対応する数のエンティティを配信先に決定する(S740)。この際、シードに対応する全てのエンティティも配信先に決定される。
このようにして、プロセッサ31は、外部データセット35Aに対応する複数の顧客と対応付けられたユーザの集合であるシードの集合と、内部データセット35Bに対応する複数のユーザのうち、シードと特徴が類似するユーザの集合と、を広告コンテンツの配信先に選択する。
その後、プロセッサ31は、S650の処理と同様に、S740で決定したコンテンツ配信先の情報端末に、サービス利用企業側システム40から提供された広告コンテンツを、広域ネットワークを通じて送信する(S750)。その後、配信制御処理を終了する。
以上に説明した本実施形態の配信システム30によれば、サービス利用企業側システム40から提供された顧客群のデータセットを基礎に、それら顧客群と共に、顧客群と類似した特徴を示すより大きな集合の消費者の情報端末に、広告コンテンツを配信することができる。従って、本実施形態によれば、多くの消費者に、効率的に広告配信を行うことが可能である。
<第六実施形態>
第六実施形態の配信システム30は、第四実施形態又は第五実施形態の配信システム30と同様の広告配信サービスと共に、予測サービスを提供するように構成される。
具体的には、本実施形態のプロセッサ31は、サービス利用企業側システム40からの実行要求に応じて、図14に示す予測処理を実行するように構成される。以下では、第六実施形態の説明として、プロセッサ31が実行する予測処理の詳細を選択的に説明する。本実施形態において言及されない配信システム30の構成は、第四実施形態又は第五実施形態と同じであると理解されてよい。
プロセッサ31は、予測処理を開始すると、通信インタフェース39を通じて分析対象のデータセットを、分析条件指定情報と共に、サービス利用企業側システム40から取得する(S810)。分析対象のデータセットは、分析対象の顧客毎の特徴データを備えるデータセットである。
分析条件指定情報は、顧客の購入可能性を評価する対象の商品を指定する情報であり得る。予測処理では、指定された対象商品を分析対象の各顧客が購入する可能性が、対象商品の購入数の予測値を算出することによって予測される。ここでの予測は、顧客の行動を推定することに対応し、予測値は、行動に関する推定値に対応する。
S810の処理実行後、プロセッサ31は、第一のデータセット15Aとして分析対象のデータセットを用いて、更には、第二のデータセット15Bとして内部データセット35Bを用いて、分析処理におけるS110~S170又はS310~S370の処理と同様の処理を実行することにより、分析対象の各顧客と内部データセット35Bに特徴データを有する各ユーザとの対応関係を示す対応関係行列Ωを算出する(S820)。
プロセッサ31は更に、算出された対応関係行列Ωに基づき、分析対象の顧客毎に、対応する顧客に近しい所定数のユーザを抽出し、内部データセット35Bから特定可能な上記抽出したユーザの対象商品の購入数の重み付け平均により、対応する顧客の対象商品の購入数の予測値を算出する(S830)。このようにしてプロセッサ31は、顧客の購買行動を、対応付けられたユーザの購買行動から推定する。内部データセット35Bは、各ユーザの対象商品の購入数を特定可能な情報を含む。
対応関係行列Ωの各要素は、顧客とユーザとの間の類似度を0~1の値で示す。具体的には、対応関係行列Ωにおける第i行第j列の要素は、内部データセット35Bに対応するユーザの集合のうちi番目のユーザと、分析対象のデータセットに対応する顧客の集合のうちのj番目の顧客と、の間の類似度を値0~1で示す。
重み付け平均は、例えば、類似度を重みとして用いて算出される。重み付け平均は、顧客と近しい3人のユーザとして第一、第二、及び第三のユーザが抽出されたと仮定したとき、次のように算出され得る。
すなわち、顧客と第一のユーザとの類似度がw1、顧客と第二のユーザとの類似度がw2、顧客と第三のユーザとの類似度w3であり、第一のユーザの対象商品購入数がp1、第二のユーザの対象商品購入数がp2であり、第三のユーザの対象商品購入数がp3であるとき、顧客の対象商品の購入数の予測値peは、pe=(w1・p1+w2・p2+w3・p3)/3で算出され得る。
対応関係行列Ωからは、顧客毎に、すべてのユーザとの類似度(換言すれば対応付けの大きさ)を特定可能である。従って、近しいユーザを抽出するプロセスなしに、すべてのユーザの対象商品の購入数の重み付け平均によって、顧客の対象商品の購入数の予測値が算出されてもよい。
S830の処理実行後、プロセッサ31は、顧客毎の対応商品の購入数の予測値を記述した予測データを、予測処理の実行要求元に出力する(S840)。その後、プロセッサ31は、図14に示す予測処理を終了する。
別例によれば、プロセッサ31は、S830の処理実行後、予測データを出力することに代えて又は加えて、顧客毎の対応商品の購入数の予測値に基づき、予測値が大きい順に、サービス利用企業から指定された配信数に対応する人数の顧客に対して、対象商品の購入を進める広告コンテンツを配信する処理を実行してもよい(S840)。
以上に、第六実施形態の配信システム30を説明したが、本実施形態によれば、共通変数なしのデータフュージョン技術を用いて、有意義な広告配信サービスを提供でき、更には、有意義なマーケティングソリューションを提供可能である。
[その他]
本開示が上述した実施形態に限定されるものではなく、種々の態様を採り得ることは言うまでもない。上記実施形態における1つの構成要素が有する機能は、複数の構成要素に分散して設けられてもよい。複数の構成要素が有する機能は、1つの構成要素に統合されてもよい。上記実施形態の構成の一部は、省略されてもよい。上記実施形態の構成の少なくとも一部は、他の上記実施形態の構成に対して付加又は置換されてもよい。特許請求の範囲に記載の文言から特定される技術思想に含まれるあらゆる態様が本開示の実施形態である。
1…情報処理システム、11,31…プロセッサ、13,33…メモリ、15,35…ストレージ、15A…第一のデータセット、15B…第二のデータセット、15C…拡張データセット、17…ユーザインタフェース、19,39…通信インタフェース、30…配信システム、35A…外部データセット、35B…内部データセット、35C…拡張データセット、40…サービス利用企業側システム、Pr,Pr1…コンピュータプログラム。

Claims (17)

  1. 複数の第一のエンティティに関する第一のデータセットであって、前記複数の第一のエンティティのそれぞれの特徴を記述する第一のデータセットを取得するように構成される第一取得部と、
    複数の第二のエンティティに関する第二のデータセットであって、前記複数の第二のエンティティのそれぞれの特徴を記述する第二のデータセットを取得するように構成される第二取得部と、
    前記第一のデータセットから特定される第一の特徴ベクトルの一群であって、前記第一の特徴ベクトルのそれぞれが、前記複数の第一のエンティティのうちの対応する一つの特徴を表す第一の特徴ベクトルの一群、及び、前記第二のデータセットから特定される第二の特徴ベクトルの一群であって、前記第二の特徴ベクトルのそれぞれが、前記複数の第二のエンティティのうちの対応する一つの特徴を表す第二の特徴ベクトルの一群に対する次元削減処理を実行することによって、前記第一の特徴ベクトルの一群に対応する第一の低次元特徴ベクトルの一群、及び、前記第二の特徴ベクトルの一群に対応する第二の低次元特徴ベクトルの一群であって前記第一の低次元特徴ベクトルの一群と同一次元数の第二の低次元特徴ベクトルの一群を生成するように構成される次元削減部と、
    前記第一の低次元特徴ベクトルの一群、及び、前記第二の低次元特徴ベクトルの一群に基づき、前記複数の第一のエンティティのそれぞれを、前記複数の第二のエンティティの少なくとも一つに対応付けるように構成される対応付け部と、
    を備え、
    前記対応付け部は、前記第一の低次元特徴ベクトルの一群から特定される前記第一のエンティティ間の類似度、及び、前記第二の低次元特徴ベクトルの一群から特定される前記第二のエンティティ間の類似度に基づき、類似度に関する前記第一のエンティティ間の相互関係が前記第二のエンティティ間の相互関係に適合するように、前記複数の第一のエンティティのそれぞれを、前記複数の第二のエンティティの少なくとも一つに対応付ける情報処理システム。
  2. 複数の第一のエンティティに関する第一のデータセットであって、前記複数の第一のエンティティのそれぞれの特徴を記述する第一のデータセットを取得するように構成される第一取得部と、
    複数の第二のエンティティに関する第二のデータセットであって、前記複数の第二のエンティティのそれぞれの特徴を記述する第二のデータセットを取得するように構成される第二取得部と、
    前記第一のデータセットから特定される第一の特徴ベクトルの一群であって、前記第一の特徴ベクトルのそれぞれが、前記複数の第一のエンティティのうちの対応する一つの特徴を表す第一の特徴ベクトルの一群、及び、前記第二のデータセットから特定される第二の特徴ベクトルの一群であって、前記第二の特徴ベクトルのそれぞれが、前記複数の第二のエンティティのうちの対応する一つの特徴を表す第二の特徴ベクトルの一群に対する次元削減処理を実行することによって、前記第一の特徴ベクトルの一群に対応する第一の低次元特徴ベクトルの一群、及び、前記第二の特徴ベクトルの一群に対応する第二の低次元特徴ベクトルの一群であって前記第一の低次元特徴ベクトルの一群と同一次元数の第二の低次元特徴ベクトルの一群を生成するように構成される次元削減部と、
    前記第一の低次元特徴ベクトルの一群、及び、前記第二の低次元特徴ベクトルの一群に基づき、前記複数の第一のエンティティのそれぞれを、前記複数の第二のエンティティの少なくとも一つに対応付けるように構成される対応付け部と、
    を備え、
    前記第一の低次元特徴ベクトルは、第一の特徴空間によって定義され、
    前記第二の低次元特徴ベクトルは、第二の特徴空間によって定義され、
    前記対応付け部は、前記第一の低次元特徴ベクトルの一群から特定される前記第一の特徴空間における前記複数の第一のエンティティの分布が、前記第二の低次元特徴ベクトルの一群から特定される前記第二の特徴空間における前記複数の第二のエンティティの分布に適合するように、前記第一の特徴空間上の前記複数の第一のエンティティを前記第二の特徴空間にマッピングするための写像を探索し、前記写像に基づいて、前記複数の第一のエンティティのそれぞれを、前記複数の第二のエンティティの少なくとも一つに対応付ける情報処理システム。
  3. 複数の第一のエンティティに関する第一のデータセットであって、前記複数の第一のエンティティのそれぞれの特徴を記述する第一のデータセットを取得するように構成される第一取得部と、
    複数の第二のエンティティに関する第二のデータセットであって、前記複数の第二のエンティティのそれぞれの特徴を記述する第二のデータセットを取得するように構成される第二取得部と、
    前記第一のデータセットから特定される第一の特徴ベクトルの一群であって、前記第一の特徴ベクトルのそれぞれが、前記複数の第一のエンティティのうちの対応する一つの特徴を表す第一の特徴ベクトルの一群、及び、前記第二のデータセットから特定される第二の特徴ベクトルの一群であって、前記第二の特徴ベクトルのそれぞれが、前記複数の第二のエンティティのうちの対応する一つの特徴を表す第二の特徴ベクトルの一群に対する次元削減処理を実行することによって、前記第一の特徴ベクトルの一群に対応する第一の低次元特徴ベクトルの一群、及び、前記第二の特徴ベクトルの一群に対応する第二の低次元特徴ベクトルの一群であって前記第一の低次元特徴ベクトルの一群と同一次元数の第二の低次元特徴ベクトルの一群を生成するように構成される次元削減部と、
    前記第一の低次元特徴ベクトルの一群、及び、前記第二の低次元特徴ベクトルの一群に基づき、前記複数の第一のエンティティのそれぞれを、前記複数の第二のエンティティの少なくとも一つに対応付けるように構成される対応付け部と、
    を備え、
    前記対応付け部は、行列K、行列L、及び行列Hを含む式
    Figure 0007227412000005
    に従う値Z(Ω)を最大化する行列Ωを行列Ωとして探索し、前記行列Ωに基づいて、前記複数の第一のエンティティのそれぞれを、前記複数の第二のエンティティの少なくとも一つに対応付けるように構成され、
    前記第一のエンティティの数は、Nであり、前記第二のエンティティの数は、前記第一のエンティティと同じであり、
    前記行列Kは、N行N列の行列であって、第i行第j列の要素の値が、前記複数の第一のエンティティのうちのi番目のエンティティの第一の低次元特徴ベクトルと、前記複数の第一のエンティティのうちのj番目のエンティティの第一の低次元特徴ベクトルと、に基づいて算出される前記複数の第一のエンティティのうちの前記i番目のエンティティと前記j番目のエンティティとの間の類似度を表す第一の類似度行列であり、
    前記行列Lは、N行N列の行列であって、第i行第j列の要素の値が、前記複数の第二のエンティティのうちのi番目のエンティティの第二の低次元特徴ベクトルと、前記複数の第二のエンティティのうちのj番目のエンティティの第二の低次元特徴ベクトルと、に基づいて算出される前記複数の第二のエンティティのうちの前記i番目のエンティティと前記j番目のエンティティとの間の類似度を表す第二の類似度行列であり、
    前記行列Hは、N行N列の行列であって、第i行第j列の要素の値が、i=jであるとき値1-1/Nを示し、i≠jであるとき値0を示す行列である情報処理システム。
  4. 前記対応付け部は、
    前記行列Ωに基づいて、前記次元削減処理での次元削減方式を変更し、変更後の前記次元削減方式での前記次元削減処理を、前記次元削減部に実行させ、それにより新たに得られた前記第一の低次元特徴ベクトルの一群及び前記第二の低次元特徴ベクトルの一群に基づいて、前記値Z(Ω)を最大化する行列Ωを行列Ωとして探索する再探索処理を、所定条件が満足されるまで繰返し実行することにより、前記行列Ωを改善し、改善された行列Ωに基づいて、前記複数の第一のエンティティのそれぞれを、前記複数の第二のエンティティの少なくとも一つに対応付ける
    ように構成される請求項記載の情報処理システム。
  5. 前記対応付け部は、前記行列Ωに基づいて、前記次元削減方式を、前記第一の低次元特徴ベクトルの一群及び前記第二の低次元特徴ベクトルの一群のうち、互いに対応する第一の低次元特徴ベクトルと第二の低次元特徴ベクトルとの間の特徴空間上の距離が短くなるように変更する請求項記載の情報処理システム。
  6. 前記第一のデータセットは、複数の第一の特徴データを含み、前記複数の第一の特徴データのそれぞれは、前記複数の第一のエンティティのうちの対応する一つの特徴を表し、
    前記第二のデータセットは、複数の第二の特徴データを含み、前記複数の第二の特徴データのそれぞれは、前記複数の第二のエンティティのうちの対応する一つの特徴を表し、
    前記情報処理システムは、
    前記対応付け部による対応付けに基づき、前記第一のデータセットに含まれる前記複数の第一の特徴データのそれぞれに、前記第二のデータセットに含まれる前記複数の第二の特徴データのうちの一つを結合することによって、複数の拡張データを含む拡張データセットであって、前記複数の拡張データのそれぞれが、対応する一つの第一の特徴データと第二の特徴データとの結合データである複数の拡張データを含む拡張データセットを生成するデータフュージョン部
    を更に備える請求項1~請求項のいずれか一項記載の情報処理システム。
  7. 前記第一のエンティティ及び前記第二のエンティティは、人であり、
    前記第一のデータセットは、第一の集団に属する複数の人のそれぞれの第一の特徴を記述するデータセットであり、
    前記第二のデータセットは、第二の集団の属する複数の人のそれぞれの第二の特徴を記述するデータセットである
    請求項1~請求項のいずれか一項記載の情報処理システム。
  8. 前記第一の特徴と前記第二の特徴との組合せは、購買行動に関する特徴と、オンライン空間及びオフライン空間の少なくとも一方の空間における移動に関する特徴、及び/又は、前記空間上の複数の地点への訪問に関する特徴と、の組合せである請求項記載の情報処理システム。
  9. 前記第一のエンティティ及び前記第二のエンティティは、人であり、
    前記第二のデータセットには、前記複数の第二のエンティティのそれぞれに対応する情報端末の識別情報が関連付けられており、
    前記情報処理システムは、
    前記識別情報に基づいて、前記複数の第二のエンティティのうち、情報コンテンツの配信先として選択された第二のエンティティの集合に対応する情報端末の集合に、前記情報コンテンツを配信するように構成される配信部と、
    前記対応付け部により前記複数の第一のエンティティのいずれかと対応付けられた前記第二のエンティティの集合の少なくとも一部を、前記情報コンテンツの配信先に選択する選択部と、
    を備える請求項1~請求項のいずれか一項記載の情報処理システム。
  10. 前記選択部は、前記対応付け部により前記複数の第一のエンティティのいずれかと対応付けられた前記第二のエンティティの集合である第一の集合と、前記複数の第二のエンティティのうち、前記第一の集合と特徴が類似する第二の集合と、を前記情報コンテンツの配信先に選択する請求項記載の情報処理システム。
  11. 前記第一のエンティティ及び前記第二のエンティティは、人であり、
    前記第二のデータセットは、前記複数の第二のエンティティのそれぞれの行動に関する特徴を記述し、
    前記情報処理システムは、更に、
    前記複数の第一のエンティティの少なくとも一部のエンティティに関して、エンティティ毎に、前記第二のデータセットから特定される前記対応付け部によって当該エンティティに対応付けられた前記複数の第二のエンティティの少なくとも一つの行動に関する特徴に基づき、当該エンティティの行動に関する推定値を算出する推定部
    を備える請求項1~請求項10のいずれか一項記載の情報処理システム。
  12. 請求項1~請求項のいずれか一項記載の情報処理システムにおける前記第一取得部、前記第二取得部、前記次元削減部、及び、前記対応付け部として、コンピュータを機能させるためのコンピュータプログラム。
  13. 請求項又は請求項10記載の情報処理システムにおける前記第一取得部、前記第二取得部、前記次元削減部、前記対応付け部、前記配信部、及び、前記選択部として、コンピュータを機能させるためのコンピュータプログラム。
  14. 請求項11記載の情報処理システムにおける前記第一取得部、前記第二取得部、前記次元削減部、前記対応付け部、及び、前記推定部として、コンピュータを機能させるためのコンピュータプログラム。
  15. コンピュータにより実行される情報処理方法であって、
    複数の第一のエンティティに関する第一のデータセットであって、前記複数の第一のエンティティのそれぞれの特徴を記述する第一のデータセットを取得することと、
    複数の第二のエンティティに関する第二のデータセットであって、前記複数の第二のエンティティのそれぞれの特徴を記述する第二のデータセットを取得することと、
    前記第一のデータセットから特定される第一の特徴ベクトルの一群であって、前記第一の特徴ベクトルのそれぞれが、前記複数の第一のエンティティのうちの対応する一つの特徴を表す第一の特徴ベクトルの一群、及び、前記第二のデータセットから特定される第二の特徴ベクトルの一群であって、前記第二の特徴ベクトルのそれぞれが、前記複数の第二のエンティティのうちの対応する一つの特徴を表す第二の特徴ベクトルの一群に対する次元削減処理を実行することによって、前記第一の特徴ベクトルの一群に対応する第一の低次元特徴ベクトルの一群、及び、前記第二の特徴ベクトルの一群に対応する第二の低次元特徴ベクトルの一群であって前記第一の低次元特徴ベクトルの一群と同一次元数の第二の低次元特徴ベクトルの一群を生成することと、
    前記第一の低次元特徴ベクトルの一群、及び、前記第二の低次元特徴ベクトルの一群に基づき、前記複数の第一のエンティティのそれぞれを、前記複数の第二のエンティティの少なくとも一つに対応付けることと、
    を含み、
    前記対応付けることは、
    前記第一の低次元特徴ベクトルの一群から特定される前記第一のエンティティ間の類似度、及び、前記第二の低次元特徴ベクトルの一群から特定される前記第二のエンティティ間の類似度に基づき、類似度に関する前記第一のエンティティ間の相互関係が前記第二のエンティティ間の相互関係に適合するように、前記複数の第一のエンティティのそれぞれを、前記複数の第二のエンティティの一つに対応付けること
    を含む情報処理方法。
  16. コンピュータにより実行される情報処理方法であって、
    複数の第一のエンティティに関する第一のデータセットであって、前記複数の第一のエンティティのそれぞれの特徴を記述する第一のデータセットを取得することと、
    複数の第二のエンティティに関する第二のデータセットであって、前記複数の第二のエンティティのそれぞれの特徴を記述する第二のデータセットを取得することと、
    前記第一のデータセットから特定される第一の特徴ベクトルの一群であって、前記第一の特徴ベクトルのそれぞれが、前記複数の第一のエンティティのうちの対応する一つの特徴を表す第一の特徴ベクトルの一群、及び、前記第二のデータセットから特定される第二の特徴ベクトルの一群であって、前記第二の特徴ベクトルのそれぞれが、前記複数の第二のエンティティのうちの対応する一つの特徴を表す第二の特徴ベクトルの一群に対する次元削減処理を実行することによって、前記第一の特徴ベクトルの一群に対応する第一の低次元特徴ベクトルの一群、及び、前記第二の特徴ベクトルの一群に対応する第二の低次元特徴ベクトルの一群であって前記第一の低次元特徴ベクトルの一群と同一次元数の第二の低次元特徴ベクトルの一群を生成することと、
    前記第一の低次元特徴ベクトルの一群、及び、前記第二の低次元特徴ベクトルの一群に基づき、前記複数の第一のエンティティのそれぞれを、前記複数の第二のエンティティの少なくとも一つに対応付けることと、
    を含み、
    前記第一の低次元特徴ベクトルは、第一の特徴空間によって定義され、
    前記第二の低次元特徴ベクトルは、第二の特徴空間によって定義され、
    前記対応付けることは、前記第一の低次元特徴ベクトルの一群から特定される前記第一の特徴空間における前記複数の第一のエンティティの分布が、前記第二の低次元特徴ベクトルの一群から特定される前記第二の特徴空間における前記複数の第二のエンティティの分布に適合するように、前記第一の特徴空間上の前記複数の第一のエンティティを前記第二の特徴空間にマッピングするための写像を探索し、前記写像に基づいて、前記複数の第一のエンティティのそれぞれを、前記複数の第二のエンティティの少なくとも一つに対応付けることを含む情報処理方法。
  17. コンピュータにより実行される情報処理方法であって、
    複数の第一のエンティティに関する第一のデータセットであって、前記複数の第一のエンティティのそれぞれの特徴を記述する第一のデータセットを取得することと、
    複数の第二のエンティティに関する第二のデータセットであって、前記複数の第二のエンティティのそれぞれの特徴を記述する第二のデータセットを取得することと、
    前記第一のデータセットから特定される第一の特徴ベクトルの一群であって、前記第一の特徴ベクトルのそれぞれが、前記複数の第一のエンティティのうちの対応する一つの特徴を表す第一の特徴ベクトルの一群、及び、前記第二のデータセットから特定される第二の特徴ベクトルの一群であって、前記第二の特徴ベクトルのそれぞれが、前記複数の第二のエンティティのうちの対応する一つの特徴を表す第二の特徴ベクトルの一群に対する次元削減処理を実行することによって、前記第一の特徴ベクトルの一群に対応する第一の低次元特徴ベクトルの一群、及び、前記第二の特徴ベクトルの一群に対応する第二の低次元特徴ベクトルの一群であって前記第一の低次元特徴ベクトルの一群と同一次元数の第二の低次元特徴ベクトルの一群を生成することと、
    前記第一の低次元特徴ベクトルの一群、及び、前記第二の低次元特徴ベクトルの一群に基づき、前記複数の第一のエンティティのそれぞれを、前記複数の第二のエンティティの少なくとも一つに対応付けることと、
    を含み、
    前記対応付けることは、行列K、行列L、及び行列Hを含む式
    Figure 0007227412000006
    に従う値Z(Ω)を最大化する行列Ωを行列Ω として探索し、前記行列Ω に基づいて、前記複数の第一のエンティティのそれぞれを、前記複数の第二のエンティティの少なくとも一つに対応付けることを含み、
    前記第一のエンティティの数は、Nであり、前記第二のエンティティの数は、前記第一のエンティティと同じであり、
    前記行列Kは、N行N列の行列であって、第i行第j列の要素の値が、前記複数の第一のエンティティのうちのi番目のエンティティの第一の低次元特徴ベクトルと、前記複数の第一のエンティティのうちのj番目のエンティティの第一の低次元特徴ベクトルと、に基づいて算出される前記複数の第一のエンティティのうちの前記i番目のエンティティと前記j番目のエンティティとの間の類似度を表す第一の類似度行列であり、
    前記行列Lは、N行N列の行列であって、第i行第j列の要素の値が、前記複数の第二のエンティティのうちのi番目のエンティティの第二の低次元特徴ベクトルと、前記複数の第二のエンティティのうちのj番目のエンティティの第二の低次元特徴ベクトルと、に基づいて算出される前記複数の第二のエンティティのうちの前記i番目のエンティティと前記j番目のエンティティとの間の類似度を表す第二の類似度行列であり、
    前記行列Hは、N行N列の行列であって、第i行第j列の要素の値が、i=jであるとき値1-1/Nを示し、i≠jであるとき値0を示す行列である情報処理方法。
JP2022048893A 2021-11-09 2022-03-24 情報処理システム、コンピュータプログラム、及び情報処理方法 Active JP7227412B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2022/041591 WO2023085279A1 (ja) 2021-11-09 2022-11-08 情報処理システム及び情報処理方法
TW111142613A TW202336607A (zh) 2021-11-09 2022-11-08 資訊處理系統及資訊處理方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021182537 2021-11-09
JP2021182537 2021-11-09

Publications (2)

Publication Number Publication Date
JP7227412B1 true JP7227412B1 (ja) 2023-02-21
JP2023070618A JP2023070618A (ja) 2023-05-19

Family

ID=85252006

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022048893A Active JP7227412B1 (ja) 2021-11-09 2022-03-24 情報処理システム、コンピュータプログラム、及び情報処理方法

Country Status (3)

Country Link
JP (1) JP7227412B1 (ja)
TW (1) TW202336607A (ja)
WO (1) WO2023085279A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7541212B1 (ja) * 2022-11-04 2024-08-27 株式会社マクロミル 情報処理方法、プログラム、記憶媒体および情報処理装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150006559A1 (en) 2011-08-31 2015-01-01 Comscore, Inc. Data Fusion Using Behavioral Factors
JP2016126609A (ja) 2015-01-06 2016-07-11 株式会社博報堂Dyホールディングス 情報処理システム、及び、プログラム。
JP2017097717A (ja) 2015-11-26 2017-06-01 株式会社博報堂 情報処理システム及びプログラム
JP2018156299A (ja) 2017-03-16 2018-10-04 株式会社ビデオリサーチ 調査データ処理装置及び調査データ処理方法
JP2019092067A (ja) 2017-11-15 2019-06-13 株式会社電通 情報処理装置、情報処理方法、情報処理システム及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150006559A1 (en) 2011-08-31 2015-01-01 Comscore, Inc. Data Fusion Using Behavioral Factors
JP2016126609A (ja) 2015-01-06 2016-07-11 株式会社博報堂Dyホールディングス 情報処理システム、及び、プログラム。
JP2017097717A (ja) 2015-11-26 2017-06-01 株式会社博報堂 情報処理システム及びプログラム
JP2018156299A (ja) 2017-03-16 2018-10-04 株式会社ビデオリサーチ 調査データ処理装置及び調査データ処理方法
JP2019092067A (ja) 2017-11-15 2019-06-13 株式会社電通 情報処理装置、情報処理方法、情報処理システム及びプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
星野 崇宏,学習科学研究の妥当性向上へ向けた統計解析法と複数データの統合手法について,教育システム情報学会誌 Vol.24 No.3,教育システム情報学会,2007年07月01日,第24巻 第3号,pp.216~224
西尾 義英,共通変数から推定が容易な潜在変数を融合対象とするデータフュージョン,電子情報通信学会技術研究報告 Vol.119 No.413 [online],一般社団法人電子情報通信学会,2020年02月07日,第119巻 第413号,pp.55~60,Internet<URL:https://www.ieice.org/ken/user/index.php?cmd=download&p=4eB7&t=IEICE-AI&l=57df8fa478d645fb26045e2762d2ba89277851794f79f693de48961f1887ea26&lang=>

Also Published As

Publication number Publication date
WO2023085279A1 (ja) 2023-05-19
TW202336607A (zh) 2023-09-16
JP2023070618A (ja) 2023-05-19

Similar Documents

Publication Publication Date Title
Guan et al. Matrix factorization with rating completion: An enhanced SVD model for collaborative filtering recommender systems
Ringel et al. Visualizing asymmetric competition among more than 1,000 products using big search data
JP5913722B1 (ja) 情報処理システム及びプログラム
Lu et al. A video-based automated recommender (VAR) system for garments
CN110503531A (zh) 时序感知的动态社交场景推荐方法
US20110082824A1 (en) Method for selecting an optimal classification protocol for classifying one or more targets
Dhillon et al. Modeling dynamic user interests: A neural matrix factorization approach
CN111008335B (zh) 一种信息处理方法、装置、设备及存储介质
JP5914549B2 (ja) 情報処理装置および情報分析方法
JP6731826B2 (ja) 抽出装置、抽出方法、及び抽出プログラム
US20150310529A1 (en) Web-behavior-augmented recommendations
WO2023085279A1 (ja) 情報処理システム及び情報処理方法
JP6434954B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6947768B2 (ja) 推定装置、推定方法および推定プログラム
Kashef et al. Predicting l-CrossSold products using connected components: A clustering-based recommendation system
Li et al. Analysis and research of retail customer consumption behavior based on support vector machine
JP6258246B2 (ja) 解析装置、解析方法及びプログラム
JP6585998B2 (ja) コンテンツ決定装置
JP5011185B2 (ja) 情報分析装置、情報分析方法、及び情報分析プログラム
JP6160018B1 (ja) 情報解析装置、情報解析方法、および情報解析プログラム
JP7557101B1 (ja) 情報処理システム、コンピュータプログラム、及び情報処理方法
Zhao et al. A theoretical analysis of two-stage recommendation for cold-start collaborative filtering
JP7208286B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP7434264B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP7459041B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20220324

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220722

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230209

R150 Certificate of patent or registration of utility model

Ref document number: 7227412

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150