JP2018116373A - 生成装置、生成方法、及び生成プログラム - Google Patents

生成装置、生成方法、及び生成プログラム Download PDF

Info

Publication number
JP2018116373A
JP2018116373A JP2017005406A JP2017005406A JP2018116373A JP 2018116373 A JP2018116373 A JP 2018116373A JP 2017005406 A JP2017005406 A JP 2017005406A JP 2017005406 A JP2017005406 A JP 2017005406A JP 2018116373 A JP2018116373 A JP 2018116373A
Authority
JP
Japan
Prior art keywords
user
behavior information
type
information
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017005406A
Other languages
English (en)
Other versions
JP6500044B2 (ja
Inventor
孝太 坪内
Kota Tsubouchi
孝太 坪内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2017005406A priority Critical patent/JP6500044B2/ja
Publication of JP2018116373A publication Critical patent/JP2018116373A/ja
Application granted granted Critical
Publication of JP6500044B2 publication Critical patent/JP6500044B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】所定の事柄への対応の予測に用いるモデルを精度よく生成する。【解決手段】本願に係る生成装置は、取得部と、生成部とを有する。取得部は、第1ユーザに関する第1種別の行動情報及び第1ユーザに関する第2種別の行動情報と、第1ユーザ以外の第2ユーザであって、当該第2ユーザに関する第2種別の行動情報が所定の条件を満たす第2ユーザに関する第1種別の行動情報とを取得する。生成部は、第1ユーザに関する第1種別の行動情報及び第2種別の行動情報と、第2ユーザに関する第1種別の行動情報と、第2ユーザに関する第2種別の行動情報であって、第2種別の行動情報に対応する第2ユーザの行動とは異なる所定の方法により生成された第2種別の行動情報である拡張行動情報とに基づいて、所定の事柄への対応の予測に用いる予測モデルを生成する。【選択図】図4

Description

本発明は、生成装置、生成方法、及び生成プログラムに関する。
従来、多くの対象、例えばユーザから収集できる情報、例えば検索ログ等の情報に基づいて、所定の事柄への対応の予測に用いるモデルを生成する技術が提供されている。
特開2016−177377号公報
しかしながら、上記の従来技術では、所定の事柄への対応の予測に用いるモデルを精度よく生成することができるとは限らない。例えば、ユーザによっては単純なキーワードのような検索クエリのログ情報は取得可能であるが、ユーザの位置に関する情報が取得できない等、ユーザによって取得できる情報が異なる。また、情報が取得可能なユーザ数が少ない種別の情報の方が予測の精度向上に有用な場合が多く、このような場合、ユーザの行動有無の予測に用いるモデルを精度よく生成することは難しい。
本願は、上記に鑑みてなされたものであって、所定の事柄への対応の予測に用いるモデルを精度よく生成する生成装置、生成方法、及び生成プログラムを提供することを目的とする。
本願に係る生成装置は、第1ユーザに関する第1種別の行動情報及び前記第1ユーザに関する第2種別の行動情報と、第1ユーザ以外の第2ユーザであって、当該第2ユーザに関する第2種別の行動情報が所定の条件を満たす第2ユーザに関する第1種別の行動情報とを取得する取得部と、前記第1ユーザに関する第1種別の行動情報及び第2種別の行動情報と、前記第2ユーザに関する第1種別の行動情報と、前記第2ユーザに関する第2種別の行動情報であって、第2種別の行動情報に対応する前記第2ユーザの行動とは異なる所定の方法により生成された第2種別の行動情報である拡張行動情報とに基づいて、所定の事柄への対応の予測に用いる予測モデルを生成する生成部と、を備えたことを特徴とする。
実施形態の一態様によれば、所定の事柄への対応の予測に用いるモデルを精度よく生成することができるという効果を奏する。
図1は、実施形態に係る生成処理の一例を示す図である。 図2は、実施形態に係る生成処理の一例を示す図である。 図3は、実施形態に係る生成処理の一例を示す図である。 図4は、実施形態に係る生成装置の構成例を示す図である。 図5は、実施形態に係るユーザ情報記憶部の一例を示す図である。 図6は、実施形態に係る第1行動情報記憶部の一例を示す図である。 図7は、実施形態に係る第2行動情報記憶部の一例を示す図である。 図8は、実施形態に係る判定モデル情報記憶部の一例を示す図である。 図9は、実施形態に係る拡張第2行動情報記憶部の一例を示す図である。 図10は、実施形態に係る正解情報記憶部の一例を示す図である。 図11は、実施形態に係る予測モデル情報記憶部の一例を示す図である。 図12は、実施形態に係る生成処理の一例を示すフローチャートである。 図13は、実施形態に係る生成処理の一例を示すフローチャートである。 図14は、実施形態に係る生成処理の一例を示すフローチャートである。 図15は、実施形態に係る予測処理の一例を示すフローチャートである。 図16は、実施形態に係る予測処理の一例を示すフローチャートである。 図17は、実施形態に係るモデル生成の繰返し処理の一例を示す図である。 図18は、実施形態に係る他の種別の行動情報を用いたモデル生成の一例を示す図である。 図19は、生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る生成装置、生成方法、及び生成プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る生成装置、生成方法、及び生成プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
(実施形態)
〔1.生成処理〕
まず、図1〜図3を用いて、実施形態に係る生成処理の一例について説明する。図1〜図3は、実施形態に係る生成処理の一例を示す図である。図1〜図3の例では、生成装置100が種別の異なる2つの種別のユーザの行動情報を用いて所定の事柄への対応(以下、「予測対象」ともいう)をユーザが行うかどうかを予測する予測モデルを生成する場合を示す。図1〜図3の例では、生成装置100が予測対象「釣竿Xの購入」を予測対象とする場合を示す。図1〜図3の例では、第1種別の行動情報(以下、「第1行動情報」ともいう)として、ユーザが検索行動において用いた検索クエリ(以下、単に「クエリ」ともいう)に関する情報を用い、第2種別の行動情報(以下、「第2行動情報」ともいう)として、ユーザが行動(移動)により位置した位置に関する情報を用いる場合を示す。
また、以下では、第1行動情報と第2行動情報との両方を取得可能なユーザを第1ユーザとし、第1行動情報のみが取得可能なユーザを第2ユーザとして説明する。なお、第2行動情報がない(取得不可能な)ユーザを第2ユーザとしてもよいし、第2行動情報の量が所定の閾値未満であるユーザを第2ユーザとしてもよい。図1の例では、第1ユーザ群UG1には、ユーザU1やユーザU2等のユーザが含まれる。なお、上記のように、「ユーザU*(*は任意の数値)」と記載した場合、そのユーザはユーザID「U*」により識別されるユーザであることを示す。例えば、「ユーザU2」と記載した場合、そのユーザはユーザID「U2」により識別されるユーザである。また、図1の例では、第2ユーザ群UG2にはユーザU3やユーザU4やユーザU5等のユーザが含まれる。
また、図1では、ユーザU1〜U5が各々端末装置10−1〜10−5を利用する場合を示す。なお、端末装置10−1〜10−5を区別せずに説明する場合、端末装置10と総称する。図1に示すように、生成システム1には、端末装置10と、生成装置100とが含まれる。端末装置10と、生成装置100とは所定のネットワークN(図9参照)を介して、有線または無線により通信可能に接続される。なお、図1に示した生成システム1には、複数台の端末装置10や、複数台の生成装置100が含まれてもよい。
端末装置10は、ユーザによって利用される情報処理装置である。端末装置10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。図1は、端末装置10がスマートフォンである場合を示す。また、端末装置10は、GPS(Global Positioning System)センサ等の機能を有し、ユーザの位置を検知可能であるものとする。また、端末装置10は、ユーザに関する位置情報等の各種情報を生成装置100へ送信する。なお、以下では、端末装置10をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置10と読み替えることもできる。
生成装置100は、第1ユーザに関する第1行動情報と第2行動情報とに基づいて判定モデルを生成する。ここでいう判定モデルとは、位置に関する各特徴に対応するモデルを意味するが、詳細は後述する。また、生成装置100は、判定モデルと第2ユーザに関する第1種別の行動情報とに基づいて、第2ユーザに関する第2種別の行動情報である拡張行動情報(以下、「拡張第2行動情報」ともいう)を生成する。
生成装置100は、第1ユーザに関する第1行動情報及び第2行動情報と、第2ユーザに関する第1行動情報及び拡張第2行動情報とに基づいて、ユーザが予測対象を行うかどうかの予測に用いる予測モデルを生成する情報処理装置である。
〔1−1.判定モデルの生成〕
まず、図1を用いて、判定モデルの生成について説明する。図1は、実施形態に係る生成処理の一例を示す図である。例えば、図1は、判定モデルの生成に関する生成処理の一例を示す図である。
図1では、生成装置100は、ユーザU1が利用する端末装置10−1からユーザU1の第1行動情報である検索履歴情報を取得する(ステップS11−1)。また、生成装置100は、ユーザU1が利用する端末装置10−1からユーザU1の第2行動情報である位置履歴情報を取得する(ステップS12−1)。
また、生成装置100は、ユーザU2が利用する端末装置10−2からユーザU2の第1行動情報である検索履歴情報を取得する(ステップS11−2)。また、生成装置100は、ユーザU2が利用する端末装置10−2からユーザU2の第2行動情報である位置履歴情報を取得する(ステップS12−2)。このように、生成装置100は、第1ユーザ群UG1に含まれるユーザU1、U2等のユーザから第1行動情報及び第2行動情報を取得する。
また、生成装置100は、ユーザU3が利用する端末装置10−3からユーザU3の第1行動情報である検索履歴情報を取得する(ステップS11−3)。また、生成装置100は、ユーザU4が利用する端末装置10−4からユーザU4の第1行動情報である検索履歴情報を取得する(ステップS11−4)。また、生成装置100は、ユーザU5が利用する端末装置10−5からユーザU5の第1行動情報である検索履歴情報を取得する(ステップS11−5)。このように、生成装置100は、第2ユーザ群UG2に含まれるユーザU3、U4、U5等のユーザから第1行動情報のみを取得する。
なお、ステップS11−1〜S11−5は、処理を説明するためのものであり、ステップS11−1〜S11−5のいずれが先に行われてもよく、各ステップS11−1〜S11−5は、複数回行われてもよい。以下、ステップS11−1〜S11−5を区別せずに説明する場合、ステップS11と総称する。また、ステップS12−1〜S12−2は、処理を説明するためのものであり、ステップS12−1〜S12−2のいずれが先に行われてもよく、各ステップS12−1〜S12−2は、複数回行われてもよい。以下、ステップS12−1〜S12−2を区別せずに説明する場合、ステップS12と総称する。
なお、生成装置100は、予め各ユーザから各種情報を取得済みである場合、第1行動情報記憶部122や第2行動情報記憶部123から第1ユーザの第1行動情報及び第2行動情報を取得したり、第2ユーザの第1行動情報を取得したりしてもよい。
そして、生成装置100は、第1ユーザの第2行動情報に基づいて位置に関する特徴を抽出する(ステップS13)。例えば、生成装置100は、図1中の第2行動情報記憶部123に示す第1ユーザの第2行動情報に基づいて位置に関する特徴を抽出する。
図1に示す第2行動情報記憶部123には、「ユーザID」、「第2行動情報(位置)」といった項目が含まれる。「ユーザID」は、ユーザを識別するための識別情報を示す。「日時」は、ユーザが対応する位置にいた日時を示す。また、「位置」は、対応するユーザが位置した地点を示す位置情報を示す。例えば、図1に示す例において、ユーザU1は、日時「TM21−1」に、釣りショップAがある位置「LC1−1」に位置したことを示す。また例えば、図1に示す例において、ユーザU1は、日時「TM21−2」に、海上である位置「LC1−2」に位置したことを示す。
図1の例では、生成装置100は、第2行動情報記憶部123に記憶された第1ユーザの第2行動情報に基づいて、特徴リストFL11に示すような位置に関する特徴を抽出する。例えば、生成装置100は、予測対象「釣竿Xの購入」に応じて、釣りに関する特徴を抽出してもよい。図1の例では、生成装置100は、予測対象「釣竿Xの購入」に応じて、特徴ID「F1」により識別される特徴「海」や、特徴ID「F2」により識別される特徴「釣りショップ」や、特徴ID「F3」により識別される特徴「川」等の釣りに関連する特徴を抽出する。
なお、生成装置100は、予測対象に応じて抽出する特徴を変動させてもよい。例えば、生成装置100は、ユーザの位置に関する第2行動情報に基づいて推定される特徴等の種々の特徴を抽出してもよい。例えば、生成装置100は、第2行動情報に基づいて推定されるユーザの行動パターン、例えば、「月1回海へ行く」や「電車を利用する」等の特徴を抽出してもよい。また、特徴の抽出については、生成装置100が自動で抽出してもよいし、生成装置100の管理者等が予測対象に応じて抽出する特徴を指定してもよい。
そして、生成装置100は、ステップS13において抽出した特徴に基づいて、第1ユーザの第2行動情報を成形する(ステップS14)。例えば、生成装置100は、図1中の特徴リストFL11に基づいて、第2行動情報記憶部123に示す第1ユーザの第2行動情報を成形する。例えば、生成装置100は、図1中の成形後第2行動情報リストSD11に示すように、図1中の特徴リストFL11に含まれる各特徴の有無を示す情報に第1ユーザの第2行動情報を成形する。
図1に示す成形後第2行動情報リストSD11には、「ユーザID」、「成形後第2行動情報(位置)」といった項目が含まれる。また、「成形後第2行動情報(位置)」には、「特徴(位置)」、「有無」といった項目が含まれる。「ユーザID」は、ユーザを識別するための識別情報を示す。また、「特徴(位置)」は、位置に関する特徴を示す。また、「有無」は、対応するユーザが特徴(位置)に関する行動を行ったかどうかを示す。図1の例では、「1」が対応する特徴(位置)に関する行動を行ったユーザであることを示し、「0」が対応する特徴(位置)に関する行動を行っていないユーザであることを示す。
例えば、ユーザU1は、特徴「海」が有無「1」であるユーザ、すなわち位置「海」へ行ったユーザであることを示す。また、例えば、ユーザU1は、特徴「釣りショップ」が有無「1」であるユーザ、すなわち位置「釣りショップ」へ行ったユーザであることを示す。また、例えば、ユーザU2は、特徴「海」が有無「0」であるユーザ、すなわち位置「海」へ行っていないユーザであることを示す。例えば、生成装置100は、図1に示す成形後第2行動情報リストSD11中の成形後第2行動情報を第2行動情報記憶部123に記憶してもよい。例えば、生成装置100は、図1に示す成形後第2行動情報リストSD11中の成形後第2行動情報を第1ユーザの第2行動情報として第2行動情報記憶部123に記憶してもよい。
そして、生成装置100は、第1ユーザの第1行動情報及び第2行動情報に基づいて判定モデルを生成する(ステップS15)。図1の例では、生成装置100は、第1行動情報記憶部122に記憶された第1ユーザの第1行動情報と、成形後第2行動情報リストSD11中の成形後第2行動情報とに基づいて、判定モデルを生成する。図1の例では、生成装置100は、第1行動情報記憶部122に記憶された第1行動情報のうち、第1ユーザ群UG1に含まれるユーザ(ユーザU1、U2等)の第1行動情報を用いて、判定モデル情報記憶部124に示すような判定モデルDM1〜DM3等を生成する。
図1に示す判定モデル情報記憶部124には、各特徴(位置)に対応する判定モデルが記憶される。図1に示す判定モデル情報記憶部124は、判定モデル情報として、各判定モデルDM1〜DM3等に対応させて「素性1」〜「素性3」等といった項目を有する。例えば、図1に示す例において、判定モデルDM1に関する判定モデル情報は、特徴「海」に対応する判定モデルであることを示す。
例えば、図1に示す例において、判定モデルDM1に関する判定モデル情報は、素性1の重みが「0.5」、素性2の重みが「−0.4」、素性3の重みが「0.2」等であることを示す。例えば、図1に示す例において、判定モデルの素性は、第1行動情報に対応する素性であってもよい。例えば、図1に示す例において、判定モデルの素性は、検索クエリとして用いられる文字列等の情報に対応する素性であってもよい。例えば、図1に示す例において、判定モデルの素性は、素性1がクエリ「海」に対応し、素性2がクエリ「グルメ」に対応してもよい。
このように、生成装置100は、判定モデルを生成することにより、第1行動情報に基づいて、第2行動情報に対応する行動の有無の判定に利用可能な情報を取得することが可能となる。
〔1−2.拡張第2行動情報の生成〕
次に、図2を用いて、拡張第2行動情報の生成について説明する。図2は、実施形態に係る生成処理の一例を示す図である。例えば、図2は、拡張第2行動情報の生成に関する生成処理の一例を示す図である。
図2に示すように、生成装置100は、第2ユーザの第1行動情報及び判定モデルに基づいて第2ユーザの拡張第2行動情報を生成する(ステップS21)。例えば、生成装置100は、各特徴の判定モデルの各々に各第2ユーザの第1行動情報を入力することにより、各第2ユーザにおける各特徴のスコアを取得する。例えば、生成装置100は、各特徴と、各第2ユーザにおける各特徴のスコアとの組み合わせに基づいて、第2ユーザの拡張第2行動情報を生成する。
図2の例では、生成装置100は、第1行動情報記憶部122に記憶された第2ユーザの第1行動情報と、判定モデル情報記憶部124に記憶された判定モデルに基づいて、拡張第2行動情報記憶部125に示すような第2ユーザの拡張第2行動情報を生成する。図2の例では、生成装置100は、第1行動情報記憶部122に記憶された第1行動情報のうち、第2ユーザ群UG2に含まれるユーザ(ユーザU3、U4、U5等)の第1行動情報を用いて、拡張第2行動情報記憶部125に示すような第2ユーザの拡張第2行動情報を生成する。
図2に示す拡張第2行動情報記憶部125には、「ユーザID」、「拡張第2行動情報(位置)」といった項目が含まれる。また、「拡張第2行動情報(位置)」には、「特徴(位置)」、「スコア」といった項目が含まれる。「ユーザID」は、ユーザを識別するための識別情報を示す。また、「特徴(位置)」は、対応するユーザについて判定した位置に関する特徴を示す。なお、図1に示す例では、「特徴(位置)」は、各判定モデルの特徴に対応する。また、「スコア」は、各位置に対応する判定モデルに対応するユーザの情報が入力された場合に出力されたスコアを示す。
例えば、図2に示す例において、ユーザU3は、位置「海」に関する判定モデルDM1が出力したスコアが「0.2」であることを示す。また、例えば、図2に示す例において、ユーザU3は、位置「釣りショップ」に関する判定モデルDM2が出力したスコアが「0.4」であることを示す。なお、図2の例では、拡張第2行動情報記憶部125に、「スコア」が記憶される場合を示したが、スコアが所定の閾値以上である場合「1」を記憶し、所定の閾値未満である場合「0」を記憶してもよい。この場合、拡張第2行動情報記憶部125に「1」が記憶された「特徴(位置)」に対応する特徴が「有」であることを示し、「0」が記憶された「特徴(位置)」に対応する特徴が「無」であることを示す。
このように、生成装置100は、第2ユーザについて拡張第2行動情報を生成することにより、第2ユーザについても第2行動情報として適用可能な情報を取得することが可能となる。また、生成装置100は、ユーザの検索行動に基づく第1行動情報では顕在化しない類似性が顕在化する可能性が高いユーザの位置に関する行動に基づく第2行動情報に対応する拡張第2行動情報を生成することにより、予測に用いるデータの質を向上させる学習(以下、「質拡張学習」ともいう)を行うことができる。これにより、生成装置100は、大規模の質の低いデータ(第1行動情報)と、小規模の質の高いデータ(第2行動情報)との両方に基づいて、図3に示す予測処理等を行うことができる。
〔1−3.予測モデルの生成〕
次に、図3を用いて、予測モデルの生成について説明する。図3は、実施形態に係る生成処理の一例を示す図である。例えば、図3は、予測モデルの生成に関する生成処理の一例を示す図である。また、図3は、生成した予測モデルを用いた予測処理の一例を示す図である。
生成装置100は、正解情報、第1ユーザの第1行動情報及び第2行動情報、第2ユーザの第1行動情報及び拡張第2行動情報に基づいて予測モデルを生成する(ステップS31)。図3に示すように、生成装置100は、正解情報記憶部126に記憶された正解情報に基づいて、予測モデルを生成する。図3に示す例においては、生成装置100は、予測ユーザが予測対象「釣竿Xの購入」を行うかどうかを示す予測情報リストPL11を生成する。
図3に示す正解情報記憶部126は、「ユーザID」、「正解情報(購買情報)」といった項目が含まれる。また、「正解情報(購買情報)」には、「釣竿X」といった項目が含まれる。「ユーザID」は、ユーザを識別するための識別情報を示す。また、「釣竿X」は、対応するユーザが対象「釣竿X」を購入したかどうかを示す。すなわち、「釣竿X」は、予測対象「釣竿Xの購入」が行われたかどうかを示す。
図3に示す例において、ユーザU1は、釣竿Xを購入したユーザであることを示す。また、図3に示す例において、ユーザU5は、釣竿Xを購入していないユーザであることを示す。このように、図3の例では、予測対象「釣竿Xの購入」について、ユーザU1とユーザU5が購買履歴情報等により、釣竿Xを購入しているかどうかが判別可能なユーザ(以下、「正解ユーザ」ともいう)である場合を示す。
例えば、生成装置100は、正解ユーザの第1行動情報を第1行動情報記憶部122から取得する。図3の例では、生成装置100は、第1行動情報記憶部122から正解ユーザであるユーザU1やユーザU5等の第1行動情報を取得する。
また、例えば、生成装置100は、正解ユーザのうち第1ユーザの第2行動情報に関する情報を取得する。図3の例では、生成装置100は、成形後第2行動情報リストSD11から正解ユーザであり第1ユーザであるユーザU1等の成形後第2行動情報を取得する。なお、生成装置100は、第2行動情報記憶部123から正解ユーザであり第1ユーザであるユーザU1等の第2行動情報を取得し、成形してもよい。
また、例えば、生成装置100は、正解ユーザのうち第2ユーザの拡張第2行動情報を拡張第2行動情報記憶部125から取得する。図3の例では、生成装置100は、拡張第2行動情報記憶部125から正解ユーザであり第2ユーザであるユーザU5の拡張第2行動情報を取得する。
そして、生成装置100は、正解ユーザであり第1ユーザであるユーザU1等に関する正解情報、第1行動情報及び成形後第2行動情報と、正解ユーザであり第2ユーザであるユーザU5等に関する正解情報、第1行動情報及び拡張第2行動情報とに基づいて予測モデルを生成する。図3の例では、生成装置100は、正解情報、第1ユーザの第1行動情報及び第2行動情報、第2ユーザの第1行動情報及び拡張第2行動情報に基づいて、予測モデル情報記憶部127に示すような予測対象「釣竿Xの購入」を予測する予測モデルPM1を生成する。
図3に示す予測モデル情報記憶部127は、予測モデル情報として、予測モデルPM1に対応させて「素性1」〜「素性3」等といった項目を有する。例えば、図3に示す例において、予測モデルPM1に関する予測モデル情報は、事柄「釣竿Xの購入」に対応する予測モデルであることを示す。例えば、予測モデルPM1に一のユーザに関する情報を入力し、予測モデルPM1が出力するスコア(値)が所定の閾値以上である場合、予測対象「釣竿Xの購入」を行ったユーザとして判定する。
図3に示す例では、予測モデルPM1に関する予測モデル情報は、素性1の重みが「−0.3」、素性2の重みが「0.6」、素性3の重みが「0.1」等であることを示す。例えば、図3に示す例において、予測モデルの素性は、第1行動情報や第2行動情報に対応する素性であってもよい。例えば、図3に示す例において、予測モデルの素性は、検索クエリとして用いられる文字列や位置に関する特徴等の情報に対応する素性であってもよい。例えば、図3に示す例において、予測モデルの素性は、素性1がクエリ「ブーツ」に対応し、素性2が特徴「釣りショップ」に対応してもよい。
例えば、一のユーザが第1ユーザである場合、予測モデルPM1に一のユーザに関する第1行動情報や成形後第2行動情報を入力し、予測モデルPM1が出力するスコア(値)が所定の閾値以上である場合、予測対象「釣竿Xの購入」を行ったユーザとして判定する。例えば、一のユーザが第1ユーザである場合、予測モデルPM1に一のユーザに関する第1行動情報や第2行動情報を入力し、予測モデルPM1が出力するスコア(値)が所定の閾値以上である場合、予測対象「釣竿Xの購入」を行ったユーザとして判定してもよい。
また、例えば、一のユーザが第2ユーザである場合、予測モデルPM1に一のユーザに関する第1行動情報や拡張第2行動情報を入力し、予測モデルPM1が出力するスコア(値)が所定の閾値以上である場合、予測対象「釣竿Xの購入」を行ったユーザとして判定してもよい。
このように、生成装置100は、所定の事柄への対応の予測に用いるモデルを精度よく生成することができる。
ここから、生成した予測モデルPM1を用いた予測処理について説明する。生成装置100は、予測モデルPM1を用いて、正解ユーザ以外のユーザにおける予測対象「釣竿Xの購入」の有無を予測する(ステップS32)。例えば、生成装置100は、正解ユーザであるユーザU1、U5等以外のユーザ(以下、「予測ユーザ」ともいう)について予測対象「釣竿Xの購入」の有無を予測する。例えば、生成装置100は、予測ユーザであるユーザU2、U3、U4等について予測対象「釣竿Xの購入」の有無を予測する。なお、予測対象「釣竿Xの購入」は一例であり、予測対象はユーザの行動に関する対象であれば、どのような対象であってもよい。
図3に示す予測情報リストPL11には、「ユーザID」、「予測情報(釣竿X)」といった項目が含まれる。また、「予測情報(釣竿X)」には、「スコア」、「有無」といった項目が含まれる。「ユーザID」は、ユーザを識別するための識別情報を示す。「スコア」は、予測モデルに対応するユーザの情報が入力された場合に出力されたスコアを示す。また、「有無」は、対応するユーザが予測対象に関する行動を行ったかどうかを示す。図3の例では、「1」が対応する特徴(位置)に関する行動を行ったユーザであることを示し、「0」が対応する特徴(位置)に関する行動を行っていないユーザであることを示す。なお、図3の例では、スコアが閾値「0.7」以上である場合、特徴(位置)に関する行動を行ったユーザであると予測し、スコアが閾値「0.7」未満である場合、特徴(位置)に関する行動を行ってないユーザであると予測する場合を示す。
例えば、生成装置100は、第1行動情報記憶部122から予測ユーザであり第1ユーザであるユーザU2の第1行動情報を取得する。また、例えば、生成装置100は、成形後第2行動情報リストSD11から予測ユーザであり第1ユーザであるユーザU2の成形後第2行動情報を取得する。そして、生成装置100は、ユーザU2の第1行動情報及び成形後第2行動情報を予測モデルPM1に入力することによりスコアを取得する。図3の例では、予測情報リストPL11に示すように、生成装置100は、ユーザU2の予測対象「釣竿Xの購入」を行うかどうかに関するスコアを「0.6」と算出する。そのため、生成装置100は、スコア「0.6」であり、閾値「0.7」未満であるため、ユーザU2が予測対象「釣竿Xの購入」を行う可能性が低いユーザであると予測し、有無を「0」とする。
例えば、予測モデルPM1において、ユーザU2の第1行動情報に含まれる検索クエリに対応する素性の重みやユーザU2の成形後第2行動情報に含まれる特徴(位置)に対応する素性の重みを合計することにより、ユーザU2のスコアが出力される。図1に示す例においては、生成装置100は、スコアが大きい程、予測対象「釣竿Xの購入」が行われる可能性が高いと判定し、スコアが小さい程、予測対象「釣竿Xの購入」が行われる可能性が低いと判定する。
また、例えば、生成装置100は、第1行動情報記憶部122から予測ユーザであり第2ユーザであるユーザU3の第1行動情報を取得する。また、例えば、生成装置100は、拡張第2行動情報記憶部125から予測ユーザであり第2ユーザであるユーザU3の拡張第2行動情報を取得する。そして、生成装置100は、ユーザU3の第1行動情報及び拡張第2行動情報を予測モデルPM1に入力することによりスコアを取得する。図3の例では、予測情報リストPL11に示すように、生成装置100は、ユーザU3の予測対象「釣竿Xの購入」を行うかどうかに関するスコアを「0.8」と算出する。そのため、生成装置100は、スコア「0.8」であり、閾値「0.7」以上であるため、ユーザU3が予測対象「釣竿Xの購入」を行う可能性が高いユーザであると予測し、有無を「1」とする。
また、例えば、生成装置100は、第1行動情報記憶部122から予測ユーザであり第2ユーザであるユーザU4の第1行動情報を取得する。また、例えば、生成装置100は、拡張第2行動情報記憶部125から予測ユーザであり第2ユーザであるユーザU4の拡張第2行動情報を取得する。そして、生成装置100は、ユーザU4の第1行動情報及び拡張第2行動情報を予測モデルPM1に入力することによりスコアを取得する。図3の例では、予測情報リストPL11に示すように、生成装置100は、ユーザU4の予測対象「釣竿Xの購入」を行うかどうかに関するスコアを「0.1」と算出する。そのため、生成装置100は、スコア「0.1」であり、閾値「0.7」未満であるため、ユーザU4が予測対象「釣竿Xの購入」を行う可能性が低いユーザであると予測し、有無を「0」とする。
このように、実施形態に係る生成装置100は、予測対象への対応の予測、すなわちユーザの行動有無の予測に用いるモデルを精度よく生成することができる。したがって、生成装置100は、予測対象への対応を精度よく予測できる。
〔1−4.第1ユーザ、第2ユーザ〕
上述した例のように、第1ユーザに比べて第2ユーザの数が多数になる。例えば、第2行動情報であるユーザの位置に関する情報が取得可能なユーザ数は、第1行動情報である検索行動に用いたクエリに関する情報が取得可能なユーザ数よりも少ない。そのため、例えば、第2ユーザの数が1000万であり、第1ユーザの数が5万である等、第2ユーザの数が第1ユーザに比べて圧倒的に多数になる場合が多い。一方で、予測対象は、第2行動情報に基づいて予測を行う方が精度が高くなる場合がある。例えば、上述の例のように、予測対象「釣竿Xの購入」が行われるかどうかの予測は、検索クエリに関する第1行動情報よりも、ユーザの位置に関する第2行動情報を用いたほうが精度が高くなる。
しかしながら、従来の手法では、第2行動情報が取得できない第2ユーザ(上記の例では、1000万ユーザ)の情報は、第2行動情報を用いた予測には利用することが難しい。このような場合、例えば、第2行動情報が取得できない第2ユーザの情報の利用を諦める場合、予測対象の予測精度を向上させることが難しい。また、第2ユーザについては位置に関する情報「無」という特徴としてモデルを生成することも可能であるが、この場合、多数の第2ユーザについて、位置に関する特徴「無」となるため、予測対象の予測精度を向上させることが難しい。
一方、生成装置100は、第2行動情報を取得できない第2ユーザについては、拡張第2行動情報を生成することにより、第2行動情報を利用した予測が可能となる。これにより、生成装置100は、第2ユーザの情報の利用を諦めたり、第2ユーザの第2行動情報に対応する特徴を「無」として、予測処理を行ったりする場合に比べて、予測対象の予測精度を向上させることが可能となる。
〔1−5.第1行動情報、第2行動情報〕
なお、上述した第1行動情報及び第2行動情報は一例であり、どのような情報であってもよい。例えば、第1行動情報は、ユーザのウェブ上におけるコンテンツの閲覧に関する行動情報であり、第2行動情報は、ユーザの購買履歴に関する行動情報であってもよい。
〔1−6.判定モデル〕
上述した例では、第1行動情報に基づいて、第2行動情報に関する行動の有無を判定する判定モデルを生成する場合を示したが、判定モデルは、第2行動情報に関する行動の有無を判定可能であればどのように生成されてもよい。例えば、生成装置100は、第1行動情報以外の他の行動情報に基づいて、第2行動情報に関する行動の有無を判定する判定モデルを生成してもよい。なお、この点についても詳細は後述する。
また、例えば、生成装置100は、どのような第2行動情報に関する行動の特徴のうち、どのような特徴を抽出して、その特徴に関する行動を判定する判定モデルを生成するかを適宜の情報に基づいて決定してもよい。例えば、生成装置100は、一回目に生成した判定モデルの重みで異種データ間の特徴の相関関係の傾向を把握し、その傾向に基づいて二回目の特徴の抽出及び判定モデルの生成を行ってもよい。このように、生成装置100は、二回以上の段階、すなわち多段階で質拡張学習を行なってもよい。
〔2.生成装置の構成〕
次に、図4を用いて、実施形態に係る生成装置100の構成について説明する。図4は、実施形態に係る生成装置100の構成例を示す図である。図4に示すように、生成装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、生成装置100は、生成装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、端末装置10との間で情報の送受信を行う。
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図4に示すように、ユーザ情報記憶部121と、第1行動情報記憶部122と、第2行動情報記憶部123と、判定モデル情報記憶部124と、拡張第2行動情報記憶部125と、正解情報記憶部126と、予測モデル情報記憶部127とを有する。
(ユーザ情報記憶部121)
実施形態に係るユーザ情報記憶部121は、ユーザに関する各種情報を記憶する。例えば、ユーザ情報記憶部121は、ユーザ属性に関する各種情報を記憶する。図5は、実施形態に係るユーザ情報記憶部の一例を示す図である。図5に示すユーザ情報記憶部121は、「ユーザID」、「年齢」、「性別」、「自宅」、「勤務地」、「興味」といった項目が含まれる。
「ユーザID」は、ユーザを識別するための識別情報を示す。例えば、ユーザID「U1」により識別されるユーザは、図1の例に示したユーザU1に対応する。また、「年齢」は、ユーザIDにより識別されるユーザの年齢を示す。なお、「年齢」は、例えば35歳など、ユーザIDにより識別されるユーザの具体的な年齢であってもよい。また、「性別」は、ユーザIDにより識別されるユーザの性別を示す。
また、「自宅」は、ユーザIDにより識別されるユーザの自宅の位置情報を示す。なお、図5に示す例では、「自宅」は、「LC11」といった抽象的な符号を図示するが、緯度や経度を示す情報であってもよい。また、例えば、「自宅」は、地域名や住所であってもよい。
また、「勤務地」は、ユーザIDにより識別されるユーザの勤務地の位置情報を示す。なお、図5に示す例では、「勤務地」は、「LC12」といった抽象的な符号を図示するが、緯度や経度を示す情報であってもよい。また、例えば、「自宅」は、地域名や住所であってもよい。
また、「興味」は、ユーザIDにより識別されるユーザの興味を示す。すなわち、「興味」は、ユーザIDにより識別されるユーザが関心の高い対象を示す。なお、図5に示す例では、「興味」は、各ユーザに1つずつ図示するが、複数であってもよい。
例えば、図5に示す例において、ユーザID「U1」により識別されるユーザの年齢は、「20代」であり、性別は、「男性」であることを示す。また、例えば、ユーザID「U1」により識別されるユーザは、自宅が「LC11」であることを示す。また、例えば、ユーザID「U1」により識別されるユーザは、勤務地が「LC12」であることを示す。また、例えば、ユーザID「U1」により識別されるユーザは、「スポーツ」に興味があることを示す。
なお、ユーザ情報記憶部121は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、ユーザ情報記憶部121は、デモグラフィック属性情報やサイコグラフィック属性情報等の種々の情報を記憶してもよい。例えば、ユーザ情報記憶部121は、氏名、家族構成、収入等の情報を記憶してもよい。
(第1行動情報記憶部122)
実施形態に係る第1行動情報記憶部122は、第1種別の行動情報である第1行動情報に関する各種情報を記憶する。図6は、実施形態に係る第1行動情報記憶部の一例を示す図である。例えば、第1行動情報記憶部122は、第1行動情報としてユーザが検索に用いたクエリに関する情報を記憶する。図6に示す第1行動情報記憶部122には、「ユーザID」、「第1行動情報(検索クエリ)」といった項目が含まれる。また、「第1行動情報(検索クエリ)」には、「日時」、「検索クエリ」といった項目が含まれる。
「ユーザID」は、ユーザを識別するための識別情報を示す。例えば、ユーザID「U2」により識別されるユーザは、図1の例に示したユーザU2に対応する。「日時」は、対応する検索クエリを用いて検索行動を行った日時を示す。なお、図6の例では、「TM11−1」等で図示するが、「日時」には、「2017年1月8日14時51分22秒」等の具体的な日時が記憶されてもよい。また、「検索」は、対応するユーザが検索行動に用いた検索クエリを示す。
例えば、図6に示す例において、ユーザID「U1」により識別されるユーザは、日時「TM11−1」に検索クエリ「海」を用いて検索行動を行ったことを示す。また、例えば、図6に示す例において、ユーザID「U1」により識別されるユーザは、日時「TM11−2」に検索クエリ「大物」を用いて検索行動を行ったことを示す。
なお、第1行動情報記憶部122は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、第1行動情報記憶部122は、検索行動を行った後閲覧したコンテンツに関する情報を記憶してもよい。また、図6では、ユーザIDごとに行動情報が第1行動情報記憶部122に記憶される場合を示したが、行動情報は、ユーザIDごとに限らず、例えば日時順に記憶されてもよい。
(第2行動情報記憶部123)
実施形態に係る第2行動情報記憶部123は、第2種別の行動情報である第2行動情報に関する各種情報を記憶する。図7は、実施形態に係る第2行動情報記憶部の一例を示す図である。例えば、第2行動情報記憶部123は、第2行動情報としてユーザが行動(移動)により位置した位置情報を記憶する。図7に示す第2行動情報記憶部123には、「ユーザID」、「第2行動情報(位置)」といった項目が含まれる。また、「第2行動情報(位置)」には、「日時」、「位置」といった項目が含まれる。
「ユーザID」は、ユーザを識別するための識別情報を示す。例えば、ユーザID「U3」により識別されるユーザは、図1の例に示したユーザU3に対応する。「日時」は、ユーザが対応する位置にいた日時を示す。例えば、「日時」は、対応する位置にいることがユーザの端末装置10が有するGPSセンサ等により検知された日時を示す。なお、図7の例では、「TM21−1」等で図示するが、「日時」には、「2017年1月8日14時51分22秒」等の具体的な日時が記憶されてもよい。また、「位置」は、対応するユーザが位置した地点を示す位置情報を示す。なお、図7に示す例では、「位置」は、「LC1−1」といった抽象的な符号を図示するが、緯度や経度を示す情報であってもよい。また、例えば、「位置」は、図7中に括弧書きで示すようにその位置の役割や地域名や住所等を含んでもよい。
例えば、図7に示す例において、ユーザID「U1」により識別されるユーザは、日時「TM21−1」に、釣りショップAがある位置「LC1−1」に位置したことを示す。また例えば、図7に示す例において、ユーザID「U1」により識別されるユーザは、日時「TM21−2」に、海上である位置「LC1−2」に位置したことを示す。
なお、第2行動情報記憶部123は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、第2行動情報記憶部123は、検索行動を行った後閲覧したコンテンツに関する情報を記憶してもよい。また、図7では、ユーザIDごとに行動情報が第2行動情報記憶部123に記憶される場合を示したが、行動情報は、ユーザIDごとに限らず、例えば日時順に記憶されてもよい。
(判定モデル情報記憶部124)
実施形態に係る判定モデル情報記憶部124は、判定モデルに関する情報を記憶する。例えば、判定モデル情報記憶部124は、生成処理により生成された判定モデル情報を記憶する。図8は、実施形態に係る判定モデル情報記憶部の一例を示す図である。図8に示す判定モデル情報記憶部124では、各特徴(位置)に対応する判定モデルが記憶される。図8に示す判定モデル情報記憶部124は、判定モデル情報として、各判定モデルDM1〜DM3等に対応させて「素性1」〜「素性3」等といった項目を有する。
例えば、図8に示す例において、判定モデルDM1に関する判定モデル情報は、特徴「海」に対応する判定モデルであることを示す。例えば、判定モデルDM1に一のユーザに関する情報(第1行動情報)を入力し、判定モデルDM1が出力するスコア(値)が所定の閾値以上である場合、一のユーザを海に行ったユーザとして判定してもよい。
例えば、図8に示す例において、判定モデルDM1に関する判定モデル情報は、素性1の重みが「0.5」、素性2の重みが「−0.4」、素性3の重みが「0.2」等であることを示す。例えば、モデルの素性(特徴量)がm次元のベクトルで表現される場合、素性数はm個になり、素性1〜素性mの重みが記憶される。例えば、図8に示す例において、判定モデルの素性は、第1行動情報に対応する素性であってもよい。例えば、図8に示す例において、判定モデルの素性は、検索クエリとして用いられる文字列等の情報に対応する素性であってもよい。例えば、図8に示す例において、判定モデルの素性は、素性1がクエリ「海」に対応し、素性2がクエリ「グルメ」に対応してもよい。
なお、判定モデル情報記憶部124は、上記に限らず、目的に応じて種々の判定モデル情報を記憶してもよい。
(拡張第2行動情報記憶部125)
実施形態に係る拡張第2行動情報記憶部125は、第2種別の拡張行動情報である拡張第2行動情報に関する各種情報を記憶する。図9は、実施形態に係る拡張第2行動情報記憶部の一例を示す図である。例えば、拡張第2行動情報記憶部125は、拡張第2行動情報として判定モデルにより判定されたユーザの位置に関する情報を記憶する。図9に示す拡張第2行動情報記憶部125には、「ユーザID」、「拡張第2行動情報(位置)」といった項目が含まれる。また、「拡張第2行動情報(位置)」には、「特徴(位置)」、「スコア」といった項目が含まれる。
「ユーザID」は、ユーザを識別するための識別情報を示す。例えば、ユーザID「U4」により識別されるユーザは、図1の例に示したユーザU4に対応する。また、「特徴(位置)」は、対応するユーザについてモデルを用いてスコアを算出した位置に関する特徴を示す。なお、図9に示す例では、「特徴(位置)」は、各判定モデルの特徴である場合を示す。また、「スコア」は、各位置に対応する判定モデルに対応するユーザの情報が入力された場合に出力されたスコアを示す。
例えば、図9に示す例において、ユーザID「U3」により識別されるユーザは、位置「海」に関する判定モデルDM1が出力したスコアが「0.2」であることを示す。また、例えば、図9に示す例において、ユーザID「U3」により識別されるユーザは、位置「釣りショップ」に関する判定モデルDM2が出力したスコアが「0.4」であることを示す。図9の例では、位置とスコアをセットで記憶する場合を示したが、拡張第2行動情報記憶部125には、スコアが所定の閾値以上である位置のみを、ユーザが位置したものとして記憶してもよい。
なお、拡張第2行動情報記憶部125は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、拡張第2行動情報記憶部125は、位置に限らずユーザの位置に関する行動情報であればどのような情報を記憶してもよい。例えば、拡張第2行動情報記憶部125は、「月1回海へ行く」かどうかを判定する判定モデルや「電車を利用する」かどうかを判定する判定モデル等の種々のモデルに対応するスコアを記憶してもよい。例えば、拡張第2行動情報記憶部125は、「月1回海へ行く」や「電車を利用する」等の種々のユーザの位置に関するスコアを記憶してもよい。また、図9では、ユーザIDごとに行動情報が拡張第2行動情報記憶部125に記憶される場合を示したが、行動情報は、ユーザIDごとに限らず、例えば日時順に記憶されてもよい。
(正解情報記憶部126)
実施形態に係る正解情報記憶部126は、予測に関する正解情報を記憶する。例えば、正解情報記憶部126は、予測対象となる事柄に関する情報を記憶する。図10は、実施形態に係る正解情報記憶部の一例を示す図である。図10に示す正解情報記憶部126は、「ユーザID」、「正解情報(購買情報)」といった項目が含まれる。また、「正解情報(購買情報)」には、「釣竿X」といった項目が含まれる。
「ユーザID」は、ユーザを識別するための識別情報を示す。例えば、ユーザID「U5」により識別されるユーザは、図1の例に示したユーザU5に対応する。また、「釣竿X」は、対応するユーザが対象「釣竿X」を購入したかどうかを示す。すなわち、「釣竿X」は、予測対象「釣竿Xの購入」が行われたかどうかを示す。
例えば、図10に示す例において、ユーザID「U1」により識別されるユーザは、釣竿Xを購入したユーザであることを示す。また、例えば、図10に示す例において、ユーザID「U5」により識別されるユーザは、釣竿Xを購入していないユーザであることを示す。このように、図10の例では、ユーザU1とユーザU5は、購買履歴情報等により、釣竿Xを購入しているかどうかが判別可能なユーザである場合を示す。
なお、正解情報記憶部126は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
(予測モデル情報記憶部127)
実施形態に係る予測モデル情報記憶部127は、予測モデルに関する情報を記憶する。例えば、予測モデル情報記憶部127は、生成処理により生成された予測モデル情報を記憶する。図11は、実施形態に係る予測モデル情報記憶部の一例を示す図である。図11に示す予測モデル情報記憶部127では、予測対象「釣竿Xの購入」に対応する予測モデルPM1等の予測モデル情報が記憶される。図11に示す予測モデル情報記憶部127は、予測モデル情報として、予測モデルPM1に対応させて「素性1」〜「素性3」等といった項目を有する。
例えば、図11に示す例において、予測モデルPM1に関する予測モデル情報は、事柄「釣竿Xの購入」に対応する予測モデルであることを示す。例えば、予測モデルPM1に一のユーザに関する情報を入力し、予測モデルPM1が出力するスコア(値)が所定の閾値以上である場合、予測対象「釣竿Xの購入」を行ったユーザとして判定してもよい。
例えば、一のユーザが第1ユーザである場合、予測モデルPM1に一のユーザに関する第1行動情報や第2行動情報を入力し、予測モデルPM1が出力するスコア(値)が所定の閾値以上である場合、予測対象「釣竿Xの購入」を行ったユーザとして判定してもよい。例えば、一のユーザが第1ユーザである場合、予測モデルPM1に一のユーザに関する第1行動情報や成形後第2行動情報を入力し、予測モデルPM1が出力するスコア(値)が所定の閾値以上である場合、予測対象「釣竿Xの購入」を行ったユーザとして判定してもよい。
また、例えば、一のユーザが第2ユーザである場合、予測モデルPM1に一のユーザに関する第1行動情報や拡張第2行動情報を入力し、予測モデルPM1が出力するスコア(値)が所定の閾値以上である場合、予測対象「釣竿Xの購入」を行ったユーザとして判定してもよい。
例えば、図11に示す例において、予測モデルPM1に関する予測モデル情報は、素性1の重みが「−0.3」、素性2の重みが「0.6」、素性3の重みが「0.1」等であることを示す。例えば、モデルの素性(特徴量)がm次元のベクトルで表現される場合、素性数はm個になり、素性1〜素性mの重みが記憶される。例えば、図11に示す例において、予測モデルの素性は、第1行動情報や第2行動情報に対応する素性であってもよい。例えば、図11に示す例において、予測モデルの素性は、検索クエリとして用いられる文字列や位置に関する特徴等の情報に対応する素性であってもよい。例えば、図11に示す例において、予測モデルの素性は、素性1がクエリ「ブーツ」に対応し、素性2が特徴「釣りショップ」に対応してもよい。
なお、予測モデル情報記憶部127は、上記に限らず、目的に応じて種々の予測モデル情報を記憶してもよい。
(制御部130)
図4の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、生成装置100内部の記憶装置に記憶されている各種プログラム(提供プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図4に示すように、制御部130は、取得部131と、抽出部132と、生成部133と、予測部134と、提供部135とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図4に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図4に示した接続関係に限られず、他の接続関係であってもよい。
(取得部131)
取得部131は、種々の情報を取得する。取得部131は、端末装置10等の外部装置から各種情報を取得する。また、取得部131は、ユーザ情報記憶部121や、第1行動情報記憶部122や、第2行動情報記憶部123や、判定モデル情報記憶部124や、拡張第2行動情報記憶部125や、正解情報記憶部126や、予測モデル情報記憶部127等から各種情報を取得する。
例えば、取得部131は、第1ユーザに関する第1種別の行動情報(第1行動情報)及び第1ユーザに関する第2種別の行動情報(第2行動情報)と、第1ユーザ以外の第2ユーザであって、当該第2ユーザに関する第2種別の行動情報が所定の条件を満たす第2ユーザに関する第1種別の行動情報とを取得する。例えば、取得部131は、第2種別の行動情報の量が所定の閾値未満である第2ユーザに関する第1種別の行動情報を取得する。例えば、取得部131は、第2種別の行動情報がない第2ユーザに関する第1種別の行動情報を取得する。
例えば、取得部131は、第2ユーザよりも少数の第1ユーザに関する第1種別の行動情報及び第2種別の行動情報を取得する。例えば、取得部131は、第1ユーザに関する検索行動を第1ユーザに関する第1種別の行動情報として取得する。例えば、取得部131は、第1ユーザの位置に関する情報を第1ユーザに関する第2種別の行動情報として取得する。例えば、取得部131は、第2ユーザに関する検索行動を第2ユーザに関する第1種別の行動情報として取得する。
(抽出部132)
抽出部132は、種々の情報を抽出する。例えば、抽出部132は、第1行動情報から所定の特徴を示す行動を抽出する。
図1の例では、抽出部132は、第1ユーザの第2行動情報に基づいて位置に関する特徴を抽出する。例えば、抽出部132は、図1中の第2行動情報記憶部123に示す第1ユーザの第2行動情報に基づいて位置に関する特徴を抽出する。
図1の例では、抽出部132は、第2行動情報記憶部123に記憶された第1ユーザの第2行動情報に基づいて、特徴リストFL11に示すような位置に関する特徴を抽出する。例えば、抽出部132は、予測対象「釣竿Xの購入」に応じて、釣りに関する特徴を抽出してもよい。図1の例では、抽出部132は、予測対象「釣竿Xの購入」に応じて、特徴ID「F1」により識別される特徴「海」や、特徴ID「F2」により識別される特徴「釣りショップ」や、特徴ID「F3」により識別される特徴「川」等の釣りに関連する特徴を抽出する。
(生成部133)
生成部133は、種々の情報を生成する。例えば、生成部133は、第1ユーザに関する第1種別の行動情報(第1行動情報)及び第2種別の行動情報(第2行動情報)と、第2ユーザに関する第1種別の行動情報と、第2ユーザに関する第2種別の行動情報であって、第2種別の行動情報に対応する第2ユーザの行動とは異なる所定の方法により生成された第2種別の行動情報である拡張行動情報(拡張第2行動情報)とに基づいて、所定の事柄への対応の予測に用いる予測モデルを生成する。
例えば、生成部133は、第1種別の行動情報に基づいて、第2ユーザの拡張行動情報を生成する。例えば、生成部133は、第1ユーザに関する第1種別の行動情報及び第2種別の行動情報に基づいて生成された第2種別の行動情報の所定の行動の有無を判定する判定モデルと、第2ユーザに関する第1種別の行動情報とに基づいて、第2ユーザの拡張行動情報を生成する。
例えば、生成部133は、第1ユーザに関する第2種別の行動情報から抽出された所定の行動に対応する第2種別の行動情報と、第2ユーザの拡張行動情報とに基づいて、予測モデルを生成する。
図1の例では、生成部133は、第1ユーザの第1行動情報及び第2行動情報に基づいて判定モデルを生成する。図1の例では、生成部133は、第1行動情報記憶部122に記憶された第1ユーザの第1行動情報と、成形後第2行動情報リストSD11中の成形後第2行動情報とに基づいて、判定モデルを生成する。図1の例では、生成部133は、第1行動情報記憶部122に記憶された第1行動情報のうち、第1ユーザ群UG1に含まれるユーザ(ユーザU1、U2等)の第1行動情報を用いて、判定モデル情報記憶部124に示すような判定モデルDM1〜DM3等を生成する。
図2の例では、生成部133は、第2ユーザの第1行動情報及び判定モデルに基づいて第2ユーザの拡張第2行動情報を生成する。例えば、生成部133は、各特徴の判定モデルの各々に各第2ユーザの第1行動情報を入力することにより、各第2ユーザにおける各特徴のスコアを取得する。例えば、生成部133は、各特徴と、各第2ユーザにおける各特徴のスコアとの組み合わせに基づいて、第2ユーザの拡張第2行動情報を生成する。
図2の例では、生成部133は、第1行動情報記憶部122に記憶された第2ユーザの第1行動情報と、判定モデル情報記憶部124に記憶された判定モデルに基づいて、拡張第2行動情報記憶部125に示すような第2ユーザの拡張第2行動情報を生成する。図2の例では、生成部133は、第1行動情報記憶部122に記憶された第1行動情報のうち、第2ユーザ群UG2に含まれるユーザ(ユーザU3、U4、U5等)の第1行動情報を用いて、拡張第2行動情報記憶部125に示すような第2ユーザの拡張第2行動情報を生成する。
図3の例では、生成部133は、正解情報、第1ユーザの第1行動情報及び第2行動情報、第2ユーザの第1行動情報及び拡張第2行動情報に基づいて予測モデルを生成する。図3に示すように、生成部133は、正解情報記憶部126に記憶された正解情報に基づいて、予測モデルを生成する。図3の例では、生成部133は、正解ユーザであり第1ユーザであるユーザU1等に関する正解情報、第1行動情報及び成形後第2行動情報と、正解ユーザであり第2ユーザであるユーザU5等に関する正解情報、第1行動情報及び拡張第2行動情報とに基づいて予測モデルを生成する。図3の例では、生成部133は、正解情報、第1ユーザの第1行動情報及び第2行動情報、第2ユーザの第1行動情報及び拡張第2行動情報に基づいて、予測モデル情報記憶部127に示すような予測対象「釣竿Xの購入」を予測する予測モデルPM1を生成する。
例えば、生成部133は、第1種別の行動情報に対応する行動及び第2種別の行動情報に対応する行動とは異なる他の種別の行動に対応する第3行動情報に基づいて、第2ユーザの拡張行動情報を生成する。例えば、生成部133は、第1ユーザに関する第3行動情報及び第2種別の行動情報に基づいて生成された第2種別の行動情報の所定の行動の有無を判定する他の判定モデルと、第2ユーザに関する第3行動情報とに基づいて、第2ユーザの拡張行動情報を生成する。例えば、生成部133は、複数種別の各々に対応する行動に関する第3行動情報に基づいて、第2ユーザの拡張行動情報を生成する。なお、これらの点についての詳細は後述する。
(予測部134)
予測部134は、種々の情報を予測する。例えば、予測部134は、生成部133により生成された各種モデルを用いて、種々の情報を予測する。
図3の例では、予測部134は、予測モデルPM1を用いて、正解ユーザ以外のユーザにおける予測対象「釣竿Xの購入」の有無を予測する。例えば、予測部134は、予測ユーザについて予測対象「釣竿Xの購入」の有無を予測する。例えば、予測部134は、予測ユーザであるユーザU2、U3、U4等について予測対象「釣竿Xの購入」の有無を予測する。
図3の例では、予測部134は、スコア「0.6」であり、閾値「0.7」未満であるため、ユーザU2が予測対象「釣竿Xの購入」を行う可能性が低いユーザであると予測する。図3の例では、予測部134は、スコア「0.8」であり、閾値「0.7」以上であるため、ユーザU3が予測対象「釣竿Xの購入」を行う可能性が高いユーザであると予測する。図3の例では、予測部134は、スコア「0.1」であり、閾値「0.7」未満であるため、ユーザU4が予測対象「釣竿Xの購入」を行う可能性が低いユーザであると予測する。
(提供部135)
提供部135は、端末装置10等の外部装置に各種情報を提供する。例えば、提供部135は、生成部133により生成された各種情報を外部装置に提供してもよい。また、提供部135は、予測部134により予測された各種の予測情報を外部装置に提供してもよい。
〔3.生成処理のフロー〕
〔3−1.判定モデルの生成〕
次に、図12を用いて、実施形態に係る生成システム1による生成処理の手順について説明する。図12は、実施形態に係る生成処理の一例を示すフローチャートである。具体的には、図12は、判定モデルの生成に関する生成処理の一例を示すフローチャートである。
図12に示すように、生成装置100は、第1ユーザの第1行動情報を取得する(ステップS101)。例えば、生成装置100は、第1行動情報記憶部122から第1ユーザの第1行動情報を取得する。
また、生成装置100は、第1ユーザの第2行動情報を取得する(ステップS102)。例えば、生成装置100は、第2行動情報記憶部123から第1ユーザの第2行動情報を取得する。
その後、生成装置100は、第1ユーザの第1行動情報及び第2行動情報に基づいて判定モデルを生成する(ステップS103)。図1の例では、生成装置100は、第1行動情報記憶部122に記憶された第1ユーザの第1行動情報と、第2行動情報記憶部123に記憶された第1ユーザの第2行動情報とに基づいて、判定モデル情報記憶部124に示すような判定モデルDM1〜DM3等を生成する。
〔3−2.拡張第2行動情報の生成〕
次に、図13を用いて、実施形態に係る生成システム1による生成処理の手順について説明する。図13は、実施形態に係る生成処理の一例を示すフローチャートである。具体的には、図13は、拡張第2行動情報の生成に関する生成処理の一例を示すフローチャートである。
図13に示すように、生成装置100は、第2ユーザの第1行動情報を取得する(ステップS201)。例えば、生成装置100は、第1行動情報記憶部122から第2ユーザの第1行動情報を取得する。
また、生成装置100は、第2ユーザの第1行動情報及び判定モデルに基づいて第2ユーザの拡張第2行動情報を生成する(ステップS202)。図2の例では、生成装置100は、第1行動情報記憶部122に記憶された第2ユーザの第1行動情報と、判定モデル情報記憶部124に記憶された判定モデルに基づいて、拡張第2行動情報記憶部125に示すような第2ユーザの拡張第2行動情報を生成する。
〔3−3.予測モデルの生成〕
次に、図14を用いて、実施形態に係る生成システム1による生成処理の手順について説明する。図14は、実施形態に係る生成処理の一例を示すフローチャートである。具体的には、図14は、予測モデルの生成に関する生成処理の一例を示すフローチャートである。
図14に示すように、生成装置100は、正解情報に含まれる第1ユーザの第1行動情報及び第2行動情報を取得する(ステップS301)。例えば、生成装置100は、正解情報記憶部126に含まれる第1ユーザの第1行動情報を第1行動情報記憶部122から取得する。例えば、生成装置100は、正解情報記憶部126に含まれる第1ユーザの第2行動情報を第2行動情報記憶部123から取得する。
そして、生成装置100は、正解情報に含まれる第2ユーザの第1行動情報及び拡張第2行動情報を取得する(ステップS302)。例えば、生成装置100は、正解情報記憶部126に含まれる第2ユーザの第1行動情報を第1行動情報記憶部122から取得する。例えば、生成装置100は、正解情報記憶部126に含まれる第2ユーザの拡張第2行動情報を拡張第2行動情報記憶部125から取得する。
その後、生成装置100は、正解情報、第1ユーザの第1行動情報及び第2行動情報、第2ユーザの第1行動情報及び拡張第2行動情報に基づいて予測モデルを生成する(ステップS303)。図3の例では、生成装置100は、正解情報、第1ユーザの第1行動情報及び第2行動情報、第2ユーザの第1行動情報及び拡張第2行動情報に基づいて、釣竿Xを購入するかを予測する予測モデルPM1を生成する。
〔4.予測成処理のフロー〕
〔4−1.第1ユーザに関する予測〕
次に、図15を用いて、実施形態に係る生成システム1による予測処理の手順について説明する。図15は、実施形態に係る予測処理の一例を示すフローチャートである。具体的には、図15は、第1ユーザに関する予測処理の一例を示すフローチャートである。
図15に示すように、生成装置100は、予測モデルを取得する(ステップS401)。例えば、生成装置100は、予測モデル情報記憶部127から予測モデルを取得する。
また、生成装置100は、第1ユーザの第1行動情報及び第2行動情報を取得する(ステップS402)。例えば、生成装置100は、第1行動情報記憶部122から第1ユーザの第1行動情報を取得する。また、例えば、生成装置100は、第2行動情報記憶部123から第1ユーザの第2行動情報を取得する。
そして、生成装置100は、予測モデル、第1ユーザの第1行動情報及び第2行動情報に基づいて第1ユーザの行動を予測する(ステップS403)。図3の例では、生成装置100は、予測モデル、第1ユーザの第1行動情報及び第2行動情報に基づいて、第1ユーザが釣竿Xを購入するかを予測する。
〔4−2.第2ユーザに関する予測〕
次に、図16を用いて、実施形態に係る生成システム1による予測処理の手順について説明する。図16は、実施形態に係る予測処理の一例を示すフローチャートである。具体的には、図16は、第2ユーザに関する予測処理の一例を示すフローチャートである。
図16に示すように、生成装置100は、予測モデルを取得する(ステップS501)。例えば、生成装置100は、予測モデル情報記憶部127から予測モデルを取得する。
また、生成装置100は、第2ユーザの第1行動情報及び拡張第2行動情報を取得する(ステップS502)。例えば、生成装置100は、第1行動情報記憶部122から第2ユーザの第1行動情報を取得する。また、例えば、生成装置100は、拡張第2行動情報記憶部125から第2ユーザの拡張第2行動情報を取得する。
そして、生成装置100は、予測モデル、第2ユーザの第1行動情報及び拡張第2行動情報に基づいて第2ユーザの行動を予測する(ステップS503)。図3の例では、生成装置100は、予測モデル、第2ユーザの第1行動情報及び拡張第2行動情報に基づいて、第2ユーザが釣竿Xを購入するかを予測する。
〔5.モデルの生成〕
また、生成装置100は、第1行動情報及び第2行動情報以外の種々の種別の行動情報(以下、「第3行動情報」ともいう)を用いて、モデルを生成してもよい。この点について、図17を用いて説明する。図17は、実施形態に係るモデル生成の繰返し処理の一例を示す図である。具体的には、図17は、モデル生成の繰返し処理を概念的に示す図である。
図17に示す第1行動情報FD1及び第2行動情報SD1は、第1ユーザ群UG1に対応する情報である。例えば、図17に示す第1行動情報FD1は、図6中の第1行動情報記憶部122に記憶された第1行動情報のうち、第1ユーザに関する第1行動情報に対応する。また、図17に示す第2行動情報SD1は、図7中の第2行動情報記憶部123に記憶された第2行動情報に対応する。
まず、生成装置100は、第1行動情報FD1及び第2行動情報SD1に基づいて、判定モデル情報DD1を生成する(ステップS41)。図17に示す判定モデル情報DD1は、図8中の判定モデル情報記憶部124に記憶された判定モデルに対応する。
図17に示す第1行動情報FD2は、第2ユーザ群UG2に対応する情報である。例えば、図17に示す第1行動情報FD2は、図6中の第1行動情報記憶部122に記憶された第1行動情報のうち、第2ユーザに関する第1行動情報に対応する。
生成装置100は、第1行動情報FD2及び判定モデル情報DD1に基づいて、拡張第2行動情報EX1を生成する(ステップS42)。図17に示す拡張第2行動情報EX1は、図9中の拡張第2行動情報記憶部125に記憶された拡張第2行動情報に対応する。
図17に示す第1行動情報FD2及び拡張第2行動情報EX1は、第2ユーザ群UG2に対応する情報である。図17において、生成装置100は、第1行動情報FD2及び拡張第2行動情報EX1に基づいて、判定モデル情報DD2を生成する(ステップS43)。図17に示す判定モデル情報DD2は、繰返し処理により、拡張第2行動情報を用いて生成される判定モデルである。
このように、生成装置100は、拡張第2行動情報を用いて再帰的に判定モデルを生成することにより、判定モデルの精度を高めることができる。なお、図17の例では、第1行動情報FD2及び拡張第2行動情報EX1のみを用いて判定モデル情報DD2を生成する場合を示したが、生成装置100は、第1行動情報FD1、第2行動情報SD1、第1行動情報FD2、及び拡張第2行動情報EX1を用いて判定モデル情報DD2を生成してもよい。また、生成装置100は、ステップS43以降も判定モデルの生成処理を繰り返してもよい。
〔6.他の種別の行動情報を用いたモデルの生成〕
また、生成装置100は、第1行動情報及び第2行動情報以外の種々の種別の行動情報を用いて、判定モデルを生成してもよい。この点について、図18を用いて説明する。図18は、実施形態に係る他の種別の行動情報を用いたモデル生成の一例を示す図である。具体的には、図18は、第3行動情報を用いた判定モデルの生成を概念的に示す図である。なお、第3行動情報は、第1行動情報及び第2行動情報と種別の異なる情報であれば、どのような情報であってもよい。
図18に示す第1行動情報FD1、第2行動情報SD1、第3行動情報TD1−1及び第3行動情報TD1−2は、第1ユーザ群UG1に対応する情報である。例えば、図18に示す第1行動情報FD1は、図6中の第1行動情報記憶部122に記憶された第1行動情報のうち、第1ユーザに関する第1行動情報に対応する。また、図18に示す第2行動情報SD1は、図7中の第2行動情報記憶部123に記憶された第2行動情報に対応する。例えば、第3行動情報TD1−1は、ユーザのウェブ上におけるコンテンツの閲覧に関する行動情報である。また、例えば、第3行動情報TD1−2は、ユーザの購買履歴に関する行動情報である。
まず、生成装置100は、第2行動情報SD1、第3行動情報TD1−1及び第3行動情報TD1−2に基づいて、判定モデル情報DD3を生成する(ステップS51)。図18に示す判定モデル情報DD3は、第3行動情報TD1−1及び第3行動情報TD1−2に関する情報を入力として、第2行動情報における各特徴に対応する複数の判定モデルを含む。
生成装置100は、判定モデル情報DD3、第3行動情報TD2−1及び第3行動情報TD2−2に基づいて、拡張第2行動情報EX2を生成する(ステップS52)。例えば、第3行動情報TD2−1は、第3行動情報TD1−1と同様の種別の情報である。例えば、第3行動情報TD2−1は、ユーザのウェブ上におけるコンテンツの閲覧に関する行動情報である。また、例えば、第3行動情報TD2−2は、第3行動情報TD1−2と同様の種別の情報である。例えば、第3行動情報TD2−2は、ユーザの購買履歴に関する行動情報である。図18に示す拡張第2行動情報EX2は、第1行動情報以外の第3行動情報を入力とする判定モデルの出力に基づいて生成された拡張第2行動情報に対応する。
このように、生成装置100は、第1行動情報及び第2行動情報以外の第3行動情報から拡張第2行動情報を生成することにより、種々の観点に基づく判定モデルを生成することが可能となる。なお、図18の例では、第2行動情報SD1、第3行動情報TD1−1及び第3行動情報TD1−2を用いて判定モデル情報DD3を生成する場合を示したが、生成装置100は、第1行動情報FD1、第2行動情報SD1、第3行動情報TD1−1及び第3行動情報TD1−2を用いて判定モデル情報DD3を生成してもよい。また、生成装置100は、ステップS52以降も判定モデルの生成処理を繰り返してもよい。
〔7.効果〕
上述してきたように、実施形態に係る生成装置100は、取得部131と、生成部133とを有する。取得部131は、第1ユーザに関する第1種別の行動情報及び第1ユーザに関する第2種別の行動情報と、第1ユーザ以外の第2ユーザであって、当該第2ユーザに関する第2種別の行動情報が所定の条件を満たす第2ユーザに関する第1種別の行動情報とを取得する。生成部133は、第1ユーザに関する第1種別の行動情報及び第2種別の行動情報と、第2ユーザに関する第1種別の行動情報と、第2ユーザに関する第2種別の行動情報であって、第2種別の行動情報に対応する第2ユーザの行動とは異なる所定の方法により生成された第2種別の行動情報である拡張行動情報とに基づいて、所定の事柄への対応の予測に用いる予測モデルを生成する。
これにより、実施形態に係る生成装置100は、第1ユーザ及び第2ユーザの双方について、第1種別の行動情報及び第2種別の行動情報の両方に基づいて予測モデルを生成できるため、所定の事柄への対応の予測に用いるモデルを精度よく生成することができる。
また、実施形態に係る生成装置100において、取得部131は、第2種別の行動情報の量が所定の閾値未満である第2ユーザに関する第1種別の行動情報を取得する。
これにより、実施形態に係る生成装置100は、第1ユーザ及び第2ユーザの双方について、第1種別の行動情報及び第2種別の行動情報の両方に基づいて予測モデルを生成できるため、所定の事柄への対応の予測に用いるモデルを精度よく生成することができる。
また、実施形態に係る生成装置100において、取得部131は、第2種別の行動情報がない第2ユーザに関する第1種別の行動情報を取得する。
これにより、実施形態に係る生成装置100は、第1ユーザ及び第2ユーザの双方について、第1種別の行動情報及び第2種別の行動情報の両方に基づいて予測モデルを生成できるため、所定の事柄への対応の予測に用いるモデルを精度よく生成することができる。
また、実施形態に係る生成装置100において、生成部133は、第1種別の行動情報に基づいて、第2ユーザの拡張行動情報を生成する。
これにより、実施形態に係る生成装置100は、第1ユーザ及び第2ユーザの双方について、第1種別の行動情報及び第2種別の行動情報の両方に基づいて予測モデルを生成できるため、所定の事柄への対応の予測に用いるモデルを精度よく生成することができる。
また、実施形態に係る生成装置100において、生成部133は、第1ユーザに関する第1種別の行動情報及び第2種別の行動情報に基づいて生成された第2種別の行動情報の所定の行動の有無を判定する判定モデルと、第2ユーザに関する第1種別の行動情報とに基づいて、第2ユーザの拡張行動情報を生成する。
これにより、実施形態に係る生成装置100は、第1ユーザの情報に基づいて生成された判定モデルを用いて第2ユーザの拡張行動情報を生成することができ、所定の事柄への対応の予測に用いるモデルを精度よく生成することができる。
また、実施形態に係る生成装置100において、生成部133は、第1ユーザに関する第2種別の行動情報から抽出された所定の行動に対応する第2種別の行動情報と、第2ユーザの拡張行動情報とに基づいて、予測モデルを生成する。
これにより、実施形態に係る生成装置100は、第1ユーザに関する第2種別の行動情報から抽出された所定の行動情報に基づいて生成された判定モデルを用いて第2ユーザの拡張行動情報を生成することができ、所定の事柄への対応の予測に用いるモデルを精度よく生成することができる。
また、実施形態に係る生成装置100において、生成部133は、第1種別の行動情報に対応する行動及び第2種別の行動情報に対応する行動とは異なる他の種別の行動に対応する第3行動情報に基づいて、第2ユーザの拡張行動情報を生成する。
これにより、実施形態に係る生成装置100は、第1種別の行動情報に対応する行動及び第2種別の行動情報に対応する行動とは異なる他の種別の行動を加味して第2ユーザの拡張行動情報を生成することができ、所定の事柄への対応の予測に用いるモデルを精度よく生成することができる。
また、実施形態に係る生成装置100において、生成部133は、第1ユーザに関する第3行動情報及び第2種別の行動情報に基づいて生成された第2種別の行動情報の所定の行動の有無を判定する他の判定モデルと、第2ユーザに関する第3行動情報とに基づいて、第2ユーザの拡張行動情報を生成する。
これにより、実施形態に係る生成装置100は、第1種別の行動情報に対応する行動及び第2種別の行動情報に対応する行動とは異なる他の種別の行動に基づいて判定モデルを生成することができ、所定の事柄への対応の予測に用いるモデルを精度よく生成することができる。
また、実施形態に係る生成装置100において、生成部133は、複数種別の各々に対応する行動に関する第3行動情報に基づいて、第2ユーザの拡張行動情報を生成する。
これにより、実施形態に係る生成装置100は、複数種別の各々に対応する行動に関する第3行動情報を加味して第2ユーザの拡張行動情報を生成することができ、所定の事柄への対応の予測に用いるモデルを精度よく生成することができる。
また、実施形態に係る生成装置100において、取得部131は、第2ユーザよりも少数の第1ユーザに関する第1種別の行動情報及び第2種別の行動情報を取得する。
これにより、実施形態に係る生成装置100は、第2ユーザよりも少数の第1ユーザと、多数の第2ユーザとの双方の情報を利用することが可能となり、所定の事柄への対応の予測に用いるモデルを精度よく生成することができる。
また、実施形態に係る生成装置100において、取得部131は、第1ユーザに関する検索行動を第1ユーザに関する第1種別の行動情報として取得し、第1ユーザの位置に関する情報を第1ユーザに関する第2種別の行動情報として取得し、第2ユーザに関する検索行動を第2ユーザに関する第1種別の行動情報として取得する。
これにより、実施形態に係る生成装置100は、第1ユーザに関する検索行動を第1ユーザに関する第1種別の行動情報として取得し、第1ユーザの位置に関する情報を第1ユーザに関する第2種別の行動情報として取得し、第2ユーザに関する検索行動を第2ユーザに関する第1種別の行動情報として取得することで、所定の事柄への対応の予測に用いるモデルを精度よく生成することができる。
〔8.ハードウェア構成〕
上述してきた実施形態に係る生成装置100は、例えば図19に示すような構成のコンピュータ1000によって実現される。図19は、生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータをネットワークNを介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る生成装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
以上、本願の実施形態及び変形例のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
〔9.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
1 生成システム
100 生成装置
121 ユーザ情報記憶部
122 第1行動情報記憶部
123 第2行動情報記憶部
124 判定モデル情報記憶部
125 拡張第2行動情報記憶部
126 正解情報記憶部
127 予測モデル情報記憶部
130 制御部
131 取得部
132 抽出部
133 生成部
134 予測部
135 提供部
10 端末装置
N ネットワーク

Claims (13)

  1. 第1ユーザに関する第1種別の行動情報及び前記第1ユーザに関する第2種別の行動情報と、第1ユーザ以外の第2ユーザであって、当該第2ユーザに関する第2種別の行動情報が所定の条件を満たす第2ユーザに関する第1種別の行動情報とを取得する取得部と、
    前記第1ユーザに関する第1種別の行動情報及び第2種別の行動情報と、前記第2ユーザに関する第1種別の行動情報と、前記第2ユーザに関する第2種別の行動情報であって、第2種別の行動情報に対応する前記第2ユーザの行動とは異なる所定の方法により生成された第2種別の行動情報である拡張行動情報とに基づいて、所定の事柄への対応の予測に用いる予測モデルを生成する生成部と、
    を備えたことを特徴とする生成装置。
  2. 前記取得部は、
    第2種別の行動情報の量が所定の閾値未満である前記第2ユーザに関する第1種別の行動情報を取得する
    ことを特徴とする請求項1に記載の生成装置。
  3. 前記取得部は、
    第2種別の行動情報がない前記第2ユーザに関する第1種別の行動情報を取得する
    ことを特徴とする請求項1または請求項2に記載の生成装置。
  4. 前記生成部は、
    第1種別の行動情報に基づいて、前記第2ユーザの前記拡張行動情報を生成する
    ことを特徴とする請求項1〜3のいずれか1項に記載の生成装置。
  5. 前記生成部は、
    第1ユーザに関する第1種別の行動情報及び第2種別の行動情報に基づいて生成された第2種別の行動情報の所定の行動の有無を判定する判定モデルと、前記第2ユーザに関する第1種別の行動情報とに基づいて、前記第2ユーザの前記拡張行動情報を生成する
    ことを特徴とする請求項1〜4のいずれか1項に記載の生成装置。
  6. 前記生成部は、
    第1ユーザに関する第2種別の行動情報から抽出された前記所定の行動に対応する第2種別の行動情報と、前記第2ユーザの前記拡張行動情報とに基づいて、前記予測モデルを生成する
    ことを特徴とする請求項5に記載の生成装置。
  7. 前記生成部は、
    前記第1種別の行動情報に対応する行動及び前記第2種別の行動情報に対応する行動とは異なる他の種別の行動に対応する第3行動情報に基づいて、前記第2ユーザの前記拡張行動情報を生成する
    ことを特徴とする請求項1〜6のいずれか1項に記載の生成装置。
  8. 前記生成部は、
    第1ユーザに関する第3行動情報及び第2種別の行動情報に基づいて生成された第2種別の行動情報の所定の行動の有無を判定する他の判定モデルと、前記第2ユーザに関する第3行動情報とに基づいて、前記第2ユーザの前記拡張行動情報を生成する
    ことを特徴とする請求項7に記載の生成装置。
  9. 前記生成部は、
    複数種別の各々に対応する行動に関する第3行動情報に基づいて、前記第2ユーザの前記拡張行動情報を生成する
    ことを特徴とする請求項7または請求項8に記載の生成装置。
  10. 前記取得部は、
    前記第2ユーザよりも少数の前記第1ユーザに関する第1種別の行動情報及び第2種別の行動情報を取得する
    ことを特徴とする請求項1〜9のいずれか1項に記載の生成装置。
  11. 前記取得部は、
    前記第1ユーザに関する検索行動を前記第1ユーザに関する第1種別の行動情報として取得し、前記第1ユーザの位置に関する情報を前記第1ユーザに関する第2種別の行動情報として取得し、前記第2ユーザに関する検索行動を前記第2ユーザに関する第1種別の行動情報として取得する
    ことを特徴とする請求項1〜10のいずれか1項に記載の生成装置。
  12. コンピュータが実行する生成方法であって、
    第1ユーザに関する第1種別の行動情報及び前記第1ユーザに関する第2種別の行動情報と、第1ユーザ以外の第2ユーザであって、当該第2ユーザに関する第2種別の行動情報が所定の条件を満たす第2ユーザに関する第1種別の行動情報とを取得する取得工程と、
    前記第1ユーザに関する第1種別の行動情報及び第2種別の行動情報と、前記第2ユーザに関する第1種別の行動情報と、前記第2ユーザに関する第2種別の行動情報であって、第2種別の行動情報に対応する前記第2ユーザの行動とは異なる所定の方法により生成された第2種別の行動情報である拡張行動情報とに基づいて、所定の事柄への対応の予測に用いる予測モデルを生成する生成工程と、
    を備えたことを特徴とする生成方法。
  13. 第1ユーザに関する第1種別の行動情報及び前記第1ユーザに関する第2種別の行動情報と、第1ユーザ以外の第2ユーザであって、当該第2ユーザに関する第2種別の行動情報が所定の条件を満たす第2ユーザに関する第1種別の行動情報とを取得する取得手順と、
    前記第1ユーザに関する第1種別の行動情報及び第2種別の行動情報と、前記第2ユーザに関する第1種別の行動情報と、前記第2ユーザに関する第2種別の行動情報であって、第2種別の行動情報に対応する前記第2ユーザの行動とは異なる所定の方法により生成された第2種別の行動情報である拡張行動情報とに基づいて、所定の事柄への対応の予測に用いる予測モデルを生成する生成手順と、
    をコンピュータに実行させることを特徴とする生成プログラム。
JP2017005406A 2017-01-16 2017-01-16 生成装置、生成方法、及び生成プログラム Active JP6500044B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017005406A JP6500044B2 (ja) 2017-01-16 2017-01-16 生成装置、生成方法、及び生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017005406A JP6500044B2 (ja) 2017-01-16 2017-01-16 生成装置、生成方法、及び生成プログラム

Publications (2)

Publication Number Publication Date
JP2018116373A true JP2018116373A (ja) 2018-07-26
JP6500044B2 JP6500044B2 (ja) 2019-04-10

Family

ID=62984174

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017005406A Active JP6500044B2 (ja) 2017-01-16 2017-01-16 生成装置、生成方法、及び生成プログラム

Country Status (1)

Country Link
JP (1) JP6500044B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020135316A (ja) * 2019-02-18 2020-08-31 富士通株式会社 プログラム、情報処理装置及び情報処理方法
JP6944080B1 (ja) * 2021-03-18 2021-10-06 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP6944079B1 (ja) * 2021-03-18 2021-10-06 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP6993525B1 (ja) 2021-03-18 2022-01-13 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP7025578B1 (ja) 2021-03-19 2022-02-24 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008225907A (ja) * 2007-03-13 2008-09-25 Nippon Telegr & Teleph Corp <Ntt> 言語解析モデル学習装置、言語解析モデル学習方法、言語解析モデル学習プログラムならびにその記録媒体
JP2012079286A (ja) * 2010-09-30 2012-04-19 Nippon Telegr & Teleph Corp <Ntt> 構造予測モデル学習装置、方法、プログラム、及び記録媒体
JP2016177649A (ja) * 2015-03-20 2016-10-06 ヤフー株式会社 情報処理装置、情報処理プログラムおよび情報処理方法
JP2016177377A (ja) * 2015-03-18 2016-10-06 ヤフー株式会社 学習装置、学習方法、及び学習プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008225907A (ja) * 2007-03-13 2008-09-25 Nippon Telegr & Teleph Corp <Ntt> 言語解析モデル学習装置、言語解析モデル学習方法、言語解析モデル学習プログラムならびにその記録媒体
JP2012079286A (ja) * 2010-09-30 2012-04-19 Nippon Telegr & Teleph Corp <Ntt> 構造予測モデル学習装置、方法、プログラム、及び記録媒体
JP2016177377A (ja) * 2015-03-18 2016-10-06 ヤフー株式会社 学習装置、学習方法、及び学習プログラム
JP2016177649A (ja) * 2015-03-20 2016-10-06 ヤフー株式会社 情報処理装置、情報処理プログラムおよび情報処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
鈴木 潤: "大規模データを用いた半教師あり学習による高精度係り受け解析モデルの学習", 情報処理学会論文誌 論文誌ジャーナル [CD−ROM], vol. 52, no. 11, JPN6018023296, 15 November 2011 (2011-11-15), JP, pages 3038 - 3051, ISSN: 0003909676 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020135316A (ja) * 2019-02-18 2020-08-31 富士通株式会社 プログラム、情報処理装置及び情報処理方法
JP6944080B1 (ja) * 2021-03-18 2021-10-06 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP6944079B1 (ja) * 2021-03-18 2021-10-06 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP6993525B1 (ja) 2021-03-18 2022-01-13 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP2022144332A (ja) * 2021-03-18 2022-10-03 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP2022144330A (ja) * 2021-03-18 2022-10-03 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP2022144331A (ja) * 2021-03-18 2022-10-03 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP7025578B1 (ja) 2021-03-19 2022-02-24 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP2022145213A (ja) * 2021-03-19 2022-10-03 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム

Also Published As

Publication number Publication date
JP6500044B2 (ja) 2019-04-10

Similar Documents

Publication Publication Date Title
JP6500044B2 (ja) 生成装置、生成方法、及び生成プログラム
JP6759844B2 (ja) 画像を施設に対して関連付けるシステム、方法、プログラム及び装置
US10489688B2 (en) Personalized digital image aesthetics in a digital medium environment
CN107315759B (zh) 归类关键字的方法、装置和处理系统、分类模型生成方法
JP5454357B2 (ja) 情報処理装置および方法、並びに、プログラム
US9123259B2 (en) Discovering functional groups of an area
CN104699732B (zh) 形成用户简档的方法和信息处理设备
JP6911603B2 (ja) ユーザによって訪問される施設のカテゴリの予測モデルを生成する方法、プログラム、サーバ装置、及び処理装置
US20150371114A1 (en) Classifying and annotating images based on user context
JP6228151B2 (ja) 学習装置、学習方法、及び学習プログラム
JP2021119526A (ja) 生成装置、生成方法、及び生成プログラム
JP2018045361A (ja) 情報処理装置、情報処理方法、およびプログラム
JP6757276B2 (ja) 生成装置、生成方法、及び生成プログラム
JP2013109384A (ja) 情報提供装置
KR101441983B1 (ko) 사용자 프로파일 생성 장치 및 그 방법
JP6955392B2 (ja) 決定装置、決定方法、及び決定プログラム
CN107766881B (zh) 一种基于基础分类器的寻路方法、设备及存储设备
JP7132448B1 (ja) 提案装置、提案方法及び提案プログラム
JP6896594B2 (ja) 楽曲選択装置、楽曲選択方法及びプログラム
JP6353144B1 (ja) 予測装置、予測方法、及び予測プログラム
US20230215198A1 (en) Image based command classification and task engine for a computing system
JP2019036087A (ja) 生成装置、生成方法、生成プログラム、学習データ、及びモデル
JP6587660B2 (ja) 推定装置、推定方法、及び推定プログラム
JP2020035072A (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP7114352B2 (ja) 予測装置、予測方法、及び予測プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180626

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180809

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20181106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190123

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20190131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190318

R150 Certificate of patent or registration of utility model

Ref document number: 6500044

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250