JP6899805B2 - Characteristic estimation device, characteristic estimation method, characteristic estimation program, etc. - Google Patents
Characteristic estimation device, characteristic estimation method, characteristic estimation program, etc. Download PDFInfo
- Publication number
- JP6899805B2 JP6899805B2 JP2018173297A JP2018173297A JP6899805B2 JP 6899805 B2 JP6899805 B2 JP 6899805B2 JP 2018173297 A JP2018173297 A JP 2018173297A JP 2018173297 A JP2018173297 A JP 2018173297A JP 6899805 B2 JP6899805 B2 JP 6899805B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- characteristic
- behavior history
- behavior
- teacher
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 67
- 238000012549 training Methods 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 7
- 230000006399 behavior Effects 0.000 description 143
- 230000009471 action Effects 0.000 description 70
- 230000008569 process Effects 0.000 description 38
- 238000012795 verification Methods 0.000 description 27
- 230000008859 change Effects 0.000 description 18
- 238000012545 processing Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 15
- 230000006872 improvement Effects 0.000 description 15
- 238000003066 decision tree Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、ユーザの特性を推定する方法等の技術分野に関する。 The present invention relates to technical fields such as methods for estimating user characteristics.
従来から、インターネット等の通信ネットワークにおいて、多くのユーザを複数種類の特性の何れかに分類(セグメント化)し、分類されたユーザの特性に応じて情報を提供することが行われている。例えば、マーケティングの分野では、オピニオンリーダとしてイノベータと呼ばれる特性を持つユーザに訴求することが効果的であることが知られている。ユーザの特性を推定する手法として、ユーザに対してアンケートを行うことで推定する手法や、ユーザによる情報へのアクセス履歴を分析することで推定する手法等がある。特許文献1には、ユーザの特性を推定する手法が開示されている。具体的には、特許文献1の手法は、教師ユーザに対するアンケートの結果に基づいて特定された、教師ユーザの特性を目的変数とし、教師ユーザのアクセス履歴に基づいて生成された、教師ユーザの行動データを説明変数とする特性推定モデルを生成し、この特性推定モデルと推定ユーザの行動データとから推定ユーザの特性を推定するようになっている。
Conventionally, in a communication network such as the Internet, many users are classified (segmented) into any of a plurality of types of characteristics, and information is provided according to the characteristics of the classified users. For example, in the field of marketing, it is known that it is effective to appeal to users who have characteristics called innovators as opinion leaders. As a method of estimating the characteristics of a user, there are a method of estimating by conducting a questionnaire to the user, a method of estimating by analyzing the access history of information by the user, and the like.
しかしながら、特許文献1の技術では、特性判別に用いるアンケートの質問の基礎となる仮説との関係が不明であり、また、当該特性を判別するための仮説の妥当性を評価するという思想もない。
However, in the technique of
そこで、本発明は、上記点等に鑑みてなされたものであり、対象者のアンケート結果に基づいて実証的な特性推定を可能にした特性推定装置、特性推定方法、及び特性推定プログラム等を提供することを課題とする。 Therefore, the present invention has been made in view of the above points and the like, and provides a characteristic estimation device, a characteristic estimation method, a characteristic estimation program, etc. that enable empirical characteristic estimation based on the results of a questionnaire of a subject. The task is to do.
上記課題を解決するために、請求項1に記載の発明は、アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類する分類手段と、前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断する判断手段と、前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成する生成手段と、前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定する推定手段と、を備えることを特徴とする。
In order to solve the above problem, the invention according to
この発明によれば、対象者のアンケート結果に基づいて実証的な特性推定を行うことができる。 According to the present invention, empirical characteristic estimation can be performed based on the results of a questionnaire of the subject.
請求項2に記載の発明は、請求項1に記載の特性推定装置において、前記第2ユーザの行動履歴が更新された場合、前記推定手段は、当該更新された行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を再推定することにより更新することを特徴とする。
In the invention according to
この発明によれば、第2ユーザについて推定される特性を当該第2ユーザの行動履歴の変化に対応させることができる。 According to the present invention, the characteristics estimated for the second user can be made to correspond to the change in the behavior history of the second user.
請求項3に記載の発明は、請求項1または2に記載の特性推定装置において、前記第2ユーザの行動履歴が更新された場合、前記学習済みモデルにおける所定の分類基準において、推定された特性に属する前記第2ユーザの出現率が同等となる条件、および、推定された特性に属する前記第2ユーザが所定の一致度を有する条件、を満たすように、前記所定の分類基準を変更する変更手段を更に備えることを特徴とする。
The invention according to
この発明によれば、特性が推定された第2ユーザの行動履歴の変化に追従して、学習済みモデルによる推定精度を高めていくことができる。 According to the present invention, it is possible to improve the estimation accuracy by the trained model by following the change in the behavior history of the second user whose characteristics have been estimated.
請求項4に記載の発明は、請求項1乃至3のいずれか一項に記載の特性推定装置において、前記第1ユーザの行動履歴が更新されることで前記教師ユーザの行動履歴が更新された場合、当該更新された行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データを用いて前記学習済みモデルを更新する更新手段を更に備えることを特徴とする。
In the invention according to
この発明によれば、教師ユーザの行動履歴の変化に追従して、学習済みモデルによる推定精度を高めていくことができる。 According to the present invention, it is possible to improve the estimation accuracy by the trained model by following the change in the behavior history of the teacher user.
請求項5に記載の発明は、請求項4に記載の特性推定装置において、前記第1ユーザの行動履歴が更新されることで前記教師ユーザの行動履歴が更新された場合、前記判断手段は、当該更新された、前記教師ユーザの行動履歴が前記特性に関連して設定された基準を満たすか否かを判断することを特徴とする。 According to the fifth aspect of the present invention, in the characteristic estimation device according to the fourth aspect, when the action history of the teacher user is updated by updating the action history of the first user, the determination means may be used. It is characterized in that it is determined whether or not the updated behavior history of the teacher user meets the criteria set in relation to the characteristic.
この発明によれば、教師ユーザの行動履歴の変化に追従して、実証的な判断を含めて学習済みモデルによる推定精度を高めていくことができる。 According to the present invention, it is possible to improve the estimation accuracy by the trained model including the empirical judgment by following the change in the behavior history of the teacher user.
請求項6に記載の発明は、請求項1乃至5のいずれか一項に記載の特性推定装置において、前記生成手段は、前記行動履歴が前記基準を満たさないと判断された第1ユーザを教師ユーザとして採用しないことを特徴とする。
The invention described in
この発明によれば、推定により特定される拡張集合の基点となる教師データの段階からその実証性や客観性を確保維持することができる。 According to the present invention, the demonstrability and objectivity can be ensured and maintained from the stage of the teacher data which is the base point of the extension set specified by estimation.
請求項7に記載の発明は、請求項2に記載の特性推定装置において、前記第1ユーザの行動履歴が更新されることで前記教師ユーザの行動履歴が更新された場合、当該更新された行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データを用いて前記学習済みモデルを更新する更新手段を更に備え、前記学習済みモデルの更新間隔は、前記第2ユーザの特性の更新間隔よりも長いことを特徴とする。
The invention according to
この発明によれば、学習済みモデルの更新を最低限に留め、装置の負荷を低減することができる。 According to the present invention, it is possible to minimize the update of the trained model and reduce the load on the device.
請求項11に記載の発明は、コンピュータにより実行される特性推定方法であって、アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類するステップと、前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断するステップと、前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成するステップと、前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定するステップと、を含むことを特徴とする。
The invention according to
請求項12に記載の発明は、アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類するステップと、前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断するステップと、前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成するステップと、前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定するステップと、をコンピュータに実行させることを特徴とする。 The invention according to claim 12 is a step of classifying the first user into one of a plurality of preset characteristics based on the answers of the plurality of first users who responded to the questionnaire. The step of determining whether or not the behavior history of the first user satisfies the criteria set in relation to the characteristics based on the hypothesis common to the questionnaire, and the behavior history of the plurality of first users is said. A trained model learned by learning data with the first user determined to meet the criteria as the teacher user, the behavior information extracted from the behavior history of the teacher user as the explanatory variable, and the characteristics of the teacher user as the objective variable. And a step of estimating the characteristics of the second user using the behavior information extracted from the behavior history of the second user different from the first user and the learned model are executed on the computer. It is characterized by letting it.
本発明によれば、対象者のアンケート結果に基づいて実証的な特性推定を行うことができる。 According to the present invention, empirical characteristic estimation can be performed based on the results of a questionnaire of a subject.
以下、図面を参照して本発明の実施形態について説明する。なお、以下の実施形態においては、第1ユーザを対象ユーザと称し、第2ユーザを推定ユーザと称するものとする。対象ユーザとは、アンケートの対象者であり、後述する基準を満たす教師ユーザが含まれる。推定ユーザとは、対象ユーザとは異なるユーザであり、教師ユーザの教師データを用いて生成された学習済みモデルから特性が推定されるユーザである。なお、対象ユーザ及び推定ユーザは、それぞれのユーザに付与されたユーザID(識別情報)により識別される。以下の説明においては、対象ユーザ及び推定ユーザを総称して、単に、ユーザという場合がある。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In the following embodiment, the first user is referred to as a target user, and the second user is referred to as an estimated user. The target user is a target person of the questionnaire, and includes a teacher user who meets the criteria described later. The estimated user is a user different from the target user, and the characteristic is estimated from the trained model generated by using the teacher data of the teacher user. The target user and the estimated user are identified by the user ID (identification information) given to each user. In the following description, the target user and the estimated user may be collectively referred to as a user.
[1.特性推定装置の基本動作]
はじめに、図1を参照して、本発明に係る特性推定装置の基本動作について説明する。図1は、特性推定装置の基本動作を示す概念図であり、図2は、特性推定装置の基本動作の概念図である。
[1. Basic operation of the characteristic estimation device]
First, the basic operation of the characteristic estimation device according to the present invention will be described with reference to FIG. FIG. 1 is a conceptual diagram showing the basic operation of the characteristic estimation device, and FIG. 2 is a conceptual diagram of the basic operation of the characteristic estimation device.
図1及び図2に示すように、先ず、特性推定装置(分類手段)は、アンケート(質問調査)に回答した複数の対象ユーザのそれぞれの回答(アンケート結果)に基づいて、当該複数の対象ユーザを予め設定された複数の特性のうちのいずれかの特性に分類(セグメント化)する(フェーズF1)。ユーザの特性には、行動特性や市場における出現分布などに基づく仮説があり、アンケート結果に基づく特性分類は、対象ユーザの主観的、意識的な判断に基づく仮説検証ということができる。ユーザの特性の例として、イノベータ理論に沿った複数の特性(イノベータ、アーリーアダプタ、アーリーマジョリティ、レイトマジョリティ、及びラガード)が挙げられるが、これに限定されるものではなく、例えば、ユーザの人生における価値観等を考慮した特性を採用することができる。 As shown in FIGS. 1 and 2, first, the characteristic estimation device (classification means) is based on the respective answers (questionnaire results) of the plurality of target users who answered the questionnaire (questionnaire survey), and the plurality of target users. Is classified (segmented) into one of a plurality of preset characteristics (Phase F1). User characteristics include hypotheses based on behavioral characteristics and market appearance distribution, and characteristic classification based on questionnaire results can be said to be hypothesis verification based on the subjective and conscious judgment of the target user. Examples of user characteristics include, but are not limited to, multiple characteristics in line with innovator theory (innovators, early adopters, early majority, late majority, and lagard), for example, in the user's life. It is possible to adopt characteristics that take values into consideration.
次に、特性推定装置(判断手段)は、アンケートに回答した対象ユーザの行動履歴が所定の基準(客観的な基準)を満たすか否かを対象ユーザ毎に判断し、当該対象ユーザのうち行動履歴が上記基準を満たすと判断された対象ユーザを教師ユーザとして特定する(フェーズF2)。ここで、行動履歴は、対象ユーザの実際の行為に基づく客観的な事実(事象)を表すものである。教師ユーザの行動履歴から抽出される行動情報と教師ユーザの特性との組が、後述する学習済みモデルの生成にあたり教師データとして用いられる。上記基準は、例えば、アンケートと共通の仮説に基づき特性に関連して設定されるものであり、アンケートと関連する基準を含む。上記基準の例としては、新製品を予約注文しているかどうか、トレンド商品を購入または検索しているかどうか、などが挙げられる。教師データの作成過程において、アンケートに回答した対象ユーザの行動履歴(つまり、客観的な事実に基づくデータ)を用いることで、対象ユーザの意識に頼ることにより起こりうる不完全性、不確実性を補完することができる。例えば、「何月何日にWebサイトAを訪問したか」といった対象ユーザの記憶に頼った細かなデータの正確性に不安が残るという現象に基づく不確実性を、当該対象ユーザの行動履歴で補完することができる。これにより、正確性が担保された状態で活用可能な情報が増え、教師データの精度向上が期待できる。なお、当該基準は、当該基準のみにより行動履歴を検証することで特性を分類することも可能な基準である。 Next, the characteristic estimation device (judgment means) determines for each target user whether or not the behavior history of the target user who responded to the questionnaire meets a predetermined standard (objective standard), and acts among the target users. The target user whose history is determined to satisfy the above criteria is specified as a teacher user (Phase F2). Here, the action history represents an objective fact (event) based on the actual action of the target user. The set of the behavior information extracted from the behavior history of the teacher user and the characteristics of the teacher user is used as teacher data in generating the trained model described later. The above criteria are, for example, set in relation to characteristics based on a hypothesis common to the questionnaire, and include criteria related to the questionnaire. Examples of the above criteria include whether a new product is pre-ordered, whether a trending product is purchased or searched, and the like. In the process of creating teacher data, by using the behavior history of the target user who answered the questionnaire (that is, data based on objective facts), the incompleteness and uncertainty that can occur by relying on the consciousness of the target user can be determined. Can be complemented. For example, the behavior history of the target user can be used to describe the uncertainty based on the phenomenon that the accuracy of detailed data that relies on the memory of the target user, such as "what month and day the website A was visited," remains uncertain. Can be complemented. As a result, the amount of information that can be used while the accuracy is guaranteed increases, and the accuracy of teacher data can be expected to improve. In addition, the standard is a standard that can classify the characteristics by verifying the behavior history only by the standard.
行動履歴が上記基準を満たすか否かは、例えば、個々の事象から蓋然性の高い特性を導き出す帰納的な仮説検証項目群(アンケートと共通の仮説モデルに基づく検証項目群)を特性ごとに設定(仮説検証項目は特性間で重複してもよい)し、この項目群に対する該当率が所定の割合を超えたか否かを判断することにより行われるとよい。ここで、仮説検証項目群に対する該当率は、行動履歴から抽出された行動情報(購買データ等の実データ)に基づいて算出される。このような判断は、対象ユーザの客観的な事実に基づく仮説検証ということができる。そして、該当率が所定の割合を超えた対象ユーザが教師ユーザとして特定される。一方、該当率が所定の割合を超えない対象ユーザは教師ユーザとして採用されない。該当率が所定の割合を超えない場合には、アンケートによる主観的評価と客観的評価とが乖離している場合(即ち、仮説に合わない場合)のほかに、当該対象ユーザの購買データ等の実データが十分ではなく証明できないという場合が該当する。つまり、証明困難な場合にも、対象ユーザは教師ユーザとして採用されず、その対象ユーザの行動情報と特性との組は教師データから除外される。これらの処理により、推定により特定される拡張集合の基点となる教師データの段階からその実証性や客観性を確保維持でき、後段の推定時に実証性や客観性を踏まえた状態で推定処理を進めることができる。 Whether or not the behavior history meets the above criteria is determined, for example, by setting an inductive hypothesis verification item group (verification item group based on a hypothesis model common to the questionnaire) for each characteristic (a group of verification items based on a hypothesis model common to the questionnaire) that derives highly probable characteristics from individual events. Hypothesis verification items may overlap between characteristics), and it may be performed by determining whether or not the corresponding rate for this item group exceeds a predetermined ratio. Here, the corresponding rate for the hypothesis verification item group is calculated based on the behavior information (actual data such as purchase data) extracted from the behavior history. Such a judgment can be said to be a hypothesis verification based on the objective facts of the target user. Then, the target user whose corresponding rate exceeds a predetermined rate is specified as a teacher user. On the other hand, the target user whose corresponding rate does not exceed the predetermined rate is not adopted as the teacher user. If the applicable rate does not exceed the specified rate, in addition to the case where the subjective evaluation by the questionnaire and the objective evaluation are different (that is, when the hypothesis is not met), the purchase data of the target user, etc. This applies when the actual data is not sufficient and cannot be proved. That is, even when it is difficult to prove, the target user is not adopted as the teacher user, and the pair of the behavior information and the characteristic of the target user is excluded from the teacher data. By these processes, the demonstrability and objectivity can be secured and maintained from the stage of the teacher data which is the base point of the extended set specified by the estimation, and the estimation process proceeds in a state based on the demonstrability and objectivity at the time of the later estimation. be able to.
次に、特性推定装置(生成手段)は、基準を満たすと判断された対象ユーザを教師ユーザとし、教師ユーザの行動履歴から抽出された行動情報を説明変数とし、教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成する(フェーズF3)。つまり、特性推定装置は、教師ユーザの行動情報と特性とを教師データとして学習した学習済みモデルを生成する。これにより、対象ユーザの主観的な判断に基づく仮説検証と、対象ユーザの客観的な事実に基づく仮説検証を踏まえて実証的な特性推定を可能にする。 Next, the characteristic estimation device (generation means) uses the target user determined to meet the criteria as the teacher user, the behavior information extracted from the behavior history of the teacher user as the explanatory variable, and the characteristic of the teacher user as the objective variable. A trained model trained from the trained data is generated (Phase F3). That is, the characteristic estimation device generates a trained model in which the behavior information and characteristics of the teacher user are learned as teacher data. This enables hypothesis verification based on the subjective judgment of the target user and empirical characteristic estimation based on hypothesis verification based on the objective facts of the target user.
次に、特性推定装置(推定手段)は、推定ユーザの行動履歴から抽出された行動情報と学習済みモデルとを用いて当該推定ユーザの特性を推定(予測)する(フェーズF4)。つまり、推定ユーザの行動履歴から抽出された行動情報が、学習済みモデルに入力されることで推定ユーザの特性が出力される。学習済みモデルは、例えば、複数の特性のそれぞれを目的変数とし1つの行動情報を説明変数としてモデル化されているので、推定ユーザ一人について複数の目的変数のそれぞれのセグメントに対する当てはまり度が算出され、その中で最大当てはまり度を算出したセグメントが採用されて推定ユーザの特性が決定される。例えば、後述する図6において、最大当てはまり度を算出したセグメントSe1の特性01が推定ユーザの特性として決定される。 Next, the characteristic estimation device (estimating means) estimates (predicts) the characteristics of the estimated user using the behavior information extracted from the behavior history of the estimated user and the learned model (Phase F4). That is, the behavior information extracted from the behavior history of the estimated user is input to the trained model, and the characteristics of the estimated user are output. Since the trained model is modeled using, for example, each of a plurality of characteristics as an objective variable and one behavioral information as an explanatory variable, the degree of fit of the plurality of objective variables to each segment is calculated for each estimated user. Among them, the segment for which the maximum fit is calculated is adopted to determine the characteristics of the estimated user. For example, in FIG. 6, which will be described later, the characteristic 01 of the segment Se1 for which the maximum fit degree is calculated is determined as the characteristic of the estimated user.
[2.通信システムSの概要構成及び機能]
次に、図3を参照して、本発明が適用される通信システムSの概要構成について説明する。図3は、通信システムSの概要構成の一例を示す図である。
[2. Overview of communication system S Configuration and functions]
Next, with reference to FIG. 3, the outline configuration of the communication system S to which the present invention is applied will be described. FIG. 3 is a diagram showing an example of an outline configuration of the communication system S.
図3に示すように、通信システムSは、アンケート管理サーバ(リサーチサーバ)1、行動履歴管理サーバ2、及び特性推定サーバ3等を含んで構成される。アンケート管理サーバ1、及び行動履歴管理サーバ2は、それぞれ、特性推定サーバ3との間で、例えばイントラネットを介して通信可能になっている。なお、アンケート管理サーバ1、行動履歴管理サーバ2、及び特性推定サーバ3は、1つのサーバにより構成されてもよい。
As shown in FIG. 3, the communication system S includes a questionnaire management server (research server) 1, an action
(2−1.アンケート管理サーバ1)
アンケート管理サーバ1は、対象ユーザに対して実施されたアンケートの結果を管理するサーバである。例えば、アンケート管理サーバ1は、アンケートに係る質問情報を複数の対象ユーザのそれぞれのユーザ端末UTm(m=1,2,3・・・)へインターネット等の通信ネットワークNWを介して送信し、アンケートに係る回答情報をそれぞれのユーザ端末UTmから受信し、それぞれの回答情報が示す回答をアンケート結果として、それぞれの対象ユーザのユーザIDに対応付けてアンケートデータベース(DB)101に格納する。なお、ユーザ端末UTmには、対象ユーザに使用されるものと、推定ユーザに使用されるものとがある。ユーザ端末UTmの例として、パーソナルコンピュータ、スマートフォン、タブレット、及びゲーム機等が挙げられる。
(2-1. Questionnaire management server 1)
The
アンケートに係る質問情報及び回答情報は、電子メールで対象ユーザのユーザ端末UTmへ送信されてもよいし、対象ユーザのユーザ端末UTmのブラウザやアプリケーションによるリクエストに応じて当該ユーザ端末UTmへ送信されてもよい。アンケートに係る質問情報には、対象ユーザの特性を判別するための複数の質問(アンケートの質問事項(設問))及び各質問に対する回答の選択肢(アンケート選択肢であり、例えば、5つ)が記述されており、アンケートに係る回答情報には、各質問に対して選択された回答が記述されている。なお、アンケート管理サーバ1は、本発明に係る特性推定装置の分類手段の機能を有してもよい。
The question information and the answer information related to the questionnaire may be sent to the user terminal UTm of the target user by e-mail, or may be sent to the user terminal UTm in response to a request from the browser or application of the user terminal UTm of the target user. May be good. In the question information related to the questionnaire, a plurality of questions (questionnaire questions (questions)) for determining the characteristics of the target user and answer options (questionnaire options, for example, five) for each question are described. In the answer information related to the questionnaire, the answer selected for each question is described. The
(2−2.行動履歴管理サーバ2)
行動履歴管理サーバ2は、オンラインまたはオフラインでユーザにより行われた行動の履歴(行動履歴)を管理するサーバである。例えば、行動履歴管理サーバ2は、ユーザ端末UTmや処理端末STn(n=1,2,3・・・)から通信ネットワークNWを介してアクセス可能なサーバSAo(o=1,2,3・・・)から、それぞれのユーザ(対象ユーザ及び推定ユーザ)の行動履歴を収集し、それぞれの行動履歴をそれぞれのユーザのユーザIDに対応付けて行動履歴データベース201に格納する。なお、処理端末STnの例として、例えば店舗に設置され、ユーザが所持する決済用カード(例えば、電子マネー決済やクレジット決済等が可能なICカード等)またはユーザ端末UTm(例えば、電子マネー決済やクレジット決済等が可能な決済用アプリケーションが搭載されたスマートフォン等)と通信可能な決済処理端末が挙げられる。また、処理端末STnの例として、商品等の展示会やイベント等の会場に設置された入場処理端末が挙げられる。
(2-2. Behavior history management server 2)
The action
サーバSAoの例として、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、トラベル予約サーバ、テレビ視聴解析サーバ、決済処理サーバ、動画/楽曲ストリーミングサーバ、SNS(Social Networking Service)サーバ、チケット発行管理サーバ、及び実行動追跡サーバ等が挙げられる。ここで、より多くのサーバSAoから広く、ユーザの行動履歴を収集することができれば、学習済みモデルを用いた推定精度を向上させることが可能となる。そのため、ユーザを識別するユーザIDが、より多くのサーバSAo間で共通する、または関連付けるように構成することが望ましい。 Examples of server SAo include shopping server, free market server, auction server, travel reservation server, TV viewing analysis server, payment processing server, video / music streaming server, SNS (Social Networking Service) server, ticket issuance management server, and actual server. An action tracking server and the like can be mentioned. Here, if the user's behavior history can be widely collected from more servers SAo, it is possible to improve the estimation accuracy using the trained model. Therefore, it is desirable that the user ID that identifies the user is configured to be common or associated with more servers SAo.
行動履歴には、通信ネットワークNWを介してユーザがオンラインでおこなった行動(例えば、商品またはサービス等の検索、商品またはサービス等の閲覧、商品またはサービスに対する支払(購入)、商品またはサービス等に対する投稿等)の履歴ばかりでなく、ユーザが実店舗に赴いてオフラインでおこなった行動(例えば、商品やサービスに対する支払等)の履歴、さらにはユーザが商品等の展示会やイベント等に赴いて入場した行動の履歴等を含むとよい。行動履歴の例として、商品またはサービスの検索履歴、商品またはサービスの閲覧履歴、商品またはサービスのブックマーク登録履歴(お気に入り登録)、商品またはサービスの予約履歴(商品の場合、購入予約履歴)、商品またはサービスに対する支払履歴(商品の場合、購入履歴)、商品またはサービスに対するコメント(クチコミ)またはツイート等の投稿履歴、商品としての動画または楽曲の再生履歴、及び商品の展示会やイベント等の会場への入場履歴等が挙げられ、どの行動履歴が特性推定サーバ3により利用されるかは例えば管理者等により任意に設定される。
The action history includes actions performed online by the user via the communication network NW (for example, searching for a product or service, browsing a product or service, paying (purchasing) a product or service, posting a product or service, etc.). Etc.), as well as the history of actions that the user went to the actual store and performed offline (for example, payment for products and services), and the user went to an exhibition or event of the product etc. to enter. It is good to include the history of actions. Examples of behavior history are search history of goods or services, browsing history of goods or services, bookmark registration history of goods or services (favorite registration), reservation history of goods or services (purchase reservation history in the case of goods), goods or Payment history for services (purchase history in the case of products), posting history of comments (word-of-mouth) or tweets about products or services, playback history of videos or songs as products, and to venues such as product exhibitions and events The admission history and the like can be mentioned, and which action history is used by the
検索履歴及び閲覧履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、及びトラベル予約サーバに記憶される。検索履歴には、商品またはサービスの情報の公開日時(つまり、ユーザにより検索可能になった日時)、商品またはサービスの検索日時、検索条件(検索に用いられたキーワード)、及び検索対象の商品またはサービスの情報(例えば、ID、名称、カテゴリー、価格)等が含まれる。閲覧履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、及びトラベル予約サーバに記憶される。閲覧履歴には、商品またはサービスの情報の公開日時(つまり、ユーザにより閲覧可能になった日時)、商品またはサービスの閲覧日時、及び閲覧対象の商品またはサービスの情報(例えば、ID、名称、カテゴリー、価格)等が含まれる。 The search history and browsing history are stored in, for example, a shopping server, a flea market server, an auction server, and a travel reservation server. The search history includes the date and time when the information of the product or service was published (that is, the date and time when it became searchable by the user), the search date and time of the product or service, the search condition (keyword used for the search), and the product or the product to be searched. Service information (eg, ID, name, category, price) and the like are included. The browsing history is stored in, for example, a shopping server, a flea market server, an auction server, and a travel reservation server. The browsing history includes the publication date and time of the product or service information (that is, the date and time when the product or service became available for viewing), the browsing date and time of the product or service, and the information of the product or service to be browsed (for example, ID, name, category). , Price) etc. are included.
なお、閲覧履歴は、テレビ放送の電波受信によりテレビ画面に表示された商品またはサービスの閲覧履歴であってもよい。この場合、例えばユーザ端末UTm(例えば、スマートフォン)が搭載するマイクにより取得された音声データがテレビ視聴解析サーバにより取得される。そして、テレビ視聴解析サーバは、取得した音声データとオリジナル(マスタ)の音声データとを照合してユーザがどの時間の映像を視聴していたかを判定することで、商品またはサービスの閲覧日時、及び閲覧された商品またはサービスの情報を特定し、閲覧履歴として記憶する。或いは、テレビ画面にユーザへの選択ボタンの選択を促す情報を表示させ、例えばユーザ端末UTm(例えば、スマートフォン)に表示された選択ボタンがユーザにより押下されると、その押下信号がテレビ視聴解析サーバにより取得される。そして、テレビ視聴解析サーバは、取得した押下信号の取得日時からユーザがどの時間の映像を視聴していたかを判定することで、商品またはサービスの閲覧日時、及び閲覧された商品またはサービスの情報を特定し、閲覧履歴として記憶する。 The browsing history may be the browsing history of the product or service displayed on the TV screen by receiving the radio wave of the TV broadcast. In this case, for example, the audio data acquired by the microphone mounted on the user terminal UTm (for example, a smartphone) is acquired by the television viewing analysis server. Then, the TV viewing analysis server collates the acquired audio data with the original (master) audio data to determine at what time the user was watching the video, thereby determining the viewing date and time of the product or service, and the viewing date and time of the service. Identify the browsed product or service information and store it as a browsing history. Alternatively, when information prompting the user to select a selection button is displayed on the TV screen and the selection button displayed on the user terminal UTm (for example, a smartphone) is pressed by the user, the pressing signal is sent to the television viewing analysis server. Obtained by. Then, the TV viewing analysis server determines the viewing date and time of the product or service and the information of the viewed product or service by determining which time the user was watching the video from the acquisition date and time of the acquired pressing signal. Identify and store as browsing history.
ブックマーク登録履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、及びトラベル予約サーバに記憶される。ブックマーク登録履歴には、商品またはサービスの情報の公開日時、商品またはサービスのブックマーク登録日時、及びブックマーク登録対象の商品またはサービスの情報等が含まれる。予約履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、及びトラベル予約サーバに記憶される。予約履歴には、商品またはサービスの情報の公開日時、商品またはサービスの予約日時、及び予約対象の商品またはサービスの情報等が含まれる。支払履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、トラベル予約サーバ、及び決済処理サーバに記憶される。支払履歴には、商品またはサービスの情報の公開日時、商品またはサービスに対する支払日時、及び支払対象の商品またはサービスの情報等が含まれる。 The bookmark registration history is stored in, for example, a shopping server, a flea market server, an auction server, and a travel reservation server. The bookmark registration history includes the publication date and time of the product or service information, the bookmark registration date and time of the product or service, the information of the product or service to be bookmarked, and the like. The reservation history is stored in, for example, a shopping server, a flea market server, an auction server, and a travel reservation server. The reservation history includes the publication date and time of the product or service information, the reservation date and time of the product or service, the information of the product or service to be reserved, and the like. The payment history is stored in, for example, a shopping server, a flea market server, an auction server, a travel reservation server, and a payment processing server. The payment history includes the publication date and time of the information on the product or service, the payment date and time for the product or service, the information on the product or service to be paid, and the like.
投稿履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、トラベル予約サーバ、動画/楽曲ストリーミングサーバ、及びSNSサーバに記憶される。投稿履歴には、商品またはサービスの情報の公開日時、商品またはサービスに対するコメントまたはツイート等の投稿日時、投稿内容、投稿対象の商品またはサービスの情報等が含まれる。なお、投稿履歴には、投稿したユーザのフォロワー数が含まれるとよい。再生履歴は、例えば、動画/楽曲ストリーミングサーバに記憶される。再生履歴には、商品(動画または楽曲)の情報の公開日時、商品の再生日時、及び再生対象の商品の情報等が含まれる。 The posting history is stored in, for example, a shopping server, a flea market server, an auction server, a travel reservation server, a video / music streaming server, and an SNS server. The posting history includes the publication date and time of information on the product or service, the posting date and time of comments or tweets on the product or service, the content of the posting, information on the product or service to be posted, and the like. The posting history should include the number of followers of the user who posted. The playback history is stored in, for example, a video / music streaming server. The playback history includes the release date and time of the product (video or music) information, the playback date and time of the product, the information of the product to be played, and the like.
入場履歴は、例えば、チケット発行管理サーバに記憶される。入場履歴には、商品の展示会やイベント等の会場への入場日時、及び展示対象の商品の情報等が含まれる。例えば、チケット発行管理サーバにより発行されたチケットが会場に設置された処理端末STnにより検知されると、発行されたチケットの番号等がチケット発行管理サーバにより取得される。そして、チケット発行管理サーバは、取得したチケットの番号等の取得時刻から入場日時を判定し、当該チケットの番号等から展示対象の商品の情報を特定し、入場履歴として記憶する。 The admission history is stored in, for example, the ticket issuance management server. The admission history includes information on the date and time of admission to the venue such as an exhibition or event of the product, and information on the product to be exhibited. For example, when the ticket issued by the ticket issuance management server is detected by the processing terminal STn installed at the venue, the issued ticket number and the like are acquired by the ticket issuance management server. Then, the ticket issuance management server determines the admission date and time from the acquisition time of the acquired ticket number or the like, identifies the information of the product to be exhibited from the ticket number or the like, and stores it as the admission history.
なお、入場履歴は、実行動追跡サーバに記憶される場合もある。ユーザ端末UTmがGPS(Global Positioning System)機能、及びGPS機能により検出された位置情報(
緯度及び経度)を取得して実行動追跡サーバに送信するアプリケーションを搭載する場合、取得した位置情報を例えば所定時間間隔で実行動追跡サーバへ送信する。そして、実行動追跡サーバは、ユーザ端末UTmから受信した位置情報及び受信日時と、予め用意されたリストに記述される展示会やイベント等の会場の位置情報及び実施日時とを照合することで、ユーザが実際に当該会場に行ったと判定した場合、その会場への入場日時、及び展示対象の商品の情報等を含む入場履歴を記憶する。
The admission history may be stored in the execution behavior tracking server. Position information detected by the user terminal UTm by the GPS (Global Positioning System) function and the GPS function (
When an application that acquires (latitude and longitude) and sends it to the execution motion tracking server is installed, the acquired position information is transmitted to the execution motion tracking server, for example, at predetermined time intervals. Then, the execution motion tracking server collates the location information and the reception date and time received from the user terminal UTm with the location information and the implementation date and time of the venue such as an exhibition or event described in the list prepared in advance. When it is determined that the user has actually visited the venue, the admission history including the date and time of admission to the venue and information on the products to be exhibited is stored.
(2−3.特性推定サーバ3)
特性推定サーバ3は、単独で、またはアンケート管理サーバ1と共に、本発明に係る特性推定装置として機能するサーバである。図4(A)は、特性推定サーバ3のハードウェア構成例を示す図であり、図4(B)は、特性推定サーバ3のシステム制御部33の機能ブロック例を示す図である。なお、図示しないが、特性推定サーバ3にはオペレータの端末が接続可能になっている。
(2-3. Characteristic estimation server 3)
The
図4(A)に示すように、特性推定サーバ3は、通信部31、記憶部32、及びシステム制御部33等を備え、これらの構成要素はシステムバス34に接続されている。通信部31は、例えばイントラネットに接続され、アンケート管理サーバ1及び行動履歴管理サーバ2との間の通信状態の制御を行う。
As shown in FIG. 4A, the
記憶部32は、例えば、ハードディスクドライブ等により構成されており、OS及び本発明の特性推定プログラム等の各種プログラムを記憶する。なお、特性推定プログラムは、所定のサーバから特性推定サーバ3にダウンロードされてもよいし、CD、DVD、BDなどの記録媒体に記録(コンピュータにより読み取り可能に記録)されており、当該記録媒体から読み込まれて記憶部32に記憶されるようにしてもよい。
The
また、記憶部32には、ユーザ情報データベース301等が構築されている。図5は、ユーザ情報データベース301の内容の一例を示す図である。図5に示すユーザ情報データベース301には、例えば所定のサイトの利用会員としてアカウントが発行された各ユーザのユーザID、ユーザ名、ユーザ種別、及び特性等が対応付けられて格納されている。ここで、ユーザ種別は、教師ユーザであるか否かを示す(図中、“1”が教師ユーザを示す)。ユーザの特性は、5つの特性01〜05のうち何れかの特性が付与されている。なお、ユーザ情報データベース301において特性が空欄のユーザは、まだ特性が推定されていないユーザである。
Further, a
システム制御部33(本発明におけるコンピュータの一例)は、CPU(Central Processing Unit)33a,ROM(Read Only Memory)33b,及びRAM(Random Access
Memory)33c等を備え、OS上で特性推定プログラム等を実行する。システム制御部
33は、特性推定プログラムを実行することにより、図4(B)に示すように、対象ユーザ分類部331、教師ユーザ特定部332、モデル生成部333、特性推定部334、モデル更新部335、及び分類基準変更部336等として機能する。なお、対象ユーザ分類部331は、本発明における分類手段の一例である。教師ユーザ特定部332は、本発明における判断手段の一例である。モデル生成部333は、本発明における生成手段の一例である。特性推定部334は、本発明における推定手段の一例である。モデル更新部335は、本発明における更新手段の一例である。分類基準変更部336は、本発明における変更手段の一例である。
The system control unit 33 (an example of a computer in the present invention) includes a CPU (Central Processing Unit) 33a, a ROM (Read Only Memory) 33b, and a RAM (Random Access).
Memory) 33c and the like are provided, and a characteristic estimation program and the like are executed on the OS. By executing the characteristic estimation program, the
(2−3−1.対象ユーザ分類部331)
先ず、対象ユーザ分類部331は、アカウントが発行された全ユーザの中から決定された複数の対象ユーザ(つまり、全ユーザの中の一部のユーザ)のそれぞれに対するアンケートの結果をアンケート管理サーバ1のアンケートデータベース101から取得し、複数の対象ユーザのそれぞれの回答に基づいて、当該複数の対象ユーザを予め設定された複数の特性のうちのいずれかの特性に分類する。このような分類方法は種々考えられるが、例えば、質問に対する回答の選択肢と配点(得点の元になる点数)との対応関係を記述する回答配点表データと、合計得点(スコア)と特性との対応関係を記述する特性判別条件データ(換言すると、セグメント定義データ)とが用いられるとよい。
(2-3-1. Target user classification unit 331)
First, the target user classification unit 331 obtains the results of a questionnaire for each of a plurality of target users (that is, some users among all users) determined from all the users to whom the account has been issued. Based on the answers of the plurality of target users, the plurality of target users are classified into one of a plurality of preset characteristics. Various classification methods can be considered. For example, the answer score table data that describes the correspondence between the answer options for the question and the score (the score that is the basis of the score), and the total score (score) and the characteristics. Characteristic discrimination condition data (in other words, segment definition data) that describes the correspondence may be used.
一例として、回答配点表データでは、選択肢1(あてはまる)には+2点、選択肢2(まあまああてはまる)には+1点、選択肢3(どちらともいえない)には0点、選択肢4(あまりあてはまらない)には−1点、選択肢5(あてはまらない)には−2点、・・・というように対応付けられている。また、一例として、特性判別条件データでは、合計得点12点以上には特性C01(例えば、イノベータ)、合計得点5〜11には特性C02(例えば、アーリーアダプタ)、合計得点−2〜4には特性C03(例えば、アーリーマジョリティ)、・・・というように対応付けられている。 As an example, in the answer score table data, option 1 (applicable) has +2 points, option 2 (somewhat applicable) has +1 point, option 3 (neither can be said) has 0 points, and option 4 (not very applicable). ) Is associated with -1 point, option 5 (not applicable) is associated with -2 points, and so on. Further, as an example, in the characteristic discrimination condition data, the characteristic C01 (for example, an innovator) has a total score of 12 points or more, the characteristic C02 (for example, an early adopter) has a total score of 5 to 11, and the total score of 2 to 4 has a characteristic C02 (for example, an early adopter). The characteristics C03 (for example, early majority), ... Are associated with each other.
例えば、対象ユーザ分類部331は、上記回答配点表データを参照することで、各質問に対する回答(何れかの選択肢)に対応する得点を質問毎に決定し、決定した各得点を全質問について合計することで合計得点を算出(対象ユーザ毎に算出)する。そして、対象ユーザ分類部331は、特性判別条件データを参照し、算出した合計得点に対応する特性を対象ユーザに付与することで、当該複数の対象ユーザを複数の特性のうちのいずれかの特性に分類(対象ユーザ毎に分類)する。こうして、対象ユーザに付与された特性は、当該対象ユーザのユーザIDに対応付けられてユーザ情報データベース301に格納されることになる。
For example, the target user classification unit 331 determines the score corresponding to the answer (any option) to each question for each question by referring to the above answer score table data, and totals each determined score for all the questions. By doing so, the total score is calculated (calculated for each target user). Then, the target user classification unit 331 refers to the characteristic discrimination condition data and assigns the characteristic corresponding to the calculated total score to the target user, thereby assigning the plurality of target users to any one of the plurality of characteristics. (Classify by target user). In this way, the characteristics given to the target user are stored in the
なお、アンケート管理サーバ1が複数の対象ユーザのそれぞれの回答に基づいて、当該複数の対象ユーザを予め設定された複数の特性のうちのいずれかの特性に分類してもよい。この場合、対象ユーザ分類部331は、対象ユーザ(ユーザID)と特性との対応関係を示す情報をアンケート管理サーバ1から取得することになる。
The
(2−3−2.教師ユーザ特定部332)
次に、教師ユーザ特定部332は、複数の対象ユーザのそれぞれの行動履歴を行動履歴管理サーバ2の行動履歴データベース201から取得し、取得した行動履歴がアンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを対象ユーザ毎に判断し、当該対象ユーザのうち行動履歴が上記基準を満たすと判断された対象ユーザを教師ユーザとして特定する。ここで、「特性に関連して設定された基準」には、「特性ごとに設定された基準」、「特性を横断した連続性を有する基準」、及び「ユーザ全体の行動履歴に基づく行動分布と特性との対応関係を示す基準」のうち、少なくとも何れか一つが含まれる。特性ごとに設定された基準を満たすか否かの判断には、例えば、アンケートの質問事項や回答の選択肢に使われる用語と共通する属性の情報(商品名やサービス名など)を検索しているか、当該情報における商品を購買しているか、当該情報におけるサービスを利用しているか、または、商品名やサービス名だけでなく、共通のブランド、店舗を含む検索、これに関わる行動(購買行動や利用行動など)をしているか、を判断することを含むとよい。さらに、この基準を満たすか否かの判断には、アンケートの質問事項等に関連する地域や時期の検索、当該地域や時期に行動(購買行動や利用行動など)をしているかを判断することを含むとよい。
(2-3-2. Teacher user identification unit 332)
Next, the teacher
また、特性を横断した連続性を有する基準を満たすか否かの判断の例として、特定の商品(例えば、トレンド商品)が一般公開されてから対象ユーザがそのウェブページにアクセスするまでの時間(アクセスタイミング)に基づいて、当該公開から例えば3日以内に上記ウェブページにアクセスしていたのか(この場合、特性01に該当)、或いは、4日以降かつ14日以内に上記ウェブページにアクセスしていたのか(この場合、特性02に該当)、を判断することが挙げられる。この場合、例えば、特性01に分類された対象ユーザが、4日以降かつ14日以内に上記ウェブページにアクセスしていた場合、当該基準を満たさないとして教師ユーザから除外される。また、ユーザ全体の行動履歴に基づく行動分布(換言すると、実行動データ集合の分布)と特性との対応関係を示す基準の例として、ある分野(例えば、自動車分野)のソーシャルメディアのアクセスログの全体分布(行動分布)において特性01から特性05の中で、特性01や特性02は特性04や特性05よりも当該分野のソーシャルメディアにおける情報発信量や情報受信量が多いという基準が挙げられる。この場合、例えば、アンケートにより特性01に分類された対象ユーザの情報発信量が当該ソーシャルメディアのアクセスログの全体分布のうち、下位レベル(例えば、平均以下の分布層)に含まれる場合、当該基準を満たさないとして教師ユーザから除外される。
In addition, as an example of determining whether or not a criterion having continuity across characteristics is satisfied, the time from when a specific product (for example, a trend product) is opened to the public until the target user accesses the web page ( Based on the access timing), did you access the above web page within 3 days from the publication (in this case, it corresponds to characteristic 01), or accessed the above web page after 4 days and within 14 days. It is possible to judge whether or not it was (in this case, it corresponds to the characteristic 02). In this case, for example, if the target user classified into the characteristic 01 accesses the web page after 4 days and within 14 days, the target user is excluded from the teacher user because it does not satisfy the criteria. In addition, as an example of a standard showing the correspondence between the behavior distribution (in other words, the distribution of the execution dynamic data set) based on the behavior history of the entire user and the characteristics, the access log of social media in a certain field (for example, the automobile field) Among the
教師ユーザを特定するための好適な例として、教師ユーザ特定部332は、個々の事象から蓋然性の高い特性を導き出す帰納的な仮説検証項目群を特性ごとに設定(仮説検証項目は特性間で重複してもよい)し、対象ユーザの行動履歴から抽出された行動情報に基づいて、当該仮説検証項目群に対する該当率が所定の割合を超えたか否かを判断し、当該該当率が所定の割合を超えた対象ユーザ(つまり、基準を満たすと判断された対象ユーザ)を教師ユーザとして特定するとよい。ここで、仮説検証項目群に対する該当率は、例えば、複数の仮説検証項目のそれぞれに対する該当有無(該当するか否か)を対象ユーザの行動履歴に基づいて算出した結果に基づく(=該当数/仮説検証項目の総数)。仮説検証項目群は、アンケートと共通の仮説に基づき特性ごとに設定されるものであり、例えば、アンケートの質問及び回答の選択肢に対応し、アンケートの質問及び回答の選択肢を補完する項目群とするとよい。これにより、例えば、あるトレンド商品や新製品を購入した対象ユーザがアンケート結果に基づき特性01と判別されたときに、その対象ユーザについての仮説検証項目群に対する該当率から当該特性01の確からしさを判断(換言すると、特性01であることを実証)することができる。例えば、特定の商品(例えば、新製品)またはサービスの予約注文の有無、特定の商品(例えば、トレンド商品)またはサービスの検索または閲覧の有無、特定の商品(例えば、トレンド商品)の購入の有無、特定のサービスの利用の有無、公開された情報(例えば、特定の商品またはサービスの情報)へのユーザのアクセスタイミング、公開された情報(例えば、特定の商品またはサービスの情報)に対するユーザの情報発信量、及び公開された情報に対するユーザの行動力(例えば、特定の商品の展示会やイベント等の会場へ行ったか否か)などに基づいて仮説検証項目群が設定される。
As a preferred example for identifying a teacher user, the teacher
ここで、情報発信量とは、例えば、コメント(またはツイート)の投稿数と、1コメント(または1ツイート)あたりのデータ量(文字数でもよい)とのうちの少なくとも何れか一方である。また、アクセスタイミングは、例えば、情報(例えば、商品またはサービスの情報)が公開された日から3日以内までのアクセス、情報が公開された日から4日〜14日までのアクセス、・・・というように複数段階に分けることができる。情報発信量は、公開された情報に対するコメント投稿数100件以上(または、1コメントあたりの文字数が300文字以上)、公開された情報に対するコメント投稿数60件〜99件(または、1コメントあたりの文字数が100〜299文字)、・・・というように複数段階に分けることができる。教師ユーザ特定部332は、ユーザのフォロワー数に基づいて仮説検証項目群を設定してもよい。なお、前述の基準を用いることにより、特性推定サーバ3は、特性を横断した連続性を有する仮説検証項目(例えば、アクセスタイミング)における複数段階のうち、どの段階に該当するかを対象ユーザの行動履歴に基づいて判断し、当該判断された段階(例えば、公開された日から3日以内までのアクセス)と、アンケート結果に基づき分類された当該対象ユーザの特性と、が関連(または合致)する場合に当該対象ユーザを教師ユーザとして特定してもよい。また、特性推定サーバ3は、ユーザ全体の行動履歴に基づく行動分布と特性との対応関係を示す仮説検証項目において、当該行動分布中のどのレベルに該当するかを対象ユーザの行動履歴に基づいて判断し、当該判断されたレベル(例えば、下位レベル)と、アンケート結果に基づき分類された当該対象ユーザの特性と、が関連(または合致)する場合に当該対象ユーザを教師ユーザとして特定してもよい。
Here, the amount of information transmission is, for example, at least one of the number of comments (or tweets) posted and the amount of data (or the number of characters) per comment (or tweet). The access timing is, for example, access within 3 days from the date when the information (for example, product or service information) is published, access from the date when the information is published to 4 to 14 days, ... It can be divided into multiple stages. The amount of information sent is 100 or more comments posted for published information (or 300 characters or more per comment), and 60 to 99 comments posted for published information (or per comment). The number of characters is 100 to 299 characters), and so on, and it can be divided into a plurality of stages. The teacher
(2−3−3.モデル生成部333)
次に、モデル生成部333は、教師ユーザ特定部332により特定された教師ユーザの行動履歴から抽出された行動情報を説明変数とし、教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成する。ここで、行動情報は、例えば複数項目のデータを設定可能なデータフォーマットに行動履歴から抽出されたデータを設定することで得られる。この項目の例として、特定の商品またはサービスの予約注文の有無、特定の商品またはサービスの検索または閲覧の有無、特定の商品の購入の有無、特定のサービスの利用の有無、検索回数(または検索頻度)、検索条件、閲覧回数(または閲覧頻度)、支払回数(または支払頻度)、投稿回数(投稿頻度)、アクセスタイミング、情報発信量などが挙げられる。
(2-3-3. Model generation unit 333)
Next, the model generation unit 333 has learned by using the behavior information extracted from the behavior history of the teacher user specified by the teacher
学習済みモデルには、例えば、決定木が採用される。決定木とは、所定の分岐ルール(分類基準の一例)にしたがって条件分岐によりセグメントを分割して分類する手法である。このような決定木において、複数の目的変数のそれぞれのセグメントに対する当てはまり度が算出される。図6は、決定木における条件分岐の例を示す概念図である。図6に示すセグメント内には、それぞれの特性と特定された人数の割合(出現率)を示している。図6に示すセグメントSe1及びSe2内の“x”,“xx”は、それぞれ、数値を示しており、“x”よりも“xx”の方が大きい数値であることを示す。 For the trained model, for example, a decision tree is adopted. The decision tree is a method of dividing and classifying segments by conditional branching according to a predetermined branching rule (an example of a classification standard). In such a decision tree, the degree of fit of a plurality of objective variables for each segment is calculated. FIG. 6 is a conceptual diagram showing an example of conditional branching in a decision tree. In the segment shown in FIG. 6, each characteristic and the ratio (appearance rate) of the specified number of people are shown. “X” and “xx” in the segments Se1 and Se2 shown in FIG. 6 indicate numerical values, respectively, and indicate that “xx” is a larger numerical value than “x”.
例えば、アンケートにより分類された教師データは、特性01〜特性05に分類され、それぞれの特性について人数の割合(出現率)が特定される。この集合が、様々な説明変数を用いて目的変数とする特性毎に分類される。ここでは、例えば、商品ABCの購入(X1)、商品XYZの購入(X2)、所定のトレンドを表現するキーワードの検索(X3)、を含む項目が説明変数となる分岐ルールが設定されたことになる。これらを説明変数として決定木を用いて分類していくと、例えば、セグメントSe1は一つの特性01の出現率xxが規定値yy以上になったことを示す。この場合の説明変数は分岐ルールを参照するとX1とX2となる。このように、一つの目的変数である特性01の当てはまり度が所定の基準以上となるように分岐ルールが設定され、説明変数X1、X2を用いた分類として特定される。同様に、セグメントSe2は特性02の出現率xxが規定以上となるような分岐ルールにより説明変数X1、X2、X3とした特性02の集合として特定される。
For example, the teacher data classified by the questionnaire is classified into characteristic 01 to characteristic 05, and the ratio of the number of people (appearance rate) is specified for each characteristic. This set is classified according to the characteristics that are the objective variables using various explanatory variables. Here, for example, a branch rule has been set in which items including items including purchase of product ABC (X1), purchase of product XYZ (X2), and search for a keyword expressing a predetermined trend (X3) are set as explanatory variables. Become. When these are classified using a decision tree as an explanatory variable, for example, the segment Se1 shows that the appearance rate xx of one characteristic 01 is equal to or higher than the specified value yy. The explanatory variables in this case are X1 and X2 when referring to the branch rule. In this way, the branching rule is set so that the degree of fit of the characteristic 01, which is one objective variable, is equal to or higher than a predetermined reference, and the classification is specified as the classification using the explanatory variables X1 and X2. Similarly, the segment Se2 is specified as a set of
なお、学習済みモデルの生成において、複数の教師ユーザのそれぞれの教師データのうち、一部の教師データをトレーニングデータとして学習済みモデルを構築し、残りの一部をテストデータとして学習済みモデルの検証を行うとよい。また、学習済みモデルを生成するための教師有りの機械学習のアルゴリズムは、特に限定されるものではないが、例えば、勾配ブースティング(Gradient Boosting)、または勾配ブースティングとランダム
フォレスト(Random Forests)を組み合わせたXGBoostが用いられてもよい。勾配ブース
ティングは、複数の決定木を作成して集団で学習させる方法であり、学習済みモデルとして複数の決定木を構築し、1つ前までの決定木の情報を用いて新たな決定木を構築していくブースティングを行うようになっている。具体的には、1つ前の決定木では予測できなかった損失関数の勾配を目的変数として新たな決定木が構築される。各決定木において、説明変数は根から枝に行く途中で条件により分類され、末端の葉に辿り着くと、当該末端の葉に与えられた値が予測値として返されるようになっている。XGBoostは、勾配ブース
ティングの方法と基本的には同じであるが、ランダムフォレストを採用しているため、全ての説明変数が使用されるのではなく、ランダムに決定された割合で説明変数の数が選定されて決定木が構築される。
In the generation of the trained model, of the teacher data of each of the plurality of teacher users, a trained model is constructed using some teacher data as training data, and the remaining part is used as test data to verify the trained model. It is good to do. Also, the supervised machine learning algorithms for generating trained models are not particularly limited, but for example, Gradient Boosting, or Gradient Boosting and Random Forests. The combined XG Boost may be used. Gradient boosting is a method of creating multiple decision trees and training them in a group. It constructs multiple decision trees as a trained model and uses the information of the previous decision tree to create a new decision tree. It is designed to be boosted to build. Specifically, a new decision tree is constructed with the gradient of the loss function, which could not be predicted by the previous decision tree, as the objective variable. In each decision tree, the explanatory variables are classified according to the conditions on the way from the root to the branch, and when the terminal leaf is reached, the value given to the terminal leaf is returned as a predicted value. XGBoost is basically the same as the gradient boosting method, but because it uses a random forest, not all explanatory variables are used, but the number of explanatory variables at a randomly determined rate. Is selected and a decision tree is constructed.
(2−3−4.特性推定部334)
次に、特性推定部334は、例えば所定のサイトの利用会員としてアカウントが発行された全ユーザの中から推定対象として決定された推定ユーザ(教師ユーザ以外のユーザ)の行動履歴を行動履歴管理サーバ2の行動履歴データベース201から取得し、取得した行動履歴から抽出された行動情報と、モデル生成部333により生成された学習済みモデルとを用いて、当該推定ユーザの特性を推定する。すなわち、特性推定部334は、行動履歴から抽出された行動情報を学習済みモデルに入力することで当該行動情報に対する特性(予測値)を得る。こうして推定ユーザについて推定された特性は、当該推定ユーザのユーザIDに対応付けられてユーザ情報データベース301に格納されることになる。なお、推定ユーザの行動履歴が更新された場合、特性推定部334は、当該更新された行動履歴から抽出された行動情報と、学習済みモデルとを用いて当該推定ユーザの特性を再推定することにより更新するとよい。これにより、推定ユーザついて推定される特性を当該推定ユーザの行動履歴の変化に対応させることができる。
(2-3-4. Characteristic estimation unit 334)
Next, the
(2−3−5.モデル更新部335)
対象ユーザの行動履歴が更新されることで教師ユーザの行動履歴が更新された場合、モデル更新部335は、当該更新された行動履歴から抽出された行動情報を説明変数とし、教師ユーザの特性を目的変数とした学習データを用いて学習済みモデル(学習済みモデルにおける係数(パラメータ))を更新する。これにより、例えば所定期間毎に変化するトレンド(流行)等に応じて学習済みモデルを更新することができる。この場合において、教師ユーザ特定部332は、更新された、教師ユーザの行動履歴が上記基準を満たすか否かを判断し、モデル更新部335は、当該基準を満たすと判断された教師ユーザの更新された行動履歴から抽出された行動情報を説明変数とし、当該教師ユーザの特性を目的変数とした学習データを用いて学習済みモデルを更新するとよい。これにより、教師ユーザの行動履歴の変化に追従して、学習済みモデルによる推定精度を高めていくことができる。
(2-3-5. Model update unit 335)
When the behavior history of the teacher user is updated by updating the behavior history of the target user, the model update unit 335 uses the behavior information extracted from the updated behavior history as an explanatory variable and sets the characteristics of the teacher user. The trained model (factor (parameter) in the trained model) is updated using the training data used as the objective variable. As a result, the trained model can be updated according to, for example, a trend (trend) that changes at predetermined intervals. In this case, the teacher
また、教師ユーザの行動履歴が更新されることによる学習済みモデルの更新間隔は、推定ユーザの特性の更新(再推定)間隔よりも長くなるようにするとよい。これにより、教師ユーザの行動履歴が更新されることによる学習済みモデルの更新を最低限に留め、サーバ負荷を低減することができる。なお、モデル更新部335は、推定ユーザの特性が推定された場合、当該推定ユーザの行動履歴から抽出された行動情報を説明変数とし、当該推定ユーザの推定された特性を目的変数とした学習データを用いて学習済みモデルを更新してもよい。 Further, the update interval of the trained model due to the update of the behavior history of the teacher user may be longer than the update (re-estimation) interval of the characteristics of the estimated user. As a result, the update of the trained model due to the update of the behavior history of the teacher user can be minimized, and the server load can be reduced. When the characteristics of the estimated user are estimated, the model update unit 335 uses the behavior information extracted from the behavior history of the estimated user as an explanatory variable, and the learning data using the estimated characteristics of the estimated user as an objective variable. The trained model may be updated using.
(2−3−6.分類基準変更部336)
推定ユーザの行動履歴が更新された場合、分類基準変更部336は、上記学習済みモデルにおける所定の分岐ルールにおいて、推定された特性に属する推定ユーザの出現率が同等となる条件、および、推定された特性に属する推定ユーザが所定の一致度を有する条件、を満たすように、当該分岐ルールを変更する。この理由を以下に説明する。
(2-3-6. Classification Criteria Change Unit 336)
When the behavior history of the estimated user is updated, the classification standard changing unit 336 sets the condition that the appearance rate of the estimated user belonging to the estimated characteristic is the same in the predetermined branching rule in the trained model, and is estimated. The branching rule is modified so that the presumed user belonging to the above characteristic satisfies the condition that the estimated user has a predetermined degree of matching. The reason for this will be explained below.
推定ユーザの行動履歴が変化することにより、例えば、図6に示す「商品XYZ」を購入
した人数が増えると、分岐ルールでは、特性01の出現率(例えば、10%)が増加してしまう。そのため、特性01の出現率が例えば10%で同等に維持されるよう(つまり、推定
された特性に属する推定ユーザの出現率が同等となる条件を満たすよう)、分岐ルールを変更する(この変更は、学習済みモデルの変更に相当)。分岐ルールを変更の例として、説明変数の「商品XYZ」購入(X2)の重み付け(係数)を変えること、説明変数の「商品XYZ」購入(X2)を「商品ABC」購入(X1)に入れ替えること、「商品ABC」購入(X1)の分岐を新たに追加すること、などの分岐構成を変えることが挙げられる。言い換えれば、推定ユーザの行動履歴が変更されると、学習済みモデルの変数構成や重みづけが変わるので、その変更を加味して全体最適なモデルを作り直す。
As the behavior history of the estimated user changes, for example, when the number of people who purchase the "product XYZ" shown in FIG. 6 increases, the appearance rate of the characteristic 01 (for example, 10%) increases in the branch rule. Therefore, the branching rule is changed so that the appearance rate of the characteristic 01 is maintained at the same level, for example, at 10% (that is, the appearance rate of the estimated users belonging to the estimated characteristics is satisfied). Equivalent to changing the trained model). As an example of changing the branching rule, change the weighting (coefficient) of the explanatory variable "product XYZ" purchase (X2), and replace the explanatory variable "product XYZ" purchase (X2) with "product ABC" purchase (X1). That, adding a new branch for purchasing "Product ABC" (X1), and changing the branch configuration. In other words, when the behavior history of the estimated user is changed, the variable configuration and weighting of the trained model change, so the change is taken into consideration to recreate the overall optimal model.
しかし、出現率を同等に維持するだけでは全く違う分類になってしまうことが想定されるので、制約条件として、学習済みモデルの変更前後で個々の推定ユーザが他の特性に移ってしまう割合を低く設定(例えば、学習済みモデルの変更前後の一致度を9割以上に設定)する(つまり、推定された特性に属する推定ユーザが所定の一致度を有する条件を満たすように設定する)。これにより、特性が推定された推定ユーザの行動履歴の変化に追従して、学習済みモデルによる推定精度を高めていくことができる。 However, it is assumed that the classification will be completely different if the appearance rates are kept the same, so as a constraint condition, the rate at which each estimated user shifts to another characteristic before and after the change of the trained model is set. Set low (for example, set the degree of matching before and after the change of the trained model to 90% or more) (that is, set so that the estimated user belonging to the estimated characteristic satisfies the condition having a predetermined degree of matching). As a result, it is possible to improve the estimation accuracy by the trained model by following the change in the behavior history of the estimated user whose characteristics have been estimated.
なお、推定ユーザの行動履歴が更新されることによる(分類基準変更部336による)学習済みモデルの変更間隔は、教師ユーザの行動履歴が更新されることによる(モデル更新部335による)学習済みモデルの更新間隔よりも短くなるようにするとよい。これにより、教師ユーザの行動履歴が更新されることによる学習済みモデルの更新を最低限に留め、サーバ負荷を低減することができる。 The change interval of the trained model due to the update of the behavior history of the estimated user (according to the classification standard change unit 336) is the trained model due to the update of the behavior history of the teacher user (according to the model update unit 335). It is better to make it shorter than the update interval of. As a result, the update of the trained model due to the update of the behavior history of the teacher user can be minimized, and the server load can be reduced.
[3.特性推定サーバ3の各種処理]
次に、特性推定サーバ3のシステム制御部33により実行される各種処理について説明する。
[3. Various processes of the characteristic estimation server 3]
Next, various processes executed by the
(3−1.学習済みモデル生成処理)
先ず、図7を参照して、システム制御部33により実行される学習済みモデル生成処理について説明する。図7は、システム制御部33により実行される学習済みモデル生成処理の一例を示すフローチャートである。
(3-1. Trained model generation process)
First, the trained model generation process executed by the
図7に示す学習済みモデル生成処理は、例えばオペレータからの指示に応じて開始される。図7に示す処理が開始されると、システム制御部33は、ユーザ情報データベース301から特定可能な複数の対象ユーザ(予め決定された複数の対象ユーザ)のそれぞれのアンケート結果をアンケート管理サーバ1のアンケートデータベース101から取得する(ステップS1)。例えば、システム制御部33は、それぞれの対象ユーザのユーザID(またはユーザ名)が記述された対象ユーザリストを含む要求をアンケート管理サーバ1へ送信することで、それぞれの対象ユーザのアンケート結果をアンケート管理サーバ1から取得する。こうして取得されたアンケート結果は、例えば、それぞれの対象ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。
The trained model generation process shown in FIG. 7 is started in response to an instruction from an operator, for example. When the process shown in FIG. 7 is started, the
次いで、システム制御部33は、上記複数の対象ユーザのそれぞれの行動履歴を行動履歴管理サーバ2の行動履歴データベース201から取得する(ステップS2)。例えば、システム制御部33は、上記対象ユーザリストを含む要求を行動履歴管理サーバ2へ送信することで、それぞれの対象ユーザの行動履歴を行動履歴管理サーバ2から取得する。こうして取得された行動履歴は、例えば、それぞれの対象ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。
Next, the
次いで、システム制御部33は、アンケート結果及び行動履歴が取得された対象ユーザの中から対象ユーザを1人選定(例えば、ユーザIDまたはユーザ名により選定)する(ステップS3)。
Next, the
次いで、システム制御部33(対象ユーザ分類部331)は、ステップS3で選定された対象ユーザのアンケート結果(回答)に基づいて、当該対象ユーザが予め設定された複数の特性のうちのいずれかの特性に分類されるかを特定する(ステップS4)。これにより特定された特性は、例えば、当該対象ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。 Next, the system control unit 33 (target user classification unit 331) has one of a plurality of characteristics preset by the target user based on the questionnaire result (answer) of the target user selected in step S3. It is specified whether it is classified into a characteristic (step S4). The characteristics identified by this are stored in the memory in association with, for example, the user ID (or user name) of the target user.
次いで、システム制御部33(教師ユーザ特定部332)は、ステップS3で選定された対象ユーザの行動履歴がアンケートと共通の仮説に基づき設定された基準を満たすか否かを判断する(ステップS5)。システム制御部33(教師ユーザ特定部332)は、当該対象ユーザの行動履歴が当該基準を満たすと判断した場合(ステップS5:YES)、当該対象ユーザを教師ユーザとして特定し(ステップS6)、ステップS7へ進む。こうして教師ユーザとして特定された対象ユーザのユーザID(またはユーザ名)に対応付けられて、教師ユーザを示すユーザ種別がメモリに記憶される。一方、システム制御部33(教師ユーザ特定部332)は、当該対象ユーザの行動履歴が当該基準を満たさないと判断した場合(ステップS5:NO)、当該対象ユーザを教師ユーザとして特定せずにステップS7へ進む。
Next, the system control unit 33 (teacher user identification unit 332) determines whether or not the behavior history of the target user selected in step S3 satisfies the criteria set based on the hypothesis common to the questionnaire (step S5). .. When the system control unit 33 (teacher user identification unit 332) determines that the behavior history of the target user satisfies the criterion (step S5: YES), the
ステップS7では、システム制御部33は、アンケート結果及び行動履歴が取得された対象ユーザのうち、まだ選定されていない対象ユーザがあるか否かを判定する。システム制御部33は、まだ選定されていない対象ユーザがあると判定した場合には(ステップS7:YES)、ステップS3へ戻り、上記と同様の処理を行う。一方、システム制御部33は、まだ選定されていない対象ユーザがないと判定した場合には(ステップS7:NO)、ステップS8へ進む。
In step S7, the
ステップS8では、システム制御部33(モデル生成部333)は、ステップS6で特定された教師ユーザのそれぞれの行動履歴から抽出された行動情報を説明変数とし、ステップS6で特定された教師ユーザのそれぞれの特性を目的変数とした学習データにより学習した学習済みモデルを生成する。こうして生成された学習済みモデルは、後述する特性推定処理において用いられる。 In step S8, the system control unit 33 (model generation unit 333) uses the action information extracted from each action history of the teacher user specified in step S6 as an explanatory variable, and each of the teacher users specified in step S6. A trained model trained by training data with the characteristics of is used as the objective variable is generated. The trained model generated in this way is used in the characteristic estimation process described later.
次いで、システム制御部33は、それぞれの対象ユーザについてステップS4で特定された特性を、それぞれの対象ユーザのユーザIDに対応付けてユーザ情報データベース301に格納し、さらに、ステップS6で教師ユーザとして特定された対象ユーザについては、教師ユーザを示すユーザ種別を、当該対象ユーザのユーザID(またはユーザ名)に対応付けてユーザ情報データベース301に格納し(ステップS9)、図7に示す処理を終了する。
Next, the
なお、学習済みモデル生成処理は、対象ユーザに対して新たにアンケートが実施された場合、再び実行されることになる。 The trained model generation process will be executed again when a new questionnaire is conducted for the target user.
(3−2.特性推定処理)
次に、図8を参照して、システム制御部33により実行される特性推定処理について説明する。図8は、システム制御部33により実行される特性推定処理の一例を示すフローチャートである。
(3-2. Characteristic estimation processing)
Next, the characteristic estimation process executed by the
図8に示す特性推定処理は、例えばオペレータからの指示に応じて開始される。図8に示す処理が開始されると、システム制御部33は、ユーザ情報データベース301から特定可能な1以上の推定ユーザ(例えば、特性がまだ推定されていない1以上の推定ユーザ)の行動履歴を行動履歴管理サーバ2の行動履歴データベース201から取得する(ステップS11)。例えば、システム制御部33は、推定ユーザのユーザID(またはユーザ名)が記述された推定ユーザリストを含む要求を行動履歴管理サーバ2へ送信することで、推定ユーザの行動履歴を行動履歴管理サーバ2から取得する。こうして取得された行動履歴は、例えば、推定ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。
The characteristic estimation process shown in FIG. 8 is started in response to an instruction from an operator, for example. When the process shown in FIG. 8 is started, the
次いで、システム制御部33は、行動履歴が取得された推定ユーザの中から推定ユーザを1人選定(例えば、ユーザIDまたはユーザ名により選定)する(ステップS12)。
Next, the
次いで、システム制御部33(特性推定部334)は、ステップS12で選定された推定ユーザの行動履歴から抽出された行動情報を学習済みモデルに入力することで当該行動情報に対する特性を推定する(ステップS13)。こうして推定された特性は、例えば、当該推定ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。このように、アンケートの対象者でない推定ユーザ群にまで拡張して特性を付与することができる。 Next, the system control unit 33 (characteristic estimation unit 334) estimates the characteristics of the behavior information by inputting the behavior information extracted from the behavior history of the estimated user selected in step S12 into the learned model (step). S13). The characteristics estimated in this way are stored in the memory in association with, for example, the user ID (or user name) of the estimated user. In this way, it is possible to extend the characteristics to the estimated users who are not the subjects of the questionnaire.
なお、システム制御部33(モデル更新部335)は、ステップS13で特性が推定された推定ユーザの行動履歴から抽出された行動情報を説明変数とし、当該推定ユーザの推定された特性を目的変数とした学習データを用いて学習済みモデルを更新してもよい。 The system control unit 33 (model update unit 335) uses the behavior information extracted from the behavior history of the estimated user whose characteristics are estimated in step S13 as an explanatory variable, and the estimated characteristics of the estimated user as an objective variable. The trained model may be updated using the trained data.
次いで、システム制御部33は、行動履歴が取得された推定ユーザのうち、まだ選定されていない推定ユーザがあるか否かを判定する(ステップS14)。システム制御部33は、まだ選定されていない推定ユーザがあると判定した場合には(ステップS14:YES)、ステップS12へ戻り、上記と同様の処理を行う。一方、システム制御部33は、まだ選定されていない推定ユーザがないと判定した場合には(ステップS14:NO)、ステップS15へ進む。
Next, the
ステップS15では、システム制御部33は、推定ユーザについてステップS13で推定された特性を、推定ユーザのユーザIDに対応付けてユーザ情報データベース301に格納し、図8に示す処理を終了する。
In step S15, the
なお、特性推定処理は、新たにアカウントが発行されたユーザに対して実行されることになる。 The characteristic estimation process will be executed for the user to whom the account is newly issued.
(3−3.特性更新処理)
次に、図9を参照して、システム制御部33により実行される特性更新処理について説明する。図9は、システム制御部33により実行される特性更新処理の一例を示すフローチャートである。
(3-3. Characteristic update processing)
Next, the characteristic update process executed by the
図9に示す特性更新処理は、例えば所定時間間隔(例えば、24時間毎、または1週間毎)に実行される。図9に示す処理が開始されると、システム制御部33は、行動履歴が更新されたユーザのリストを行動履歴管理サーバ2から取得する(ステップS21)。このリストには、例えば、行動履歴が更新されたユーザのユーザID(またはユーザ名)が記述されている。
The characteristic update process shown in FIG. 9 is executed, for example, at predetermined time intervals (for example, every 24 hours or every week). When the process shown in FIG. 9 is started, the
次いで、システム制御部33は、ユーザ情報データベース301を参照することで、ステップS21で取得されたリストから推定ユーザを特定し、特定した1以上の推定ユーザの更新後の行動履歴を、上記ステップS11と同じように、行動履歴管理サーバ2の行動履歴データベース201から取得する(ステップS22)。
Next, the
次いで、システム制御部33は、更新後の行動履歴が取得された推定ユーザの中から推定ユーザを1人選定(例えば、ユーザIDまたはユーザ名により選定)する(ステップS23)。
Next, the
次いで、システム制御部33(特性推定部334)は、ステップS23で選定された推定ユーザの更新後の行動履歴から抽出された行動情報を、上記学習済みモデルに入力することで当該行動情報に対する特性を再推定する(ステップS24)。こうして再推定された特性は、例えば、当該推定ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。 Next, the system control unit 33 (characteristic estimation unit 334) inputs the behavior information extracted from the updated behavior history of the estimated user selected in step S23 into the trained model to input the characteristics for the behavior information. Is re-estimated (step S24). The characteristics re-estimated in this way are stored in the memory in association with, for example, the user ID (or user name) of the estimated user.
なお、システム制御部33(分類基準変更部336)は、ステップS24の前または後において、上記学習済みモデルにおける所定の分岐ルールにおいて、推定された特性に属する推定ユーザの出現率が同等となる条件、および、推定された特性に属する推定ユーザが所定の一致度を有する条件、を満たすように、当該分岐ルールを変更するとよい。 In addition, the system control unit 33 (classification standard change unit 336) is a condition that the appearance rate of the estimated users belonging to the estimated characteristics is the same in the predetermined branching rule in the trained model before or after the step S24. , And the condition that the estimated user belonging to the estimated characteristic has a predetermined degree of matching, the branching rule may be changed.
次いで、システム制御部33は、更新後の行動履歴が取得された推定ユーザのうち、まだ選定されていない推定ユーザがあるか否かを判定する(ステップS25)。システム制御部33は、まだ選定されていない推定ユーザがあると判定した場合には(ステップS25:YES)、ステップS23へ戻り、上記と同様の処理を行う。一方、システム制御部33は、まだ選定されていない推定ユーザがないと判定した場合には(ステップS25:NO)、ステップS26へ進む。
Next, the
ステップS26では、システム制御部33は、推定ユーザについてステップS24で再推定された特性を、推定ユーザのユーザIDに対応付けてユーザ情報データベース301に格納(上書き更新)し、図9に示す処理を終了する。
In step S26, the
(3−4.学習済みモデル更新処理)
次に、図10を参照して、システム制御部33により実行される学習済みモデル更新処理について説明する。図10は、システム制御部33により実行される学習済みモデル更新処理の一例を示すフローチャートである。
(3-4. Trained model update process)
Next, the trained model update process executed by the
図10に示す学習済みモデル更新処理は、特性更新処理よりも長い時間間隔(例えば、半年毎、または1年毎)に実行される。図10に示す処理が開始されると、システム制御部33は、行動履歴が更新されたユーザのリストを行動履歴管理サーバ2から取得する(ステップS31)。
The trained model update process shown in FIG. 10 is executed at a longer time interval (for example, every six months or every year) than the characteristic update process. When the process shown in FIG. 10 is started, the
次いで、システム制御部33は、ユーザ情報データベース301を参照することで、ステップS31で取得されたリストから教師ユーザを所定数以上特定できたか否かを判定する(ステップS32)。この所定数は、ユーザ情報データベース301から特定可能な教師ユーザの総数の例えば1%〜5%の割合に応じた数としてもよい。システム制御部33は、取得されたリストから教師ユーザを所定数以上特定できたと判定した場合には(ステップS32:YES)、ステップS33へ進む。一方、システム制御部33は、取得されたリストから教師ユーザを所定数以上特定できないと判定した場合には(ステップS32:NO)、図10に示す処理を終了する。
Next, the
ステップS33では、システム制御部33は、行動履歴が更新された教師ユーザの特性をユーザ情報データベース301から取得する。次いで、システム制御部33は、行動履歴が更新された教師ユーザの更新後の行動履歴を行動履歴管理サーバ2の行動履歴データベース201から取得する(ステップS34)。
In step S33, the
次いで、システム制御部33は、行動履歴が更新された教師ユーザの中から教師ユーザを1人選定(例えば、ユーザIDまたはユーザ名により選定)する(ステップS35)。
Next, the
次いで、システム制御部33(教師ユーザ特定部332)は、ステップS35で選定された教師ユーザの更新後の行動履歴がアンケートと共通の仮説に基づき設定された基準を満たすか否かを判断する(ステップS36)。システム制御部33(教師ユーザ特定部332)は、当該教師ユーザの更新後の行動履歴が当該基準を満たすと判断した場合(ステップS36:YES)、当該教師ユーザを特定し(ステップS37)、ステップS38へ進む。一方、システム制御部33(教師ユーザ特定部332)は、当該教師ユーザの更新後の行動履歴が当該基準を満たさないと判断した場合(ステップS36:NO)、教師ユーザとして特定せず(採用せず)にステップS38へ進む。
Next, the system control unit 33 (teacher user identification unit 332) determines whether or not the updated behavior history of the teacher user selected in step S35 meets the criteria set based on the hypothesis common to the questionnaire ( Step S36). When the system control unit 33 (teacher user identification unit 332) determines that the updated action history of the teacher user satisfies the criterion (step S36: YES), the
なお、別の例として、ステップS35〜S38の処理は行われないように構成してもよい。すなわち、教師ユーザの行動履歴が更新された場合、システム制御部33は、教師ユーザの更新後の行動履歴が上記基準を満たすか否かを判断することなく、教師ユーザの更新後の行動履歴から抽出された行動情報を説明変数とし、教師ユーザの特性を目的変数とした学習データを用いて学習済みモデルを更新してもよい。
As another example, the process of steps S35 to S38 may not be performed. That is, when the behavior history of the teacher user is updated, the
ステップS38では、システム制御部33は、行動履歴が更新された教師ユーザのうち、まだ選定されていない教師ユーザがあるか否かを判定する。システム制御部33は、まだ選定されていない教師ユーザがあると判定した場合には(ステップS38:YES)、ステップS35へ戻り、上記と同様の処理を行う。一方、システム制御部33は、まだ選定されていない教師ユーザがないと判定した場合には(ステップS38:NO)、ステップS39へ進む。
In step S38, the
ステップS39では、システム制御部33(モデル更新部335)は、ステップS37で特定された教師ユーザの更新後の行動履歴(ステップS34で取得された行動履歴)から抽出された行動情報を説明変数とし、ステップ37で特定された教師ユーザの特性(ステップS33で取得された特性)を目的変数とした学習データを用いて学習済みモデルを更新し、図10に示す処理を終了する。 In step S39, the system control unit 33 (model update unit 335) uses the action information extracted from the updated action history of the teacher user specified in step S37 (action history acquired in step S34) as an explanatory variable. , The trained model is updated using the training data with the characteristics of the teacher user identified in step 37 (characteristics acquired in step S33) as the objective variable, and the process shown in FIG. 10 is completed.
なお、学習済みモデル更新処理により更新された学習済みモデルは、その後に推定ユーザの特性が推定される場合に用いられる。 The trained model updated by the trained model update process is used when the characteristics of the estimated user are subsequently estimated.
以上説明したように、上記実施形態によれば、特性推定サーバ3は、アンケートに回答した複数の対象ユーザのそれぞれの回答に基づいて、当該複数の対象ユーザを予め設定された複数の特性のうちのいずれかの特性に分類し、それぞれの対象ユーザの行動履歴が所定の基準を満たすか否かを判断する。そして、特性推定サーバ3は、基準を満たすと判断された対象ユーザを教師ユーザとし、教師ユーザの行動履歴から抽出された行動情報を説明変数とし、教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成し、推定ユーザの行動履歴から抽出された行動情報と、生成された学習済みモデルとを用いて当該推定ユーザの特性を推定するように構成したので、対象ユーザのアンケート結果に基づいて実証的な特性推定を行うことができる。すなわち、対象ユーザの主観的、意識的な判断に基づく仮説検証と、対象ユーザの客観的な事実に基づく仮説検証を踏まえて実証的な特性推定を可能にした。
As described above, according to the above-described embodiment, the
また、上記実施形態では、対象ユーザのアンケートで起こりうる不完全性、不確実性を当該対象ユーザの行動履歴で補うことで、学習済みモデルの生成に用いる教師データの精度を向上することができようになったが、これに加えて、アンケートによる特性分類の結果に基づいて作成された段階の教師データ(プレ教師データ)についても改善することができる。すなわち、特性推定サーバ3(特性分類装置の分類手段及び判断手段の一例)は、上述したように、アンケートに回答した複数の対象ユーザのそれぞれの回答に基づいて、対象ユーザを予め設定された複数の特性のうちのいずれかの特性に分類し、当該対象ユーザの行動履歴がアンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断する。そして、特性推定サーバ3(特性分類装置の特定手段の一例)は、当該基準を満たすか否かの判断結果からアンケートの改善項目(改善点)を特定する。例えば、当該基準を満たすか否かの判断結果から、どのような質問事項(アンケートの質問事項)が特性の分類判定(セグメント判定)に有用または無用であったか、どのようなアンケート選択肢(質問に対する回答の選択肢)が特性の分類判定に有用または無用であったか、どのような分類方法(特性の分類に用いられる算出方法)が特性の分類判定に適していたかを判断することで、アンケートの改善項目(例えば、アンケートの質問事項、アンケート選択肢、及び分類方法の少なくとも何れか1つ)を特定する。これにより、アンケートの品質向上に寄与することができる。 Further, in the above embodiment, the accuracy of the teacher data used for generating the trained model can be improved by supplementing the incompleteness and uncertainty that may occur in the questionnaire of the target user with the behavior history of the target user. However, in addition to this, it is possible to improve the teacher data (pre-teacher data) at the stage created based on the results of the characteristic classification by the questionnaire. That is, as described above, the characteristic estimation server 3 (an example of the classification means and the determination means of the characteristic classification device) sets the target users in advance based on the answers of the plurality of target users who answered the questionnaire. It is classified into one of the characteristics of the above, and it is determined whether or not the behavior history of the target user meets the criteria set in relation to the characteristics based on the hypothesis common to the questionnaire. Then, the characteristic estimation server 3 (an example of the identification means of the characteristic classification device) identifies the improvement items (improvement points) of the questionnaire from the judgment result of whether or not the criteria are satisfied. For example, what kind of question (questionnaire question) was useful or useless for characteristic classification judgment (segment judgment) based on the judgment result of whether or not the criteria were met, and what kind of questionnaire option (answer to the question) By determining whether the classification method (option) was useful or useless for the classification judgment of the characteristics, and what classification method (calculation method used for the classification of the characteristics) was suitable for the classification judgment of the characteristics, the improvement items of the questionnaire ( For example, at least one of questionnaire questions, questionnaire options, and classification methods) is specified. This can contribute to improving the quality of the questionnaire.
例えば、特性推定サーバ3は、アンケートと共通の仮説に基づき特性ごとに設定された複数の仮説検証項目のそれぞれに対する該当有無を対象ユーザの行動履歴に基づいて判断し、その判断結果(つまり、複数の仮説検証項目のそれぞれに対する該当有無)に基づいて、アンケートに関する複数の項目(例えば、アンケートの質問事項、アンケート選択肢、及び分類方法)のうち少なくとも1つの項目を改善項目として特定するとよい。また、特性推定サーバ3は、特性を横断した連続性を有する仮説検証項目(例えば、アクセスタイミング)において複数段階のうち、どの段階に該当するかを対象ユーザの行動履歴に基づいて判断し、その判断結果に基づいて、アンケートに関する複数の項目(例えば、アンケートの質問事項、アンケート選択肢、及び分類方法)のうち少なくとも1つの項目を改善項目として特定してもよい。例えば、当該判断された段階と、アンケート結果に基づき分類された特性と、が関連(または合致)しないことに対して影響を与えている項目が改善項目として特定される。また、特性推定サーバ3は、ユーザ全体の行動履歴に基づく行動分布と特性との対応関係を示す仮説検証項目において、当該行動分布中のどのレベルに該当するかを対象ユーザの行動履歴に基づいて判断し、その判断結果に基づいて、アンケートに関する複数の項目(例えば、アンケートの質問事項、アンケート選択肢、及び分類方法)のうち少なくとも1つの項目を改善項目として特定してもよい。例えば、当該判断されたレベルと、アンケート結果に基づき分類された特性と、が関連(または合致)しないことに対して影響を与えている項目が改善項目として特定される。
For example, the
図11は、アンケートの改善項目としてアンケート選択肢が特定された場合における改善内容を示す概念図である。図11(A)では、アンケート選択肢の分割の可能性が見い出されることで、アンケート選択肢2が分割されている。図11(B)では、アンケート選択肢において異なるデータ傾向が見いだされることで、アンケート選択肢2の一部分がアンケート選択肢1に統合されている。その他、図示しないが、アンケートの改善項目として分類方法が特定された場合、複数の分類方法のうち、より適した分類方法が選定される。例えば、対象ユーザの回答に基づきいずれかの特性に分類される際、アンケートにおけるトレンド商品購買に関する質問でyes(あてはまる)との回答に対して+5点として採点され、結果として、当該対象ユーザの特性が特性01として判別(分類)された場合において、当該対象ユーザの行動履歴が基準を満たさない(つまり、対象ユーザは特性01に該当しない)場合がありうる。この場合、トレンド商品購買に関する質問で「あてはまる」との回答に対して+5点としたことが適当ではなかった、つまり、分類方法が適当でなかったとして、当該分類方法がアンケートの改善項目として特定される。これにより、分類方法に影響を与える質問の内容変更、当該質問の配点変更(つまり、質問に対する選択肢の重み付けの変更)、または当該質問自体の削除等が行われる。また、アンケートの質問1でyesを+2点、noを0点、質問2でyesを+1点、noを−1点として、例えば合計3点以上の対象ユーザが特性01として判別された場合において、当該対象ユーザの行動履歴が基準を満たさず、特性01には不適切な場合がありうる。この場合にも、分類方法がアンケートの改善項目として特定され、アンケートの質問の内容変更、当該質問の配点変更、または当該質問自体の削除等が行われる。つまり、特性判別に用いる計算ロジックが適正化される。
FIG. 11 is a conceptual diagram showing the content of improvement when a questionnaire option is specified as an improvement item of the questionnaire. In FIG. 11A, the
なお、以上のように本発明の一実施形態を説明したが、本発明は上記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲で上記実施形態から種々構成等に変更を加えてもよく、その場合も本発明の技術的範囲に含まれる。 Although one embodiment of the present invention has been described above, the present invention is not limited to the above embodiment, and changes from the above embodiment to various configurations and the like are made without departing from the gist of the present invention. It may be added, and it is also included in the technical scope of the present invention.
1 アンケート管理サーバ
2 行動履歴管理サーバ
3 特性推定サーバ
31 通信部
32 記憶部
33 システム制御部
34 システムバス
101 アンケートデータベース
201 行動履歴データベース
301 ユーザ情報データベース
UTm ユーザ端末
STn 処理端末
SAo サーバ
NW 通信ネットワーク
S 通信システム
1
Claims (12)
前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断する判断手段と、
前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成する生成手段と、
前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定する推定手段と、
を備えることを特徴とする特性推定装置。 A classification means for classifying the first user into one of a plurality of preset characteristics based on the responses of the plurality of first users who responded to the questionnaire.
A means for determining whether or not the behavior history of the first user meets the criteria set in relation to the characteristics based on the hypothesis common to the questionnaire.
Among the plurality of first users, the first user whose behavior history is determined to satisfy the criteria is used as a teacher user, and the behavior information extracted from the behavior history of the teacher user is used as an explanatory variable, and the characteristics of the teacher user. A generation means for generating a trained model trained by training data with
An estimation means for estimating the characteristics of the second user using the behavior information extracted from the behavior history of the second user different from the first user and the trained model.
A characteristic estimation device comprising.
前記学習済みモデルの更新間隔は、前記第2ユーザの特性の更新間隔よりも長いことを特徴とする請求項2に記載の特性推定装置。 When the behavior history of the teacher user is updated by updating the behavior history of the first user, the behavior information extracted from the updated behavior history is used as an explanatory variable, and the characteristic of the teacher user is used as an objective variable. Further provided with an update means for updating the trained model using the training data of
The characteristic estimation device according to claim 2, wherein the update interval of the trained model is longer than the update interval of the characteristics of the second user.
アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類するステップと、
前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断するステップと、
前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成するステップと、
前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定するステップと、
を含むことを特徴とする特性推定方法。 A method of character estimation performed by a computer
A step of classifying the first user into one of a plurality of preset characteristics based on the answers of each of the plurality of first users who responded to the questionnaire.
A step of determining whether or not the behavior history of the first user meets the criteria set in relation to the characteristics based on the hypothesis common to the questionnaire, and
Among the plurality of first users, the first user whose behavior history is determined to satisfy the criteria is used as a teacher user, and the behavior information extracted from the behavior history of the teacher user is used as an explanatory variable, and the characteristics of the teacher user. Steps to generate a trained model trained with training data with
A step of estimating the characteristics of the second user using the behavior information extracted from the behavior history of the second user different from the first user and the trained model.
A characteristic estimation method characterized by including.
前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断するステップと、
前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成するステップと、
前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定するステップと、
をコンピュータに実行させることを特徴とする特性推定プログラム。 A step of classifying the first user into one of a plurality of preset characteristics based on the answers of each of the plurality of first users who responded to the questionnaire.
A step of determining whether or not the behavior history of the first user meets the criteria set in relation to the characteristics based on the hypothesis common to the questionnaire, and
Among the plurality of first users, the first user whose behavior history is determined to satisfy the criteria is used as a teacher user, and the behavior information extracted from the behavior history of the teacher user is used as an explanatory variable, and the characteristics of the teacher user. Steps to generate a trained model trained with training data with
A step of estimating the characteristics of the second user using the behavior information extracted from the behavior history of the second user different from the first user and the trained model.
A characteristic estimation program characterized by having a computer execute the above.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018157945 | 2018-08-27 | ||
JP2018157945 | 2018-08-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020035409A JP2020035409A (en) | 2020-03-05 |
JP6899805B2 true JP6899805B2 (en) | 2021-07-07 |
Family
ID=69668400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018173297A Active JP6899805B2 (en) | 2018-08-27 | 2018-09-18 | Characteristic estimation device, characteristic estimation method, characteristic estimation program, etc. |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6899805B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7065927B1 (en) | 2020-10-29 | 2022-05-12 | 株式会社Z会 | Achievement estimation model generation device, scholastic ability estimation device, scholastic ability estimation model generation method, scholastic ability estimation method, program |
JP2023097496A (en) * | 2021-12-28 | 2023-07-10 | Sensy株式会社 | Machine learning device, data processing device, inference device, machine learning method, data processing method, and inference method |
EP4307202A1 (en) * | 2022-03-18 | 2024-01-17 | Rakuten Group, Inc. | Information processing device, information processing method, and program |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010204966A (en) * | 2009-03-03 | 2010-09-16 | Nippon Telegr & Teleph Corp <Ntt> | Sampling device, sampling method, sampling program, class distinction device and class distinction system |
WO2018128403A1 (en) * | 2017-01-06 | 2018-07-12 | Samsung Electronics Co., Ltd. | Apparatus and method for processing content |
-
2018
- 2018-09-18 JP JP2018173297A patent/JP6899805B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020035409A (en) | 2020-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108665329B (en) | Commodity recommendation method based on user browsing behavior | |
US20200410531A1 (en) | Methods, systems, and apparatus for enhancing electronic commerce using social media | |
US20200273054A1 (en) | Digital receipts economy | |
WO2018118189A1 (en) | Systems and methods for customizing content of a billboard | |
Forouzandeh et al. | Content marketing through data mining on Facebook social network. | |
US20160012512A1 (en) | Lifestyle recommendation system | |
US20150193685A1 (en) | Optimal time to post for maximum social engagement | |
Reimer et al. | How online consumer segments differ in long-term marketing effectiveness | |
JP6899805B2 (en) | Characteristic estimation device, characteristic estimation method, characteristic estimation program, etc. | |
US20160063547A1 (en) | Method and system for making targeted offers | |
KR20130033506A (en) | Item recommendation method and apparatus | |
CN110689402A (en) | Method and device for recommending merchants, electronic equipment and readable storage medium | |
JP2022531410A (en) | Digital anthropology and ethnographic system | |
Liu et al. | Inferring gender and age of customers in shopping malls via indoor positioning data | |
KR20200063348A (en) | Blogger and advertiser recommendation system based on bigdata collaborative filtering and method thereof | |
Zheng et al. | A scalable purchase intention prediction system using extreme gradient boosting machines with browsing content entropy | |
US20140101064A1 (en) | Systems and Methods for Automated Reprogramming of Displayed Content | |
JP2021047551A (en) | Specification device, specification method, and specification program | |
Kumar et al. | Context-aware social popularity based recommender system | |
Ma | Modeling users for online advertising | |
JP7354195B2 (en) | Information processing device, information processing method, and information processing program | |
JP2021103340A (en) | Device, method, and program for making recommendation based on customer attribute information | |
JP7280327B2 (en) | Marketing information analysis device, method and program | |
Hassanpour et al. | Improving Accuracy of Recommender Systems using Social Network Information and Longitudinal Data | |
Xiao | Recommending Best Products from E-commerce Purchase History and User Click Behavior Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200317 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210601 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210615 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6899805 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |