JP6899805B2 - Characteristic estimation device, characteristic estimation method, characteristic estimation program, etc. - Google Patents

Characteristic estimation device, characteristic estimation method, characteristic estimation program, etc. Download PDF

Info

Publication number
JP6899805B2
JP6899805B2 JP2018173297A JP2018173297A JP6899805B2 JP 6899805 B2 JP6899805 B2 JP 6899805B2 JP 2018173297 A JP2018173297 A JP 2018173297A JP 2018173297 A JP2018173297 A JP 2018173297A JP 6899805 B2 JP6899805 B2 JP 6899805B2
Authority
JP
Japan
Prior art keywords
user
characteristic
behavior history
behavior
teacher
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018173297A
Other languages
Japanese (ja)
Other versions
JP2020035409A (en
Inventor
果純 伴
果純 伴
敬基 見原
敬基 見原
志穂 吉冨
志穂 吉冨
広大 小川
広大 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Group Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Group Inc filed Critical Rakuten Group Inc
Publication of JP2020035409A publication Critical patent/JP2020035409A/en
Application granted granted Critical
Publication of JP6899805B2 publication Critical patent/JP6899805B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、ユーザの特性を推定する方法等の技術分野に関する。 The present invention relates to technical fields such as methods for estimating user characteristics.

従来から、インターネット等の通信ネットワークにおいて、多くのユーザを複数種類の特性の何れかに分類(セグメント化)し、分類されたユーザの特性に応じて情報を提供することが行われている。例えば、マーケティングの分野では、オピニオンリーダとしてイノベータと呼ばれる特性を持つユーザに訴求することが効果的であることが知られている。ユーザの特性を推定する手法として、ユーザに対してアンケートを行うことで推定する手法や、ユーザによる情報へのアクセス履歴を分析することで推定する手法等がある。特許文献1には、ユーザの特性を推定する手法が開示されている。具体的には、特許文献1の手法は、教師ユーザに対するアンケートの結果に基づいて特定された、教師ユーザの特性を目的変数とし、教師ユーザのアクセス履歴に基づいて生成された、教師ユーザの行動データを説明変数とする特性推定モデルを生成し、この特性推定モデルと推定ユーザの行動データとから推定ユーザの特性を推定するようになっている。 Conventionally, in a communication network such as the Internet, many users are classified (segmented) into any of a plurality of types of characteristics, and information is provided according to the characteristics of the classified users. For example, in the field of marketing, it is known that it is effective to appeal to users who have characteristics called innovators as opinion leaders. As a method of estimating the characteristics of a user, there are a method of estimating by conducting a questionnaire to the user, a method of estimating by analyzing the access history of information by the user, and the like. Patent Document 1 discloses a method for estimating user characteristics. Specifically, the method of Patent Document 1 uses the characteristics of the teacher user as the objective variable, which is specified based on the result of the questionnaire to the teacher user, and the behavior of the teacher user generated based on the access history of the teacher user. A characteristic estimation model using data as an explanatory variable is generated, and the characteristics of the estimated user are estimated from this characteristic estimation model and the behavior data of the estimated user.

特開2009−289068号公報Japanese Unexamined Patent Publication No. 2009-289068

しかしながら、特許文献1の技術では、特性判別に用いるアンケートの質問の基礎となる仮説との関係が不明であり、また、当該特性を判別するための仮説の妥当性を評価するという思想もない。 However, in the technique of Patent Document 1, the relationship with the hypothesis that is the basis of the question of the questionnaire used for the characteristic discrimination is unclear, and there is no idea of evaluating the validity of the hypothesis for discriminating the characteristic.

そこで、本発明は、上記点等に鑑みてなされたものであり、対象者のアンケート結果に基づいて実証的な特性推定を可能にした特性推定装置、特性推定方法、及び特性推定プログラム等を提供することを課題とする。 Therefore, the present invention has been made in view of the above points and the like, and provides a characteristic estimation device, a characteristic estimation method, a characteristic estimation program, etc. that enable empirical characteristic estimation based on the results of a questionnaire of a subject. The task is to do.

上記課題を解決するために、請求項1に記載の発明は、アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類する分類手段と、前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断する判断手段と、前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成する生成手段と、前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定する推定手段と、を備えることを特徴とする。 In order to solve the above problem, the invention according to claim 1 is one of a plurality of characteristics set in advance for the first user based on the answers of the plurality of first users who responded to the questionnaire. A classification means for classifying into the characteristics, a determination means for determining whether or not the behavior history of the first user meets the criteria set in relation to the characteristics based on the hypothesis common to the questionnaire, and the plurality. the first user of the action history of the first user is determined to prior meet Kimoto quasi as a teacher user, the action information extracted from the behavior history of the teacher user as explanatory variables, the characteristics of the teacher user The second model uses the generation means for generating the trained model learned from the training data as the objective variable, the behavior information extracted from the behavior history of the second user different from the first user, and the trained model. It is characterized by including an estimation means for estimating user characteristics.

この発明によれば、対象者のアンケート結果に基づいて実証的な特性推定を行うことができる。 According to the present invention, empirical characteristic estimation can be performed based on the results of a questionnaire of the subject.

請求項2に記載の発明は、請求項1に記載の特性推定装置において、前記第2ユーザの行動履歴が更新された場合、前記推定手段は、当該更新された行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を再推定することにより更新することを特徴とする。 In the invention according to claim 2, when the action history of the second user is updated in the characteristic estimation device according to claim 1, the estimation means uses the action information extracted from the updated action history. It is characterized in that it is updated by re-estimating the characteristics of the second user using the trained model and the trained model.

この発明によれば、第2ユーザについて推定される特性を当該第2ユーザの行動履歴の変化に対応させることができる。 According to the present invention, the characteristics estimated for the second user can be made to correspond to the change in the behavior history of the second user.

請求項3に記載の発明は、請求項1または2に記載の特性推定装置において、前記第2ユーザの行動履歴が更新された場合、前記学習済みモデルにおける所定の分類基準において、推定された特性に属する前記第2ユーザの出現率が同等となる条件、および、推定された特性に属する前記第2ユーザが所定の一致度を有する条件、を満たすように、前記所定の分類基準を変更する変更手段を更に備えることを特徴とする。 The invention according to claim 3 is the characteristic estimated according to a predetermined classification criterion in the trained model when the behavior history of the second user is updated in the characteristic estimation device according to claim 1 or 2. Change to change the predetermined classification criteria so as to satisfy the condition that the appearance rate of the second user belonging to the above is equal and the condition that the second user belonging to the estimated characteristic has a predetermined degree of agreement. It is characterized by further providing means.

この発明によれば、特性が推定された第2ユーザの行動履歴の変化に追従して、学習済みモデルによる推定精度を高めていくことができる。 According to the present invention, it is possible to improve the estimation accuracy by the trained model by following the change in the behavior history of the second user whose characteristics have been estimated.

請求項4に記載の発明は、請求項1乃至3のいずれか一項に記載の特性推定装置において、前記第1ユーザの行動履歴が更新されることで前記教師ユーザの行動履歴が更新された場合、当該更新された行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データを用いて前記学習済みモデルを更新する更新手段を更に備えることを特徴とする。 In the invention according to claim 4, in the characteristic estimation device according to any one of claims 1 to 3, the action history of the teacher user is updated by updating the action history of the first user. In this case, the behavior information extracted from the updated behavior history is used as an explanatory variable, and the learning data using the characteristics of the teacher user as the objective variable is further provided as an update means for updating the trained model. To do.

この発明によれば、教師ユーザの行動履歴の変化に追従して、学習済みモデルによる推定精度を高めていくことができる。 According to the present invention, it is possible to improve the estimation accuracy by the trained model by following the change in the behavior history of the teacher user.

請求項5に記載の発明は、請求項4に記載の特性推定装置において、前記第1ユーザの行動履歴が更新されることで前記教師ユーザの行動履歴が更新された場合、前記判断手段は、当該更新された、前記教師ユーザの行動履歴が前記特性に関連して設定された基準を満たすか否かを判断することを特徴とする。 According to the fifth aspect of the present invention, in the characteristic estimation device according to the fourth aspect, when the action history of the teacher user is updated by updating the action history of the first user, the determination means may be used. It is characterized in that it is determined whether or not the updated behavior history of the teacher user meets the criteria set in relation to the characteristic.

この発明によれば、教師ユーザの行動履歴の変化に追従して、実証的な判断を含めて学習済みモデルによる推定精度を高めていくことができる。 According to the present invention, it is possible to improve the estimation accuracy by the trained model including the empirical judgment by following the change in the behavior history of the teacher user.

請求項6に記載の発明は、請求項1乃至5のいずれか一項に記載の特性推定装置において、前記生成手段は、前記行動履歴が前記基準を満たさないと判断された第1ユーザを教師ユーザとして採用しないことを特徴とする。 The invention described in claim 6 is the characteristic estimation apparatus according to any one of claims 1 to 5, before SL generating means, first to the action history is judged that the not satisfied Kimoto quasi It is characterized in that the user is not adopted as a teacher user.

この発明によれば、推定により特定される拡張集合の基点となる教師データの段階からその実証性や客観性を確保維持することができる。 According to the present invention, the demonstrability and objectivity can be ensured and maintained from the stage of the teacher data which is the base point of the extension set specified by estimation.

請求項7に記載の発明は、請求項2に記載の特性推定装置において、前記第1ユーザの行動履歴が更新されることで前記教師ユーザの行動履歴が更新された場合、当該更新された行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データを用いて前記学習済みモデルを更新する更新手段を更に備え、前記学習済みモデルの更新間隔は、前記第2ユーザの特性の更新間隔よりも長いことを特徴とする。 The invention according to claim 7 is the updated behavior when the behavior history of the teacher user is updated by updating the behavior history of the first user in the characteristic estimation device according to claim 2. An update means for updating the trained model using the training data with the behavior information extracted from the history as the explanatory variable and the characteristics of the teacher user as the objective variable is further provided, and the update interval of the trained model is the above. It is characterized in that it is longer than the update interval of the characteristics of the second user.

この発明によれば、学習済みモデルの更新を最低限に留め、装置の負荷を低減することができる。 According to the present invention, it is possible to minimize the update of the trained model and reduce the load on the device.

請求項11に記載の発明は、コンピュータにより実行される特性推定方法であって、アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類するステップと、前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断するステップと、前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成するステップと、前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定するステップと、を含むことを特徴とする。 The invention according to claim 11 is a characteristic estimation method executed by a computer, in which the first user is preset with a plurality of characteristics based on the answers of the plurality of first users who have answered the questionnaire. The step of classifying into one of the characteristics, the step of determining whether or not the behavior history of the first user meets the criteria set in relation to the characteristics based on the hypothesis common to the questionnaire, and the above. Among the plurality of first users, the first user whose behavior history is determined to satisfy the criteria is used as the teacher user, the behavior information extracted from the behavior history of the teacher user is used as an explanatory variable, and the characteristics of the teacher user are set. The second user uses the step of generating a trained model learned from the training data used as the objective variable, the behavior information extracted from the behavior history of the second user different from the first user, and the trained model. It is characterized by including a step of estimating the characteristics of.

請求項12に記載の発明は、アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類するステップと、前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断するステップと、前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成するステップと、前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定するステップと、をコンピュータに実行させることを特徴とする。 The invention according to claim 12 is a step of classifying the first user into one of a plurality of preset characteristics based on the answers of the plurality of first users who responded to the questionnaire. The step of determining whether or not the behavior history of the first user satisfies the criteria set in relation to the characteristics based on the hypothesis common to the questionnaire, and the behavior history of the plurality of first users is said. A trained model learned by learning data with the first user determined to meet the criteria as the teacher user, the behavior information extracted from the behavior history of the teacher user as the explanatory variable, and the characteristics of the teacher user as the objective variable. And a step of estimating the characteristics of the second user using the behavior information extracted from the behavior history of the second user different from the first user and the learned model are executed on the computer. It is characterized by letting it.

本発明によれば、対象者のアンケート結果に基づいて実証的な特性推定を行うことができる。 According to the present invention, empirical characteristic estimation can be performed based on the results of a questionnaire of a subject.

特性推定装置の基本動作の流れを示すフロー図である。It is a flow chart which shows the flow of the basic operation of a characteristic estimation apparatus. 特性推定装置の基本動作の概念図である。It is a conceptual diagram of the basic operation of a characteristic estimation device. 通信システムSの概要構成の一例を示す図である。It is a figure which shows an example of the outline structure of the communication system S. (A)は、特性推定サーバ3のハードウェア構成例を示す図であり、(B)は、特性推定サーバ3の制御部31の機能ブロック例を示す図である。(A) is a diagram showing a hardware configuration example of the characteristic estimation server 3, and (B) is a diagram showing a functional block example of the control unit 31 of the characteristic estimation server 3. ユーザ情報データベース301の内容の一例を示す図である。It is a figure which shows an example of the contents of the user information database 301. 学習済みモデルの例として、決定木における条件分岐の例を示す概念図である。As an example of the trained model, it is a conceptual diagram showing an example of conditional branching in a decision tree. システム制御部33により実行される学習済みモデル生成処理の一例を示すフローチャートである。It is a flowchart which shows an example of the trained model generation processing executed by the system control unit 33. システム制御部33により実行される特性推定処理の一例を示すフローチャートである。It is a flowchart which shows an example of the characteristic estimation processing executed by the system control unit 33. システム制御部33により実行される特性更新処理の一例を示すフローチャートである。It is a flowchart which shows an example of the characteristic update process executed by the system control unit 33. システム制御部33により実行される学習済みモデル更新処理の一例を示すフローチャートである。It is a flowchart which shows an example of the trained model update process executed by the system control unit 33. アンケートの改善項目としてアンケート選択肢が特定された場合における改善内容を示す概念図である。It is a conceptual diagram which shows the improvement content when the questionnaire option is specified as the improvement item of the questionnaire.

以下、図面を参照して本発明の実施形態について説明する。なお、以下の実施形態においては、第1ユーザを対象ユーザと称し、第2ユーザを推定ユーザと称するものとする。対象ユーザとは、アンケートの対象者であり、後述する基準を満たす教師ユーザが含まれる。推定ユーザとは、対象ユーザとは異なるユーザであり、教師ユーザの教師データを用いて生成された学習済みモデルから特性が推定されるユーザである。なお、対象ユーザ及び推定ユーザは、それぞれのユーザに付与されたユーザID(識別情報)により識別される。以下の説明においては、対象ユーザ及び推定ユーザを総称して、単に、ユーザという場合がある。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In the following embodiment, the first user is referred to as a target user, and the second user is referred to as an estimated user. The target user is a target person of the questionnaire, and includes a teacher user who meets the criteria described later. The estimated user is a user different from the target user, and the characteristic is estimated from the trained model generated by using the teacher data of the teacher user. The target user and the estimated user are identified by the user ID (identification information) given to each user. In the following description, the target user and the estimated user may be collectively referred to as a user.

[1.特性推定装置の基本動作]
はじめに、図1を参照して、本発明に係る特性推定装置の基本動作について説明する。図1は、特性推定装置の基本動作を示す概念図であり、図2は、特性推定装置の基本動作の概念図である。
[1. Basic operation of the characteristic estimation device]
First, the basic operation of the characteristic estimation device according to the present invention will be described with reference to FIG. FIG. 1 is a conceptual diagram showing the basic operation of the characteristic estimation device, and FIG. 2 is a conceptual diagram of the basic operation of the characteristic estimation device.

図1及び図2に示すように、先ず、特性推定装置(分類手段)は、アンケート(質問調査)に回答した複数の対象ユーザのそれぞれの回答(アンケート結果)に基づいて、当該複数の対象ユーザを予め設定された複数の特性のうちのいずれかの特性に分類(セグメント化)する(フェーズF1)。ユーザの特性には、行動特性や市場における出現分布などに基づく仮説があり、アンケート結果に基づく特性分類は、対象ユーザの主観的、意識的な判断に基づく仮説検証ということができる。ユーザの特性の例として、イノベータ理論に沿った複数の特性(イノベータ、アーリーアダプタ、アーリーマジョリティ、レイトマジョリティ、及びラガード)が挙げられるが、これに限定されるものではなく、例えば、ユーザの人生における価値観等を考慮した特性を採用することができる。 As shown in FIGS. 1 and 2, first, the characteristic estimation device (classification means) is based on the respective answers (questionnaire results) of the plurality of target users who answered the questionnaire (questionnaire survey), and the plurality of target users. Is classified (segmented) into one of a plurality of preset characteristics (Phase F1). User characteristics include hypotheses based on behavioral characteristics and market appearance distribution, and characteristic classification based on questionnaire results can be said to be hypothesis verification based on the subjective and conscious judgment of the target user. Examples of user characteristics include, but are not limited to, multiple characteristics in line with innovator theory (innovators, early adopters, early majority, late majority, and lagard), for example, in the user's life. It is possible to adopt characteristics that take values into consideration.

次に、特性推定装置(判断手段)は、アンケートに回答した対象ユーザの行動履歴が所定の基準(客観的な基準)を満たすか否かを対象ユーザ毎に判断し、当該対象ユーザのうち行動履歴が上記基準を満たすと判断された対象ユーザを教師ユーザとして特定する(フェーズF2)。ここで、行動履歴は、対象ユーザの実際の行為に基づく客観的な事実(事象)を表すものである。教師ユーザの行動履歴から抽出される行動情報と教師ユーザの特性との組が、後述する学習済みモデルの生成にあたり教師データとして用いられる。上記基準は、例えば、アンケートと共通の仮説に基づき特性に関連して設定されるものであり、アンケートと関連する基準を含む。上記基準の例としては、新製品を予約注文しているかどうか、トレンド商品を購入または検索しているかどうか、などが挙げられる。教師データの作成過程において、アンケートに回答した対象ユーザの行動履歴(つまり、客観的な事実に基づくデータ)を用いることで、対象ユーザの意識に頼ることにより起こりうる不完全性、不確実性を補完することができる。例えば、「何月何日にWebサイトAを訪問したか」といった対象ユーザの記憶に頼った細かなデータの正確性に不安が残るという現象に基づく不確実性を、当該対象ユーザの行動履歴で補完することができる。これにより、正確性が担保された状態で活用可能な情報が増え、教師データの精度向上が期待できる。なお、当該基準は、当該基準のみにより行動履歴を検証することで特性を分類することも可能な基準である。 Next, the characteristic estimation device (judgment means) determines for each target user whether or not the behavior history of the target user who responded to the questionnaire meets a predetermined standard (objective standard), and acts among the target users. The target user whose history is determined to satisfy the above criteria is specified as a teacher user (Phase F2). Here, the action history represents an objective fact (event) based on the actual action of the target user. The set of the behavior information extracted from the behavior history of the teacher user and the characteristics of the teacher user is used as teacher data in generating the trained model described later. The above criteria are, for example, set in relation to characteristics based on a hypothesis common to the questionnaire, and include criteria related to the questionnaire. Examples of the above criteria include whether a new product is pre-ordered, whether a trending product is purchased or searched, and the like. In the process of creating teacher data, by using the behavior history of the target user who answered the questionnaire (that is, data based on objective facts), the incompleteness and uncertainty that can occur by relying on the consciousness of the target user can be determined. Can be complemented. For example, the behavior history of the target user can be used to describe the uncertainty based on the phenomenon that the accuracy of detailed data that relies on the memory of the target user, such as "what month and day the website A was visited," remains uncertain. Can be complemented. As a result, the amount of information that can be used while the accuracy is guaranteed increases, and the accuracy of teacher data can be expected to improve. In addition, the standard is a standard that can classify the characteristics by verifying the behavior history only by the standard.

行動履歴が上記基準を満たすか否かは、例えば、個々の事象から蓋然性の高い特性を導き出す帰納的な仮説検証項目群(アンケートと共通の仮説モデルに基づく検証項目群)を特性ごとに設定(仮説検証項目は特性間で重複してもよい)し、この項目群に対する該当率が所定の割合を超えたか否かを判断することにより行われるとよい。ここで、仮説検証項目群に対する該当率は、行動履歴から抽出された行動情報(購買データ等の実データ)に基づいて算出される。このような判断は、対象ユーザの客観的な事実に基づく仮説検証ということができる。そして、該当率が所定の割合を超えた対象ユーザが教師ユーザとして特定される。一方、該当率が所定の割合を超えない対象ユーザは教師ユーザとして採用されない。該当率が所定の割合を超えない場合には、アンケートによる主観的評価と客観的評価とが乖離している場合(即ち、仮説に合わない場合)のほかに、当該対象ユーザの購買データ等の実データが十分ではなく証明できないという場合が該当する。つまり、証明困難な場合にも、対象ユーザは教師ユーザとして採用されず、その対象ユーザの行動情報と特性との組は教師データから除外される。これらの処理により、推定により特定される拡張集合の基点となる教師データの段階からその実証性や客観性を確保維持でき、後段の推定時に実証性や客観性を踏まえた状態で推定処理を進めることができる。 Whether or not the behavior history meets the above criteria is determined, for example, by setting an inductive hypothesis verification item group (verification item group based on a hypothesis model common to the questionnaire) for each characteristic (a group of verification items based on a hypothesis model common to the questionnaire) that derives highly probable characteristics from individual events. Hypothesis verification items may overlap between characteristics), and it may be performed by determining whether or not the corresponding rate for this item group exceeds a predetermined ratio. Here, the corresponding rate for the hypothesis verification item group is calculated based on the behavior information (actual data such as purchase data) extracted from the behavior history. Such a judgment can be said to be a hypothesis verification based on the objective facts of the target user. Then, the target user whose corresponding rate exceeds a predetermined rate is specified as a teacher user. On the other hand, the target user whose corresponding rate does not exceed the predetermined rate is not adopted as the teacher user. If the applicable rate does not exceed the specified rate, in addition to the case where the subjective evaluation by the questionnaire and the objective evaluation are different (that is, when the hypothesis is not met), the purchase data of the target user, etc. This applies when the actual data is not sufficient and cannot be proved. That is, even when it is difficult to prove, the target user is not adopted as the teacher user, and the pair of the behavior information and the characteristic of the target user is excluded from the teacher data. By these processes, the demonstrability and objectivity can be secured and maintained from the stage of the teacher data which is the base point of the extended set specified by the estimation, and the estimation process proceeds in a state based on the demonstrability and objectivity at the time of the later estimation. be able to.

次に、特性推定装置(生成手段)は、基準を満たすと判断された対象ユーザを教師ユーザとし、教師ユーザの行動履歴から抽出された行動情報を説明変数とし、教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成する(フェーズF3)。つまり、特性推定装置は、教師ユーザの行動情報と特性とを教師データとして学習した学習済みモデルを生成する。これにより、対象ユーザの主観的な判断に基づく仮説検証と、対象ユーザの客観的な事実に基づく仮説検証を踏まえて実証的な特性推定を可能にする。 Next, the characteristic estimation device (generation means) uses the target user determined to meet the criteria as the teacher user, the behavior information extracted from the behavior history of the teacher user as the explanatory variable, and the characteristic of the teacher user as the objective variable. A trained model trained from the trained data is generated (Phase F3). That is, the characteristic estimation device generates a trained model in which the behavior information and characteristics of the teacher user are learned as teacher data. This enables hypothesis verification based on the subjective judgment of the target user and empirical characteristic estimation based on hypothesis verification based on the objective facts of the target user.

次に、特性推定装置(推定手段)は、推定ユーザの行動履歴から抽出された行動情報と学習済みモデルとを用いて当該推定ユーザの特性を推定(予測)する(フェーズF4)。つまり、推定ユーザの行動履歴から抽出された行動情報が、学習済みモデルに入力されることで推定ユーザの特性が出力される。学習済みモデルは、例えば、複数の特性のそれぞれを目的変数とし1つの行動情報を説明変数としてモデル化されているので、推定ユーザ一人について複数の目的変数のそれぞれのセグメントに対する当てはまり度が算出され、その中で最大当てはまり度を算出したセグメントが採用されて推定ユーザの特性が決定される。例えば、後述する図6において、最大当てはまり度を算出したセグメントSe1の特性01が推定ユーザの特性として決定される。 Next, the characteristic estimation device (estimating means) estimates (predicts) the characteristics of the estimated user using the behavior information extracted from the behavior history of the estimated user and the learned model (Phase F4). That is, the behavior information extracted from the behavior history of the estimated user is input to the trained model, and the characteristics of the estimated user are output. Since the trained model is modeled using, for example, each of a plurality of characteristics as an objective variable and one behavioral information as an explanatory variable, the degree of fit of the plurality of objective variables to each segment is calculated for each estimated user. Among them, the segment for which the maximum fit is calculated is adopted to determine the characteristics of the estimated user. For example, in FIG. 6, which will be described later, the characteristic 01 of the segment Se1 for which the maximum fit degree is calculated is determined as the characteristic of the estimated user.

[2.通信システムSの概要構成及び機能]
次に、図3を参照して、本発明が適用される通信システムSの概要構成について説明する。図3は、通信システムSの概要構成の一例を示す図である。
[2. Overview of communication system S Configuration and functions]
Next, with reference to FIG. 3, the outline configuration of the communication system S to which the present invention is applied will be described. FIG. 3 is a diagram showing an example of an outline configuration of the communication system S.

図3に示すように、通信システムSは、アンケート管理サーバ(リサーチサーバ)1、行動履歴管理サーバ2、及び特性推定サーバ3等を含んで構成される。アンケート管理サーバ1、及び行動履歴管理サーバ2は、それぞれ、特性推定サーバ3との間で、例えばイントラネットを介して通信可能になっている。なお、アンケート管理サーバ1、行動履歴管理サーバ2、及び特性推定サーバ3は、1つのサーバにより構成されてもよい。 As shown in FIG. 3, the communication system S includes a questionnaire management server (research server) 1, an action history management server 2, a characteristic estimation server 3, and the like. The questionnaire management server 1 and the action history management server 2 can communicate with the characteristic estimation server 3, for example, via an intranet, respectively. The questionnaire management server 1, the action history management server 2, and the characteristic estimation server 3 may be configured by one server.

(2−1.アンケート管理サーバ1)
アンケート管理サーバ1は、対象ユーザに対して実施されたアンケートの結果を管理するサーバである。例えば、アンケート管理サーバ1は、アンケートに係る質問情報を複数の対象ユーザのそれぞれのユーザ端末UTm(m=1,2,3・・・)へインターネット等の通信ネットワークNWを介して送信し、アンケートに係る回答情報をそれぞれのユーザ端末UTmから受信し、それぞれの回答情報が示す回答をアンケート結果として、それぞれの対象ユーザのユーザIDに対応付けてアンケートデータベース(DB)101に格納する。なお、ユーザ端末UTmには、対象ユーザに使用されるものと、推定ユーザに使用されるものとがある。ユーザ端末UTmの例として、パーソナルコンピュータ、スマートフォン、タブレット、及びゲーム機等が挙げられる。
(2-1. Questionnaire management server 1)
The questionnaire management server 1 is a server that manages the results of questionnaires conducted on the target users. For example, the questionnaire management server 1 transmits question information related to the questionnaire to each user terminal UTm (m = 1, 2, 3 ...) Of a plurality of target users via a communication network NW such as the Internet, and conducts a questionnaire. The answer information according to the above is received from each user terminal UTm, and the answer indicated by each answer information is stored as a questionnaire result in the questionnaire database (DB) 101 in association with the user ID of each target user. The user terminal UTm includes one used by the target user and one used by the estimated user. Examples of the user terminal UTm include personal computers, smartphones, tablets, game machines, and the like.

アンケートに係る質問情報及び回答情報は、電子メールで対象ユーザのユーザ端末UTmへ送信されてもよいし、対象ユーザのユーザ端末UTmのブラウザやアプリケーションによるリクエストに応じて当該ユーザ端末UTmへ送信されてもよい。アンケートに係る質問情報には、対象ユーザの特性を判別するための複数の質問(アンケートの質問事項(設問))及び各質問に対する回答の選択肢(アンケート選択肢であり、例えば、5つ)が記述されており、アンケートに係る回答情報には、各質問に対して選択された回答が記述されている。なお、アンケート管理サーバ1は、本発明に係る特性推定装置の分類手段の機能を有してもよい。 The question information and the answer information related to the questionnaire may be sent to the user terminal UTm of the target user by e-mail, or may be sent to the user terminal UTm in response to a request from the browser or application of the user terminal UTm of the target user. May be good. In the question information related to the questionnaire, a plurality of questions (questionnaire questions (questions)) for determining the characteristics of the target user and answer options (questionnaire options, for example, five) for each question are described. In the answer information related to the questionnaire, the answer selected for each question is described. The questionnaire management server 1 may have a function of a classification means of the characteristic estimation device according to the present invention.

(2−2.行動履歴管理サーバ2)
行動履歴管理サーバ2は、オンラインまたはオフラインでユーザにより行われた行動の履歴(行動履歴)を管理するサーバである。例えば、行動履歴管理サーバ2は、ユーザ端末UTmや処理端末STn(n=1,2,3・・・)から通信ネットワークNWを介してアクセス可能なサーバSAo(o=1,2,3・・・)から、それぞれのユーザ(対象ユーザ及び推定ユーザ)の行動履歴を収集し、それぞれの行動履歴をそれぞれのユーザのユーザIDに対応付けて行動履歴データベース201に格納する。なお、処理端末STnの例として、例えば店舗に設置され、ユーザが所持する決済用カード(例えば、電子マネー決済やクレジット決済等が可能なICカード等)またはユーザ端末UTm(例えば、電子マネー決済やクレジット決済等が可能な決済用アプリケーションが搭載されたスマートフォン等)と通信可能な決済処理端末が挙げられる。また、処理端末STnの例として、商品等の展示会やイベント等の会場に設置された入場処理端末が挙げられる。
(2-2. Behavior history management server 2)
The action history management server 2 is a server that manages a history of actions (behavior history) performed by a user online or offline. For example, the action history management server 2 is a server SAo (o = 1,2,3 ...) that can be accessed from the user terminal UTm or the processing terminal STn (n = 1,2,3 ...) via the communication network NW. The action history of each user (target user and estimated user) is collected from (), and each action history is stored in the action history database 201 in association with the user ID of each user. As an example of the processing terminal STn, for example, a payment card installed in a store and possessed by the user (for example, an IC card capable of electronic money payment or credit card payment) or a user terminal UTm (for example, electronic money payment or the like) A payment processing terminal capable of communicating with a payment processing application (such as a smartphone equipped with a payment application capable of credit card payment) can be mentioned. Further, as an example of the processing terminal STn, there is an entrance processing terminal installed at a venue such as an exhibition or an event of a product or the like.

サーバSAoの例として、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、トラベル予約サーバ、テレビ視聴解析サーバ、決済処理サーバ、動画/楽曲ストリーミングサーバ、SNS(Social Networking Service)サーバ、チケット発行管理サーバ、及び実行動追跡サーバ等が挙げられる。ここで、より多くのサーバSAoから広く、ユーザの行動履歴を収集することができれば、学習済みモデルを用いた推定精度を向上させることが可能となる。そのため、ユーザを識別するユーザIDが、より多くのサーバSAo間で共通する、または関連付けるように構成することが望ましい。 Examples of server SAo include shopping server, free market server, auction server, travel reservation server, TV viewing analysis server, payment processing server, video / music streaming server, SNS (Social Networking Service) server, ticket issuance management server, and actual server. An action tracking server and the like can be mentioned. Here, if the user's behavior history can be widely collected from more servers SAo, it is possible to improve the estimation accuracy using the trained model. Therefore, it is desirable that the user ID that identifies the user is configured to be common or associated with more servers SAo.

行動履歴には、通信ネットワークNWを介してユーザがオンラインでおこなった行動(例えば、商品またはサービス等の検索、商品またはサービス等の閲覧、商品またはサービスに対する支払(購入)、商品またはサービス等に対する投稿等)の履歴ばかりでなく、ユーザが実店舗に赴いてオフラインでおこなった行動(例えば、商品やサービスに対する支払等)の履歴、さらにはユーザが商品等の展示会やイベント等に赴いて入場した行動の履歴等を含むとよい。行動履歴の例として、商品またはサービスの検索履歴、商品またはサービスの閲覧履歴、商品またはサービスのブックマーク登録履歴(お気に入り登録)、商品またはサービスの予約履歴(商品の場合、購入予約履歴)、商品またはサービスに対する支払履歴(商品の場合、購入履歴)、商品またはサービスに対するコメント(クチコミ)またはツイート等の投稿履歴、商品としての動画または楽曲の再生履歴、及び商品の展示会やイベント等の会場への入場履歴等が挙げられ、どの行動履歴が特性推定サーバ3により利用されるかは例えば管理者等により任意に設定される。 The action history includes actions performed online by the user via the communication network NW (for example, searching for a product or service, browsing a product or service, paying (purchasing) a product or service, posting a product or service, etc.). Etc.), as well as the history of actions that the user went to the actual store and performed offline (for example, payment for products and services), and the user went to an exhibition or event of the product etc. to enter. It is good to include the history of actions. Examples of behavior history are search history of goods or services, browsing history of goods or services, bookmark registration history of goods or services (favorite registration), reservation history of goods or services (purchase reservation history in the case of goods), goods or Payment history for services (purchase history in the case of products), posting history of comments (word-of-mouth) or tweets about products or services, playback history of videos or songs as products, and to venues such as product exhibitions and events The admission history and the like can be mentioned, and which action history is used by the characteristic estimation server 3 is arbitrarily set by, for example, an administrator or the like.

検索履歴及び閲覧履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、及びトラベル予約サーバに記憶される。検索履歴には、商品またはサービスの情報の公開日時(つまり、ユーザにより検索可能になった日時)、商品またはサービスの検索日時、検索条件(検索に用いられたキーワード)、及び検索対象の商品またはサービスの情報(例えば、ID、名称、カテゴリー、価格)等が含まれる。閲覧履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、及びトラベル予約サーバに記憶される。閲覧履歴には、商品またはサービスの情報の公開日時(つまり、ユーザにより閲覧可能になった日時)、商品またはサービスの閲覧日時、及び閲覧対象の商品またはサービスの情報(例えば、ID、名称、カテゴリー、価格)等が含まれる。 The search history and browsing history are stored in, for example, a shopping server, a flea market server, an auction server, and a travel reservation server. The search history includes the date and time when the information of the product or service was published (that is, the date and time when it became searchable by the user), the search date and time of the product or service, the search condition (keyword used for the search), and the product or the product to be searched. Service information (eg, ID, name, category, price) and the like are included. The browsing history is stored in, for example, a shopping server, a flea market server, an auction server, and a travel reservation server. The browsing history includes the publication date and time of the product or service information (that is, the date and time when the product or service became available for viewing), the browsing date and time of the product or service, and the information of the product or service to be browsed (for example, ID, name, category). , Price) etc. are included.

なお、閲覧履歴は、テレビ放送の電波受信によりテレビ画面に表示された商品またはサービスの閲覧履歴であってもよい。この場合、例えばユーザ端末UTm(例えば、スマートフォン)が搭載するマイクにより取得された音声データがテレビ視聴解析サーバにより取得される。そして、テレビ視聴解析サーバは、取得した音声データとオリジナル(マスタ)の音声データとを照合してユーザがどの時間の映像を視聴していたかを判定することで、商品またはサービスの閲覧日時、及び閲覧された商品またはサービスの情報を特定し、閲覧履歴として記憶する。或いは、テレビ画面にユーザへの選択ボタンの選択を促す情報を表示させ、例えばユーザ端末UTm(例えば、スマートフォン)に表示された選択ボタンがユーザにより押下されると、その押下信号がテレビ視聴解析サーバにより取得される。そして、テレビ視聴解析サーバは、取得した押下信号の取得日時からユーザがどの時間の映像を視聴していたかを判定することで、商品またはサービスの閲覧日時、及び閲覧された商品またはサービスの情報を特定し、閲覧履歴として記憶する。 The browsing history may be the browsing history of the product or service displayed on the TV screen by receiving the radio wave of the TV broadcast. In this case, for example, the audio data acquired by the microphone mounted on the user terminal UTm (for example, a smartphone) is acquired by the television viewing analysis server. Then, the TV viewing analysis server collates the acquired audio data with the original (master) audio data to determine at what time the user was watching the video, thereby determining the viewing date and time of the product or service, and the viewing date and time of the service. Identify the browsed product or service information and store it as a browsing history. Alternatively, when information prompting the user to select a selection button is displayed on the TV screen and the selection button displayed on the user terminal UTm (for example, a smartphone) is pressed by the user, the pressing signal is sent to the television viewing analysis server. Obtained by. Then, the TV viewing analysis server determines the viewing date and time of the product or service and the information of the viewed product or service by determining which time the user was watching the video from the acquisition date and time of the acquired pressing signal. Identify and store as browsing history.

ブックマーク登録履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、及びトラベル予約サーバに記憶される。ブックマーク登録履歴には、商品またはサービスの情報の公開日時、商品またはサービスのブックマーク登録日時、及びブックマーク登録対象の商品またはサービスの情報等が含まれる。予約履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、及びトラベル予約サーバに記憶される。予約履歴には、商品またはサービスの情報の公開日時、商品またはサービスの予約日時、及び予約対象の商品またはサービスの情報等が含まれる。支払履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、トラベル予約サーバ、及び決済処理サーバに記憶される。支払履歴には、商品またはサービスの情報の公開日時、商品またはサービスに対する支払日時、及び支払対象の商品またはサービスの情報等が含まれる。 The bookmark registration history is stored in, for example, a shopping server, a flea market server, an auction server, and a travel reservation server. The bookmark registration history includes the publication date and time of the product or service information, the bookmark registration date and time of the product or service, the information of the product or service to be bookmarked, and the like. The reservation history is stored in, for example, a shopping server, a flea market server, an auction server, and a travel reservation server. The reservation history includes the publication date and time of the product or service information, the reservation date and time of the product or service, the information of the product or service to be reserved, and the like. The payment history is stored in, for example, a shopping server, a flea market server, an auction server, a travel reservation server, and a payment processing server. The payment history includes the publication date and time of the information on the product or service, the payment date and time for the product or service, the information on the product or service to be paid, and the like.

投稿履歴は、例えば、ショッピングサーバ、フリーマーケットサーバ、オークションサーバ、トラベル予約サーバ、動画/楽曲ストリーミングサーバ、及びSNSサーバに記憶される。投稿履歴には、商品またはサービスの情報の公開日時、商品またはサービスに対するコメントまたはツイート等の投稿日時、投稿内容、投稿対象の商品またはサービスの情報等が含まれる。なお、投稿履歴には、投稿したユーザのフォロワー数が含まれるとよい。再生履歴は、例えば、動画/楽曲ストリーミングサーバに記憶される。再生履歴には、商品(動画または楽曲)の情報の公開日時、商品の再生日時、及び再生対象の商品の情報等が含まれる。 The posting history is stored in, for example, a shopping server, a flea market server, an auction server, a travel reservation server, a video / music streaming server, and an SNS server. The posting history includes the publication date and time of information on the product or service, the posting date and time of comments or tweets on the product or service, the content of the posting, information on the product or service to be posted, and the like. The posting history should include the number of followers of the user who posted. The playback history is stored in, for example, a video / music streaming server. The playback history includes the release date and time of the product (video or music) information, the playback date and time of the product, the information of the product to be played, and the like.

入場履歴は、例えば、チケット発行管理サーバに記憶される。入場履歴には、商品の展示会やイベント等の会場への入場日時、及び展示対象の商品の情報等が含まれる。例えば、チケット発行管理サーバにより発行されたチケットが会場に設置された処理端末STnにより検知されると、発行されたチケットの番号等がチケット発行管理サーバにより取得される。そして、チケット発行管理サーバは、取得したチケットの番号等の取得時刻から入場日時を判定し、当該チケットの番号等から展示対象の商品の情報を特定し、入場履歴として記憶する。 The admission history is stored in, for example, the ticket issuance management server. The admission history includes information on the date and time of admission to the venue such as an exhibition or event of the product, and information on the product to be exhibited. For example, when the ticket issued by the ticket issuance management server is detected by the processing terminal STn installed at the venue, the issued ticket number and the like are acquired by the ticket issuance management server. Then, the ticket issuance management server determines the admission date and time from the acquisition time of the acquired ticket number or the like, identifies the information of the product to be exhibited from the ticket number or the like, and stores it as the admission history.

なお、入場履歴は、実行動追跡サーバに記憶される場合もある。ユーザ端末UTmがGPS(Global Positioning System)機能、及びGPS機能により検出された位置情報(
緯度及び経度)を取得して実行動追跡サーバに送信するアプリケーションを搭載する場合、取得した位置情報を例えば所定時間間隔で実行動追跡サーバへ送信する。そして、実行動追跡サーバは、ユーザ端末UTmから受信した位置情報及び受信日時と、予め用意されたリストに記述される展示会やイベント等の会場の位置情報及び実施日時とを照合することで、ユーザが実際に当該会場に行ったと判定した場合、その会場への入場日時、及び展示対象の商品の情報等を含む入場履歴を記憶する。
The admission history may be stored in the execution behavior tracking server. Position information detected by the user terminal UTm by the GPS (Global Positioning System) function and the GPS function (
When an application that acquires (latitude and longitude) and sends it to the execution motion tracking server is installed, the acquired position information is transmitted to the execution motion tracking server, for example, at predetermined time intervals. Then, the execution motion tracking server collates the location information and the reception date and time received from the user terminal UTm with the location information and the implementation date and time of the venue such as an exhibition or event described in the list prepared in advance. When it is determined that the user has actually visited the venue, the admission history including the date and time of admission to the venue and information on the products to be exhibited is stored.

(2−3.特性推定サーバ3)
特性推定サーバ3は、単独で、またはアンケート管理サーバ1と共に、本発明に係る特性推定装置として機能するサーバである。図4(A)は、特性推定サーバ3のハードウェア構成例を示す図であり、図4(B)は、特性推定サーバ3のシステム制御部33の機能ブロック例を示す図である。なお、図示しないが、特性推定サーバ3にはオペレータの端末が接続可能になっている。
(2-3. Characteristic estimation server 3)
The characteristic estimation server 3 is a server that functions as a characteristic estimation device according to the present invention alone or together with the questionnaire management server 1. FIG. 4A is a diagram showing a hardware configuration example of the characteristic estimation server 3, and FIG. 4B is a diagram showing a functional block example of the system control unit 33 of the characteristic estimation server 3. Although not shown, an operator's terminal can be connected to the characteristic estimation server 3.

図4(A)に示すように、特性推定サーバ3は、通信部31、記憶部32、及びシステム制御部33等を備え、これらの構成要素はシステムバス34に接続されている。通信部31は、例えばイントラネットに接続され、アンケート管理サーバ1及び行動履歴管理サーバ2との間の通信状態の制御を行う。 As shown in FIG. 4A, the characteristic estimation server 3 includes a communication unit 31, a storage unit 32, a system control unit 33, and the like, and these components are connected to the system bus 34. The communication unit 31 is connected to, for example, an intranet, and controls the communication state between the questionnaire management server 1 and the action history management server 2.

記憶部32は、例えば、ハードディスクドライブ等により構成されており、OS及び本発明の特性推定プログラム等の各種プログラムを記憶する。なお、特性推定プログラムは、所定のサーバから特性推定サーバ3にダウンロードされてもよいし、CD、DVD、BDなどの記録媒体に記録(コンピュータにより読み取り可能に記録)されており、当該記録媒体から読み込まれて記憶部32に記憶されるようにしてもよい。 The storage unit 32 is composed of, for example, a hard disk drive or the like, and stores various programs such as the OS and the characteristic estimation program of the present invention. The characteristic estimation program may be downloaded from a predetermined server to the characteristic estimation server 3, or recorded on a recording medium such as a CD, DVD, or BD (recorded readable by a computer) from the recording medium. It may be read and stored in the storage unit 32.

また、記憶部32には、ユーザ情報データベース301等が構築されている。図5は、ユーザ情報データベース301の内容の一例を示す図である。図5に示すユーザ情報データベース301には、例えば所定のサイトの利用会員としてアカウントが発行された各ユーザのユーザID、ユーザ名、ユーザ種別、及び特性等が対応付けられて格納されている。ここで、ユーザ種別は、教師ユーザであるか否かを示す(図中、“1”が教師ユーザを示す)。ユーザの特性は、5つの特性01〜05のうち何れかの特性が付与されている。なお、ユーザ情報データベース301において特性が空欄のユーザは、まだ特性が推定されていないユーザである。 Further, a user information database 301 and the like are constructed in the storage unit 32. FIG. 5 is a diagram showing an example of the contents of the user information database 301. In the user information database 301 shown in FIG. 5, for example, the user ID, user name, user type, characteristics, and the like of each user whose account has been issued as a user member of a predetermined site are stored in association with each other. Here, the user type indicates whether or not the user is a teacher user (in the figure, "1" indicates a teacher user). As the user's characteristic, any one of the five characteristics 01 to 05 is given. The user whose characteristic is blank in the user information database 301 is a user whose characteristic has not been estimated yet.

システム制御部33(本発明におけるコンピュータの一例)は、CPU(Central Processing Unit)33a,ROM(Read Only Memory)33b,及びRAM(Random Access
Memory)33c等を備え、OS上で特性推定プログラム等を実行する。システム制御部
33は、特性推定プログラムを実行することにより、図4(B)に示すように、対象ユーザ分類部331、教師ユーザ特定部332、モデル生成部333、特性推定部334、モデル更新部335、及び分類基準変更部336等として機能する。なお、対象ユーザ分類部331は、本発明における分類手段の一例である。教師ユーザ特定部332は、本発明における判断手段の一例である。モデル生成部333は、本発明における生成手段の一例である。特性推定部334は、本発明における推定手段の一例である。モデル更新部335は、本発明における更新手段の一例である。分類基準変更部336は、本発明における変更手段の一例である。
The system control unit 33 (an example of a computer in the present invention) includes a CPU (Central Processing Unit) 33a, a ROM (Read Only Memory) 33b, and a RAM (Random Access).
Memory) 33c and the like are provided, and a characteristic estimation program and the like are executed on the OS. By executing the characteristic estimation program, the system control unit 33 executes the characteristic estimation program, and as shown in FIG. 4B, the target user classification unit 331, the teacher user identification unit 332, the model generation unit 333, the characteristic estimation unit 334, and the model update unit. It functions as 335, classification standard changing unit 336, and the like. The target user classification unit 331 is an example of the classification means in the present invention. The teacher user identification unit 332 is an example of the determination means in the present invention. The model generation unit 333 is an example of the generation means in the present invention. The characteristic estimation unit 334 is an example of the estimation means in the present invention. The model update unit 335 is an example of the update means in the present invention. The classification standard changing unit 336 is an example of the changing means in the present invention.

(2−3−1.対象ユーザ分類部331)
先ず、対象ユーザ分類部331は、アカウントが発行された全ユーザの中から決定された複数の対象ユーザ(つまり、全ユーザの中の一部のユーザ)のそれぞれに対するアンケートの結果をアンケート管理サーバ1のアンケートデータベース101から取得し、複数の対象ユーザのそれぞれの回答に基づいて、当該複数の対象ユーザを予め設定された複数の特性のうちのいずれかの特性に分類する。このような分類方法は種々考えられるが、例えば、質問に対する回答の選択肢と配点(得点の元になる点数)との対応関係を記述する回答配点表データと、合計得点(スコア)と特性との対応関係を記述する特性判別条件データ(換言すると、セグメント定義データ)とが用いられるとよい。
(2-3-1. Target user classification unit 331)
First, the target user classification unit 331 obtains the results of a questionnaire for each of a plurality of target users (that is, some users among all users) determined from all the users to whom the account has been issued. Based on the answers of the plurality of target users, the plurality of target users are classified into one of a plurality of preset characteristics. Various classification methods can be considered. For example, the answer score table data that describes the correspondence between the answer options for the question and the score (the score that is the basis of the score), and the total score (score) and the characteristics. Characteristic discrimination condition data (in other words, segment definition data) that describes the correspondence may be used.

一例として、回答配点表データでは、選択肢1(あてはまる)には+2点、選択肢2(まあまああてはまる)には+1点、選択肢3(どちらともいえない)には0点、選択肢4(あまりあてはまらない)には−1点、選択肢5(あてはまらない)には−2点、・・・というように対応付けられている。また、一例として、特性判別条件データでは、合計得点12点以上には特性C01(例えば、イノベータ)、合計得点5〜11には特性C02(例えば、アーリーアダプタ)、合計得点−2〜4には特性C03(例えば、アーリーマジョリティ)、・・・というように対応付けられている。 As an example, in the answer score table data, option 1 (applicable) has +2 points, option 2 (somewhat applicable) has +1 point, option 3 (neither can be said) has 0 points, and option 4 (not very applicable). ) Is associated with -1 point, option 5 (not applicable) is associated with -2 points, and so on. Further, as an example, in the characteristic discrimination condition data, the characteristic C01 (for example, an innovator) has a total score of 12 points or more, the characteristic C02 (for example, an early adopter) has a total score of 5 to 11, and the total score of 2 to 4 has a characteristic C02 (for example, an early adopter). The characteristics C03 (for example, early majority), ... Are associated with each other.

例えば、対象ユーザ分類部331は、上記回答配点表データを参照することで、各質問に対する回答(何れかの選択肢)に対応する得点を質問毎に決定し、決定した各得点を全質問について合計することで合計得点を算出(対象ユーザ毎に算出)する。そして、対象ユーザ分類部331は、特性判別条件データを参照し、算出した合計得点に対応する特性を対象ユーザに付与することで、当該複数の対象ユーザを複数の特性のうちのいずれかの特性に分類(対象ユーザ毎に分類)する。こうして、対象ユーザに付与された特性は、当該対象ユーザのユーザIDに対応付けられてユーザ情報データベース301に格納されることになる。 For example, the target user classification unit 331 determines the score corresponding to the answer (any option) to each question for each question by referring to the above answer score table data, and totals each determined score for all the questions. By doing so, the total score is calculated (calculated for each target user). Then, the target user classification unit 331 refers to the characteristic discrimination condition data and assigns the characteristic corresponding to the calculated total score to the target user, thereby assigning the plurality of target users to any one of the plurality of characteristics. (Classify by target user). In this way, the characteristics given to the target user are stored in the user information database 301 in association with the user ID of the target user.

なお、アンケート管理サーバ1が複数の対象ユーザのそれぞれの回答に基づいて、当該複数の対象ユーザを予め設定された複数の特性のうちのいずれかの特性に分類してもよい。この場合、対象ユーザ分類部331は、対象ユーザ(ユーザID)と特性との対応関係を示す情報をアンケート管理サーバ1から取得することになる。 The questionnaire management server 1 may classify the plurality of target users into one of a plurality of preset characteristics based on the responses of the plurality of target users. In this case, the target user classification unit 331 acquires information indicating the correspondence between the target user (user ID) and the characteristics from the questionnaire management server 1.

(2−3−2.教師ユーザ特定部332)
次に、教師ユーザ特定部332は、複数の対象ユーザのそれぞれの行動履歴を行動履歴管理サーバ2の行動履歴データベース201から取得し、取得した行動履歴がアンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを対象ユーザ毎に判断し、当該対象ユーザのうち行動履歴が上記基準を満たすと判断された対象ユーザを教師ユーザとして特定する。ここで、「特性に関連して設定された基準」には、「特性ごとに設定された基準」、「特性を横断した連続性を有する基準」、及び「ユーザ全体の行動履歴に基づく行動分布と特性との対応関係を示す基準」のうち、少なくとも何れか一つが含まれる。特性ごとに設定された基準を満たすか否かの判断には、例えば、アンケートの質問事項や回答の選択肢に使われる用語と共通する属性の情報(商品名やサービス名など)を検索しているか、当該情報における商品を購買しているか、当該情報におけるサービスを利用しているか、または、商品名やサービス名だけでなく、共通のブランド、店舗を含む検索、これに関わる行動(購買行動や利用行動など)をしているか、を判断することを含むとよい。さらに、この基準を満たすか否かの判断には、アンケートの質問事項等に関連する地域や時期の検索、当該地域や時期に行動(購買行動や利用行動など)をしているかを判断することを含むとよい。
(2-3-2. Teacher user identification unit 332)
Next, the teacher user identification unit 332 acquires the behavior history of each of the plurality of target users from the behavior history database 201 of the behavior history management server 2, and the acquired behavior history is related to the characteristics based on the hypothesis common to the questionnaire. It is determined for each target user whether or not the criteria set in the above are satisfied, and among the target users, the target user whose action history is determined to meet the above criteria is specified as a teacher user. Here, the "criteria set in relation to the characteristics" include "criteria set for each characteristic", "criteria having continuity across the characteristics", and "behavior distribution based on the behavior history of the entire user". At least one of the "criteria showing the correspondence between the characteristics and the characteristics" is included. To determine whether or not the criteria set for each characteristic are met, for example, are you searching for information on attributes (product name, service name, etc.) that are common to the terms used in questionnaire questions and answer options? , Are you purchasing the product in the information, or are using the service in the information, or search including not only the product name and service name but also the common brand and store, and the behavior related to this (purchasing behavior and use) It should include determining whether or not you are doing (acting, etc.). Furthermore, in order to judge whether or not this criterion is met, it is necessary to search for the area and time related to the questions in the questionnaire, and to judge whether or not the person is taking action (purchasing behavior, usage behavior, etc.) in the area or time. May be included.

また、特性を横断した連続性を有する基準を満たすか否かの判断の例として、特定の商品(例えば、トレンド商品)が一般公開されてから対象ユーザがそのウェブページにアクセスするまでの時間(アクセスタイミング)に基づいて、当該公開から例えば3日以内に上記ウェブページにアクセスしていたのか(この場合、特性01に該当)、或いは、4日以降かつ14日以内に上記ウェブページにアクセスしていたのか(この場合、特性02に該当)、を判断することが挙げられる。この場合、例えば、特性01に分類された対象ユーザが、4日以降かつ14日以内に上記ウェブページにアクセスしていた場合、当該基準を満たさないとして教師ユーザから除外される。また、ユーザ全体の行動履歴に基づく行動分布(換言すると、実行動データ集合の分布)と特性との対応関係を示す基準の例として、ある分野(例えば、自動車分野)のソーシャルメディアのアクセスログの全体分布(行動分布)において特性01から特性05の中で、特性01や特性02は特性04や特性05よりも当該分野のソーシャルメディアにおける情報発信量や情報受信量が多いという基準が挙げられる。この場合、例えば、アンケートにより特性01に分類された対象ユーザの情報発信量が当該ソーシャルメディアのアクセスログの全体分布のうち、下位レベル(例えば、平均以下の分布層)に含まれる場合、当該基準を満たさないとして教師ユーザから除外される。 In addition, as an example of determining whether or not a criterion having continuity across characteristics is satisfied, the time from when a specific product (for example, a trend product) is opened to the public until the target user accesses the web page ( Based on the access timing), did you access the above web page within 3 days from the publication (in this case, it corresponds to characteristic 01), or accessed the above web page after 4 days and within 14 days. It is possible to judge whether or not it was (in this case, it corresponds to the characteristic 02). In this case, for example, if the target user classified into the characteristic 01 accesses the web page after 4 days and within 14 days, the target user is excluded from the teacher user because it does not satisfy the criteria. In addition, as an example of a standard showing the correspondence between the behavior distribution (in other words, the distribution of the execution dynamic data set) based on the behavior history of the entire user and the characteristics, the access log of social media in a certain field (for example, the automobile field) Among the characteristics 01 to 05 in the overall distribution (behavior distribution), there is a criterion that the characteristic 01 and the characteristic 02 have a larger amount of information transmission and information reception in the social media in the field than the characteristic 04 and the characteristic 05. In this case, for example, when the amount of information transmitted by the target user classified into the characteristic 01 by the questionnaire is included in the lower level (for example, the distribution layer below the average) of the overall distribution of the access log of the social media, the criterion is used. Is excluded from the teacher user as not satisfying.

教師ユーザを特定するための好適な例として、教師ユーザ特定部332は、個々の事象から蓋然性の高い特性を導き出す帰納的な仮説検証項目群を特性ごとに設定(仮説検証項目は特性間で重複してもよい)し、対象ユーザの行動履歴から抽出された行動情報に基づいて、当該仮説検証項目群に対する該当率が所定の割合を超えたか否かを判断し、当該該当率が所定の割合を超えた対象ユーザ(つまり、基準を満たすと判断された対象ユーザ)を教師ユーザとして特定するとよい。ここで、仮説検証項目群に対する該当率は、例えば、複数の仮説検証項目のそれぞれに対する該当有無(該当するか否か)を対象ユーザの行動履歴に基づいて算出した結果に基づく(=該当数/仮説検証項目の総数)。仮説検証項目群は、アンケートと共通の仮説に基づき特性ごとに設定されるものであり、例えば、アンケートの質問及び回答の選択肢に対応し、アンケートの質問及び回答の選択肢を補完する項目群とするとよい。これにより、例えば、あるトレンド商品や新製品を購入した対象ユーザがアンケート結果に基づき特性01と判別されたときに、その対象ユーザについての仮説検証項目群に対する該当率から当該特性01の確からしさを判断(換言すると、特性01であることを実証)することができる。例えば、特定の商品(例えば、新製品)またはサービスの予約注文の有無、特定の商品(例えば、トレンド商品)またはサービスの検索または閲覧の有無、特定の商品(例えば、トレンド商品)の購入の有無、特定のサービスの利用の有無、公開された情報(例えば、特定の商品またはサービスの情報)へのユーザのアクセスタイミング、公開された情報(例えば、特定の商品またはサービスの情報)に対するユーザの情報発信量、及び公開された情報に対するユーザの行動力(例えば、特定の商品の展示会やイベント等の会場へ行ったか否か)などに基づいて仮説検証項目群が設定される。 As a preferred example for identifying a teacher user, the teacher user identification unit 332 sets a group of inductive hypothesis verification items for each characteristic to derive highly probable characteristics from individual events (hypothesis verification items overlap between characteristics). Then, based on the behavior information extracted from the behavior history of the target user, it is determined whether or not the corresponding rate for the hypothesis verification item group exceeds the predetermined ratio, and the corresponding ratio is the predetermined ratio. It is advisable to identify the target user exceeding the above (that is, the target user determined to meet the criteria) as the teacher user. Here, the hit rate for the hypothesis verification item group is based on, for example, the result of calculating whether or not each of the plurality of hypothesis verification items is applicable (whether or not it is applicable) based on the behavior history of the target user (= number of applicable items /). Total number of hypothesis verification items). The hypothesis verification item group is set for each characteristic based on the hypothesis common to the questionnaire. For example, it is assumed that the item group corresponds to the question and answer options of the questionnaire and complements the question and answer options of the questionnaire. Good. As a result, for example, when the target user who purchased a certain trend product or new product is determined to have the characteristic 01 based on the questionnaire result, the certainty of the characteristic 01 is determined from the corresponding rate for the hypothesis verification item group for the target user. Judgment (in other words, demonstrating that it is characteristic 01) can be made. For example, whether or not a specific product (for example, a new product) or service is pre-ordered, whether or not a specific product (for example, a trend product) or service is searched or browsed, and whether or not a specific product (for example, a trend product) is purchased. , Whether or not a specific service is used, when the user accesses public information (for example, information on a specific product or service), and information about the user regarding public information (for example, information on a specific product or service). A hypothesis verification item group is set based on the amount of transmission and the user's ability to act on the disclosed information (for example, whether or not he / she went to a venue such as an exhibition or event of a specific product).

ここで、情報発信量とは、例えば、コメント(またはツイート)の投稿数と、1コメント(または1ツイート)あたりのデータ量(文字数でもよい)とのうちの少なくとも何れか一方である。また、アクセスタイミングは、例えば、情報(例えば、商品またはサービスの情報)が公開された日から3日以内までのアクセス、情報が公開された日から4日〜14日までのアクセス、・・・というように複数段階に分けることができる。情報発信量は、公開された情報に対するコメント投稿数100件以上(または、1コメントあたりの文字数が300文字以上)、公開された情報に対するコメント投稿数60件〜99件(または、1コメントあたりの文字数が100〜299文字)、・・・というように複数段階に分けることができる。教師ユーザ特定部332は、ユーザのフォロワー数に基づいて仮説検証項目群を設定してもよい。なお、前述の基準を用いることにより、特性推定サーバ3は、特性を横断した連続性を有する仮説検証項目(例えば、アクセスタイミング)における複数段階のうち、どの段階に該当するかを対象ユーザの行動履歴に基づいて判断し、当該判断された段階(例えば、公開された日から3日以内までのアクセス)と、アンケート結果に基づき分類された当該対象ユーザの特性と、が関連(または合致)する場合に当該対象ユーザを教師ユーザとして特定してもよい。また、特性推定サーバ3は、ユーザ全体の行動履歴に基づく行動分布と特性との対応関係を示す仮説検証項目において、当該行動分布中のどのレベルに該当するかを対象ユーザの行動履歴に基づいて判断し、当該判断されたレベル(例えば、下位レベル)と、アンケート結果に基づき分類された当該対象ユーザの特性と、が関連(または合致)する場合に当該対象ユーザを教師ユーザとして特定してもよい。 Here, the amount of information transmission is, for example, at least one of the number of comments (or tweets) posted and the amount of data (or the number of characters) per comment (or tweet). The access timing is, for example, access within 3 days from the date when the information (for example, product or service information) is published, access from the date when the information is published to 4 to 14 days, ... It can be divided into multiple stages. The amount of information sent is 100 or more comments posted for published information (or 300 characters or more per comment), and 60 to 99 comments posted for published information (or per comment). The number of characters is 100 to 299 characters), and so on, and it can be divided into a plurality of stages. The teacher user identification unit 332 may set a hypothesis verification item group based on the number of followers of the user. By using the above-mentioned criteria, the characteristic estimation server 3 determines which stage of the plurality of stages in the hypothesis verification item (for example, access timing) having continuity across the characteristics corresponds to the behavior of the target user. Judgment based on history, the stage of judgment (for example, access within 3 days from the date of publication) and the characteristics of the target user classified based on the questionnaire result are related (or matched). In some cases, the target user may be specified as a teacher user. Further, the characteristic estimation server 3 determines which level in the behavior distribution corresponds to the hypothesis verification item showing the correspondence between the behavior distribution and the characteristic based on the behavior history of the entire user based on the behavior history of the target user. Even if it is judged and the judged level (for example, lower level) and the characteristics of the target user classified based on the questionnaire result are related (or matched), the target user is specified as a teacher user. Good.

(2−3−3.モデル生成部333)
次に、モデル生成部333は、教師ユーザ特定部332により特定された教師ユーザの行動履歴から抽出された行動情報を説明変数とし、教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成する。ここで、行動情報は、例えば複数項目のデータを設定可能なデータフォーマットに行動履歴から抽出されたデータを設定することで得られる。この項目の例として、特定の商品またはサービスの予約注文の有無、特定の商品またはサービスの検索または閲覧の有無、特定の商品の購入の有無、特定のサービスの利用の有無、検索回数(または検索頻度)、検索条件、閲覧回数(または閲覧頻度)、支払回数(または支払頻度)、投稿回数(投稿頻度)、アクセスタイミング、情報発信量などが挙げられる。
(2-3-3. Model generation unit 333)
Next, the model generation unit 333 has learned by using the behavior information extracted from the behavior history of the teacher user specified by the teacher user identification unit 332 as an explanatory variable and learning data using the characteristics of the teacher user as an objective variable. Generate a model. Here, the action information can be obtained, for example, by setting the data extracted from the action history in a data format in which data of a plurality of items can be set. Examples of this item are whether or not you have a pre-order for a particular product or service, whether or not you have searched or browsed for a particular product or service, whether or not you have purchased a particular product, whether or not you have used a particular service, and how many searches (or searches) Frequency), search conditions, browsing frequency (or browsing frequency), payment frequency (or payment frequency), posting frequency (posting frequency), access timing, information transmission amount, and the like.

学習済みモデルには、例えば、決定木が採用される。決定木とは、所定の分岐ルール(分類基準の一例)にしたがって条件分岐によりセグメントを分割して分類する手法である。このような決定木において、複数の目的変数のそれぞれのセグメントに対する当てはまり度が算出される。図6は、決定木における条件分岐の例を示す概念図である。図6に示すセグメント内には、それぞれの特性と特定された人数の割合(出現率)を示している。図6に示すセグメントSe1及びSe2内の“x”,“xx”は、それぞれ、数値を示しており、“x”よりも“xx”の方が大きい数値であることを示す。 For the trained model, for example, a decision tree is adopted. The decision tree is a method of dividing and classifying segments by conditional branching according to a predetermined branching rule (an example of a classification standard). In such a decision tree, the degree of fit of a plurality of objective variables for each segment is calculated. FIG. 6 is a conceptual diagram showing an example of conditional branching in a decision tree. In the segment shown in FIG. 6, each characteristic and the ratio (appearance rate) of the specified number of people are shown. “X” and “xx” in the segments Se1 and Se2 shown in FIG. 6 indicate numerical values, respectively, and indicate that “xx” is a larger numerical value than “x”.

例えば、アンケートにより分類された教師データは、特性01〜特性05に分類され、それぞれの特性について人数の割合(出現率)が特定される。この集合が、様々な説明変数を用いて目的変数とする特性毎に分類される。ここでは、例えば、商品ABCの購入(X1)、商品XYZの購入(X2)、所定のトレンドを表現するキーワードの検索(X3)、を含む項目が説明変数となる分岐ルールが設定されたことになる。これらを説明変数として決定木を用いて分類していくと、例えば、セグメントSe1は一つの特性01の出現率xxが規定値yy以上になったことを示す。この場合の説明変数は分岐ルールを参照するとX1とX2となる。このように、一つの目的変数である特性01の当てはまり度が所定の基準以上となるように分岐ルールが設定され、説明変数X1、X2を用いた分類として特定される。同様に、セグメントSe2は特性02の出現率xxが規定以上となるような分岐ルールにより説明変数X1、X2、X3とした特性02の集合として特定される。 For example, the teacher data classified by the questionnaire is classified into characteristic 01 to characteristic 05, and the ratio of the number of people (appearance rate) is specified for each characteristic. This set is classified according to the characteristics that are the objective variables using various explanatory variables. Here, for example, a branch rule has been set in which items including items including purchase of product ABC (X1), purchase of product XYZ (X2), and search for a keyword expressing a predetermined trend (X3) are set as explanatory variables. Become. When these are classified using a decision tree as an explanatory variable, for example, the segment Se1 shows that the appearance rate xx of one characteristic 01 is equal to or higher than the specified value yy. The explanatory variables in this case are X1 and X2 when referring to the branch rule. In this way, the branching rule is set so that the degree of fit of the characteristic 01, which is one objective variable, is equal to or higher than a predetermined reference, and the classification is specified as the classification using the explanatory variables X1 and X2. Similarly, the segment Se2 is specified as a set of characteristics 02 with explanatory variables X1, X2, and X3 by a branching rule such that the appearance rate xx of the characteristic 02 is equal to or higher than the specified value.

なお、学習済みモデルの生成において、複数の教師ユーザのそれぞれの教師データのうち、一部の教師データをトレーニングデータとして学習済みモデルを構築し、残りの一部をテストデータとして学習済みモデルの検証を行うとよい。また、学習済みモデルを生成するための教師有りの機械学習のアルゴリズムは、特に限定されるものではないが、例えば、勾配ブースティング(Gradient Boosting)、または勾配ブースティングとランダム
フォレスト(Random Forests)を組み合わせたXGBoostが用いられてもよい。勾配ブース
ティングは、複数の決定木を作成して集団で学習させる方法であり、学習済みモデルとして複数の決定木を構築し、1つ前までの決定木の情報を用いて新たな決定木を構築していくブースティングを行うようになっている。具体的には、1つ前の決定木では予測できなかった損失関数の勾配を目的変数として新たな決定木が構築される。各決定木において、説明変数は根から枝に行く途中で条件により分類され、末端の葉に辿り着くと、当該末端の葉に与えられた値が予測値として返されるようになっている。XGBoostは、勾配ブース
ティングの方法と基本的には同じであるが、ランダムフォレストを採用しているため、全ての説明変数が使用されるのではなく、ランダムに決定された割合で説明変数の数が選定されて決定木が構築される。
In the generation of the trained model, of the teacher data of each of the plurality of teacher users, a trained model is constructed using some teacher data as training data, and the remaining part is used as test data to verify the trained model. It is good to do. Also, the supervised machine learning algorithms for generating trained models are not particularly limited, but for example, Gradient Boosting, or Gradient Boosting and Random Forests. The combined XG Boost may be used. Gradient boosting is a method of creating multiple decision trees and training them in a group. It constructs multiple decision trees as a trained model and uses the information of the previous decision tree to create a new decision tree. It is designed to be boosted to build. Specifically, a new decision tree is constructed with the gradient of the loss function, which could not be predicted by the previous decision tree, as the objective variable. In each decision tree, the explanatory variables are classified according to the conditions on the way from the root to the branch, and when the terminal leaf is reached, the value given to the terminal leaf is returned as a predicted value. XGBoost is basically the same as the gradient boosting method, but because it uses a random forest, not all explanatory variables are used, but the number of explanatory variables at a randomly determined rate. Is selected and a decision tree is constructed.

(2−3−4.特性推定部334)
次に、特性推定部334は、例えば所定のサイトの利用会員としてアカウントが発行された全ユーザの中から推定対象として決定された推定ユーザ(教師ユーザ以外のユーザ)の行動履歴を行動履歴管理サーバ2の行動履歴データベース201から取得し、取得した行動履歴から抽出された行動情報と、モデル生成部333により生成された学習済みモデルとを用いて、当該推定ユーザの特性を推定する。すなわち、特性推定部334は、行動履歴から抽出された行動情報を学習済みモデルに入力することで当該行動情報に対する特性(予測値)を得る。こうして推定ユーザについて推定された特性は、当該推定ユーザのユーザIDに対応付けられてユーザ情報データベース301に格納されることになる。なお、推定ユーザの行動履歴が更新された場合、特性推定部334は、当該更新された行動履歴から抽出された行動情報と、学習済みモデルとを用いて当該推定ユーザの特性を再推定することにより更新するとよい。これにより、推定ユーザついて推定される特性を当該推定ユーザの行動履歴の変化に対応させることができる。
(2-3-4. Characteristic estimation unit 334)
Next, the characteristic estimation unit 334 uses the behavior history management server to collect the behavior history of the estimated user (user other than the teacher user) determined as the estimation target from all the users whose accounts have been issued as members of the predetermined site, for example. The characteristics of the estimated user are estimated using the behavior information acquired from the behavior history database 201 of 2 and extracted from the acquired behavior history and the learned model generated by the model generation unit 333. That is, the characteristic estimation unit 334 obtains the characteristics (predicted value) for the behavior information by inputting the behavior information extracted from the behavior history into the trained model. The characteristics estimated for the estimated user in this way are associated with the user ID of the estimated user and stored in the user information database 301. When the behavior history of the estimated user is updated, the characteristic estimation unit 334 re-estimates the characteristics of the estimated user using the behavior information extracted from the updated behavior history and the learned model. It is recommended to update by. As a result, the characteristics estimated for the estimated user can be made to correspond to the change in the behavior history of the estimated user.

(2−3−5.モデル更新部335)
対象ユーザの行動履歴が更新されることで教師ユーザの行動履歴が更新された場合、モデル更新部335は、当該更新された行動履歴から抽出された行動情報を説明変数とし、教師ユーザの特性を目的変数とした学習データを用いて学習済みモデル(学習済みモデルにおける係数(パラメータ))を更新する。これにより、例えば所定期間毎に変化するトレンド(流行)等に応じて学習済みモデルを更新することができる。この場合において、教師ユーザ特定部332は、更新された、教師ユーザの行動履歴が上記基準を満たすか否かを判断し、モデル更新部335は、当該基準を満たすと判断された教師ユーザの更新された行動履歴から抽出された行動情報を説明変数とし、当該教師ユーザの特性を目的変数とした学習データを用いて学習済みモデルを更新するとよい。これにより、教師ユーザの行動履歴の変化に追従して、学習済みモデルによる推定精度を高めていくことができる。
(2-3-5. Model update unit 335)
When the behavior history of the teacher user is updated by updating the behavior history of the target user, the model update unit 335 uses the behavior information extracted from the updated behavior history as an explanatory variable and sets the characteristics of the teacher user. The trained model (factor (parameter) in the trained model) is updated using the training data used as the objective variable. As a result, the trained model can be updated according to, for example, a trend (trend) that changes at predetermined intervals. In this case, the teacher user identification unit 332 determines whether or not the updated behavior history of the teacher user satisfies the above criteria, and the model update unit 335 updates the teacher user determined to meet the criteria. It is advisable to update the trained model using the training data with the behavior information extracted from the behavior history as the explanatory variable and the characteristics of the teacher user as the objective variable. As a result, it is possible to improve the estimation accuracy by the trained model by following the change in the behavior history of the teacher user.

また、教師ユーザの行動履歴が更新されることによる学習済みモデルの更新間隔は、推定ユーザの特性の更新(再推定)間隔よりも長くなるようにするとよい。これにより、教師ユーザの行動履歴が更新されることによる学習済みモデルの更新を最低限に留め、サーバ負荷を低減することができる。なお、モデル更新部335は、推定ユーザの特性が推定された場合、当該推定ユーザの行動履歴から抽出された行動情報を説明変数とし、当該推定ユーザの推定された特性を目的変数とした学習データを用いて学習済みモデルを更新してもよい。 Further, the update interval of the trained model due to the update of the behavior history of the teacher user may be longer than the update (re-estimation) interval of the characteristics of the estimated user. As a result, the update of the trained model due to the update of the behavior history of the teacher user can be minimized, and the server load can be reduced. When the characteristics of the estimated user are estimated, the model update unit 335 uses the behavior information extracted from the behavior history of the estimated user as an explanatory variable, and the learning data using the estimated characteristics of the estimated user as an objective variable. The trained model may be updated using.

(2−3−6.分類基準変更部336)
推定ユーザの行動履歴が更新された場合、分類基準変更部336は、上記学習済みモデルにおける所定の分岐ルールにおいて、推定された特性に属する推定ユーザの出現率が同等となる条件、および、推定された特性に属する推定ユーザが所定の一致度を有する条件、を満たすように、当該分岐ルールを変更する。この理由を以下に説明する。
(2-3-6. Classification Criteria Change Unit 336)
When the behavior history of the estimated user is updated, the classification standard changing unit 336 sets the condition that the appearance rate of the estimated user belonging to the estimated characteristic is the same in the predetermined branching rule in the trained model, and is estimated. The branching rule is modified so that the presumed user belonging to the above characteristic satisfies the condition that the estimated user has a predetermined degree of matching. The reason for this will be explained below.

推定ユーザの行動履歴が変化することにより、例えば、図6に示す「商品XYZ」を購入
した人数が増えると、分岐ルールでは、特性01の出現率(例えば、10%)が増加してしまう。そのため、特性01の出現率が例えば10%で同等に維持されるよう(つまり、推定
された特性に属する推定ユーザの出現率が同等となる条件を満たすよう)、分岐ルールを変更する(この変更は、学習済みモデルの変更に相当)。分岐ルールを変更の例として、説明変数の「商品XYZ」購入(X2)の重み付け(係数)を変えること、説明変数の「商品XYZ」購入(X2)を「商品ABC」購入(X1)に入れ替えること、「商品ABC」購入(X1)の分岐を新たに追加すること、などの分岐構成を変えることが挙げられる。言い換えれば、推定ユーザの行動履歴が変更されると、学習済みモデルの変数構成や重みづけが変わるので、その変更を加味して全体最適なモデルを作り直す。
As the behavior history of the estimated user changes, for example, when the number of people who purchase the "product XYZ" shown in FIG. 6 increases, the appearance rate of the characteristic 01 (for example, 10%) increases in the branch rule. Therefore, the branching rule is changed so that the appearance rate of the characteristic 01 is maintained at the same level, for example, at 10% (that is, the appearance rate of the estimated users belonging to the estimated characteristics is satisfied). Equivalent to changing the trained model). As an example of changing the branching rule, change the weighting (coefficient) of the explanatory variable "product XYZ" purchase (X2), and replace the explanatory variable "product XYZ" purchase (X2) with "product ABC" purchase (X1). That, adding a new branch for purchasing "Product ABC" (X1), and changing the branch configuration. In other words, when the behavior history of the estimated user is changed, the variable configuration and weighting of the trained model change, so the change is taken into consideration to recreate the overall optimal model.

しかし、出現率を同等に維持するだけでは全く違う分類になってしまうことが想定されるので、制約条件として、学習済みモデルの変更前後で個々の推定ユーザが他の特性に移ってしまう割合を低く設定(例えば、学習済みモデルの変更前後の一致度を9割以上に設定)する(つまり、推定された特性に属する推定ユーザが所定の一致度を有する条件を満たすように設定する)。これにより、特性が推定された推定ユーザの行動履歴の変化に追従して、学習済みモデルによる推定精度を高めていくことができる。 However, it is assumed that the classification will be completely different if the appearance rates are kept the same, so as a constraint condition, the rate at which each estimated user shifts to another characteristic before and after the change of the trained model is set. Set low (for example, set the degree of matching before and after the change of the trained model to 90% or more) (that is, set so that the estimated user belonging to the estimated characteristic satisfies the condition having a predetermined degree of matching). As a result, it is possible to improve the estimation accuracy by the trained model by following the change in the behavior history of the estimated user whose characteristics have been estimated.

なお、推定ユーザの行動履歴が更新されることによる(分類基準変更部336による)学習済みモデルの変更間隔は、教師ユーザの行動履歴が更新されることによる(モデル更新部335による)学習済みモデルの更新間隔よりも短くなるようにするとよい。これにより、教師ユーザの行動履歴が更新されることによる学習済みモデルの更新を最低限に留め、サーバ負荷を低減することができる。 The change interval of the trained model due to the update of the behavior history of the estimated user (according to the classification standard change unit 336) is the trained model due to the update of the behavior history of the teacher user (according to the model update unit 335). It is better to make it shorter than the update interval of. As a result, the update of the trained model due to the update of the behavior history of the teacher user can be minimized, and the server load can be reduced.

[3.特性推定サーバ3の各種処理]
次に、特性推定サーバ3のシステム制御部33により実行される各種処理について説明する。
[3. Various processes of the characteristic estimation server 3]
Next, various processes executed by the system control unit 33 of the characteristic estimation server 3 will be described.

(3−1.学習済みモデル生成処理)
先ず、図7を参照して、システム制御部33により実行される学習済みモデル生成処理について説明する。図7は、システム制御部33により実行される学習済みモデル生成処理の一例を示すフローチャートである。
(3-1. Trained model generation process)
First, the trained model generation process executed by the system control unit 33 will be described with reference to FIG. 7. FIG. 7 is a flowchart showing an example of the trained model generation process executed by the system control unit 33.

図7に示す学習済みモデル生成処理は、例えばオペレータからの指示に応じて開始される。図7に示す処理が開始されると、システム制御部33は、ユーザ情報データベース301から特定可能な複数の対象ユーザ(予め決定された複数の対象ユーザ)のそれぞれのアンケート結果をアンケート管理サーバ1のアンケートデータベース101から取得する(ステップS1)。例えば、システム制御部33は、それぞれの対象ユーザのユーザID(またはユーザ名)が記述された対象ユーザリストを含む要求をアンケート管理サーバ1へ送信することで、それぞれの対象ユーザのアンケート結果をアンケート管理サーバ1から取得する。こうして取得されたアンケート結果は、例えば、それぞれの対象ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。 The trained model generation process shown in FIG. 7 is started in response to an instruction from an operator, for example. When the process shown in FIG. 7 is started, the system control unit 33 sends the questionnaire results of the plurality of target users (plurality of predetermined target users) that can be identified from the user information database 301 to the questionnaire management server 1. Obtained from the questionnaire database 101 (step S1). For example, the system control unit 33 questionnaires the questionnaire results of each target user by transmitting a request including a target user list in which the user ID (or user name) of each target user is described to the questionnaire management server 1. Obtained from management server 1. The questionnaire result acquired in this way is stored in the memory in association with the user ID (or user name) of each target user, for example.

次いで、システム制御部33は、上記複数の対象ユーザのそれぞれの行動履歴を行動履歴管理サーバ2の行動履歴データベース201から取得する(ステップS2)。例えば、システム制御部33は、上記対象ユーザリストを含む要求を行動履歴管理サーバ2へ送信することで、それぞれの対象ユーザの行動履歴を行動履歴管理サーバ2から取得する。こうして取得された行動履歴は、例えば、それぞれの対象ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。 Next, the system control unit 33 acquires the action history of each of the plurality of target users from the action history database 201 of the action history management server 2 (step S2). For example, the system control unit 33 acquires the action history of each target user from the action history management server 2 by transmitting the request including the target user list to the action history management server 2. The action history acquired in this way is stored in the memory in association with the user ID (or user name) of each target user, for example.

次いで、システム制御部33は、アンケート結果及び行動履歴が取得された対象ユーザの中から対象ユーザを1人選定(例えば、ユーザIDまたはユーザ名により選定)する(ステップS3)。 Next, the system control unit 33 selects one target user (for example, by user ID or user name) from the target users for which the questionnaire result and the action history have been acquired (step S3).

次いで、システム制御部33(対象ユーザ分類部331)は、ステップS3で選定された対象ユーザのアンケート結果(回答)に基づいて、当該対象ユーザが予め設定された複数の特性のうちのいずれかの特性に分類されるかを特定する(ステップS4)。これにより特定された特性は、例えば、当該対象ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。 Next, the system control unit 33 (target user classification unit 331) has one of a plurality of characteristics preset by the target user based on the questionnaire result (answer) of the target user selected in step S3. It is specified whether it is classified into a characteristic (step S4). The characteristics identified by this are stored in the memory in association with, for example, the user ID (or user name) of the target user.

次いで、システム制御部33(教師ユーザ特定部332)は、ステップS3で選定された対象ユーザの行動履歴がアンケートと共通の仮説に基づき設定された基準を満たすか否かを判断する(ステップS5)。システム制御部33(教師ユーザ特定部332)は、当該対象ユーザの行動履歴が当該基準を満たすと判断した場合(ステップS5:YES)、当該対象ユーザを教師ユーザとして特定し(ステップS6)、ステップS7へ進む。こうして教師ユーザとして特定された対象ユーザのユーザID(またはユーザ名)に対応付けられて、教師ユーザを示すユーザ種別がメモリに記憶される。一方、システム制御部33(教師ユーザ特定部332)は、当該対象ユーザの行動履歴が当該基準を満たさないと判断した場合(ステップS5:NO)、当該対象ユーザを教師ユーザとして特定せずにステップS7へ進む。 Next, the system control unit 33 (teacher user identification unit 332) determines whether or not the behavior history of the target user selected in step S3 satisfies the criteria set based on the hypothesis common to the questionnaire (step S5). .. When the system control unit 33 (teacher user identification unit 332) determines that the behavior history of the target user satisfies the criterion (step S5: YES), the system control unit 33 identifies the target user as a teacher user (step S6), and steps. Proceed to S7. The user type indicating the teacher user is stored in the memory in association with the user ID (or user name) of the target user identified as the teacher user in this way. On the other hand, when the system control unit 33 (teacher user identification unit 332) determines that the behavior history of the target user does not satisfy the criterion (step S5: NO), the step is performed without specifying the target user as the teacher user. Proceed to S7.

ステップS7では、システム制御部33は、アンケート結果及び行動履歴が取得された対象ユーザのうち、まだ選定されていない対象ユーザがあるか否かを判定する。システム制御部33は、まだ選定されていない対象ユーザがあると判定した場合には(ステップS7:YES)、ステップS3へ戻り、上記と同様の処理を行う。一方、システム制御部33は、まだ選定されていない対象ユーザがないと判定した場合には(ステップS7:NO)、ステップS8へ進む。 In step S7, the system control unit 33 determines whether or not there is a target user who has not yet been selected among the target users whose questionnaire results and action history have been acquired. When the system control unit 33 determines that there is a target user who has not been selected yet (step S7: YES), the system control unit 33 returns to step S3 and performs the same process as described above. On the other hand, when the system control unit 33 determines that there is no target user who has not been selected yet (step S7: NO), the system control unit 33 proceeds to step S8.

ステップS8では、システム制御部33(モデル生成部333)は、ステップS6で特定された教師ユーザのそれぞれの行動履歴から抽出された行動情報を説明変数とし、ステップS6で特定された教師ユーザのそれぞれの特性を目的変数とした学習データにより学習した学習済みモデルを生成する。こうして生成された学習済みモデルは、後述する特性推定処理において用いられる。 In step S8, the system control unit 33 (model generation unit 333) uses the action information extracted from each action history of the teacher user specified in step S6 as an explanatory variable, and each of the teacher users specified in step S6. A trained model trained by training data with the characteristics of is used as the objective variable is generated. The trained model generated in this way is used in the characteristic estimation process described later.

次いで、システム制御部33は、それぞれの対象ユーザについてステップS4で特定された特性を、それぞれの対象ユーザのユーザIDに対応付けてユーザ情報データベース301に格納し、さらに、ステップS6で教師ユーザとして特定された対象ユーザについては、教師ユーザを示すユーザ種別を、当該対象ユーザのユーザID(またはユーザ名)に対応付けてユーザ情報データベース301に格納し(ステップS9)、図7に示す処理を終了する。 Next, the system control unit 33 stores the characteristics identified in step S4 for each target user in the user information database 301 in association with the user ID of each target user, and further identifies the target user as a teacher user in step S6. For the target user, the user type indicating the teacher user is stored in the user information database 301 in association with the user ID (or user name) of the target user (step S9), and the process shown in FIG. 7 is terminated. ..

なお、学習済みモデル生成処理は、対象ユーザに対して新たにアンケートが実施された場合、再び実行されることになる。 The trained model generation process will be executed again when a new questionnaire is conducted for the target user.

(3−2.特性推定処理)
次に、図8を参照して、システム制御部33により実行される特性推定処理について説明する。図8は、システム制御部33により実行される特性推定処理の一例を示すフローチャートである。
(3-2. Characteristic estimation processing)
Next, the characteristic estimation process executed by the system control unit 33 will be described with reference to FIG. FIG. 8 is a flowchart showing an example of the characteristic estimation process executed by the system control unit 33.

図8に示す特性推定処理は、例えばオペレータからの指示に応じて開始される。図8に示す処理が開始されると、システム制御部33は、ユーザ情報データベース301から特定可能な1以上の推定ユーザ(例えば、特性がまだ推定されていない1以上の推定ユーザ)の行動履歴を行動履歴管理サーバ2の行動履歴データベース201から取得する(ステップS11)。例えば、システム制御部33は、推定ユーザのユーザID(またはユーザ名)が記述された推定ユーザリストを含む要求を行動履歴管理サーバ2へ送信することで、推定ユーザの行動履歴を行動履歴管理サーバ2から取得する。こうして取得された行動履歴は、例えば、推定ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。 The characteristic estimation process shown in FIG. 8 is started in response to an instruction from an operator, for example. When the process shown in FIG. 8 is started, the system control unit 33 displays the behavior history of one or more estimated users (for example, one or more estimated users whose characteristics have not been estimated yet) that can be specified from the user information database 301. It is acquired from the action history database 201 of the action history management server 2 (step S11). For example, the system control unit 33 transmits the action history of the estimated user to the action history management server 2 by transmitting a request including the estimated user list in which the user ID (or user name) of the estimated user is described to the action history management server 2. Get from 2. The action history acquired in this way is stored in the memory in association with, for example, the user ID (or user name) of the estimated user.

次いで、システム制御部33は、行動履歴が取得された推定ユーザの中から推定ユーザを1人選定(例えば、ユーザIDまたはユーザ名により選定)する(ステップS12)。 Next, the system control unit 33 selects one estimated user (for example, by user ID or user name) from the estimated users whose action history has been acquired (step S12).

次いで、システム制御部33(特性推定部334)は、ステップS12で選定された推定ユーザの行動履歴から抽出された行動情報を学習済みモデルに入力することで当該行動情報に対する特性を推定する(ステップS13)。こうして推定された特性は、例えば、当該推定ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。このように、アンケートの対象者でない推定ユーザ群にまで拡張して特性を付与することができる。 Next, the system control unit 33 (characteristic estimation unit 334) estimates the characteristics of the behavior information by inputting the behavior information extracted from the behavior history of the estimated user selected in step S12 into the learned model (step). S13). The characteristics estimated in this way are stored in the memory in association with, for example, the user ID (or user name) of the estimated user. In this way, it is possible to extend the characteristics to the estimated users who are not the subjects of the questionnaire.

なお、システム制御部33(モデル更新部335)は、ステップS13で特性が推定された推定ユーザの行動履歴から抽出された行動情報を説明変数とし、当該推定ユーザの推定された特性を目的変数とした学習データを用いて学習済みモデルを更新してもよい。 The system control unit 33 (model update unit 335) uses the behavior information extracted from the behavior history of the estimated user whose characteristics are estimated in step S13 as an explanatory variable, and the estimated characteristics of the estimated user as an objective variable. The trained model may be updated using the trained data.

次いで、システム制御部33は、行動履歴が取得された推定ユーザのうち、まだ選定されていない推定ユーザがあるか否かを判定する(ステップS14)。システム制御部33は、まだ選定されていない推定ユーザがあると判定した場合には(ステップS14:YES)、ステップS12へ戻り、上記と同様の処理を行う。一方、システム制御部33は、まだ選定されていない推定ユーザがないと判定した場合には(ステップS14:NO)、ステップS15へ進む。 Next, the system control unit 33 determines whether or not there is an estimated user who has not yet been selected among the estimated users whose action history has been acquired (step S14). When the system control unit 33 determines that there is an estimated user who has not been selected yet (step S14: YES), the system control unit 33 returns to step S12 and performs the same process as described above. On the other hand, when the system control unit 33 determines that there is no estimated user who has not been selected yet (step S14: NO), the system control unit 33 proceeds to step S15.

ステップS15では、システム制御部33は、推定ユーザについてステップS13で推定された特性を、推定ユーザのユーザIDに対応付けてユーザ情報データベース301に格納し、図8に示す処理を終了する。 In step S15, the system control unit 33 stores the characteristics estimated in step S13 for the estimated user in the user information database 301 in association with the user ID of the estimated user, and ends the process shown in FIG.

なお、特性推定処理は、新たにアカウントが発行されたユーザに対して実行されることになる。 The characteristic estimation process will be executed for the user to whom the account is newly issued.

(3−3.特性更新処理)
次に、図9を参照して、システム制御部33により実行される特性更新処理について説明する。図9は、システム制御部33により実行される特性更新処理の一例を示すフローチャートである。
(3-3. Characteristic update processing)
Next, the characteristic update process executed by the system control unit 33 will be described with reference to FIG. FIG. 9 is a flowchart showing an example of the characteristic update process executed by the system control unit 33.

図9に示す特性更新処理は、例えば所定時間間隔(例えば、24時間毎、または1週間毎)に実行される。図9に示す処理が開始されると、システム制御部33は、行動履歴が更新されたユーザのリストを行動履歴管理サーバ2から取得する(ステップS21)。このリストには、例えば、行動履歴が更新されたユーザのユーザID(またはユーザ名)が記述されている。 The characteristic update process shown in FIG. 9 is executed, for example, at predetermined time intervals (for example, every 24 hours or every week). When the process shown in FIG. 9 is started, the system control unit 33 acquires a list of users whose action history has been updated from the action history management server 2 (step S21). In this list, for example, the user ID (or user name) of the user whose action history has been updated is described.

次いで、システム制御部33は、ユーザ情報データベース301を参照することで、ステップS21で取得されたリストから推定ユーザを特定し、特定した1以上の推定ユーザの更新後の行動履歴を、上記ステップS11と同じように、行動履歴管理サーバ2の行動履歴データベース201から取得する(ステップS22)。 Next, the system control unit 33 identifies an estimated user from the list acquired in step S21 by referring to the user information database 301, and updates the action history of one or more identified estimated users in step S11. In the same manner as above, it is acquired from the action history database 201 of the action history management server 2 (step S22).

次いで、システム制御部33は、更新後の行動履歴が取得された推定ユーザの中から推定ユーザを1人選定(例えば、ユーザIDまたはユーザ名により選定)する(ステップS23)。 Next, the system control unit 33 selects one estimated user (for example, by user ID or user name) from the estimated users for whom the updated action history has been acquired (step S23).

次いで、システム制御部33(特性推定部334)は、ステップS23で選定された推定ユーザの更新後の行動履歴から抽出された行動情報を、上記学習済みモデルに入力することで当該行動情報に対する特性を再推定する(ステップS24)。こうして再推定された特性は、例えば、当該推定ユーザのユーザID(またはユーザ名)に対応付けられてメモリに記憶される。 Next, the system control unit 33 (characteristic estimation unit 334) inputs the behavior information extracted from the updated behavior history of the estimated user selected in step S23 into the trained model to input the characteristics for the behavior information. Is re-estimated (step S24). The characteristics re-estimated in this way are stored in the memory in association with, for example, the user ID (or user name) of the estimated user.

なお、システム制御部33(分類基準変更部336)は、ステップS24の前または後において、上記学習済みモデルにおける所定の分岐ルールにおいて、推定された特性に属する推定ユーザの出現率が同等となる条件、および、推定された特性に属する推定ユーザが所定の一致度を有する条件、を満たすように、当該分岐ルールを変更するとよい。 In addition, the system control unit 33 (classification standard change unit 336) is a condition that the appearance rate of the estimated users belonging to the estimated characteristics is the same in the predetermined branching rule in the trained model before or after the step S24. , And the condition that the estimated user belonging to the estimated characteristic has a predetermined degree of matching, the branching rule may be changed.

次いで、システム制御部33は、更新後の行動履歴が取得された推定ユーザのうち、まだ選定されていない推定ユーザがあるか否かを判定する(ステップS25)。システム制御部33は、まだ選定されていない推定ユーザがあると判定した場合には(ステップS25:YES)、ステップS23へ戻り、上記と同様の処理を行う。一方、システム制御部33は、まだ選定されていない推定ユーザがないと判定した場合には(ステップS25:NO)、ステップS26へ進む。 Next, the system control unit 33 determines whether or not there is an estimated user who has not yet been selected among the estimated users for whom the updated action history has been acquired (step S25). When the system control unit 33 determines that there is an estimated user who has not been selected yet (step S25: YES), the system control unit 33 returns to step S23 and performs the same processing as described above. On the other hand, when the system control unit 33 determines that there is no estimated user who has not been selected yet (step S25: NO), the system control unit 33 proceeds to step S26.

ステップS26では、システム制御部33は、推定ユーザについてステップS24で再推定された特性を、推定ユーザのユーザIDに対応付けてユーザ情報データベース301に格納(上書き更新)し、図9に示す処理を終了する。 In step S26, the system control unit 33 stores (overwrites and updates) the characteristics re-estimated in step S24 for the estimated user in the user information database 301 in association with the user ID of the estimated user, and performs the process shown in FIG. finish.

(3−4.学習済みモデル更新処理)
次に、図10を参照して、システム制御部33により実行される学習済みモデル更新処理について説明する。図10は、システム制御部33により実行される学習済みモデル更新処理の一例を示すフローチャートである。
(3-4. Trained model update process)
Next, the trained model update process executed by the system control unit 33 will be described with reference to FIG. FIG. 10 is a flowchart showing an example of the trained model update process executed by the system control unit 33.

図10に示す学習済みモデル更新処理は、特性更新処理よりも長い時間間隔(例えば、半年毎、または1年毎)に実行される。図10に示す処理が開始されると、システム制御部33は、行動履歴が更新されたユーザのリストを行動履歴管理サーバ2から取得する(ステップS31)。 The trained model update process shown in FIG. 10 is executed at a longer time interval (for example, every six months or every year) than the characteristic update process. When the process shown in FIG. 10 is started, the system control unit 33 acquires a list of users whose action history has been updated from the action history management server 2 (step S31).

次いで、システム制御部33は、ユーザ情報データベース301を参照することで、ステップS31で取得されたリストから教師ユーザを所定数以上特定できたか否かを判定する(ステップS32)。この所定数は、ユーザ情報データベース301から特定可能な教師ユーザの総数の例えば1%〜5%の割合に応じた数としてもよい。システム制御部33は、取得されたリストから教師ユーザを所定数以上特定できたと判定した場合には(ステップS32:YES)、ステップS33へ進む。一方、システム制御部33は、取得されたリストから教師ユーザを所定数以上特定できないと判定した場合には(ステップS32:NO)、図10に示す処理を終了する。 Next, the system control unit 33 determines whether or not a predetermined number or more of teacher users can be specified from the list acquired in step S31 by referring to the user information database 301 (step S32). This predetermined number may be a number according to a ratio of, for example, 1% to 5% of the total number of teacher users that can be specified from the user information database 301. When the system control unit 33 determines that a predetermined number or more of teacher users have been identified from the acquired list (step S32: YES), the system control unit 33 proceeds to step S33. On the other hand, when it is determined that the teacher users cannot be specified by a predetermined number or more from the acquired list (step S32: NO), the system control unit 33 ends the process shown in FIG.

ステップS33では、システム制御部33は、行動履歴が更新された教師ユーザの特性をユーザ情報データベース301から取得する。次いで、システム制御部33は、行動履歴が更新された教師ユーザの更新後の行動履歴を行動履歴管理サーバ2の行動履歴データベース201から取得する(ステップS34)。 In step S33, the system control unit 33 acquires the characteristics of the teacher user whose action history has been updated from the user information database 301. Next, the system control unit 33 acquires the updated behavior history of the teacher user whose behavior history has been updated from the behavior history database 201 of the behavior history management server 2 (step S34).

次いで、システム制御部33は、行動履歴が更新された教師ユーザの中から教師ユーザを1人選定(例えば、ユーザIDまたはユーザ名により選定)する(ステップS35)。 Next, the system control unit 33 selects one teacher user (for example, by user ID or user name) from the teacher users whose action history has been updated (step S35).

次いで、システム制御部33(教師ユーザ特定部332)は、ステップS35で選定された教師ユーザの更新後の行動履歴がアンケートと共通の仮説に基づき設定された基準を満たすか否かを判断する(ステップS36)。システム制御部33(教師ユーザ特定部332)は、当該教師ユーザの更新後の行動履歴が当該基準を満たすと判断した場合(ステップS36:YES)、当該教師ユーザを特定し(ステップS37)、ステップS38へ進む。一方、システム制御部33(教師ユーザ特定部332)は、当該教師ユーザの更新後の行動履歴が当該基準を満たさないと判断した場合(ステップS36:NO)、教師ユーザとして特定せず(採用せず)にステップS38へ進む。 Next, the system control unit 33 (teacher user identification unit 332) determines whether or not the updated behavior history of the teacher user selected in step S35 meets the criteria set based on the hypothesis common to the questionnaire ( Step S36). When the system control unit 33 (teacher user identification unit 332) determines that the updated action history of the teacher user satisfies the criterion (step S36: YES), the system control unit 33 identifies the teacher user (step S37), and steps. Proceed to S38. On the other hand, when the system control unit 33 (teacher user identification unit 332) determines that the updated behavior history of the teacher user does not satisfy the criterion (step S36: NO), the system control unit 33 does not specify the teacher user as a teacher user (adopt). ) Proceed to step S38.

なお、別の例として、ステップS35〜S38の処理は行われないように構成してもよい。すなわち、教師ユーザの行動履歴が更新された場合、システム制御部33は、教師ユーザの更新後の行動履歴が上記基準を満たすか否かを判断することなく、教師ユーザの更新後の行動履歴から抽出された行動情報を説明変数とし、教師ユーザの特性を目的変数とした学習データを用いて学習済みモデルを更新してもよい。 As another example, the process of steps S35 to S38 may not be performed. That is, when the behavior history of the teacher user is updated, the system control unit 33 does not determine whether or not the updated behavior history of the teacher user satisfies the above criteria, but from the updated behavior history of the teacher user. The trained model may be updated using the training data using the extracted behavior information as the explanatory variable and the characteristics of the teacher user as the objective variable.

ステップS38では、システム制御部33は、行動履歴が更新された教師ユーザのうち、まだ選定されていない教師ユーザがあるか否かを判定する。システム制御部33は、まだ選定されていない教師ユーザがあると判定した場合には(ステップS38:YES)、ステップS35へ戻り、上記と同様の処理を行う。一方、システム制御部33は、まだ選定されていない教師ユーザがないと判定した場合には(ステップS38:NO)、ステップS39へ進む。 In step S38, the system control unit 33 determines whether or not there is a teacher user who has not yet been selected among the teacher users whose action history has been updated. When the system control unit 33 determines that there is a teacher user who has not been selected yet (step S38: YES), the system control unit 33 returns to step S35 and performs the same processing as described above. On the other hand, when the system control unit 33 determines that there is no teacher user who has not been selected yet (step S38: NO), the system control unit 33 proceeds to step S39.

ステップS39では、システム制御部33(モデル更新部335)は、ステップS37で特定された教師ユーザの更新後の行動履歴(ステップS34で取得された行動履歴)から抽出された行動情報を説明変数とし、ステップ37で特定された教師ユーザの特性(ステップS33で取得された特性)を目的変数とした学習データを用いて学習済みモデルを更新し、図10に示す処理を終了する。 In step S39, the system control unit 33 (model update unit 335) uses the action information extracted from the updated action history of the teacher user specified in step S37 (action history acquired in step S34) as an explanatory variable. , The trained model is updated using the training data with the characteristics of the teacher user identified in step 37 (characteristics acquired in step S33) as the objective variable, and the process shown in FIG. 10 is completed.

なお、学習済みモデル更新処理により更新された学習済みモデルは、その後に推定ユーザの特性が推定される場合に用いられる。 The trained model updated by the trained model update process is used when the characteristics of the estimated user are subsequently estimated.

以上説明したように、上記実施形態によれば、特性推定サーバ3は、アンケートに回答した複数の対象ユーザのそれぞれの回答に基づいて、当該複数の対象ユーザを予め設定された複数の特性のうちのいずれかの特性に分類し、それぞれの対象ユーザの行動履歴が所定の基準を満たすか否かを判断する。そして、特性推定サーバ3は、基準を満たすと判断された対象ユーザを教師ユーザとし、教師ユーザの行動履歴から抽出された行動情報を説明変数とし、教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成し、推定ユーザの行動履歴から抽出された行動情報と、生成された学習済みモデルとを用いて当該推定ユーザの特性を推定するように構成したので、対象ユーザのアンケート結果に基づいて実証的な特性推定を行うことができる。すなわち、対象ユーザの主観的、意識的な判断に基づく仮説検証と、対象ユーザの客観的な事実に基づく仮説検証を踏まえて実証的な特性推定を可能にした。 As described above, according to the above-described embodiment, the characteristic estimation server 3 sets the plurality of target users among the plurality of characteristics preset based on the responses of the plurality of target users who responded to the questionnaire. It is classified into one of the following characteristics, and it is determined whether or not the behavior history of each target user meets a predetermined criterion. Then, the characteristic estimation server 3 uses learning data in which the target user determined to satisfy the criteria is the teacher user, the behavior information extracted from the behavior history of the teacher user is used as the explanatory variable, and the characteristic of the teacher user is used as the objective variable. A trained model was generated, and the behavior information extracted from the behavior history of the estimated user and the generated learned model were used to estimate the characteristics of the estimated user. Empirical characterization can be performed based on the results. That is, it is possible to perform empirical characteristic estimation based on hypothesis verification based on the subjective and conscious judgment of the target user and hypothesis verification based on the objective facts of the target user.

また、上記実施形態では、対象ユーザのアンケートで起こりうる不完全性、不確実性を当該対象ユーザの行動履歴で補うことで、学習済みモデルの生成に用いる教師データの精度を向上することができようになったが、これに加えて、アンケートによる特性分類の結果に基づいて作成された段階の教師データ(プレ教師データ)についても改善することができる。すなわち、特性推定サーバ3(特性分類装置の分類手段及び判断手段の一例)は、上述したように、アンケートに回答した複数の対象ユーザのそれぞれの回答に基づいて、対象ユーザを予め設定された複数の特性のうちのいずれかの特性に分類し、当該対象ユーザの行動履歴がアンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断する。そして、特性推定サーバ3(特性分類装置の特定手段の一例)は、当該基準を満たすか否かの判断結果からアンケートの改善項目(改善点)を特定する。例えば、当該基準を満たすか否かの判断結果から、どのような質問事項(アンケートの質問事項)が特性の分類判定(セグメント判定)に有用または無用であったか、どのようなアンケート選択肢(質問に対する回答の選択肢)が特性の分類判定に有用または無用であったか、どのような分類方法(特性の分類に用いられる算出方法)が特性の分類判定に適していたかを判断することで、アンケートの改善項目(例えば、アンケートの質問事項、アンケート選択肢、及び分類方法の少なくとも何れか1つ)を特定する。これにより、アンケートの品質向上に寄与することができる。 Further, in the above embodiment, the accuracy of the teacher data used for generating the trained model can be improved by supplementing the incompleteness and uncertainty that may occur in the questionnaire of the target user with the behavior history of the target user. However, in addition to this, it is possible to improve the teacher data (pre-teacher data) at the stage created based on the results of the characteristic classification by the questionnaire. That is, as described above, the characteristic estimation server 3 (an example of the classification means and the determination means of the characteristic classification device) sets the target users in advance based on the answers of the plurality of target users who answered the questionnaire. It is classified into one of the characteristics of the above, and it is determined whether or not the behavior history of the target user meets the criteria set in relation to the characteristics based on the hypothesis common to the questionnaire. Then, the characteristic estimation server 3 (an example of the identification means of the characteristic classification device) identifies the improvement items (improvement points) of the questionnaire from the judgment result of whether or not the criteria are satisfied. For example, what kind of question (questionnaire question) was useful or useless for characteristic classification judgment (segment judgment) based on the judgment result of whether or not the criteria were met, and what kind of questionnaire option (answer to the question) By determining whether the classification method (option) was useful or useless for the classification judgment of the characteristics, and what classification method (calculation method used for the classification of the characteristics) was suitable for the classification judgment of the characteristics, the improvement items of the questionnaire ( For example, at least one of questionnaire questions, questionnaire options, and classification methods) is specified. This can contribute to improving the quality of the questionnaire.

例えば、特性推定サーバ3は、アンケートと共通の仮説に基づき特性ごとに設定された複数の仮説検証項目のそれぞれに対する該当有無を対象ユーザの行動履歴に基づいて判断し、その判断結果(つまり、複数の仮説検証項目のそれぞれに対する該当有無)に基づいて、アンケートに関する複数の項目(例えば、アンケートの質問事項、アンケート選択肢、及び分類方法)のうち少なくとも1つの項目を改善項目として特定するとよい。また、特性推定サーバ3は、特性を横断した連続性を有する仮説検証項目(例えば、アクセスタイミング)において複数段階のうち、どの段階に該当するかを対象ユーザの行動履歴に基づいて判断し、その判断結果に基づいて、アンケートに関する複数の項目(例えば、アンケートの質問事項、アンケート選択肢、及び分類方法)のうち少なくとも1つの項目を改善項目として特定してもよい。例えば、当該判断された段階と、アンケート結果に基づき分類された特性と、が関連(または合致)しないことに対して影響を与えている項目が改善項目として特定される。また、特性推定サーバ3は、ユーザ全体の行動履歴に基づく行動分布と特性との対応関係を示す仮説検証項目において、当該行動分布中のどのレベルに該当するかを対象ユーザの行動履歴に基づいて判断し、その判断結果に基づいて、アンケートに関する複数の項目(例えば、アンケートの質問事項、アンケート選択肢、及び分類方法)のうち少なくとも1つの項目を改善項目として特定してもよい。例えば、当該判断されたレベルと、アンケート結果に基づき分類された特性と、が関連(または合致)しないことに対して影響を与えている項目が改善項目として特定される。 For example, the characteristic estimation server 3 determines whether or not each of the plurality of hypothesis verification items set for each characteristic is applicable based on the hypothesis common to the questionnaire based on the behavior history of the target user, and the determination result (that is, a plurality of). It is preferable to specify at least one item out of a plurality of items related to the questionnaire (for example, questionnaire questions, questionnaire options, and classification method) as improvement items based on whether or not each of the hypothesis verification items is applicable. Further, the characteristic estimation server 3 determines which stage corresponds to a plurality of stages in the hypothesis verification item (for example, access timing) having continuity across the characteristics based on the behavior history of the target user, and determines which stage corresponds to the stage. Based on the judgment result, at least one of a plurality of items related to the questionnaire (for example, questionnaire questions, questionnaire options, and classification method) may be specified as improvement items. For example, an item that influences the disagreement (or match) between the judged stage and the characteristics classified based on the questionnaire result is specified as an improvement item. Further, the characteristic estimation server 3 determines which level in the behavior distribution corresponds to the hypothesis verification item showing the correspondence between the behavior distribution and the characteristic based on the behavior history of the entire user based on the behavior history of the target user. Judgment may be made, and at least one of a plurality of items related to the questionnaire (for example, questionnaire questions, questionnaire options, and classification method) may be specified as improvement items based on the judgment result. For example, an item that influences the disagreement (or match) between the judged level and the characteristic classified based on the questionnaire result is specified as an improvement item.

図11は、アンケートの改善項目としてアンケート選択肢が特定された場合における改善内容を示す概念図である。図11(A)では、アンケート選択肢の分割の可能性が見い出されることで、アンケート選択肢2が分割されている。図11(B)では、アンケート選択肢において異なるデータ傾向が見いだされることで、アンケート選択肢2の一部分がアンケート選択肢1に統合されている。その他、図示しないが、アンケートの改善項目として分類方法が特定された場合、複数の分類方法のうち、より適した分類方法が選定される。例えば、対象ユーザの回答に基づきいずれかの特性に分類される際、アンケートにおけるトレンド商品購買に関する質問でyes(あてはまる)との回答に対して+5点として採点され、結果として、当該対象ユーザの特性が特性01として判別(分類)された場合において、当該対象ユーザの行動履歴が基準を満たさない(つまり、対象ユーザは特性01に該当しない)場合がありうる。この場合、トレンド商品購買に関する質問で「あてはまる」との回答に対して+5点としたことが適当ではなかった、つまり、分類方法が適当でなかったとして、当該分類方法がアンケートの改善項目として特定される。これにより、分類方法に影響を与える質問の内容変更、当該質問の配点変更(つまり、質問に対する選択肢の重み付けの変更)、または当該質問自体の削除等が行われる。また、アンケートの質問1でyesを+2点、noを0点、質問2でyesを+1点、noを−1点として、例えば合計3点以上の対象ユーザが特性01として判別された場合において、当該対象ユーザの行動履歴が基準を満たさず、特性01には不適切な場合がありうる。この場合にも、分類方法がアンケートの改善項目として特定され、アンケートの質問の内容変更、当該質問の配点変更、または当該質問自体の削除等が行われる。つまり、特性判別に用いる計算ロジックが適正化される。 FIG. 11 is a conceptual diagram showing the content of improvement when a questionnaire option is specified as an improvement item of the questionnaire. In FIG. 11A, the questionnaire option 2 is divided because the possibility of dividing the questionnaire option is found. In FIG. 11B, a part of the questionnaire option 2 is integrated into the questionnaire option 1 by finding different data trends in the questionnaire options. In addition, although not shown, when a classification method is specified as an improvement item in the questionnaire, a more suitable classification method is selected from a plurality of classification methods. For example, when classified into one of the characteristics based on the response of the target user, the answer to yes (applicable) in the question about trend product purchase in the questionnaire is scored as +5 points, and as a result, the characteristic of the target user. Is discriminated (classified) as the characteristic 01, the behavior history of the target user may not satisfy the criteria (that is, the target user does not correspond to the characteristic 01). In this case, it was not appropriate to give +5 points to the answer "Applicable" to the question about purchasing trend products, that is, the classification method was not appropriate, and the classification method was specified as an improvement item in the questionnaire. Will be done. As a result, the content of the question that affects the classification method is changed, the score of the question is changed (that is, the weighting of the options for the question is changed), or the question itself is deleted. In addition, when question 1 of the questionnaire sets yes to +2 points, no to 0 points, question 2 sets yes to +1 points and no to -1 points, for example, when a target user with a total of 3 points or more is determined as characteristic 01, The behavior history of the target user may not meet the criteria and may be inappropriate for the characteristic 01. In this case as well, the classification method is specified as an improvement item of the questionnaire, and the content of the question in the questionnaire is changed, the score of the question is changed, or the question itself is deleted. That is, the calculation logic used for characteristic discrimination is optimized.

なお、以上のように本発明の一実施形態を説明したが、本発明は上記実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲で上記実施形態から種々構成等に変更を加えてもよく、その場合も本発明の技術的範囲に含まれる。 Although one embodiment of the present invention has been described above, the present invention is not limited to the above embodiment, and changes from the above embodiment to various configurations and the like are made without departing from the gist of the present invention. It may be added, and it is also included in the technical scope of the present invention.

1 アンケート管理サーバ
2 行動履歴管理サーバ
3 特性推定サーバ
31 通信部
32 記憶部
33 システム制御部
34 システムバス
101 アンケートデータベース
201 行動履歴データベース
301 ユーザ情報データベース
UTm ユーザ端末
STn 処理端末
SAo サーバ
NW 通信ネットワーク
S 通信システム
1 Questionnaire management server 2 Action history management server 3 Characteristic estimation server 31 Communication unit 32 Storage unit 33 System control unit 34 System bus 101 Questionnaire database 201 Action history database 301 User information database UTm User terminal STn processing terminal SAo server NW communication network S communication system

Claims (12)

アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類する分類手段と、
前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断する判断手段と、
前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成する生成手段と、
前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定する推定手段と、
を備えることを特徴とする特性推定装置。
A classification means for classifying the first user into one of a plurality of preset characteristics based on the responses of the plurality of first users who responded to the questionnaire.
A means for determining whether or not the behavior history of the first user meets the criteria set in relation to the characteristics based on the hypothesis common to the questionnaire.
Among the plurality of first users, the first user whose behavior history is determined to satisfy the criteria is used as a teacher user, and the behavior information extracted from the behavior history of the teacher user is used as an explanatory variable, and the characteristics of the teacher user. A generation means for generating a trained model trained by training data with
An estimation means for estimating the characteristics of the second user using the behavior information extracted from the behavior history of the second user different from the first user and the trained model.
A characteristic estimation device comprising.
前記第2ユーザの行動履歴が更新された場合、前記推定手段は、当該更新された行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を再推定することにより更新することを特徴とする請求項1に記載の特性推定装置。 When the behavior history of the second user is updated, the estimation means re-estimates the characteristics of the second user using the behavior information extracted from the updated behavior history and the learned model. The characteristic estimation device according to claim 1, wherein the characteristic estimation device is updated by 前記第2ユーザの行動履歴が更新された場合、前記学習済みモデルにおける所定の分類基準において、推定された特性に属する前記第2ユーザの出現率が同等となる条件、および、推定された特性に属する前記第2ユーザが所定の一致度を有する条件、を満たすように、前記所定の分類基準を変更する変更手段を更に備えることを特徴とする請求項1または2に記載の特性推定装置。 When the behavior history of the second user is updated, the conditions under which the appearance rate of the second user belonging to the estimated characteristic is equivalent and the estimated characteristic are satisfied in the predetermined classification criteria in the trained model. The characteristic estimation device according to claim 1 or 2, further comprising a changing means for changing the predetermined classification standard so that the second user to which the second user belongs satisfies the condition having a predetermined degree of agreement. 前記第1ユーザの行動履歴が更新されることで前記教師ユーザの行動履歴が更新された場合、当該更新された行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データを用いて前記学習済みモデルを更新する更新手段を更に備えることを特徴とする請求項1乃至3のいずれか一項に記載の特性推定装置。 When the behavior history of the teacher user is updated by updating the behavior history of the first user, the behavior information extracted from the updated behavior history is used as an explanatory variable, and the characteristic of the teacher user is used as an objective variable. The characteristic estimation device according to any one of claims 1 to 3, further comprising an update means for updating the trained model using the training data. 前記第1ユーザの行動履歴が更新されることで前記教師ユーザの行動履歴が更新された場合、前記判断手段は、当該更新された、前記教師ユーザの行動履歴が前記特性に関連して設定された基準を満たすか否かを判断することを特徴とする請求項4に記載の特性推定装置。 When the behavior history of the teacher user is updated by updating the behavior history of the first user, the determination means sets the updated behavior history of the teacher user in relation to the characteristic. The characteristic estimation device according to claim 4, wherein it is determined whether or not the above criteria are satisfied. 前記生成手段は、前記行動履歴が前記基準を満たさないと判断された第1ユーザを教師ユーザとして採用しないことを特徴とする請求項1乃至5のいずれか一項に記載の特性推定装置。 The characteristic estimation device according to any one of claims 1 to 5, wherein the generation means does not employ a first user whose behavior history is determined not to satisfy the criteria as a teacher user. 前記第1ユーザの行動履歴が更新されることで前記教師ユーザの行動履歴が更新された場合、当該更新された行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データを用いて前記学習済みモデルを更新する更新手段を更に備え、
前記学習済みモデルの更新間隔は、前記第2ユーザの特性の更新間隔よりも長いことを特徴とする請求項2に記載の特性推定装置。
When the behavior history of the teacher user is updated by updating the behavior history of the first user, the behavior information extracted from the updated behavior history is used as an explanatory variable, and the characteristic of the teacher user is used as an objective variable. Further provided with an update means for updating the trained model using the training data of
The characteristic estimation device according to claim 2, wherein the update interval of the trained model is longer than the update interval of the characteristics of the second user.
前記特性に関連して設定された基準は、前記特性ごとに設定された基準であることを特徴とする請求項1乃至7のいずれか一項に記載の特性推定装置。The characteristic estimation device according to any one of claims 1 to 7, wherein the standard set in relation to the characteristic is a standard set for each of the characteristics. 前記特性に関連して設定された基準は、前記特性を横断した連続性を有する基準であることを特徴とする請求項1乃至7のいずれか一項に記載の特性推定装置。The characteristic estimation device according to any one of claims 1 to 7, wherein the standard set in relation to the characteristic is a standard having continuity across the characteristic. 前記特性に関連して設定された基準は、ユーザ全体の行動履歴に基づく行動分布と前記特性との対応関係を示す基準であることを特徴とする請求項1乃至7のいずれか一項に記載の特性推定装置。The standard set in relation to the characteristic is described in any one of claims 1 to 7, wherein the standard is a standard showing a correspondence relationship between the behavior distribution based on the behavior history of the entire user and the characteristic. Characteristic estimation device. コンピュータにより実行される特性推定方法であって、
アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類するステップと、
前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断するステップと、
前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成するステップと、
前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定するステップと、
を含むことを特徴とする特性推定方法。
A method of character estimation performed by a computer
A step of classifying the first user into one of a plurality of preset characteristics based on the answers of each of the plurality of first users who responded to the questionnaire.
A step of determining whether or not the behavior history of the first user meets the criteria set in relation to the characteristics based on the hypothesis common to the questionnaire, and
Among the plurality of first users, the first user whose behavior history is determined to satisfy the criteria is used as a teacher user, and the behavior information extracted from the behavior history of the teacher user is used as an explanatory variable, and the characteristics of the teacher user. Steps to generate a trained model trained with training data with
A step of estimating the characteristics of the second user using the behavior information extracted from the behavior history of the second user different from the first user and the trained model.
A characteristic estimation method characterized by including.
アンケートに回答した複数の第1ユーザのそれぞれの回答に基づいて、前記第1ユーザを予め設定された複数の特性のうちのいずれかの特性に分類するステップと、
前記第1ユーザの行動履歴が前記アンケートと共通の仮説に基づき特性に関連して設定された基準を満たすか否かを判断するステップと、
前記複数の第1ユーザのうち前記行動履歴が前記基準を満たすと判断された第1ユーザを教師ユーザとして、前記教師ユーザの行動履歴から抽出された行動情報を説明変数とし、前記教師ユーザの特性を目的変数とした学習データにより学習した学習済みモデルを生成するステップと、
前記第1ユーザとは異なる第2ユーザの行動履歴から抽出された行動情報と前記学習済みモデルとを用いて当該第2ユーザの特性を推定するステップと、
をコンピュータに実行させることを特徴とする特性推定プログラム。
A step of classifying the first user into one of a plurality of preset characteristics based on the answers of each of the plurality of first users who responded to the questionnaire.
A step of determining whether or not the behavior history of the first user meets the criteria set in relation to the characteristics based on the hypothesis common to the questionnaire, and
Among the plurality of first users, the first user whose behavior history is determined to satisfy the criteria is used as a teacher user, and the behavior information extracted from the behavior history of the teacher user is used as an explanatory variable, and the characteristics of the teacher user. Steps to generate a trained model trained with training data with
A step of estimating the characteristics of the second user using the behavior information extracted from the behavior history of the second user different from the first user and the trained model.
A characteristic estimation program characterized by having a computer execute the above.
JP2018173297A 2018-08-27 2018-09-18 Characteristic estimation device, characteristic estimation method, characteristic estimation program, etc. Active JP6899805B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018157945 2018-08-27
JP2018157945 2018-08-27

Publications (2)

Publication Number Publication Date
JP2020035409A JP2020035409A (en) 2020-03-05
JP6899805B2 true JP6899805B2 (en) 2021-07-07

Family

ID=69668400

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018173297A Active JP6899805B2 (en) 2018-08-27 2018-09-18 Characteristic estimation device, characteristic estimation method, characteristic estimation program, etc.

Country Status (1)

Country Link
JP (1) JP6899805B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7065927B1 (en) 2020-10-29 2022-05-12 株式会社Z会 Achievement estimation model generation device, scholastic ability estimation device, scholastic ability estimation model generation method, scholastic ability estimation method, program
JP2023097496A (en) * 2021-12-28 2023-07-10 Sensy株式会社 Machine learning device, data processing device, inference device, machine learning method, data processing method, and inference method
EP4307202A1 (en) * 2022-03-18 2024-01-17 Rakuten Group, Inc. Information processing device, information processing method, and program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010204966A (en) * 2009-03-03 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> Sampling device, sampling method, sampling program, class distinction device and class distinction system
WO2018128403A1 (en) * 2017-01-06 2018-07-12 Samsung Electronics Co., Ltd. Apparatus and method for processing content

Also Published As

Publication number Publication date
JP2020035409A (en) 2020-03-05

Similar Documents

Publication Publication Date Title
CN108665329B (en) Commodity recommendation method based on user browsing behavior
US20200410531A1 (en) Methods, systems, and apparatus for enhancing electronic commerce using social media
US20200273054A1 (en) Digital receipts economy
WO2018118189A1 (en) Systems and methods for customizing content of a billboard
Forouzandeh et al. Content marketing through data mining on Facebook social network.
US20160012512A1 (en) Lifestyle recommendation system
US20150193685A1 (en) Optimal time to post for maximum social engagement
Reimer et al. How online consumer segments differ in long-term marketing effectiveness
JP6899805B2 (en) Characteristic estimation device, characteristic estimation method, characteristic estimation program, etc.
US20160063547A1 (en) Method and system for making targeted offers
KR20130033506A (en) Item recommendation method and apparatus
CN110689402A (en) Method and device for recommending merchants, electronic equipment and readable storage medium
JP2022531410A (en) Digital anthropology and ethnographic system
Liu et al. Inferring gender and age of customers in shopping malls via indoor positioning data
KR20200063348A (en) Blogger and advertiser recommendation system based on bigdata collaborative filtering and method thereof
Zheng et al. A scalable purchase intention prediction system using extreme gradient boosting machines with browsing content entropy
US20140101064A1 (en) Systems and Methods for Automated Reprogramming of Displayed Content
JP2021047551A (en) Specification device, specification method, and specification program
Kumar et al. Context-aware social popularity based recommender system
Ma Modeling users for online advertising
JP7354195B2 (en) Information processing device, information processing method, and information processing program
JP2021103340A (en) Device, method, and program for making recommendation based on customer attribute information
JP7280327B2 (en) Marketing information analysis device, method and program
Hassanpour et al. Improving Accuracy of Recommender Systems using Social Network Information and Longitudinal Data
Xiao Recommending Best Products from E-commerce Purchase History and User Click Behavior Data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210601

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210615

R150 Certificate of patent or registration of utility model

Ref document number: 6899805

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150