JP6701026B2 - Judgment device, judgment method, and judgment program - Google Patents

Judgment device, judgment method, and judgment program Download PDF

Info

Publication number
JP6701026B2
JP6701026B2 JP2016156745A JP2016156745A JP6701026B2 JP 6701026 B2 JP6701026 B2 JP 6701026B2 JP 2016156745 A JP2016156745 A JP 2016156745A JP 2016156745 A JP2016156745 A JP 2016156745A JP 6701026 B2 JP6701026 B2 JP 6701026B2
Authority
JP
Japan
Prior art keywords
index value
user
value
sample
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016156745A
Other languages
Japanese (ja)
Other versions
JP2018025934A (en
Inventor
僚太 中山
僚太 中山
純 西村
純 西村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2016156745A priority Critical patent/JP6701026B2/en
Publication of JP2018025934A publication Critical patent/JP2018025934A/en
Application granted granted Critical
Publication of JP6701026B2 publication Critical patent/JP6701026B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、判定装置、判定方法および判定プログラムに関する。   The present invention relates to a determination device, a determination method, and a determination program.

従来、利用者による評価結果の有意性を判定する技術が知られている。このような技術の一例として、あるウェブコンテンツを利用者に評価させた際の評価結果と、同一のウェブコンテンツについて過去に行われた評価結果とを用いることで、評価値の平均値が有するばらつきを減少させ、有意性の判定精度を向上させるCUPED(Controlled-experiment Using Pre-Experiment Data)といった技術が知られている。   Conventionally, a technique for determining the significance of the evaluation result by the user is known. As an example of such a technique, by using an evaluation result when a user evaluates a certain web content and an evaluation result performed in the past with respect to the same web content, a variation in the average value of the evaluation values is obtained. There is known a technique such as CUPED (Controlled-experiment Using Pre-Experiment Data) that reduces the error rate and improves the accuracy of significance determination.

特開2007−052601号公報JP, 2007-052601, A 特開2011―043911号公報JP, 2011-043911, A

“Improving the Sensitivity of Online Controlled Experiments by Utilizing Pre-Experiment Data”, Alex Deng, Ya Xu, Ron Kohavi, Toby Walker, WSDM’13, February 4-8, 2013, Rome, Italy.“Improving the Sensitivity of Online Controlled Experiments by Utilizing Pre-Experiment Data”, Alex Deng, Ya Xu, Ron Kohavi, Toby Walker, WSDM′13, February 4-8, 2013, Rome, Italy.

しかしながら、上述した従来技術では、新たに評価を行った利用者と過去に評価を行った利用者が重複しない場合には、平均値のばらつきが増大し、有意性の検出精度が悪化する場合がある。   However, in the above-described conventional technique, when the user who newly evaluates and the user who previously evaluates do not overlap, the dispersion of the average value increases, and the accuracy of significance detection may deteriorate. is there.

本願は、上記に鑑みてなされたものであって、評価結果が有する有意性の検出精度を向上させることを目的とする。   The present application has been made in view of the above, and an object thereof is to improve the accuracy of detecting the significance of the evaluation result.

本願に係る判定装置は、所定のコンテンツに関する利用者の行動を示す第1の指標値と、当該利用者の属性に基づく第2の指標値とに基づいて、前記所定のコンテンツに関して推定される利用者の行動を示す推定指標値を、前記所定のコンテンツに関する標本ごとに算出する算出部と、前記標本ごとに算出された前記推定指標値に基づいて、各標本間の有意差を判定する判定部とを有することを特徴とする。   The determination apparatus according to the present application is estimated to be used for the predetermined content based on a first index value indicating the behavior of the user regarding the predetermined content and a second index value based on the attribute of the user. A calculation unit that calculates an estimated index value indicating the behavior of a person for each sample related to the predetermined content, and a determination unit that determines a significant difference between samples based on the estimated index value calculated for each sample. And having.

実施形態の一態様によれば、評価結果が有する有意性の検出精度を向上させることができる。   According to the aspect of the embodiment, it is possible to improve the accuracy of detecting the significance of the evaluation result.

図1は、実施形態に係る判定装置が実行する判定処理の一例を示す図である。FIG. 1 is a diagram illustrating an example of a determination process executed by the determination device according to the embodiment. 図2は、実施形態に係る判定装置の構成例を示す図である。FIG. 2 is a diagram illustrating a configuration example of the determination device according to the embodiment. 図3は、実施形態に係る行動履歴データベースに登録される情報の一例を示す図である。FIG. 3 is a diagram showing an example of information registered in the action history database according to the embodiment. 図4は、実施形態に係るユーザデータベースに登録される情報の一例を説明する図である。FIG. 4 is a diagram illustrating an example of information registered in the user database according to the embodiment. 図5は、実施形態に係る判定装置が生成する結果画面の一例を示す図である。FIG. 5 is a diagram illustrating an example of a result screen generated by the determination device according to the embodiment. 図6は、実施形態にかかる判定装置が実行する判定処理の流れの一例を示すフローチャートである。FIG. 6 is a flowchart showing an example of the flow of the determination process executed by the determination device according to the embodiment. 図7は、ハードウェア構成の一例を示す図である。FIG. 7 is a diagram illustrating an example of the hardware configuration.

以下に、本願に係る判定装置、判定方法および判定プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る判定装置、判定方法および判定プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。   Hereinafter, modes (hereinafter, referred to as “embodiments”) for carrying out the determination device, the determination method, and the determination program according to the present application will be described in detail with reference to the drawings. The determination device, the determination method, and the determination program according to the present application are not limited to this embodiment. Also, in each of the following embodiments, the same parts are designated by the same reference numerals, and duplicate description will be omitted.

[実施形態]
〔1−1.判定装置の一例〕
まず、図1を用いて、判定装置が実行する判定処理の一例について説明する。図1は、実施形態に係る判定装置が実行する判定処理の一例を示す図である。図1では、判定装置10は、インターネット等の所定のネットワークNを介して、所定のコンテンツを配信するコンテンツサーバ50や、管理者端末200と通信可能である。なお、判定装置10は、ネットワークNを介して、利用者U01が使用する端末装置101、利用者U02が使用する端末装置102と通信可能であってもよい。
[Embodiment]
[1-1. Example of determination device]
First, an example of the determination process executed by the determination device will be described with reference to FIG. FIG. 1 is a diagram illustrating an example of a determination process executed by the determination device according to the embodiment. In FIG. 1, the determination device 10 can communicate with a content server 50 that delivers predetermined content and a manager terminal 200 via a predetermined network N such as the Internet. The determination device 10 may be capable of communicating with the terminal device 101 used by the user U01 and the terminal device 102 used by the user U02 via the network N.

端末装置101、102は、スマートフォンやタブレット等のスマートデバイスであり、3G(3rd Generation)やLTE(Long Term Evolution)等の無線通信網を介して、コンテンツサーバ50といった任意のサーバ装置と通信を行うことができる携帯端末装置である。なお、端末装置101、102は、スマートデバイスのみならず、デスクトップPCやノートPC等の情報処理装置であってもよい。なお、以下の説明では、各利用者U01、U02が使用する端末装置101、102を端末装置100と総称する場合がある。また、以下の説明では、利用者U01、利用者U02以外にも、任意の数の利用者が使用する任意の数の端末装置100がコンテンツサーバ50等と通信可能であるものとする。   The terminal devices 101 and 102 are smart devices such as smartphones and tablets, and communicate with an arbitrary server device such as the content server 50 via a wireless communication network such as 3G (3rd Generation) or LTE (Long Term Evolution). It is a portable terminal device that can be. The terminal devices 101 and 102 are not limited to smart devices and may be information processing devices such as desktop PCs and notebook PCs. In the following description, the terminal devices 101 and 102 used by the users U01 and U02 may be collectively referred to as the terminal device 100. Further, in the following description, it is assumed that, in addition to the users U01 and U02, any number of terminal devices 100 used by any number of users can communicate with the content server 50 and the like.

コンテンツサーバ50は、端末装置100に対してウェブページ、ウィジェット、静止画像、動画像、ゲーム等といった各種のウェブコンテンツ(以下、「コンテンツ」と記載する。)を配信するサーバ装置である。例えば、コンテンツサーバ50は、所定のドメインに含まれる所定のコンテンツを端末装置100に送信する。   The content server 50 is a server device that delivers various web contents (hereinafter referred to as “contents”) such as web pages, widgets, still images, moving images, and games to the terminal device 100. For example, the content server 50 transmits the predetermined content included in the predetermined domain to the terminal device 100.

管理者端末200は、判定装置10の管理を行う管理者が使用する端末装置であり、例えば、PCやサーバ装置等により実現される。なお、管理者端末200は、判定装置10の管理者のみならず、判定装置10による判定処理の結果を所望する利用者が使用する端末装置であれば、任意の利用者が使用する端末装置であってよい。   The administrator terminal 200 is a terminal device used by an administrator who manages the determination device 10, and is realized by, for example, a PC or a server device. Note that the administrator terminal 200 is a terminal device used by any user as long as it is a terminal device used not only by the administrator of the determination device 10 but also by a user who desires the result of the determination processing by the determination device 10. You can

判定装置10は、同一の事象に含まれる標本の有意差を判定する判定装置であり、例えば、サーバ装置やクラウドシステム等により実現される。より具体的な例を説明すると、判定装置10は、コンテンツサーバ50が配信した所定のコンテンツにおける利用者の行動を示す情報から複数の情報をランダムに選択することで複数の標本を抽出し、抽出した標本同士に統計学的に有意な差が存在するか否かを判定する。より具体的には、判定装置10は、所定のコンテンツにおける利用者の行動を示す標本について、t検定やZ検定等といった任意の検定手法により標本の有意差を判定する判定装置である。以下の説明では、Z検定を用いた検定を行う例について説明するが、判定装置10は、以下に説明する判定方法を、任意の検定手法に適用してよい。   The determination device 10 is a determination device that determines a significant difference between samples included in the same event, and is realized by, for example, a server device or a cloud system. To describe a more specific example, the determination device 10 extracts a plurality of samples by randomly selecting a plurality of information from the information indicating the behavior of the user in the predetermined content distributed by the content server 50, and extracts the sample. It is determined whether or not there is a statistically significant difference between the prepared samples. More specifically, the determination device 10 is a determination device that determines a significant difference between samples showing user behavior in predetermined content by an arbitrary test method such as t-test or Z-test. In the following description, an example of performing a test using the Z test will be described, but the determination device 10 may apply the determination method described below to any test method.

〔1−2.コントロールバリエーションについて〕
ここで、一般的な検定手法においては、有意差の判定対象となる標本ごとに平均値を算出し、算出した平均値を用いて有意差が存在するか否かを判定する。例えば、Z検定といわれる手法においては、情報の母集団から1つ以上の情報をランダムに抽出した標本Y(t)および標本Y(c)を生成し、以下の式(1)の値が所定の閾値よりも多い場合には、標本Y(t)および標本Y(c)に有意差があると判定する。なお、式(1)においてオーバーラインを付したY(t)は、標本Y(t)として抽出された値の平均値を示し、オーバーラインを付したY(c)は、標本Y(c)として抽出された値の平均値を示す。なお、以下の説明では、オーバーラインを付した記号は、その記号が示す値の平均値を示すものとする。
[1-2. About control variations]
Here, in a general test method, an average value is calculated for each sample for which a significant difference is to be determined, and whether the significant difference exists is determined using the calculated average value. For example, in the method called the Z test, a sample Y (t) and a sample Y (c) in which one or more pieces of information are randomly extracted from a population of information are generated, and the value of the following formula (1) is predetermined. If it is larger than the threshold value of, it is determined that there is a significant difference between the sample Y (t) and the sample Y (c) . In addition, in formula (1), the overlined Y (t) represents the average value of the values extracted as the sample Y (t) , and the overlined Y (c) is the sample Y (c). The average value of the values extracted as is shown. In the following description, an overlined symbol indicates the average value of the values indicated by the symbol.

Figure 0006701026
Figure 0006701026

ここで、標本Yにn個の値Xiが含まれる場合、標本Yの平均値は、以下の式(2)で示すことができる。   Here, when the sample Y includes n values Xi, the average value of the sample Y can be expressed by the following equation (2).

Figure 0006701026
Figure 0006701026

ここで、式(2)を用いた場合、標本の選択や事象の内容、すなわち、所定のコンテンツにおける利用者の行動の情報によっては、平均値の分散が必ずしも小さいとは言えない場合がある。しかしながら、標本の平均値の分散が増大した場合には、有意差の検出精度が悪化する場合がある。   Here, when the expression (2) is used, the variance of the average value may not necessarily be small depending on the selection of the sample and the content of the event, that is, the information on the behavior of the user in the predetermined content. However, when the variance of the average value of the sample increases, the accuracy of detecting the significant difference may deteriorate.

そこで、コントロールバリエーション(Control Variates)と呼ばれる式を用いて所定の推定量(以下、「推定指標値」と記載する。)を算出し、式(1)に示した平均値に代えて、各標本の推定指標値を用いて、有意差を評価するCUPEDと呼ばれる手法が知られている。例えば、CUPEDにおいては、以下の式(3)で示される推定指標値を標本ごとに算出する。ここで、式(3)では、推定指標値をYcvで示した。また、式(3)に示すXは、標本Yとは独立して選択される値であり、θは、Xの値に応じて最適値が定まる係数である。また、式(3)に示すEXは、Xの値の期待値を示す。 Therefore, a predetermined estimated amount (hereinafter referred to as “estimation index value”) is calculated using an expression called Control Variates, and each sample is replaced with the average value shown in Expression (1). There is known a method called CUPED for evaluating a significant difference using the estimated index value of. For example, in CUPED, the estimated index value shown by the following equation (3) is calculated for each sample. Here, in Expression (3), the estimated index value is represented by Y cv . Further, X shown in the equation (3) is a value selected independently of the sample Y, and θ is a coefficient whose optimum value is determined according to the value of X. Further, EX shown in Expression (3) indicates an expected value of X.

Figure 0006701026
Figure 0006701026

ここで、サンプルサイズを無限大に近づけた場合、式(3)は、式(2)と同じ式になる。このため、判定装置10は、式(3)に示される推定指標値を用いて、式(1)から有意差を判定しても、適切に有意差を判定できると考えられる。さらに、式(3)で示される推定指標値の分散を算出すると、以下の式(4)を得ることができる。   Here, when the sample size is brought close to infinity, the equation (3) becomes the same as the equation (2). Therefore, it is considered that the determination device 10 can appropriately determine the significant difference even if the significant difference is determined from the equation (1) using the estimated index value shown in the equation (3). Furthermore, the following equation (4) can be obtained by calculating the variance of the estimated index value shown in equation (3).

Figure 0006701026
Figure 0006701026

ここで、式(4)の右辺は、標本Yの平均値の分散と(1−ρ)との積で示すことができるが、(1−ρ)は1よりも小さい値を取る。つまり、ある標本Yについての推定指標値の値は、平均値の値よりも分散が小さくなる。このため、判定装置10は、式(3)に示される推定指標値を用いて、式(1)から有意差を判定した場合は、有意差を精度良く算出することができる。 Here, the right side of Expression (4) can be expressed by the product of the variance of the average value of the sample Y and (1-ρ 2 ), but (1-ρ 2 ) takes a value smaller than 1. That is, the variance of the estimated index value for a sample Y is smaller than that of the average value. Therefore, when the determination device 10 determines the significant difference from the equation (1) using the estimated index value shown in the equation (3), the determination device 10 can accurately calculate the significant difference.

〔1−3.判定処理について〕
ここで、推定指標値を算出する際のXの値は、任意の値を採用することができる。一方で、有意差の検出力は、採用される情報のカバレッジを増加させた場合や、採用される情報間の相関性を強化した場合に増大する。
[1-3. Judgment processing]
Here, an arbitrary value can be adopted as the value of X when calculating the estimated index value. On the other hand, the power of detecting a significant difference increases when the coverage of the adopted information is increased or when the correlation between the adopted information is strengthened.

そこで、判定装置10は、以下の判定処理を実行する。まず、判定装置10は、所定のコンテンツに関する利用者の行動を示す第1の指標値と、利用者の属性に基づく第2の指標値とに基づいて、所定のコンテンツに関して推定される利用者の行動を示す推定指標値を、所定のコンテンツに関する標本ごとに算出する。また、判定装置10は、標本ごとに算出された推定指標値に基づいて、各標本間の有意差を判定する。そして、判定装置10は、標本ごとに算出された推定指標値に基づいて、各標本間の有意差を判定し、判定結果を出力する。   Therefore, the determination device 10 executes the following determination process. First, the determination device 10 determines the user's estimated for the predetermined content based on the first index value indicating the behavior of the user regarding the predetermined content and the second index value based on the attribute of the user. The estimated index value indicating the behavior is calculated for each sample regarding the predetermined content. Further, the determination device 10 determines a significant difference between each sample based on the estimated index value calculated for each sample. Then, the determination device 10 determines a significant difference between the samples based on the estimated index value calculated for each sample, and outputs the determination result.

例えば、判定装置10は、所定のコンテンツの閲覧中に利用者がクリックしたリンクや、利用者が入力したクエリの値、クリックやクエリの入力を行ったか否か等、所定のコンテンツの閲覧時において利用者が実行可能な行動を示す値を第1の指標値として選択する。例えば、判定装置10は、クエリの入力を行った利用者に対して、第1の指標値「1」を割り当て、入力しなかった利用者に対して第1の指標値「0」を割り当てる。   For example, the determination device 10 determines whether the link clicked by the user while browsing the predetermined content, the value of the query input by the user, whether the click or the query is input, or the like when browsing the predetermined content. A value indicating a user-executable action is selected as the first index value. For example, the determination device 10 assigns the first index value “1” to the user who inputs the query, and assigns the first index value “0” to the user who did not input the query.

続いて、判定装置10は、所定のコンテンツの閲覧中に利用者が行った行動を示す値の中から、所定の数の値をランダムに抽出した第1の標本と第2の標本とを抽出する。そして、判定装置10は、各標本ごとに以下の処理を実行することで、推定指標値を算出する。まず、判定装置10は、第1の指標値として、所定のコンテンツの閲覧中に利用者が行った行動を示す値を、式(2)や式(3)に示すYの値とする。より具体的には、判定装置10は、第1の標本として抽出した値をY(t)とし、第2の標本として抽出した値をY(c)とする。そして、判定装置10は、Y(t)、Y(c)の平均値をそれぞれ算出する。 Subsequently, the determination device 10 extracts a first sample and a second sample in which a predetermined number of values are randomly extracted from the values indicating the behavior of the user while browsing the predetermined content. To do. Then, the determination apparatus 10 calculates the estimated index value by executing the following process for each sample. First, the determination device 10 sets, as the first index value, a value indicating the action taken by the user while browsing the predetermined content, as the Y value shown in the formula (2) or the formula (3). More specifically, the determination apparatus 10 sets the value extracted as the first sample as Y (t) and the value extracted as the second sample as Y (c) . Then, the determination device 10 calculates the average value of Y (t) and Y (c) , respectively.

続いて、判定装置10は、所定のコンテンツを閲覧した各利用者を、属性情報に基づいて複数のグループに組み分けし、組み分けの結果に基づいた値を第2の指標値として算出する。例えば、判定装置10は、利用者の性別が男性であるか女性であるかを判定し、利用者の性別が男性である場合には値「0」を第2の指標値とし、利用者の性別が女性である場合には値「1」を第2の指標値とする。そして、端末装置10は、第2の指標値を式(3)におけるXの値とする。   Subsequently, the determination device 10 divides each user who browses the predetermined content into a plurality of groups based on the attribute information, and calculates a value based on the result of the division as the second index value. For example, the determination device 10 determines whether the gender of the user is male or female, and when the gender of the user is male, the value “0” is set as the second index value, and When the gender is female, the value "1" is used as the second index value. Then, the terminal device 10 sets the second index value as the value of X in Expression (3).

例えば、判定装置10は、第1の標本に含まれる値が示す行動を行った利用者を特定し、特定した利用者の属性に基づく第2の指標値を収集する。そして、判定装置10は、収集した値をX(t)とする。同様に、判定装置10は、第2の標本に含まれる値が示す行動を行った利用者を特定し、特定した利用者の属性に基づく第2の指標値を収集する。そして、判定装置10は、収集した値をX(c)とする。 For example, the determination device 10 identifies the user who has performed the action indicated by the value included in the first sample, and collects the second index value based on the attribute of the identified user. Then, the determination device 10 sets the collected value as X (t) . Similarly, the determination device 10 identifies the user who has performed the action indicated by the value included in the second sample, and collects the second index value based on the attribute of the identified user. Then, the determination device 10 sets the collected value as X (c) .

そして、判定装置10は、Y(t)の値の平均値から、所定の係数θとX(t)の値の平均値との積を減算し、さらに、所定の係数θとX(t)の値の期待値との積を加算した値を、第1の標本の推定指標値Y(t) cvとする。また、判定装置10は、Y(c)の値の平均値から、所定の係数θとX(c)の値の平均値との積を減算し、さらに、所定の係数θとX(c)の値の期待値との積を加算した値を、第2の標本の推定指標値Y(c) cvの値とする。すなわち、判定装置10は、所定のコンテンツに関して推定される利用者の行動を示す推定指標値を標本ごとに算出する。 Then, the determination device 10 subtracts the product of the predetermined coefficient θ and the average value of the values of X (t) from the average value of the values of Y (t) , and further, the predetermined coefficient θ and X (t). The value obtained by adding the product of the value of and the expected value is set as the estimated index value Y (t) cv of the first sample. Further, the determination device 10 subtracts the product of the predetermined coefficient θ and the average value of the values of X (c) from the average value of the values of Y (c) , and further determines the predetermined coefficient θ and X (c). The value obtained by adding the product of the value of and the expected value is set as the value of the estimated index value Y (c) cv of the second sample. That is, the determination device 10 calculates, for each sample, an estimated index value indicating the behavior of the user estimated with respect to the predetermined content.

そして、判定装置10は、Y(t) cvをY(t)の平均値とし、Y(c) cvをY(c)の平均値として、上述した式(1)の値を算出し、算出した値が所定の閾値を超えるか否かに基づいて、第1の標本および第2の標本の有意差を判定する。 Then, the determination device 10 calculates the value of the above-described formula (1) using Y (t) cv as the average value of Y (t) and Y (c) cv as the average value of Y (c) , and calculates the value. The significant difference between the first sample and the second sample is determined based on whether or not the calculated value exceeds a predetermined threshold value.

このように、判定装置10は、所定のコンテンツに関する利用者の行動の標本間の有意差を判定する際に、所定のコンテンツに関する利用者の行動を示す指標値のみならず、その利用者の属性情報に応じた第2の指標値を用いて、標本ごとに推定指標値を算出し、算出した推定指標値に基づき、標本間の有意差を判定する。すなわち、判定装置10は、第1の指標値に関する利用者のクラスタリングに関する情報を、第2の指標値とする。この結果、判定装置10は、標本のカバレッジを向上させることができるので、有意差の判定精度を向上させることができる。また、判定装置10は、第1の標本および第2の標本に第1の指標値が含まれる利用者を特定し、特定した利用者の属性に基づく第2の指標値を用いるので、XとYとの相関性を向上させる結果、有意差の判定精度を向上させることができる。   In this way, the determination device 10 determines not only the index value indicating the behavior of the user regarding the predetermined content but also the attribute of the user when determining the significant difference between the samples of the behavior of the user regarding the predetermined content. An estimated index value is calculated for each sample using the second index value according to the information, and a significant difference between samples is determined based on the calculated estimated index value. That is, the determination device 10 sets the information on the user clustering related to the first index value as the second index value. As a result, the determination device 10 can improve the coverage of the sample, and thus can improve the accuracy of determining the significant difference. Further, since the determination device 10 identifies the user whose first index value is included in the first sample and the second sample and uses the second index value based on the attribute of the identified user, X As a result of improving the correlation with Y, the accuracy of determining a significant difference can be improved.

ここで、カバレッジを向上させるため、第2の指標値として、所定のコンテンツに関する利用者の行動であって、第1の指標値の元となる行動よりも過去に取得された行動に基づく指標値を用いる手法が考えられる。しかしながら、このような手法では、所定のコンテンツが新規なコンテンツである場合や、所定のコンテンツの配信先に新規な利用者が存在する場合には、過去に出力された情報が存在しないため、推定指標値の分散が上昇する恐れがある。   Here, in order to improve the coverage, as the second index value, the index value based on the activity of the user regarding the predetermined content, which is based on the activity acquired earlier than the activity that is the basis of the first index value. A method using is conceivable. However, in such a method, when the predetermined content is a new content, or when a new user exists at the delivery destination of the predetermined content, there is no information output in the past, so it is estimated The dispersion of index values may increase.

しかしながら、判定装置10は、第2の指標値として、過去に取得された行動に基づく指標値ではなく、利用者の属性に基づく指標値を用いて、推定指標値の値を算出する。このため、判定装置10は、所定のコンテンツを初めて所定の利用者に配信した場合であっても、その利用者の属性情報に基づく値を第2の指標値とすることで、推定指標値の分散を減少させることができる。この結果、判定装置10は、有意差の判定精度を向上させることができる。   However, the determination device 10 calculates the value of the estimated index value by using the index value based on the attribute of the user as the second index value, not the index value based on the behavior acquired in the past. Therefore, even when the predetermined content is delivered to the predetermined user for the first time, the determination device 10 sets the value based on the attribute information of the user as the second index value, so that the estimated index value Dispersion can be reduced. As a result, the determination device 10 can improve the determination accuracy of the significant difference.

〔1−4.属性情報について〕
ここで、判定装置10は、利用者の属性に基づく値であれば、任意の属性に基づく値を第2の指標値としてもよく、利用者の属性から任意のルールに基づいて生成された値を第2の指標値としてよい。
[1-4. About attribute information]
Here, the determination device 10 may use a value based on an arbitrary attribute as the second index value as long as it is a value based on the attribute of the user, and a value generated from the attribute of the user based on an arbitrary rule. May be used as the second index value.

例えば、判定装置10は、利用者の属性として、性別、年齢、年代、住所、趣味等といった情報を利用してもよい。また、判定装置10は、利用者の属性として、利用者が使用している端末装置100の種別や利用者がコンテンツを閲覧した際の位置を示す情報を用いてもよい。また、判定装置10は、利用者の属性として、利用者が電子商店街で過去に購入した商品や役務の履歴、オークションサイト等における出品履歴や落札履歴、利用者が閲覧したウェブページの履歴等、各種の履歴を利用者の属性としてもよい。   For example, the determination device 10 may use information such as sex, age, age, address, hobbies, etc., as the attributes of the user. Further, the determination device 10 may use, as the attribute of the user, information indicating the type of the terminal device 100 used by the user and the position when the user browses the content. Further, the determination device 10 has, as the attributes of the user, a history of products and services that the user has purchased in the online shopping mall in the past, an exhibition history and a successful bid history at an auction site, etc., a history of web pages browsed by the user, and the like. , Various types of history may be used as user attributes.

そして、判定装置10は、利用者の属性に応じて、利用者を複数のグループに分類し、分類結果に応じた値を第2の指標値とする。例えば、判定装置10は、予め所定の番号が付された複数のグループを設定し、利用者をいずれかのグループに分類する。そして、判定装置10は、利用者が分類されたグループに設定されていた番号を第2の指標値としてもよい。   Then, the determination device 10 classifies the users into a plurality of groups according to the attributes of the users, and sets a value corresponding to the classification result as the second index value. For example, the determination device 10 sets a plurality of groups to which predetermined numbers are given in advance, and classifies the users into any of the groups. Then, the determination device 10 may use the number set in the group into which the users are classified as the second index value.

また、例えば、判定装置10は、利用者の属性ごとに、その属性に応じた値を決定し、決定した値に基づいて第2の指標値を算出してもよい。すなわち、判定装置10は、利用者の属性を示す値であれば、任意の値を第2の指標値として算出してよい。   Further, for example, the determination device 10 may determine a value according to the attribute of each user and calculate the second index value based on the determined value. That is, the determination device 10 may calculate an arbitrary value as the second index value as long as the value indicates the attribute of the user.

〔1−5.グループ分けについて〕
ここで、判定装置10は、利用者の属性に応じて利用者の分類を行うモデルを用いて、利用者の分類を行い、分類結果に応じた値を第2の指標値として採用してもよい。例えば、判定装置10は、SVM(Support Vector Machine)やニューラルネットワーク、ディープラーニング等といった任意の学習手法により、利用者の属性を学習したモデルを用いて、利用者の分類を行ってよい。
[1-5. About grouping]
Here, the determination device 10 classifies the users by using the model that classifies the users according to the attributes of the users, and adopts a value according to the classification result as the second index value. Good. For example, the determination device 10 may classify the users using a model in which the attributes of the users are learned by an arbitrary learning method such as SVM (Support Vector Machine), neural network, and deep learning.

また、判定装置10は、利用者の分類結果に応じた第2の指標値を用いた際に、有意差の判定精度が向上するように学習を行ったモデルを用いてもよい。すなわち、判定装置10は、有意差の判定精度が向上するように、利用者を分類するよう学習を行ったモデルを用いてもよい。例えば、判定装置10は、予め有意差が算出された第1の標本および第2の標本を正解データとして取得する。また、判定装置10は、正解データから利用者の分類を行い、分類結果に基づいた第2の指標値を算出する。そして、判定装置10は、算出した第2の指標値を用いた際に算出される有意差が、予め算出された有意差と近づくように、モデルの修正を行ってもよい。   In addition, the determination device 10 may use a model that has been learned so that the determination accuracy of the significant difference is improved when the second index value according to the user's classification result is used. That is, the determination device 10 may use a model learned to classify the users so that the determination accuracy of the significant difference is improved. For example, the determination device 10 acquires, as correct answer data, the first sample and the second sample for which a significant difference has been calculated in advance. Further, the determination device 10 classifies the users from the correct answer data and calculates the second index value based on the classification result. Then, the determination device 10 may correct the model so that the significant difference calculated when the calculated second index value is used approaches the significant difference calculated in advance.

なお、上述したモデルは、判定装置10が学習を行ってもよく、判定装置10とは異なる学習装置により予め学習が行われたものであってもよい。   The above-described model may be learned by the determination device 10 or may be one that is previously learned by a learning device different from the determination device 10.

〔1−6.コンテンツについて〕
ここで、判定装置10は、所定のコンテンツとして任意のコンテンツを採用してよい。例えば、判定装置10は、所定のコンテンツがウェブ検索を受付けるポータルサイト、オークション、経路検索、電子商店街、ゲーム、宿泊予約、ファイナンス、天気予報、レストランの情報サイト、不動産サイト、自動車関連のサイト、各種の掲示板やブログ、レシピ等の提供を行うウェブサイト等を所定のコンテンツとして良い。また、判定装置10は、ウェブサイトのみならず、所定のコンテンツと関連するアプリケーションやウィジェットを所定のコンテンツとし、かかるコンテンツにおける利用者の行動を示す値を第1の指標値としてもよい。
[1-6. About content]
Here, the determination device 10 may employ any content as the predetermined content. For example, the determination device 10 may be a portal site where a predetermined content accepts a web search, an auction, a route search, an online shopping mall, a game, an accommodation reservation, finance, a weather forecast, a restaurant information site, a real estate site, an automobile-related site, The predetermined content may be various bulletin boards, blogs, websites that provide recipes, and the like. Further, the determination device 10 may set not only the website but also an application or a widget related to a predetermined content as the predetermined content, and a value indicating the behavior of the user in the content as the first index value.

〔1−7.利用者の共通性について〕
また、判定装置10は、第1の指標値が示す行動を行った利用者の属性に基づく値のみならず、他の利用者の属性に基づく値を第2の指標値に加えてもよい。すなわち、判定装置10は、第1の指標値に関する利用者と、第2の指標値に関する利用者とを完全に同一とする必要はなく、第1の指標値が示す行動を行った利用者と、第2の指標値が属性を示す利用者との一部が共通するように、第2の指標値を取得してもよい。すなわち、判定装置10は、所定のコンテンツについて複数の利用者が行った行動を示す第1の指標値と、かかる複数の利用者のうち、所定の数の利用者を含む複数の利用者の属性に基づく第2の指標値とを用いて、推定指標値を算出すればよい。
[1-7. Regarding commonality of users]
The determination device 10 may add not only the value based on the attribute of the user who performed the action indicated by the first index value but also the value based on the attribute of another user to the second index value. That is, the determination device 10 does not need to completely make the user associated with the first index value and the user associated with the second index value the same as the user who performed the action indicated by the first index value. The second index value may be acquired such that the second index value is partly common with the user indicating the attribute. That is, the determination device 10 determines the first index value indicating the behavior of a plurality of users with respect to the predetermined content and the attributes of the plurality of users including a predetermined number of users among the plurality of users. The estimated index value may be calculated using the second index value based on.

〔1−8.指標値が示す行動について〕
ここで、判定装置10は、例えば、所定のコンテンツに関する利用者の行動を示す指標値として、所定のコンテンツを閲覧中に利用者が行ったクリックの有無やクリックしたリンク又はコンテンツ等を示す値を指標値とする。しかしながら、実施形態は、これに限定するものではない。例えば、判定装置10は、クリック以外にも、例えば、ウェブ検索を行う際に入力したクエリの内容やクエリを入力した回数を指標値としてもよい。すなわち、判定装置10は、任意の行動を示す値を指標値としてよい。
[1-8. Regarding the behavior indicated by the index value)
Here, the determination device 10 uses, for example, a value indicating the presence/absence of a click made by the user while browsing the predetermined content, a link indicating the clicked content, or the like as an index value indicating the behavior of the user regarding the predetermined content. Use as index value. However, the embodiment is not limited to this. For example, the determination device 10 may use, as an index value, for example, the content of the query input when performing the web search or the number of times the query is input, other than the click. That is, the determination device 10 may use a value indicating an arbitrary action as the index value.

例えば、判定装置10は、所定のコンテンツに対して行った利用者の評価や、利用者が入力した所定のコンテンツに対する興味の度合いを示す値を第1の指標値としてもよい。すなわち、判定装置10は、第1の指標値と第2の指標値とがある程度共通する利用者に関連するKPI(Key Performance Indicator)であるならば、任意の指標値を第1の指標値として採用してよい。   For example, the determination device 10 may use, as the first index value, a value indicating the user's evaluation of the predetermined content or the degree of interest in the predetermined content input by the user. That is, if the first index value and the second index value are KPIs (Key Performance Indicators) related to the user in which the first index value and the second index value are common to some extent, the determination device 10 sets any index value as the first index value. You may adopt it.

〔1−9.判定処理の一例について〕
次に、図1を用いて、判定装置10が実行する処理の一例について説明する。なお、以下の説明では、所定のコンテンツに関する利用者の行動を示す情報を第1の指標値とし、その利用者の属性を示す情報を第2の指標値として用いる処理の一例について説明する。また、図1に示す例では、利用者U01の属性情報が「属性#1」であり、利用者U02の属性情報が「属性#2」である例について説明する。
[1-9. Regarding an example of determination processing]
Next, an example of the process executed by the determination device 10 will be described with reference to FIG. In the following description, an example of a process will be described in which the information indicating the behavior of the user regarding the predetermined content is used as the first index value and the information indicating the attribute of the user is used as the second index value. Further, in the example shown in FIG. 1, an example in which the attribute information of the user U01 is “attribute #1” and the attribute information of the user U02 is “attribute #2” will be described.

まず、コンテンツサーバ50は、端末装置100からの要求に従って、所定のコンテンツを端末装置100に配信する(ステップS1)。そして、コンテンツサーバ50は、所定のコンテンツの閲覧中に利用者U01、U02が行ったクリックの内容を示すクリック履歴とともに、その利用者U01、U02の属性を示す属性情報「属性#1」、「属性#2」を収集する(ステップS2)。なお、コンテンツサーバ50は、例えば、利用者U01、U02の属性情報を管理する管理サーバ(図示は省略)等の外部サーバから、利用者U01、U02の属性情報を収集してもよい。   First, the content server 50 delivers predetermined content to the terminal device 100 according to a request from the terminal device 100 (step S1). Then, the content server 50, along with the click history indicating the details of the clicks made by the users U01 and U02 while browsing the predetermined content, the attribute information “attribute #1”, “attribute #1” indicating the attributes of the users U01 and U02, Attribute #2" is collected (step S2). The content server 50 may collect the attribute information of the users U01 and U02 from an external server such as a management server (not shown) that manages the attribute information of the users U01 and U02.

続いて、判定装置10は、所定のコンテンツに関するクリック履歴と属性情報とをコンテンツサーバ50から収集する(ステップS3)。そして、判定装置10は、各クリック履歴が示すクリックの内容を行動内容とし、行動内容と、クリックを行った利用者の利用者IDとを対応付けて行動履歴データベース31に登録する。   Then, the determination device 10 collects the click history and the attribute information regarding the predetermined content from the content server 50 (step S3). Then, the determination device 10 sets the content of the click indicated by each click history as the action content, and registers the action content and the user ID of the user who performed the click in the action history database 31 in association with each other.

また、判定装置10は、収集した属性情報に基づいて、利用者U01、U02をグルーピングする(ステップS4)。より具体的には、判定装置10は、属性情報を入力すると、属性の種別ごとに、属性の内容を示す値を出力するモデルを用いて、利用者の属性情報を示す値を算出する。   The determination device 10 also groups the users U01 and U02 based on the collected attribute information (step S4). More specifically, when the attribute information is input, the determination device 10 calculates a value indicating the attribute information of the user by using a model that outputs a value indicating the content of the attribute for each attribute type.

例えば、図1に示すモデルは、性別が「男性」である場合には性別に対応する値「1」を出力し、性別が「女性」である場合には性別に対応する値「0」を出力するものとする。また、例えば、図1に示すモデルは、年代が「20代」である場合には、年代に対応する値「2」を出力し、年代が「30代」である場合には、年代に対応する値「3」を出力するものとする。また、例えば、図1に示すモデルは、住所が「神奈川在住」である場合には、住所に対応する値「4」を出力し、住所が「東京在住」である場合には、住所に対応する値「5」を出力するものとする。   For example, the model shown in FIG. 1 outputs the value “1” corresponding to the gender when the gender is “male”, and outputs the value “0” corresponding to the gender when the gender is “female”. It shall be output. Further, for example, the model shown in FIG. 1 outputs a value “2” corresponding to the age when the age is “20s”, and corresponds to the age when the age is “30s”. The value "3" to be output is output. Further, for example, the model shown in FIG. 1 outputs a value “4” corresponding to the address when the address is “resident in Kanagawa” and corresponds to the address when the address is “resident in Tokyo”. The value "5" to be output is output.

例えば、図1に示す例では、利用者U01の属性情報「属性#1」の内容が、性別「男性」、年代「30代」、住所「東京在住」であるものとする。このような属性を入力した場合、図1に示すモデルは、利用者U01の属性情報を示す値「1」、「3」、「5」を出力する。そして、判定装置10は、モデルが出力した値を並べた3桁の値「135」を、利用者U01の分類先となるグループを示す値、すなわち、第2の指標値とする。その後、判定装置10は、利用者IDと利用者の属性情報と第2の指標値とを対応付けてユーザデータベース32に登録する。   For example, in the example shown in FIG. 1, it is assumed that the content of the attribute information “attribute #1” of the user U01 is gender “male”, age “30s”, and address “resident in Tokyo”. When such an attribute is input, the model shown in FIG. 1 outputs the values “1”, “3”, and “5” indicating the attribute information of the user U01. Then, the determination device 10 sets the three-digit value “135” in which the values output by the model are arranged, as the value indicating the group that is the classification destination of the user U01, that is, the second index value. Then, the determination device 10 registers the user ID, the user attribute information, and the second index value in the user database 32 in association with each other.

なお、例えば、利用者U02の属性情報「属性#2」の内容が、性別「女性」、年代「20代」、住所「神奈川在住」である場合、図1に示すモデルは、利用者U02の属性情報を示す値として「0」、「2」、「4」を出力する。このため、判定装置10は、モデルが出力する値を並べた3桁の値「024」を、利用者U02の分類先となるグループを示す値、すなわち、第2の指標値とする。   Note that, for example, when the content of the attribute information “attribute #2” of the user U02 is gender “female”, age “20s”, and address “Kanagawa resident”, the model shown in FIG. "0", "2", and "4" are output as the values indicating the attribute information. Therefore, the determination device 10 sets the three-digit value “024” in which the values output by the model are arranged, as the value indicating the group to which the user U02 is classified, that is, the second index value.

また、判定装置10は、所定のコンテンツに関する標本の有意差を判定する場合、所定のコンテンツのクリック履歴から第1の指標値を標本ごとに算出する(ステップS5)。例えば、判定装置10は、所定のコンテンツのクリック履歴から、所定の数のクリック履歴を第1の標本としてランダムに選択し、第1の標本として選択したクリック履歴の内容を示す値の集合を第1の指標値Y(t)とする。同様に、判定装置10は、所定のコンテンツのクリック履歴から、所定の数のクリック履歴を第2の標本としてランダムに選択し、第2の標本として選択したクリック履歴の内容を示す値の集合を第1の指標値Y(c)とする。 Further, when determining the significant difference between the samples regarding the predetermined content, the determination device 10 calculates the first index value for each sample from the click history of the predetermined content (step S5). For example, the determination apparatus 10 randomly selects a predetermined number of click histories as the first sample from the click histories of the predetermined content, and sets a set of values indicating the contents of the click history selected as the first sample as the first sample. The index value Y (t) is 1. Similarly, the determination device 10 randomly selects a predetermined number of click histories as the second sample from the click histories of the predetermined contents, and sets a set of values indicating the contents of the click history selected as the second sample. Let it be the first index value Y (c) .

また、判定装置10は、利用者のグルーピング結果に応じた第2の指標値を標本ごとに算出する(ステップS6)。例えば、判定装置10は、第1の標本として選択されたクリック履歴が示すクリックを行った利用者を特定し、特定した利用者が分類されたグループを示す値をユーザデータベース32から抽出する。そして、判定装置10は、抽出した値の集合を第2の指標値X(t)とする。同様に、判定装置10は、第2の標本として選択されたクリック履歴が示すクリックを行った利用者を特定し、特定した利用者が分類されたグループを示す値をユーザデータベース32から抽出し、抽出した値の集合を第2の指標値X(c)とする。 Further, the determination device 10 calculates the second index value for each sample according to the user's grouping result (step S6). For example, the determination device 10 identifies the user who clicked the click history selected as the first sample, and extracts from the user database 32 a value indicating a group into which the identified user is classified. Then, the determination device 10 sets the set of extracted values as the second index value X (t) . Similarly, the determination device 10 identifies the user who performed the click indicated by the click history selected as the second sample, extracts the value indicating the group into which the identified user is classified, from the user database 32, The set of extracted values is set as the second index value X (c) .

そして、判定装置10は、所定のコンテンツについて推定される平均的な利用者の行動を示す値、すなわち、推定指標値を標本ごとに算出する(ステップS7)。例えば、判定装置10は、第1の指標値Y(t)と第2の指標値X(t)とを用いて、Y(t) cvの値を式(3)から算出し、第1の指標値Y(c)と第2の指標値X(c)とを用いて、Y(c) cvの値を式(3)から算出する。そして、判定装置10は、算出した推定指標値を用いて、標本間の有意差を判定する(ステップS8)。例えば、判定装置10は、Y(t) cvの値をY(t)の平均値とし、Y(c) cvの値をY(c)の平均値として、Z検定を行い、有意差が存在するか否かを判定する。そして、判定装置10は、検定結果を管理者端末200へと提供する(ステップS9)。 Then, the determination device 10 calculates, for each sample, a value indicating an average user behavior estimated for a predetermined content, that is, an estimated index value (step S7). For example, the determination device 10 calculates the value of Y (t) cv from the equation (3) using the first index value Y (t) and the second index value X (t) , Using the index value Y (c) and the second index value X (c) , the value of Y (c) cv is calculated from the equation (3). Then, the determination device 10 uses the calculated estimated index value to determine a significant difference between the samples (step S8). For example, the determination device 10 performs a Z test using the value of Y (t) cv as the average value of Y (t) and the value of Y (c) cv as the average value of Y (c) , and there is a significant difference. It is determined whether to do. Then, the determination device 10 provides the test result to the administrator terminal 200 (step S9).

〔2.判定装置の構成〕
以下、上記した判定処理を実現する判定装置10が有する機能構成の一例について説明する。図2は、実施形態に係る判定装置の構成例を示す図である。図2に示すように、判定装置10は、通信部20、記憶部30、および制御部40を有する。
[2. Configuration of determination device]
Hereinafter, an example of a functional configuration of the determination device 10 that realizes the determination process described above will be described. FIG. 2 is a diagram illustrating a configuration example of the determination device according to the embodiment. As shown in FIG. 2, the determination device 10 includes a communication unit 20, a storage unit 30, and a control unit 40.

通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、端末装置100や管理者端末200、コンテンツサーバ50との間で情報の送受信を行う。   The communication unit 20 is realized by, for example, a NIC (Network Interface Card) or the like. The communication unit 20 is connected to the network N in a wired or wireless manner, and transmits/receives information to/from the terminal device 100, the administrator terminal 200, and the content server 50.

記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、行動履歴データベース31、ユーザデータベース32、および分類モデルデータ33を記憶する。   The storage unit 30 is realized by, for example, a semiconductor memory device such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk. The storage unit 30 also stores an action history database 31, a user database 32, and classification model data 33.

行動履歴データベース31には、所定のコンテンツに関する利用者の行動を示す情報、すなわち、行動履歴が格納される。例えば、図3は、実施形態に係る行動履歴データベースに登録される情報の一例を示す図である。図3に示すように、行動履歴データベース31には、「コンテンツID」、「利用者ID」、「行動内容」等といった項目を有する情報が登録されている。なお、行動履歴データベース31には、図3に示す情報以外にも、任意の情報が登録されていてもよい。   The action history database 31 stores information indicating a user's action regarding a predetermined content, that is, an action history. For example, FIG. 3 is a diagram showing an example of information registered in the action history database according to the embodiment. As shown in FIG. 3, the action history database 31 is registered with information having items such as “content ID”, “user ID”, and “contents of action”. Note that, in the action history database 31, any information other than the information shown in FIG. 3 may be registered.

ここで、「コンテンツID」とは、コンテンツの識別子である。また、「利用者ID」とは、対応付けられた行動履歴が示す行動を行った利用者の識別子である。また、「行動内容」とは、利用者の行動を示す情報であり、例えば、クリックの内容を示す情報である。例えば、図3に示す例では、コンテンツID「コンテンツ#1」、利用者ID「User#1」、および行動内容「Click#1」とが対応付けて登録されている。このような情報は、コンテンツID「コンテンツ#1」が示すコンテンツを閲覧中に、利用者ID「User#1」が示す利用者が、行動内容「Click#1」が示すクリックを行った旨を示す情報である。なお、行動内容は、どのようなクリックが行われたかのみならず、クリックの有無を示す情報であってもよい。   Here, the "content ID" is an identifier of the content. The "user ID" is an identifier of a user who has performed the action indicated by the associated action history. The “action content” is information indicating the action of the user, for example, information indicating the content of the click. For example, in the example shown in FIG. 3, the content ID “content #1”, the user ID “User#1”, and the action content “Click#1” are registered in association with each other. Such information indicates that the user indicated by the user ID “User#1” clicks the action indicated by the action content “Click#1” while browsing the content indicated by the content ID “content #1”. It is information to show. The action content may be not only what kind of click has been made, but also information indicating the presence or absence of a click.

図2に戻り説明を続ける。ユーザデータベース32には、利用者の識別子であるユーザIDと利用者の属性情報とが、属性情報の項目ごとに対応付けて登録されている。例えば、図4は、実施形態に係るユーザデータベースに登録される情報の一例を説明する図である。例えば、図4に示す例では、ユーザデータベース32には、「利用者ID」、「属性項目」、「属性情報」、および「グループ」といった項目を有する情報が、「利用者ID」ごとに複数登録されている。「属性項目」とは、属性情報の項目を示す情報であり、例えば、「性別」、「年齢」、「住所」等といった情報が登録される。また、「属性情報」とは、対応付けられたユーザIDが示す利用者の属性情報であって、対応付けられた属性項目が示す内容の属性情報である。また、「グループ」とは、対応付けられた利用者IDが示す利用者が分類されたグループを示す値、すなわち、利用者の属性情報を示す値である。   Returning to FIG. 2, the explanation will be continued. In the user database 32, a user ID that is a user identifier and user attribute information are registered in association with each item of attribute information. For example, FIG. 4 is a diagram illustrating an example of information registered in the user database according to the embodiment. For example, in the example shown in FIG. 4, the user database 32 has a plurality of pieces of information having items such as “user ID”, “attribute item”, “attribute information”, and “group” for each “user ID”. It is registered. The “attribute item” is information indicating an item of attribute information, and for example, information such as “sex”, “age”, “address”, etc. is registered. The “attribute information” is the attribute information of the user indicated by the associated user ID, and is the attribute information of the content indicated by the associated attribute item. The "group" is a value indicating a group into which the user indicated by the associated user ID is classified, that is, a value indicating attribute information of the user.

例えば、図4に示す例では、利用者ID「User#1」に対し、属性項目「性別」および属性情報「男性」が対応付けて登録され、属性項目「年齢」(「年代」でもよい。)および属性情報「30代」が対応付けて登録され、属性項目「住所」および属性情報「A市」が対応付けて登録され、グループ「135」が対応付けて登録されている。このような情報は、例えば、利用者ID「User#1」が示す利用者の性別が男性であり、年齢が30代に含まれる年齢であり、住所がA市である旨を示している。またこのような情報は、利用者ID「User#1」が示す利用者の分類先となるグループが「135」である旨を示している。すなわち、このような情報は、利用者ID「User#1」が示す利用者の属性情報を示す値が「135」である旨を示す。   For example, in the example shown in FIG. 4, the attribute item "sex" and the attribute information "male" are registered in association with the user ID "User#1", and the attribute item "age" ("age" may be used). ) And attribute information “30s” are registered in association with each other, attribute item “address” and attribute information “A city” are registered in association with each other, and group “135” is registered in association with each other. Such information indicates, for example, that the gender of the user indicated by the user ID “User#1” is male, the age is in the age group of thirties, and the address is A city. Further, such information indicates that the group to which the user indicated by the user ID "User#1" is to be classified is "135". That is, such information indicates that the value indicating the user attribute information indicated by the user ID “User#1” is “135”.

なお、ユーザデータベース32には、図4に示す属性項目や属性情報以外にも、任意の属性項目や属性情報が登録されていてよい。また、ユーザデータベース32には、必ずしも全ての属性項目について属性情報が登録されている必要はなく、利用者が登録した、または、利用者の行動履歴から推定された属性情報のみが登録されていてもよい。   In addition to the attribute items and attribute information shown in FIG. 4, arbitrary attribute items and attribute information may be registered in the user database 32. Further, the user database 32 does not necessarily need to register the attribute information for all the attribute items, but only the attribute information registered by the user or estimated from the user's action history is registered. Good.

図2に戻り、説明を続ける。分類モデルデータ33は、利用者の属性情報に基づいて、利用者の分類を行うモデルである。例えば、分類モデルデータ33は、利用者の属性情報が入力されると、属性情報の種別ごとに、利用者の属性を示す値を算出するモデルである。   Returning to FIG. 2, the description will be continued. The classification model data 33 is a model for classifying users based on the attribute information of the users. For example, the classification model data 33 is a model that, when the attribute information of the user is input, calculates a value indicating the attribute of the user for each type of attribute information.

制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、判定装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部40は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。   The control unit 40 is a controller, and various programs stored in a storage device inside the determination device 10 include a RAM and the like by a processor such as a CPU (Central Processing Unit) and an MPU (Micro Processing Unit). It is realized by being executed as a work area. The control unit 40 is a controller, and may be realized by an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

図2に示すように、制御部40は、収集部41、選択部42、算出部43、判定部44、出力部45、および学習部46を有する。収集部41は、所定のコンテンツに関する利用者の行動を示す行動履歴をコンテンツサーバ50から収集する。より具体的には、収集部41は、行動を行った利用者の利用者IDと、利用者が行った行動の内容を示す行動内容と、利用者が閲覧していたコンテンツを示すコンテンツIDとを対応付けた情報を行動履歴としてコンテンツサーバ50から収集する。そして、収集部41は、収集した行動履歴を行動履歴データベース31に登録する。すなわち、収集部41は、行動履歴を収集し、利用者が閲覧していたコンテンツ毎に行動履歴をまとめて行動履歴データベース31に登録する。   As shown in FIG. 2, the control unit 40 includes a collection unit 41, a selection unit 42, a calculation unit 43, a determination unit 44, an output unit 45, and a learning unit 46. The collection unit 41 collects, from the content server 50, a behavior history indicating the behavior of the user regarding predetermined content. More specifically, the collection unit 41 has a user ID of a user who has performed an action, an action content that indicates the content of the action performed by the user, and a content ID that indicates the content that the user has browsed. The information associated with is collected from the content server 50 as an action history. Then, the collection unit 41 registers the collected action history in the action history database 31. That is, the collecting unit 41 collects the action history, collects the action history for each content browsed by the user, and registers the action history in the action history database 31.

また、収集部41は、利用者の属性情報をコンテンツサーバ50から収集する。また、収集部41は、収集した属性情報を分類モデルデータ33に入力し、分類モデルデータ33が出力した値、すなわち、第2の指標値となる値を、利用者の属性情報と、利用者IDと対応付けてユーザデータベース32に登録する。   Further, the collection unit 41 collects user attribute information from the content server 50. Further, the collection unit 41 inputs the collected attribute information into the classification model data 33, and outputs the value output from the classification model data 33, that is, the value serving as the second index value, to the user attribute information and the user. It is registered in the user database 32 in association with the ID.

選択部42は、行動履歴データベース31およびユーザデータベース32に登録された情報から、第1の標本および第2の標本を選択する。例えば、選択部42は、管理者端末200から所定のコンテンツに関する標本の有意差を判定する旨の要求を受付けた場合、所定のコンテンツを示すコンテンツID(例えば、コンテンツID「コンテンツ#1」)を含む行動履歴を行動履歴データベース31から特定する。   The selection unit 42 selects the first sample and the second sample from the information registered in the action history database 31 and the user database 32. For example, when the selection unit 42 receives a request from the administrator terminal 200 to determine a significant difference between samples related to a predetermined content, the selection unit 42 assigns the content ID indicating the predetermined content (for example, the content ID “content #1”). The action history including the action history database 31 is specified.

具体的には、選択部42は、第1の標本に含まれる第1の指標値として、特定した行動履歴からランダムに所定の数の利用者IDと行動履歴との組を選択する。続いて、選択部42は、第1の指標値として選択した組に含まれる利用者IDと同じ利用者IDに対応付けられた「グループ」の値を第2の指標値としてユーザデータベース32から選択する。なお、選択部42は、第1の指標値として選択した組に含まれる利用者IDのうち、所定の数の利用者IDを選択し、選択した利用者IDと対応付けられたグループの値に加えてランダムに選択したグループの値を第2の指標値としてもよい。同様に、選択部42は、第2の標本に含まれる第1の指標値として、特定した行動履歴からランダムに所定の数の利用者IDと行動履歴との組を選択し、選択した利用者IDと対応する利用者IDと対応付けられた「グループ」の値を第2の標本に含まれる第2の指標値とする。   Specifically, the selection unit 42 randomly selects, as the first index value included in the first sample, a predetermined number of sets of user IDs and action history from the identified action history. Subsequently, the selection unit 42 selects, from the user database 32, the value of “group” associated with the same user ID as the user ID included in the set selected as the first index value, as the second index value. To do. Note that the selection unit 42 selects a predetermined number of user IDs from the user IDs included in the set selected as the first index value, and sets the selected value to the group value associated with the selected user ID. In addition, the value of the randomly selected group may be used as the second index value. Similarly, the selection unit 42 randomly selects, as the first index value included in the second sample, a set of a predetermined number of user IDs and action history from the identified action history, and selects the selected user. The value of the “group” associated with the user ID corresponding to the ID is set as the second index value included in the second sample.

算出部43は、所定のコンテンツに関する利用者U01、U02の行動を示す第1の指標値と、利用者U01、U02の属性に基づく第2の指標値とに基づいて、所定のコンテンツに関して推定される利用者U01、U02の行動を示す推定指標値を、所定のコンテンツに関する標本ごとに算出する。   The calculation unit 43 is estimated for the predetermined content based on the first index value indicating the behavior of the users U01 and U02 regarding the predetermined content and the second index value based on the attributes of the users U01 and U02. The estimated index value indicating the behavior of the users U01 and U02 is calculated for each sample regarding a predetermined content.

具体的には、算出部43は、第1の指標値として、所定のコンテンツの閲覧中に行った選択操作の内容を示す値の平均値から、推定指標値を算出する。また、算出部43は、第2の指標値として、第2のコンテンツの閲覧中に行った選択操作の内容を示す値の平均値から、推定指標値を算出してもよい。また、算出部43は、利用者の属性に応じて利用者の分類を行うモデルを用いて、利用者の分類を行い、分類結果に応じた値を第2の指標値とする。そして、算出部43は、第1の指標値の平均値に対し、所定の係数と第2の指標値の平均値との積を減算し、所定の係数と第2の指標値の期待値との積を加算した値を推定指標値とする。   Specifically, the calculation unit 43 calculates the estimated index value as the first index value from the average value of the values indicating the contents of the selection operation performed while browsing the predetermined content. Further, the calculation unit 43 may calculate the estimated index value as the second index value from the average value of the values indicating the contents of the selection operation performed while browsing the second content. Further, the calculation unit 43 classifies the users by using the model that classifies the users according to the attributes of the users, and sets the value corresponding to the classification result as the second index value. Then, the calculation unit 43 subtracts the product of the predetermined coefficient and the average value of the second index values from the average value of the first index values to obtain the predetermined coefficient and the expected value of the second index value. The value obtained by adding the products of is taken as the estimated index value.

例えば、算出部43は、選択部42が選択した第1の標本に含まれる複数の行動履歴をそれぞれ数値化し、第1の指標値Y(t)とする。また、算出部43は、第2の標本に含まれる複数の行動履歴をそれぞれ数値化し、第1の指標値Y(c)とする。続いて、算出部43は、選択部42が選択した第1の標本に含まれる「グループ」の値を第2の指標値X(t)とする。また、算出部43は、選択部42が選択した第2の標本に含まれる「グループ」の値を第2の指標値X(c)とする。 For example, the calculation unit 43 digitizes each of the plurality of action histories included in the first sample selected by the selection unit 42, and sets the numerical values as the first index value Y (t) . In addition, the calculation unit 43 digitizes the plurality of action histories included in the second sample, and sets them as the first index value Y (c) . Subsequently, the calculation unit 43 sets the value of the “group” included in the first sample selected by the selection unit 42 as the second index value X (t) . Further, the calculation unit 43 sets the value of the “group” included in the second sample selected by the selection unit 42 as the second index value X (c) .

そして、算出部43は、第1の指標値Y(t)と第2の指標値X(t)とを用いて、第1の標本に係る推定指標値Y(t) cvの値を式(3)から算出し、第1の指標値Y(c)と第2の指標値X(c)とを用いて、第2の標本に係る推定指標値Y(c) cvの値を式(3)から算出する。 Then, the calculation unit 43 uses the first index value Y (t) and the second index value X (t) to calculate the value of the estimated index value Y (t) cv related to the first sample by the formula ( 3) and using the first index value Y (c) and the second index value X (c) , the value of the estimated index value Y (c) cv relating to the second sample is calculated by the formula (3 ).

判定部44は、標本ごとに算出された推定指標値に基づいて、各標本間の有意差を判定する。具体的には、判定部44は、算出部43が算出した推定指標値Y(t) cvおよびY(c) cvを用いて、式(1)から標本間の有意差を示す値を算出し、算出した値が所定の閾値よりも多いか否かを判定する。そして、判定部44は、算出した値が所定の閾値よりも多い場合には、有意差が存在すると判定し、算出した値が所定の閾値以下である場合には、有意差が存在しないと判定する。 The determination unit 44 determines a significant difference between each sample based on the estimated index value calculated for each sample. Specifically, the determination unit 44 uses the estimated index values Y (t) cv and Y (c) cv calculated by the calculation unit 43 to calculate a value indicating a significant difference between the samples from Expression (1). , It is determined whether the calculated value is larger than a predetermined threshold value. Then, the determination unit 44 determines that there is a significant difference when the calculated value is larger than the predetermined threshold value, and determines that there is no significant difference when the calculated value is less than or equal to the predetermined threshold value. To do.

出力部45は、判定部44による判定結果を管理者端末200に出力する。例えば、出力部45は、判定部44が実行する判定結果に基づいて、判定結果を示す結果画面C10を生成し、生成した結果画面C10を管理者端末200に配信する。   The output unit 45 outputs the determination result of the determination unit 44 to the administrator terminal 200. For example, the output unit 45 generates a result screen C10 indicating the determination result based on the determination result executed by the determination unit 44, and distributes the generated result screen C10 to the administrator terminal 200.

例えば、図5は、実施形態に係る判定装置が生成する結果画面の一例を示す図である。例えば、判定装置10は、所定のコンテンツに関する利用者の行動履歴からランダムに選択した第1の標本と第2の標本との組を複数組抽出し、抽出した組ごとに上述した判定処理を実行することで、有意差を示す値を算出する。そして、判定装置10は、図5に示すような結果画面C10を生成し、生成した結果画面C10を管理者端末200に表示させる。   For example, FIG. 5 is a diagram illustrating an example of a result screen generated by the determination device according to the embodiment. For example, the determination apparatus 10 extracts a plurality of sets of a first sample and a second sample that are randomly selected from the user's action history regarding predetermined content, and executes the above-described determination process for each extracted set. By doing so, a value indicating a significant difference is calculated. Then, the determination device 10 generates a result screen C10 as shown in FIG. 5 and causes the administrator terminal 200 to display the generated result screen C10.

例えば、判定装置10は、図5に示すように、標本の組ごとに有意差を示す値を算出し、算出結果を用いて、横軸方向に標本の組、縦軸方向に有意差を示す値を設定したグラフを生成する。そして、判定装置10は、グラフのうち、有意差の値が所定の閾値を超える範囲を太線で示し、有意差の値が所定の閾値以下となる範囲を点線で示す。また、判定装置10は、図5に示すグラフ中の黒丸印で示すように、管理者端末200の管理者がグラフ上の位置を選択した場合には、選択された位置に対応する標本の組に含まれる行動履歴をそれぞれ表示する結果画面C10を生成する。   For example, as illustrated in FIG. 5, the determination device 10 calculates a value indicating a significant difference for each set of samples, and uses the calculation result to show the set of samples in the horizontal axis direction and the significant difference in the vertical axis direction. Generate a graph with values set. Then, the determination device 10 indicates, in the graph, a range in which the value of the significant difference exceeds a predetermined threshold value by a thick line, and a range in which the value of the significant difference is equal to or less than the predetermined threshold value by a dotted line. Further, when the administrator of the administrator terminal 200 selects a position on the graph, as shown by a black circle in the graph shown in FIG. 5, the determination device 10 sets a set of samples corresponding to the selected position. A result screen C10 for displaying the action history included in each is generated.

図2に戻り、説明を続ける。学習部46は、分類モデルデータ33の学習を行う。例えば、学習部46は、予め有意差が算出された第1の標本および第2の標本を正解データとし、正解データから利用者の分類を行い、分類結果に基づいた第2の指標値を算出する。そして、学習部46は、算出した第2の指標値を用いた際に算出される有意差が、予め算出された有意差と近づくように、分類モデルデータ33の修正を行う。なお、学習部46は、上述した学習処理以外にも、任意の学習手法を用いて、利用者U01、U02の属性から利用者U01、U02をグルーピングするモデルを学習を行ってよい。   Returning to FIG. 2, the description will be continued. The learning unit 46 learns the classification model data 33. For example, the learning unit 46 sets the first sample and the second sample for which a significant difference has been calculated in advance as correct answer data, classifies users from correct answer data, and calculates a second index value based on the classification result. To do. Then, the learning unit 46 corrects the classification model data 33 so that the significant difference calculated when using the calculated second index value approaches the significant difference calculated in advance. The learning unit 46 may learn a model that groups the users U01 and U02 from the attributes of the users U01 and U02 by using any learning method other than the above-described learning process.

〔3.判定処理の流れの一例〕
続いて、図6を用いて、判定装置10が実行する処理の流れについて説明する。図6は、実施形態にかかる判定装置が実行する判定処理の流れの一例を示すフローチャートである。例えば、判定装置10は、各利用者の行動履歴と属性情報とを収集する(ステップS101)。そして、判定装置10は、収集した属性情報に基づいて、利用者のグルーピングを行う(ステップS102)。続いて、判定装置10は、所定のコンテンツに関する第1の指標値を標本ごとに算出し(ステップS103)、各標本と関連する利用者と同じ利用者のグルーピング結果に基づく第2の指標値を、標本ごとに算出する(ステップS104)。
[3. Example of flow of determination process]
Subsequently, a flow of processing executed by the determination device 10 will be described with reference to FIG. FIG. 6 is a flowchart showing an example of the flow of the determination process executed by the determination device according to the embodiment. For example, the determination device 10 collects the action history and attribute information of each user (step S101). Then, the determination device 10 groups users based on the collected attribute information (step S102). Subsequently, the determination apparatus 10 calculates a first index value for each sample for each sample (step S103), and obtains a second index value based on the grouping result of the same users as the users associated with each sample. , For each sample (step S104).

そして、判定装置10は、式(3)、すなわち、コントロールバリエーションと呼ばれる式に基づいて、推定指標値を標本ごとに算出し(ステップS105)、推定指標値を用いて、標本間の有意差を判定する(ステップS106)。その後、判定装置10は、判定結果を出力し(ステップS107)、処理を終了する。   Then, the determination device 10 calculates an estimated index value for each sample based on the equation (3), that is, an equation called control variation (step S105), and uses the estimated index value to determine the significant difference between the samples. The determination is made (step S106). Then, the determination device 10 outputs the determination result (step S107) and ends the process.

〔4.変形例〕
上記では、判定装置10による判定処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、判定装置10が実行する判定処理のバリエーションについて説明する。
[4. Modification example)
In the above, an example of the determination process by the determination device 10 has been described. However, the embodiment is not limited to this. Hereinafter, variations of the determination process executed by the determination device 10 will be described.

〔4−1.コントロールバリエーションについて〕
ここで、判定装置10は、所定のコンテンツに関する第1の指標値のみならず、利用者の属性に基づく第2の指標値を用いて、所定のコンテンツに関する指標値の有意差を判定するのであれば、式(3)として示した式以外の式を用いてもよい。また、判定装置10は、第1の指標値および第2の指標値から、θの値やEXの値を任意の手法により求めてもよい。
[4-1. About control variations]
Here, the determination device 10 determines not only the first index value regarding the predetermined content but also the second index value based on the attribute of the user to determine the significant difference between the index values regarding the predetermined content. For example, an expression other than the expression shown as the expression (3) may be used. Further, the determination device 10 may obtain the value of θ or the value of EX from the first index value and the second index value by an arbitrary method.

〔4−2.第2の指標値について〕
ここで、式(3)として示したコントロールバリエーションの式においては、Xに任意の情報を適用可能である。そこで、判定装置10は、第1の指標値が示す行動に関連するウェブページとはクロスドメインの関係を有するウェブページ等、所定のウェブページとは異なるウェブページに関する利用者の行動を示す値を第2の指標値としてもよい。
[4-2. Regarding the second index value]
Here, in the control variation formula shown as the formula (3), arbitrary information can be applied to X. Therefore, the determination device 10 determines a value indicating the behavior of the user regarding a web page different from a predetermined web page, such as a web page having a cross-domain relationship with the web page related to the behavior indicated by the first index value. It may be the second index value.

例えば、判定装置10は、所定のコンテンツに関する利用者の行動の標本間の有意差を判定する際に、所定のコンテンツに関する利用者の行動を示す値を第1の指標値とする。また、判定装置10は、所定のコンテンツとクロスドメインの関係を有する第2コンテンツの閲覧中に利用者が行った行動を示す値を第2の指標値とする。そして、判定装置10は、標本ごとに推定指標値を算出し、算出した推定指標値に基づき、標本間の有意差を判定してもよい。   For example, the determination device 10 sets the value indicating the behavior of the user regarding the predetermined content as the first index value when determining the significant difference between the samples of the behavior of the user regarding the predetermined content. Further, the determination device 10 sets the value indicating the action taken by the user while browsing the second content having a cross domain relationship with the predetermined content as the second index value. Then, the determination device 10 may calculate an estimated index value for each sample and determine a significant difference between samples based on the calculated estimated index value.

なお、判定装置10は、第2コンテンツの閲覧中に利用者が行った行動と、その利用者の属性とに応じた値を第2の指標値としてもよい。例えば、判定装置10は、第2コンテンツの閲覧中に利用者が行った行動を示す値と、利用者の属性情報を示す値とを並べた値を第2の指標値としてもよい。   Note that the determination device 10 may use, as the second index value, a value corresponding to the action performed by the user while browsing the second content and the attribute of the user. For example, the determination device 10 may use, as the second index value, a value obtained by arranging a value indicating the behavior of the user while browsing the second content and a value indicating the attribute information of the user.

また、他の例では、判定装置10は、行動履歴を収集した全ての利用者をクラスタリングの対象として、予めクラスタリングを行っておく。また、判定装置10は、所定のコンテンツに関する行動履歴から第1の標本と第2の標本とを選択する。また、判定装置10は、各標本について、所定のコンテンツの閲覧中に利用者が行った行動を示す第1の指標値と、その利用者が第2コンテンツを閲覧中に行った行動およびその利用者がクラスタリングされたグループの組み合わせを示す第2の指標値とを取得する。そして、判定装置10は、第1の指標値と第2の指標値とから、推定指標値を各標本ごとに算出し、推定指標値に基づいて、各標本の有意差を判定すればよい。なお、判定装置10は、行動履歴を収集した全ての利用者をクラスタリングの対象とする必要はなく、例えば、第1の標本にユーザIDが含まれる利用者のみをクラスタリングの対象としてもよい。   Further, in another example, the determination device 10 performs clustering in advance with all the users who have collected the action history as the target of clustering. Further, the determination apparatus 10 selects the first sample and the second sample from the action history regarding the predetermined content. In addition, the determination device 10 determines, for each sample, a first index value indicating the behavior of the user while browsing the predetermined content, the behavior of the user while browsing the second content, and the utilization thereof. A second index value indicating a combination of groups in which the person is clustered. Then, the determination device 10 may calculate an estimated index value for each sample from the first index value and the second index value, and determine a significant difference between each sample based on the estimated index value. Note that the determination device 10 does not need to target all users who have collected the action history as clustering targets, and may target only users whose user IDs are included in the first sample as clustering targets, for example.

〔4−3.判定対象や判定内容について〕
ここで、判定装置10は、所定のコンテンツに関する利用者の行動を示す第1の指標値を用いて、推定指標値を算出し、推定指標値を用いて、標本の有意差を判定した。すなわち、判定装置10は、所定のコンテンツに関する利用者の行動を示す情報の有意差を判定した。ここで、判定装置10は、所定のコンテンツに関する利用者の行動を示すのであれば、任意の行動を示す情報を第1の指標値とし、その情報の有意差を判定してもよい。例えば、判定装置10は、ABテストの結果、商品や任意の投稿に対する評価、音楽や映画等の各種コンテンツに対する評価等、所定のコンテンツに対して利用者が行った評価の内容を第1の指標値としてもよく、有意差の判定対象としてもよい。
[4-3. About judgment target and judgment contents]
Here, the determination apparatus 10 calculates the estimated index value using the first index value indicating the behavior of the user regarding the predetermined content, and determines the significant difference between the samples using the estimated index value. That is, the determination device 10 determines the significant difference in the information indicating the behavior of the user regarding the predetermined content. Here, if the determination device 10 indicates the behavior of the user regarding the predetermined content, the determination device 10 may determine the significant difference in the information by using the information indicating the arbitrary behavior as the first index value. For example, the determination device 10 uses the content of the evaluation performed on the predetermined content by the user as the first index, such as the result of the AB test, the evaluation of the product or any post, the evaluation of various contents such as music and movies, and the like. It may be a value, or may be a significant difference determination target.

また、判定装置10は、上述した推定指標値を用いて、Z検定以外にも、t検定等、任意の統計学的な検定手法を用いて、各標本が有する有意差の判定を行ってよい。   Further, the determination apparatus 10 may use the above-mentioned estimated index value to determine a significant difference between each sample by using any statistical test method such as t-test in addition to the Z test. ..

〔4−4.装置構成〕
判定装置10は、端末装置100や管理者端末200と情報のやり取りを行うフロントエンドサーバと、コンテンツサーバ50と情報をやり取りし、上述した判定処理を実行するバックエンドサーバとにより実現されてもよい。このような場合、フロントエンドサーバには、図2に示す出力部45が配置され、バックエンドサーバには、収集部41、選択部42、算出部43、判定部44、行動履歴データベース31、およびユーザデータベース32が配置されることとなる。また、記憶部30に格納された各データベース31、32や分類モデルデータ33は、判定装置10の内部ではなく、例えば、外部のストレージサーバ等に格納されていてもよい。
[4-4. Device configuration〕
The determination device 10 may be realized by a front-end server that exchanges information with the terminal device 100 or the administrator terminal 200, and a back-end server that exchanges information with the content server 50 and executes the determination process described above. .. In such a case, the output unit 45 shown in FIG. 2 is arranged in the front-end server, and the collection unit 41, the selection unit 42, the calculation unit 43, the determination unit 44, the action history database 31, and the back-end server. The user database 32 will be arranged. The databases 31 and 32 and the classification model data 33 stored in the storage unit 30 may be stored not in the determination device 10 but in an external storage server or the like, for example.

〔4−5.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[4-5. Other]
Further, of the processes described in the above embodiment, all or part of the processes described as being automatically performed may be manually performed, or the processes described as being manually performed may be performed. All or part of the process can be automatically performed by a known method. In addition, the processing procedures, specific names, information including various data and parameters shown in the above-mentioned documents and drawings can be arbitrarily changed unless otherwise specified. For example, the various kinds of information shown in each drawing are not limited to the illustrated information.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。   Further, each constituent element of each illustrated device is functionally conceptual, and does not necessarily have to be physically configured as illustrated. That is, the specific form of distribution/integration of each device is not limited to that shown in the figure, and all or a part of the device may be functionally or physically distributed/arranged in arbitrary units according to various loads or usage conditions. It can be integrated and configured.

また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。   Further, the respective embodiments described above can be appropriately combined within a range in which the processing content is not inconsistent.

〔5.プログラム〕
また、上述してきた実施形態に係る判定装置10は、例えば図7に示すような構成のコンピュータ1000によって実現される。図7は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
[5. program〕
Further, the determination device 10 according to the above-described embodiment is realized by, for example, a computer 1000 configured as shown in FIG. 7. FIG. 7 is a diagram illustrating an example of the hardware configuration. The computer 1000 is connected to an output device 1010 and an input device 1020, and an arithmetic device 1030, a primary storage device 1040, a secondary storage device 1050, an output IF (Interface) 1060, an input IF 1070, and a network IF 1080 are connected by a bus 1090. Have.

演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD、フラッシュメモリ等により実現される。   The arithmetic unit 1030 operates based on a program stored in the primary storage device 1040 or the secondary storage device 1050, a program read from the input device 1020, or the like, and executes various processes. The primary storage device 1040 is a memory device such as a RAM that temporarily stores data used by the arithmetic device 1030 for various calculations. The secondary storage device 1050 is a storage device in which data used by the arithmetic device 1030 for various calculations and various databases are registered, and is realized by a ROM (Read Only Memory), an HDD, a flash memory, or the like.

出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。   The output IF 1060 is an interface for transmitting information to be output to an output device 1010 that outputs various kinds of information such as a monitor and a printer. For example, a USB (Universal Serial Bus) or a DVI (Digital Visual Interface), It is realized by a connector of a standard such as HDMI (registered trademark) (High Definition Multimedia Interface). The input IF 1070 is an interface for receiving information from various input devices 1020 such as a mouse, a keyboard, and a scanner, and is realized by, for example, USB.

なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。   The input device 1020 is, for example, an optical recording medium such as a CD (Compact Disc), a DVD (Digital Versatile Disc), a PD (Phase change rewritable Disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), or a tape. It may be a device that reads information from a medium, a magnetic recording medium, a semiconductor memory, or the like. The input device 1020 may also be an external storage medium such as a USB memory.

ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。   The network IF 1080 receives data from another device via the network N and sends the data to the arithmetic device 1030, and also transmits data generated by the arithmetic device 1030 via the network N to another device.

演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。   The arithmetic device 1030 controls the output device 1010 and the input device 1020 via the output IF 1060 and the input IF 1070. For example, the arithmetic device 1030 loads a program from the input device 1020 or the secondary storage device 1050 onto the primary storage device 1040, and executes the loaded program.

例えば、コンピュータ1000が判定装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。   For example, when the computer 1000 functions as the determination device 10, the arithmetic device 1030 of the computer 1000 implements the function of the control unit 40 by executing the program loaded on the primary storage device 1040.

〔6.効果〕
上述したように、判定装置10は、所定のコンテンツに関する利用者U01、U02の行動を示す第1の指標値と、利用者U01、U02の属性に基づく第2の指標値とに基づいて、所定のコンテンツに関して推定される利用者の行動を示す推定指標値を、所定のコンテンツに関する標本ごとに算出する。そして、判定装置10は、標本ごとに算出された推定指標値に基づいて、各標本間の有意差を判定する。この結果、判定装置10は、有意差の判定に用いる情報の相関性を悪化させることなく、カバレッジを向上させることができるので、推定指標値の分散を低下させ、有意差の検出精度を向上させることができる。
[6. effect〕
As described above, the determination device 10 sets the predetermined index value based on the first index value indicating the behavior of the users U01 and U02 regarding the predetermined content and the second index value based on the attributes of the users U01 and U02. The estimated index value indicating the behavior of the user estimated with respect to the content is calculated for each sample regarding the predetermined content. Then, the determination device 10 determines a significant difference between each sample based on the estimated index value calculated for each sample. As a result, the determination device 10 can improve the coverage without deteriorating the correlation of the information used for the determination of the significant difference, so that the variance of the estimated index value is reduced and the detection accuracy of the significant difference is improved. be able to.

また、判定装置10は、利用者U01、U02の属性に応じた分類を行うモデルを用いて、利用者U01、U02を分類し、分類結果に応じた値を第2の指標値とする。このため、判定装置10は、容易な処理で推定指標値の分散を低下させ、有意差の検出精度を向上させることができる。   The determination device 10 also classifies the users U01 and U02 using a model that classifies according to the attributes of the users U01 and U02, and sets the value according to the classification result as the second index value. Therefore, the determination device 10 can reduce the variance of the estimated index value and improve the detection accuracy of the significant difference with a simple process.

また、判定装置10は、第1の指標値として、所定のコンテンツの閲覧中に行った選択操作の内容を示す値の平均値から、推定指標値を算出する。このため、判定装置10は、推定指標値を適切に算出することができる。   Further, the determination device 10 calculates the estimated index value as the first index value from the average value of the values indicating the contents of the selection operation performed while browsing the predetermined content. Therefore, the determination device 10 can appropriately calculate the estimated index value.

また、判定装置10は、第1の指標値の平均値に対し、所定の係数と第2の指標値の平均値との積を減算し、所定の係数と第2の指標値の期待値との積を加算した値を推定指標値とする。このため、判定装置10は、推定指標値の分散を通常の平均値よりも低下させることができるので、有意差の検出精度を向上させることができる。   Further, the determination device 10 subtracts the product of the predetermined coefficient and the average value of the second index values from the average value of the first index values to obtain the predetermined coefficient and the expected value of the second index value. The value obtained by adding the products of is taken as the estimated index value. Therefore, the determination device 10 can reduce the variance of the estimated index values below the normal average value, and thus can improve the accuracy of detecting a significant difference.

また、判定装置10は、所定のコンテンツについて複数の利用者が行った行動を示す第1の指標値と、第1の指標値が示す行動を行った複数の利用者のうち、所定の数の利用者を含む複数の利用者の属性に基づく第2の指標値とを用いて、推定指標値を算出する。このため、判定装置10は、適切に有意差を判定することができる。   In addition, the determination device 10 determines whether a predetermined number of the first index value indicating an action performed by a plurality of users with respect to a predetermined content and a plurality of users performing an action indicated by the first index value. The estimated index value is calculated using the second index value based on the attributes of the plurality of users including the user. Therefore, the determination device 10 can appropriately determine the significant difference.

また、判定装置10は、判定結果を出力する。このため、判定装置10は、管理者等に対して判定結果を提供することができる。   The determination device 10 also outputs the determination result. Therefore, the determination device 10 can provide the determination result to the administrator or the like.

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。   As described above, some of the embodiments of the present application have been described in detail based on the drawings, but these are examples, and various modifications based on the knowledge of those skilled in the art, including the modes described in the section of the disclosure of the invention, It is possible to implement the present invention in other forms with improvements.

また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、算出部は、算出手段や算出回路に読み替えることができる。   Further, the above-mentioned "section (module, unit)" can be read as "means" or "circuit". For example, the calculation unit can be read as a calculation unit or a calculation circuit.

10 判定装置
20 通信部
30 記憶部
31 行動履歴データベース
32 ユーザデータベース
33 分類モデルデータ33
40 制御部
41 収集部
42 選択部
43 算出部
44 判定部
45 出力部
46 学習部
50 コンテンツサーバ
100〜102 端末装置
200 管理者端末
10 determination device 20 communication unit 30 storage unit 31 action history database 32 user database 33 classification model data 33
40 control unit 41 collection unit 42 selection unit 43 calculation unit 44 determination unit 45 output unit 46 learning unit 50 content server 100 to 102 terminal device 200 administrator terminal

Claims (8)

第1の標本および第2の標本に属する利用者をそれぞれランダムに選択し、標本ごとに、当該標本に属する利用者の行動であって、所定のコンテンツに関する利用者の行動を示す値の集合に基づく第1の指標値と、利用者の属性を示す値の集合に基づく第2の指標値とに基づいて、前記所定のコンテンツについて推定される平均的な利用者の行動を示す値である推定指標値を算出する算出部と、
前記標本ごとに算出された前記推定指標値に基づいて、各標本間の有意差を判定する判定部と
を有することを特徴とする判定装置。
A user belonging to the first sample and the user belonging to the second sample are randomly selected, and for each sample, a set of values indicating the behavior of the user belonging to the sample and indicating the behavior of each user regarding a predetermined content. in the first and the index value, based on the second index value based on the set of values indicating the attributes of each user, a value that indicates the behavior of the average user to be estimated for the predetermined content based on a calculation unit for de San some estimate index value,
A determination unit that determines a significant difference between each sample based on the estimated index value calculated for each sample.
前記算出部は、前記利用者の属性に応じた分類を行うモデルを用いて、前記利用者を分類し、当該分類結果に応じた値の集合を前記第2の指標値とする
ことを特徴とする請求項1に記載の判定装置。
The calculation unit classifies the users by using a model that performs classification according to the attributes of the users, and sets a set of values according to the classification result as the second index value. The determination device according to claim 1.
前記算出部は、前記所定のコンテンツの閲覧中に行った選択操作の内容を示す値の平均値を前記第1の指標値とする
ことを特徴とする請求項1または2に記載の判定装置。
The calculation unit, judgment unit according to the mean value before Symbol value indicating the predetermined content selection operation made during viewing of contents to claim 1 or 2, characterized in that said first index value ..
前記算出部は、前記所定のコンテンツに関する各利用者の行動を示す値の平均である第1の指標値と、各利用者の属性を示す値の平均である第2の指標値とを算出し、当該第1の指標値から、所定の係数と前記第2の指標値との積を減算し、当該所定の係数と前記第2の指標値の期待値との積を加算した値を、前記推定指標値とする
ことを特徴とする請求項1〜3のうちいずれか1つに記載の判定装置。
The calculation unit calculates a first index value that is an average of values that indicate the behavior of each user regarding the predetermined content and a second index value that is an average of values that indicate the attributes of each user. , said first index value or, et al., subtracts the product of the a predetermined coefficient the second index value, a value obtained by adding the product of the expected value of the with the predetermined coefficient a second index value, The determination device according to claim 1, wherein the determination index value is used as the estimated index value.
前記算出部は、前記所定のコンテンツについて複数の利用者が行った行動を示す値に基づく第1の指標値と、当該第1の指標値が示す行動を行った複数の利用者のうち、所定の数の利用者を含む複数の利用者の属性を示す値に基づく第2の指標値とを用いて、前記推定指標値を算出する
ことを特徴とする請求項1〜4のうちいずれか1つに記載の判定装置。
The calculation unit determines a first index value based on a value indicating an action performed by a plurality of users with respect to the predetermined content, and a predetermined index among a plurality of users who performed the action indicated by the first index value. The estimated index value is calculated using a second index value based on a value indicating an attribute of a plurality of users including the number of users. Judgment device.
前記判定部による判定結果を出力する出力部
を有することを特徴とする請求項1〜5のうちいずれか1つに記載の判定装置。
The determination device according to claim 1, further comprising: an output unit that outputs a determination result by the determination unit.
判定装置が実行する判定方法であって、
第1の標本および第2の標本に属する利用者をそれぞれランダムに選択し、標本ごとに、当該標本に属する利用者の行動であって、所定のコンテンツに関する利用者の行動を示す値の集合に基づく第1の指標値と、利用者の属性を示す値の集合に基づく第2の指標値とに基づいて、前記所定のコンテンツについて推定される平均的な利用者の行動を示す値である推定指標値を算出する算出工程と、
前記標本ごとに算出された前記推定指標値に基づいて、各標本間の有意差を判定する判定工程と
を含むことを特徴とする判定方法。
A determination method executed by the determination device,
A user belonging to the first sample and the user belonging to the second sample are randomly selected, and for each sample, a set of values indicating the behavior of the user belonging to the sample and indicating the behavior of each user regarding a predetermined content. in the first and the index value, based on the second index value based on the set of values indicating the attributes of each user, a value that indicates the behavior of the average user to be estimated for the predetermined content based on a calculation step of de San some estimate index value,
A determination step of determining a significant difference between each sample based on the estimated index value calculated for each sample.
第1の標本および第2の標本に属する利用者をそれぞれランダムに選択し、標本ごとに、当該標本に属する利用者の行動であって、所定のコンテンツに関する利用者の行動を示す値の集合に基づく第1の指標値と、利用者の属性を示す値の集合に基づく第2の指標値とに基づいて、前記所定のコンテンツについて推定される平均的な利用者の行動を示す値である推定指標値を算出する算出手順と、
前記標本ごとに算出された前記推定指標値に基づいて、各標本間の有意差を判定する判定手順と
をコンピュータに実行させるための判定プログラム。
A user belonging to the first sample and the user belonging to the second sample are randomly selected, and for each sample, a set of values indicating the behavior of the user belonging to the sample and indicating the behavior of each user regarding a predetermined content. in the first and the index value, based on the second index value based on the set of values indicating the attributes of each user, a value that indicates the behavior of the average user to be estimated for the predetermined content based on a calculation procedure for de San certain estimated index value,
A determination program for causing a computer to execute a determination procedure for determining a significant difference between samples based on the estimated index value calculated for each sample.
JP2016156745A 2016-08-09 2016-08-09 Judgment device, judgment method, and judgment program Active JP6701026B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016156745A JP6701026B2 (en) 2016-08-09 2016-08-09 Judgment device, judgment method, and judgment program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016156745A JP6701026B2 (en) 2016-08-09 2016-08-09 Judgment device, judgment method, and judgment program

Publications (2)

Publication Number Publication Date
JP2018025934A JP2018025934A (en) 2018-02-15
JP6701026B2 true JP6701026B2 (en) 2020-05-27

Family

ID=61193830

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016156745A Active JP6701026B2 (en) 2016-08-09 2016-08-09 Judgment device, judgment method, and judgment program

Country Status (1)

Country Link
JP (1) JP6701026B2 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010124801A (en) * 2008-11-28 2010-06-10 Institute Of Physical & Chemical Research Maker for predicting effect of interferon therapy and method for screening interferon activity enhancer
JP5769347B2 (en) * 2013-07-31 2015-08-26 シャープ株式会社 Information processing apparatus, information processing system, terminal apparatus, information processing method, and information processing program
JP6440462B2 (en) * 2014-11-14 2018-12-19 東日本旅客鉄道株式会社 Service effect evaluation device

Also Published As

Publication number Publication date
JP2018025934A (en) 2018-02-15

Similar Documents

Publication Publication Date Title
US9256826B2 (en) Predicting reactions to short-text posts
JP6145576B2 (en) Large page recommendation in online social networks
US9215252B2 (en) Methods and apparatus to identify privacy relevant correlations between data values
US9015128B2 (en) Method and system for measuring social influence and receptivity of users
EP2778985A1 (en) Search result ranking by department
US20160026643A1 (en) Presenting suggested facets
US20160189202A1 (en) Systems and methods for measuring complex online strategy effectiveness
WO2017116526A1 (en) Systems and methods for utilizing webpage scripts to segment client sessions of a website
JP2018045553A (en) Selection device, selection method, and selection program
JP2013214133A (en) Information processing device, information processing method, and program
JP2019191686A (en) Information processing apparatus, information processing system, information processing method, and program
CN107357847B (en) Data processing method and device
JP6701026B2 (en) Judgment device, judgment method, and judgment program
US11373210B2 (en) Content interest from interaction information
JP4962950B2 (en) Recommendation method, recommendation server and program for users on network
US9892201B2 (en) Search engine classification
JP2017076376A (en) Calculation device, calculation method and calculation program
JP6203339B1 (en) Determination device, determination method, and determination program
JP6007300B1 (en) Calculation device, calculation method, and calculation program
JP2020035072A (en) Device, method, and program for processing information
JP2018045551A (en) Determination device, determination method, and determination program
JP7407779B2 (en) Information processing device, information processing method, and information processing program
US11550859B2 (en) Analytics system entity resolution
JP7303855B2 (en) Information processing device, information processing method and information processing program
US20180025378A1 (en) Fatigue Control in Dissemination of Digital Marketing Content

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180914

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191029

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200501

R150 Certificate of patent or registration of utility model

Ref document number: 6701026

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350