JP6701026B2 - Judgment device, judgment method, and judgment program - Google Patents
Judgment device, judgment method, and judgment program Download PDFInfo
- Publication number
- JP6701026B2 JP6701026B2 JP2016156745A JP2016156745A JP6701026B2 JP 6701026 B2 JP6701026 B2 JP 6701026B2 JP 2016156745 A JP2016156745 A JP 2016156745A JP 2016156745 A JP2016156745 A JP 2016156745A JP 6701026 B2 JP6701026 B2 JP 6701026B2
- Authority
- JP
- Japan
- Prior art keywords
- index value
- user
- value
- sample
- determination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 45
- 230000009471 action Effects 0.000 claims description 61
- 238000004364 calculation method Methods 0.000 claims description 28
- 230000006399 behavior Effects 0.000 description 35
- 230000008569 process Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 12
- 238000011156 evaluation Methods 0.000 description 10
- 238000013145 classification model Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 3
- 238000000692 Student's t-test Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012353 t test Methods 0.000 description 2
- 238000010998 test method Methods 0.000 description 2
- 238000001801 Z-test Methods 0.000 description 1
- 230000004308 accommodation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 238000012812 general test Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Description
本発明は、判定装置、判定方法および判定プログラムに関する。 The present invention relates to a determination device, a determination method, and a determination program.
従来、利用者による評価結果の有意性を判定する技術が知られている。このような技術の一例として、あるウェブコンテンツを利用者に評価させた際の評価結果と、同一のウェブコンテンツについて過去に行われた評価結果とを用いることで、評価値の平均値が有するばらつきを減少させ、有意性の判定精度を向上させるCUPED(Controlled-experiment Using Pre-Experiment Data)といった技術が知られている。 Conventionally, a technique for determining the significance of the evaluation result by the user is known. As an example of such a technique, by using an evaluation result when a user evaluates a certain web content and an evaluation result performed in the past with respect to the same web content, a variation in the average value of the evaluation values is obtained. There is known a technique such as CUPED (Controlled-experiment Using Pre-Experiment Data) that reduces the error rate and improves the accuracy of significance determination.
しかしながら、上述した従来技術では、新たに評価を行った利用者と過去に評価を行った利用者が重複しない場合には、平均値のばらつきが増大し、有意性の検出精度が悪化する場合がある。 However, in the above-described conventional technique, when the user who newly evaluates and the user who previously evaluates do not overlap, the dispersion of the average value increases, and the accuracy of significance detection may deteriorate. is there.
本願は、上記に鑑みてなされたものであって、評価結果が有する有意性の検出精度を向上させることを目的とする。 The present application has been made in view of the above, and an object thereof is to improve the accuracy of detecting the significance of the evaluation result.
本願に係る判定装置は、所定のコンテンツに関する利用者の行動を示す第1の指標値と、当該利用者の属性に基づく第2の指標値とに基づいて、前記所定のコンテンツに関して推定される利用者の行動を示す推定指標値を、前記所定のコンテンツに関する標本ごとに算出する算出部と、前記標本ごとに算出された前記推定指標値に基づいて、各標本間の有意差を判定する判定部とを有することを特徴とする。 The determination apparatus according to the present application is estimated to be used for the predetermined content based on a first index value indicating the behavior of the user regarding the predetermined content and a second index value based on the attribute of the user. A calculation unit that calculates an estimated index value indicating the behavior of a person for each sample related to the predetermined content, and a determination unit that determines a significant difference between samples based on the estimated index value calculated for each sample. And having.
実施形態の一態様によれば、評価結果が有する有意性の検出精度を向上させることができる。 According to the aspect of the embodiment, it is possible to improve the accuracy of detecting the significance of the evaluation result.
以下に、本願に係る判定装置、判定方法および判定プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る判定装置、判定方法および判定プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Hereinafter, modes (hereinafter, referred to as “embodiments”) for carrying out the determination device, the determination method, and the determination program according to the present application will be described in detail with reference to the drawings. The determination device, the determination method, and the determination program according to the present application are not limited to this embodiment. Also, in each of the following embodiments, the same parts are designated by the same reference numerals, and duplicate description will be omitted.
[実施形態]
〔1−1.判定装置の一例〕
まず、図1を用いて、判定装置が実行する判定処理の一例について説明する。図1は、実施形態に係る判定装置が実行する判定処理の一例を示す図である。図1では、判定装置10は、インターネット等の所定のネットワークNを介して、所定のコンテンツを配信するコンテンツサーバ50や、管理者端末200と通信可能である。なお、判定装置10は、ネットワークNを介して、利用者U01が使用する端末装置101、利用者U02が使用する端末装置102と通信可能であってもよい。
[Embodiment]
[1-1. Example of determination device]
First, an example of the determination process executed by the determination device will be described with reference to FIG. FIG. 1 is a diagram illustrating an example of a determination process executed by the determination device according to the embodiment. In FIG. 1, the
端末装置101、102は、スマートフォンやタブレット等のスマートデバイスであり、3G(3rd Generation)やLTE(Long Term Evolution)等の無線通信網を介して、コンテンツサーバ50といった任意のサーバ装置と通信を行うことができる携帯端末装置である。なお、端末装置101、102は、スマートデバイスのみならず、デスクトップPCやノートPC等の情報処理装置であってもよい。なお、以下の説明では、各利用者U01、U02が使用する端末装置101、102を端末装置100と総称する場合がある。また、以下の説明では、利用者U01、利用者U02以外にも、任意の数の利用者が使用する任意の数の端末装置100がコンテンツサーバ50等と通信可能であるものとする。
The
コンテンツサーバ50は、端末装置100に対してウェブページ、ウィジェット、静止画像、動画像、ゲーム等といった各種のウェブコンテンツ(以下、「コンテンツ」と記載する。)を配信するサーバ装置である。例えば、コンテンツサーバ50は、所定のドメインに含まれる所定のコンテンツを端末装置100に送信する。
The
管理者端末200は、判定装置10の管理を行う管理者が使用する端末装置であり、例えば、PCやサーバ装置等により実現される。なお、管理者端末200は、判定装置10の管理者のみならず、判定装置10による判定処理の結果を所望する利用者が使用する端末装置であれば、任意の利用者が使用する端末装置であってよい。
The
判定装置10は、同一の事象に含まれる標本の有意差を判定する判定装置であり、例えば、サーバ装置やクラウドシステム等により実現される。より具体的な例を説明すると、判定装置10は、コンテンツサーバ50が配信した所定のコンテンツにおける利用者の行動を示す情報から複数の情報をランダムに選択することで複数の標本を抽出し、抽出した標本同士に統計学的に有意な差が存在するか否かを判定する。より具体的には、判定装置10は、所定のコンテンツにおける利用者の行動を示す標本について、t検定やZ検定等といった任意の検定手法により標本の有意差を判定する判定装置である。以下の説明では、Z検定を用いた検定を行う例について説明するが、判定装置10は、以下に説明する判定方法を、任意の検定手法に適用してよい。
The
〔1−2.コントロールバリエーションについて〕
ここで、一般的な検定手法においては、有意差の判定対象となる標本ごとに平均値を算出し、算出した平均値を用いて有意差が存在するか否かを判定する。例えば、Z検定といわれる手法においては、情報の母集団から1つ以上の情報をランダムに抽出した標本Y(t)および標本Y(c)を生成し、以下の式(1)の値が所定の閾値よりも多い場合には、標本Y(t)および標本Y(c)に有意差があると判定する。なお、式(1)においてオーバーラインを付したY(t)は、標本Y(t)として抽出された値の平均値を示し、オーバーラインを付したY(c)は、標本Y(c)として抽出された値の平均値を示す。なお、以下の説明では、オーバーラインを付した記号は、その記号が示す値の平均値を示すものとする。
[1-2. About control variations]
Here, in a general test method, an average value is calculated for each sample for which a significant difference is to be determined, and whether the significant difference exists is determined using the calculated average value. For example, in the method called the Z test, a sample Y (t) and a sample Y (c) in which one or more pieces of information are randomly extracted from a population of information are generated, and the value of the following formula (1) is predetermined. If it is larger than the threshold value of, it is determined that there is a significant difference between the sample Y (t) and the sample Y (c) . In addition, in formula (1), the overlined Y (t) represents the average value of the values extracted as the sample Y (t) , and the overlined Y (c) is the sample Y (c). The average value of the values extracted as is shown. In the following description, an overlined symbol indicates the average value of the values indicated by the symbol.
ここで、標本Yにn個の値Xiが含まれる場合、標本Yの平均値は、以下の式(2)で示すことができる。 Here, when the sample Y includes n values Xi, the average value of the sample Y can be expressed by the following equation (2).
ここで、式(2)を用いた場合、標本の選択や事象の内容、すなわち、所定のコンテンツにおける利用者の行動の情報によっては、平均値の分散が必ずしも小さいとは言えない場合がある。しかしながら、標本の平均値の分散が増大した場合には、有意差の検出精度が悪化する場合がある。 Here, when the expression (2) is used, the variance of the average value may not necessarily be small depending on the selection of the sample and the content of the event, that is, the information on the behavior of the user in the predetermined content. However, when the variance of the average value of the sample increases, the accuracy of detecting the significant difference may deteriorate.
そこで、コントロールバリエーション(Control Variates)と呼ばれる式を用いて所定の推定量(以下、「推定指標値」と記載する。)を算出し、式(1)に示した平均値に代えて、各標本の推定指標値を用いて、有意差を評価するCUPEDと呼ばれる手法が知られている。例えば、CUPEDにおいては、以下の式(3)で示される推定指標値を標本ごとに算出する。ここで、式(3)では、推定指標値をYcvで示した。また、式(3)に示すXは、標本Yとは独立して選択される値であり、θは、Xの値に応じて最適値が定まる係数である。また、式(3)に示すEXは、Xの値の期待値を示す。 Therefore, a predetermined estimated amount (hereinafter referred to as “estimation index value”) is calculated using an expression called Control Variates, and each sample is replaced with the average value shown in Expression (1). There is known a method called CUPED for evaluating a significant difference using the estimated index value of. For example, in CUPED, the estimated index value shown by the following equation (3) is calculated for each sample. Here, in Expression (3), the estimated index value is represented by Y cv . Further, X shown in the equation (3) is a value selected independently of the sample Y, and θ is a coefficient whose optimum value is determined according to the value of X. Further, EX shown in Expression (3) indicates an expected value of X.
ここで、サンプルサイズを無限大に近づけた場合、式(3)は、式(2)と同じ式になる。このため、判定装置10は、式(3)に示される推定指標値を用いて、式(1)から有意差を判定しても、適切に有意差を判定できると考えられる。さらに、式(3)で示される推定指標値の分散を算出すると、以下の式(4)を得ることができる。
Here, when the sample size is brought close to infinity, the equation (3) becomes the same as the equation (2). Therefore, it is considered that the
ここで、式(4)の右辺は、標本Yの平均値の分散と(1−ρ2)との積で示すことができるが、(1−ρ2)は1よりも小さい値を取る。つまり、ある標本Yについての推定指標値の値は、平均値の値よりも分散が小さくなる。このため、判定装置10は、式(3)に示される推定指標値を用いて、式(1)から有意差を判定した場合は、有意差を精度良く算出することができる。
Here, the right side of Expression (4) can be expressed by the product of the variance of the average value of the sample Y and (1-ρ 2 ), but (1-ρ 2 ) takes a value smaller than 1. That is, the variance of the estimated index value for a sample Y is smaller than that of the average value. Therefore, when the
〔1−3.判定処理について〕
ここで、推定指標値を算出する際のXの値は、任意の値を採用することができる。一方で、有意差の検出力は、採用される情報のカバレッジを増加させた場合や、採用される情報間の相関性を強化した場合に増大する。
[1-3. Judgment processing]
Here, an arbitrary value can be adopted as the value of X when calculating the estimated index value. On the other hand, the power of detecting a significant difference increases when the coverage of the adopted information is increased or when the correlation between the adopted information is strengthened.
そこで、判定装置10は、以下の判定処理を実行する。まず、判定装置10は、所定のコンテンツに関する利用者の行動を示す第1の指標値と、利用者の属性に基づく第2の指標値とに基づいて、所定のコンテンツに関して推定される利用者の行動を示す推定指標値を、所定のコンテンツに関する標本ごとに算出する。また、判定装置10は、標本ごとに算出された推定指標値に基づいて、各標本間の有意差を判定する。そして、判定装置10は、標本ごとに算出された推定指標値に基づいて、各標本間の有意差を判定し、判定結果を出力する。
Therefore, the
例えば、判定装置10は、所定のコンテンツの閲覧中に利用者がクリックしたリンクや、利用者が入力したクエリの値、クリックやクエリの入力を行ったか否か等、所定のコンテンツの閲覧時において利用者が実行可能な行動を示す値を第1の指標値として選択する。例えば、判定装置10は、クエリの入力を行った利用者に対して、第1の指標値「1」を割り当て、入力しなかった利用者に対して第1の指標値「0」を割り当てる。
For example, the
続いて、判定装置10は、所定のコンテンツの閲覧中に利用者が行った行動を示す値の中から、所定の数の値をランダムに抽出した第1の標本と第2の標本とを抽出する。そして、判定装置10は、各標本ごとに以下の処理を実行することで、推定指標値を算出する。まず、判定装置10は、第1の指標値として、所定のコンテンツの閲覧中に利用者が行った行動を示す値を、式(2)や式(3)に示すYの値とする。より具体的には、判定装置10は、第1の標本として抽出した値をY(t)とし、第2の標本として抽出した値をY(c)とする。そして、判定装置10は、Y(t)、Y(c)の平均値をそれぞれ算出する。
Subsequently, the
続いて、判定装置10は、所定のコンテンツを閲覧した各利用者を、属性情報に基づいて複数のグループに組み分けし、組み分けの結果に基づいた値を第2の指標値として算出する。例えば、判定装置10は、利用者の性別が男性であるか女性であるかを判定し、利用者の性別が男性である場合には値「0」を第2の指標値とし、利用者の性別が女性である場合には値「1」を第2の指標値とする。そして、端末装置10は、第2の指標値を式(3)におけるXの値とする。
Subsequently, the
例えば、判定装置10は、第1の標本に含まれる値が示す行動を行った利用者を特定し、特定した利用者の属性に基づく第2の指標値を収集する。そして、判定装置10は、収集した値をX(t)とする。同様に、判定装置10は、第2の標本に含まれる値が示す行動を行った利用者を特定し、特定した利用者の属性に基づく第2の指標値を収集する。そして、判定装置10は、収集した値をX(c)とする。
For example, the
そして、判定装置10は、Y(t)の値の平均値から、所定の係数θとX(t)の値の平均値との積を減算し、さらに、所定の係数θとX(t)の値の期待値との積を加算した値を、第1の標本の推定指標値Y(t) cvとする。また、判定装置10は、Y(c)の値の平均値から、所定の係数θとX(c)の値の平均値との積を減算し、さらに、所定の係数θとX(c)の値の期待値との積を加算した値を、第2の標本の推定指標値Y(c) cvの値とする。すなわち、判定装置10は、所定のコンテンツに関して推定される利用者の行動を示す推定指標値を標本ごとに算出する。
Then, the
そして、判定装置10は、Y(t) cvをY(t)の平均値とし、Y(c) cvをY(c)の平均値として、上述した式(1)の値を算出し、算出した値が所定の閾値を超えるか否かに基づいて、第1の標本および第2の標本の有意差を判定する。
Then, the
このように、判定装置10は、所定のコンテンツに関する利用者の行動の標本間の有意差を判定する際に、所定のコンテンツに関する利用者の行動を示す指標値のみならず、その利用者の属性情報に応じた第2の指標値を用いて、標本ごとに推定指標値を算出し、算出した推定指標値に基づき、標本間の有意差を判定する。すなわち、判定装置10は、第1の指標値に関する利用者のクラスタリングに関する情報を、第2の指標値とする。この結果、判定装置10は、標本のカバレッジを向上させることができるので、有意差の判定精度を向上させることができる。また、判定装置10は、第1の標本および第2の標本に第1の指標値が含まれる利用者を特定し、特定した利用者の属性に基づく第2の指標値を用いるので、XとYとの相関性を向上させる結果、有意差の判定精度を向上させることができる。
In this way, the
ここで、カバレッジを向上させるため、第2の指標値として、所定のコンテンツに関する利用者の行動であって、第1の指標値の元となる行動よりも過去に取得された行動に基づく指標値を用いる手法が考えられる。しかしながら、このような手法では、所定のコンテンツが新規なコンテンツである場合や、所定のコンテンツの配信先に新規な利用者が存在する場合には、過去に出力された情報が存在しないため、推定指標値の分散が上昇する恐れがある。 Here, in order to improve the coverage, as the second index value, the index value based on the activity of the user regarding the predetermined content, which is based on the activity acquired earlier than the activity that is the basis of the first index value. A method using is conceivable. However, in such a method, when the predetermined content is a new content, or when a new user exists at the delivery destination of the predetermined content, there is no information output in the past, so it is estimated The dispersion of index values may increase.
しかしながら、判定装置10は、第2の指標値として、過去に取得された行動に基づく指標値ではなく、利用者の属性に基づく指標値を用いて、推定指標値の値を算出する。このため、判定装置10は、所定のコンテンツを初めて所定の利用者に配信した場合であっても、その利用者の属性情報に基づく値を第2の指標値とすることで、推定指標値の分散を減少させることができる。この結果、判定装置10は、有意差の判定精度を向上させることができる。
However, the
〔1−4.属性情報について〕
ここで、判定装置10は、利用者の属性に基づく値であれば、任意の属性に基づく値を第2の指標値としてもよく、利用者の属性から任意のルールに基づいて生成された値を第2の指標値としてよい。
[1-4. About attribute information]
Here, the
例えば、判定装置10は、利用者の属性として、性別、年齢、年代、住所、趣味等といった情報を利用してもよい。また、判定装置10は、利用者の属性として、利用者が使用している端末装置100の種別や利用者がコンテンツを閲覧した際の位置を示す情報を用いてもよい。また、判定装置10は、利用者の属性として、利用者が電子商店街で過去に購入した商品や役務の履歴、オークションサイト等における出品履歴や落札履歴、利用者が閲覧したウェブページの履歴等、各種の履歴を利用者の属性としてもよい。
For example, the
そして、判定装置10は、利用者の属性に応じて、利用者を複数のグループに分類し、分類結果に応じた値を第2の指標値とする。例えば、判定装置10は、予め所定の番号が付された複数のグループを設定し、利用者をいずれかのグループに分類する。そして、判定装置10は、利用者が分類されたグループに設定されていた番号を第2の指標値としてもよい。
Then, the
また、例えば、判定装置10は、利用者の属性ごとに、その属性に応じた値を決定し、決定した値に基づいて第2の指標値を算出してもよい。すなわち、判定装置10は、利用者の属性を示す値であれば、任意の値を第2の指標値として算出してよい。
Further, for example, the
〔1−5.グループ分けについて〕
ここで、判定装置10は、利用者の属性に応じて利用者の分類を行うモデルを用いて、利用者の分類を行い、分類結果に応じた値を第2の指標値として採用してもよい。例えば、判定装置10は、SVM(Support Vector Machine)やニューラルネットワーク、ディープラーニング等といった任意の学習手法により、利用者の属性を学習したモデルを用いて、利用者の分類を行ってよい。
[1-5. About grouping]
Here, the
また、判定装置10は、利用者の分類結果に応じた第2の指標値を用いた際に、有意差の判定精度が向上するように学習を行ったモデルを用いてもよい。すなわち、判定装置10は、有意差の判定精度が向上するように、利用者を分類するよう学習を行ったモデルを用いてもよい。例えば、判定装置10は、予め有意差が算出された第1の標本および第2の標本を正解データとして取得する。また、判定装置10は、正解データから利用者の分類を行い、分類結果に基づいた第2の指標値を算出する。そして、判定装置10は、算出した第2の指標値を用いた際に算出される有意差が、予め算出された有意差と近づくように、モデルの修正を行ってもよい。
In addition, the
なお、上述したモデルは、判定装置10が学習を行ってもよく、判定装置10とは異なる学習装置により予め学習が行われたものであってもよい。
The above-described model may be learned by the
〔1−6.コンテンツについて〕
ここで、判定装置10は、所定のコンテンツとして任意のコンテンツを採用してよい。例えば、判定装置10は、所定のコンテンツがウェブ検索を受付けるポータルサイト、オークション、経路検索、電子商店街、ゲーム、宿泊予約、ファイナンス、天気予報、レストランの情報サイト、不動産サイト、自動車関連のサイト、各種の掲示板やブログ、レシピ等の提供を行うウェブサイト等を所定のコンテンツとして良い。また、判定装置10は、ウェブサイトのみならず、所定のコンテンツと関連するアプリケーションやウィジェットを所定のコンテンツとし、かかるコンテンツにおける利用者の行動を示す値を第1の指標値としてもよい。
[1-6. About content]
Here, the
〔1−7.利用者の共通性について〕
また、判定装置10は、第1の指標値が示す行動を行った利用者の属性に基づく値のみならず、他の利用者の属性に基づく値を第2の指標値に加えてもよい。すなわち、判定装置10は、第1の指標値に関する利用者と、第2の指標値に関する利用者とを完全に同一とする必要はなく、第1の指標値が示す行動を行った利用者と、第2の指標値が属性を示す利用者との一部が共通するように、第2の指標値を取得してもよい。すなわち、判定装置10は、所定のコンテンツについて複数の利用者が行った行動を示す第1の指標値と、かかる複数の利用者のうち、所定の数の利用者を含む複数の利用者の属性に基づく第2の指標値とを用いて、推定指標値を算出すればよい。
[1-7. Regarding commonality of users]
The
〔1−8.指標値が示す行動について〕
ここで、判定装置10は、例えば、所定のコンテンツに関する利用者の行動を示す指標値として、所定のコンテンツを閲覧中に利用者が行ったクリックの有無やクリックしたリンク又はコンテンツ等を示す値を指標値とする。しかしながら、実施形態は、これに限定するものではない。例えば、判定装置10は、クリック以外にも、例えば、ウェブ検索を行う際に入力したクエリの内容やクエリを入力した回数を指標値としてもよい。すなわち、判定装置10は、任意の行動を示す値を指標値としてよい。
[1-8. Regarding the behavior indicated by the index value)
Here, the
例えば、判定装置10は、所定のコンテンツに対して行った利用者の評価や、利用者が入力した所定のコンテンツに対する興味の度合いを示す値を第1の指標値としてもよい。すなわち、判定装置10は、第1の指標値と第2の指標値とがある程度共通する利用者に関連するKPI(Key Performance Indicator)であるならば、任意の指標値を第1の指標値として採用してよい。
For example, the
〔1−9.判定処理の一例について〕
次に、図1を用いて、判定装置10が実行する処理の一例について説明する。なお、以下の説明では、所定のコンテンツに関する利用者の行動を示す情報を第1の指標値とし、その利用者の属性を示す情報を第2の指標値として用いる処理の一例について説明する。また、図1に示す例では、利用者U01の属性情報が「属性#1」であり、利用者U02の属性情報が「属性#2」である例について説明する。
[1-9. Regarding an example of determination processing]
Next, an example of the process executed by the
まず、コンテンツサーバ50は、端末装置100からの要求に従って、所定のコンテンツを端末装置100に配信する(ステップS1)。そして、コンテンツサーバ50は、所定のコンテンツの閲覧中に利用者U01、U02が行ったクリックの内容を示すクリック履歴とともに、その利用者U01、U02の属性を示す属性情報「属性#1」、「属性#2」を収集する(ステップS2)。なお、コンテンツサーバ50は、例えば、利用者U01、U02の属性情報を管理する管理サーバ(図示は省略)等の外部サーバから、利用者U01、U02の属性情報を収集してもよい。
First, the
続いて、判定装置10は、所定のコンテンツに関するクリック履歴と属性情報とをコンテンツサーバ50から収集する(ステップS3)。そして、判定装置10は、各クリック履歴が示すクリックの内容を行動内容とし、行動内容と、クリックを行った利用者の利用者IDとを対応付けて行動履歴データベース31に登録する。
Then, the
また、判定装置10は、収集した属性情報に基づいて、利用者U01、U02をグルーピングする(ステップS4)。より具体的には、判定装置10は、属性情報を入力すると、属性の種別ごとに、属性の内容を示す値を出力するモデルを用いて、利用者の属性情報を示す値を算出する。
The
例えば、図1に示すモデルは、性別が「男性」である場合には性別に対応する値「1」を出力し、性別が「女性」である場合には性別に対応する値「0」を出力するものとする。また、例えば、図1に示すモデルは、年代が「20代」である場合には、年代に対応する値「2」を出力し、年代が「30代」である場合には、年代に対応する値「3」を出力するものとする。また、例えば、図1に示すモデルは、住所が「神奈川在住」である場合には、住所に対応する値「4」を出力し、住所が「東京在住」である場合には、住所に対応する値「5」を出力するものとする。 For example, the model shown in FIG. 1 outputs the value “1” corresponding to the gender when the gender is “male”, and outputs the value “0” corresponding to the gender when the gender is “female”. It shall be output. Further, for example, the model shown in FIG. 1 outputs a value “2” corresponding to the age when the age is “20s”, and corresponds to the age when the age is “30s”. The value "3" to be output is output. Further, for example, the model shown in FIG. 1 outputs a value “4” corresponding to the address when the address is “resident in Kanagawa” and corresponds to the address when the address is “resident in Tokyo”. The value "5" to be output is output.
例えば、図1に示す例では、利用者U01の属性情報「属性#1」の内容が、性別「男性」、年代「30代」、住所「東京在住」であるものとする。このような属性を入力した場合、図1に示すモデルは、利用者U01の属性情報を示す値「1」、「3」、「5」を出力する。そして、判定装置10は、モデルが出力した値を並べた3桁の値「135」を、利用者U01の分類先となるグループを示す値、すなわち、第2の指標値とする。その後、判定装置10は、利用者IDと利用者の属性情報と第2の指標値とを対応付けてユーザデータベース32に登録する。
For example, in the example shown in FIG. 1, it is assumed that the content of the attribute information “
なお、例えば、利用者U02の属性情報「属性#2」の内容が、性別「女性」、年代「20代」、住所「神奈川在住」である場合、図1に示すモデルは、利用者U02の属性情報を示す値として「0」、「2」、「4」を出力する。このため、判定装置10は、モデルが出力する値を並べた3桁の値「024」を、利用者U02の分類先となるグループを示す値、すなわち、第2の指標値とする。
Note that, for example, when the content of the attribute information “
また、判定装置10は、所定のコンテンツに関する標本の有意差を判定する場合、所定のコンテンツのクリック履歴から第1の指標値を標本ごとに算出する(ステップS5)。例えば、判定装置10は、所定のコンテンツのクリック履歴から、所定の数のクリック履歴を第1の標本としてランダムに選択し、第1の標本として選択したクリック履歴の内容を示す値の集合を第1の指標値Y(t)とする。同様に、判定装置10は、所定のコンテンツのクリック履歴から、所定の数のクリック履歴を第2の標本としてランダムに選択し、第2の標本として選択したクリック履歴の内容を示す値の集合を第1の指標値Y(c)とする。
Further, when determining the significant difference between the samples regarding the predetermined content, the
また、判定装置10は、利用者のグルーピング結果に応じた第2の指標値を標本ごとに算出する(ステップS6)。例えば、判定装置10は、第1の標本として選択されたクリック履歴が示すクリックを行った利用者を特定し、特定した利用者が分類されたグループを示す値をユーザデータベース32から抽出する。そして、判定装置10は、抽出した値の集合を第2の指標値X(t)とする。同様に、判定装置10は、第2の標本として選択されたクリック履歴が示すクリックを行った利用者を特定し、特定した利用者が分類されたグループを示す値をユーザデータベース32から抽出し、抽出した値の集合を第2の指標値X(c)とする。
Further, the
そして、判定装置10は、所定のコンテンツについて推定される平均的な利用者の行動を示す値、すなわち、推定指標値を標本ごとに算出する(ステップS7)。例えば、判定装置10は、第1の指標値Y(t)と第2の指標値X(t)とを用いて、Y(t) cvの値を式(3)から算出し、第1の指標値Y(c)と第2の指標値X(c)とを用いて、Y(c) cvの値を式(3)から算出する。そして、判定装置10は、算出した推定指標値を用いて、標本間の有意差を判定する(ステップS8)。例えば、判定装置10は、Y(t) cvの値をY(t)の平均値とし、Y(c) cvの値をY(c)の平均値として、Z検定を行い、有意差が存在するか否かを判定する。そして、判定装置10は、検定結果を管理者端末200へと提供する(ステップS9)。
Then, the
〔2.判定装置の構成〕
以下、上記した判定処理を実現する判定装置10が有する機能構成の一例について説明する。図2は、実施形態に係る判定装置の構成例を示す図である。図2に示すように、判定装置10は、通信部20、記憶部30、および制御部40を有する。
[2. Configuration of determination device]
Hereinafter, an example of a functional configuration of the
通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、端末装置100や管理者端末200、コンテンツサーバ50との間で情報の送受信を行う。
The
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、行動履歴データベース31、ユーザデータベース32、および分類モデルデータ33を記憶する。
The
行動履歴データベース31には、所定のコンテンツに関する利用者の行動を示す情報、すなわち、行動履歴が格納される。例えば、図3は、実施形態に係る行動履歴データベースに登録される情報の一例を示す図である。図3に示すように、行動履歴データベース31には、「コンテンツID」、「利用者ID」、「行動内容」等といった項目を有する情報が登録されている。なお、行動履歴データベース31には、図3に示す情報以外にも、任意の情報が登録されていてもよい。
The
ここで、「コンテンツID」とは、コンテンツの識別子である。また、「利用者ID」とは、対応付けられた行動履歴が示す行動を行った利用者の識別子である。また、「行動内容」とは、利用者の行動を示す情報であり、例えば、クリックの内容を示す情報である。例えば、図3に示す例では、コンテンツID「コンテンツ#1」、利用者ID「User#1」、および行動内容「Click#1」とが対応付けて登録されている。このような情報は、コンテンツID「コンテンツ#1」が示すコンテンツを閲覧中に、利用者ID「User#1」が示す利用者が、行動内容「Click#1」が示すクリックを行った旨を示す情報である。なお、行動内容は、どのようなクリックが行われたかのみならず、クリックの有無を示す情報であってもよい。
Here, the "content ID" is an identifier of the content. The "user ID" is an identifier of a user who has performed the action indicated by the associated action history. The “action content” is information indicating the action of the user, for example, information indicating the content of the click. For example, in the example shown in FIG. 3, the content ID “
図2に戻り説明を続ける。ユーザデータベース32には、利用者の識別子であるユーザIDと利用者の属性情報とが、属性情報の項目ごとに対応付けて登録されている。例えば、図4は、実施形態に係るユーザデータベースに登録される情報の一例を説明する図である。例えば、図4に示す例では、ユーザデータベース32には、「利用者ID」、「属性項目」、「属性情報」、および「グループ」といった項目を有する情報が、「利用者ID」ごとに複数登録されている。「属性項目」とは、属性情報の項目を示す情報であり、例えば、「性別」、「年齢」、「住所」等といった情報が登録される。また、「属性情報」とは、対応付けられたユーザIDが示す利用者の属性情報であって、対応付けられた属性項目が示す内容の属性情報である。また、「グループ」とは、対応付けられた利用者IDが示す利用者が分類されたグループを示す値、すなわち、利用者の属性情報を示す値である。
Returning to FIG. 2, the explanation will be continued. In the
例えば、図4に示す例では、利用者ID「User#1」に対し、属性項目「性別」および属性情報「男性」が対応付けて登録され、属性項目「年齢」(「年代」でもよい。)および属性情報「30代」が対応付けて登録され、属性項目「住所」および属性情報「A市」が対応付けて登録され、グループ「135」が対応付けて登録されている。このような情報は、例えば、利用者ID「User#1」が示す利用者の性別が男性であり、年齢が30代に含まれる年齢であり、住所がA市である旨を示している。またこのような情報は、利用者ID「User#1」が示す利用者の分類先となるグループが「135」である旨を示している。すなわち、このような情報は、利用者ID「User#1」が示す利用者の属性情報を示す値が「135」である旨を示す。
For example, in the example shown in FIG. 4, the attribute item "sex" and the attribute information "male" are registered in association with the user ID "
なお、ユーザデータベース32には、図4に示す属性項目や属性情報以外にも、任意の属性項目や属性情報が登録されていてよい。また、ユーザデータベース32には、必ずしも全ての属性項目について属性情報が登録されている必要はなく、利用者が登録した、または、利用者の行動履歴から推定された属性情報のみが登録されていてもよい。
In addition to the attribute items and attribute information shown in FIG. 4, arbitrary attribute items and attribute information may be registered in the
図2に戻り、説明を続ける。分類モデルデータ33は、利用者の属性情報に基づいて、利用者の分類を行うモデルである。例えば、分類モデルデータ33は、利用者の属性情報が入力されると、属性情報の種別ごとに、利用者の属性を示す値を算出するモデルである。
Returning to FIG. 2, the description will be continued. The
制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、判定装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部40は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
The
図2に示すように、制御部40は、収集部41、選択部42、算出部43、判定部44、出力部45、および学習部46を有する。収集部41は、所定のコンテンツに関する利用者の行動を示す行動履歴をコンテンツサーバ50から収集する。より具体的には、収集部41は、行動を行った利用者の利用者IDと、利用者が行った行動の内容を示す行動内容と、利用者が閲覧していたコンテンツを示すコンテンツIDとを対応付けた情報を行動履歴としてコンテンツサーバ50から収集する。そして、収集部41は、収集した行動履歴を行動履歴データベース31に登録する。すなわち、収集部41は、行動履歴を収集し、利用者が閲覧していたコンテンツ毎に行動履歴をまとめて行動履歴データベース31に登録する。
As shown in FIG. 2, the
また、収集部41は、利用者の属性情報をコンテンツサーバ50から収集する。また、収集部41は、収集した属性情報を分類モデルデータ33に入力し、分類モデルデータ33が出力した値、すなわち、第2の指標値となる値を、利用者の属性情報と、利用者IDと対応付けてユーザデータベース32に登録する。
Further, the
選択部42は、行動履歴データベース31およびユーザデータベース32に登録された情報から、第1の標本および第2の標本を選択する。例えば、選択部42は、管理者端末200から所定のコンテンツに関する標本の有意差を判定する旨の要求を受付けた場合、所定のコンテンツを示すコンテンツID(例えば、コンテンツID「コンテンツ#1」)を含む行動履歴を行動履歴データベース31から特定する。
The selection unit 42 selects the first sample and the second sample from the information registered in the
具体的には、選択部42は、第1の標本に含まれる第1の指標値として、特定した行動履歴からランダムに所定の数の利用者IDと行動履歴との組を選択する。続いて、選択部42は、第1の指標値として選択した組に含まれる利用者IDと同じ利用者IDに対応付けられた「グループ」の値を第2の指標値としてユーザデータベース32から選択する。なお、選択部42は、第1の指標値として選択した組に含まれる利用者IDのうち、所定の数の利用者IDを選択し、選択した利用者IDと対応付けられたグループの値に加えてランダムに選択したグループの値を第2の指標値としてもよい。同様に、選択部42は、第2の標本に含まれる第1の指標値として、特定した行動履歴からランダムに所定の数の利用者IDと行動履歴との組を選択し、選択した利用者IDと対応する利用者IDと対応付けられた「グループ」の値を第2の標本に含まれる第2の指標値とする。
Specifically, the selection unit 42 randomly selects, as the first index value included in the first sample, a predetermined number of sets of user IDs and action history from the identified action history. Subsequently, the selection unit 42 selects, from the
算出部43は、所定のコンテンツに関する利用者U01、U02の行動を示す第1の指標値と、利用者U01、U02の属性に基づく第2の指標値とに基づいて、所定のコンテンツに関して推定される利用者U01、U02の行動を示す推定指標値を、所定のコンテンツに関する標本ごとに算出する。
The
具体的には、算出部43は、第1の指標値として、所定のコンテンツの閲覧中に行った選択操作の内容を示す値の平均値から、推定指標値を算出する。また、算出部43は、第2の指標値として、第2のコンテンツの閲覧中に行った選択操作の内容を示す値の平均値から、推定指標値を算出してもよい。また、算出部43は、利用者の属性に応じて利用者の分類を行うモデルを用いて、利用者の分類を行い、分類結果に応じた値を第2の指標値とする。そして、算出部43は、第1の指標値の平均値に対し、所定の係数と第2の指標値の平均値との積を減算し、所定の係数と第2の指標値の期待値との積を加算した値を推定指標値とする。
Specifically, the
例えば、算出部43は、選択部42が選択した第1の標本に含まれる複数の行動履歴をそれぞれ数値化し、第1の指標値Y(t)とする。また、算出部43は、第2の標本に含まれる複数の行動履歴をそれぞれ数値化し、第1の指標値Y(c)とする。続いて、算出部43は、選択部42が選択した第1の標本に含まれる「グループ」の値を第2の指標値X(t)とする。また、算出部43は、選択部42が選択した第2の標本に含まれる「グループ」の値を第2の指標値X(c)とする。
For example, the
そして、算出部43は、第1の指標値Y(t)と第2の指標値X(t)とを用いて、第1の標本に係る推定指標値Y(t) cvの値を式(3)から算出し、第1の指標値Y(c)と第2の指標値X(c)とを用いて、第2の標本に係る推定指標値Y(c) cvの値を式(3)から算出する。
Then, the
判定部44は、標本ごとに算出された推定指標値に基づいて、各標本間の有意差を判定する。具体的には、判定部44は、算出部43が算出した推定指標値Y(t) cvおよびY(c) cvを用いて、式(1)から標本間の有意差を示す値を算出し、算出した値が所定の閾値よりも多いか否かを判定する。そして、判定部44は、算出した値が所定の閾値よりも多い場合には、有意差が存在すると判定し、算出した値が所定の閾値以下である場合には、有意差が存在しないと判定する。
The
出力部45は、判定部44による判定結果を管理者端末200に出力する。例えば、出力部45は、判定部44が実行する判定結果に基づいて、判定結果を示す結果画面C10を生成し、生成した結果画面C10を管理者端末200に配信する。
The
例えば、図5は、実施形態に係る判定装置が生成する結果画面の一例を示す図である。例えば、判定装置10は、所定のコンテンツに関する利用者の行動履歴からランダムに選択した第1の標本と第2の標本との組を複数組抽出し、抽出した組ごとに上述した判定処理を実行することで、有意差を示す値を算出する。そして、判定装置10は、図5に示すような結果画面C10を生成し、生成した結果画面C10を管理者端末200に表示させる。
For example, FIG. 5 is a diagram illustrating an example of a result screen generated by the determination device according to the embodiment. For example, the
例えば、判定装置10は、図5に示すように、標本の組ごとに有意差を示す値を算出し、算出結果を用いて、横軸方向に標本の組、縦軸方向に有意差を示す値を設定したグラフを生成する。そして、判定装置10は、グラフのうち、有意差の値が所定の閾値を超える範囲を太線で示し、有意差の値が所定の閾値以下となる範囲を点線で示す。また、判定装置10は、図5に示すグラフ中の黒丸印で示すように、管理者端末200の管理者がグラフ上の位置を選択した場合には、選択された位置に対応する標本の組に含まれる行動履歴をそれぞれ表示する結果画面C10を生成する。
For example, as illustrated in FIG. 5, the
図2に戻り、説明を続ける。学習部46は、分類モデルデータ33の学習を行う。例えば、学習部46は、予め有意差が算出された第1の標本および第2の標本を正解データとし、正解データから利用者の分類を行い、分類結果に基づいた第2の指標値を算出する。そして、学習部46は、算出した第2の指標値を用いた際に算出される有意差が、予め算出された有意差と近づくように、分類モデルデータ33の修正を行う。なお、学習部46は、上述した学習処理以外にも、任意の学習手法を用いて、利用者U01、U02の属性から利用者U01、U02をグルーピングするモデルを学習を行ってよい。
Returning to FIG. 2, the description will be continued. The
〔3.判定処理の流れの一例〕
続いて、図6を用いて、判定装置10が実行する処理の流れについて説明する。図6は、実施形態にかかる判定装置が実行する判定処理の流れの一例を示すフローチャートである。例えば、判定装置10は、各利用者の行動履歴と属性情報とを収集する(ステップS101)。そして、判定装置10は、収集した属性情報に基づいて、利用者のグルーピングを行う(ステップS102)。続いて、判定装置10は、所定のコンテンツに関する第1の指標値を標本ごとに算出し(ステップS103)、各標本と関連する利用者と同じ利用者のグルーピング結果に基づく第2の指標値を、標本ごとに算出する(ステップS104)。
[3. Example of flow of determination process]
Subsequently, a flow of processing executed by the
そして、判定装置10は、式(3)、すなわち、コントロールバリエーションと呼ばれる式に基づいて、推定指標値を標本ごとに算出し(ステップS105)、推定指標値を用いて、標本間の有意差を判定する(ステップS106)。その後、判定装置10は、判定結果を出力し(ステップS107)、処理を終了する。
Then, the
〔4.変形例〕
上記では、判定装置10による判定処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、判定装置10が実行する判定処理のバリエーションについて説明する。
[4. Modification example)
In the above, an example of the determination process by the
〔4−1.コントロールバリエーションについて〕
ここで、判定装置10は、所定のコンテンツに関する第1の指標値のみならず、利用者の属性に基づく第2の指標値を用いて、所定のコンテンツに関する指標値の有意差を判定するのであれば、式(3)として示した式以外の式を用いてもよい。また、判定装置10は、第1の指標値および第2の指標値から、θの値やEXの値を任意の手法により求めてもよい。
[4-1. About control variations]
Here, the
〔4−2.第2の指標値について〕
ここで、式(3)として示したコントロールバリエーションの式においては、Xに任意の情報を適用可能である。そこで、判定装置10は、第1の指標値が示す行動に関連するウェブページとはクロスドメインの関係を有するウェブページ等、所定のウェブページとは異なるウェブページに関する利用者の行動を示す値を第2の指標値としてもよい。
[4-2. Regarding the second index value]
Here, in the control variation formula shown as the formula (3), arbitrary information can be applied to X. Therefore, the
例えば、判定装置10は、所定のコンテンツに関する利用者の行動の標本間の有意差を判定する際に、所定のコンテンツに関する利用者の行動を示す値を第1の指標値とする。また、判定装置10は、所定のコンテンツとクロスドメインの関係を有する第2コンテンツの閲覧中に利用者が行った行動を示す値を第2の指標値とする。そして、判定装置10は、標本ごとに推定指標値を算出し、算出した推定指標値に基づき、標本間の有意差を判定してもよい。
For example, the
なお、判定装置10は、第2コンテンツの閲覧中に利用者が行った行動と、その利用者の属性とに応じた値を第2の指標値としてもよい。例えば、判定装置10は、第2コンテンツの閲覧中に利用者が行った行動を示す値と、利用者の属性情報を示す値とを並べた値を第2の指標値としてもよい。
Note that the
また、他の例では、判定装置10は、行動履歴を収集した全ての利用者をクラスタリングの対象として、予めクラスタリングを行っておく。また、判定装置10は、所定のコンテンツに関する行動履歴から第1の標本と第2の標本とを選択する。また、判定装置10は、各標本について、所定のコンテンツの閲覧中に利用者が行った行動を示す第1の指標値と、その利用者が第2コンテンツを閲覧中に行った行動およびその利用者がクラスタリングされたグループの組み合わせを示す第2の指標値とを取得する。そして、判定装置10は、第1の指標値と第2の指標値とから、推定指標値を各標本ごとに算出し、推定指標値に基づいて、各標本の有意差を判定すればよい。なお、判定装置10は、行動履歴を収集した全ての利用者をクラスタリングの対象とする必要はなく、例えば、第1の標本にユーザIDが含まれる利用者のみをクラスタリングの対象としてもよい。
Further, in another example, the
〔4−3.判定対象や判定内容について〕
ここで、判定装置10は、所定のコンテンツに関する利用者の行動を示す第1の指標値を用いて、推定指標値を算出し、推定指標値を用いて、標本の有意差を判定した。すなわち、判定装置10は、所定のコンテンツに関する利用者の行動を示す情報の有意差を判定した。ここで、判定装置10は、所定のコンテンツに関する利用者の行動を示すのであれば、任意の行動を示す情報を第1の指標値とし、その情報の有意差を判定してもよい。例えば、判定装置10は、ABテストの結果、商品や任意の投稿に対する評価、音楽や映画等の各種コンテンツに対する評価等、所定のコンテンツに対して利用者が行った評価の内容を第1の指標値としてもよく、有意差の判定対象としてもよい。
[4-3. About judgment target and judgment contents]
Here, the
また、判定装置10は、上述した推定指標値を用いて、Z検定以外にも、t検定等、任意の統計学的な検定手法を用いて、各標本が有する有意差の判定を行ってよい。
Further, the
〔4−4.装置構成〕
判定装置10は、端末装置100や管理者端末200と情報のやり取りを行うフロントエンドサーバと、コンテンツサーバ50と情報をやり取りし、上述した判定処理を実行するバックエンドサーバとにより実現されてもよい。このような場合、フロントエンドサーバには、図2に示す出力部45が配置され、バックエンドサーバには、収集部41、選択部42、算出部43、判定部44、行動履歴データベース31、およびユーザデータベース32が配置されることとなる。また、記憶部30に格納された各データベース31、32や分類モデルデータ33は、判定装置10の内部ではなく、例えば、外部のストレージサーバ等に格納されていてもよい。
[4-4. Device configuration〕
The
〔4−5.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[4-5. Other]
Further, of the processes described in the above embodiment, all or part of the processes described as being automatically performed may be manually performed, or the processes described as being manually performed may be performed. All or part of the process can be automatically performed by a known method. In addition, the processing procedures, specific names, information including various data and parameters shown in the above-mentioned documents and drawings can be arbitrarily changed unless otherwise specified. For example, the various kinds of information shown in each drawing are not limited to the illustrated information.
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each constituent element of each illustrated device is functionally conceptual, and does not necessarily have to be physically configured as illustrated. That is, the specific form of distribution/integration of each device is not limited to that shown in the figure, and all or a part of the device may be functionally or physically distributed/arranged in arbitrary units according to various loads or usage conditions. It can be integrated and configured.
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 Further, the respective embodiments described above can be appropriately combined within a range in which the processing content is not inconsistent.
〔5.プログラム〕
また、上述してきた実施形態に係る判定装置10は、例えば図7に示すような構成のコンピュータ1000によって実現される。図7は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
[5. program〕
Further, the
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD、フラッシュメモリ等により実現される。
The
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
The output IF 1060 is an interface for transmitting information to be output to an output device 1010 that outputs various kinds of information such as a monitor and a printer. For example, a USB (Universal Serial Bus) or a DVI (Digital Visual Interface), It is realized by a connector of a standard such as HDMI (registered trademark) (High Definition Multimedia Interface). The input IF 1070 is an interface for receiving information from
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
The
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
The network IF 1080 receives data from another device via the network N and sends the data to the
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
The
例えば、コンピュータ1000が判定装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部40の機能を実現する。
For example, when the
〔6.効果〕
上述したように、判定装置10は、所定のコンテンツに関する利用者U01、U02の行動を示す第1の指標値と、利用者U01、U02の属性に基づく第2の指標値とに基づいて、所定のコンテンツに関して推定される利用者の行動を示す推定指標値を、所定のコンテンツに関する標本ごとに算出する。そして、判定装置10は、標本ごとに算出された推定指標値に基づいて、各標本間の有意差を判定する。この結果、判定装置10は、有意差の判定に用いる情報の相関性を悪化させることなく、カバレッジを向上させることができるので、推定指標値の分散を低下させ、有意差の検出精度を向上させることができる。
[6. effect〕
As described above, the
また、判定装置10は、利用者U01、U02の属性に応じた分類を行うモデルを用いて、利用者U01、U02を分類し、分類結果に応じた値を第2の指標値とする。このため、判定装置10は、容易な処理で推定指標値の分散を低下させ、有意差の検出精度を向上させることができる。
The
また、判定装置10は、第1の指標値として、所定のコンテンツの閲覧中に行った選択操作の内容を示す値の平均値から、推定指標値を算出する。このため、判定装置10は、推定指標値を適切に算出することができる。
Further, the
また、判定装置10は、第1の指標値の平均値に対し、所定の係数と第2の指標値の平均値との積を減算し、所定の係数と第2の指標値の期待値との積を加算した値を推定指標値とする。このため、判定装置10は、推定指標値の分散を通常の平均値よりも低下させることができるので、有意差の検出精度を向上させることができる。
Further, the
また、判定装置10は、所定のコンテンツについて複数の利用者が行った行動を示す第1の指標値と、第1の指標値が示す行動を行った複数の利用者のうち、所定の数の利用者を含む複数の利用者の属性に基づく第2の指標値とを用いて、推定指標値を算出する。このため、判定装置10は、適切に有意差を判定することができる。
In addition, the
また、判定装置10は、判定結果を出力する。このため、判定装置10は、管理者等に対して判定結果を提供することができる。
The
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 As described above, some of the embodiments of the present application have been described in detail based on the drawings, but these are examples, and various modifications based on the knowledge of those skilled in the art, including the modes described in the section of the disclosure of the invention, It is possible to implement the present invention in other forms with improvements.
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、算出部は、算出手段や算出回路に読み替えることができる。 Further, the above-mentioned "section (module, unit)" can be read as "means" or "circuit". For example, the calculation unit can be read as a calculation unit or a calculation circuit.
10 判定装置
20 通信部
30 記憶部
31 行動履歴データベース
32 ユーザデータベース
33 分類モデルデータ33
40 制御部
41 収集部
42 選択部
43 算出部
44 判定部
45 出力部
46 学習部
50 コンテンツサーバ
100〜102 端末装置
200 管理者端末
10
40
Claims (8)
前記標本ごとに算出された前記推定指標値に基づいて、各標本間の有意差を判定する判定部と
を有することを特徴とする判定装置。 A user belonging to the first sample and the user belonging to the second sample are randomly selected, and for each sample, a set of values indicating the behavior of the user belonging to the sample and indicating the behavior of each user regarding a predetermined content. in the first and the index value, based on the second index value based on the set of values indicating the attributes of each user, a value that indicates the behavior of the average user to be estimated for the predetermined content based on a calculation unit for de San some estimate index value,
A determination unit that determines a significant difference between each sample based on the estimated index value calculated for each sample.
ことを特徴とする請求項1に記載の判定装置。 The calculation unit classifies the users by using a model that performs classification according to the attributes of the users, and sets a set of values according to the classification result as the second index value. The determination device according to claim 1.
ことを特徴とする請求項1または2に記載の判定装置。 The calculation unit, judgment unit according to the mean value before Symbol value indicating the predetermined content selection operation made during viewing of contents to claim 1 or 2, characterized in that said first index value ..
ことを特徴とする請求項1〜3のうちいずれか1つに記載の判定装置。 The calculation unit calculates a first index value that is an average of values that indicate the behavior of each user regarding the predetermined content and a second index value that is an average of values that indicate the attributes of each user. , said first index value or, et al., subtracts the product of the a predetermined coefficient the second index value, a value obtained by adding the product of the expected value of the with the predetermined coefficient a second index value, The determination device according to claim 1, wherein the determination index value is used as the estimated index value.
ことを特徴とする請求項1〜4のうちいずれか1つに記載の判定装置。 The calculation unit determines a first index value based on a value indicating an action performed by a plurality of users with respect to the predetermined content, and a predetermined index among a plurality of users who performed the action indicated by the first index value. The estimated index value is calculated using a second index value based on a value indicating an attribute of a plurality of users including the number of users. Judgment device.
を有することを特徴とする請求項1〜5のうちいずれか1つに記載の判定装置。 The determination device according to claim 1, further comprising: an output unit that outputs a determination result by the determination unit.
第1の標本および第2の標本に属する利用者をそれぞれランダムに選択し、標本ごとに、当該標本に属する利用者の行動であって、所定のコンテンツに関する各利用者の行動を示す値の集合に基づく第1の指標値と、各利用者の属性を示す値の集合に基づく第2の指標値とに基づいて、前記所定のコンテンツについて推定される平均的な利用者の行動を示す値である推定指標値を算出する算出工程と、
前記標本ごとに算出された前記推定指標値に基づいて、各標本間の有意差を判定する判定工程と
を含むことを特徴とする判定方法。 A determination method executed by the determination device,
A user belonging to the first sample and the user belonging to the second sample are randomly selected, and for each sample, a set of values indicating the behavior of the user belonging to the sample and indicating the behavior of each user regarding a predetermined content. in the first and the index value, based on the second index value based on the set of values indicating the attributes of each user, a value that indicates the behavior of the average user to be estimated for the predetermined content based on a calculation step of de San some estimate index value,
A determination step of determining a significant difference between each sample based on the estimated index value calculated for each sample.
前記標本ごとに算出された前記推定指標値に基づいて、各標本間の有意差を判定する判定手順と
をコンピュータに実行させるための判定プログラム。 A user belonging to the first sample and the user belonging to the second sample are randomly selected, and for each sample, a set of values indicating the behavior of the user belonging to the sample and indicating the behavior of each user regarding a predetermined content. in the first and the index value, based on the second index value based on the set of values indicating the attributes of each user, a value that indicates the behavior of the average user to be estimated for the predetermined content based on a calculation procedure for de San certain estimated index value,
A determination program for causing a computer to execute a determination procedure for determining a significant difference between samples based on the estimated index value calculated for each sample.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016156745A JP6701026B2 (en) | 2016-08-09 | 2016-08-09 | Judgment device, judgment method, and judgment program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016156745A JP6701026B2 (en) | 2016-08-09 | 2016-08-09 | Judgment device, judgment method, and judgment program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018025934A JP2018025934A (en) | 2018-02-15 |
JP6701026B2 true JP6701026B2 (en) | 2020-05-27 |
Family
ID=61193830
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016156745A Active JP6701026B2 (en) | 2016-08-09 | 2016-08-09 | Judgment device, judgment method, and judgment program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6701026B2 (en) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010124801A (en) * | 2008-11-28 | 2010-06-10 | Institute Of Physical & Chemical Research | Maker for predicting effect of interferon therapy and method for screening interferon activity enhancer |
JP5769347B2 (en) * | 2013-07-31 | 2015-08-26 | シャープ株式会社 | Information processing apparatus, information processing system, terminal apparatus, information processing method, and information processing program |
JP6440462B2 (en) * | 2014-11-14 | 2018-12-19 | 東日本旅客鉄道株式会社 | Service effect evaluation device |
-
2016
- 2016-08-09 JP JP2016156745A patent/JP6701026B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018025934A (en) | 2018-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9256826B2 (en) | Predicting reactions to short-text posts | |
JP6145576B2 (en) | Large page recommendation in online social networks | |
US9215252B2 (en) | Methods and apparatus to identify privacy relevant correlations between data values | |
US9015128B2 (en) | Method and system for measuring social influence and receptivity of users | |
EP2778985A1 (en) | Search result ranking by department | |
US20160026643A1 (en) | Presenting suggested facets | |
US20160189202A1 (en) | Systems and methods for measuring complex online strategy effectiveness | |
WO2017116526A1 (en) | Systems and methods for utilizing webpage scripts to segment client sessions of a website | |
JP2018045553A (en) | Selection device, selection method, and selection program | |
JP2013214133A (en) | Information processing device, information processing method, and program | |
JP2019191686A (en) | Information processing apparatus, information processing system, information processing method, and program | |
CN107357847B (en) | Data processing method and device | |
JP6701026B2 (en) | Judgment device, judgment method, and judgment program | |
US11373210B2 (en) | Content interest from interaction information | |
JP4962950B2 (en) | Recommendation method, recommendation server and program for users on network | |
US9892201B2 (en) | Search engine classification | |
JP2017076376A (en) | Calculation device, calculation method and calculation program | |
JP6203339B1 (en) | Determination device, determination method, and determination program | |
JP6007300B1 (en) | Calculation device, calculation method, and calculation program | |
JP2020035072A (en) | Device, method, and program for processing information | |
JP2018045551A (en) | Determination device, determination method, and determination program | |
JP7407779B2 (en) | Information processing device, information processing method, and information processing program | |
US11550859B2 (en) | Analytics system entity resolution | |
JP7303855B2 (en) | Information processing device, information processing method and information processing program | |
US20180025378A1 (en) | Fatigue Control in Dissemination of Digital Marketing Content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180914 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190925 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191029 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200407 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200501 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6701026 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |