JP5225423B2 - 予測モデル生成装置及び方法 - Google Patents
予測モデル生成装置及び方法 Download PDFInfo
- Publication number
- JP5225423B2 JP5225423B2 JP2011093877A JP2011093877A JP5225423B2 JP 5225423 B2 JP5225423 B2 JP 5225423B2 JP 2011093877 A JP2011093877 A JP 2011093877A JP 2011093877 A JP2011093877 A JP 2011093877A JP 5225423 B2 JP5225423 B2 JP 5225423B2
- Authority
- JP
- Japan
- Prior art keywords
- samples
- variable
- explanatory
- prediction model
- explanatory variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 19
- 238000004519 manufacturing process Methods 0.000 claims description 9
- 238000002360 preparation method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 2
- 102100031577 High affinity copper uptake protein 1 Human genes 0.000 description 1
- 101710196315 High affinity copper uptake protein 1 Proteins 0.000 description 1
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 102100031145 Probable low affinity copper uptake protein 2 Human genes 0.000 description 1
- 101710095010 Probable low affinity copper uptake protein 2 Proteins 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
これにより、サンプル数がユーザの予定する信頼度を満たすための最少サンプル数に満たない説明変数が存在する場合であっても、統計上有意でないデータを紛れ込ませることがない。このとき、予測モデル生成装置によれば、最少サンプル数に満たない説明変数を自動的にグループ化するため、ユーザの経験や知識に関係なく誤差の少ない予測モデルを自動的に生成することができる。
初めに、図1を参照して、本発明の予測モデル生成装置1の構成について説明する。
予測モデル生成装置1は、ユーザ端末30と通信可能に接続され、信頼度パラメータ取得手段11と、最少サンプル数算出手段12と、モデル生成準備手段13と、予測モデル生成手段14と、統計ログデータベース21と、予測モデルデータベース22と、を含んで構成される。
z:信頼度計数(信頼度90%基準で1.65)
E:信頼度パラメータ(許容できる誤差の範囲)
最少サンプル数算出手段12は、上記式に基づいて、ユーザ端末30から受け付けた信頼度パラメータ(E(例えば、クリックレートの20%と受け付けた場合には、0.0002))から最少サンプル数を算出する。
ここで、統計ログデータベース21は、広告の表示順序及び当該表示順序に対応するクリックレートの組み合わせを、予測モデルを生成するためのサンプルとして記憶する。具体的には、図2に示すように、検索クエリ毎に、当該検索クエリに基づく検索結果ページにおける広告の表示順序に対応付けて、当該表示順序で表示された広告の数(インプレッション数)及び当該表示順序で表示された広告のクリックレートを記憶する。図2における棒グラフは、広告の表示順序と当該表示順序で表示された広告の数(インプレッション数)との関係を示し、折れ線グラフは、広告の表示順序と当該表示順序で表示された広告のクリックレートを示す。統計ログデータベース21には、検索サイトにおける検索ログやクリックログなどに基づいてリアルタイムで収集された各種情報から所定の周期で集計された統計ログ(サンプル)が、検索クエリ毎に記憶される。
図1に戻り、統計ログ読出手段131は、統計ログデータベース21から検索クエリ毎に設けられた予測モデル生成用のサンプルを読み出す。すなわち、本実施形態の予測モデル生成装置1では、広告の表示順序(説明変数)に基づいて、表示される広告のクリックレート(目的変数)を予測するための予測モデルを、検索クエリ毎に生成する。
このとき、インプレッション数が最少サンプル数を満たしていない表示順序については、後述するようにグループ化手段133によるグループ化が行われた後に予測モデル生成用の数値としてセットされ、最少サンプル数を満たしている表示順序については、そのまま予測モデル生成用の数値としてセットされる。
図2及び図3を参照して、表示順序「1.7」のインプレッション数201が最少サンプルに満たないと判定された場合、グループ化手段133は、隣接するインプレッション数203(表示順序「2.0」)をインプレッション数201に加えグループ化し、インプレッション数205とする(図3参照)。このとき、インプレッション数201とインプレッション数203とを加算することで最少サンプル数を満たすものとすると、サンプル数が少なかったサンプル(表示順序「1.7」)が最少サンプル数を満たすことになり、適切な近似曲線を作成することができる。
R2:第2表示順序
I1:第1表示順序のインプレッション数
I2:第2表示順序のインプレッション数
図2を参照して、グループ化した表示順序「1.7」のインプレッション数201は「500」であり、表示順序「2.0」のインプレッション数203は「500」である場合、グループ化後の表示順序は「1.85」となる(図3)。
CTR2:第2表示順序に対応するクリックレート
I1:第1表示順序のインプレッション数
I2:第2表示順序のインプレッション数
図2を参照して、グループ化した表示順序「1.7」に対応するクリックレート211は「4.5」であり、インプレッション数201は「500」である。また、グループ化した表示順序「2.0」に対応するクリックレート213は「6.5」であり、インプレッション数は「500」である。その結果、グループ化後のクリックレート215は「5.5」となる(図3)。
x:表示順序(説明変数)
y:クリックレート(目的変数)
その結果、図3のようにセットされた数値から図4に示す予測モデルが生成される。予測モデル生成手段14により生成された予測モデルは、図示しない予測モデルデータベース22に記憶される。すなわち、予測モデルデータベース22には、広告の表示順序に基づいて表示される広告のクリックレートを予測するための予測モデルが、検索クエリ毎に記憶される。
以上説明した予測モデル生成装置1のハードウェアは、1又は複数の一般的なコンピュータによって構成することができる。一般的なコンピュータは、例えば、制御部として、中央処理装置(CPU)を備える他、記憶部として、メモリ(RAM、ROM)、ハードディスク(HDD)及び光ディスク(CD、DVDなど)を、ネットワーク通信装置として、各種有線及び無線LAN装置を、表示装置として、例えば、液晶ディスプレイ、プラズマディスプレイなどの各種ディスプレイを、入力装置として、例えば、キーボード及びポインティング・デバイス(マウス、トラッキングボールなど)を適宜備え、これらは、バスラインにより接続されている。このような一般的なコンピュータにおいて、CPUは、予測モデル生成装置1を統括的に制御し、各種プログラムを適宜読み出して実行することにより、上述したハードウェアと協働し、本発明に係る各種機能を実現している。
続いて、図5を参照して、予測モデル生成装置1の予測モデル生成処理について説明する。予測モデル生成装置1は、予め定められた所定のタイミング又はユーザが指定したタイミングで予測モデル生成処理を実行する。
ここで、信頼度パラメータの受け付けは、検索クエリ毎に個別に受け付けることとしてもよく、複数又は全部の検索クエリに共通して受け付けることとしてもよい。また、S1,S2の処理は、予測モデル生成処理を行う際に常に行うこととしてもよいが、省略することもできる。すなわち、ユーザが所望する予測モデルの精度が変わらない場合には、前回算出しておいた最少サンプル数に基づいて、S3〜S10の処理を行うこととしてもよい。
予測モデル生成装置1によれば、予測モデルを生成する際に、インプレッション数が最少サンプル数に満たない(すなわち、統計上有意でない)広告の表示順序やクリックレートについては、最少サンプル数を満たすまで隣接する範囲でグループ化した上で予測モデルを生成する。
これにより、インプレッション数がユーザの予定する信頼度を満たすための最少サンプル数に満たないサンプル(表示順序及びクリックレート)が存在する場合であっても、ユーザの経験や知識に関係なく誤差の少ない予測モデルを自動的に生成することができる。
このとき、予測モデル生成装置1では、隣接する範囲でグループ化する際に、それぞれのインプレッション数に基づいて重み付けを行った上で、グループ化後の表示順序及びクリックレートを決定する。これにより、グループ化した際の誤差を一定度に抑えることができ、サンプル数が少ない場合であっても誤差の少ない予測モデルを自動的に生成することができる。
11 信頼度パラメータ取得手段
12 最少サンプル数算出手段
13 モデル生成準備手段
131 統計ログ読出手段
132 サンプル数判定手段
133 グループ化手段
134 説明変数変更手段
135 目的変数変更手段
14 予測モデル生成手段
21 統計ログデータベース
22 予測モデルデータベース
Claims (3)
- 説明変数を用いて目的変数の予測モデルを生成する予測モデル生成装置であって、
説明変数及び当該説明変数に対応する目的変数の既知の組み合わせを、予測モデルを生成するためのサンプルとして記憶する統計ログデータベースと、
前記予測モデルについて所定の信頼度を満たすための最少サンプル数を算出する最少サンプル数算出手段と、
前記統計ログデータベースから前記サンプルを読み出す統計ログ読出手段と、
前記統計ログ読出手段が読み出した前記説明変数毎の前記サンプルの数が前記最少サンプル数を満たしているか否かを判定するサンプル数判定手段と、
前記サンプル数判定手段により特定の説明変数の前記サンプルの数が前記最少サンプル数に満たないと判定されることを条件に、当該特定の説明変数に隣接する説明変数に係る前記サンプルを加えることで、前記最少サンプル数を満たす範囲の隣接説明変数に係る前記サンプルをグループ化するグループ化手段と、
前記グループ化手段によりグループ化された前記サンプルに係る、前記特定の説明変数と前記隣接説明変数とに基づいて、グループ化後の説明変数を決定する説明変数変更手段と、
前記グループ化手段によりグループ化された前記サンプルに係る、前記特定の説明変数と前記隣接説明変数とに各々対応する前記目的変数に基づいて、グループ化後の前記サンプルに係る、前記説明変数に対応する目的変数を決定する目的変数変更手段と、前記統計ログ読出手段が読み出した前記説明変数及び前記説明変数変更手段が決定した前記説明変数と、
当該説明変数に各々対応する前記目的変数とに基づいて、前記目的変数の予測モデルを生成する予測モデル生成手段と、
を備える予測モデル生成装置。 - 前記説明変数変更手段及び前記目的変数変更手段は、前記特定の説明変数のサンプルの数と前記隣接説明変数のサンプルの数とに基づいて重み付けられたグループ化後の説明変数及び対応する目的変数を決定する、
請求項1に記載の予測モデル生成装置。 - 説明変数を用いて目的変数の予測モデルを生成する方法であって、
コンピュータが実行する、
前記予測モデルについて所定の信頼度を満たすための説明変数及び当該説明変数に対応する目的変数の既知の組み合わせの数である最少サンプル数を算出するステップと、
前記説明変数及び当該説明変数に対応する目的変数の既知の組み合わせを、予測モデルを生成するためのサンプルとして記憶する統計ログデータベースから前記サンプルを読み出すステップと、
読み出した前記説明変数毎の前記サンプルの数が前記最少サンプル数を満たしているか否かを判定するステップと、
特定の説明変数の前記サンプルの数が前記最少サンプル数に満たないと判定されることを条件に、当該特定の説明変数に隣接する説明変数に係る前記サンプルを加えることで、前記最少サンプル数を満たす範囲の隣接説明変数に係る前記サンプルをグループ化するステップと、
グループ化された前記サンプルに係る、前記特定の説明変数と前記隣接説明変数とに基づいて、グループ化後の説明変数を決定するステップと、
グループ化された前記サンプルに係る、前記特定の説明変数と前記隣接説明変数とに各々対応する前記目的変数に基づいて、グループ化後の前記サンプルに係る、前記説明変数に対応する目的変数を決定するステップと、
前記統計ログデータベースから読み出した前記説明変数及び決定した前記説明変数と、当該説明変数に各々対応する前記目的変数とに基づいて、前記目的変数の予測モデルを生成するステップと、
を含む方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011093877A JP5225423B2 (ja) | 2011-04-20 | 2011-04-20 | 予測モデル生成装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011093877A JP5225423B2 (ja) | 2011-04-20 | 2011-04-20 | 予測モデル生成装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012226573A JP2012226573A (ja) | 2012-11-15 |
JP5225423B2 true JP5225423B2 (ja) | 2013-07-03 |
Family
ID=47276665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011093877A Active JP5225423B2 (ja) | 2011-04-20 | 2011-04-20 | 予測モデル生成装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5225423B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017135322A1 (ja) * | 2016-02-03 | 2017-08-10 | 日本電気株式会社 | 最適化システム、最適化方法、及び、記録媒体 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4417897B2 (ja) * | 2005-09-14 | 2010-02-17 | 富士通マイクロエレクトロニクス株式会社 | 製造データ解析方法及び製造データ解析装置 |
JP2007199862A (ja) * | 2006-01-24 | 2007-08-09 | Nippon Telegr & Teleph Corp <Ntt> | エネルギー需要予測方法、予測装置、プログラム、および記録媒体 |
JP5004551B2 (ja) * | 2006-11-06 | 2012-08-22 | 株式会社電通 | 広告診断プログラム、装置及び方法 |
JP4568786B2 (ja) * | 2009-03-26 | 2010-10-27 | シャープ株式会社 | 要因分析装置および要因分析方法 |
-
2011
- 2011-04-20 JP JP2011093877A patent/JP5225423B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012226573A (ja) | 2012-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10534845B2 (en) | System and method for optimizing electronic document layouts | |
US9065727B1 (en) | Device identifier similarity models derived from online event signals | |
CN107885868B (zh) | 生成渠道贡献的图形化表示的方法、系统及介质 | |
KR101807755B1 (ko) | 광고 수익률을 갖는 다수의 속성 모델들 | |
US9076160B2 (en) | System and method for suggesting recommended keyword | |
US20170308609A1 (en) | Multi-result ranking exploration | |
US9026479B1 (en) | Predicting user interests | |
CN106251174A (zh) | 信息推荐方法及装置 | |
US20100211568A1 (en) | Personalized recommendations on dynamic content | |
US20160092912A1 (en) | Automated optimization of an advertisement placement engine | |
US10878058B2 (en) | Systems and methods for optimizing and simulating webpage ranking and traffic | |
CN105556512A (zh) | 用于分析关注实体特性的设备、系统以及方法 | |
KR20140034180A (ko) | 우선순위 차원데이터 컨버젼 경로의 보고 | |
CN110910201B (zh) | 信息推荐的控制方法、装置、计算机设备及存储介质 | |
CN102262661A (zh) | 一种基于k阶混合马尔可夫模型的Web页面访问预测方法 | |
CN106447419B (zh) | 基于特征选择的拜访者标识 | |
CN105701108A (zh) | 一种信息推荐方法、装置及服务器 | |
CA3062119A1 (en) | Method and device for setting sample weight, and electronic apparatus | |
JP2009163425A (ja) | 広告サーバ及び広告管理方法 | |
CN110766510A (zh) | 推荐方法、装置、电子设备及可读存储介质 | |
US9159083B1 (en) | Content evaluation based on user's browsing history | |
JP5250088B2 (ja) | 広告サーバ及び広告管理方法 | |
CN106776757A (zh) | 用户完成网银操作的指示方法及装置 | |
EP2469463A1 (en) | A method and a system for analysing traffic on a website by means of path analysis | |
JP5225423B2 (ja) | 予測モデル生成装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130312 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5225423 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160322 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |