JP6511186B1 - 広告配信システム - Google Patents
広告配信システム Download PDFInfo
- Publication number
- JP6511186B1 JP6511186B1 JP2018156496A JP2018156496A JP6511186B1 JP 6511186 B1 JP6511186 B1 JP 6511186B1 JP 2018156496 A JP2018156496 A JP 2018156496A JP 2018156496 A JP2018156496 A JP 2018156496A JP 6511186 B1 JP6511186 B1 JP 6511186B1
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- attribute
- audience
- processing unit
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 claims abstract description 176
- 238000012384 transportation and delivery Methods 0.000 claims abstract description 59
- 238000000034 method Methods 0.000 claims description 35
- 230000008569 process Effects 0.000 claims description 32
- 238000005457 optimization Methods 0.000 claims description 24
- 238000000354 decomposition reaction Methods 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 abstract description 12
- 235000014510 cooky Nutrition 0.000 description 36
- 238000010586 diagram Methods 0.000 description 24
- 230000006870 function Effects 0.000 description 18
- 230000004044 response Effects 0.000 description 11
- 238000013515 script Methods 0.000 description 11
- 230000006399 behavior Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000006854 communication Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
より詳細には、インターネットにおけるwebサイトのコンテンツに含まれる広告を、適切なターゲットオーディエンス(target audience:広告が目標とする視聴者)に配信する、広告配信システムに関する。
一方、インターネットは基本的に一対一の双方向通信である。つまり、インターネットにおける広告は、あるオーディエンス一人に対し、広告を配信した、という事実を完全に把握可能である。このため、1件当たりの広告配信料を定めることが可能であるため、配信件数を絞れば安価な料金で訴求力の高い広告を配信することができる。
このため、インターネットの広告は、中小企業や個人事業者にも広く利用されている。
特許文献1には、コンテンツに係る属性を評価することができる属性評価装置が開示されている。
特許文献2には、広告主がターゲットオーディエンスを特定し易くするための、オーディエンスを分類する機能を有する、広告配信サーバが開示されている。特に、特許文献2に記載される技術は本発明の基礎となる技術である。
これまで、広告配信業者がターゲットオーディエンスを特定する方法は、オーディエンスの過去の購買履歴や商品紹介サイトに対する閲覧履歴に基いていた。しかし、既に商品を購入したオーディエンスが再び同じ商品を購入するとは限らない。このため、オーディエンスが必要としていないと考えているにもかかわらず、オーディエンスがあちこちのサイトを閲覧する度にいつまでも同じ種類の広告が付きまとい、広告が煙たがられる、という逆効果を生じることがしばしば見受けられる。
広告主が真に必要とするターゲットオーディエンスとは、未だ商品を購買していないが購買の可能性があると思われる、「未だ見ぬ顧客」である。この、未だ見ぬ顧客を特定する技術は、未だ確立されているとはいえない。
以上のような状況に鑑みて、発明者らは特許文献2に開示される、広告主がターゲットオーディエンスを特定し易くするための、オーディエンスを分類する機能を有する、広告配信サーバを開発した。
広告配信サービスにおけるCookieは、当該オーディエンスの個人情報を詳細に特定することなく、当該オーディエンスの匿名性を担保しつつ、当該オーディエンスが概ねどのような人であるのかを識別する「匿名識別情報」としての役割を担う。
このような、Cookieによるオーディエンスの属性の特定が不可能なオーディエンスに対し、従来技術では当該オーディエンスの属性に適した広告を配信することが原理的に不可能である。
更に、オーディエンスIDで特定できない未知オーディエンスの情報端末によるサーバへの1回のアクセスを示すアクセス情報であって少なくともアクセス先のURL及びアクセス日時を含む未知オーディエンスアクセス情報を分解してパターン要素群に変換し、変換されたパターン要素群と合致するパターンを所定のパターンのうちから取得し、取得したパターンと対応関係のある属性情報を学習処理の係数の結果に応じて取得することで、未知オーディエンスの属性情報を推定する基本判定処理部と、未知オーディエンスに対し、推定された属性情報に合致する広告を選択して配信する広告配信処理部とを具備する。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
特許文献2に記載の技術を用いる広告配信サーバは、webブラウザにおいて広告配信サービスのCookieを許可しているオーディエンスについて、当該オーディエンスの属性情報を特定しており、データベースに記録している。
一方、Cookieを許可していないオーディエンスは、広告配信サーバの立場で見ると、当該オーディエンスの属性情報が全くわからない。このままでは当該オーディエンスに対して適切な広告を配信することができない。
なお、これ以降、webブラウザが広告配信サービスのCookieを許可しているオーディエンスを、既に属性情報が判明していることから、既知オーディエンスと呼ぶ。逆に、webブラウザが広告配信サービスのCookieを許可していないオーディエンスを、属性情報が未知であることから、未知オーディエンスと呼ぶ。
本発明は、既知オーディエンスから得られるアクセス情報と属性情報から、未知オーディエンスのアクセス情報を手がかりに、未知オーディエンスの属性情報を推定する技術である。
図1は、本発明の実施形態に関わる、広告配信システムの概略図である。
広告配信システム101には、インターネット102を通じてアクセス可能な複数の広告配信サーバ103を中心に、複数の広告主サイト104、複数のポータルサイト105、そして複数の広告主クライアント106が存在する。複数の広告配信サーバ103は周知のクラウドコンピューティングによるwebサービスを提供する。複数の既知オーディエンス107は、広告主サイト104及び/又はポータルサイト105にアクセスすることで、広告配信サーバ103から広告を受信する。
広告主サイト104、ポータルサイト105、広告配信サーバ103は周知のwebサーバである。webサーバはHTTP又はHTTPSにて所望のコンテンツを提供する。広告主クライアント106は所定のクライアントマシンである。但し、広告主クライアント106は広告配信サーバ103と非対話型通信を行うため、サーバの形態を採っている。
既知オーディエンス107は情報端末108で動作するwebブラウザにおいて、広告配信サーバ103から送信されるCookieの保存と広告配信サーバ103に対するCookieの送信を許可している。このため、広告配信サーバ103は既知オーディエンス107の属性情報を特定することができるので、既知オーディエンス107の属性情報を内部のデータベースに記録している。
そして、広告配信サーバ103はこれら既知の属性情報を基に、既知オーディエンス107の趣味趣向に適した広告の配信を行う。
未知オーディエンス109は情報端末110で動作するwebブラウザにおいて、広告配信サーバ103から送信されるCookieの保存と広告配信サーバ103に対するCookieの送信を禁止している。このため、広告配信サーバ103は未知オーディエンス109の属性情報を特定することができないので、後述する未知オーディエンス109に対する属性推定の技術を用いて属性情報を推定する。
そして、広告配信サーバ103はこれら推定した属性情報を基に、未知オーディエンス109の趣味趣向に適した広告の配信を行う。
図2は、広告配信システム101における、広告が既知オーディエンス107の情報端末108のwebブラウザに配信される動作の流れを示すタイムチャートである。
ある既知オーディエンス107が、情報端末108のwebブラウザを用いてポータルサイト105(又は広告主サイト104)にアクセスして、HTML文書を要求する(S201)。ポータルサイト105は情報端末108のwebブラウザの要求に応じて、HTML文書を情報端末108のwebブラウザへ送信する(S202)。情報端末108のwebブラウザはポータルサイト105からHTML文書を受信する(S203)。情報端末108のwebブラウザは受信したHTML文書の内、すぐに表示部305(図3参照)に表示できる内容について、表示処理を行う(S204)。
もう一つのスクリプトは、広告を要求するスクリプトである。このスクリプトの実行により、情報端末108のwebブラウザは広告配信サーバ103に対し、広告を要求する(S208)。これらのスクリプトはJavaScript(登録商標)やECMAScript(登録商標)等である。
広告のオークションは、ステップS208における情報端末108のwebブラウザから送信される広告要求から、ステップS215における情報端末108のwebブラウザによる広告受信に至るまで、50msec以内で実施することが、広告配信業者の業界内ルールとして定められている。
図2中、ステップS205の後にステップS208が実行されているが、これらは順不同である。
広告主サイト104及びポータルサイト105が情報端末108のwebブラウザの要求に応じて出力するHTML文書には、アクセス情報を取得するためのスクリプトが埋め込まれている。ステップS205に示すように、情報端末108のwebブラウザが初めて広告主サイト104又はポータルサイト105にアクセスして、スクリプトを実行すると、情報端末108のwebブラウザから広告配信サーバ103へアクセス情報が送信される。そして、ステップS206、S207に示すように、広告配信サーバ103は、受信したアクセス情報にCookieが含まれていないことを検出すると、Cookieを生成して、結果情報と共に情報端末108のwebブラウザに送信し、情報端末108のwebブラウザは受信したCookieを記憶する。これ以降、情報端末108のwebブラウザは広告配信サーバ103にアクセス情報を送信する際、このCookieも広告配信サーバ103に送信する。
情報端末108のwebブラウザは、ステップS208において広告配信サーバ103に対し広告を要求する際、Cookieも送信する。したがって、広告配信サーバ103は広告がどのオーディエンスIDから要求されたのかを把握できる。
そこで、広告配信サーバ103は、ステップS205において情報端末110のwebブラウザから広告配信サーバ103へ送信されるアクセス情報を手がかりに、未知オーディエンス109の属性情報を推定する。
本実施形態の広告配信システム101は、広告配信サーバ103がステップS206において、未知オーディエンス109が使用する情報端末110の属性情報を、未知オーディエンス109のアクセス情報から推定するための技術である。
図3Aは、既知オーディエンス107が使用する情報端末108のハードウェア構成を示すブロック図である。
情報端末108は、バス307に接続された、周知のCPU301、ROM302、RAM303、ハードディスク装置やフラッシュメモリ等の不揮発性ストレージ304、表示部305、操作部306を備える。
バス307には更に、インターネット102に接続するためのNIC(Network Information Card)308が接続されている。
なお、図3Aのブロック図は、図1に示されるデスクトップパソコン110a、ノートパソコン108a、そしてスマートフォン108bを包含する上位概念で記載されている。例えばスマートフォン108bの場合、表示部305は液晶ディスプレイであり、操作部306は静電式位置検出装置である。そして、表示部305と操作部306はタッチパネルディスプレイを構成する。また、スマートフォン108bの場合、NIC308はLTE(Long Term Evolution)等の無線通信機能や無線LANインターフェースが該当する。更に、シリアルポートを用いたPPP(Point to Point Protocol)接続も、本明細書におけるNIC308が指し示す概念として含まれる。つまり、図3AにおけるNIC308は、インターネット102に接続するための、広義の物理的及び/又は論理的なインターフェースを指す。
図3Aは、既知オーディエンス107が使用する情報端末108のハードウェア構成を示すブロック図であるが、未知オーディエンス109が使用する情報端末110のハードウェア構成も同じである。
周知のネットワークOSとwebブラウザプログラムが稼働する情報端末108は、入出力制御部309を有し、入出力制御部309は、ユーザ(既知オーディエンス107)の操作によって操作部306が発する操作情報を受けて、インターネット102上のwebサイトに存在する情報を取得し、取得した情報(HTML文書等)を表示部305に表示する。その際、入出力制御部309は必要に応じてCookie310の読み書きも行う。また、入出力制御部309はHTML文書に含まれるスクリプトを実行し、その実行結果に応じて所定のwebサーバにアクセスする機能も備える。
未知オーディエンス109が使用する情報端末110のソフトウェア機能は、図3Bに示される、既知オーディエンス107が使用する情報端末108のソフトウェア機能からCookie310が除かれている以外は、等しい機能ブロック構成である。
図4Aは、webサーバ401のハードウェア構成を示すブロック図である。なお、広告配信サーバ103のハードウェア構成もwebサーバ401と同じである。
webサーバ401は、バス407に接続された、周知のCPU402、ROM403、RAM404、ハードディスク装置やフラッシュメモリ等の不揮発性ストレージ405、NIC406、リアルタイムクロック(RealTime Clock:以下「RTC」と略)408を備える。なお、情報端末108にあった表示部305及び操作部306は、多くの場合省略されている。
webサーバプログラム等で構成される入出力制御部409は、情報端末108から情報の取得要求を受信すると、要求に応じて、HTML文書や画像ファイル等の静的コンテンツ410や、cgi(Common Gateway Interface)等で構成される動的コンテンツ生成処理部411の実行結果を情報端末108へ返送する。動的コンテンツ生成処理部411は、入出力制御部409によって実行されると、必要に応じて各種データベース412を参照して、動的コンテンツを作成する。
なお、図4Bの動的コンテンツ生成処理部411による動的コンテンツの生成手段はcgiに限られない。Java(登録商標)アプレット等、様々な動的コンテンツ生成手段を採り得る。
図5は、広告配信サーバ103のソフトウェア機能を示すブロック図である。
広告配信サーバ103は、実際には複数の計算機を有するクラウドコンピューティングで構成されるが、説明の便宜上、単一の計算機に見立てて機能ブロックを説明する。
webサーバプログラム等で構成される入出力制御部501は、既知オーディエンス107が使用する情報端末108から情報の取得要求を受信すると、オーディエンスアクセス情報取得部502を実行する。
そして、アクセス情報にCookieが含まれていることがわかると、Cookie内のオーディエンスIDで広告配信データベース503内のオーディエンスマスタテーブル505を検索して、既知オーディエンス107の属性情報を特定する。そして、特定した既知オーディエンス107の属性情報を入出力制御部501に引き渡す。入出力制御部501は、既知オーディエンス107の属性情報を広告配信処理部506に引き渡して、広告配信処理部506を実行する。
また、入出力制御部501は、オーディエンスアクセス情報取得部502が取得した既知オーディエンス107のアクセス情報をブースト学習処理部507に引き渡して、ブースト学習処理部507を実行する。
オーディエンスアクセス情報取得部502は、アクセス情報を広告配信データベース503内のオーディエンス行動履歴データ504に記録する。但し、未知オーディエンス109はCookieが含まれておらず、オーディエンスIDを取得できないので、オーディエンスIDについては空欄(NULL)にするか、あるいは特定不可能であることを示す特別なオーディエンスIDをオーディエンス行動履歴データ504に記録する。そして、アクセス情報にCookieが含まれていないことがわかると、未知オーディエンス109のアクセスである旨を入出力制御部501に報告する。
広告配信処理部506は、既知オーディエンス107に対しては、オーディエンスマスタテーブル505から取得できる既知オーディエンス107の属性情報に基づいて、既知オーディエンス107の属性情報に適した広告配信処理を実行する。未知オーディエンス109に対しては、基本判定処理部508が推定した未知オーディエンス109の属性情報に基づいて、未知オーディエンス109の属性情報に適した広告配信処理を実行する。
ブースト学習処理部507は、基本判定処理部508が推定する未知オーディエンス109の属性情報の精度を向上させるために、既知オーディエンス107のアクセス情報を用いて、パターンテーブル513に対して「強化した学習」を実行する。強化した学習の詳細については図11で後述する。
オーディエンスアクセス情報取得部502と広告配信処理部506は、既知オーディエンス107が使用する情報端末108に対しては特許文献2に開示される従来技術と同じ動作を行う。すなわち、オーディエンスアクセス情報取得部502と広告配信処理部506は、機能的には特許文献2に開示される従来技術と等しい。しかし、オーディエンスアクセス情報取得部502と広告配信処理部506は、未知オーディエンス109が使用する情報端末110に対しては、基本判定処理部508から得た属性情報に基づいて、既知オーディエンス107が使用する情報端末108に対する動作と同様の動作を行う。
すなわち、基本判定処理部508は、本実施形態において新規に設けられた機能ブロックである。
クラスタ作成処理部510は、オーディエンス行動履歴データ504に基づき、図示しないクラスタ作成用のデータベースを形成し、更新することで、オーディエンスマスタテーブル505に記録されている既知オーディエンス107に属性情報を付与し、あるいは更新する。
ベース学習処理部511は、オーディエンス行動履歴データ504に基づき、パターンテーブル513を作成し、基本的な学習処理を実行する。
ウェイト最適化処理部512は、基本判定処理部508が使用する、広告配信データベース503内のウェイトテーブル514の係数を作成し、あるいは更新する。
クラスタ作成処理部510は、既知オーディエンス107が使用する情報端末108に対しては特許文献2に開示される従来技術と同じ動作を行う。すなわち、クラスタ作成処理部510は、機能的には特許文献2に開示される従来技術と等しい。
ベース学習処理部511は、パターンテーブル513の作成と更新を行う。なお、図8で詳述するが、ベース学習処理部511が実行されている間は、広告配信サーバ103は広告配信処理等ができない。したがって、図5に開示される広告配信サーバ103は複数台が用意され、それぞれがベース学習処理部511の実行タイミングをずらすことで、広告配信サービスの停止を防ぐように構成される。
ブースト学習処理部507は、ベース学習処理部511では実現し得ない、判定率を向上させるための強化した学習を実行する。なお、図8で詳述するが、ブースト学習処理部507の実行タイミングは、ベース学習処理部511が実行されていない間に、例えば30分毎に実行される。
ウェイト最適化処理部512は、ウェイトテーブル514の作成と更新を行う。
すなわち、ブースト学習処理部507、ベース学習処理部511、及びウェイト最適化処理部512は、本実施形態において新規に設けられた機能ブロックである。
図6は、広告配信データベース503に含まれるテーブルのフィールド構成を示す図である。
パターンマスタテーブル517は、パターンIDフィールドと、パターン要素番号フィールドと、パターン要素フィールドを有する。
パターンIDフィールドには、パターンを一意に識別するパターンIDが格納される。
パターン要素番号フィールドには、パターンIDに属する要素を一意に識別する番号(順番)が格納される。
パターン要素フィールドには、パターンの要素を示す情報が格納される。例えば、URLのホスト名、URLのパス名、時間帯(アクセス日時を粗く分化したもの)、端末OS、端末機種名等である。
パターンマスタテーブル517において、一つのパターンIDには複数のパターン要素番号が対応する。すなわち、パターンIDとパターン要素番号は1対多の対応関係を有する。
パターン要素番号とパターン要素は、1対1の対応関係を有する。
webサイトに公開されているHTML文書の内容が、特定の属性情報に属するオーディエンスの興味の対象となる内容である場合、未知オーディエンス109のアクセス情報が既知オーディエンス107のアクセス情報と類似するのであれば、当該未知オーディエンス109の属性情報は概ね既知オーディエンス107の属性情報に類似する可能性がある。例えば、女性化粧品の企業のwebサイトであれば、アクセスするオーディエンスの殆どは女性であると推測することができる。
例えば、いわゆるポータルサイトやニュースサイトであれば、アクセスするオーディエンスは老若男女が入り混じり、未知オーディエンス109の属性情報を容易に推測することができないと思われる。
例えば、平日の午前中に、前述のポータルサイトやニュースサイトにアクセスする人達は、児童、学生、会社員の可能性は低く、専業主婦や無職の老人である可能性が高いものと考えられる。つまり、webサイトの内容自体に偏りがなくとも、その他の情報と組み合わせることで、オーディエンスの属性情報の偏りを特定することが可能になる。
属性IDフィールドには、属性情報を一意に識別する属性IDが格納される。
属性情報フィールドには、オーディエンスの属性に関する情報が格納される。例えば、性別、年齢層、居住地、職種、家族構成、趣味趣向等である。
属性マスタテーブル515において、属性IDと属性情報は、1対1の対応関係を有する。
属性グループIDフィールドは、属性グループを一意に識別する属性グループIDが格納される。
属性IDフィールドは、属性マスタテーブル515の同名フィールドと同じである。
例えば、性別という属性グループには、男を示す属性ID、女を示す属性ID、性別不明を示す属性IDが属する。
したがって、属性グループマスタテーブル516において、一つの属性グループIDには複数の属性IDが対応する。すなわち、属性グループIDと属性IDは1対多の対応関係を有する。
パターンIDフィールドは、パターンマスタテーブル517の同名フィールドと同じである。
属性IDフィールドは、属性マスタテーブル515の同名フィールドと同じである。
属性計数値フィールドには、学習処理における当該属性IDのヒット数が格納される。
パターンテーブル513において、一つのパターンIDには複数の属性IDが対応する。すなわち、パターンIDと属性IDは1対多の対応関係を有する。
属性IDと属性計数値は1対1の対応関係を有する。
属性IDフィールドは、属性マスタテーブル515の同名フィールドと同じである。
ウェイト係数フィールドには、当該属性IDの、パターンテーブル513における属性計数値に乗算するウェイト係数が格納される。
ウェイトテーブル514において、属性IDと属性情報は、1対1の対応関係を有する。
なお、図6には示していないが、ウェイト行列テーブル518は、複数のウェイトテーブル514の集合体である。
オーディエンスIDフィールドには、オーディエンスを一意に識別するオーディエンスIDが格納される。
属性IDフィールドは、属性マスタテーブル515の同名フィールドと同じである。
オーディエンスマスタテーブル505において、一つのオーディエンスIDには複数の属性IDが対応する。すなわち、オーディエンスIDと属性IDは1対多の対応関係を有する。
オーディエンスIDフィールドは、オーディエンスマスタテーブル505の同名フィールドと同じである。
行動履歴データフィールドには、当該オーディエンスがあるURLのweb文書にアクセスした際のアクセス情報、いわゆるアクセスログが格納される。
図7は、パターンテーブル513が形成するイメージの一例を示す図である。
前述の様に、パターンとは、オーディエンスが使用する情報端末から得られるアクセス情報の構成要素を部分的に抜粋し、正規化を施した情報である。言い換えれば、パターンとは、所定の正規化を施したアクセス情報の、構成要素の部分集合(サブセット)である。
アクセス情報は、既知オーディエンス107が使用する情報端末108、及び未知オーディエンス109が使用する情報端末110の何れからも等しく取得することができる。したがって、あるパターンについて既知オーディエンス107の属性情報に偏りが見受けられる場合、同じパターンの未知オーディエンス109は同様の属性情報を有する可能性が高い。
「パターン1」(P701)の場合、「属性2」の属性計数値(P702)が他の「属性1」「属性3」と比べて大きい値である。一方、「パターン2」(P703)の場合、「属性1」の属性計数値(P704)が他の「属性2」「属性3」と比べて大きい値である。
例えば、「属性1」と「属性2」が性別を示す属性グループIDに属しており、「属性1」が男性を表す属性であり、「属性2」が女性を表す属性である場合、「パターン1」(P701)に合致する未知オーディエンス109は女性の可能性が高く、「パターン2」(P703)に合致する未知オーディエンス109は男性の可能性が高いと推測できる。
図8は、広告配信サーバ103における、時間軸上における動作の流れを示す概略図である。
先ず、時点T801において、スケジューラ509はベース学習処理部511を実行する。これによりベース学習処理P802が開始され、ベース学習処理部511はパターンテーブル513の作成と更新を行う。そして、ベース学習処理部511によるベース学習処理P802が終了する時点T803迄は、スケジューラ509はウェイト最適化処理部512の実行を禁止すると共に、スケジューラ509は入出力制御部501にベース学習処理部511が実行中である旨を通知する。入出力制御部501はこの通知を受けて、オーディエンスアクセス情報取得部502、広告配信処理部506、基本判定処理部508、ブースト学習処理部507の実行を禁止する。
図9は、ベース学習処理部511の機能ブロック図である。
オーディエンスIDを有する既知オーディエンス107のアクセス情報である既知オーディエンスアクセス情報901は、パターン分解処理部902に入力される。
パターン分解処理部902は、行動履歴データを分解した内容でパターンマスタテーブル517を検索することで、該当するパターンIDを複数個、引き出す。
また、パターン分解処理部902は、オーディエンスマスタテーブル505をオーディエンスIDで検索することで、該当する属性IDを複数個、引き出す。
すると、パターンIDと属性IDの組よりなるパターンリスト903ができる。これはパターンテーブル513から属性計数値フィールドを抜いたものと等しい。
ベース加算処理部904は、パターンリスト903のレコード(パターンIDと属性IDの組)に合致する(検索にヒットする)パターンテーブル513のレコードの属性計数値フィールドを1だけインクリメントする。ベース加算処理部904の処理は、ナイーブベイズにおける学習処理そのものである。
図10は、基本判定処理部508の機能ブロック図である。
オーディエンスIDのない未知オーディエンス109のアクセス情報である未知オーディエンスアクセス情報1001は、パターン分解処理部902に入力される。
パターン分解処理部902は、未知オーディエンスアクセス情報1001を分解した内容でパターンマスタテーブル517を検索することで、該当するパターンIDを複数個、引き出す。すると、パターンIDを複数個有するパターンIDリスト1003ができる。
なお、このパターン分解処理部902は、オーディエンスIDを有する既知オーディエンスアクセス情報901を与えると、オーディエンスIDでオーディエンスマスタテーブル505を検索することで、パターンリスト903を出力するが、オーディエンスIDのない未知オーディエンスアクセス情報1001を与えると、オーディエンスマスタテーブル505を検索できないので、パターンIDのみのパターンIDリスト1003を出力する。
推定処理部1004は、パターンIDでパターンテーブル513を検索し、ヒットした
レコードの属性ID毎の属性計数値に、ウェイトテーブル514を参照して導き出したウェイト係数を乗算する。そして得られた値を対数変換した後、属性グループマスタテーブル516を参照して、同一属性グループ内の他の属性IDの値と相対比較して、1個の属性グループ内における最も合致する可能性が高い属性IDを特定する。
特定した属性IDは複数個出力され、属性IDリスト1005となる。
この属性IDリスト1005は広告配信処理部506に送信され、未知オーディエンス109に対し、最も相応しいweb広告が割り当てられる。
図11は、ブースト学習処理部507の機能ブロック図である。
オーディエンスIDを有する既知オーディエンス107のアクセス情報である既知オーディエンスアクセス情報901は、パターン分解処理部902に入力される。
パターン分解処理部902は、行動履歴データを分解した内容でパターンマスタテーブル517を検索することで、該当するパターンIDを複数個、引き出す。
また、パターン分解処理部902は、オーディエンスマスタテーブル505をオーディエンスIDで検索することで、該当する属性IDを複数個、引き出す。
すると、パターンIDと属性IDの組よりなるパターンリスト903ができる。
ここまではベース学習処理部511と全く同じである。
推定処理部1004は、パターンIDでパターンテーブル513を検索し、ヒットしたレコードの属性ID毎の属性計数値に、ウェイトテーブル514を参照したウェイト係数を乗算する。そして得られた値を対数変換した後、属性グループマスタテーブル516を参照して、同一属性グループ内の他の属性IDの値と相対比較して、属性グループ内における最も可能性が高い属性IDを特定する。
ここで、推定処理部1004が出力する、ある属性グループIDにおいて特定した属性IDを、推定属性ID1101と呼ぶ。
推定処理部1004が出力する推定属性ID1101と、パターンリスト903から得られる正解属性ID1102は、ブースト加算処理部1103に入力される。
ブースト加算処理部1103は、推定属性ID1101と正解属性ID1102とを比較して、一致しているか否かを判定する。
推定属性ID1101と正解属性ID1102が一致していなければ、パターンリスト903のレコード(パターンIDと属性IDの組)に合致する(検索にヒットする)パターンテーブル513のレコードの属性計数値フィールドを、推定属性ID1101と正解属性ID1102が一致している時の加算値よりも更に大きなブースト加算値(例えば「7」等)にて大幅にインクリメントする。
ブースト加算処理部1103の処理は、ナイーブベイズにおける学習処理(図9のベース加算処理部904の処理)と比べると、インクリメントする値が異なっている。
図12は、ウェイト最適化処理部512の機能ブロック図である。
オーディエンスIDを有する既知のオーディエンス行動履歴データ504は、パターン分解処理部902に入力される。
パターン分解処理部902は、行動履歴データを分解した内容でパターンマスタテーブル517を検索することで、該当するパターンIDを複数個、引き出す。
また、パターン分解処理部902は、オーディエンスマスタテーブル505をオーディエンスIDで検索することで、該当する属性IDを複数個、引き出す。
すると、パターンIDと属性IDの組よりなるパターンリスト903ができる。
ここまではベース学習処理部511と全く同じである。
推定処理部1004は、パターンIDでパターンテーブル513を検索し、ヒットしたレコードの属性ID毎の属性計数値に、ウェイトテーブル514を参照したウェイト係数を乗算する。そして得られた値を対数変換した後、属性グループマスタテーブル516を参照して、同一属性グループ内の他の属性IDの値と相対比較して、属性グループ内における最も可能性が高い属性IDを特定する。
ここまではブースト学習処理部507と同じである。
ウェイト行列最適化処理部1201は、推定属性ID1101と正解属性ID1102とを比較して、一致しているか否かを判定する。
この判定処理を、大量のパターンリスト903において繰り返して、ウェイトテーブル514の正解率を算出する。
ウェイト行列最適化処理部1201は最終的に、最も正解率が高い最適なウェイトテーブル514を特定する。
一つ目の特徴は、URL、時刻、デバイス等から得られる情報は僅かであるが、そこに高度な統計処理を行うことで、僅かな手がかりからでも高精度な予測が可能な点である。
二つ目の特徴は、学習や判定に使う情報を、URL、時刻、デバイス等の言語に依存しない情報に絞ることで、あらゆる国や、地域、言語で、オーディエンスの属性情報の推定が可能な点である。
そこで、本発明に係る広告配信サーバ103は、既知オーディエンス107のアクセス情報を機械学習に関するアルゴリズムにおける教師データとして利用することで、未知オーディエンス109のアクセス情報から未知オーディエンス109の属性情報を推定する。
発明者らは、当初、ナイーブベイズのみで広告配信システムを試作してみたところ、未知オーディエンス109の属性情報に対する実用的な判定率を得ることができなかった。
先ず、システム運用中における学習処理を、通常のナイーブベイズアルゴリズムにおける学習処理よりも、属性計数値のインクリメント処理における加算値を増大させた。更に、誤った推定結果を得た場合には、属性計数値のインクリメント処理における加算値を更に増大させる、ブースト加算値を設定した。これが図11にて説明した、ブースト学習処理部507におけるブースト学習処理である。
(1)ウェイトテーブル514は、URLのホスト名(FQDN)毎に異なるウェイトテーブル514を使用すると、未知オーディエンス109の属性情報の推定精度を向上させることが可能になる。
図13は、ウェイトテーブル514の変形例のフィールド構成を示す図である。
ウェイトテーブル1301は、属性IDフィールドと、パターンIDフィールドと、パターン要素番号フィールドと、ウェイト係数フィールドを有する。
属性IDフィールドは、属性マスタテーブル515の同名フィールドと同じである。
パターンIDフィールド及びパターン要素番号フィールドは、パターンマスタテーブル517の同名フィールドと同じである。
但し、パターンIDとパターン要素番号で特定される、URLのホスト名に合致する場合においてのみ、このウェイト係数が適用される。
ウェイトテーブル1301において、属性ID、パターンID及びパターン要素番号の組と属性情報は、1対1の対応関係を有する。
このウェイトテーブル1301は、図12のウェイト最適化処理において、パターンID及びパターン要素番号で特定されるURLのホスト名においてのみ実行される。
広告配信サーバ103は、既知オーディエンス107のアクセス情報を所定のパターンに分解してから、ナイーブベイズアルゴリズムを用いた学習処理を行う。そして、未知オーディエンス109のアクセス情報を所定のパターンに分解してから、ナイーブベイズアルゴリズムを用いた推定処理を行う。
更に広告配信サーバ103は、推定処理の精度を向上させるため、通常運用時における学習処理において、正解の場合は通常の学習処理よりインクリメント数を増加させた加算値を与え、不正解の場合は加算値から更にインクリメント数を増加させたブースト加算値を与える、というブースト学習処理を実行する。
更に広告配信サーバ103は、推定処理の精度を向上させるため、判定処理の際に、属性計数値にウェイト係数を乗算してから対数変換する処理を行う。このウェイト係数は膨大な計算処理によって最も正解率が高いウェイトテーブル514で構成される。
Claims (6)
- アクセス先のホスト及びアクセス日時の時間帯を含むパターン要素群の組み合わせを示す所定のパターンを複数記憶するパターンマスタテーブルと、
オーディエンスを一意に識別するオーディエンスIDを有する既知オーディエンスの情報端末によるサーバへの1回のアクセスを示すアクセス情報であって少なくともアクセス先のURL及びアクセス日時を含む既知オーディエンスアクセス情報を分解して前記パターン要素群に変換し、変換された前記パターン要素群と合致するパターンを前記所定のパターンのうちから取得し、取得したパターンと前記既知オーディエンスの特徴を表す属性情報とを用いて、パターンと属性情報との対応関係を計数する学習処理を行うベース学習処理部と、
前記オーディエンスIDで特定できない未知オーディエンスの情報端末によるサーバへの1回のアクセスを示すアクセス情報であって少なくともアクセス先のURL及びアクセス日時を含む未知オーディエンスアクセス情報を分解して前記パターン要素群に変換し、変換された前記パターン要素群と合致するパターンを前記所定のパターンのうちから取得し、取得したパターンと対応関係のある属性情報を前記学習処理の係数の結果に応じて取得することで、前記未知オーディエンスの属性情報を推定する基本判定処理部と、
前記未知オーディエンスに対し、前記推定された属性情報に合致する広告を選択して配信する広告配信処理部と
を具備する広告配信システム。 - 更に、
前記パターンを一意に識別するパターンIDが格納されるパターンIDフィールドと、前記属性情報を一意に識別する属性IDが格納される属性IDフィールドと、学習処理における当該属性IDのヒット数が格納される属性計数値フィールドとを有するパターンテーブルと
を備え、
前記ベース学習処理部は、
前記オーディエンスIDを含む前記既知オーディエンスアクセス情報が入力される時には前記既知オーディエンスアクセス情報を所定のパターンに再構築して前記パターンIDを得ると共に、前記オーディエンスIDに合致する属性IDを得て、前記パターンIDと前記属性IDの組よりなるパターンリストを出力するパターン分解処理部と、
前記パターンリストに基づいて、前記パターンテーブルの前記属性計数値フィールドの値をインクリメントするベース加算処理部と
を具備し、
前記基本判定処理部は、
前記オーディエンスIDを含まない前記未知オーディエンスアクセス情報が入力される時には前記未知オーディエンスアクセス情報を所定のパターンに再構築して前記パターンIDを得て、前記パターンIDを複数有するパターンIDリストを出力する前記パターン分解処理部と、
前記パターン分解処理部が出力する前記パターンIDリストから得られる前記パターンIDに基づいて前記パターンテーブルを検索して、前記ヒット数に基づいて最も合致する可能性が高い属性IDの集合体である属性IDリストを出力する推定処理部と
を具備する、請求項1に記載の広告配信システム。 - 更にブースト学習処理部を具備し、
前記ブースト学習処理部は、前記パターン分解処理部と、前記推定処理部とを含み、
前記パターンリストから得られる前記パターンIDを前記推定処理部に入力して推定属性IDを得て、前記パターンリストの前記パターンIDと組になっている正解属性IDと前記推定属性IDと一致しているか否かを判定し、一致していれば、前記パターンテーブルの前記属性計数値フィールドの値を1より大きい所定の加算数でインクリメントし、一致していなければ、前記パターンテーブルの前記属性計数値フィールドの値を前記加算数より更に大きい所定のブースト加算数でインクリメントする、ブースト加算処理部と
を具備する、請求項2に記載の広告配信システム。 - 更に、
前記属性IDフィールドと、前記パターンテーブルにおける前記属性IDに属する前記属性計数値フィールドの値に乗算するウェイト係数が格納されるウェイト係数フィールドとを有するウェイトテーブルと
を具備し、
前記推定処理部は、前記パターン分解処理部が出力する前記パターンIDリストから得られる前記パターンIDに基づいて前記パターンテーブルを検索して、得られた属性IDに対応する属性計数値に前記ウェイトテーブルのウェイト係数を乗算した後、対数変換を行い、単一の属性グループに属する複数の前記属性ID同士で前記対数変換を行った値の相対比較を行う、
請求項3に記載の広告配信システム。 - 更にウェイト最適化処理部を具備し、
前記ウェイト最適化処理部は、前記パターン分解処理部と、前記推定処理部とを含み、 前記パターンリストから得られる前記パターンIDを前記推定処理部に入力して推定属性IDを得て、前記パターンリストの前記パターンIDと組になっている正解属性IDと前記推定属性IDと一致しているか否かを判定し、複数の前記ウェイトテーブルにおける正解属性IDと前記推定属性IDの正解率を算出して、最も正解率が高いウェイトテーブルを特定するウェイト行列最適化処理部と
を具備する、請求項4に記載の広告配信システム。 - 前記ウェイトテーブルは更に、前記パターンIDフィールドと、前記パターンIDに属する要素を一意に識別する番号であるパターン要素番号が格納されるパターン要素番号フィールドとを有し、
前記推定処理部は、前記パターン分解処理部が出力する前記パターンIDリストから得られる前記パターンIDに基づいて前記パターンテーブルを検索して得られた前記属性ID、前記パターンID及び前記アクセス情報におけるURLのホスト名を指し示す前記パターン要素番号の組に対応する属性計数値に前記ウェイトテーブルのウェイト係数を乗算した後、対数変換を行い、単一の属性グループに属する複数の前記属性ID同士で前記対数変換を行った値の相対比較を行う、
請求項5に記載の広告配信システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018156496A JP6511186B1 (ja) | 2018-08-23 | 2018-08-23 | 広告配信システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018156496A JP6511186B1 (ja) | 2018-08-23 | 2018-08-23 | 広告配信システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6511186B1 true JP6511186B1 (ja) | 2019-05-15 |
JP2020030677A JP2020030677A (ja) | 2020-02-27 |
Family
ID=66530675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018156496A Active JP6511186B1 (ja) | 2018-08-23 | 2018-08-23 | 広告配信システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6511186B1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7560510B2 (ja) | 2022-05-18 | 2024-10-02 | Lineヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7162522B2 (en) * | 2001-11-02 | 2007-01-09 | Xerox Corporation | User profile classification by web usage analysis |
JP2006053616A (ja) * | 2004-08-09 | 2006-02-23 | Kddi Corp | サーバ装置、webサイト推奨方法およびプログラム |
JP5034279B2 (ja) * | 2006-03-15 | 2012-09-26 | 富士通株式会社 | 属性推定プログラムおよび属性情報提供システム |
JP4808207B2 (ja) * | 2007-12-11 | 2011-11-02 | ヤフー株式会社 | 広告配信装置、広告配信方法、広告配信プログラム及び広告入札方法 |
JP4962970B2 (ja) * | 2008-05-20 | 2012-06-27 | ヤフー株式会社 | プロフィールを利用した商品情報提供サーバ、システム及び方法 |
JP4948573B2 (ja) * | 2009-07-14 | 2012-06-06 | ヤフー株式会社 | 広告課金装置及び方法 |
JP2012048360A (ja) * | 2010-08-25 | 2012-03-08 | Sony Corp | Id価値評価装置、id価値評価システム、及びid価値評価方法 |
-
2018
- 2018-08-23 JP JP2018156496A patent/JP6511186B1/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020030677A (ja) | 2020-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10134058B2 (en) | Methods and apparatus for identifying unique users for on-line advertising | |
US20220358541A1 (en) | Systems and methods for cross-browser advertising id synchronization | |
US9710555B2 (en) | User profile stitching | |
CN109636488B (zh) | 广告投放方法及装置 | |
JP5928920B2 (ja) | お勧めデータの決定 | |
JP5055133B2 (ja) | クロスネットワークのユーザの行動データを公開するための方法及びデバイス | |
US8639575B2 (en) | Audience segment estimation | |
US10552505B2 (en) | Method and system for generating a user-personalization interest parameter for identifying personalized targeted content item | |
US20100211464A1 (en) | Targeted Online Advertising | |
US20110015992A1 (en) | Estimating statistics for online advertising campaigns | |
US20090037421A1 (en) | Traffic Predictor for Network-Accessible Information Modules | |
US20090287645A1 (en) | Search results with most clicked next objects | |
US20150213484A1 (en) | System and method for tracking related events | |
US20160148255A1 (en) | Methods and apparatus for identifying a cookie-less user | |
JP2014182437A (ja) | 広告抽出装置、広告抽出方法及び広告抽出プログラム | |
US8756172B1 (en) | Defining a segment based on interaction proneness | |
US20150242885A1 (en) | Invitational content attribution | |
US20140278796A1 (en) | Identifying Target Audience for a Product or Service | |
US20150019324A1 (en) | System and method for centralized advertisements serving and verification | |
US20140280237A1 (en) | Method and system for identifying sets of social look-alike users | |
US9292515B1 (en) | Using follow-on search behavior to measure the effectiveness of online video ads | |
US20160189204A1 (en) | Systems and methods for building keyword searchable audience based on performance ranking | |
JP6511186B1 (ja) | 広告配信システム | |
JP6329015B2 (ja) | 広告配信サーバ | |
US9367583B1 (en) | Systems and methods of generating content performance metrics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180905 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20180905 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20180906 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180830 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181211 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190405 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6511186 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |