JP6511186B1 - 広告配信システム - Google Patents

広告配信システム Download PDF

Info

Publication number
JP6511186B1
JP6511186B1 JP2018156496A JP2018156496A JP6511186B1 JP 6511186 B1 JP6511186 B1 JP 6511186B1 JP 2018156496 A JP2018156496 A JP 2018156496A JP 2018156496 A JP2018156496 A JP 2018156496A JP 6511186 B1 JP6511186 B1 JP 6511186B1
Authority
JP
Japan
Prior art keywords
pattern
attribute
audience
processing unit
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018156496A
Other languages
English (en)
Other versions
JP2020030677A (ja
Inventor
悟 大久保
悟 大久保
Original Assignee
ログリー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ログリー株式会社 filed Critical ログリー株式会社
Priority to JP2018156496A priority Critical patent/JP6511186B1/ja
Application granted granted Critical
Publication of JP6511186B1 publication Critical patent/JP6511186B1/ja
Publication of JP2020030677A publication Critical patent/JP2020030677A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】匿名識別情報を有しないオーディエンスの属性を推定することにより、匿名識別情報を有しないオーディエンスに対して適切な広告を配信することが可能な広告配信システムを提供する。【解決手段】広告配信サーバは、既知オーディエンスのアクセス情報を所定のパターンに分解してから、ナイーブベイズアルゴリズムを用いた学習処理を行う。そして、未知オーディエンスのアクセス情報を所定のパターンに分解してから、ナイーブベイズアルゴリズムを用いた推定処理を行う。【選択図】図1

Description

本発明は、広告配信システムに関する。
より詳細には、インターネットにおけるwebサイトのコンテンツに含まれる広告を、適切なターゲットオーディエンス(target audience:広告が目標とする視聴者)に配信する、広告配信システムに関する。
今日、エンドユーザはインターネットを情報収集閲覧用途に活用している。その用途の殆どが、webブラウザを用いたHTML文書の閲覧である。インターネットが商業用途に利用され始めてから、主たるポータルサイトやブログサイト等では、広告がHTML文書に挿入されている。テレビジョン(以下「テレビ」)の視聴率が低下し、インターネットのトラフィックが倍増している今日において、インターネット上における広告配信技術は、重要性を増している。
テレビ放送は片方向にて情報をブロードキャスト配信する。つまり、テレビ放送におけるコマーシャルは、極めて多くの、不特定多数の視聴者(オーディエンス)に広告を一斉配信する。このため、広告料は高い。
一方、インターネットは基本的に一対一の双方向通信である。つまり、インターネットにおける広告は、あるオーディエンス一人に対し、広告を配信した、という事実を完全に把握可能である。このため、1件当たりの広告配信料を定めることが可能であるため、配信件数を絞れば安価な料金で訴求力の高い広告を配信することができる。
このため、インターネットの広告は、中小企業や個人事業者にも広く利用されている。
なお、本発明に関係すると思われる先行技術文献を、特許文献1及び特許文献2に示す。
特許文献1には、コンテンツに係る属性を評価することができる属性評価装置が開示されている。
特許文献2には、広告主がターゲットオーディエンスを特定し易くするための、オーディエンスを分類する機能を有する、広告配信サーバが開示されている。特に、特許文献2に記載される技術は本発明の基礎となる技術である。
特開2006−202118号公報 特許第6329015号公報
中小企業や個人事業者等の、資力に限りがある事業者の場合、如何に低コストで確実にオーディエンスへ広告を配信するかが肝要である。すなわち、少ない広告資金を効果的に活用するために、自社の商品に興味を持って貰える可能性があるターゲットオーディエンスを特定することが求められる。
これまで、広告配信業者がターゲットオーディエンスを特定する方法は、オーディエンスの過去の購買履歴や商品紹介サイトに対する閲覧履歴に基いていた。しかし、既に商品を購入したオーディエンスが再び同じ商品を購入するとは限らない。このため、オーディエンスが必要としていないと考えているにもかかわらず、オーディエンスがあちこちのサイトを閲覧する度にいつまでも同じ種類の広告が付きまとい、広告が煙たがられる、という逆効果を生じることがしばしば見受けられる。
広告主が真に必要とするターゲットオーディエンスとは、未だ商品を購買していないが購買の可能性があると思われる、「未だ見ぬ顧客」である。この、未だ見ぬ顧客を特定する技術は、未だ確立されているとはいえない。
以上のような状況に鑑みて、発明者らは特許文献2に開示される、広告主がターゲットオーディエンスを特定し易くするための、オーディエンスを分類する機能を有する、広告配信サーバを開発した。
特許文献2に係る広告配信サーバは、オーディエンスが使用する端末で稼働するwebブラウザにおいて、RFC6265(http://tools.ietf.org/html/rfc6265)にて定められる周知のHTTP Cookie(以下「Cookie」と略)の保存を許可している場合に、運用が可能である。広告配信サーバはこのCookieを用いて、オーディエンスを一意に識別し、オーディエンスに種々の属性情報を付与して、オーディエンスに適した広告配信サービスを運用する。属性情報とは、オーディエンスの特徴を表す情報である。例えば、当該オーディエンスの性別、年齢層、都道府県の市郡等のおおよその住所、職種、趣味趣向等である。
広告配信サービスにおけるCookieは、当該オーディエンスの個人情報を詳細に特定することなく、当該オーディエンスの匿名性を担保しつつ、当該オーディエンスが概ねどのような人であるのかを識別する「匿名識別情報」としての役割を担う。
しかし、Cookieはオーディエンスが様々なwebサイトにアクセスした情報を追跡することが可能であるため、個人情報に類する情報の漏洩を嫌うオーディエンス等、広告配信サービスに対してCookieの保存及び運用を許可しない設定を行うオーディエンスが増加してきた。特に、米Apple社がwebブラウザに導入したセキュリティ機能「Intelligent Tracking Prevention:ITP」を導入したことにより、ITPを導入した端末ではCookieによる匿名オーディエンスの追跡(トラッキング)ができない。
このような、Cookieによるオーディエンスの属性の特定が不可能なオーディエンスに対し、従来技術では当該オーディエンスの属性に適した広告を配信することが原理的に不可能である。
本発明は係る状況に鑑みてなされたものであり、匿名識別情報を有しないオーディエンスの属性を推定することにより、匿名識別情報を有しないオーディエンスに対して適切な広告を配信することが可能な広告配信システムを提供することを目的とする。
上記課題を解決するために、本発明の広告配信システムは、アクセス先のホスト及びアクセス日時の時間帯を含むパターン要素群の組み合わせを示す所定のパターンを複数記憶するパターンマスタテーブルと、オーディエンスを一意に識別するオーディエンスIDを有する既知オーディエンスの情報端末によるサーバへの1回のアクセスを示すアクセス情報であって少なくともアクセス先のURL及びアクセス日時を含む既知オーディエンスアクセス情報を分解してパターン要素群に変換し、変換されたパターン要素群と合致するパターンを所定のパターンのうちから取得し、取得したパターンと既知オーディエンスの特徴を表す属性情報とを用いて、パターンと属性情報との対応関係を計数する学習処理を行うベース学習処理部とを具備する。
更に、オーディエンスIDで特定できない未知オーディエンスの情報端末によるサーバへの1回のアクセスを示すアクセス情報であって少なくともアクセス先のURL及びアクセス日時を含む未知オーディエンスアクセス情報を分解してパターン要素群に変換し、変換されたパターン要素群と合致するパターンを所定のパターンのうちから取得し、取得したパターンと対応関係のある属性情報を学習処理の係数の結果に応じて取得することで、未知オーディエンスの属性情報を推定する基本判定処理部と、未知オーディエンスに対し、推定された属性情報に合致する広告を選択して配信する広告配信処理部とを具備する。
本発明により、匿名識別情報を有しないオーディエンスの属性を推定することにより、匿名識別情報を有しないオーディエンスに対して適切な広告を配信することが可能な広告配信システムを提供することができる。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
本発明の実施形態に関わる、広告配信システムの概略図である。 広告配信システムにおける、広告がオーディエンスの情報端末に配信される動作の流れを示すタイムチャートである。 情報端末のハードウェア構成とソフトウェア機能を示すブロック図である。 webサーバ及び広告配信サーバのハードウェア構成と、webサーバのソフトウェア機能を示すブロック図である。 広告配信サーバのソフトウェア機能を示すブロック図である。 広告配信データベースに含まれるテーブルのフィールド構成を示す図である。 パターンテーブルが形成するイメージの一例を示す図である。 広告配信サーバにおける、時間軸上における動作の流れを示す概略図である。 ベース学習処理部の機能ブロック図である。 基本判定処理部の機能ブロック図である。 ブースト学習処理部の機能ブロック図である。 ウェイト最適化処理部の機能ブロック図である。 変形例に係るウェイトテーブルのフィールド構成を示す図である。
本発明は、特許文献2に開示される広告配信サーバが生成する成果を利用する。
特許文献2に記載の技術を用いる広告配信サーバは、webブラウザにおいて広告配信サービスのCookieを許可しているオーディエンスについて、当該オーディエンスの属性情報を特定しており、データベースに記録している。
一方、Cookieを許可していないオーディエンスは、広告配信サーバの立場で見ると、当該オーディエンスの属性情報が全くわからない。このままでは当該オーディエンスに対して適切な広告を配信することができない。
そこで、このようなオーディエンスについては、webブラウザがアクセスしたwebサイトのURL、アクセスした日時、オーディエンスが使用している端末のOS、端末の機種名、webブラウザの種類等のアクセス情報、すなわち、webブラウザがwebサイトにアクセスした際に広告配信サーバが得られるアクセス情報を基に当該オーディエンスの属性情報を推定する。この推定には、機械学習に関するアルゴリズムが使用される。
なお、これ以降、webブラウザが広告配信サービスのCookieを許可しているオーディエンスを、既に属性情報が判明していることから、既知オーディエンスと呼ぶ。逆に、webブラウザが広告配信サービスのCookieを許可していないオーディエンスを、属性情報が未知であることから、未知オーディエンスと呼ぶ。
本発明は、既知オーディエンスから得られるアクセス情報と属性情報から、未知オーディエンスのアクセス情報を手がかりに、未知オーディエンスの属性情報を推定する技術である。
[広告配信システム101の概略]
図1は、本発明の実施形態に関わる、広告配信システムの概略図である。
広告配信システム101には、インターネット102を通じてアクセス可能な複数の広告配信サーバ103を中心に、複数の広告主サイト104、複数のポータルサイト105、そして複数の広告主クライアント106が存在する。複数の広告配信サーバ103は周知のクラウドコンピューティングによるwebサービスを提供する。複数の既知オーディエンス107は、広告主サイト104及び/又はポータルサイト105にアクセスすることで、広告配信サーバ103から広告を受信する。
広告主サイト104、ポータルサイト105、広告配信サーバ103は周知のwebサーバである。webサーバはHTTP又はHTTPSにて所望のコンテンツを提供する。広告主クライアント106は所定のクライアントマシンである。但し、広告主クライアント106は広告配信サーバ103と非対話型通信を行うため、サーバの形態を採っている。
既知オーディエンス107は、ノートパソコン108a、あるいはスマートフォン108b等の情報端末108を用いて、広告主サイト104やポータルサイト105にアクセスし、HTML文書を閲覧する。この閲覧したHTML文書には、広告配信サーバ103から送信された広告が含まれる。
既知オーディエンス107は情報端末108で動作するwebブラウザにおいて、広告配信サーバ103から送信されるCookieの保存と広告配信サーバ103に対するCookieの送信を許可している。このため、広告配信サーバ103は既知オーディエンス107の属性情報を特定することができるので、既知オーディエンス107の属性情報を内部のデータベースに記録している。
そして、広告配信サーバ103はこれら既知の属性情報を基に、既知オーディエンス107の趣味趣向に適した広告の配信を行う。
未知オーディエンス109は、デスクトップパソコン110a、あるいはスマートフォン110b等の情報端末110を用いて、広告主サイト104やポータルサイト105にアクセスし、HTML文書を閲覧する。この閲覧したHTML文書には、広告配信サーバ103から送信された広告が含まれる。
未知オーディエンス109は情報端末110で動作するwebブラウザにおいて、広告配信サーバ103から送信されるCookieの保存と広告配信サーバ103に対するCookieの送信を禁止している。このため、広告配信サーバ103は未知オーディエンス109の属性情報を特定することができないので、後述する未知オーディエンス109に対する属性推定の技術を用いて属性情報を推定する。
そして、広告配信サーバ103はこれら推定した属性情報を基に、未知オーディエンス109の趣味趣向に適した広告の配信を行う。
[広告が配信される動作の流れ]
図2は、広告配信システム101における、広告が既知オーディエンス107の情報端末108のwebブラウザに配信される動作の流れを示すタイムチャートである。
ある既知オーディエンス107が、情報端末108のwebブラウザを用いてポータルサイト105(又は広告主サイト104)にアクセスして、HTML文書を要求する(S201)。ポータルサイト105は情報端末108のwebブラウザの要求に応じて、HTML文書を情報端末108のwebブラウザへ送信する(S202)。情報端末108のwebブラウザはポータルサイト105からHTML文書を受信する(S203)。情報端末108のwebブラウザは受信したHTML文書の内、すぐに表示部305(図3参照)に表示できる内容について、表示処理を行う(S204)。
そして、情報端末108のwebブラウザは、HTML文書に含まれる、二種類のスクリプトを実行する。一つのスクリプトは、情報端末108のwebブラウザがポータルサイト105にアクセスしてHTML文書を要求したことに関するアクセス情報を広告配信サーバ103に送信するスクリプトである。このスクリプトの実行により、情報端末108のwebブラウザは広告配信サーバ103に対し、ステップS201において取得を要求したHTML文書のURLや、後述するオーディエンスIDを含むアクセス情報を送信する(S205)。広告配信サーバ103は、情報端末108のwebブラウザが送信するアクセス情報を受信すると、内部のデータベースに含まれる図示しないログファイルにアクセス情報を記録して、情報端末108のwebブラウザに結果情報(レスポンス)を返送する(S206)。そして、情報端末108のwebブラウザはこの結果情報を受信する(S207)。
もう一つのスクリプトは、広告を要求するスクリプトである。このスクリプトの実行により、情報端末108のwebブラウザは広告配信サーバ103に対し、広告を要求する(S208)。これらのスクリプトはJavaScript(登録商標)やECMAScript(登録商標)等である。
広告配信サーバ103は、情報端末108のwebブラウザが送信する広告の要求を受信すると、内部のデータベースを参照して、当該情報端末108のwebブラウザを使用している既知オーディエンス107に付されている属性情報を取得する。そして、この属性情報に合致する広告主の広告主クライアント106に対し、広告オークションの参加を呼びかける要求を送信し、広告オークションを実行する(S209)。広告オークション実行の要求は、複数の広告主クライアント106に送信される。その中で、所定の条件に合致したと判断した広告主クライアント106が、オークション参加表明を広告配信サーバ103に返信する(S210、S211)。図2中、第一広告主106aと第二広告主106bが、オークション参加表明を広告配信サーバ103に返信したものとする。
広告配信サーバ103は、第一広告主106aが送信したオークション参加表明(S210)を受信する(S212)とともに、第二広告主106bが送信したオークション参加表明(S211)を受信する(S213)。広告配信サーバ103は、所定の時間内に受信した一つ以上のオークション参加表明を受けて、予め内部のデータベースに保持されている、広告主の広告配信条件を参照する。そして、高額な広告料を支払う広告主に対し、広告の配信を決定し、当該広告主のための広告の内容(コンテンツ)を既知オーディエンス107の情報端末108のwebブラウザへ送信する(S214)。こうして、既知オーディエンス107の情報端末108のwebブラウザは広告配信サーバ103から広告の内容を受信して(S215)、これを表示部305に表示する(S216)。
なお、広告が画像データを伴う場合、ステップS215から更に画像データを広告主サイト104から取得する処理が生じる場合がある。
広告のオークションは、ステップS208における情報端末108のwebブラウザから送信される広告要求から、ステップS215における情報端末108のwebブラウザによる広告受信に至るまで、50msec以内で実施することが、広告配信業者の業界内ルールとして定められている。
周知のように、HTTPはHTTPリクエストとHTTPレスポンスの対で一つの通信が完結する、ステートレスなプロトコルである。図2中、ステップS201のHTTPリクエストには、ステップS203のHTTPレスポンスが対応する。ステップS205のHTTPリクエストには、ステップS207のHTTPレスポンスが対応する。ステップS208のHTTPリクエストには、ステップS215のHTTPレスポンスが対応する。
図2中、ステップS205の後にステップS208が実行されているが、これらは順不同である。
広告配信サーバ103はCookieを用いて、既知オーディエンス107を一意に識別する。広告配信サービスにおけるCookieは、既知オーディエンス107の個人情報を詳細に特定することなく、既知オーディエンス107の匿名性を担保しつつ、既知オーディエンス107が概ねどの様な人であるのかを識別する「匿名識別情報」としての役割を担う。
広告主サイト104及びポータルサイト105が情報端末108のwebブラウザの要求に応じて出力するHTML文書には、アクセス情報を取得するためのスクリプトが埋め込まれている。ステップS205に示すように、情報端末108のwebブラウザが初めて広告主サイト104又はポータルサイト105にアクセスして、スクリプトを実行すると、情報端末108のwebブラウザから広告配信サーバ103へアクセス情報が送信される。そして、ステップS206、S207に示すように、広告配信サーバ103は、受信したアクセス情報にCookieが含まれていないことを検出すると、Cookieを生成して、結果情報と共に情報端末108のwebブラウザに送信し、情報端末108のwebブラウザは受信したCookieを記憶する。これ以降、情報端末108のwebブラウザは広告配信サーバ103にアクセス情報を送信する際、このCookieも広告配信サーバ103に送信する。
Cookieには、既知オーディエンス107が使用する情報端末108のwebブラウザを一意に識別するためのオーディエンスIDが含まれている。このオーディエンスIDは、あくまでも特定の既知オーディエンス107が使用する情報端末108のwebブラウザがどの広告主サイト104やポータルサイト105にアクセスしたのかを検出するためだけに設けられるものであり、既知オーディエンス107の個人情報を特定する要素は一切含まれない。仮に、既知オーディエンス107がパソコンとスマートフォンを所持している場合、パソコンとスマートフォンにはそれぞれ異なるオーディエンスIDが付与される。広告配信サーバ103が、それらパソコンとスマートフォンの所有者が同一人物であることを知る術はない。但し、既知オーディエンス107が使用する情報端末108のwebブラウザのアクセス履歴が広告配信サーバ103に蓄積されるので、既知オーディエンス107の嗜好がおおよそ推測可能である。
既に述べたように、情報端末108のwebブラウザが広告配信サーバ103に送信するアクセス情報とは、情報端末108のwebブラウザのCookieに含まれるオーディエンスIDと、ステップS201において情報端末108のwebブラウザが広告主サイト104やポータルサイト105から取得しようとするHTML文書のURLと、情報端末108のwebブラウザのIPアドレス等である。
情報端末108のwebブラウザは、ステップS208において広告配信サーバ103に対し広告を要求する際、Cookieも送信する。したがって、広告配信サーバ103は広告がどのオーディエンスIDから要求されたのかを把握できる。
以上、広告配信システム101が既知オーディエンス107に対して広告配信を行う動作の流れを説明した。広告配信システム101のこの動作の流れは、未知オーディエンス109に対しても同様である。但し、未知オーディエンス109が使用する情報端末110のwebブラウザは、ステップS207で、広告配信サーバ103から送信されるCookieを受信しても、Cookieを記憶しない。したがって、情報端末110のwebブラウザは広告配信サーバ103にアクセス情報を送信する際、Cookieを広告配信サーバ103に送信しないので、広告配信サーバ103は未知オーディエンス109の属性情報をCookieのオーディエンスIDから特定することができない。
そこで、広告配信サーバ103は、ステップS205において情報端末110のwebブラウザから広告配信サーバ103へ送信されるアクセス情報を手がかりに、未知オーディエンス109の属性情報を推定する。
本実施形態の広告配信システム101は、広告配信サーバ103がステップS206において、未知オーディエンス109が使用する情報端末110の属性情報を、未知オーディエンス109のアクセス情報から推定するための技術である。
[情報端末108及び情報端末110のハードウェア構成とソフトウェア機能]
図3Aは、既知オーディエンス107が使用する情報端末108のハードウェア構成を示すブロック図である。
情報端末108は、バス307に接続された、周知のCPU301、ROM302、RAM303、ハードディスク装置やフラッシュメモリ等の不揮発性ストレージ304、表示部305、操作部306を備える。
バス307には更に、インターネット102に接続するためのNIC(Network Information Card)308が接続されている。
なお、図3Aのブロック図は、図1に示されるデスクトップパソコン110a、ノートパソコン108a、そしてスマートフォン108bを包含する上位概念で記載されている。例えばスマートフォン108bの場合、表示部305は液晶ディスプレイであり、操作部306は静電式位置検出装置である。そして、表示部305と操作部306はタッチパネルディスプレイを構成する。また、スマートフォン108bの場合、NIC308はLTE(Long Term Evolution)等の無線通信機能や無線LANインターフェースが該当する。更に、シリアルポートを用いたPPP(Point to Point Protocol)接続も、本明細書におけるNIC308が指し示す概念として含まれる。つまり、図3AにおけるNIC308は、インターネット102に接続するための、広義の物理的及び/又は論理的なインターフェースを指す。
図3Aは、既知オーディエンス107が使用する情報端末108のハードウェア構成を示すブロック図であるが、未知オーディエンス109が使用する情報端末110のハードウェア構成も同じである。
図3Bは、既知オーディエンス107が使用する情報端末108のソフトウェア機能を示すブロック図である。
周知のネットワークOSとwebブラウザプログラムが稼働する情報端末108は、入出力制御部309を有し、入出力制御部309は、ユーザ(既知オーディエンス107)の操作によって操作部306が発する操作情報を受けて、インターネット102上のwebサイトに存在する情報を取得し、取得した情報(HTML文書等)を表示部305に表示する。その際、入出力制御部309は必要に応じてCookie310の読み書きも行う。また、入出力制御部309はHTML文書に含まれるスクリプトを実行し、その実行結果に応じて所定のwebサーバにアクセスする機能も備える。
図3Cは、未知オーディエンス109が使用する情報端末110のソフトウェア機能を示すブロック図である。
未知オーディエンス109が使用する情報端末110のソフトウェア機能は、図3Bに示される、既知オーディエンス107が使用する情報端末108のソフトウェア機能からCookie310が除かれている以外は、等しい機能ブロック構成である。
[webサーバ401のハードウェア構成とソフトウェア機能]
図4Aは、webサーバ401のハードウェア構成を示すブロック図である。なお、広告配信サーバ103のハードウェア構成もwebサーバ401と同じである。
webサーバ401は、バス407に接続された、周知のCPU402、ROM403、RAM404、ハードディスク装置やフラッシュメモリ等の不揮発性ストレージ405、NIC406、リアルタイムクロック(RealTime Clock:以下「RTC」と略)408を備える。なお、情報端末108にあった表示部305及び操作部306は、多くの場合省略されている。
図4Bは、webサーバ401のソフトウェア機能を示すブロック図である。
webサーバプログラム等で構成される入出力制御部409は、情報端末108から情報の取得要求を受信すると、要求に応じて、HTML文書や画像ファイル等の静的コンテンツ410や、cgi(Common Gateway Interface)等で構成される動的コンテンツ生成処理部411の実行結果を情報端末108へ返送する。動的コンテンツ生成処理部411は、入出力制御部409によって実行されると、必要に応じて各種データベース412を参照して、動的コンテンツを作成する。
なお、図4Bの動的コンテンツ生成処理部411による動的コンテンツの生成手段はcgiに限られない。Java(登録商標)アプレット等、様々な動的コンテンツ生成手段を採り得る。
[広告配信サーバ103のソフトウェア機能]
図5は、広告配信サーバ103のソフトウェア機能を示すブロック図である。
広告配信サーバ103は、実際には複数の計算機を有するクラウドコンピューティングで構成されるが、説明の便宜上、単一の計算機に見立てて機能ブロックを説明する。
webサーバプログラム等で構成される入出力制御部501は、既知オーディエンス107が使用する情報端末108から情報の取得要求を受信すると、オーディエンスアクセス情報取得部502を実行する。
オーディエンスアクセス情報取得部502は、アクセス情報を広告配信データベース503内のオーディエンス行動履歴データ504に記録する。
そして、アクセス情報にCookieが含まれていることがわかると、Cookie内のオーディエンスIDで広告配信データベース503内のオーディエンスマスタテーブル505を検索して、既知オーディエンス107の属性情報を特定する。そして、特定した既知オーディエンス107の属性情報を入出力制御部501に引き渡す。入出力制御部501は、既知オーディエンス107の属性情報を広告配信処理部506に引き渡して、広告配信処理部506を実行する。
また、入出力制御部501は、オーディエンスアクセス情報取得部502が取得した既知オーディエンス107のアクセス情報をブースト学習処理部507に引き渡して、ブースト学習処理部507を実行する。
入出力制御部501は、未知オーディエンス109が使用する情報端末110から情報の取得要求を受信すると、要求に応じて、オーディエンスアクセス情報取得部502を実行する。
オーディエンスアクセス情報取得部502は、アクセス情報を広告配信データベース503内のオーディエンス行動履歴データ504に記録する。但し、未知オーディエンス109はCookieが含まれておらず、オーディエンスIDを取得できないので、オーディエンスIDについては空欄(NULL)にするか、あるいは特定不可能であることを示す特別なオーディエンスIDをオーディエンス行動履歴データ504に記録する。そして、アクセス情報にCookieが含まれていないことがわかると、未知オーディエンス109のアクセスである旨を入出力制御部501に報告する。
入出力制御部501は、オーディエンスアクセス情報取得部502の報告に基づき、基本判定処理部508を実行する。基本判定処理部508は、オーディエンスアクセス情報取得部502が取得したアクセス情報に基づき、未知オーディエンス109の属性情報を推定する。そして、推定した未知オーディエンス109の属性情報を入出力制御部501に引き渡す。入出力制御部501は、未知オーディエンス109の属性情報を広告配信処理部506に引き渡して、広告配信処理部506を実行する。
スケジューラ509はRTC408から現在日時情報を取得し、図示しない内部の定められた起動時刻設定に基づいて、クラスタ作成処理部510、ベース学習処理部511、ウェイト最適化処理部512を実行する。
オーディエンスアクセス情報取得部502は、既知オーディエンス107が使用する情報端末108、及び未知オーディエンス109が使用する情報端末110から、アクセス情報を取得する。オーディエンスアクセス情報取得部502が取得したアクセス情報は、オーディエンス行動履歴データ504に記録される。
広告配信処理部506は、既知オーディエンス107に対しては、オーディエンスマスタテーブル505から取得できる既知オーディエンス107の属性情報に基づいて、既知オーディエンス107の属性情報に適した広告配信処理を実行する。未知オーディエンス109に対しては、基本判定処理部508が推定した未知オーディエンス109の属性情報に基づいて、未知オーディエンス109の属性情報に適した広告配信処理を実行する。
基本判定処理部508は、未知オーディエンス109のアクセス情報を手がかりに、機械学習に関するアルゴリズムに基づき、広告配信データベース503内のパターンテーブル513を参照して、未知オーディエンス109の属性情報を推定する。
ブースト学習処理部507は、基本判定処理部508が推定する未知オーディエンス109の属性情報の精度を向上させるために、既知オーディエンス107のアクセス情報を用いて、パターンテーブル513に対して「強化した学習」を実行する。強化した学習の詳細については図11で後述する。
オーディエンスアクセス情報取得部502、広告配信処理部506、基本判定処理部508は、入出力制御部501が、既知オーディエンス107が使用する情報端末108、及び未知オーディエンス109が使用する情報端末110から情報の取得要求を受信したことを受けて、入出力制御部501によって実行される。
オーディエンスアクセス情報取得部502と広告配信処理部506は、既知オーディエンス107が使用する情報端末108に対しては特許文献2に開示される従来技術と同じ動作を行う。すなわち、オーディエンスアクセス情報取得部502と広告配信処理部506は、機能的には特許文献2に開示される従来技術と等しい。しかし、オーディエンスアクセス情報取得部502と広告配信処理部506は、未知オーディエンス109が使用する情報端末110に対しては、基本判定処理部508から得た属性情報に基づいて、既知オーディエンス107が使用する情報端末108に対する動作と同様の動作を行う。
すなわち、基本判定処理部508は、本実施形態において新規に設けられた機能ブロックである。
ブースト学習処理部507は、オーディエンス行動履歴データ504に基づき、強化した学習を実行する。
クラスタ作成処理部510は、オーディエンス行動履歴データ504に基づき、図示しないクラスタ作成用のデータベースを形成し、更新することで、オーディエンスマスタテーブル505に記録されている既知オーディエンス107に属性情報を付与し、あるいは更新する。
ベース学習処理部511は、オーディエンス行動履歴データ504に基づき、パターンテーブル513を作成し、基本的な学習処理を実行する。
ウェイト最適化処理部512は、基本判定処理部508が使用する、広告配信データベース503内のウェイトテーブル514の係数を作成し、あるいは更新する。
ブースト学習処理部507、クラスタ作成処理部510、ベース学習処理部511、ウェイト最適化処理部512は、予め定められた起動時刻設定に基づいて、スケジューラ509によって実行される。
クラスタ作成処理部510は、既知オーディエンス107が使用する情報端末108に対しては特許文献2に開示される従来技術と同じ動作を行う。すなわち、クラスタ作成処理部510は、機能的には特許文献2に開示される従来技術と等しい。
ベース学習処理部511は、パターンテーブル513の作成と更新を行う。なお、図8で詳述するが、ベース学習処理部511が実行されている間は、広告配信サーバ103は広告配信処理等ができない。したがって、図5に開示される広告配信サーバ103は複数台が用意され、それぞれがベース学習処理部511の実行タイミングをずらすことで、広告配信サービスの停止を防ぐように構成される。
ブースト学習処理部507は、ベース学習処理部511では実現し得ない、判定率を向上させるための強化した学習を実行する。なお、図8で詳述するが、ブースト学習処理部507の実行タイミングは、ベース学習処理部511が実行されていない間に、例えば30分毎に実行される。
ウェイト最適化処理部512は、ウェイトテーブル514の作成と更新を行う。
すなわち、ブースト学習処理部507、ベース学習処理部511、及びウェイト最適化処理部512は、本実施形態において新規に設けられた機能ブロックである。
[テーブルのフィールド構成]
図6は、広告配信データベース503に含まれるテーブルのフィールド構成を示す図である。
パターンマスタテーブル517は、パターンIDフィールドと、パターン要素番号フィールドと、パターン要素フィールドを有する。
パターンIDフィールドには、パターンを一意に識別するパターンIDが格納される。
パターン要素番号フィールドには、パターンIDに属する要素を一意に識別する番号(順番)が格納される。
パターン要素フィールドには、パターンの要素を示す情報が格納される。例えば、URLのホスト名、URLのパス名、時間帯(アクセス日時を粗く分化したもの)、端末OS、端末機種名等である。
パターンマスタテーブル517において、一つのパターンIDには複数のパターン要素番号が対応する。すなわち、パターンIDとパターン要素番号は1対多の対応関係を有する。
パターン要素番号とパターン要素は、1対1の対応関係を有する。
パターンとは、既知オーディエンス107が使用する情報端末108、及び未知オーディエンス109が使用する情報端末110から得られるアクセス情報の構成要素を部分的に抜粋し、正規化を施すことによって、アクセス情報を再構築した情報である。
webサイトに公開されているHTML文書の内容が、特定の属性情報に属するオーディエンスの興味の対象となる内容である場合、未知オーディエンス109のアクセス情報が既知オーディエンス107のアクセス情報と類似するのであれば、当該未知オーディエンス109の属性情報は概ね既知オーディエンス107の属性情報に類似する可能性がある。例えば、女性化粧品の企業のwebサイトであれば、アクセスするオーディエンスの殆どは女性であると推測することができる。
しかし、webサイトに公開されているHTML文書の内容が、不特定多数の属性情報に属するオーディエンスの興味の対象となる内容である場合は、未知オーディエンス109の属性情報の推定は難しくなる。
例えば、いわゆるポータルサイトやニュースサイトであれば、アクセスするオーディエンスは老若男女が入り混じり、未知オーディエンス109の属性情報を容易に推測することができないと思われる。
発明者らは、アクセス情報を(1)URLのホスト名(Fully Qualified Domain Name:FQDN)、(2)URLのパス名、(3)アクセス日時の粒度を粗くした時間帯、(4)情報端末のOS、(5)情報端末の機種名、(6)情報端末のwebブラウザ名、等に分化して、正規化処理を施した。そして、FQDNを筆頭に、パス名、時間帯、OS等を部分的に組み合わせることで、様々なアクセス情報の部分的情報を作成した。
例えば、平日の午前中に、前述のポータルサイトやニュースサイトにアクセスする人達は、児童、学生、会社員の可能性は低く、専業主婦や無職の老人である可能性が高いものと考えられる。つまり、webサイトの内容自体に偏りがなくとも、その他の情報と組み合わせることで、オーディエンスの属性情報の偏りを特定することが可能になる。
属性マスタテーブル515は、属性IDフィールドと、属性情報フィールドを有する。
属性IDフィールドには、属性情報を一意に識別する属性IDが格納される。
属性情報フィールドには、オーディエンスの属性に関する情報が格納される。例えば、性別、年齢層、居住地、職種、家族構成、趣味趣向等である。
属性マスタテーブル515において、属性IDと属性情報は、1対1の対応関係を有する。
属性グループマスタテーブル516は、属性グループIDフィールドと、属性IDフィールドを有する。
属性グループIDフィールドは、属性グループを一意に識別する属性グループIDが格納される。
属性IDフィールドは、属性マスタテーブル515の同名フィールドと同じである。
一つの属性グループには、複数の属性IDが属する。
例えば、性別という属性グループには、男を示す属性ID、女を示す属性ID、性別不明を示す属性IDが属する。
したがって、属性グループマスタテーブル516において、一つの属性グループIDには複数の属性IDが対応する。すなわち、属性グループIDと属性IDは1対多の対応関係を有する。
パターンテーブル513は、パターンIDフィールドと、属性IDフィールドと、属性計数値フィールドを有する。
パターンIDフィールドは、パターンマスタテーブル517の同名フィールドと同じである。
属性IDフィールドは、属性マスタテーブル515の同名フィールドと同じである。
属性計数値フィールドには、学習処理における当該属性IDのヒット数が格納される。
パターンテーブル513において、一つのパターンIDには複数の属性IDが対応する。すなわち、パターンIDと属性IDは1対多の対応関係を有する。
属性IDと属性計数値は1対1の対応関係を有する。
本実施形態に係る広告配信サーバ103は、周知のナイーブベイズアルゴリズムを利用して、既知オーディエンス107のアクセス情報と属性情報から、未知オーディエンス109の属性情報を推定する。その際、このパターンテーブル513はナイーブベイズアルゴリズムの辞書データとして機能する。
ウェイトテーブル514は、属性IDフィールドと、ウェイト係数フィールドを有する。
属性IDフィールドは、属性マスタテーブル515の同名フィールドと同じである。
ウェイト係数フィールドには、当該属性IDの、パターンテーブル513における属性計数値に乗算するウェイト係数が格納される。
ウェイトテーブル514において、属性IDと属性情報は、1対1の対応関係を有する。
なお、図6には示していないが、ウェイト行列テーブル518は、複数のウェイトテーブル514の集合体である。
オーディエンスマスタテーブル505は、オーディエンスIDフィールドと、属性IDフィールドを有する。
オーディエンスIDフィールドには、オーディエンスを一意に識別するオーディエンスIDが格納される。
属性IDフィールドは、属性マスタテーブル515の同名フィールドと同じである。
オーディエンスマスタテーブル505において、一つのオーディエンスIDには複数の属性IDが対応する。すなわち、オーディエンスIDと属性IDは1対多の対応関係を有する。
オーディエンス行動履歴データ504は、オーディエンスIDフィールドと、行動履歴データフィールドを有する。
オーディエンスIDフィールドは、オーディエンスマスタテーブル505の同名フィールドと同じである。
行動履歴データフィールドには、当該オーディエンスがあるURLのweb文書にアクセスした際のアクセス情報、いわゆるアクセスログが格納される。
[パターンテーブル513のイメージ]
図7は、パターンテーブル513が形成するイメージの一例を示す図である。
前述の様に、パターンとは、オーディエンスが使用する情報端末から得られるアクセス情報の構成要素を部分的に抜粋し、正規化を施した情報である。言い換えれば、パターンとは、所定の正規化を施したアクセス情報の、構成要素の部分集合(サブセット)である。
アクセス情報は、既知オーディエンス107が使用する情報端末108、及び未知オーディエンス109が使用する情報端末110の何れからも等しく取得することができる。したがって、あるパターンについて既知オーディエンス107の属性情報に偏りが見受けられる場合、同じパターンの未知オーディエンス109は同様の属性情報を有する可能性が高い。
図7において、「パターン1」というパターンID(P701)には「属性1」、「属性2」、「属性3」…という、複数の属性IDが属する。これがパターンテーブル513におけるパターンIDフィールドと属性IDフィールドの、1対多の関係である。そして、「属性1」、「属性2」、「属性3」のそれぞれに、属性計数値がある。
「パターン1」(P701)の場合、「属性2」の属性計数値(P702)が他の「属性1」「属性3」と比べて大きい値である。一方、「パターン2」(P703)の場合、「属性1」の属性計数値(P704)が他の「属性2」「属性3」と比べて大きい値である。
例えば、「属性1」と「属性2」が性別を示す属性グループIDに属しており、「属性1」が男性を表す属性であり、「属性2」が女性を表す属性である場合、「パターン1」(P701)に合致する未知オーディエンス109は女性の可能性が高く、「パターン2」(P703)に合致する未知オーディエンス109は男性の可能性が高いと推測できる。
ナイーブベイズの場合、基本判定処理部508において、属性計数値を自然対数に変換したスコア値を得る。その後、同一の属性グループIDに属する属性IDのスコア同士を相対比較することで、ある属性グループIDにおける属性IDの偏りを推定する。但し、本発明の実施形態に係る広告配信サーバ103における推定処理は、属性計数値に、ウェイトテーブル514のウェイト係数を乗算した値について、対数変換を行う。
[動作の流れ]
図8は、広告配信サーバ103における、時間軸上における動作の流れを示す概略図である。
先ず、時点T801において、スケジューラ509はベース学習処理部511を実行する。これによりベース学習処理P802が開始され、ベース学習処理部511はパターンテーブル513の作成と更新を行う。そして、ベース学習処理部511によるベース学習処理P802が終了する時点T803迄は、スケジューラ509はウェイト最適化処理部512の実行を禁止すると共に、スケジューラ509は入出力制御部501にベース学習処理部511が実行中である旨を通知する。入出力制御部501はこの通知を受けて、オーディエンスアクセス情報取得部502、広告配信処理部506、基本判定処理部508、ブースト学習処理部507の実行を禁止する。
時点T803においてベース学習処理部511がパターンテーブル513の作成及び更新処理を終了したら、スケジューラ509はウェイト最適化処理部512を実行する。これによりウェイト最適化処理P804が開始され、ウェイト最適化部はウェイトテーブル514の作成と更新を行う。そして、ベース学習処理部511によるベース学習処理P802が終了した時点T803以降は、スケジューラ509は入出力制御部501にベース学習処理部511が実行されていない旨を通知する。入出力制御部501はこの通知を受けて、オーディエンスアクセス情報取得部502、広告配信処理部506、基本判定処理部508、ブースト学習処理部507の実行を開始する。これにより、ブースト学習処理部507によるブースト学習処理P805、基本判定処理部508による基本判定処理P806が開始される。
[ベース学習処理部511]
図9は、ベース学習処理部511の機能ブロック図である。
オーディエンスIDを有する既知オーディエンス107のアクセス情報である既知オーディエンスアクセス情報901は、パターン分解処理部902に入力される。
パターン分解処理部902は、行動履歴データを分解した内容でパターンマスタテーブル517を検索することで、該当するパターンIDを複数個、引き出す。
また、パターン分解処理部902は、オーディエンスマスタテーブル505をオーディエンスIDで検索することで、該当する属性IDを複数個、引き出す。
すると、パターンIDと属性IDの組よりなるパターンリスト903ができる。これはパターンテーブル513から属性計数値フィールドを抜いたものと等しい。
パターンリスト903は、ベース加算処理部904に入力される。
ベース加算処理部904は、パターンリスト903のレコード(パターンIDと属性IDの組)に合致する(検索にヒットする)パターンテーブル513のレコードの属性計数値フィールドを1だけインクリメントする。ベース加算処理部904の処理は、ナイーブベイズにおける学習処理そのものである。
[基本判定処理部508]
図10は、基本判定処理部508の機能ブロック図である。
オーディエンスIDのない未知オーディエンス109のアクセス情報である未知オーディエンスアクセス情報1001は、パターン分解処理部902に入力される。
パターン分解処理部902は、未知オーディエンスアクセス情報1001を分解した内容でパターンマスタテーブル517を検索することで、該当するパターンIDを複数個、引き出す。すると、パターンIDを複数個有するパターンIDリスト1003ができる。
なお、このパターン分解処理部902は、オーディエンスIDを有する既知オーディエンスアクセス情報901を与えると、オーディエンスIDでオーディエンスマスタテーブル505を検索することで、パターンリスト903を出力するが、オーディエンスIDのない未知オーディエンスアクセス情報1001を与えると、オーディエンスマスタテーブル505を検索できないので、パターンIDのみのパターンIDリスト1003を出力する。
パターンIDリスト1003は推定処理部1004に入力される。
推定処理部1004は、パターンIDでパターンテーブル513を検索し、ヒットした
レコードの属性ID毎の属性計数値に、ウェイトテーブル514を参照して導き出したウェイト係数を乗算する。そして得られた値を対数変換した後、属性グループマスタテーブル516を参照して、同一属性グループ内の他の属性IDの値と相対比較して、1個の属性グループ内における最も合致する可能性が高い属性IDを特定する。
特定した属性IDは複数個出力され、属性IDリスト1005となる。
この属性IDリスト1005は広告配信処理部506に送信され、未知オーディエンス109に対し、最も相応しいweb広告が割り当てられる。
[ブースト学習処理部507]
図11は、ブースト学習処理部507の機能ブロック図である。
オーディエンスIDを有する既知オーディエンス107のアクセス情報である既知オーディエンスアクセス情報901は、パターン分解処理部902に入力される。
パターン分解処理部902は、行動履歴データを分解した内容でパターンマスタテーブル517を検索することで、該当するパターンIDを複数個、引き出す。
また、パターン分解処理部902は、オーディエンスマスタテーブル505をオーディエンスIDで検索することで、該当する属性IDを複数個、引き出す。
すると、パターンIDと属性IDの組よりなるパターンリスト903ができる。
ここまではベース学習処理部511と全く同じである。
パターンリスト903のパターンIDは、推定処理部1004に入力される。
推定処理部1004は、パターンIDでパターンテーブル513を検索し、ヒットしたレコードの属性ID毎の属性計数値に、ウェイトテーブル514を参照したウェイト係数を乗算する。そして得られた値を対数変換した後、属性グループマスタテーブル516を参照して、同一属性グループ内の他の属性IDの値と相対比較して、属性グループ内における最も可能性が高い属性IDを特定する。
ここで、推定処理部1004が出力する、ある属性グループIDにおいて特定した属性IDを、推定属性ID1101と呼ぶ。
一方、パターンリスト903にはパターンIDに対して属性IDが組となっている。つまり、パターンリスト903のレコードはパターンIDに対する正解の属性IDで構成されている。
推定処理部1004が出力する推定属性ID1101と、パターンリスト903から得られる正解属性ID1102は、ブースト加算処理部1103に入力される。
ブースト加算処理部1103は、推定属性ID1101と正解属性ID1102とを比較して、一致しているか否かを判定する。
推定属性ID1101と正解属性ID1102が一致していれば、パターンリスト903のレコード(パターンIDと属性IDの組)に合致する(検索にヒットする)パターンテーブル513のレコードの属性計数値フィールドを、ベース学習処理部511の時より大きい加算値でインクリメントする。この加算値とは、例えば3である。
推定属性ID1101と正解属性ID1102が一致していなければ、パターンリスト903のレコード(パターンIDと属性IDの組)に合致する(検索にヒットする)パターンテーブル513のレコードの属性計数値フィールドを、推定属性ID1101と正解属性ID1102が一致している時の加算値よりも更に大きなブースト加算値(例えば「7」等)にて大幅にインクリメントする。
ブースト加算処理部1103の処理は、ナイーブベイズにおける学習処理(図9のベース加算処理部904の処理)と比べると、インクリメントする値が異なっている。
[ウェイト最適化処理部512]
図12は、ウェイト最適化処理部512の機能ブロック図である。
オーディエンスIDを有する既知のオーディエンス行動履歴データ504は、パターン分解処理部902に入力される。
パターン分解処理部902は、行動履歴データを分解した内容でパターンマスタテーブル517を検索することで、該当するパターンIDを複数個、引き出す。
また、パターン分解処理部902は、オーディエンスマスタテーブル505をオーディエンスIDで検索することで、該当する属性IDを複数個、引き出す。
すると、パターンIDと属性IDの組よりなるパターンリスト903ができる。
ここまではベース学習処理部511と全く同じである。
パターンリスト903のパターンIDは、推定処理部1004に入力される。
推定処理部1004は、パターンIDでパターンテーブル513を検索し、ヒットしたレコードの属性ID毎の属性計数値に、ウェイトテーブル514を参照したウェイト係数を乗算する。そして得られた値を対数変換した後、属性グループマスタテーブル516を参照して、同一属性グループ内の他の属性IDの値と相対比較して、属性グループ内における最も可能性が高い属性IDを特定する。
一方、パターンリスト903にはパターンIDに対して属性IDが組となっている。つまり、パターンリスト903のレコードはパターンIDに対する正解属性ID1102で構成されている。
ここまではブースト学習処理部507と同じである。
推定処理部1004が出力する推定属性ID1101と、 パターンリスト903から得られる正解属性ID1102は、ウェイト行列最適化処理部1201に入力される。
ウェイト行列最適化処理部1201は、推定属性ID1101と正解属性ID1102とを比較して、一致しているか否かを判定する。
この判定処理を、大量のパターンリスト903において繰り返して、ウェイトテーブル514の正解率を算出する。
更に、ウェイトテーブル514の要素の値を変化させて上記の演算処理を繰り返して、ウェイト行列テーブル518に含まれる、異なるウェイトテーブル514における正解率を得る。
ウェイト行列最適化処理部1201は最終的に、最も正解率が高い最適なウェイトテーブル514を特定する。
ウェイト行列最適化処理部1201における、最も正解率が高いウェイトテーブル514を特定する処理には、膨大な計算量が必要になる。この計算処理を低減するため、周知の主成分分析等の次元圧縮処理を応用して、ウェイトテーブル514を特定する計算処理の低減を図っている。
本システムの特徴は、大きく二つある。
一つ目の特徴は、URL、時刻、デバイス等から得られる情報は僅かであるが、そこに高度な統計処理を行うことで、僅かな手がかりからでも高精度な予測が可能な点である。
二つ目の特徴は、学習や判定に使う情報を、URL、時刻、デバイス等の言語に依存しない情報に絞ることで、あらゆる国や、地域、言語で、オーディエンスの属性情報の推定が可能な点である。
出願人が運用している広告配信システムは、オーディエンスIDを有する既知オーディエンス107の属性情報が記憶されているオーディエンスマスタテーブル505を有している。このオーディエンスマスタテーブル505は、オーディエンスの属性情報が確定しているデータである。
そこで、本発明に係る広告配信サーバ103は、既知オーディエンス107のアクセス情報を機械学習に関するアルゴリズムにおける教師データとして利用することで、未知オーディエンス109のアクセス情報から未知オーディエンス109の属性情報を推定する。
しかしながら、インターネット上の情報やトレンドは極めて早く変動する。多くの大衆の興味を惹き付ける何らかの新しい情報が出現すると、途端に当該情報が掲載されているwebサイトやwebページにアクセスが集中し、SNS(Social Networking Service)サイト等で当該情報に関する投稿が急増する。すると、学習に要する時間が長く、また学習に必要な教師データを大量に要するような機械学習に関するアルゴリズムでは、リアルタイムに変動するインターネットのトレンドに追従することが困難である。
発明者らは、当初、ナイーブベイズのみで広告配信システムを試作してみたところ、未知オーディエンス109の属性情報に対する実用的な判定率を得ることができなかった。
そこで発明者らは、システム運用中における学習処理に工夫を施すことを試みた。
先ず、システム運用中における学習処理を、通常のナイーブベイズアルゴリズムにおける学習処理よりも、属性計数値のインクリメント処理における加算値を増大させた。更に、誤った推定結果を得た場合には、属性計数値のインクリメント処理における加算値を更に増大させる、ブースト加算値を設定した。これが図11にて説明した、ブースト学習処理部507におけるブースト学習処理である。
更に、ナイーブベイズの推定処理にも工夫を加えた。通常であれば、属性計数値に対数変換を行って、相対比較を行うが、本発明の実施形態に係る広告配信サーバ103は、判定処理の際に、属性計数値にウェイト係数を乗算してから対数変換する処理を行う。このウェイト係数は膨大な計算処理によって最も正解率が高いウェイトテーブル514で構成される。これが図12にて説明した、ウェイト最適化処理部512におけるウェイト最適化処理である。
以上説明した実施形態には、以下に記す変形例が可能である。
(1)ウェイトテーブル514は、URLのホスト名(FQDN)毎に異なるウェイトテーブル514を使用すると、未知オーディエンス109の属性情報の推定精度を向上させることが可能になる。
図13は、ウェイトテーブル514の変形例のフィールド構成を示す図である。
ウェイトテーブル1301は、属性IDフィールドと、パターンIDフィールドと、パターン要素番号フィールドと、ウェイト係数フィールドを有する。
属性IDフィールドは、属性マスタテーブル515の同名フィールドと同じである。
パターンIDフィールド及びパターン要素番号フィールドは、パターンマスタテーブル517の同名フィールドと同じである。
ウェイト係数フィールドには、当該属性IDの属性計数値に乗算するウェイト係数が格納される。
但し、パターンIDとパターン要素番号で特定される、URLのホスト名に合致する場合においてのみ、このウェイト係数が適用される。
ウェイトテーブル1301において、属性ID、パターンID及びパターン要素番号の組と属性情報は、1対1の対応関係を有する。
このウェイトテーブル1301は、図12のウェイト最適化処理において、パターンID及びパターン要素番号で特定されるURLのホスト名においてのみ実行される。
(2)図11にて説明したブースト学習処理、すなわち、正解の場合は通常の学習処理よりインクリメント数を増加させた加算値を与え、不正解の場合は加算値から更にインクリメント数を増加させたブースト加算値を与える、という技術思想は、ナイーブベイズ以外の、他の機械学習に関するアルゴリズムにも適用可能である。すなわち、正解ならA回学習させ、不正解ならB回学習させる。このとき、AとBは自然数であり、かつ、1<A<Bである。
(3)上記の実施形態では、情報端末はwebブラウザを実行するものと仮定して説明したが、広告を表示可能なソフトウェアであれば、必ずしもwebブラウザでなくてもよい。例えば、近年普及しているスマートフォンのアプリケーションプログラムには、広告を表示するものが多く存在する。特に、インターネットオークション等のアプリケーションプログラムは、オーディエンスの行動履歴に偏りを見出すことが可能である。このような、webブラウザでないソフトウェアであっても、広告配信サーバ103は対応が可能である。
本実施形態では、広告配信システム101を開示した。
広告配信サーバ103は、既知オーディエンス107のアクセス情報を所定のパターンに分解してから、ナイーブベイズアルゴリズムを用いた学習処理を行う。そして、未知オーディエンス109のアクセス情報を所定のパターンに分解してから、ナイーブベイズアルゴリズムを用いた推定処理を行う。
更に広告配信サーバ103は、推定処理の精度を向上させるため、通常運用時における学習処理において、正解の場合は通常の学習処理よりインクリメント数を増加させた加算値を与え、不正解の場合は加算値から更にインクリメント数を増加させたブースト加算値を与える、というブースト学習処理を実行する。
更に広告配信サーバ103は、推定処理の精度を向上させるため、判定処理の際に、属性計数値にウェイト係数を乗算してから対数変換する処理を行う。このウェイト係数は膨大な計算処理によって最も正解率が高いウェイトテーブル514で構成される。
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、特許請求の範囲に記載した本発明の要旨を逸脱しない限りにおいて、他の変形例、応用例を含む。
101…広告配信システム、102…インターネット、103…広告配信サーバ、104…広告主サイト、105…ポータルサイト、106…広告主クライアント、106a…第一広告主、106b…第二広告主、107…既知オーディエンス、108…情報端末、108a…ノートパソコン、108b…スマートフォン、109…未知オーディエンス、110…情報端末、110a…デスクトップパソコン、110b…スマートフォン、301…CPU、302…ROM、303…RAM、304…不揮発性ストレージ、305…表示部、306…操作部、307…バス、308…NIC、309…入出力制御部、310…Cookie、401…webサーバ、402…CPU、403…ROM、404…RAM、405…不揮発性ストレージ、406…NIC、407…バス、408…RTC、409…入出力制御部、410…静的コンテンツ、411…動的コンテンツ生成処理部、412…データベース、501…入出力制御部、502…オーディエンスアクセス情報取得部、503…広告配信データベース、504…オーディエンス行動履歴データ、505…オーディエンスマスタテーブル、506…広告配信処理部、507…ブースト学習処理部、508…基本判定処理部、509…スケジューラ、510…クラスタ作成処理部、511…ベース学習処理部、512…ウェイト最適化処理部、513…パターンテーブル、514…ウェイトテーブル、515…属性マスタテーブル、516…属性グループマスタテーブル、517…パターンマスタテーブル、518…ウェイト行列テーブル、901…既知オーディエンスアクセス情報、902…パターン分解処理部、903…パターンリスト、904…ベース加算処理部、1001…未知オーディエンスアクセス情報、1003…パターンIDリスト、1004…推定処理部、1005…属性IDリスト、1103…ブースト加算処理部、1201…ウェイト行列最適化処理部、1301…ウェイトテーブル、1101…推定属性ID、1102…正解属性ID

Claims (6)

  1. アクセス先のホスト及びアクセス日時の時間帯を含むパターン要素群の組み合わせを示す所定のパターンを複数記憶するパターンマスタテーブルと、
    オーディエンスを一意に識別するオーディエンスIDを有する既知オーディエンスの情報端末によるサーバへの1回のアクセスを示すアクセス情報であって少なくともアクセス先のURL及びアクセス日時を含む既知オーディエンスアクセス情報を分解して前記パターン要素群に変換し、変換された前記パターン要素群と合致するパターンを前記所定のパターンのうちから取得し、取得したパターンと前記既知オーディエンスの特徴を表す属性情報を用いて、パターンと属性情報との対応関係を計数する学習処理を行うベース学習処理部と、
    前記オーディエンスIDで特定できない未知オーディエンスの情報端末によるサーバへの1回のアクセスを示すアクセス情報であって少なくともアクセス先のURL及びアクセス日時を含む未知オーディエンスアクセス情報を分解して前記パターン要素群に変換し、変換された前記パターン要素群と合致するパターンを前記所定のパターンのうちから取得し、取得したパターンと対応関係のある属性情報を前記学習処理の係数の結果に応じて取得することで、前記未知オーディエンスの属性情報を推定する基本判定処理部と、
    前記未知オーディエンスに対し、前記推定された属性情報に合致する広告を選択して配信する広告配信処理部と
    を具備する広告配信システム。
  2. 更に、
    前記パターンを一意に識別するパターンIDが格納されるパターンIDフィールドと、前記属性情報を一意に識別する属性IDが格納される属性IDフィールドと、学習処理における当該属性IDのヒット数が格納される属性計数値フィールドとを有するパターンテーブルと
    を備え、
    前記ベース学習処理部は、
    前記オーディエンスIDを含む前記既知オーディエンスアクセス情報が入力される時には前記既知オーディエンスアクセス情報を所定のパターンに再構築して前記パターンIDを得ると共に前記オーディエンスIDに合致する属性IDを得て、前記パターンIDと前記属性IDの組よりなるパターンリストを出力するパターン分解処理部と、
    前記パターンリストに基づいて、前記パターンテーブルの前記属性計数値フィールドの値をインクリメントするベース加算処理部と
    を具備し、
    前記基本判定処理部は、
    前記オーディエンスIDを含まない前記未知オーディエンスアクセス情報が入力される時には前記未知オーディエンスアクセス情報を所定のパターンに再構築して前記パターンIDを得て、前記パターンIDを複数有するパターンIDリストを出力する前記パターン分解処理部と、
    前記パターン分解処理部が出力する前記パターンIDリストから得られる前記パターンIDに基づいて前記パターンテーブルを検索して、前記ヒット数に基づいて最も合致する可能性が高い属性IDの集合体である属性IDリストを出力する推定処理部と
    を具備する、請求項1に記載の広告配信システム。
  3. 更にブースト学習処理部を具備し、
    前記ブースト学習処理部は、前記パターン分解処理部と、前記推定処理部とを含み、
    前記パターンリストから得られる前記パターンIDを前記推定処理部に入力して推定属性IDを得て、前記パターンリストの前記パターンIDと組になっている正解属性IDと前記推定属性IDと一致しているか否かを判定し、一致していれば、前記パターンテーブルの前記属性計数値フィールドの値を1より大きい所定の加算数でインクリメントし、一致していなければ、前記パターンテーブルの前記属性計数値フィールドの値を前記加算数より更に大きい所定のブースト加算数でインクリメントする、ブースト加算処理部と
    を具備する、請求項に記載の広告配信システム。
  4. 更に、
    前記属性IDフィールドと、前記パターンテーブルにおける前記属性IDに属する前記属性計数値フィールドの値に乗算するウェイト係数が格納されるウェイト係数フィールドとを有するウェイトテーブルと
    を具備し、
    前記推定処理部は、前記パターン分解処理部が出力する前記パターンIDリストから得られる前記パターンIDに基づいて前記パターンテーブルを検索して、得られた属性IDに対応する属性計数値に前記ウェイトテーブルのウェイト係数を乗算した後、対数変換を行い、単一の属性グループに属する複数の前記属性ID同士で前記対数変換を行った値の相対比較を行う、
    請求項に記載の広告配信システム。
  5. 更にウェイト最適化処理部を具備し、
    前記ウェイト最適化処理部は、前記パターン分解処理部と、前記推定処理部とを含み、 前記パターンリストから得られる前記パターンIDを前記推定処理部に入力して推定属性IDを得て、前記パターンリストの前記パターンIDと組になっている正解属性IDと前記推定属性IDと一致しているか否かを判定し、複数の前記ウェイトテーブルにおける正解属性IDと前記推定属性IDの正解率を算出して、最も正解率が高いウェイトテーブルを特定するウェイト行列最適化処理部と
    を具備する、請求項に記載の広告配信システム。
  6. 前記ウェイトテーブルは更に、前記パターンIDフィールドと、前記パターンIDに属する要素を一意に識別する番号であるパターン要素番号が格納されるパターン要素番号フィールドとを有し、
    前記推定処理部は、前記パターン分解処理部が出力する前記パターンIDリストから得られる前記パターンIDに基づいて前記パターンテーブルを検索して得られた前記属性ID、前記パターンID及び前記アクセス情報におけるURLのホスト名を指し示す前記パターン要素番号の組に対応する属性計数値に前記ウェイトテーブルのウェイト係数を乗算した後、対数変換を行い、単一の属性グループに属する複数の前記属性ID同士で前記対数変換を行った値の相対比較を行う、
    請求項に記載の広告配信システム。
JP2018156496A 2018-08-23 2018-08-23 広告配信システム Active JP6511186B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018156496A JP6511186B1 (ja) 2018-08-23 2018-08-23 広告配信システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018156496A JP6511186B1 (ja) 2018-08-23 2018-08-23 広告配信システム

Publications (2)

Publication Number Publication Date
JP6511186B1 true JP6511186B1 (ja) 2019-05-15
JP2020030677A JP2020030677A (ja) 2020-02-27

Family

ID=66530675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018156496A Active JP6511186B1 (ja) 2018-08-23 2018-08-23 広告配信システム

Country Status (1)

Country Link
JP (1) JP6511186B1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7560510B2 (ja) 2022-05-18 2024-10-02 Lineヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7162522B2 (en) * 2001-11-02 2007-01-09 Xerox Corporation User profile classification by web usage analysis
JP2006053616A (ja) * 2004-08-09 2006-02-23 Kddi Corp サーバ装置、webサイト推奨方法およびプログラム
JP5034279B2 (ja) * 2006-03-15 2012-09-26 富士通株式会社 属性推定プログラムおよび属性情報提供システム
JP4808207B2 (ja) * 2007-12-11 2011-11-02 ヤフー株式会社 広告配信装置、広告配信方法、広告配信プログラム及び広告入札方法
JP4962970B2 (ja) * 2008-05-20 2012-06-27 ヤフー株式会社 プロフィールを利用した商品情報提供サーバ、システム及び方法
JP4948573B2 (ja) * 2009-07-14 2012-06-06 ヤフー株式会社 広告課金装置及び方法
JP2012048360A (ja) * 2010-08-25 2012-03-08 Sony Corp Id価値評価装置、id価値評価システム、及びid価値評価方法

Also Published As

Publication number Publication date
JP2020030677A (ja) 2020-02-27

Similar Documents

Publication Publication Date Title
US10134058B2 (en) Methods and apparatus for identifying unique users for on-line advertising
US20220358541A1 (en) Systems and methods for cross-browser advertising id synchronization
US9710555B2 (en) User profile stitching
CN109636488B (zh) 广告投放方法及装置
JP5928920B2 (ja) お勧めデータの決定
JP5055133B2 (ja) クロスネットワークのユーザの行動データを公開するための方法及びデバイス
US8639575B2 (en) Audience segment estimation
US10552505B2 (en) Method and system for generating a user-personalization interest parameter for identifying personalized targeted content item
US20100211464A1 (en) Targeted Online Advertising
US20110015992A1 (en) Estimating statistics for online advertising campaigns
US20090037421A1 (en) Traffic Predictor for Network-Accessible Information Modules
US20090287645A1 (en) Search results with most clicked next objects
US20150213484A1 (en) System and method for tracking related events
US20160148255A1 (en) Methods and apparatus for identifying a cookie-less user
JP2014182437A (ja) 広告抽出装置、広告抽出方法及び広告抽出プログラム
US8756172B1 (en) Defining a segment based on interaction proneness
US20150242885A1 (en) Invitational content attribution
US20140278796A1 (en) Identifying Target Audience for a Product or Service
US20150019324A1 (en) System and method for centralized advertisements serving and verification
US20140280237A1 (en) Method and system for identifying sets of social look-alike users
US9292515B1 (en) Using follow-on search behavior to measure the effectiveness of online video ads
US20160189204A1 (en) Systems and methods for building keyword searchable audience based on performance ranking
JP6511186B1 (ja) 広告配信システム
JP6329015B2 (ja) 広告配信サーバ
US9367583B1 (en) Systems and methods of generating content performance metrics

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180905

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20180905

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20180906

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180830

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190405

R150 Certificate of patent or registration of utility model

Ref document number: 6511186

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250