JP6329015B2 - 広告配信サーバ - Google Patents

広告配信サーバ Download PDF

Info

Publication number
JP6329015B2
JP6329015B2 JP2014127363A JP2014127363A JP6329015B2 JP 6329015 B2 JP6329015 B2 JP 6329015B2 JP 2014127363 A JP2014127363 A JP 2014127363A JP 2014127363 A JP2014127363 A JP 2014127363A JP 6329015 B2 JP6329015 B2 JP 6329015B2
Authority
JP
Japan
Prior art keywords
audience
segment
url
cluster
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014127363A
Other languages
English (en)
Other versions
JP2016006606A (ja
Inventor
浩和 吉永
浩和 吉永
毅昭 井口
毅昭 井口
Original Assignee
ログリー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ログリー株式会社 filed Critical ログリー株式会社
Priority to JP2014127363A priority Critical patent/JP6329015B2/ja
Publication of JP2016006606A publication Critical patent/JP2016006606A/ja
Application granted granted Critical
Publication of JP6329015B2 publication Critical patent/JP6329015B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明は、広告配信サーバに関する。
より詳細には、インターネットにおけるwebサイトのコンテンツに含まれるバナー広告を、適切なターゲットオーディエンス(target audience:広告が目標とする視聴者)に配信するための、広告配信サーバに関する。
今日、エンドユーザはインターネットを情報収集閲覧用途に活用している。その用途の殆どが、webブラウザを用いたHTML文書の閲覧である。インターネットが商業用途に利用され始めてから、主たるポータルサイトやブログサイト等では、バナー広告がHTML文書に挿入されている。テレビジョン(以下「テレビ」)の視聴率が低下し、インターネットのトラフィックが倍増している今日において、インターネット上における広告配信技術は、重要性を増している。
テレビ放送は片方向にて情報をブロードキャスト配信する。つまり、テレビ放送におけるコマーシャルは、極めて多くの、不特定多数の視聴者(オーディエンス)に広告を一斉配信する。このため、広告料は高い。
一方、インターネットは基本的に一対一の双方向通信である。つまり、インターネットにおけるバナー広告は、あるオーディエンス一人に対し、広告を配信した、という事実を完全に把握可能である。このため、1件当たりの広告配信料を定めることが可能であるため、配信件数を絞れば安価な料金で広告を配信できる。
このため、インターネットのバナー広告は、中小企業や個人事業者にも広く利用されている。
なお、本願発明に関係すると思われる先行技術文献を、特許文献1に示す。特許文献1には、コンテンツに係る属性を評価することができる属性評価装置が開示されている。
特開2006−202118号公報
中小企業や個人事業者等の、資力に限りがある事業者の場合、如何に低コストで確実にオーディエンスへ広告を配信するかが肝要である。すなわち、少ない広告資金を効果的に活用するために、自社の商品に興味を持って貰える可能性があるターゲットオーディエンスを特定することが求められる。
これまで、広告配信業者がターゲットオーディエンスを特定する方法は、オーディエンスの過去の購買履歴や商品紹介サイトに対する閲覧履歴に基いていた。しかし、既に商品を購入したオーディエンスが再び同じ商品を購入するとは限らない。このため、オーディエンスが必要としていないと考えているにもかかわらず、オーディエンスがあちこちのサイトを閲覧する度にいつまでも同じ種類のバナー広告が付きまとい、バナー広告が煙たがられる、という逆効果を生じることがしばしば見受けられる。
広告主が真に必要とするターゲットオーディエンスとは、未だ商品を購買していないが購買の可能性があると思われる、「未だ見ぬ顧客」である。この、未だ見ぬ顧客を特定する技術は、未だ確立されているとはいえない。
本発明は係る状況に鑑みてなされたものであり、広告主がターゲットオーディエンスを特定し易くするための、オーディエンスを分類する機能を有する、広告配信サーバを提供することを目的とする。
上記課題を解決するために、本発明の広告配信サーバは、オーディエンスを一意に識別するオーディエンスIDが格納されるオーディエンスIDフィールドと、オーディエンスが所定のwebサーバにアクセスした文書のURLが格納されるURLフィールドとを有するログテーブルと、URLが格納されるURLフィールドと、URLに存在する文書に付されている、広告主の種別を示すセグメントIDが格納されるセグメントIDフィールドとを有するURLセグメントIDテーブルとを具備する。
また、本発明の広告配信サーバは、ログテーブルのURLフィールドからURLを取得して、URLにアクセスして文書を取得する非対話型webクライアントと、URLセグメントIDテーブルにて紐付けられるセグメントID毎に、文書からキーワードを抜粋し、ログテーブルにて紐付けられるオーディエンスIDについて、キーワードを共通するクラスタに分類するデータマイニングエンジンと、データマイニングエンジンが生成したクラスタに基いて、広告の配信を判定する広告配信判定部を具備する。
更に本発明の広告配信サーバはデータマイニングエンジンが生成したクラスタに基づいて、広告主が使用する広告主端末にクラスタの階層構造に基づくインテントレポートを提供するクラスタ作成部とを具備する。
本発明により、広告主がターゲットオーディエンスを特定し易くするための、オーディエンスを分類する機能を有する、広告配信サーバを提供することができる。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
本発明の実施形態に関わる、広告配信システムの概略図である。 広告配信システムにおける、バナー広告がオーディエンスの情報端末に配信される動作の流れを示すタイムチャートである。 情報端末のハードウェア構成とソフトウェア機能を示すブロック図である。 webサーバ及び広告配信サーバのハードウェア構成と、ソフトウェア機能を示すブロック図である。 広告配信サーバがオーディエンスを分類する動作の流れを示すフローチャートである。 広告配信サーバがオーディエンスを分類する動作を行う際に用いる、又は生成するデータベースのデータ構造を示す図(その1)である。 広告配信サーバがオーディエンスを分類する動作を行う際に用いる、又は生成するデータベースのデータ構造を示す図(その2)である。 広告配信サーバがオーディエンスを分類する動作を行う際に用いる、又は生成するデータベースのデータ構造を示す図(その3)である。 広告配信サーバが広告主の端末に提供する、インテントレポート画面の例である。
[広告配信システム101の概略]
図1は、本発明の実施形態に関わる、広告配信システムの概略図である。
広告配信システム101には、インターネット102を通じてアクセス可能な広告配信サーバ103を中心に、複数の広告主サイト104、複数のポータルサイト105、そして複数の広告主クライアント106が存在する。複数のオーディエンス107は、広告主サイト104及び/又はポータルサイト105にアクセスすることで、広告配信サーバ103からバナー広告を受信する。
広告主サイト104、ポータルサイト105、広告配信サーバ103は周知のwebサーバである。webサーバはHTTP又はHTTPSにて所望のコンテンツを提供する。広告主クライアント106は所定のクライアントマシンである。但し、広告主クライアント106は広告配信サーバ103と非対話型通信を行うため、サーバの形態を採っている。
オーディエンス107は、デスクトップパソコン108a、ノートパソコン108b、あるいはスマートフォン108c等の情報端末108を用いて、広告主サイト104やポータルサイト105にアクセスし、HTML文書を閲覧する。この閲覧したHTML文書には、広告配信サーバ103から送信されたバナー広告が含まれる。
また、広告主109は広告主端末110を用いて広告配信サーバ103にアクセスし、図9にて後述するインテントレポート画面901を広告主端末110に表示させて、どのオーディエンスのクラスタに広告を配信するかを決定する操作を行う。
[広告が配信される動作の流れ]
図2は、広告配信システム101における、バナー広告がオーディエンス107の情報端末108に配信される動作の流れを示すタイムチャートである。
あるオーディエンス107が、情報端末108を用いてポータルサイト105(又は広告主サイト104)にアクセスして、HTML文書を要求する(S201)。ポータルサイト105は情報端末108の要求に応じて、HTML文書を情報端末108へ送信する(S202)。情報端末108はポータルサイト105からHTML文書を受信する(S203)。情報端末108は受信したHTML文書の内、すぐに表示部305(図3参照)に表示できる内容について、表示処理を行う(S204)。
そして情報端末108は、HTML文書に含まれる、二種類のスクリプトを実行する。一つのスクリプトは、情報端末108がポータルサイト105にアクセスしてHTML文書を要求したことに関するアクセス情報を広告配信サーバ103に送信するスクリプトである。このスクリプトの実行により、情報端末108は広告配信サーバ103に対し、ステップS201において取得を要求したHTML文書のURLや、後述するオーディエンスIDを含むアクセス情報を送信する(S205)。広告配信サーバ103は、情報端末108が送信するアクセス情報を受信すると、内部のデータベースに含まれる図示しないログファイルにアクセス情報を記録して、情報端末108に結果情報(レスポンス)を返送する(S206)。そして、情報端末108はこの結果情報を受信する(S207)。
もう一つのスクリプトは、バナー広告を要求するスクリプトである。このスクリプトの実行により、情報端末108は広告配信サーバ103に対し、バナー広告を要求する(S208)。これらのスクリプトはJavaScript(登録商標)等である。
広告配信サーバ103は、情報端末108が送信するバナー広告の要求を受信すると、内部のデータベースを参照して、当該情報端末108を使用しているオーディエンス107に付されている属性情報を取得する。そして、この属性情報に合致する広告主の広告主クライアント106に対し、広告オークションの参加を呼びかける要求を送信し、広告オークションを実行する(S209)。広告オークション実行の要求は、複数の広告主クライアント106に送信される。その中で、所定の条件に合致したと判断した広告主クライアント106が、オークション参加表明を広告配信サーバ103に返信する(S210、S211)。図2中、第一広告主106aと第二広告主106bが、オークション参加表明を広告配信サーバ103に返信したものとする。
広告配信サーバ103は、第一広告主106aが送信したオークション参加表明(S210)を受信する(S212)とともに、第二広告主106bが送信したオークション参加表明(S211)を受信する(S213)。広告配信サーバ103は、所定の時間内に受信した一つ以上のオークション参加表明を受けて、予め内部のデータベースに保持されている、広告主の広告配信条件を参照する。そして、高額な広告料を支払う広告主に対し、広告の配信を決定し、当該広告主のためのバナー広告の内容(コンテンツ)をオーディエンス107の情報端末108へ送信する(S214)。こうして、オーディエンス107の情報端末108は広告配信サーバ103からバナー広告の内容を受信して(S215)、これを表示部305に表示する(S216)。
なお、バナー広告が画像データを伴う場合、ステップS215から更に画像データを広告主サイト104から取得する処理が生じる場合がある。
バナー広告のオークションは、ステップS208における情報端末108から送信されるバナー広告要求から、ステップS215における情報端末108によるバナー広告受信に至るまで、50msec以内で実施することが、バナー広告配信業者の業界内ルールとして定められている。
周知のように、HTTPはHTTPリクエストとHTTPレスポンスの対で一つの通信が完結する、ステートレスなプロトコルである。図2中、ステップS201のHTTPリクエストには、ステップS203のHTTPレスポンスが対応する。ステップS205のHTTPリクエストには、ステップS207のHTTPレスポンスが対応する。ステップS208のHTTPリクエストには、ステップS215のHTTPレスポンスが対応する。
図2中、ステップS205の後にステップS208が実行されているが、これらは順不同である。
広告配信サーバ103は、RFC6265(http://tools.ietf.org/html/rfc6265)にて定められる周知のHTTP Cookie(以下「Cookie」と略)を用いて、オーディエンス107を一意に識別する。
広告主サイト104及びポータルサイト105が情報端末108の要求に応じて出力するHTML文書には、アクセス情報を取得するためのスクリプトが埋め込まれている。情報端末108が初めて広告主サイト104又はポータルサイト105にアクセスして、スクリプトを実行すると、情報端末108から広告配信サーバ103へアクセス情報が送信される(S205)。広告配信サーバ103は、受信したアクセス情報(S206)にCookieが含まれていないことを検出すると、Cookieを生成して、結果情報と共に情報端末108に送信する(S206)。情報端末108はCookieを受信する(S207)と、Cookieを記憶する。これ以降、情報端末108は広告配信サーバ103にアクセス情報を送信する際、このCookieも広告配信サーバ103に送信する。
Cookieには、オーディエンス107が使用する情報端末108を一意に識別するためのオーディエンスIDが含まれている。このオーディエンスIDは、あくまでも特定のオーディエンス107が使用する情報端末108がどの広告主サイト104やポータルサイト105にアクセスしたのかを検出するためだけに設けられるものであり、オーディエンス107の個人情報を特定する要素は一切含まれない。仮に、オーディエンス107がパソコンとスマートフォンを所持している場合、パソコンとスマートフォンにはそれぞれ異なるオーディエンスIDが付与される。広告配信サーバ103が、それらパソコンとスマートフォンの所有者が同一人物であることを知る術はない。但し、オーディエンス107が使用する情報端末108のアクセス履歴が広告配信サーバ103に蓄積されるので、オーディエンス107の嗜好がおおよそ推測可能である。
情報端末108が広告配信サーバ103に送信するアクセス情報とは、情報端末108のCookieに含まれるオーディエンスIDと、ステップS201において情報端末108が広告主サイト104やポータルサイト105から取得しようとするHTML文書のURLと、情報端末108のIPアドレス等である。
情報端末108は、ステップS208において広告配信サーバ103に対しバナー広告を要求する際、Cookieも送信する。したがって、広告配信サーバ103はバナー広告がどのオーディエンスIDから要求されたのかを把握できる。
本実施形態の広告配信システム101は、広告配信サーバ103がステップS209において、オーディエンス107が使用する情報端末108をオーディエンスIDにて特定した後、オーディエンス107の嗜好から適切な広告主クライアント106へ広告オークションを通知する際、オーディエンス107の嗜好を従来より適切に判断するための技術である。
[情報端末108のハードウェア構成とソフトウェア機能]
図3Aは、情報端末108のハードウェア構成を示すブロック図である。
情報端末108は、バス307に接続された、周知のCPU301、ROM302、RAM303、ハードディスク装置やフラッシュメモリ等の不揮発性ストレージ304、表示部305、操作部306を備える。
バス307には更に、インターネット102に接続するためのNIC(Network Information Card)308が接続されている。
なお、図3Aのブロック図は、図1に示されるデスクトップパソコン108a、ノートパソコン108b、そしてスマートフォン108cを包含する上位概念で記載されている。例えばスマートフォン108cの場合、表示部305は液晶ディスプレイであり、操作部306は静電式位置検出装置である。そして、表示部305と操作部306はタッチパネルディスプレイを構成する。また、スマートフォン108cの場合、NIC308はLTE(Long Term Evolution)等の無線通信機能や無線LANインターフェースが該当する。更に、シリアルポートを用いたPPP(Point to Point Protocol)接続も、本明細書におけるNIC308が指し示す概念として含まれる。つまり、図3AにおけるNIC308は、インターネット102に接続するための、広義の物理的及び/又は論理的なインターフェースを指す。
図3Bは、情報端末108のソフトウェア機能を示すブロック図である。
周知のネットワークOSとwebブラウザプログラムが稼働する情報端末108は、ユーザ(オーディエンス107)の操作によって操作部306が発する操作情報を受けて、インターネット102上のwebサイトに存在する情報を取得し、取得した情報(HTML文書等)を表示部305に表示する、入出力制御部309を有する。その際、入出力制御部309は必要に応じてCookie310の読み書きを行う。また、入出力制御部309はHTML文書に含まれるスクリプトを実行し、その実行結果に応じて所定のwebサーバにアクセスする機能も備える。
[webサーバ及び広告配信サーバ103のハードウェア構成とソフトウェア機能]
図4Aは、webサーバ401のハードウェア構成を示すブロック図である。なお、広告配信サーバ103のハードウェア構成もwebサーバ401と同じである。
webサーバ401は、バス407に接続された、周知のCPU402、ROM403、RAM404、ハードディスク装置やフラッシュメモリ等の不揮発性ストレージ405、NIC406を備える。なお、情報端末108にあった表示部305及び操作部306は、多くの場合省略されている。
図4Bは、webサーバ401のソフトウェア機能を示すブロック図である。
webサーバプログラム408は、情報端末108から情報の取得要求を受信すると、要求に応じて、HTML文書や画像ファイル等の静的コンテンツ409や、動的コンテンツとしてのcgi(Common Gateway Interface)410の実行結果を情報端末108へ返送する。cgi410は、webサーバプログラム408によって実行されると、必要に応じて各種データベース411を参照して、動的コンテンツを作成する。
なお、図4Bでは動的コンテンツの生成手段をcgi410と記載したが、動的コンテンツの生成手段はcgi410に限られない。Java(登録商標)アプレット等、様々な動的コンテンツ生成手段を採り得る。
図4Cは、広告配信サーバ103のソフトウェア機能を示すブロック図である。
広告配信サーバ103とwebサーバ401との相違点は、広告配信サーバ103には、webサーバ401の構成の他に、クラスタ作成部415と、広告オークション処理部416が設けられている点である。クラスタ作成部415は、cgi412が参照する第一データベース413の他に、cgi412が直接参照しない第二データベース414と、この第二データベース414を参照して、オーディエンスIDにクラスタIDを付与した情報を第一データベース413に生成する。クラスタIDについては図5以降にて詳述する。
cgi412は、情報端末108のアクセス情報送信(図2のステップS205)に伴い、オーディエンス107のオーディエンスID、オーディエンス107がアクセスしたHTML文書のURL等の情報を取得して、第一データベース413にアクセス履歴情報を記憶する。
また、cgi412は、情報端末108から送信される広告の要求(図2のステップS208)に対し、広告コンテンツを返信する(図2のステップS214)機能を有する。すなわち、cgi412は広告の配信を判定する広告配信判定部としての機能を有する。
更に、cgi412は、広告主109が広告主端末110を用いて後述するインテントレポート画面901の要求を受けて、インテントレポート画面901を返信する。
クラスタ作成部415は、情報端末108の要求とは無関係に、周知のスケジューラや管理者の指示によって起動され、図5以降に後述する処理を実行して、第一データベース413に所定の情報を生成する。管理者の指示とは、管理者が図示しない端末を使用して広告配信サーバ103にアクセスするか、あるいは広告配信サーバ103に備わっている表示部305及び操作部306を使用して、広告配信サーバ103を操作することを意味する。
広告オークション処理部416は、webサーバプログラム408が情報端末108から広告の要求(図2のステップS208)を受信すると、これを受けて広告オークションのために必要な通信処理と、第一データベース413を参照して配信する広告を決定する処理(図2のステップS209、S212、S213及びS214)を遂行する。
[広告配信サーバ103の、クラスタ作成動作の流れ]
図5は、広告配信サーバ103がオーディエンス107を分類する動作の流れを示すフローチャートである。
図6、図7及び図8は、広告配信サーバ103がオーディエンス107を分類する動作を行う際に用いる、又は生成するデータベースのデータ構造を示す図である。
先ず、図5と図6を参照して、フローチャートを説明する。
処理を開始すると(S501)、広告配信サーバ103のクラスタ作成部415は、オーディエンス107のアクセス履歴情報が格納されている図示しないログファイルから、所定期間内のアクセス履歴情報を取り出す(S502)。所定期間は、例えば現時点から直近一ヶ月の期間等である。この、ステップS502において生成したデータをログテーブル601とする。
図6に示すログテーブル601は、日時フィールド、オーディエンスIDフィールド、URLフィールドを含む。URLとは周知のUniform Resource Locatorである。実際のログテーブル601は、この他にIPアドレス等の情報が存在するが、それらの詳細は割愛する。
ログテーブル601は、オーディエンスIDフィールドに記されているオーディエンス107が、日時フィールドに記されている日時に、URLフィールドに記されているURLのHTML文書にアクセスした事実がレコード毎に記録されている。
次に、クラスタ作成部415はログテーブル601のURLフィールドを抜粋し、重複を除去して、巡回URLリストを作成する(S503)。そして、クラスタ作成部415は巡回URLリストに含まれるURLのwebサイトにアクセスし、HTML文書を取得する(S504)。この時、クラスタ作成部415は非対話型webクライアント417として機能する。クラスタ作成部415が取得したHTML文書は第二データベース414に蓄積される。
第二データベース414には、予めURLセグメントIDテーブル602が設けられている。
URLセグメントIDテーブル602は、URLフィールドと、セグメントIDフィールドよりなる。
URLフィールドには、広告主サイト104に存在するHTML文書のURLが格納される。
セグメントIDフィールドには、HTML文書のURLに付されるセグメントIDが格納される。
すなわち、広告主サイト104のHTML文書には、セグメントIDが紐付けられている。
なお、図6中、セグメントIDフィールドには「甲野不動産」、「乙野食品」、「丙野ゲーム」と、広告主の企業名が記されているが、実際にはこれら企業名に紐付けられる、企業名を一意に識別するIDが格納される。
図5のフローチャートは、セグメントIDにて分類されるオーディエンス107を、更に細分化する処理を示している。この細分化処理は、クラスタリングともいう。
一方、ポータルサイト105のHTML文書には、セグメントIDは紐付けられていない場合が多い。例えば、ニュースサイトやSNSサイトが提供するコンテンツは、特定の広告主と関係ない場合が多い。
非対話型webクライアント417は、巡回URLリストのURLが指し示すHTML文書が広告主サイト104のコンテンツなのか、それともポータルサイト105のコンテンツなのかを区別せずに、巡回及びHTML文書の取得(crawling:クローリング)を行う。
なお、URLセグメントIDテーブル602は、予め第二データベース414に登録しておく他、広告主サイト104のHTML文書に、スクリプトと共にセグメントIDを直接埋め込んでおき、ステップS504の際、取得したHTML文書からセグメントIDを読み出すという方法もある。
クラスタ作成部415は、ステップS504にて様々なwebサイトから取得したHTML文書に形態素解析を行い、主要なキーワードを抽出する(S505)。この時点で、第二データベース414にはURLキーワードテーブル603が作成される。
URLキーワードテーブル603は、URLフィールドと、キーワードフィールドよりなる。
URLフィールドは、URLセグメントIDテーブル602の同名フィールドと同じである。
キーワードフィールドには、ステップS505にてURLフィールドのURLに存在するHTML文書から抽出したキーワードが格納される。勿論、一つのHTML文書には複数のキーワードが含まれるので、URLキーワードテーブル603は一対多の関係である。
ステップS505の時点で、URLキーワードテーブル603によってHTML文書のURLとキーワードが紐付けられた。一方、ログテーブル601にはオーディエンスIDとURLが紐付いている。したがって、オーディエンスIDとキーワードを紐付けることが可能になる。
クラスタ作成部415は、ログテーブル601からオーディエンスIDに紐付いているURLを抽出し、URLキーワードテーブル603からそれらURLに紐付いているキーワードを抽出して、第二データベース414にオーディエンスIDキーワードテーブル604を作成する(S506)。その際、クラスタ作成部415は重複するキーワードについて、スコアを付与する。例えば、オーディエンスID「AAAAAAAA」がアクセスした複数のHTML文書から、8つのHTML文書に「マンション」というキーワードが重複して出現した場合、この「マンション」というキーワードに対し、「8」というスコアを付与する。すなわち、スコアはキーワードの重複数であり、キーワード出現頻度でもある。
一つのオーディエンスIDには複数のキーワードが含まれるので、オーディエンスIDキーワードテーブル604は一対多の関係である。
予め第二データベース414に設けられているか、又はステップS504において第二データベース414に作成されるURLセグメントIDテーブル602には、URLにセグメントIDが紐付いている。一方、ログテーブル601にはオーディエンスIDとURLが紐付いている。したがって、オーディエンスIDとセグメントIDを紐付けることが可能になる。
クラスタ作成部415は、ログテーブル601からオーディエンスIDに紐付いているURLを抽出し、URLセグメントIDテーブル602からそれらURLに紐付いているセグメントIDを抽出して、第二データベース414にオーディエンスIDセグメントIDテーブル605を作成する。なお、ステップS506とは異なり、セグメントIDの重複はスコアにしない。
一つのオーディエンスIDには複数のセグメントIDが含まれ得るので、オーディエンスIDセグメントIDテーブル605は一対多の関係である。
そしてクラスタ作成部415は、オーディエンスIDセグメントIDテーブル605とオーディエンスIDキーワードテーブル604を合体させることで、オーディエンスIDに対するセグメントIDとキーワードの関係を示す、オーディエンスデータ606を作成する(S507)。
なお、オーディエンス107が情報端末108を用いて広告主サイト104にアクセスした際、セグメントIDをどのように紐付けるのかを、広告主109が広告主端末110を用いてカスタマイズ可能にしてもよい。例えば、ワイルドカードによる前方一致、複数のURLのAND/OR/NOT条件による設定、訪問頻度ないし訪問間隔による設定等、細かな指定を可能にするとよい。
次に、図5と図7を参照して、フローチャートの説明を続ける。
クラスタ作成部415は、オーディエンスIDセグメントIDテーブル605又はオーディエンスデータ606に基いて、セグメントIDに対するオーディエンスIDのリストである、セグメントIDオーディエンスIDテーブル707を第二データベース414に作成する(S508)。
一つのセグメントIDには複数のオーディエンスIDが含まれるので、セグメントIDオーディエンスIDテーブル707は一対多の関係である。
ステップS508の時点で、セグメントIDオーディエンスIDテーブル707によって、セグメントIDに対して複数のオーディエンスIDが紐付けられた。一方、ステップS506の時点で、オーディエンスIDキーワードテーブル604によって、オーディエンスIDに対して複数のキーワードが紐付けられている。したがって、セグメントIDとキーワードを紐付けることが可能になる。
クラスタ作成部415は、セグメントIDオーディエンスIDテーブル707とオーディエンスIDキーワードテーブル604を参照して、セグメントIDに紐付いているオーディエンスIDに紐付いているキーワードを抽出して、セグメントIDキーワードテーブル708を第二データベース414に作成する(S509)。その際、クラスタ作成部415は重複するキーワードについて、スコアを累積加算すると共に、重複数、すなわち当該キーワードに属するオーディエンスIDの合計も計数して、記憶する。
図7中、セグメントIDキーワードテーブル708は、セグメントIDフィールド、キーワードフィールド、スコアフィールド、そして人数フィールドがある。スコアフィールドはスコアの累積加算値であり、人数フィールドはオーディエンスIDの合計である。
例えば、セグメントID「甲野不動産」に属する「マンション」というキーワードについて、オーディエンスID「AAAAAAAA」のスコアは「8」であったとする。また、オーディエンスID「CCCCCCCC」のスコアは「7」であったとする。以下同様に、セグメントID「甲野不動産」に属する全てのオーディエンスIDについて、「マンション」というキーワードを含むオーディエンスIDにおけるスコアを全て抜き出し、それらスコアを全て合算する。すると、あるキーワードが属するセグメントIDにおける、当該キーワードの重要度が、スコアという数値として現れることとなる。
あるセグメントIDに属するキーワードは多岐に渡る。しかし、その中で当該セグメントIDに特有のキーワードはそれほど多くはない。また、異なるセグメントID同士でも同様に現れる、セグメントIDに特徴的でないキーワードも存在する。セグメントIDで括られるオーディエンス107を細分化するに当たり、それら細分化において重要となる、特徴的なキーワードを特定する処理が必要になる。
ステップS509にて、全てのセグメントIDについてセグメントIDキーワードテーブル708ができたら、クラスタ作成部415は、それら全てのセグメントIDキーワードテーブル708を参照して、キーワードの特徴度算出処理を実施する(S510)。
キーワードの特徴度算出処理とは、具体的には以下(1)〜(3)を行う処理をいう。
(1)先ず、クラスタ作成部415はあるセグメントIDに属するキーワード毎に、下記の式により出現頻度を算出する。
出現頻度=特定セグメントIDにおける、特定キーワードを有するオーディエンス数÷特定セグメントIDに属する全オーディエンス数
つまり、あるセグメントIDに属するオーディエンスにおける、キーワードが現れる頻度である。出現頻度が高ければ高いほど、当該キーワードは特徴度が高くなる。
(2)次に、クラスタ作成部415はあるセグメントIDに属するキーワード毎に、下記の式により希少度を算出する。
希少度=全オーディエンス数÷特定キーワードを有するオーディエンス数
つまり、全てのオーディエンスにおける、キーワードが現れる頻度の逆数である。希少度が高ければ高いほど、当該キーワードは特徴度が高くなる。
(3)出現頻度と希少度を算出した後、それらを等しい最大値(例えば「1」)に正規化して乗算したものを特徴度とする。
しかし、注意すべき点は、この処理は特定のキーワードを全てのセグメントIDにおいて特徴的とみなすことを意味しない。仮に、セグメントIDが携帯電話メーカーや携帯電話キャリアのものである場合、キーワード「スマートフォン」の出現頻度が全体の出現頻度と比べて突出して多くなり、この場合、キーワード「スマートフォン」はそのセグメントIDにおいて特徴的であるキーワードとなる。
こうして、ステップS510まで処理を行うことで、クラスタリングに必要なキーワードの選定処理が完了した。次に、クラスタリング処理を行う。
クラスタ作成部415は、セグメントIDオーディエンスIDテーブル707、セグメントIDキーワードテーブル708、オーディエンスIDキーワードテーブル604を参照して、あるセグメントID毎に、そのセグメントに属するキーワードおよびオーディエンスIDを抽出して、オーディエンスIDキーワード行列709を作成する。オーディエンスIDキーワード行列709は、行および列にオーディエンスIDとキーワードを用い、成分としてはオーディエンスから見たキーワードのスコアとなる。セグメントIDキーワード行列709は、一見するとオーディエンスIDキーワードテーブル604と類似するが、オーディエンスIDキーワードテーブル604にはセグメントIDの区別がない点が、オーディエンスIDキーワード行列709とは異なる。
次に、クラスタ作成部415は、オーディエンスIDキーワード行列709の成分であるスコアを正規化した上で、公知のコサイン類似度などの手法を用いてキーワード間の距離を算出し、キーワード距離行列710を作成する(S511)。キーワード距離行列710は、行および列にキーワードを用いた対称行列であり、成分としてはキーワード同士の距離となる。このキーワード距離行列710も、オーディエンスIDキーワード行列709と同様、セグメントID毎に作成する。
最後に、データマイニングエンジン418は、キーワード距離行列710を用い、公知のウォード法等の階層的クラスタリングを実施する(S512)。
キーワードの組み合わせに応じて、クラスタの関係は階層的になる。例えば、キーワード「マンション」と「間取り」の組み合わせよりなるクラスタは、キーワード「マンション」のクラスタの部分集合なので、下位に属するクラスタである。
本実施形態におけるクラスタについて、説明する。
ステップS512においてクラスタ作成部415が作成するクラスタとは、あるセグメントIDにおいて特徴的なキーワードのうち、よく同時に興味を持たれているものの集合体である。
一方、クラスタを構成するキーワードは、クラスタを導いたセグメントIDに限らず広くオーディエンスに見られるものである。よって、このクラスタに含まれるべきオーディエンスは、当該セグメントにかぎらず広く見つけることができ、これにより見込顧客を見つけることができるようになる。
また、一人のオーディエンスは、複数のクラスタに属することがありうる。
次に、図5と図8を参照して、フローチャートの説明を続ける。
クラスタ作成部415のデータマイニングエンジン418によって、あるセグメントIDに特徴的なキーワードをクラスタリング(部分集合化)できた。次に、クラスタ作成部415は各クラスタに一意な識別情報として、クラスタIDを作成し、レコード毎に付与する。こうして、クラスタ作成部415はインテントレポート811を作成する(S513)。図8中、インテントレポート811は、クラスタIDフィールド、セグメントIDフィールド、そしてキーワードフィールドよりなる。すなわち、あるセグメントIDにおける複数のキーワードの組み合わせに対し、一意なクラスタIDを付与して、これをインテントレポート811というテーブルに作成する。
最後に、クラスタ作成部415はインテントレポート811の特徴度と図6のオーディエンスデータ606のキーワードスコアを元に互いの距離を算出し、所定の閾値以上近しい場合、オーディエンスデータに対し、クラスタIDを付与する。こうして、図8に示すように、オーディエンスデータ812にはオーディエンスIDが属するクラスタIDが判明する(S514)。そして、クラスタ作成部415は一連の処理を終了する(S515)。
クラスタ作成部415は、セグメントIDで括られるオーディエンス107の嗜好を、テキストマイニングでクラスタリングする。その際、テキストマイニングの対象となるHTML文書は、オーディエンス107がアクセスした広告主サイト104のものに留まらず、ポータルサイト105のものを含む。テキストマイニングを行うことで、同じセグメントIDのオーディエンス107の中に、嗜好によって異なるクラスタを形成することができる。
[広告配信サーバ103が提供するGUI]
図9は、広告配信サーバ103が広告主端末110に提供する、インテントレポート画面901の例である。
図1で説明したように、広告主109は、広告主端末110を用いて広告配信サーバ103にアクセスする。すると、広告配信サーバ103は、図5に示したフローチャートに従ってクラスタ作成部415が第一データベース413に作成したオーディエンスデータ812、インテントレポート811及びクラスタテーブル710に基づき、広告主端末110に対し、図9のインテントレポート画面901を表示する。
インテントレポート画面901中、全てのクラスタは円で表される。そして、クラスタの階層構造に基づいて円の中に円が描画される。最大の大きさの円はセグメントIDを表す。セグメントIDの円に含まれる、その次の大きさの円は、キーワード一つ分のクラスタを表す。キーワード一つ分のクラスタの円に含まれる、その次の大きさの円は、キーワード二つ分のクラスタを表す。インテントレポート画面901は、このような入れ子状態の円を描くことによって、クラスタの階層関係を一目瞭然で示している。図9では図示していないが、特定の円をマウス等のポインティングデバイスでクリックすることで、当該円を拡大表示し、更にその円を表すクラスタに属する下位のクラスタを示す円を表示することができる。このようなユーザインタフェースを実現することで、オーディエンスの嗜好を機械的に分類することができる。
キーワードの特徴度は、円の色分けにて表される。また、クラスタに属するオーディエンスIDの数に基いて、円の大きさが決定される。
広告主109は、広告主端末110を操作して所望のクラスタを示す円をマウス等のポインティングデバイスでクリックして、クラスタの指定を行う。このクラスタの指定操作は、広告主端末110から広告配信サーバ103に送信される。広告配信サーバ103はクラスタの指定操作を受信すると、当該クラスタに属する、広告の配信を指定するオーディエンスIDを特定する。そして、図2の広告オークションにおいて、広告の配信対象とするか否かを決定する。
広告配信サーバ103は、広告主109が指定したクラスタの情報を第一データベース413に記憶しておく。そして、広告配信判定部としてのcgi412は、広告を配信する判定を、広告主109が指定したクラスタの情報に基いて行う。
以上説明した実施形態には、以下に記す応用例が可能である。
(1)図5から図8迄にて説明したクラスタ作成部415の処理内容は、広告主109の属性となるセグメントIDに属するオーディエンス107を細分化する処理であった。あくまでも、広告主109が自社商品あるいはサービスを購入する見込みの高そうな顧客、ターゲットオーディエンスを推測する。
しかし、オーディエンス107には、広告主109のセグメントIDに属さないオーディエンス107も存在する。その中には、ターゲットオーディエンスと嗜好が類似するオーディエンス107のクラスタも存在し得る。
例えば、図6、図7及び図8の例で説明すると、セグメントID「乙野食品」のみに属するオーディエンス107のキーワードに「マンション」及び「分譲」等が存在する場合が考えられる。すなわち、異なるセグメントIDに属するオーディエンスや、どのセグメントIDにも属さないオーディエンスに対しても、クラスタ作成部415がクラスタリング処理を行い、広告主端末110に提示することも可能である。
(2)クラスタ作成部415に、時間軸の要素を付加することも可能である。上述の実施形態では、一例として、オーディエンス107の直近一ヶ月のアクセス履歴をクラスタリングの処理対象とした。この処理対象となるアクセス履歴を一日単位に細かく分けて処理を行い、その都度インテントレポート画面901の基となるオーディエンスデータ812、インテントレポート811及びクラスタテーブル710を保存しておき、曜日毎に異なるインテントレポート画面901を広告主端末110に提示することも可能である。同様に、月単位のオーディエンスデータ812、インテントレポート811及びクラスタテーブル710を保存しておき、月単位のインテントレポート画面901の変化を広告主109に提示することも可能である。
本実施形態では、広告配信システム101を開示した。
広告配信サーバ103のクラスタ作成部415は、セグメントIDで括られるオーディエンス107の嗜好を、テキストマイニングでクラスタリングする。その際、テキストマイニングの対象となるHTML文書は、オーディエンス107がアクセスした広告主サイト104のものに留まらず、ポータルサイト105のものを含む。テキストマイニングを行うことで、同じセグメントIDのオーディエンス107の中に、嗜好によって異なるクラスタを形成することができる。そして、クラスタの状態をインテントレポート画面901というGUIにて広告主109に提示することで、広告主109はターゲットオーディエンスの絞り込みが可能になる。
以上、本発明の実施形態例について説明したが、本発明は上記実施形態例に限定されるものではなく、特許請求の範囲に記載した本発明の要旨を逸脱しない限りにおいて、他の変形例、応用例を含む。
例えば、上記した実施形態例は本発明をわかりやすく説明するために装置及びシステムの構成を詳細且つ具体的に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることは可能であり、更にはある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることも可能である。
また、上記の各構成、機能、処理部等は、それらの一部又は全部を、例えば集積回路で設計するなどによりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行するためのソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の揮発性或は不揮発性のストレージ、または、ICカード、光ディスク等の記録媒体に保持することができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしもすべての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
101…広告配信システム、102…インターネット、103…広告配信サーバ、104…広告主サイト、105…ポータルサイト、106…広告主クライアント、107…オーディエンス、108…情報端末、109…広告主、110…広告主端末、301…CPU、302…ROM、303…RAM、304…不揮発性ストレージ、305…表示部、306…操作部、307…バス、308…NIC、309…入出力制御部、310…Cookie、401…webサーバ、402…CPU、403…ROM、404…RAM、405…不揮発性ストレージ、406…NIC、408…webサーバプログラム、409…静的コンテンツ、410…cgi、411…データベース、412…cgi、413…第一データベース、414…第二データベース、415…クラスタ作成部、416…広告オークション処理部、417…非対話型webクライアント、418…データマイニングエンジン、601…ログテーブル、602…URLセグメントIDテーブル、603…URLキーワードテーブル、604…オーディエンスIDキーワードテーブル、605…オーディエンスIDセグメントIDテーブル、606…オーディエンスデータ、707…セグメントIDオーディエンスIDテーブル、708…セグメントIDキーワードテーブル、709…オーディエンスIDキーワード行列、710…キーワード距離行列、811…インテントレポート、812…オーディエンスデータ、901…インテントレポート画面

Claims (2)

  1. オーディエンスを一意に識別するオーディエンスIDが格納されるオーディエンスIDフィールドと、前記オーディエンスが所定のwebサーバにアクセスした文書のURLが格納されるURLフィールドとを有するログテーブルと、
    前記URLが格納されるURLフィールドと、前記URLに存在する文書に付されてい、広告主の種別を示すセグメントIDが格納されるセグメントIDフィールドとを有するURLセグメントIDテーブルと、
    前記ログテーブルの前記URLフィールドから前記URLを取得して、前記URLにアクセスして文書を取得する非対話型webクライアントと、
    前記URLセグメントIDテーブルにて紐付けられる前記セグメントID毎に、前記文書からキーワードを抜粋し、前記ログテーブルにて紐付けられる前記オーディエンスIDについて、前記キーワードを共通するクラスタに分類するデータマイニングエンジンと、
    前記データマイニングエンジンが生成した前記クラスタに基いて、広告の配信を判定する広告配信判定部と、
    前記データマイニングエンジンが生成した前記クラスタに基づいて、前記広告主が使用する広告主端末にクラスタの階層構造に基づくインテントレポートを提供するクラスタ作成部と
    を具備する広告配信サーバ。
  2. 前記クラスタ作成部は、前記非対話型webクライアントが取得した前記文書から前記キーワードを抜粋し、前記セグメントIDにおける前記キーワード同士の距離を算出して、階層的クラスタリングを実施する、
    請求項1に記載の広告配信サーバ。
JP2014127363A 2014-06-20 2014-06-20 広告配信サーバ Active JP6329015B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014127363A JP6329015B2 (ja) 2014-06-20 2014-06-20 広告配信サーバ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014127363A JP6329015B2 (ja) 2014-06-20 2014-06-20 広告配信サーバ

Publications (2)

Publication Number Publication Date
JP2016006606A JP2016006606A (ja) 2016-01-14
JP6329015B2 true JP6329015B2 (ja) 2018-05-23

Family

ID=55225009

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014127363A Active JP6329015B2 (ja) 2014-06-20 2014-06-20 広告配信サーバ

Country Status (1)

Country Link
JP (1) JP6329015B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107169121B (zh) * 2017-05-27 2020-08-11 北京知道未来信息技术有限公司 一种提取网站url的方法
JP7189789B2 (ja) * 2019-02-05 2022-12-14 Biprogy株式会社 工事関連リスク管理システム、リスク分析用データ生成装置およびリスク情報提供装置
US20230222544A1 (en) * 2020-06-02 2023-07-13 Ntt Docomo, Inc. Analysis device

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5089245B2 (ja) * 2007-05-22 2012-12-05 富士通株式会社 ディレクトリ階層生成プログラム、ディレクトリ階層生成装置およびディレクトリ階層生成方法
JP5156718B2 (ja) * 2009-10-30 2013-03-06 ヤフー株式会社 表示頻度に係る広告制御装置、広告制御方法及び広告制御プログラム
JP5220090B2 (ja) * 2010-12-28 2013-06-26 ヤフー株式会社 広告配信装置、広告配信方法及びプログラム
WO2014049828A1 (ja) * 2012-09-28 2014-04-03 楽天株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Also Published As

Publication number Publication date
JP2016006606A (ja) 2016-01-14

Similar Documents

Publication Publication Date Title
JP5928920B2 (ja) お勧めデータの決定
JP6198972B2 (ja) 広告における広告主識別子の自動検証
US9710555B2 (en) User profile stitching
JP6415458B2 (ja) ペアリングされた識別子に基づいた広告機会のためのユーザ識別
JP5693630B2 (ja) 広告抽出装置、広告抽出方法及び広告抽出プログラム
US8244578B2 (en) Methods and systems to facilitate keyword bid arbitrage with multiple advertisement placement providers
WO2017041359A1 (zh) 信息推送方法、装置、设备及非易失性计算机存储介质
US20120130819A1 (en) method and system for providing customized content using emotional preference
US20100211464A1 (en) Targeted Online Advertising
JP5438087B2 (ja) 広告配信装置
JP5203847B2 (ja) 仮定ターゲティング属性に基づく広告配信方法
CN102037464A (zh) 具有最多点击的下一个对象的搜索结果
US11386180B2 (en) Resource locator remarketing
US20160098765A1 (en) Information Processing System and Information Processing Method
JP2007286832A (ja) 広告配信システムおよび広告配信方法、広告配信プログラム
US9542697B1 (en) Customized landing pages
JP2010113542A (ja) 情報提供システム、情報処理装置及びそのプログラム
JP6329015B2 (ja) 広告配信サーバ
US9508087B1 (en) Identifying similar display items for potential placement of content items therein
JP6397057B2 (ja) 通知生成のシステムおよび方法
CN113905045A (zh) 用于提供第三方内容的系统、方法和介质
US20160189204A1 (en) Systems and methods for building keyword searchable audience based on performance ranking
US20180039643A1 (en) Analysis and management of resources in a network
JP5693629B2 (ja) 広告抽出装置、広告抽出方法及び広告抽出プログラム
JP2017174314A (ja) 広告配信システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180406

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180417

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180419

R150 Certificate of patent or registration of utility model

Ref document number: 6329015

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250