以下に、本願にかかる広告装置、広告抽出方法、広告抽出プログラム、端末装置および端末制御プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ説明する。なお、この実施形態により本願にかかる広告装置、広告抽出方法および広告抽出プログラムが限定されるものではない。また、以下の実施形態において、同一の部位には同一の符号を付し、重複する説明は省略される。
(第1の実施形態)
〔1.広告抽出処理〕
以下では、図1を用いて、第1の実施形態にかかる広告抽出処理の一例について説明する。図1は、第1の実施形態にかかる広告抽出処理の一例を示す図である。図1では、広告装置100によって広告抽出処理が行われる例を示す。
広告装置100は、広告主から広告コンテンツの入稿を受け付ける。そして、広告装置100は、ユーザ端末10からウェブページW1に含む広告コンテンツの取得要求である広告リクエストを受け付けた場合に、広告主から受け付けた広告コンテンツ、すなわち配信候補の広告コンテンツから配信対象の広告コンテンツを抽出する。具体的には、広告装置100は、配信候補の広告コンテンツと、ウェブページW1において広告コンテンツが配置される配置位置周辺に表示されるコンテンツとの関連度を示す指標値を算出する。そして、広告装置100は、算出した指標値に基づいて、配信候補の広告コンテンツから配信対象の広告コンテンツを抽出する。
まず、第1の実施形態にかかるウェブページW1ついて説明する。図1(a)に示すように、実施形態にかかるウェブページW1は、複数のコンテンツが縦方向に並べられたものである。また、これによりユーザ端末10の表示画面に複数のコンテンツが一覧表示される。
このように、一覧表示される複数のコンテンツは、記事コンテンツと広告コンテンツとに大別される。記事コンテンツは、例えば、ニュース記事、芸能情報、ブログ等であり、広告コンテンツ以外のコンテンツを示す。広告コンテンツは、記事コンテンツの間に配置される。そして、このような掲載方式の広告コンテンツは、「インフィード広告」等と呼ばれることがある。
また、図1(a)では、広告コンテンツも含め7個のコンテンツが縦一列に並べられたものをウェブページW1として例示しているが、本実施形態では、ウェブページW1は、21個のコンテンツが縦一列に並べられたものとする。このような場合、ユーザ端末10からの一度のリクエストに応じて、広告コンテンツを含めた21個のコンテンツがウェブページW1として一度にユーザ端末10に配信されるのではなく、所定数(例えば7個)ずつ配信されることにより、最終的に21個のコンテンツを含むウェブページW1が形成される。
例えば、7個のコンテンツが縦一列に並べられたウェブページW1aが初期表示された後、ユーザ操作によりウェブページW1aが上方向に移動させられ、上から7番目のコンテンツ(図1(a)の例では、記事コンテンツF)が表示画面内に含まれた場合に、ユーザ端末10は、再びリクエストを送信することで、7個のコンテンツが縦一列に並べられたウェブページW1bを取得する。そして、ユーザ端末10は、ウェブページW1aの下にウェブページW1bをつなげたものをウェブページW1として表示する。
さて、ここまで、第1の実施形態にかかるウェブページW1について説明してきた。以下では、広告装置100による広告抽出処理について、具体的に説明する。
例えば、ユーザ端末10から、21個のコンテンツを含むウェブページW1のうち、初期表示される部分であるウェブページW1aのリクエストが送信されたとする。これに応じて、コンテンツサーバ30は、図1(b)に示すように、記事コンテンツC2〜C6を配信対象の記事コンテンツとして決定するとともに、記事コンテンツC2〜C6を上から順に並べることを決定したとする。
また、コンテンツサーバ30は、決定した各記事コンテンツのタイトル、説明文等を含むテキストと並び順を対応付けたリスト1を広告装置100に送信する。例えば、コンテンツサーバ30は、リスト1において、記事コンテンツC1については、「ドラマX第10話 視聴率は11.5%」といった説明文のテキスト情報と、並び順「1」とを対応付ける。
ここで、7個のコンテンツを縦一列に並べた場合、中間の位置である配置位置L1に広告コンテンツを挿入することが予め決められているとする。広告装置100は、コンテンツサーバ30からリスト1を受け付けると、配信候補の広告コンテンツと、配置位置L1周辺に表示される記事コンテンツとの関連度を示す指標値を算出する。関連度を示す指標値とは、広告コンテンツと記事コンテンツとの関連性の度合いを数値化したものであり、関連度を示す指標値が高いほど、双方の関連性は高いといえる。以下の実施形態では、関連度を示す指標値を単に「指標値」と表記する場合がある。
また、本実施形態において、「広告コンテンツの配置位置周辺に表示される記事コンテンツ」とは、広告コンテンツの配置位置から上下2個分までの記事コンテンツを示すものとする。図1(b)の例では、配置位置L1周辺に表示される記事コンテンツとは、記事コンテンツC2〜C5を示す。なお、「広告コンテンツの配置位置周辺に表示される記事コンテンツ」は、かかる例に限定されるものではなく、例えば、広告コンテンツの配置位置から上下3個分までの記事コンテンツを示すものであってもよい。また、広告コンテンツの配置位置から上4個分までの記事コンテンツおよび下2個分までの記事コンテンツを示すものであってもよい。
広告装置100は、図1(b)に示すように、配信候補の広告コンテンツとして、広告コンテンツAD1〜AD3を有しているものとする。このため、広告装置100は、リスト1を受け付けると、各配信候補の広告コンテンツと、記事コンテンツC2〜C5それぞれとの類似度を算出し、算出した類似度の和を指標値として算出する。
図1(b)では、広告装置100が、広告コンテンツAD1と、記事コンテンツC2〜C5それぞれとの類似度4つを算出し、算出した4つの類似度の和を指標値「S1」として算出した例を示す。また、同様にして、広告装置100が、広告コンテンツAD2と、記事コンテンツC2〜C5それぞれとの類似度4つを算出し、算出した4つの類似度の和を指標値「S2」として算出した例を示す。さらに、広告装置100が、広告コンテンツAD3について、指標値「S3」を算出した例を示す。
ここで、広告コンテンツAD3は、スポーツに関する内容の広告コンテンツである。また、記事コンテンツC2〜C5の4つのうち、記事コンテンツC3およびC4の2つは、スポーツに関する内容の記事コンテンツである。このため、広告装置100は、広告コンテンツAD3と記事コンテンツC2〜C5との指標値「S3」を最も高く算出する。そして、広告装置100は、最も高い指標値「S3」を算出した広告コンテンツAD3を配信対象の広告コンテンツとして、配信候補の広告コンテンツから抽出する。
また、これにより、記事コンテンツC1、C2、C3、広告コンテンツAD3、C4、C5、C6の順で上から並べられたウェブページW1aがユーザ端末10に配信されることになる。
図1に示したインフィード広告に対し、ユーザが興味を示し、クリックするか否かは、その広告コンテンツ周辺の記事コンテンツに影響される場合がある。例えば、スポーツに関する記事コンテンツが集まっている中にスポーツに関する広告コンテンツが挿入された場合、ユーザの視界にスポーツに関する広告コンテンツが入る前に、スポーツに関する記事コンテンツが入ることにより、スポーツへのユーザの興味が高まる。これにより、ユーザは、かかるスポーツに関する広告コンテンツをクリックし易くなる傾向にある。
一方、例えば、スポーツに関する記事コンテンツが集まっている中にファッションに関する広告コンテンツが挿入された場合、スポーツに対する興味が高められたユーザが、ファッションに関する広告コンテンツをクリックする可能性は低い。
つまり、第1の実施形態にかかる広告装置100は、上記のようなユーザの特性を考慮し、広告コンテンツと、記事コンテンツとの関連度を示す指標値を算出することにより、周りの記事コンテンツとより親和性の高い広告コンテンツを抽出し、抽出した広告コンテンツを表示させることができるため、広告効果を高めることができる。
〔2.システムの構成〕
図2を用いて、第1の実施形態にかかる広告抽出システム1の構成について説明する。図2は、第1の実施形態にかかる広告抽出システム1の構成例を示す図である。図2に示すように、広告抽出システム1は、ユーザ端末10と、最適化サーバ20と、コンテンツサーバ30と、広告装置100とを含む。ユーザ端末10、最適化サーバ20、コンテンツサーバ30、広告装置100は、ネットワークを介して有線または無線により通信可能に接続される。なお、図2に示す広告抽出システム1には、複数台のユーザ端末10や、複数台の最適化サーバ20や、複数台のコンテンツサーバ30や、複数台の広告装置100が含まれてもよい。
ユーザ端末10は、ユーザによって利用される情報処理装置である。例えば、ユーザ端末10は、スマートフォン等の携帯電話機や、タブレット端末や、PDA(Personal Digital Assistant)や、デスクトップ型PC(Personal Computer)や、ノート型PC等である。例えば、ユーザ端末10は、ユーザ操作に従って、図1で示した複数のコンテンツを含む一覧情報であるウェブページW1の取得要求(リクエスト)を最適化サーバ20に送信する。また、ユーザ端末10は、最適化サーバ20から受け付けたウェブページW1を表示画面に表示する。
最適化サーバ20は、ユーザ端末10と直接情報の送受信を行うフロントエンドサーバである。例えば、最適化サーバ20は、ユーザ端末10からウェブページW1のリクエストを受信するすると、ウェブサーバ30に記事コンテンツの取得要求であるコンテンツリクエストを送信し、また、広告装置100に広告コンテンツの取得要求である広告リクエストを送信する。また、最適化サーバ20は、コンテンツサーバ30から受け付けた記事コンテンツと、広告装置100から受け付けた広告コンテンツとを用いてウェブページW1を生成し、生成したウェブページW1をユーザ端末10に配信する。なお、このような最適化サーバ20に対し、コンテンツサーバ30や広告装置100は、バックエンドサーバといえる。
コンテンツサーバ30は、最適化サーバ20に記事コンテンツを配信するサーバ装置である。例えば、コンテンツサーバ30は、最適化サーバ20からコンテンツリクエストを受信すると、配信対象の記事コンテンツと配信対象の記事コンテンツの並び順を決定する。そして、コンテンツサーバ30は、決定した配信対象の記事コンテンツと並び順とを対応付けて、最適化サーバ20に配信する。
広告装置は、広告配信を行うサーバ装置である。広告装置100は、最適化サーバ20からコンテンツリクエストを受信すると、図1で示した広告抽出処理を行うことにより、配信対象の広告コンテンツを広告情報記憶部120から抽出する。そして、広告装置100は、抽出した広告コンテンツを最適化サーバ20に配信する。
〔3.データの流れ〕
次に、図2を用いて、第1の実施形態にかかる広告抽出システム1による広告抽出処理について、データの流れを明確化しつつ説明する。なお、図1と説明が重複する点については、説明を省略する。
まず、ユーザ端末10が、ユーザ操作にしたがって、図1で説明したように、ウェブページW1のうち初期表示される部分であるウェブページW1aのリクエストを最適化サーバ20に送信したとする(ステップS11)。最適化サーバ20は、ウェブページW1aのリクエストを受信すると、ウェブページW1aに含む記事コンテンツを取得するためのコンテンツリクエストをコンテンツサーバ30に送信するとともに、ウェブページW1aに含む広告コンテンツを取得するための広告リクエストを広告装置100に送信する(ステップS12)。
コンテンツサーバ30は、最適化サーバ20からコンテンツリクエストを受信すると、例えば、各種記事コンテンツを格納している自装置内の所定の記憶部を参照し、配信対象の記事コンテンツと配信対象の記事コンテンツの並び順を決定する(ステップS13)。また、コンテンツサーバ30は、決定した情報をリストアップしたリスト1を生成する。図2に示すリスト1は、コンテンツサーバ30が、配信対象の記事コンテンツC1〜C6を、縦一列に上から1番目、2番目・・・7番目といったように並べることを決定したことを示す。また、コンテンツサーバ30が、各配信対象の記事コンテンツにタイトルや説明文などのテキスト情報を対応付けている例を示す。
例えば、図2では、コンテンツサーバ30は、記事コンテンツC1に概念的なテキスト情報「T1」を対応付けているが、実際には、図1(b)で説明したように、「ドラマX第10話 視聴率は11.5%」といった説明文を対応付けている。記事コンテンツC2〜C6のテキスト情報についても、図1(b)で例示した通りである。また、リスト1に示すように、中間の位置である配置位置L1(ここでは、上から4番目)に広告コンテンツを挿入することが予め決められているものとする。
コンテンツサーバ30は、このように生成したリスト1を広告装置100に送信する(ステップS14)。また、コンテンツサーバ30は、リスト1に示すように、配信対象の記事コンテンツのデータと並び順とを対応付けて、最適化サーバ20に送信する(ステップS15)。
広告装置100は、コンテンツサーバ30から受け付けたリスト1を参照し、配信候補の広告コンテンツと、配置位置L1周辺に表示される記事コンテンツ群との関連度を示す指標値を算出し、算出した指標値に基づいて、配信対象の広告コンテンツを抽出する(ステップS16)。かかる広告抽出処理については、図1で説明したので通りであるため説明を省略する。
そして、広告装置100は、抽出した広告コンテンツAD3を最適化サーバ20に送信する(ステップS17)。最適化サーバ20は、コンテンツサーバ30から受け付けた記事コンテンツC1〜C6と、広告装置100から受け付けた広告コンテンツAD3とを用いて、ウェブページW1aを生成する(ステップS18)。そして、最適化サーバ20は、生成したウェブページW1aをユーザ端末10に配信する(ステップS19)。
ここで、ユーザ端末10の表示画面に表示されたウェブページW1aが、ユーザ操作により上方向に移動されて、7番目の記事コンテンツC6が表示画面内に含まれたとする。かかる場合に、ユーザ端末10は、ウェブページW1aの下につなげて表示するウェブページW1bを取得するためのリクエストを最適化サーバ20に送信する(ステップ21)。なお、どのような位置のコンテンツが表示画面内に含まれた場合に、リクエストを送信するかは任意に決定されてよい。
最適化サーバ20は、ウェブページW1bのリクエストを受信すると、ウェブページW1bに含まれる記事コンテンツを取得するためのコンテンツリクエストをコンテンツサーバ30に送信するとともに、ウェブページW1bに含まれる広告コンテンツを取得するための広告リクエストを広告装置100に送信する(ステップS22)。
コンテンツサーバ30は、最適化サーバ20からコンテンツリクエストを受信すると、例えば、各種記事コンテンツを格納している自装置内の所定の記憶部を参照し、配信対象の記事コンテンツと配信対象の記事コンテンツの並び順を決定する(ステップS23)。また、コンテンツサーバ30は、決定した情報をリストアップしたリスト2を生成する。図2に示すリスト2は、コンテンツサーバ30が、配信対象の記事コンテンツC7〜C12を、縦一列に上から8番目、9番目・・・14番目といったように並べることを決定したことを示す。また、コンテンツサーバ30が、各配信対象の記事コンテンツにタイトルや説明文などのテキスト情報を対応付けている例を示す。また、リスト2に示すように、中間の位置である配置位置L2(ここでは、上から11番目)に広告コンテンツを挿入することが予め決められているものとする。
コンテンツサーバ30は、このように生成したリスト2を広告装置100に送信する(ステップS24)。また、コンテンツサーバ30は、リスト2に示すように、配信対象の記事コンテンツと並び順とを対応付けて、最適化サーバ20に送信する(ステップS25)。
広告装置100は、コンテンツサーバ30から受け付けたリスト2を参照し、配信候補の広告コンテンツ、配置位置L2周辺に表示される記事コンテンツ群との関連度を示す指標値を算出し、算出した指標値に基づいて、配信対象の広告コンテンツを抽出する(ステップS26)。ここでは、広告装置100は、広告コンテンツAD1を配信対象の広告コンテンツとして決定したとする。
広告装置100は、抽出した広告コンテンツAD1を最適化サーバ20に送信する(ステップS27)。最適化サーバ20は、コンテンツサーバ30から受け付けた記事コンテンツC7〜C12と、広告装置100から受け付けた広告コンテンツAD1とを用いて、ウェブページW1bを生成する(ステップS28)。そして、広告装置100は、生成したウェブページW1bをユーザ端末10に配信する(ステップS29)。ユーザ端末10は、既に表示しているウェブページW1aの下に、ウェブページW1bをつなげたものをウェブページW1として表示画面に表示する。
〔4.広告装置の構成〕
次に、図3を用いて、第1の実施形態にかかる広告装置100の構成について説明する。図3は、第1の実施形態にかかる広告装置100の構成例を示す図である。図3に示すように、広告装置100は、通信部110と、広告情報記憶部120と、制御部130とを有する。
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部21は、ネットワークと有線または無線で接続され、最適化サーバ20やコンテンツサーバ30との間で情報の送受信を行う。
広告情報記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。広告情報記憶部120は、広告主から受け付けた広告コンテンツに関する各種情報や広告コンテンツが配信やクリックされたことによる実績情報である配信実績を記憶する。
ここで、図4は、第1の実施形態にかかる広告情報記憶部120の一例を示す図である。図4の例では、広告情報記憶部120は、「広告主ID」、「広告コンテンツ」、「入札価格」、「CTR」、「eCPM」といった項目を有する。
「広告主ID」は、広告主または広告主によって広告コンテンツ入稿等に利用される端末装置(広告主端末)を識別するための識別情報を示す。「広告コンテンツ」は、広告主端末10から入稿された広告コンテンツを示す。図4では、「広告コンテンツ」に「AD1」といった概念的な情報が格納される例を示したが、実際には、画像、動画、テキストデータ、URLまたはこれらの格納場所を示すファイルパス名等が格納される。
「入札価格」は、広告主が広告コンテンツを入稿する際に指定する広告料金を示す。例えば、「入札価格」は、広告コンテンツがユーザに1回クリックされた際に広告主から広告配信者(例えば、広告装置100の管理者)に支払われる単価に該当する。
「CTR」は、広告コンテンツがクリックされた回数を広告コンテンツの表示回数によって除算した値を示す。なお、端末装置100に配信されたことがない広告コンテンツのCTRには、予め決められている固定値や、全ての広告コンテンツにおけるCTRの平均値や、同一の広告カテゴリ(例えば、車、旅行)に属する全ての広告コンテンツにおけるCTRの平均値等が記憶される。また、「CTR」には、CTRの予測モデル等から予測される予測CTRが記憶されてもよい。このような予測CTRは、例えば、広告コンテンツの種別や、広告コンテンツが表示されるウェブページの種別等によって予測される。
「eCPM」(effective Cost Per Mille)は、広告コンテンツの1000回表示辺りの期待収益額を示し、例えば、CTRに入札価格を乗じることにより算出することができる。
すなわち、図4では、広告主ID「B1」によって識別される広告主が、広告コンテンツ「AD1」を入稿するとともに、入札価格「150円」を指定している例を示す。また、図4では、広告コンテンツ「AD1」のCTRが「0.02」、eCPMが「3円」である例を示す。
図3に戻り、制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、広告装置100内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図3に示すように、制御部130は、入稿受付部131と、要求受付部132と、算出部133と、抽出部134と、配信部135とを有し、以下に説明する情報処理の機能や作用を実現または実行する。制御部130の内部構成は、図3に示した情報に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。
入稿受付部131は、広告主端末から広告コンテンツの入稿を受け付ける。具体的には、入稿受付部131は、入札価格の指定とともに広告コンテンツの入稿を受け付ける。そして、入稿受付部131は、入稿元の広告主に対する広告主IDに対応付けて、受け付けた広告コンテンツおよび入札価格を広告情報記憶部120に格納する。
要求受付部132は、最適化サーバ20から広告リクエストを受け付ける。例えば、要求受付部132は、広告リクエストとして、HTTPリクエストを受け付ける。また、要求受付部132は、コンテンツサーバ30から配信対象のコンテンツに関する情報を受け付ける。例えば、図2のステップS14およびS24で示したように、要求受付部132は、コンテンツサーバ30から配信対象の記事コンテンツの並び順と、配信対象の記事コンテンツのタイトルや説明文等のテキストとを、各配信対象の記事コンテンツ毎に対応付けたリストを受け付ける。
算出部133は、図1に示すウェブページW1のように、コンテンツと広告コンテンツが一覧表示される場合において、表示される候補である配信候補の広告コンテンツと、広告コンテンツの配置位置周辺に表示されるコンテンツとの関連度を示す指標値を算出する。例えば、算出部133は、配置位置周辺に表示されるコンテンツ毎に、配信候補の広告コンテンツとの類似度を算出する。そして、算出部133は、算出した各類似度を合計することにより、配置位置周辺に表示されるコンテンツ群との指標値を算出する。以下では、図5を用いて、第1の実施形態にかかる指標値算出処理について説明する。図5は、第1の実施形態にかかる指標値算出処理の一例を示す図である。なお、本実施形態において、広告コンテンツおよび記事コンテンツの配置位置(表示位置)とは、広告コンテンツおよび記事コンテンツが縦一列に並べられた場合における上からの並び順を示すものとする。
図5に示すウェブページW1xは、図1(a)に示した一覧情報であるウェブページW1の一部分を概念的に示したものである。ここでは、広告コンテンツの配置位置である配置位置Lxに配置される広告コンテンツ、すなわち配信対象の広告コンテンツが後述する抽出部134により抽出されるために、算出部133が、配信候補の広告コンテンツと記事コンテンツとの関連度を示す指標値を算出する指標値算出処理について説明する。指標値算出処理には、以下に示す2つのパターンが考えられる。
まず、パターン1について説明する。図5に示すように、広告コンテンツの配置位置Lx、すなわち並び順をi番目とする。このi番目を基準とすると、配置位置Lxより上に位置する記事コンテンツの配置位置を、i番目から近い順にi−1番目、i−2番目、i−3番目・・・と定めることができる。また、i番目を基準として、配置位置Lxより下に位置する記事コンテンツの配置位置を、i番目から近い順にi+1番目、i+2番目、i+3番目・・・と定めることができる。
ここで、算出部133は、配置位置Lxから上下2個分までの記事コンテンツを配置位置Lx周辺の記事コンテンツと定め、配信候補の広告コンテンツIとの類似度を算出する。つまり、図5の例では、算出部133は、配信候補の広告コンテンツIと、i−2番目の記事コンテンツ(記事コンテンツB)、i−1番目の記事コンテンツ(記事コンテンツC)、i+1番目の記事コンテンツ(記事コンテンツD)、i+2番目の記事コンテンツ(記事コンテンツE)それぞれとの類似度を算出する。そして、算出部133は、算出した類似度を合計することにより、広告コンテンツIと配置位置Lxから上下2個分までの記事コンテンツ群との指標値を算出する。
なお、配信候補の広告コンテンツIとは、図4に示す広告情報記憶部120に格納されている各広告コンテンツを示すものであってもよいし、図4に示す広告情報記憶部120に格納されている各広告コンテンツから、eCPMに基づいて選択された各広告コンテンツを示すものであってもよい。
算出部133は、広告コンテンツおよび記事コンテンツの特徴を示す特徴情報に基づいて、類似度を算出する。例えば、算出部133は、広告コンテンツIに含まれるテキストを形態素解析することにより単語(特徴語)を抽出し、その広告コンテンツの特徴を示す単語ベクトルを生成する。また、算出部133は、配置位置Lxから上下2個分までの各記事コンテンツに含まれるテキストを形態素解析することにより単語(特徴語)を抽出し、各記事コンテンツの特徴を示す単語ベクトルを生成する。そして、算出部133は、広告コンテンツIと各記事コンテンツについて、生成した単語ベクトル同士の類似度(例えば、単語ベクトル同士のコサイン類似度)を算出する。例えば、算出部133は、コサイン類似度として「0〜1」の範囲で示される所定の数値を算定する。
図5では、算出部133が、広告コンテンツIとi−2番目の記事コンテンツBとの類似度として、コサイン類似度cosi−2を算出した例を示す。また、算出部133が、広告コンテンツIとi−1番目の記事コンテンツCとの類似度として、コサイン類似度cosi−1を算出した例を示す。i+1番目の記事コンテンツD、i+2番目の記事コンテンツEについても同様である。
また、算出部133は、算出した各類似度に所定の重み値を付加する。例えば、パターン1では、算出部133は、配置位置Lxから上下2個分までの記事コンテンツのうち、配置位置Lxにより近い記事コンテンツとの類似度ほど高い重み値を乗じる。本実施形態では、最も高い重み値である重み値rを「0.9」とする。
図5の例では、i−1番目の記事コンテンツCおよびi+1番目の記事コンテンツDが、配置位置Lxに隣接しているため、これら記事コンテンツが配置位置Lxに対し最も近い位置にある。このため、算出部133は、広告コンテンツIとi−1番目の記事コンテンツCとの類似度cosi−1および広告コンテンツIとi+1番目の記事コンテンツDとの類似度cosi+1に、重み値r(0.9)を乗じる。
一方、i−2番目の記事コンテンツBおよびi+2番目の記事コンテンツEは、配置位置Lxからコンテンツ1つ分離れている。このため、算出部133は、広告コンテンツIとi−2番目の記事コンテンツBとの類似度cosi−2および広告コンテンツIとi+2番目の記事コンテンツEとの類似度cosi+2に、重み値rより小さい重み値r2(0.81)を乗じる。
例えば、配置位置Lxと直近の記事コンテンツとより類似する広告コンテンツを、配置位置Lxに配置することにより、その配置した広告コンテンツへのユーザの興味を高められると考えられる。これは、ユーザが、広告コンテンツに興味をもつか否かは、直近の記事コンテンツの内容により影響を受けやすいといった傾向があるためである。例えば、記事コンテンツCおよびDがスポーツ関連の記事である場合、配置位置Lxにスポーツ関連の広告コンテンツを配置することで、記事コンテンツCおよびDによって、ユーザはスポーツへの興味が高められ、スポーツ関連の広告コンテンツにも興味をもちクリックし易くなる。
このようなユーザ特性を考慮し、算出部133は、上記のように、配置位置Lxに近い記事コンテンツとの類似度ほど高い重み値を乗じることにより、配置位置Lxに近い記事コンテンツに類似する広告コンテンツを抽出し易くすることができる。
そして、算出部133は、重み値を乗じた各類似度を合計することにより、広告コンテンツIと、配置位置Lx周辺に表示される記事コンテンツ群との関連度を示す指標値SIを算出する。具体的には、これまで説明してきたパターン1での指標値算出処理において、算出部133は、指標値SIを下記の式(1)によって算出することができる。
指標値SI=r2cosi−2+rcosi−1+rcosi+1+r2cosi+2 ・・・(1)
すなわち、算出部133は、各配信候補の広告コンテンツそれぞれについて、式(1)を用いて、配置位置Lxから上下2個分までの記事コンテンツ群との関連度を示す指標値SIを算出する。
そして、算出部133は、式(1)を用いて算出した指標値SIに基づいて、広告評価値を算出する。例えば、算出部133は、広告コンテンツIの評価値であるeCPMIと、式(1)を用いて算出した指標値SIとの合計値を広告評価値EIとして算出する。具体的には、算出部133は、下記式(2)により、広告評価値EIを算出する。
広告評価値EI=eCPMI+指標値SI ・・・(2)
すなわち、算出部133は、各配信候補の広告コンテンツそれぞれについて、式(2)を用いて、広告評価値EIを算出する。
次に、パターン2について説明する。パターン2は、重み値の付与の仕方がパターン1とは異なる。その他の点については、パターン1と同様である。具体的には、パターン1では、算出部133が、配置位置Lxに近い記事コンテンツとの類似度ほど高い重み値を乗じる例を示した。しかし、算出部133は、配置位置Lxにより近い記事コンテンツとの類似度ほど高い重み値を乗じるにあたって、配置位置Lxより上方向に位置する記事コンテンツとの類似度ほど高い重み値を乗じる。
例えば、算出部133は、図5に示すパターン2のように、配置位置Lxから最も近く、かつ、配置位置Lxの上方向に位置するi−1番目の記事コンテンツCと、広告コンテンツIとの類似度cosi−1に最も高い重み値r(0.9)を乗じる。また、算出部133は、次に配置位置Lxに近く、かつ、配置位置Lxの上方向に位置するi−2番目の記事コンテンツBと、広告コンテンツIとの類似度cosi−2に、2番目に高い重み値r2(0.81)を乗じる。
また、算出部133は、配置位置Lxから最も近く、かつ、配置位置Lxの下方向に位置するi+1番目の記事コンテンツDと、広告コンテンツIとの類似度cosi+1に三番目に高い重み値r3(0.73)を乗じる。さらに、算出部133は、次に配置位置Lxに近く、かつ、配置位置Lxの下方向に位置するi+2番目の記事コンテンツEと、広告コンテンツIとの類似度cosi+2に、4番目に高い重み値r4(0.66)を乗じる。
これまで、配置位置Lxと直近の記事コンテンツとより類似する広告コンテンツを、配置位置Lxに配置することにより、その配置した広告コンテンツへのユーザの興味を高められる旨記載した。しかし、第1の実施形態にかかるウェブページW1のように、複数のコンテンツが縦一列に並べられる一覧情報を閲覧する場合、ユーザは、ウェブページW1を上方向にスクロールさせることで、各コンテンツを閲覧することが多いと考えられる。
このような場合、ユーザが広告コンテンツに興味をもつか否かは、直近の記事コンテンツの内容により影響されるとともに、ウェブページW1が上方向にスクロールされることにより、より早くユーザの目に留まる記事コンテンツの内容に影響を受けやすいといった傾向があると考えられる。例えば、記事コンテンツCがスポーツ関連の記事であり、記事コンテンツDがファッション関連の記事である場合、配置位置Lxにファッション関連の広告コンテンツを配置するよりは、スポーツ関連の広告コンテンツを配置することで、ファッション関連の記事コンテンツDより先に目に留まったスポーツ関連の記事コンテンツCによって、ユーザはスポーツへの興味が高められ、スポーツ関連の広告コンテンツにも興味をもちクリックし易くなる。
このようなユーザ特性を考慮し、算出部133は、配置位置Lxに近く、かつ、配置位置Lxの上方向に位置する記事コンテンツとの類似度ほど高い重み値を乗じることにより、配置位置Lxに近く、かつ、配置位置Lxの上方向に位置する記事コンテンツに類似する広告コンテンツを抽出し易くすることができる。
そして、算出部133は、重み値を乗じた各類似度を合計することにより、広告コンテンツIと、配置位置Lxから上下2個分までの記事コンテンツ群との関連度を示す指標値SIを算出する。具体的には、これまで説明してきたパターン2での指標値算出処理において、算出部133は、指標値SIを下記の式(3)によって算出することができる。
指標値SI=r2cosi−2+rcosi−1+r3cosi+1+r4cosi+2 ・・・(3)
すなわち、算出部133は、各配信候補の広告コンテンツそれぞれについて、式(3)を用いて、配置位置Lxから上下2個分までの記事コンテンツ群との関連度を示す指標値SIを算出する。
そして、算出部133は、式(3)を用いて算出した指標値SIに基づいて、広告評価値を算出する。例えば、算出部133は、広告コンテンツIのeCPMIと、式(3)を用いて、広告コンテンツIについて算出した指標値SIとの合計値を広告評価値EIとして算出する。つまり、算出部133は、上記式(2)により、広告評価値EIを算出する。
図3に戻り、抽出部134は、算出部133により算出された指標値に基づいて、配信候補の広告コンテンツから配信対象の広告コンテンツを抽出する。例えば、抽出部134は、算出部133により、上記式(2)を用いて算出された広告評価値が最も高い配信候補の広告コンテンツを配信対象として抽出する。
配信部135は、配信対象の広告コンテンツを配信する。具体的には、配信部135は、抽出部134により抽出された配信対象の広告コンテンツを最適化サーバ20に配信する。
〔5.広告抽出処理の具体例〕
さて、以下では、図5を用いて概念的に説明してきた広告抽出処理について、具体例を用いて説明する。図6は、第1の実施形態にかかる広告抽出処理を具体的に説明する説明図である。
まず、ユーザ端末10が、ユーザ操作にしたがって、ウェブページW1のうち初期表示される部分であるウェブページW1aのリクエストを最適化サーバ20に送信したとする。また、これにより、コンテンツサーバ30が、図6に示すように、配信対象の記事コンテンツを記事コンテンツC1〜C6と決めたことにより、並び順とテキスト情報T1〜T6とを対応付けたリスト1を広告装置100に送信したとする。さらに、広告装置100は、リスト1を受け付けた場合に、図4に示す広告情報記憶部120に格納している広告コンテンツから、eCPMの高い上位3つの広告コンテンツAD1〜AD3を配信候補の広告コンテンツとして決定したとする。
ウェブページW1aでは、これまで説明してきたように、中間の位置である配置位置L1(上から4番目)に広告コンテンツを挿入することが予め決められているものとする。
ここで、広告装置100の算出部133は、配置位置L1周辺に表示される記事コンテンツである記事コンテンツC2〜C5それぞれについて、配信候補の広告コンテンツAD1〜AD3それぞれとの類似度を算出する。
例えば、図5で示したパターン1を用いる場合、配信候補の広告コンテンツAD3を例に説明すると、算出部133は、例えば、広告コンテンツAD3と記事コンテンツC2との類似度cosi−2として「0.3」、広告コンテンツAD3と記事コンテンツC3との類似度cosi−1として「0.8」、広告コンテンツAD3と記事コンテンツC4との類似度cosi+1として「0.8」、広告コンテンツAD3と記事コンテンツC5との類似度cosi+2として「0.1」を算出する。
図6に示すように、広告コンテンツAD3がスポーツ関連広告であり、記事コンテンツC2がファッション関連記事である。スポーツとファッションとでは類似性は低いため、算出部133は、広告コンテンツAD3のテキスト「大型スポーツショップSS 日本初上陸!!」から抽出した特徴語と、記事コンテンツC2のテキストT2「スタイルをよく見せる自撮りテク」から抽出した特徴語とのコサイン類似度cosi−2として、例えば、低めの「0.3」を算出する。
一方、記事コンテンツC3およびC4はスポーツ関連記事であり、広告コンテンツAD3との類似性は高いため、算出部133は、広告コンテンツAD3のテキストから抽出した特徴語と、記事コンテンツC3のテキストT3「プロ野球ニュース ハイライト」から抽出した特徴語とのコサイン類似度cosi−1として、例えば、高めの「0.8」を算出する。また、算出部133は、広告コンテンツAD3のテキストから抽出した特徴語と記事コンテンツC4のテキストT4「日本女子バレー 浮き出た課題とは?」から抽出した特徴語とのコサイン類似度cosi+1として、同様に、高めの「0.8」を算出する。
また、記事コンテンツC5は政治関連記事であり、広告コンテンツAD3との類似性は低いため、算出部133は、類似度cosi+2として、例えば、記事コンテンツC2よりさらに低い「0.1」を算出する。
そして、算出部133は、算出した各類似度に重み値を乗じる。例えば、算出部133は、図5に示すパターン1に従い、配置位置L1に近い位置にある記事コンテンツとの類似度ほど高い重み値を乗じる。
そして、算出部133は、重み値を乗じた各類似度を上記式(1)に適用することにより、配信候補の広告コンテンツAD3と、配置位置L1周辺に表示される記事コンテンツC2〜C5との指標値SAD3を算出する。具体的には、算出部133は、上記式(1)を用いて、指標値SAD3=(0.81×0.3)+(0.9×0.8)+(0.9×0.8)+(0.81×0.1)=1.764を算出する。
さらに、算出部133は、上記式(2)に示すように、広告コンテンツAD3のeCPMAD3「2.2」と指標値SAD3「1.764」とを合計することにより、広告コンテンツAD3の広告評価値EAD3として「3.9764」を算出する。
ここまで、図5および図6を用いて、算出部133が、広告コンテンツAD3と、配置置位置L1周辺に表示される記事コンテンツC2〜C5との指標値SAD3および広告評価値EAD3を算出する例を示した。算出部133は、配信候補の広告コンテンツAD1についても、同様にして、例えば、指標値SAD1として「0.863」および広告評価値EAD1として「3.863」を算出する。また、算出部133は、配信候補の広告コンテンツAD2についても、同様にして、指標値SAD2として「1.278」や広告評価値EAD2として「2.328」を算出する。
次に、抽出部134は、算出部133により算出された各指標値のうち、最も高い広告評価値が算出された広告コンテンツAD3を配信対象として抽出する。そして、配信部135は、広告コンテンツAD3を最適化サーバ20に配信するため、配置位置L1に広告コンテンツAD3を配置したウェブページW1aが最適化サーバ20により配信される。
例えば、一般的な広告配信の場合、単にeCPMの最も高い広告コンテンツが配信対象として抽出されることが考えられる。この場合、図6の例では、広告コンテンツAD1が配信対象となる。しかし、本実施形態のように、さらに配信対象の広告コンテンツと配置位置周辺の記事コンテンツとの指標値に基づいて、配信対象の広告コンテンツを抽出すると、単にeCPMだけを考慮したときとでは、配信対象が異なる場合がある。
このように抽出された配信対象の広告コンテンツは、比較的eCPMも高く、さらに位置周辺の記事コンテンツとの親和性が高いものであるため、eCPMに基づいて抽出された広告コンテンツより高い広告効果を発生させることができる。
〔6.処理手順〕
次に、図7を用いて、第1の実施形態にかかる広告装置100が実行する広告抽出処理の手順について説明する。図7は、第1の実施形態にかかる広告装置100による広告抽出処理手順を示すフローチャートである。
まず、広告装置100の要求受付部132は、最適化サーバ20から広告リクエストを受け付けたか否かを判定する(ステップS101)。要求受付部132は、広告リクエストを受け付けた場合には(ステップS101;Yes)、コンテンツサーバ30から記事コンテンツに関するリストを受け付けたか否かを判定する(ステップS102)。要求受付部132は、リストを受け付けたか場合には(ステップS102;Yes)、受け付けたリストを算出部133に送信する。
ここで、記事コンテンツに関するリストとは、上述してきたように、配信対象の記事コンテンツの並び順とテキスト情報とを各配信対象の広告コンテンツ毎に対応付けたリストである。また、要求受付部132は、ステップS101とS102とを同時に行ってもよいし、例えば、リストを含む広告リクエストをコンテンツサーバ30から受け付けるように構成されてもよい。
次に、算出部133は、受け付けたリストを参照し、広告コンテンツが配置される配置位置Lx周辺に表示される記事コンテンツを特定する(ステップS103)。例えば、算出部133は、配置位置Lx周辺に表示される記事コンテンツとして、配置位置Lxから上下2個までに表示される記事コンテンツを特定する。
また、算出部133は、配信候補の広告コンテンツを決定する(ステップS104)。例えば、算出部133は、広告情報記憶部120を参照し、eCPMの高い上位所定数の広告コンテンツを配信候補の広告コンテンツとして決定する。
そして、算出部133は、配信候補の広告コンテンツから1つ選択する(ステップS105)。ここで、選択された広告コンテンツを広告コンテンツIとする。そして、算出部133は、配置位置Lx周辺に表示される記事コンテンツ毎に、広告コンテンツIとの類似度を算出する(ステップS106)。さらに、算出部133は、算出した各類似度に重み付けをする(ステップS107)。重み付けには、図5を用いて説明した、パターン1または2のいずれを用いてもよい。
そして、算出部133は、重み付けした各類似度を合計することにより、広告コンテンツIと、配置位置Lx周辺に表示される記事コンテンツ群との指標値SIを算出する(ステップS108)。例えば、ステップS107において、パターン1を用いて重み付けした場合、算出部133は、上記(1)式を用いて指標値SIを算出する。また、パターン2を用いて重み付けした場合、算出部133は、上記(3)式を用いて指標値SIを算出する。
また、算出部133は、広告コンテンツIのeCPMと指標値SIとを合計することにより、広告評価値EIを算出する(ステップS109)。この後、算出部133は、配信候補の広告コンテンツ全てについて、広告評価値EIを算出したか否かを判定する(ステップS110)。そして、算出部133は、配信候補の広告コンテンツ全てについて、広告評価値EIを算出したと判定した場合には(ステップS110;Yes)、算出結果を抽出部134に送信する。
次に、抽出部134は、算出結果を受け付けると、配信候補の広告コンテンツそれぞれの広告評価値EIを比較して、広告評価値EIの最も高い広告コンテンツを配信対象として抽出する(ステップS111)。配信部135は、抽出された広告コンテンツを最適化サーバ20に配信する(ステップ112)。
〔7.変形例〕
上述した第1の実施形態は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、他の実施形態について説明する。
〔7−1.カテゴリ分類〕
上記第1の実施形態では、広告装置100の算出部133が、記事コンテンツ毎に広告コンテンツとの類似度を算出する一例として、広告コンテンツのテキスト方抽出した特徴語と、記事コンテンツのテキストから抽出した特徴語とのコサイン類似度を算出する例を示した。しかし、算出部133は、配信候補の広告コンテンツが属するカテゴリと、配置位置周辺に表示される記事コンテンツが属するカテゴリとの類似度(カテゴリ類似度)を算出してもよい。この点について、図8を用いて説明する。また、適宜、図5および6も参照する。
図8は、第1の実施形態における変形例にかかるカテゴリ分類の一例を示す図である。図8に示すように、カテゴリ分類は、ツリー形式で複数の階層に分けられる。第1階層は大分類であり最も広いカテゴリ分類に対応する。第2階層は中分類であり、第1階層の各カテゴリをより細分化したカテゴリ分類に対応する。第3層は小分類であり、第2階層の各カテゴリをより細分化したカテゴリ分類に対応する。
ここで、上記では、算出部133が、式(1)に示すように、パターン1で重み付けした各コサイン類似度を合計することにより指標値を算出する、または、式(3)に示すように、パターン2で重み付けした各コサイン類似度を合計することにより指標値を算出する例を示した。カテゴリ類似度を用いる場合であっても、算出部133は、パターン1で重み付けした各カテゴリ類似度を合計することにより指標値を算出する、または、パターン2で重み付けした各カテゴリ類似度を合計することにより指標値を算出することができる。
具体的には、パターン1で各カテゴリ類似度に重み付けした場合、算出部133は、以下の式(4)で、配信対象の広告コンテンツIと、配置位置Lx周辺に表示される記事コンテンツ群との指標値SIを算出することができる。
指標値SI=r2CGi−2+rCGi−1+rCGi+1+r2CGi+2 ・・・(4)
図5を参照し、「CGi−2」は、広告コンテンツIとi−2番目の記事コンテンツBとのカテゴリ類似度を示す。「CGi−1」は、広告コンテンツIとi−1番目の記事コンテンツCとのカテゴリ類似度を示す。「CGi+1」は、広告コンテンツIとi+1番目の記事コンテンツDとのカテゴリ類似度を示す。「CGi+2」は、広告コンテンツIとi+2番目の記事コンテンツEとのカテゴリ類似度を示す。
以下では、図8に示すカテゴリツリーを用いて類似度を算出する具体例を示す。例えば、図6に示すように、広告装置100が、配信対象の記事コンテンツの並び順とテキスト情報が対応付けられたリスト1を受け付けるとともに、配信候補の広告コンテンツとして広告コンテンツAD1〜AD3を決定したとする。
ここで、広告装置100の算出部133は、配置位置L1周辺に表示される記事コンテンツである記事コンテンツC2〜C5それぞれについて、配信候補の広告コンテンツAD1〜AD3それぞれとのカテゴリ類似度を算出する。
例えば、配信候補の広告コンテンツAD3を例に説明すると、広告コンテンツAD3と記事コンテンツC2とのカテゴリ類似度CGi−2を算出する場合、図6に示すように、4番目(i番目)の広告コンテンツAD3は、「大型スポーツショップSS 日本初上陸!!」といったテキストを含む。このため、算出部133は、例えば、広告コンテンツAD3のカテゴリを「スポーツ」と特定する。また、2番目(i−2)の記事コンテンツC2は、「スタイルをよく見せる自撮りテク」といったテキストを含む。このため、算出部133は、例えば、記事コンテンツC2のカテゴリを「ファッション」と特定する。
ここで、図8に示すカテゴリツリーによると、「スポーツ」と「ファッション」とは、大分類に分けられるカテゴリであるため、双方はあまり類似していないといえる。このような大分類同士のカテゴリの類似度を算出する場合、算出部133は、例えば、類似度の最大値「1」から「0.5」を引いて、「スポーツ」と「ファッション」との類似度、すなわち、広告コンテンツAD3と記事コンテンツC2との類似度「0.5」を算出する。
また、広告コンテンツAD3と記事コンテンツC3とのカテゴリ類似度CGi−1を算出する場合、図6に示すように、3番目(i−1)の記事コンテンツC3は、「プロ野球ニュース ハイライト」といったテキストを含む。このため、算出部133は、例えば、記事コンテンツC3のカテゴリを「プロ野球」と特定する。
図8によると、「プロ野球」は、「スポーツ」の下位に該当するカテゴリであるため、両者は比較的類似度が高いといえる。そして、「スポーツ」と「プロ野球」とは2つ分階層が離れている。このような場合、算出部133は、例えば、1階層を辿るのに、類似度の最大値「1」を「0.1」を用いて調整するとし、類似度の最大値「1」から「0.1×2(2階層分)」を引く。そして、算出部133は、「スポーツ」と「プロ野球」との類似度、すなわち、広告コンテンツAD3と記事コンテンツC3との類似度「0.8」を算出する。
また、広告コンテンツAD3と記事コンテンツC4とのカテゴリ類似度CGi+1を算出する場合、図6に示すように、5番目(i+1)の記事コンテンツC4は、「日本女子バレー 浮き出た課題とは?」といったテキストを含む。このため、算出部133は、例えば、記事コンテンツC4のカテゴリを「バレー」と特定する。
図8によると、「バレー」は、「スポーツ」の下位に該当するカテゴリであるため、両者は比較的類似度が高いといえる。そして、「スポーツ」と「バレー」とは1つ分階層が離れている。このような場合、算出部133は、例えば、類似度の最大値「1」から「0.1(1階層分)」を引く。そして、算出部133は、「スポーツ」と「バレー」との類似度、すなわち、広告コンテンツAD3と記事コンテンツC4との類似度「0.9」を算出する。
また、広告コンテンツAD3と記事コンテンツC5とのカテゴリ類似度CGi+2を算出する場合、図6に示すように、6番目(i+2)の記事コンテンツC5は、「米国と韓国の合同演習が終了」といったテキストを含む。このため、算出部133は、例えば、記事コンテンツC5のカテゴリを「政治」と特定する。
図8によると、「スポーツ」と「政治」とは、大分類に分けられるカテゴリであるため、双方はあまり類似していないといえる。このため、算出部133は、例えば、類似度の最大値「1」から「0.5」を引いて、「スポーツ」と「政治」との類似度、すなわち、広告コンテンツAD3と記事コンテンツC2との類似度「0.5」を算出する。
そして、算出部133は、算出した各カテゴリ類似度に重み値を乗じる。例えば、算出部133は、図5に示すパターン1に従い、配置位置L1に近い位置にある記事コンテンツとの類似度ほど高い重み値を乗じる。
そして、算出部133は、重み値を乗じた各類似度を上記式(4)に適用することにより、配信候補の広告コンテンツAD3と、置位置L1周辺に表示される記事コンテンツC2〜C5との指標値SAD3を算出する。具体的には、算出部133は、上記式(4)を用いて、指標値SAD3=(0.81×0.5)+(0.9×0.8)+(0.9×0.9)+(0.81×0.5)=2.34を算出する。
さらに、算出部133は、上記式(2)に示すように、広告コンテンツAD3のeCPMAD3「2.2」と指標値SAD3「2.34」とを合計することにより、広告コンテンツAD3の広告評価値EAD3として「4.54」を算出する。
ここまで、算出部133が、広告コンテンツAD3と、配置位置L1周辺に表示される記事コンテンツC2〜C5との指標値SAD3および広告評価値EAD3を算出する例を示した。算出部133は、配信対象の広告コンテンツAD1についても、同様にして、記事コンテンツC2〜C5それぞれとのカテゴリ類似度から指標値SAD1および広告評価値EAD1を算出する。また、算出部133は、配信対象の広告コンテンツAD2についても、同様にして、記事コンテンツC2〜C5それぞれとのカテゴリ類似度から指標値SAD2および広告評価値EAD2を算出する。
また、図5に示したパターン2で各カテゴリ類似度に重み付けした場合、算出部133は、以下の式(5)で、配信対象の広告コンテンツIと、配置位置Lx周辺に表示される記事コンテンツ群との指標値SIを算出することができる。
指標値SI=r2CGi−2+rCGi−1+r3CGi+1+r4CGi+2 ・・・(5)
このように、第1の実施形態の変形例にかかる広告装置100は、配置位置周辺に表示される記事コンテンツ毎に、配信候補の広告コンテンツとのカテゴリ類似度を算出し、算出した類似度を用いて指標値を算出する。これにより、広告装置100は、図8に示すようなカテゴリツリーを用いることで、広告コンテンツと記事コンテンツとのカテゴリ特定およびカテゴリ類似度算出を行うことができるため、テキスト解析による特徴語抽出等を行う必要が無く、図5に示したコサイン類似度算出を行う場合よりも、広告評価値を算出するまでの処理を速めることができる。
〔8.効果〕
第1の実施形態にかかる広告装置100は、算出部133と抽出部134とを有する。算出部133は、コンテンツとともに一覧表示される配信候補の広告コンテンツと、当該配信候補の広告コンテンツが配置される配置位置周辺に表示されるコンテンツとの関連度を示す指標値を算出する。抽出部134は、算出部133により算出された指標値に基づいて、配信候補の広告コンテンツから配信対象の広告コンテンツを抽出する。
これにより、第1の実施形態にかかる広告装置100は、配置位置周辺に表示されるコンテンツとより親和性の高い広告コンテンツをユーザ端末10に表示させることができるため、広告効果を高めることができる。
また、算出部133は、配置位置周辺に表示されるコンテンツ毎に、配信候補の広告コンテンツとの類似度を算出し、算出した各類似度を用いて、配置位置周辺に表示されるコンテンツ群と配信候補の広告コンテンツとの関連度を示す指標値を算出する。
このように、第1の実施形態にかかる広告装置100は、配置位置周辺に表示されるコンテンツ毎に、配信候補の広告コンテンツとの類似度を算出することにより、配置位置周辺に表示されるコンテンツ群と配信候補の広告コンテンツとの関連度を示す指標値を精度よく算出することができる。
また、算出部133は、配置位置周辺に表示されるコンテンツのうち配置位置に近いコンテンツとの類似度ほど高い重み付けをする。
これにより、第1の実施形態にかかる広告装置100は、ユーザが広告コンテンツに興味を持つか否かは、配置位置により近いコンテンツの影響を受けやすいといったユーザ特性を考慮して指標値を算出することができるため、配置位置により近いコンテンツと親和性の高い広告コンテンツをユーザ端末10に表示させることができる。そして、これにより、広告装置100は、効果を高めることができる。
また、算出部は、配置位置周辺に表示されるコンテンツのうち配置位置より上方向に位置するコンテンツとの類似度ほど高い重み付けをする。
これにより、第1の実施形態にかかる広告装置100は、ユーザが広告コンテンツに興味を持つか否かは、配置位置により近く、かつ、配置位置より上方向に位置するコンテンツの影響を受けやすいといったユーザ特性を考慮して指標値を算出することができるため、配置位置により近く、かつ、配置位置より上方向に位置するコンテンツと親和性の高い広告コンテンツをユーザ端末10に表示させることができる。そして、これにより、広告装置100は、効果を高めることができる。
また、算出部133は、配信候補の広告コンテンツに含まれるテキストから抽出される情報と、配置位置周辺に表示されるコンテンツに含まれるテキストから抽出される情報との類似度を算出する。
このように、第1の実施形態にかかる広告装置100は、テキストから抽出した情報を用いて類似度を算出するため、精度よく類似度を算出することができる。
また、算出部133は、配信候補の広告コンテンツが属するカテゴリと、配置位置周辺に表示されるコンテンツが属するカテゴリとの類似度を算出する。
このように、第1の実施形態にかかる広告装置100は、広告コンテンツが属するカテゴリと、配置位置周辺に表示されるコンテンツが属するカテゴリとを比較することにより類似度を算出するため、テキストから抽出した情報を用いて類似度を算出する場合よりも処理速度を速めることができる。
また、算出部133は、類似度の合計することにより関連度を示す指標値を算出し、抽出部134は、算出部133により算出された指標値と、配信候補のコンテンツの評価値との和に基づいて、配信候補の広告コンテンツから配信対象の広告コンテンツを抽出する。
これにより、第1の実施形態にかかる広告装置100は、広告効果を高めることができる。
(第2の実施形態)
〔1.広告装置の構成〕
さて、第1の実施形態では、広告装置100の算出部133が、配置位置周辺の記事コンテンツ毎に、配信候補の広告コンテンツとの類似度を算出し、算出した類似度を用いて指標値を算出する例について説明してきた。しかし、ウェブページW1のように記事コンテンツと広告コンテンツとが一覧表示される一覧情報において、ユーザが興味を持っている記事コンテンツや広告コンテンツを予測し、ユーザが興味を持っていると予測されたコンテンツと親和性が高い広告コンテンツを抽出されやすくするといった処理を行ってもよい。
そして、以下では、上述してきた広告装置100に対して、さらにこのような予測処理を行う構成を加えた広告装置200について説明する。図9は、第2の実施形態にかかる広告装置200の構成例を示す図である。図9に示すように、広告装置200は、通信部110と、広告情報記憶部120と、制御部230とを有する。
また、図9に示すように、制御部230は、入稿受付部131と、要求受付部132と、算出部133と、抽出部134と、配信部135と、予測部236とを有する。すなわち、広告装置200は、広告装置100にさらに予測部236を加えた装置に相当する。
予測部236は、ウェブページW1に含まれる各コンテンツのうち、ユーザが興味を持っている記事コンテンツや広告コンテンツを予測する。例えば、予測部236は、ユーザ端末10から送信されるユーザの操作ログを解析することにより、ユーザが興味を持っている記事コンテンツや広告コンテンツを予測する。
例えば、予測部236は、ウェブページW1に対するユーザ操作により、ウェブページW1が移動された移動速度を算出する。そして、予測部236は、移動速度が所定速度以下となった場合に、ユーザ端末10の表示画面の中央付近に位置していたコンテンツを特定するとともに、特定したコンテンツにユーザが興味をもっていると予測する。
例えば、ユーザは、ウェブページW1をスクロールさせながら各コンテンツを閲覧している際に、興味の惹かれるコンテンツが目に留まった場合、無意識にスクロール速度を落とす、または、スクロール操作をやめるといった特性があると考えられる。予測部236は、このような特性に基づき、移動速度が所定速度以下となった場合に、ユーザ端末10の表示画面の中央付近に位置していたコンテンツにユーザが興味を持っていると予測する。なお、予測部236は、必ずしも、表示画面の中央付近に位置していたコンテンツにユーザが興味を持っていると予測する必要はなく、表示画面の任意の位置であってよい。
また、例えば、ユーザは、ウェブページW1をスクロールさせながら各コンテンツを閲覧している際に、興味の惹かれるコンテンツがあった場合、そのコンテンツを選択して、詳細ページへと遷移させる。このため、予測部236は、ウェブページW1に含まれる各コンテンツのうち、ユーザに選択されたコンテンツをユーザが興味を持っているコンテンツと予測してもよい。
そして、算出部133は、予測部236によりユーザに興味を持たれていると予測された記事コンテンツとの類似度に高い重み付けをし、重み付けをした類似度を配信対象の広告コンテンツIと配置位置周辺に表示される各記事コンテンツとの類似度であって、上記パターン1または2で示したように重み付けした各類似度に加えることにより、指標値Siを算出する。
例えば、予測部236によりユーザに興味を持たれていると予測された記事コンテンツYと広告コンテンツIとのコサイン類似度をcosYとすると、算出部133は、かかるコサイン類似度をcosYに最も高い重み値r(0.9)を乗じる。そして、算出部133は、上記パターン1を用いる場合、下記式(6)により、指標値SIを算出する。
指標値SI=(r2cosi−2+rcosi−1+rcosi+1+r2cosi+2)+rcosY ・・・(6)
括弧内の式は、上記式(1)に対応する。すなわち、算出部133は、予測部236によりユーザに興味を持たれていると予測された記事コンテンツYと広告コンテンツIとのコサイン類似度cosYに最も高い重み値rを乗じたrcosYを、上記式(1)にさらに加えた式(6)を用いて指標値SIを算出する。これより、算出部133は、コサイン類似度cosYによる影響度を高めることで、記事コンテンツYと親和性の高い広告コンテンツを配信対象として抽出されやすくする。
また、算出部133は、上記パターン2を用いる場合、下記式(7)により、指標値Siを算出する。
指標値SI=(r2cosi−2+rcosi−1+r3cosi+1+r4cosi+2)+rcosY ・・・(7)
括弧内の式は、上記式(3)に対応する。また、式(6)や式(7)に示すように、コサイン類似度を用いて指標値Siを算出する例を示したが、カテゴリ類似度であってもよい。
〔2.データの流れ〕
次に、図10を用いて、第2の実施形態にかかる広告抽出システム2による広告抽出処理について、データの流れを明確化しつつ説明する。図10は、第2の実施形態にかかる広告抽出システム2による広告抽出処理の一例を示す図である。
まず、ウェブページW1aとW1bとを含むウェブページW1がユーザ端末10に表示されているとする。このような状態において、ユーザ端末10は、ウェブページW1に対するユーザ操作や、かかるユーザ操作に応じて変化されるウェブページW1の表示態様を操作ログとして取得する(ステップS31)。
ここで、ユーザ端末10が、ユーザ操作にしたがって、ウェブページW1bの下につなげるウェブページW1cのリクエストと、ステップS31で取得した操作ログを最適化サーバ20に送信したとする(ステップS32)。最適化サーバ20は、ウェブページW1cのリクエストを受信すると、ウェブページW1cに含む記事コンテンツを取得するためのコンテンツリクエストをコンテンツサーバ30に送信するとともに、ウェブページW1aに含む広告コンテンツを取得するための広告リクエストと操作ログとを広告装置200に送信する(ステップS33)。
コンテンツサーバ30は、最適化サーバ20からコンテンツリクエストを受信すると、配信対象の記事コンテンツと配信対象の記事コンテンツの並び順を決定する(ステップS34)。また、コンテンツサーバ30は、決定した情報をリストアップしたリスト3を生成する。図10に示すリスト3は、コンテンツサーバ30が、配信対象の記事コンテンツC13〜C18を、縦一列に上から15番目、16番目・・・21番目といったように並べることを決定したことを示す。また、コンテンツサーバ30が、各配信対象の記事コンテンツにタイトルや説明文などのテキスト情報を対応付けている例を示す。
コンテンツサーバ30は、このように生成したリスト3を広告装置200に送信する(ステップS35)。また、コンテンツサーバ30は、リスト3に示すように、配信対象の記事コンテンツのデータと並び順とを対応付けて、最適化サーバ20に送信する(ステップS36)。
一方、広告装置200の予測部236は、要求受付部132により最適化サーバ20から広告リクエストと操作ログとが受信されると、操作ログを参照し、ユーザが興味を持っているコンテンツを予測する(ステップS34)。例えば、予測部236は、ウェブページW1が移動された移動速度を算出し、移動速度が所定速度以下となった場合に、ユーザ端末10の表示画面の中央付近に位置していたコンテンツをユーザが興味を持っているコンテンツと予測する。また、例えば、予測部236は、ユーザに選択されたコンテンツをユーザが興味を持っているコンテンツと予測してもよい。ここでは、予測部236は、ユーザが記事コンテンツC11に興味を持っていると予測したとする。
また、広告装置200の算出部133は、要求受付部132により最適化サーバ20から受け付けたリスト3を参照し、配信候補の広告コンテンツと、配置位置L3周辺に表示される記事コンテンツおよび興味を持っていると予測された記事コンテンツC11との関連度を示す指標値を算出する。また、算出部133は、指標値とeCPMとの和である広告評価値を算出する。そして、抽出部134は、算出された各配信候補の広告評価値を比較し、配信対象の広告コンテンツを抽出する(ステップS36)。ここでは、抽出部134は、広告コンテンツAD2を抽出したとする。
そして、広告装置200の配信部135は、抽出された広告コンテンツAD2を最適化サーバ20に送信する(ステップS37)。最適化サーバ20は、コンテンツサーバ30から受け付けた記事コンテンツC13〜C18と、広告装置200から受け付けた広告コンテンツAD2とを用いて、ウェブページW1cを生成する(ステップS38)。そして、最適化サーバ20は、生成したウェブページW1cをユーザ端末10に配信する(ステップS39)。ユーザ端末10は、既に表示しているウェブページW1bの下に、ウェブページW1cをつなげたものをウェブページW1として表示画面に表示する。
このように、第2の実施形態にかかる広告装置200は、ユーザが興味を持っていると予測されたコンテンツとの類似度をさらに考慮した指標値を算出し、算出した指標値に基づいて配信対象の広告コンテンツを抽出する。これにより、広告装置200は、例えば、ユーザが興味を持っている記事コンテンツと親和性の高い広告コンテンツを表示され易くすることができるため、広告効果を高めることができる。
(第3の実施形態)
〔1.端末装置による広告抽出処理〕
上記各実施形態では、広告装置100および200が、配信候補の広告コンテンツと、配信候補の広告コンテンツが配置される配置位置周辺に表示されるコンテンツとの関連度を示す指標値を算出し、指標値に基づいて、配信対象の広告コンテンツを抽出する例について説明してきた。しかし、このような広告抽出処理は、端末装置の一例であるユーザ端末10によって行われてもよい。以下では、ユーザ端末10による広告抽出処理について説明する。なお、ユーザ端末10による広告抽出処理は、広告装置100および200によって行われる広告抽出処理と同一のものであるため詳細な説明は省略する。
図11を用いて、第3の実施形態にかかる広告抽出システム3の構成について説明する。図11は、第3の実施形態にかかる広告抽出システム3の構成例を示す図である。図11に示すように、広告抽出システム3は、ユーザ端末10と、最適化サーバ20と、コンテンツサーバ30と、広告サーバ50a〜50cとを含む。ユーザ端末10、最適化サーバ20、コンテンツサーバ30、広告サーバ50a〜50cとは、ネットワークを介して有線または無線により通信可能に接続される。なお、図11に示す広告抽出システム3には、複数台のユーザ端末10や、複数台の最適化サーバ20や、複数台のコンテンツサーバ30が含まれてもよい。また、図11に示す例では、広告抽出システム3は、3台の広告サーバを含むが、3台に限定される必要はなく、広告抽出システム3は、さらに多くの広告サーバを含むものであってもよいし、3台以下であってもよい。
ユーザ端末10は、ユーザによって利用される端末装置であり、上述してきた広告装置100および200により行われる指標値算出に基づく広告抽出処理を行う。
広告サーバ50a〜50cは、広告リクエストを受け付けると、自装置内の所定の記憶部から広告コンテンツを抽出し、抽出した広告コンテンツを最適化サーバ20に配信する。
また、図11に示すように、コンテンツサーバ30は、配信業者t1によって利用され、広告サーバ50aは、配信業者t2によって利用され、広告サーバ50bは、配信業者t3によって利用され、広告サーバ50cは、配信業者t4によって利用される。また、配信業者t1〜t4は、それぞれ異なる業者である。
次に、図11を用いて、第3の実施形態にかかる広告抽出システム3による広告抽出処理について、データの流れを明確化しつつ説明する。
まず、ユーザ端末10が、ユーザ操作にしたがって、ウェブページW1のうち初期表示される部分であるウェブページW1aのリクエストを最適化サーバ20に送信したとする(ステップS40)。最適化サーバ20は、ウェブページW1aのリクエストを受信すると、ウェブページW1aに含まれる記事コンテンツを取得するためのコンテンツリクエストをコンテンツサーバ30に送信するとともに(ステップS41)、広告リクエストを広告サーバ50a〜50cそれぞれに送信する(ステップS41)。
コンテンツサーバ30は、最適化サーバ20からコンテンツリクエストを受信すると、例えば、各種記事コンテンツを格納している自装置内の所定の記憶部を参照し、配信対象の記事コンテンツと配信対象の記事コンテンツの並び順を決定する(ステップS42)。ここでは、コンテンツサーバ30は、図11に示すように、配信対象の記事コンテンツC1〜C6を、縦一列に上から1番目、2番目・・・7番目といったように並べることを決定したとする。
また、広告サーバ50a〜50cは、最適化サーバ20から広告リクエストを受信すると、各種広告コンテンツを格納している自装置内の所定の記憶部を参照し、ユーザに対して配信(表示)される候補である配信候補の広告コンテンツを抽出する(ステップS42)。ここでは、図11に示すように、広告サーバ50aは、広告コンテンツAD11を抽出し、広告サーバ50bは、広告コンテンツAD12を抽出し、広告サーバ50cは、広告コンテンツAD13を抽出したとする。なお、説明を簡単にするために、各広告サーバが、1つずつ広告コンテンツを抽出する例を示したが、各広告サーバは、複数の広告コンテンツを抽出してもよい。
また、どのような広告コンテンツを抽出するは、広告サーバ50a〜50cそれぞれの有する抽出ロジックに従ってよい。例えば、広告サーバ50aおよび広告サーバ50bは、eCPMに基づいて広告コンテンツを抽出し、広告サーバ50bは、入札価格に基づいて広告コンテンツを抽出するといったように、それぞれの広告サーバが有する独自の抽出ロジックで広告コンテンツが抽出されてよい。また、一方で、広告コンテンツを抽出するロジックが統一されてもよい。
次に、コンテンツサーバ30は、配信対象の記事コンテンツのデータと並び順とを対応付けて、最適化サーバ20に送信する(ステップS43)。また、広告サーバ50a〜50cそれぞれも、各自抽出した配信候補の広告コンテンツのデータを最適化サーバ20に送信する(ステップS43)。そして、最適化サーバ20は、コンテンツサーバ30および広告サーバ50a〜50cから受け付けた各種データをユーザ端末10に転送する(ステップS44)。
ユーザ端末10は、最適化サーバ20からデータを受け付けると、配信候補の広告コンテンツと、配信候補の広告コンテンツが配置される配置位置周辺に表示される記事コンテンツとの関連度を示す指標値を算出する。また、ユーザ端末10は、算出した指標値に基づいて、配信候補の広告コンテンツから、実際にユーザに対して表示する表示対象の広告コンテンツを抽出する(ステップS45)。
広告抽出処理について具体的に説明する。例えば、7個のコンテンツを縦一列に並べた場合、中間の位置である配置位置L10(4番目)に広告コンテンツを挿入することが予め決められているとする。これにより、ユーザ端末10は、各配信候補の広告コンテンツと、配置位置L10から上下2個分までの記事コンテンツC2〜C5それぞれとの類似度を算出し、算出した類似度の和を指標値として算出する。
例えば、ユーザ端末10は、広告コンテンツAD11と、記事コンテンツC2〜C5それぞれとの類似度4つを算出し、算出した4つの類似度を合計することにより、広告コンテンツAD11と、配置位置L10周辺に表示される記事コンテンツC2〜C5との指標値を算出する。そして、ユーザ端末10は、算出した指標値と広告コンテンツAD11のeCPMとを合計することにより、広告コンテンツAD11の広告評価値を算出する。
また、ユーザ端末10は、広告コンテンツAD12と、記事コンテンツC2〜C5それぞれとの類似度4つを算出し、算出した4つの類似度を合計することにより、広告コンテンツAD12と、記事コンテンツC2〜C5との指標値を算出する。そして、ユーザ端末10は、算出した指標値と広告コンテンツAD12のeCPMとを合計することにより、広告コンテンツAD12の広告評価値を算出する。また、ユーザ端末10は、広告コンテンツAD13についても同様にして、広告評価値を算出する。
そして、ユーザ端末は、このように算出した各広告評価値を比較することにより、例えば、広告評価値の最も高いものを表示対象の広告コンテンツとして抽出する。例えば、ユーザ端末10は、配信候補の広告コンテンツAD11〜13のうち、広告コンテンツAD13を表示対象として抽出したとすると、抽出した広告コンテンツAD13と配信対象の記事コンテンツC1〜C6とからウェブページW1aを生成し表示画面に表示する。
なお、図11に示す広告抽出システム3では、最適化サーバ20が、ユーザ端末10とコンテンツサーバ30とのデータ送受信、ユーザ端末10と広告サーバ50a〜50cとのデータ送受信を仲介する例を示したが、広告抽出システム3は、必ずしも最適化サーバ20を有している必要はない。このような場合、ユーザ端末10は、例えば、コンテンツリクエストを直接コンテンツサーバ30に送信し、広告リクエストを直接広告サーバ50a〜50cそれぞれに送信する。またユーザ端末は、コンテンツサーバ30、広告サーバ50a〜50cそれぞれから直接データを受け付ける。
このように、サーバ側ではなく、ユーザ端末10側で、広告抽出処理を行うことにより、例えば、図11に示すように、複数の配信業者による広告サーバ装置が混在するシステムにおいても、本実施形態にかかる広告抽出処理を実現することができる。
〔2.端末装置の構成〕
次に、図12を用いて、第3の実施形態にかかるユーザ端末10の構成について説明する。図12は、第3の実施形態にかかるユーザ装置10の構成例を示す図である。図12に示すように、ユーザ装置10は、通信部11と、入力部12と、出力部13と、制御部14とを有する。
通信部11は、例えば、NIC等によって実現される。そして、通信部11は、ネットワークと有線または無線で接続され、最適化サーバ20、コンテンツサーバ30、広告サーバ50a〜50cとの間で情報の送受信を行う。
入力部12は、ユーザから各種操作を受け付ける入力装置である。例えば、入力部12は、キーボードやマウスや操作キー等によって実現される。出力部13は、各種情報を表示するための表示装置である。つまり、出力部13は、ユーザ端末10の表示画面に相当する。例えば、出力部13は、液晶ディスプレイ等によって実現される。なお、ユーザ端末10にタッチパネルが採用される場合には、入力部12と出力部13とは一体化される。
図12に戻り、制御部14は、例えば、CPUやMPU等によって、ユーザ装置10内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部14は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図12に示すように、制御部14は、要求部15と、算出部16と、抽出部17と、表示制御部18とを有し、以下に説明する情報処理の機能や作用を実現または実行する。制御部14の内部構成は、図14に示した情報に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部14が有する各処理部の接続関係は、図12に示した接続関係に限られず、他の接続関係であってもよい。
要求部15は、所定のコンテンツを取得するためのリクエストを所定のサーバに送信する。また、要求部15は、コンテンツと当該コンテンツとともに一覧表示される候補(配信候補)の広告コンテンツとを受け付ける。図13の例では、要求部15は、ウェブページW1aのリクエストを最適化サーバ20に送信する。また、要求部15は、ウェブページW1aとして一覧表示する記事コンテンツC1〜C6や、配信候補の広告コンテンツAD11〜AD13を最適化サーバ20から受け付ける。
算出部16は、配信候補の広告コンテンツと、広告コンテンツが配置される配置位置周辺に表示される記事コンテンツとの関連度を示す指標値を算出する。例えば、算出部16は、配置位置周辺に表示されるコンテンツ毎に、配信候補の広告コンテンツとの類似度を算出し、算出した各類似度を用いて、配置位置周辺に表示されるコンテンツ群と配信候補の広告コンテンツとの指標値を算出する。また、算出部16は、算出した指標値と配信候補の広告コンテンツの評価値(例えば、eCPM)とを合計して広告評価値を算出する。すなわち、算出部16は、広告装置100の算出部133に対応する処理部である。
抽出部17は、算出部133により算出された指標値に基づいて、配信対象の広告コンテンツから、出力部13に表示される表示対象の広告コンテンツからを抽出する。例えば、抽出部134は、算出部133により指標値に基づいて用いて算出された広告評価値が最も高い配信候補の広告コンテンツを表示対象として抽出する。すなわち、算出部16は、広告装置100の抽出部134に対応する処理部である。
表示制御部18は、要求部15によってリクエストされたコンテンツを出力部13に表示制御する。例えば、表示制御部18は、要求部15により受け付けられた記事コンテンツと広告コンテンツとからウェブページW1aを作成し、作成したウェブページW1aをを出力部13に表示する。また、表示制御部18は、例えば、ウェブページW1aに対するユーザ操作が行われた場合に、かかるユーザ操作に応じてウェブページW1aを表示態様を変更する。
なお、上述した制御部14による広告抽出処理の処理は、例えば、JavaScript(登録商標)等により実現されてもよい。また、上述した抽出処理が所定のアプリケーション(例えば、ウェブページW1を表示するためのアプリケーション)により行われる場合、制御部14は、例えば、所定のアプリを制御するアプリ制御部として機能する。
(他の実施形態)
上述した第1〜第3の実施形態は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、他の実施形態について説明する。
〔1.一覧情報〕
上記各実施形態では、複数のコンテンツが縦一列に並べられた一覧情報の一例としてウェブページW1を用いて、広告抽出処理について説明してきた。しかし、本願にかかる一覧情報は、図13に示すウェブページW2aのように、複数のコンテンツが縦方向および横方向に並べられたものであってもよい。以下では、ウェブページW2aに含まれる広告コンテンツの配置位置L20に配置される広告コンテンツを抽出するするための指標値算出処理について、広告装置100を用いて説明する。
図13は、他の実施形態にかかる広告抽出処理の一例を示す図である。例えば、図13に示すウェブページW2aは、ウェブページW2の一部分を概念的に示したものである。ここでは、ウェブページW2aは、ウェブページW2のうち初期表示される部分であるものとする。
かかる場合、要求受付部132は、例えば、コンテンツサーバ30からウェブページW2aを示すリストを受け付ける。例えば、要求受付部132は、配信対象の記事コンテンツの表示位置とテキスト情報とを対応付けたリストを受け付ける。配信対象の記事コンテンツの表示位置は、例えば、並び順と方向によって示される。
広告コンテンツの配置位置L20、すなわち並び順をi番目とすると、要求受付部132は、図13の例では、「記事コンテンツA1:i−3番目(左)」、「記事コンテンツA2:i−3番目(右)」、「記事コンテンツA3:i−2番目(右)」、「記事コンテンツA4:i−2番目(中)」・・・といった表記がなされたリストを受け付ける。
このように、要求受付部132によりリストが受け付けられると、算出部133は、例えば、配置位置L20から上下2個分までの記事コンテンツを配置位置L20周辺の記事コンテンツと定め、配置位置L20周辺の記事コンテンツ毎に、配信候補の広告コンテンツIとの類似度を算出する。つまり、図13の例では、算出部133は、配信候補の広告コンテンツIと、i−2番目(左)の記事コンテンツA3、i−2番目(中)の記事コンテンツA4、i−2番目の記事コンテンツA5、i−1番目(左)の記事コンテンツA6、i−1番目(右)の記事コンテンツA7、i+1番目(左)の記事コンテンツA8、i−1番目(右)の記事コンテンツA9、i+2番目(左)の記事コンテンツA10、i+2番目(右)の記事コンテンツA11、それぞれとの類似度を算出する。なお、ここでは、類似度として、コサイン類似度を例に説明するが、カテゴリ類似度であってもよい。
図13では、算出部133が、広告コンテンツIとi−2番目(左)の記事コンテンツA3との類似度として、コサイン類似度cosA3を算出した例を示す。また、算出部133が、広告コンテンツIとi−2番目(中)の記事コンテンツA4との類似度として、コサイン類似度cosA4を算出した例を示す。他の記事コンテンツとの類似度も図13に示す通りである。
また、算出部133は、算出した各類似度に所定の重み値を付加する。パターン1では、算出部133は、配置位置L20と各記事コンテンツの表示位置との距離を算出し、配置位置L20により近い記事コンテンツとの類似度ほど高い重み値を乗じる。例えば、算出部133は、配置位置L20の中点P20と記事コンテンツの表示位置の中点を結ぶ直線の長さを、配置位置L20と記事コンテンツの表示位置との距離として算出する。
配置位置L20の中点P20とは、配置位置L20によって示される広告領域の対角線を結んだ交点に相当する。また、記事コンテンツA3を例に説明すると、記事コンテンツA3の表示位置の中点とは、表示位置「i−2番目(左)」によって示されるコンテンツ領域の対角線を結んだ交点に相当する。なお、このような交点の情報(例えば、座標)は、リストに含まれてコンテンツサーバ30から送信されてもよいし、広告装置100が、予め各交点の情報を有していてもよい。
そして、算出部133は、配置位置L20の中点P20と記事コンテンツA3の表示位置の中点P3を結ぶ直線の長さD3を算出する。このようにして、算出部133は、配置位置L20の中点P20と、配置位置L20周辺の各記事コンテンツの表示位置の中点を結ぶ直線の長さを算出する。かかる直線の長さが短い記事コンテンツほど、配置位置L20に近い位置にあると定めることができるため、算出部133は、かかる直線の長さが短い記事コンテンツとの類似度ほど高い重み値を乗じる。
図13の例では、配置位置L20と、i−1番目(左)の広告コンテンツA6およびi−1番目(右)の広告コンテンツA7の表示位置との距離が最も短いため、記事コンテンツA6およびA7が配置位置L20に最も近い位置にある。このため、算出部133は、広告コンテンツIと記事コンテンツA6との類似度cosA6および広告コンテンツIと記事コンテンツA7との類似度cosA7に、最も高い重み値r(0.9)を乗じる。
また、図13の例では、配置位置L20と、i+1番目(左)の記事コンテンツA8およびi+1番目(右)の記事コンテンツA9の表示位置との距離が次に短いため、記事コンテンツA8およびA9が配置位置L20に2番目に近い位置にある。このため、算出部133は、広告コンテンツIと記事コンテンツA8との類似度cosA8および広告コンテンツIと記事コンテンツA9との類似度cosA9に、2番目に高い重み値r2(0.81)を乗じる。
このようにして、算出部133は、重み値を乗じた各類似度を合計することにより、広告コンテンツIと、配置位置Lxから上下2個分までの記事コンテンツ群との関連度を示す指標値SIを算出する。具体的には、算出部133は、指標値SIを下記の式(8)によって算出することができる。
指標値SI=r4cosA3+r3cosA4+r4cosA5+rcosA6+rcosA7+r2cosA8+r2cosA9+r5cosA10+r5cosA11 ・・・(8)
そして、算出部133は、式(8)を用いて算出した指標値SIに基づいて、広告評価値を算出する。例えば、算出部133は、広告コンテンツIの評価値であるeCPMIと、式(8)を用いて算出した指標値SIとの合計値を広告評価値EIとして算出する。また、抽出部134は、各配信候補の広告コンテンツそれぞれ広告評価値EIを比較して、配信対象の広告コンテンツを抽出する。
次に、パターン2について説明する。パターン2は、重み値の付与の仕方がパターン1とは異なる。具体的には、算出部133は、配置位置L20に近い記事コンテンツとの類似度ほど高い重み値を乗じるにあたって、配置位置L20より上方向に位置する記事コンテンツとの類似度ほど高い重み値を乗じる。
例えば、算出部133は、配置位置L20から最も近く、かつ、配置位置L20の上方向に位置するi−1番目(左)の記事コンテンツA6およびi−1番目(右)の記事コンテンツA7それぞれと、広告コンテンツIとの類似度である類似度cosA6およびcosA7に最も高い重み値r(0.9)を乗じる。また、算出部133は、次に配置位置L10に近く、かつ、配置位置L10の上方向に位置するi−2番目(中)の記事コンテンツA4と、広告コンテンツIとの類似度cosA4に、番目に高い重み値r2(0.81)を乗じる。
このようにして、算出部133は、重み値を乗じた各類似度を合計することにより、広告コンテンツIと、配置位置L10から上下2個分までの記事コンテンツ群との関連度を示す指標値SIを算出する。具体的には、算出部133は、指標値SIを下記の式(9)によって算出することができる。
指標値SI=r3cosA3+r3cosA4+r3cosA5+rcosA6+rcosA7+r4cosA8+r4cosA9+r5cosA10+r5cosA11 ・・・(9)
そして、算出部133は、式(9)を用いて算出した指標値SIに基づいて、広告評価値を算出する。例えば、算出部133は、広告コンテンツIの評価値であるeCPMIと、式(9)を用いて算出した指標値SIとの合計値を広告評価値EIとして算出する。また、抽出部134は、各配信候補の広告コンテンツそれぞれ広告評価値EIを比較して、配信対象の広告コンテンツを抽出する。
〔2.画像情報を用いた類似度算出〕
上記実施形態では、算出部133が、配信候補の広告コンテンツのテキストから抽出した特徴語と、配置位置周辺に表示される記事コンテンツのテキストから抽出した特徴語とのコサイン類似度を算出する例を示した。しかし、この例に限られず、算出部133は、配信候補の広告コンテンツに対応する画像データから抽出した特徴語と、配置位置周辺に表示される記事コンテンツに対応する画像データから抽出した特徴語との類似度を算出してもよい。
〔3.広告装置の構成〕
上記各実施形態では、広告装置100または200が、コンテンツサーバ30から受け付けたリストを用いて、広告抽出処理を行う例を示した。しかし、コンテンツサーバ20と広告装置100とを一体化したものを広告装置100としてもよい。また、コンテンツサーバ20と広告装置200とを一体化したものを広告装置200としてもよい。
〔4.プログラム〕
また、上述してきた各実施形態にかかる広告装置100および200は、例えば図14に示すような構成のコンピュータ1000によって実現される。以下、広告装置100を例に挙げて説明する。図11は、広告装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、通信網50を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、通信網50を介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを、入出力インターフェイス1600を介して出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が第1の実施形態にかかる広告装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、広告情報記憶部120内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを、記録媒体1800から読み取って実行するが、他の例として、他の装置から、通信網50を介してこれらのプログラムを取得してもよい。
また、例えば、コンピュータ1000が第2の実施形態にかかる広告装置200として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部430の機能を実現する。
〔5.その他〕
上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上述してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、判定部は、判定手段や判定回路に読み替えることができる。