JP5661689B2 - Content distribution device - Google Patents

Content distribution device Download PDF

Info

Publication number
JP5661689B2
JP5661689B2 JP2012141697A JP2012141697A JP5661689B2 JP 5661689 B2 JP5661689 B2 JP 5661689B2 JP 2012141697 A JP2012141697 A JP 2012141697A JP 2012141697 A JP2012141697 A JP 2012141697A JP 5661689 B2 JP5661689 B2 JP 5661689B2
Authority
JP
Japan
Prior art keywords
content
advertisement
advertising
ctr
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012141697A
Other languages
Japanese (ja)
Other versions
JP2014006684A (en
Inventor
田中 祐介
祐介 田中
玲 田島
玲 田島
塚本 浩司
浩司 塚本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2012141697A priority Critical patent/JP5661689B2/en
Publication of JP2014006684A publication Critical patent/JP2014006684A/en
Application granted granted Critical
Publication of JP5661689B2 publication Critical patent/JP5661689B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、インターネット等のネットワークを介して広告コンテンツを配信する技術に関する。   The present invention relates to a technique for distributing advertising content via a network such as the Internet.

インターネットのホームページ等においては、バナー広告に代表されるディスプレイ広告による広告欄が設けられることが多い。   In Internet homepages and the like, there are often advertisement columns for display advertisements typified by banner advertisements.

また、広告主は1つの商材につき、視聴者の嗜好を考慮して複数の広告コンテンツを用意する場合が多い。どのような広告コンテンツが視聴者に受け入れられるかについては、予め知ることはできないので、ランダムに配信したり(例えば、4つの広告コンテンツがある場合は0.25(25%)ずつ)、所定期間のCTR(Click Through Rate)に比例した配信確率を用いたりする(例えば、4つの広告コンテンツのCTRが0.8%、0.6%、0.4%、0.2%であった場合、配信確率をCTRに比例させて40%、30%、20%、10%)。なお、CTRとは、ディスプレイ広告のような広告コンテンツが選択(クリック)された数を、配信数で割った値であり、広告効果を評価する指標の一つである。   In many cases, an advertiser prepares a plurality of advertisement contents for one product in consideration of viewer's preference. Since it is not possible to know in advance what kind of advertising content is accepted by the viewer, it can be distributed randomly (for example, 0.25 (25%) each when there are four advertising content) or for a predetermined period Distribution probability proportional to the click through rate (CTR) of (e.g., when the CTR of the four advertising contents is 0.8%, 0.6%, 0.4%, 0.2%, (Delivery probability is 40%, 30%, 20%, 10% in proportion to CTR). The CTR is a value obtained by dividing the number of selected (clicked) advertising content such as a display advertisement by the number of distributions, and is an index for evaluating the advertising effect.

特開2009−271661号公報JP 2009-271661 A

上述したように、1商材について複数の広告コンテンツが存在する場合、従来は配信確率を均等にしたり、CTRに比例した値を用いたりしていたため、広告効果を高める上で充分ではないという問題があった。   As described above, when there are a plurality of advertisement contents for one commercial item, the distribution probabilities have been made uniform or values proportional to the CTR have been used in the past, which is not sufficient for improving the advertising effect. was there.

すなわち、トータルのクリック数を最大化するためには、最も評判のいい広告コンテンツ1本に絞ることが必要であり、2位以下の広告コンテンツに相当量の配信確率を割くということはクリック数の最大化には反するからである。   In other words, in order to maximize the total number of clicks, it is necessary to focus on one of the most popular advertising content. Dividing a considerable amount of distribution probability into the second or lower advertising content means that the number of clicks This is against maximization.

しかしながら、CTRは変動が大きく、ある時点で最高の値を示していた広告コンテンツが最も評判がいい広告コンテンツであると断ずることは危険である。そのため、従来の手法を踏襲するほか術がなかった。   However, the CTR fluctuates greatly, and it is dangerous to say that the advertising content that showed the highest value at a certain point in time is the most popular advertising content. For this reason, there was no other way to follow the conventional method.

また、昨今ではボタン、メインビジュアル、キャッチコピー等をそれぞれ複数パターン用意し、それらの組み合わせにより広告コンテンツを構成する場合が多く、1商材について大量の広告コンテンツ(大量クリエイティブ)を用意する場合も多い。   In recent years, a plurality of patterns such as buttons, main visuals, and catch phrases are prepared, and the advertising content is often configured by a combination thereof. In many cases, a large amount of advertising content (mass creative) is prepared for one product. .

図1は大量クリエイティブの例を示す図であり、ロゴを6パターン、メインビジュアルを6パターン、キャッチコピーを18パターンとしたものである。この場合、広告コンテンツの総数は、それぞれの要素の組み合わせである6×6×18=648となる。   FIG. 1 is a diagram showing an example of mass creative, with 6 logo patterns, 6 main visual patterns, and 18 catch phrases. In this case, the total number of advertisement contents is 6 × 6 × 18 = 648 which is a combination of the respective elements.

このような大量クリエイティブの場合、広告の掲載期間(日時で掲載期間が定められる場合や、所定のインプレッション数(提示数)に達するまでとする場合等)内にCTRが記録されない広告コンテンツが発生することも多く、CTRに基づいて広告コンテンツの配信確率を定めること自体が困難である。   In the case of such a large amount of creatives, there is an advertising content in which CTR is not recorded within the advertisement insertion period (when the insertion period is determined by the date and time, or until the predetermined number of impressions (presentation number) is reached). In many cases, it is difficult to determine the distribution probability of advertisement content based on CTR.

一方、特許文献1には、少ない露出回数で的確にクリエイティブ(広告)の有効性を評価し、クリエイティブが効率よく露出されるようにする技術が開示されている。しかし、正規分布を用いた統計的手法に基づくものであり、必ずしも広告効果を高める上では充分ではなかった。   On the other hand, Patent Literature 1 discloses a technique for accurately evaluating the effectiveness of a creative (advertisement) with a small number of exposures so that the creative is efficiently exposed. However, it is based on a statistical method using a normal distribution, and is not necessarily sufficient for improving the advertising effect.

本発明は上記の従来の問題点に鑑み提案されたものであり、その目的とするところは、強化学習の考え方を導入するとともに、各広告コンテンツのCTRを予測することで、1商材について大量の広告コンテンツが存在する場合の広告効果を高めることにある。   The present invention has been proposed in view of the above-described conventional problems. The purpose of the present invention is to introduce the concept of reinforcement learning and to predict the CTR of each advertising content, so It is to improve the advertising effect when there is any advertising content.

上記の課題を解決するため、本発明にあっては、1つの商材についての複数の広告コンテンツを管理する広告データベースの個々の広告コンテンツに対し、当該広告コンテンツの特徴を表わす特徴量を生成する手段と、前記広告データベースから対象となる一群の広告コンテンツを選択する手段と、選択された一群の広告コンテンツの個々に対して初回の配信確率を設定する手段と、係数ベクトルを初期設定する手段と、選択された一群の広告コンテンツの個々に対して前記係数ベクトルと前記特徴量から予測CTRを算出する手段と、配信確率が設定された広告コンテンツを配信し、実績CTRを記録する手段と、広告コンテンツ毎の所定期間の前記予測CTRを報酬として、当該報酬に基づき複数の広告コンテンツの中から一の広告コンテンツの配信確率を最大化しつつ、残りの広告コンテンツにも最小限の配信確率を残すように強化学習を行い、新たな配信確率を広告コンテンツ毎に算出して設定する手段と、前記実績CTRに基づいて前記係数ベクトルを更新する手段とを備えるようにしている。   In order to solve the above-described problem, in the present invention, for each advertisement content in an advertisement database that manages a plurality of advertisement contents for one product, a feature amount that represents the feature of the advertisement content is generated. Means for selecting a target group of advertisement contents from the advertisement database, means for setting an initial delivery probability for each of the selected group of advertisement contents, means for initially setting a coefficient vector, Means for calculating the predicted CTR from the coefficient vector and the feature amount for each of the selected group of advertisement contents, means for distributing the advertisement content set with the distribution probability and recording the actual CTR, Using the predicted CTR for a predetermined period for each content as a reward, one advertisement component is selected from a plurality of advertisement contents based on the reward. Means for performing reinforcement learning so as to leave a minimum distribution probability for the remaining advertisement content while calculating and setting a new distribution probability for each advertisement content. And a means for updating the coefficient vector on the basis thereof.

本発明のコンテンツ配信装置にあっては、強化学習の考え方を導入するとともに、各広告コンテンツのCTRを予測することで、1商材について大量の広告コンテンツが存在する場合の広告効果を高めることができる。   In the content distribution apparatus of the present invention, the concept of reinforcement learning is introduced, and the CTR of each advertising content is predicted, thereby improving the advertising effect when a large amount of advertising content exists for one product. it can.

大量クリエイティブの例を示す図である。It is a figure which shows the example of a mass creative. 本発明の一実施形態にかかるシステムの構成例を示す図である。It is a figure which shows the structural example of the system concerning one Embodiment of this invention. 広告DBのデータ構造例を示す図である。It is a figure which shows the example of a data structure of advertisement DB. 実施形態の処理例を示すフローチャートである。It is a flowchart which shows the process example of embodiment. 広告コンテンツの特徴量の生成の例を示す図(その1)である。FIG. 5 is a diagram (part 1) illustrating an example of generation of a feature amount of advertisement content. 広告コンテンツの特徴量の生成の例を示す図(その2)である。FIG. 10 is a second diagram illustrating an example of generation of a feature amount of advertisement content. 初期配信確率の設定の例を示す図である。It is a figure which shows the example of the setting of an initial delivery probability. 配信確率の設定の例を示す図である。It is a figure which shows the example of the setting of a delivery probability.

以下、本発明の好適な実施形態につき説明する。   Hereinafter, preferred embodiments of the present invention will be described.

<構成>
図2は本発明の一実施形態にかかるシステムの構成例を示す図である。
<Configuration>
FIG. 2 is a diagram illustrating a configuration example of a system according to an embodiment of the present invention.

図2において、インターネット等のネットワーク1には、ユーザが操作するPC(Personal Computer)、携帯電話、PDA(Personal Digital Assistants)等の端末装置2が複数接続されている。端末装置2は、一般的なブラウザ(Webブラウザ)21を備えている。ブラウザ21は、インターネットの標準プロトコルであるHTTP(Hyper Text Transfer Protocol)等に従い、HTML(Hyper Text Markup Language)等の言語で記述されたページデータの要求・取得・表示およびフォームデータの送信等を行う機能を有している。   In FIG. 2, a plurality of terminal devices 2 such as a PC (Personal Computer), a mobile phone, and a PDA (Personal Digital Assistants) operated by a user are connected to a network 1 such as the Internet. The terminal device 2 includes a general browser (Web browser) 21. The browser 21 performs request / acquisition / display of page data described in a language such as HTML (Hyper Text Markup Language), transmission of form data, and the like according to HTTP (Hyper Text Transfer Protocol) which is a standard protocol of the Internet. It has a function.

一方、ネットワーク1には、端末装置2のブラウザ21に対して広告情報を提供する広告情報提供装置3が接続されている。   On the other hand, an advertisement information providing device 3 that provides advertisement information to the browser 21 of the terminal device 2 is connected to the network 1.

広告情報提供装置3は、機能部として、特徴量生成部301と対象広告選択部302と初期配信確率設定部303と係数ベクトル初期設定部304と予測CTR算出部305と広告情報配信・CTR記録部306と配信確率算出・設定部307と係数ベクトル更新部308とを備えている。   The advertisement information providing apparatus 3 includes, as function units, a feature amount generation unit 301, a target advertisement selection unit 302, an initial distribution probability setting unit 303, a coefficient vector initial setting unit 304, a predicted CTR calculation unit 305, and an advertisement information distribution / CTR recording unit. 306, a distribution probability calculation / setting unit 307, and a coefficient vector update unit 308.

これらの機能部は、広告情報提供装置3を構成するコンピュータのCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等のハードウェア資源上で実行されるコンピュータプログラムによって実現されるものである。これらの機能部は、単一のコンピュータ上に配置される必要はなく、必要に応じて分散される形態であってもよい。   These functional units are realized by a computer program executed on a hardware resource such as a CPU (Central Processing Unit), a ROM (Read Only Memory), and a RAM (Random Access Memory) of the computer constituting the advertisement information providing apparatus 3. It is what is done. These functional units do not need to be arranged on a single computer, and may be distributed as necessary.

また、広告情報提供装置3が利用するデータベースとして、広告DB(Data Base)309が設けられている。このデータベースは、広告情報提供装置3を構成するコンピュータ内のHDD(Hard Disk Drive)等の記憶媒体上に所定のデータを体系的に保持するものである。なお、広告DB309は広告情報提供装置3内に配置される必要はなく、他の装置上に配置してもよい。   An advertisement DB (Data Base) 309 is provided as a database used by the advertisement information providing apparatus 3. This database systematically holds predetermined data on a storage medium such as an HDD (Hard Disk Drive) in a computer constituting the advertisement information providing apparatus 3. Note that the advertisement DB 309 does not need to be arranged in the advertisement information providing apparatus 3 and may be arranged on another apparatus.

図3は広告DB309のデータ構造例を示す図である。広告DB309は、「広告ID」「広告コンテンツ数」「広告コンテンツID」「広告コンテンツデータ/リファレンス」「特徴量」「実績CTR」「予測CTR(Q値)」「配信確率」等の項目を含んでいる。「広告ID」は、一の広告主の一の商材にかかる一群の広告コンテンツを識別する情報である。「広告コンテンツ数」は、一の広告主の一の商材にかかる一群の広告コンテンツに含まれる広告コンテンツの数である。「広告コンテンツID」は、個々の広告コンテンツを識別する情報である。「広告コンテンツデータ/リファレンス」は、広告コンテンツの実データもしくは格納場所の情報である。   FIG. 3 is a diagram illustrating an example of the data structure of the advertisement DB 309. The advertisement DB 309 includes items such as “advertisement ID”, “number of advertisement contents”, “advertisement content ID”, “advertisement content data / reference”, “feature amount”, “actual CTR”, “predicted CTR (Q value)”, and “delivery probability”. It is out. “Advertisement ID” is information for identifying a group of advertisement contents related to one product of one advertiser. The “number of advertisement contents” is the number of advertisement contents included in a group of advertisement contents related to one product of one advertiser. The “advertisement content ID” is information for identifying individual advertisement content. “Advertisement content data / reference” is actual data or storage location information of the advertisement content.

「特徴量」は、各広告コンテンツの特徴を表わす情報である。詳細については後述する。「実績CTR」は、その広告コンテンツについてのCTRの実績値の記録である。「予測CTR(Q値)」は、各広告コンテンツについて「特徴量」に基づいて算出した予測されるCTRである。詳細については後述する。「配信確率」は、算出されて決定された広告コンテンツ毎の配信確率である。   The “feature amount” is information representing the feature of each advertisement content. Details will be described later. “Actual CTR” is a record of a CTR actual value for the advertisement content. The “predicted CTR (Q value)” is a predicted CTR calculated based on the “feature amount” for each advertisement content. Details will be described later. “Distribution probability” is a distribution probability for each advertisement content calculated and determined.

図2に戻り、広告情報提供装置3の特徴量生成部301は、広告DB309の各広告コンテンツに対して特徴量を生成し、広告DB309に設定する機能を有している。   Returning to FIG. 2, the feature amount generation unit 301 of the advertisement information providing device 3 has a function of generating a feature amount for each advertisement content in the advertisement DB 309 and setting it in the advertisement DB 309.

対象広告選択部302は、広告DB309から処理対象となる広告(一の広告主の一の商材にかかる一群の広告コンテンツ)を選択する機能を有している。   The target advertisement selection unit 302 has a function of selecting an advertisement to be processed (a group of advertisement contents related to one product of one advertiser) from the advertisement DB 309.

初期配信確率設定部303は、対象広告選択部302の選択した一群の広告コンテンツにつき、初期の配信確率を設定する機能を有している。   The initial distribution probability setting unit 303 has a function of setting an initial distribution probability for a group of advertisement contents selected by the target advertisement selection unit 302.

係数ベクトル初期設定部304は、予測CTRの算出に用いる係数ベクトルを初期化する機能を有している。   The coefficient vector initial setting unit 304 has a function of initializing a coefficient vector used for calculating a predicted CTR.

予測CTR算出部305は、各広告コンテンツにつき、特徴量と係数ベクトルを用いて予測CTRを算出する機能を有している。   The predicted CTR calculation unit 305 has a function of calculating a predicted CTR using a feature amount and a coefficient vector for each advertisement content.

広告情報配信・CTR記録部306は、広告DB309に登録された広告コンテンツを、設定された配信確率に基づいて端末装置2のブラウザ21に配信(一般には、端末装置2からページ要求が行われた場合に、本来のページ内容に付加する形で広告コンテンツの配信を行う)するとともに、端末装置2のブラウザ21による広告コンテンツの選択操作(バナー広告のクリック操作等)を検出し、実績CTRとして広告DB309に記録する機能を有している。   The advertisement information distribution / CTR recording unit 306 distributes the advertisement content registered in the advertisement DB 309 to the browser 21 of the terminal device 2 based on the set distribution probability (generally, a page request is made from the terminal device 2). The advertisement content is distributed in a form added to the original page content), and an advertisement content selection operation (such as a click operation of a banner advertisement) by the browser 21 of the terminal device 2 is detected and the advertisement is displayed as the actual CTR. It has a function of recording in the DB 309.

配信確率算出・設定部307は、広告DB309に記録された広告コンテンツ毎の所定期間の予測CTRに基づき、強化学習の手法により新たな配信確率を広告コンテンツ毎に算出して広告DB309に設定する機能を有している。強化学習は、大きい報酬に続く行動はより再現しやすく、小さい報酬に続く行動はより再現しづらくなるという経験的事実を基本とした方法であり、数値化された報酬信号を最大にするために、何をすべきか(どのようにして状況に基づく動作選択を行うか)を学習する(「強化学習」、三上貞芳・皆川雅章 訳、森北出版株式会社、2000年12月20日発行等を参照。)。   The distribution probability calculation / setting unit 307 calculates a new distribution probability for each advertising content by a reinforcement learning method based on the predicted CTR for each advertising content recorded in the advertising DB 309 and sets the advertising probability in the advertising DB 309. have. Reinforcement learning is based on the empirical fact that behavior following large rewards is more reproducible and behavior following small rewards is more difficult to reproduce, in order to maximize the quantified reward signal , Learn what to do (how to choose action based on the situation) ("Reinforcement learning", translation by Sadayoshi Mikami, Masaaki Minagawa, Morikita Publishing Co., Ltd., issued on December 20, 2000) reference.).

すなわち、配信確率算出・設定部307は、広告コンテンツ毎の所定期間の予測CTRを報酬として、当該報酬に基づき複数の広告コンテンツの中から一の広告コンテンツの配信確率を最大化しつつ、残りの広告コンテンツにも最小限の配信確率を残すように強化学習を行い、新たな配信確率を広告コンテンツ毎に算出して設定する。   That is, the distribution probability calculation / setting unit 307 uses the predicted CTR for a predetermined period for each advertisement content as a reward, maximizes the distribution probability of one advertisement content from the plurality of advertisement contents based on the reward, and performs the remaining advertisements. Reinforcement learning is performed so as to leave a minimum distribution probability in the content, and a new distribution probability is calculated and set for each advertising content.

係数ベクトル更新部308は、実績CTRに基づいて係数ベクトルを更新する機能を有している。   The coefficient vector update unit 308 has a function of updating the coefficient vector based on the actual CTR.

<動作>
図4は上記の実施形態の処理例を示すフローチャートである。
<Operation>
FIG. 4 is a flowchart showing a processing example of the above embodiment.

先ず、図4(a)において、広告情報提供装置3の特徴量生成部301は、広告DB309の各広告コンテンツに対して特徴量を生成し、広告DB309に設定する(ステップS100)。   First, in FIG. 4A, the feature value generation unit 301 of the advertisement information providing device 3 generates a feature value for each advertisement content in the advertisement DB 309 and sets it in the advertisement DB 309 (step S100).

図5は広告コンテンツの特徴量の生成の例を示す図である。   FIG. 5 is a diagram illustrating an example of generation of feature amounts of advertisement content.

例えば、広告コンテンツがメインビジュアルとキャッチコピーとボタンという種類の異なる構成要素の組み合わせにより構成されるものであり、メインビジュアルが7パターン、キャッチコピーが7パターン、ボタンが4パターンである場合、特徴量のベクトルとして、図5(a)に示すように、先頭からメインビジュアルに対応する7要素、キャッチコピーに対応する7要素、ボタンに対応する4要素の計18要素とする。   For example, if the advertising content is composed of a combination of different types of components such as a main visual, a catch phrase, and a button, the main visual has 7 patterns, the catch phrase has 7 patterns, and the buttons have 4 patterns. As shown in FIG. 5A, there are a total of 18 elements including 7 elements corresponding to the main visual, 7 elements corresponding to the catch phrase, and 4 elements corresponding to the buttons.

そして、例えば、メインビジュアルが第3パターン、キャッチコピーが第4パターン、ボタンが第2パターンの広告コンテンツの場合、特徴量は、図5(b)に示すように、先頭から3要素目と11要素目と16要素目を「1」とし、他を「0」とする。   For example, when the main visual is the third pattern, the catch phrase is the fourth pattern, and the button is the second pattern of the advertising content, as shown in FIG. The elements and 16th element are set to “1”, and the others are set to “0”.

図6は広告コンテンツの特徴量の生成の他の例を示す図であり、広告コンテンツが多様で構成要素の組み合わせで表現できない場合に対応したものである。   FIG. 6 is a diagram showing another example of generation of the feature amount of the advertisement content, and corresponds to a case where the advertisement content is various and cannot be expressed by a combination of components.

この場合、画像類似度に基づいて、各広告コンテンツにつき、他の広告コンテンツ(自己を含む)との距離(画像類似度)を算出し、特徴量として、
(第1の広告コンテンツとの距離,第2の広告コンテンツとの距離,・・・)
というベクトルを生成する。
In this case, based on the image similarity, for each advertising content, the distance (image similarity) from other advertising content (including self) is calculated,
(Distance to first advertising content, distance to second advertising content, ...)
Generates a vector.

図4に戻り、配信確率の設定等の処理を説明する。   Returning to FIG. 4, processing such as setting the distribution probability will be described.

図4(b)において、処理を開始すると(ステップS101)、広告情報提供装置3の対象広告選択部302は、広告DB309から処理対象となる広告(一の広告主の一の商材にかかる一群の広告コンテンツ)を選択する(ステップS102)。図3の広告DB309では広告IDを一つ選択する。   In FIG.4 (b), if a process is started (step S101), the object advertisement selection part 302 of the advertisement information provision apparatus 3 will be processed from the advertisement DB309 by the advertisement (one group concerning one product of one advertiser). Of advertisement content) is selected (step S102). In the advertisement DB 309 of FIG. 3, one advertisement ID is selected.

次いで、図4(b)に戻り、広告情報提供装置3の初期配信確率設定部303は、対象広告選択部302の選択した一群の広告コンテンツにつき、初期の配信確率を設定する(ステップS103)。初期の配信確率は一群の広告コンテンツについて同じ配信確率にすべく、選択した広告IDに対応する広告コンテンツ数を得て、逆数とすることで初期の配信確率を算出する。例えば、196個の広告コンテンツがある場合は1/196=0.0051ずつとなる。図7は初期の配信確率が設定された状態における広告DB309を示している。   4B, the initial distribution probability setting unit 303 of the advertisement information providing apparatus 3 sets an initial distribution probability for the group of advertisement contents selected by the target advertisement selecting unit 302 (step S103). The initial distribution probability is calculated by obtaining the number of advertisement contents corresponding to the selected advertisement ID and taking the reciprocal number to obtain the same distribution probability for a group of advertisement contents. For example, if there are 196 advertisement contents, 1/196 = 0.0001. FIG. 7 shows the advertisement DB 309 in a state where the initial distribution probability is set.

次いで、図4(b)に戻り、広告情報提供装置3の係数ベクトル初期設定部304は、係数ベクトルθ(=A−1b)を規定する行列A、ベクトルbを初期設定する(ステップS104)。すなわち、行列Aに特徴量の要素数に相当するd次元の単位行列を設定し、ベクトルbにd次元のゼロベクトルを設定する。 Next, returning to FIG. 4B, the coefficient vector initial setting unit 304 of the advertisement information providing apparatus 3 initializes the matrix A and the vector b that define the coefficient vector θ (= A −1 b) (step S104). . That is, a d-dimensional unit matrix corresponding to the number of elements of the feature quantity is set in the matrix A, and a d-dimensional zero vector is set in the vector b.

次いで、広告情報提供装置3の予測CTR算出部305は、選択された広告に含まれる全ての広告コンテンツa(特徴量x)に対して、予測CTR(Q値)であるQ
←x θ+α・root(x −1
により算出して設定する(ステップS105)。上付きのTは転置を示す。なお、αは誤差の許容範囲を規定する定数である。
Then, the prediction CTR calculation unit 305 of the advertisement information providing device 3, for all advertising content a included in the selected ad (features x a), the Q a is predicted CTR (Q value) Q a ← x a T θ + α · root (x a T A −1 x a )
Is calculated and set (step S105). The superscript T indicates transposition. Α is a constant that defines an allowable range of errors.

次いで、広告情報提供装置3の広告情報配信・CTR記録部306は、広告DB309に登録された広告コンテンツを、端末装置2からページ要求が行われた際に、設定された配信確率に基づいて端末装置2のブラウザ21に配信するとともに、端末装置2のブラウザ21による広告の選択操作(バナー広告のクリック操作等)を検出し、実績CTRを広告DB309に記録する(ステップS106)。   Next, the advertisement information distribution / CTR recording unit 306 of the advertisement information providing device 3 receives the advertisement content registered in the advertisement DB 309 based on the set distribution probability when a page request is made from the terminal device 2. While delivering to the browser 21 of the apparatus 2, the selection operation (click operation etc. of a banner advertisement) by the browser 21 of the terminal device 2 is detected, and the result CTR is recorded in the advertisement DB 309 (step S106).

その後、配信確率を見直す所定の期間経過後、広告情報提供装置3の配信確率算出・設定部307は、広告DB309に記録された広告コンテンツ毎の所定期間の予測CTRに基づき、強化学習の手法により新たな配信確率を広告コンテンツ毎に算出する(ステップS107)。   Thereafter, after the elapse of a predetermined period for reviewing the distribution probability, the distribution probability calculation / setting unit 307 of the advertisement information providing device 3 uses a reinforcement learning method based on the predicted CTR of the predetermined period for each advertising content recorded in the advertisement DB 309. A new distribution probability is calculated for each advertising content (step S107).

例えば、追跡法(Pursuit Methods)を用いる場合、iを広告コンテンツのインデックス(例えば、広告コンテンツが196個の場合はi=0〜195)、aを広告コンテンツ、Π(a)を広告コンテンツaの直前の配信確率、βを所定の学習率(0〜1の間の値)とすると、予測CTRが最大の広告コンテンツの配信確率は、
(Π(a)+β(1−Π(a)))/ΣΠ(a
その他の広告コンテンツの配信確率は、
(Π(a)+β(0−Π(a)))/ΣΠ(a
とする。ΣΠ(a)で割っているのは正規化するためである。
For example, when pursuit methods are used, i is an index of advertising content (for example, if the advertising content is 196, i = 0 to 195), a i is advertising content, and Π (a i ) is advertising content. When the distribution probability immediately before a i and β is a predetermined learning rate (a value between 0 and 1), the distribution probability of the advertising content with the maximum predicted CTR is
(Π (a i ) + β (1−Π (a i ))) / ΣΠ (a i )
The delivery probability of other advertising content is
(Π (a i ) + β (0−Π (a i ))) / ΣΠ (a i )
And The reason for dividing by ΣΠ (a i ) is for normalization.

行動選択規則(εグリーディ手法)を用いる場合、εを所定の定数(0〜1の間の値)、広告コンテンツの数をnとすると、予測CTRが最大の広告コンテンツの配信確率は、
1−ε
その他の広告コンテンツの配信確率は、
ε/(n−1)
とする。
When the action selection rule (ε-greedy method) is used, when ε is a predetermined constant (a value between 0 and 1) and the number of advertising content is n, the distribution probability of the advertising content with the maximum predicted CTR is
1-ε
The delivery probability of other advertising content is
ε / (n-1)
And

次いで、広告情報提供装置3の配信確率算出・設定部307は、算出された新たな配信確率を広告DB309に設定する(ステップS108)。図8は、εグリーディ手法によりε=0.1とした場合に、配信確率が更新された状態の広告DB309を示している。   Next, the distribution probability calculation / setting unit 307 of the advertisement information providing apparatus 3 sets the calculated new distribution probability in the advertisement DB 309 (step S108). FIG. 8 shows the advertisement DB 309 in a state where the distribution probability is updated when ε = 0.1 by the ε greedy method.

次いで、図4(b)に戻り、広告情報提供装置3の係数ベクトル更新部308は、広告コンテンツaの実績CTRの算出の元となるインプレッション数v、クリック数rに基づいて係数ベクトルθを更新する(ステップS109)。すなわち、
A←A+v
b←b+r
とする。
Then, back in FIG. 4 (b), the coefficient vector updating unit 308 of the advertisement information providing device 3, the number of impressions the original calculation of the actual CTR of advertisement content a v a, the coefficient vector based on the number of clicks r a theta Is updated (step S109). That is,
A ← A + v a x a x a T
b ← b + r a x a
And

その後、予測CTRの算出(ステップS105)に戻り、同様の処理を繰り返す。   Then, it returns to calculation of prediction CTR (step S105), and repeats the same process.

<総括>
以上説明したように、本実施形態によれば、強化学習の考え方を導入することで、1商材について複数の広告コンテンツが存在する場合の広告効果を高めることができる。
<Summary>
As described above, according to the present embodiment, by introducing the concept of reinforcement learning, it is possible to enhance the advertising effect when there are a plurality of advertising contents for one product.

また、広告コンテンツが大量に存在する場合であっても、全ての広告コンテンツについて予測CTRを付与することで、配信確率の設定の精度を高めることができる。   Further, even when a large amount of advertising content exists, the accuracy of setting the distribution probability can be improved by assigning the predicted CTR for all the advertising content.

以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。   The present invention has been described above by the preferred embodiments of the present invention. While the invention has been described with reference to specific embodiments, various modifications and changes may be made to the embodiments without departing from the broad spirit and scope of the invention as defined in the claims. Obviously you can. In other words, the present invention should not be construed as being limited by the details of the specific examples and the accompanying drawings.

1 ネットワーク
2 端末装置
21 ブラウザ
3 広告情報提供装置
301 特徴量生成部
302 対象広告選択部
303 初期配信確率設定部
304 係数ベクトル初期設定部
305 予測CTR算出部
306 広告情報配信・CTR記録部
307 配信確率算出・設定部
308 係数ベクトル更新部
309 広告DB
DESCRIPTION OF SYMBOLS 1 Network 2 Terminal apparatus 21 Browser 3 Advertisement information provision apparatus 301 Feature-value production | generation part 302 Target advertisement selection part 303 Initial delivery probability setting part 304 Coefficient vector initial setting part 305 Predictive CTR calculation part 306 Advertisement information delivery and CTR recording part 307 Delivery probability Calculation / setting unit 308 Coefficient vector update unit 309 Advertising DB

Claims (5)

1つの商材についての複数の広告コンテンツを管理する広告データベースの個々の広告コンテンツに対し、当該広告コンテンツの特徴を表わす特徴量を生成する手段と、
前記広告データベースから対象となる一群の広告コンテンツを選択する手段と、
選択された一群の広告コンテンツの個々に対して初回の配信確率を設定する手段と、
係数ベクトルを初期設定する手段と、
選択された一群の広告コンテンツの個々に対して前記係数ベクトルと前記特徴量から予測CTRを算出する手段と、
配信確率が設定された広告コンテンツを配信し、実績CTRを記録する手段と、
広告コンテンツ毎の所定期間の前記予測CTRを報酬として、当該報酬に基づき複数の広告コンテンツの中から一の広告コンテンツの配信確率を最大化しつつ、残りの広告コンテンツにも最小限の配信確率を残すように強化学習を行い、新たな配信確率を広告コンテンツ毎に算出して設定する手段と、
前記実績CTRに基づいて前記係数ベクトルを更新する手段と
を備えたことを特徴とするコンテンツ配信装置。
Means for generating, for each advertisement content in an advertisement database that manages a plurality of advertisement contents for one product, a feature value representing the feature of the advertisement content;
Means for selecting a group of targeted advertising content from the advertising database;
A means of setting an initial delivery probability for each of a selected group of advertising content;
Means for initializing the coefficient vector;
Means for calculating a predicted CTR from the coefficient vector and the feature amount for each of the selected group of advertising content;
Means for distributing the advertising content with the distribution probability set and recording the actual CTR;
Using the predicted CTR for a predetermined period for each advertising content as a reward, maximizing the distribution probability of one advertising content out of a plurality of advertising contents based on the reward, leaving the minimum distribution probability for the remaining advertising content Reinforce learning and calculating and setting a new distribution probability for each advertising content,
And a means for updating the coefficient vector based on the actual CTR.
請求項1に記載のコンテンツ配信装置において、
前記特徴量は、広告コンテンツの構成要素の種類毎のパターン数の総和の要素数をもつベクトルであり、実際に用いられる構成要素の種類毎のパターン位置に対応する要素を「1」とし、他の要素を「0」とする
ことを特徴とするコンテンツ配信装置。
The content delivery apparatus according to claim 1,
The feature amount is a vector having the total number of patterns for each type of component of the advertising content, and the element corresponding to the pattern position for each type of component actually used is set to “1”. A content distribution apparatus characterized in that the element of “0” is set to “0”.
請求項1に記載のコンテンツ配信装置において、
前記特徴量は、各広告コンテンツと他の全ての広告コンテンツとの画像類似度を要素にもつベクトルである
ことを特徴とするコンテンツ配信装置。
The content delivery apparatus according to claim 1,
The content distribution apparatus, wherein the feature amount is a vector having an element of image similarity between each advertisement content and all other advertisement content.
請求項1乃至3のいずれか一項に記載のコンテンツ配信装置において、
前記強化学習として、追跡法もしくは行動選択規則のいずれかを用いる
ことを特徴とするコンテンツ配信装置。
In the content delivery apparatus as described in any one of Claims 1 thru | or 3,
Either of the tracking method or the action selection rule is used as the reinforcement learning.
コンテンツ配信装置が、1つの商材についての複数の広告コンテンツを管理する広告データベースの個々の広告コンテンツに対し、当該広告コンテンツの特徴を表わす特徴量を生成する工程と、
前記コンテンツ配信装置が、前記広告データベースから対象となる一群の広告コンテンツを選択する工程と、
前記コンテンツ配信装置が、選択された一群の広告コンテンツの個々に対して初回の配信確率を設定する工程と、
前記コンテンツ配信装置が、係数ベクトルを初期設定する工程と、
前記コンテンツ配信装置が、選択された一群の広告コンテンツの個々に対して前記係数ベクトルと前記特徴量から予測CTRを算出する工程と、
前記コンテンツ配信装置が、配信確率が設定された広告コンテンツを配信し、実績CTRを記録する工程と、
前記コンテンツ配信装置が、広告コンテンツ毎の所定期間の前記予測CTRを報酬として、当該報酬に基づき複数の広告コンテンツの中から一の広告コンテンツの配信確率を最大化しつつ、残りの広告コンテンツにも最小限の配信確率を残すように強化学習を行い、新たな配信確率を広告コンテンツ毎に算出して設定する工程と、
前記コンテンツ配信装置が、前記実績CTRに基づいて前記係数ベクトルを更新する工程と
を備えたことを特徴とするコンテンツ配信方法。
A step of generating, for each advertisement content in an advertisement database managing a plurality of advertisement contents for one product, a feature amount representing a feature of the advertisement content;
The content distribution device selecting a target group of advertising content from the advertising database;
The content distribution device setting an initial distribution probability for each of the selected group of advertising content;
The content distribution device initializing a coefficient vector;
The content distribution device calculating a predicted CTR from the coefficient vector and the feature amount for each of the selected group of advertisement content;
The content distribution device distributes the advertising content set with the distribution probability and records the actual CTR;
The content distribution device uses the predicted CTR for a predetermined period for each advertisement content as a reward, and maximizes the distribution probability of one advertisement content out of a plurality of advertisement contents based on the reward, while also minimizing the remaining advertisement content Performing reinforcement learning so as to leave a limited delivery probability, calculating and setting a new delivery probability for each advertising content,
The content distribution method comprising: a step of updating the coefficient vector based on the actual CTR.
JP2012141697A 2012-06-25 2012-06-25 Content distribution device Active JP5661689B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012141697A JP5661689B2 (en) 2012-06-25 2012-06-25 Content distribution device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012141697A JP5661689B2 (en) 2012-06-25 2012-06-25 Content distribution device

Publications (2)

Publication Number Publication Date
JP2014006684A JP2014006684A (en) 2014-01-16
JP5661689B2 true JP5661689B2 (en) 2015-01-28

Family

ID=50104347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012141697A Active JP5661689B2 (en) 2012-06-25 2012-06-25 Content distribution device

Country Status (1)

Country Link
JP (1) JP5661689B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6543986B2 (en) * 2015-03-25 2019-07-17 日本電気株式会社 INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND PROGRAM
JP6436951B2 (en) * 2016-09-15 2018-12-12 Necパーソナルコンピュータ株式会社 ADVERTISEMENT APPARATUS, ADVERTISEMENT APPARATUS PROCESSING METHOD, AND PROGRAM
JP6229861B1 (en) * 2016-10-14 2017-11-15 株式会社セガゲームス Advertisement control apparatus and program
JP6870981B2 (en) * 2016-12-21 2021-05-12 ヤフー株式会社 Calculation device, calculation method and calculation program
JP7000200B2 (en) * 2018-02-22 2022-01-19 株式会社野村総合研究所 Advertising effectiveness prediction system, method and program
JP7275216B2 (en) * 2021-09-03 2023-05-17 株式会社サイバーエージェント ADVERTISING PRODUCTION SUPPORT PROGRAM, ADVERTISING PRODUCTION SUPPORT DEVICE, AND ADVERTISING PRODUCTION SUPPORT METHOD

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4880962B2 (en) * 2004-09-27 2012-02-22 ヤフー株式会社 Advertisement content distribution ratio calculation program, advertisement content distribution ratio calculation method, advertisement content distribution ratio calculation system, content distribution control system, advertisement content distribution control system, advertisement content distribution control method, and advertisement content distribution control program
US9111286B2 (en) * 2008-02-01 2015-08-18 Qualcomm, Incorporated Multiple actions and icons for mobile advertising
JP4702642B2 (en) * 2008-05-02 2011-06-15 憲司 須藤 Creative optimization server, creative optimization system, creative optimization method, and program
JPWO2011105487A1 (en) * 2010-02-25 2013-06-20 Fringe81株式会社 Server device and program for advertisement image distribution

Also Published As

Publication number Publication date
JP2014006684A (en) 2014-01-16

Similar Documents

Publication Publication Date Title
Han et al. Mobile app analytics
US20190130457A1 (en) Methods and systems for modeling campaign goal adjustment
JP5661689B2 (en) Content distribution device
US9396444B2 (en) Predictive analytics with forecasting model selection
JP5265659B2 (en) Advertisement information providing device
US9083562B2 (en) Predictive analysis of network analytics
US20170017986A1 (en) Tracking digital design asset usage and performance
EP2590128A1 (en) Information processing device, information processing method, information processing program, and recording medium in which information processing program is recorded
JP5296045B2 (en) Advertisement information providing device
Paulson et al. Efficient large-scale internet media selection optimization for online display advertising
JP5855511B2 (en) Advertisement distribution support apparatus, advertisement distribution apparatus, advertisement distribution method and program
US20160210656A1 (en) System for marketing touchpoint attribution bias correction
EP2297688A2 (en) Advertising forecast and revenue systems and methods
CN103716338A (en) Information push method and device
CN101923694A (en) Being used for popular product implants
CN103329153A (en) Systems, methods and media for providing virtual badges
US11734728B2 (en) Method and apparatus for providing web advertisements to users
US20130066708A1 (en) Online advertising system and a method of operating the same
US9922340B1 (en) Evaluating attribution models based on simulated activity streams
US20140195340A1 (en) Advertisement information providing device and advertisement information providing method
US10181130B2 (en) Real-time updates to digital marketing forecast models
US20150227963A1 (en) Systems, methods, and apparatus for budget allocation
JP5506867B2 (en) Content distribution device
CN108062684B (en) Method and device for predicting click rate of advertisement
US20130006761A1 (en) Method, system, and article of manufacture for generating ad groups for on-line advertising

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141111

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141203

R150 Certificate of patent or registration of utility model

Ref document number: 5661689

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350