JP5661689B2 - Content distribution device - Google Patents
Content distribution device Download PDFInfo
- Publication number
- JP5661689B2 JP5661689B2 JP2012141697A JP2012141697A JP5661689B2 JP 5661689 B2 JP5661689 B2 JP 5661689B2 JP 2012141697 A JP2012141697 A JP 2012141697A JP 2012141697 A JP2012141697 A JP 2012141697A JP 5661689 B2 JP5661689 B2 JP 5661689B2
- Authority
- JP
- Japan
- Prior art keywords
- content
- advertisement
- advertising
- ctr
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000009826 distribution Methods 0.000 title claims description 60
- 238000000034 method Methods 0.000 claims description 12
- 230000002787 reinforcement Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Description
本発明は、インターネット等のネットワークを介して広告コンテンツを配信する技術に関する。 The present invention relates to a technique for distributing advertising content via a network such as the Internet.
インターネットのホームページ等においては、バナー広告に代表されるディスプレイ広告による広告欄が設けられることが多い。 In Internet homepages and the like, there are often advertisement columns for display advertisements typified by banner advertisements.
また、広告主は1つの商材につき、視聴者の嗜好を考慮して複数の広告コンテンツを用意する場合が多い。どのような広告コンテンツが視聴者に受け入れられるかについては、予め知ることはできないので、ランダムに配信したり(例えば、4つの広告コンテンツがある場合は0.25(25%)ずつ)、所定期間のCTR(Click Through Rate)に比例した配信確率を用いたりする(例えば、4つの広告コンテンツのCTRが0.8%、0.6%、0.4%、0.2%であった場合、配信確率をCTRに比例させて40%、30%、20%、10%)。なお、CTRとは、ディスプレイ広告のような広告コンテンツが選択(クリック)された数を、配信数で割った値であり、広告効果を評価する指標の一つである。 In many cases, an advertiser prepares a plurality of advertisement contents for one product in consideration of viewer's preference. Since it is not possible to know in advance what kind of advertising content is accepted by the viewer, it can be distributed randomly (for example, 0.25 (25%) each when there are four advertising content) or for a predetermined period Distribution probability proportional to the click through rate (CTR) of (e.g., when the CTR of the four advertising contents is 0.8%, 0.6%, 0.4%, 0.2%, (Delivery probability is 40%, 30%, 20%, 10% in proportion to CTR). The CTR is a value obtained by dividing the number of selected (clicked) advertising content such as a display advertisement by the number of distributions, and is an index for evaluating the advertising effect.
上述したように、1商材について複数の広告コンテンツが存在する場合、従来は配信確率を均等にしたり、CTRに比例した値を用いたりしていたため、広告効果を高める上で充分ではないという問題があった。 As described above, when there are a plurality of advertisement contents for one commercial item, the distribution probabilities have been made uniform or values proportional to the CTR have been used in the past, which is not sufficient for improving the advertising effect. was there.
すなわち、トータルのクリック数を最大化するためには、最も評判のいい広告コンテンツ1本に絞ることが必要であり、2位以下の広告コンテンツに相当量の配信確率を割くということはクリック数の最大化には反するからである。 In other words, in order to maximize the total number of clicks, it is necessary to focus on one of the most popular advertising content. Dividing a considerable amount of distribution probability into the second or lower advertising content means that the number of clicks This is against maximization.
しかしながら、CTRは変動が大きく、ある時点で最高の値を示していた広告コンテンツが最も評判がいい広告コンテンツであると断ずることは危険である。そのため、従来の手法を踏襲するほか術がなかった。 However, the CTR fluctuates greatly, and it is dangerous to say that the advertising content that showed the highest value at a certain point in time is the most popular advertising content. For this reason, there was no other way to follow the conventional method.
また、昨今ではボタン、メインビジュアル、キャッチコピー等をそれぞれ複数パターン用意し、それらの組み合わせにより広告コンテンツを構成する場合が多く、1商材について大量の広告コンテンツ(大量クリエイティブ)を用意する場合も多い。 In recent years, a plurality of patterns such as buttons, main visuals, and catch phrases are prepared, and the advertising content is often configured by a combination thereof. In many cases, a large amount of advertising content (mass creative) is prepared for one product. .
図1は大量クリエイティブの例を示す図であり、ロゴを6パターン、メインビジュアルを6パターン、キャッチコピーを18パターンとしたものである。この場合、広告コンテンツの総数は、それぞれの要素の組み合わせである6×6×18=648となる。 FIG. 1 is a diagram showing an example of mass creative, with 6 logo patterns, 6 main visual patterns, and 18 catch phrases. In this case, the total number of advertisement contents is 6 × 6 × 18 = 648 which is a combination of the respective elements.
このような大量クリエイティブの場合、広告の掲載期間(日時で掲載期間が定められる場合や、所定のインプレッション数(提示数)に達するまでとする場合等)内にCTRが記録されない広告コンテンツが発生することも多く、CTRに基づいて広告コンテンツの配信確率を定めること自体が困難である。 In the case of such a large amount of creatives, there is an advertising content in which CTR is not recorded within the advertisement insertion period (when the insertion period is determined by the date and time, or until the predetermined number of impressions (presentation number) is reached). In many cases, it is difficult to determine the distribution probability of advertisement content based on CTR.
一方、特許文献1には、少ない露出回数で的確にクリエイティブ(広告)の有効性を評価し、クリエイティブが効率よく露出されるようにする技術が開示されている。しかし、正規分布を用いた統計的手法に基づくものであり、必ずしも広告効果を高める上では充分ではなかった。 On the other hand, Patent Literature 1 discloses a technique for accurately evaluating the effectiveness of a creative (advertisement) with a small number of exposures so that the creative is efficiently exposed. However, it is based on a statistical method using a normal distribution, and is not necessarily sufficient for improving the advertising effect.
本発明は上記の従来の問題点に鑑み提案されたものであり、その目的とするところは、強化学習の考え方を導入するとともに、各広告コンテンツのCTRを予測することで、1商材について大量の広告コンテンツが存在する場合の広告効果を高めることにある。 The present invention has been proposed in view of the above-described conventional problems. The purpose of the present invention is to introduce the concept of reinforcement learning and to predict the CTR of each advertising content, so It is to improve the advertising effect when there is any advertising content.
上記の課題を解決するため、本発明にあっては、1つの商材についての複数の広告コンテンツを管理する広告データベースの個々の広告コンテンツに対し、当該広告コンテンツの特徴を表わす特徴量を生成する手段と、前記広告データベースから対象となる一群の広告コンテンツを選択する手段と、選択された一群の広告コンテンツの個々に対して初回の配信確率を設定する手段と、係数ベクトルを初期設定する手段と、選択された一群の広告コンテンツの個々に対して前記係数ベクトルと前記特徴量から予測CTRを算出する手段と、配信確率が設定された広告コンテンツを配信し、実績CTRを記録する手段と、広告コンテンツ毎の所定期間の前記予測CTRを報酬として、当該報酬に基づき複数の広告コンテンツの中から一の広告コンテンツの配信確率を最大化しつつ、残りの広告コンテンツにも最小限の配信確率を残すように強化学習を行い、新たな配信確率を広告コンテンツ毎に算出して設定する手段と、前記実績CTRに基づいて前記係数ベクトルを更新する手段とを備えるようにしている。 In order to solve the above-described problem, in the present invention, for each advertisement content in an advertisement database that manages a plurality of advertisement contents for one product, a feature amount that represents the feature of the advertisement content is generated. Means for selecting a target group of advertisement contents from the advertisement database, means for setting an initial delivery probability for each of the selected group of advertisement contents, means for initially setting a coefficient vector, Means for calculating the predicted CTR from the coefficient vector and the feature amount for each of the selected group of advertisement contents, means for distributing the advertisement content set with the distribution probability and recording the actual CTR, Using the predicted CTR for a predetermined period for each content as a reward, one advertisement component is selected from a plurality of advertisement contents based on the reward. Means for performing reinforcement learning so as to leave a minimum distribution probability for the remaining advertisement content while calculating and setting a new distribution probability for each advertisement content. And a means for updating the coefficient vector on the basis thereof.
本発明のコンテンツ配信装置にあっては、強化学習の考え方を導入するとともに、各広告コンテンツのCTRを予測することで、1商材について大量の広告コンテンツが存在する場合の広告効果を高めることができる。 In the content distribution apparatus of the present invention, the concept of reinforcement learning is introduced, and the CTR of each advertising content is predicted, thereby improving the advertising effect when a large amount of advertising content exists for one product. it can.
以下、本発明の好適な実施形態につき説明する。 Hereinafter, preferred embodiments of the present invention will be described.
<構成>
図2は本発明の一実施形態にかかるシステムの構成例を示す図である。
<Configuration>
FIG. 2 is a diagram illustrating a configuration example of a system according to an embodiment of the present invention.
図2において、インターネット等のネットワーク1には、ユーザが操作するPC(Personal Computer)、携帯電話、PDA(Personal Digital Assistants)等の端末装置2が複数接続されている。端末装置2は、一般的なブラウザ(Webブラウザ)21を備えている。ブラウザ21は、インターネットの標準プロトコルであるHTTP(Hyper Text Transfer Protocol)等に従い、HTML(Hyper Text Markup Language)等の言語で記述されたページデータの要求・取得・表示およびフォームデータの送信等を行う機能を有している。 In FIG. 2, a plurality of terminal devices 2 such as a PC (Personal Computer), a mobile phone, and a PDA (Personal Digital Assistants) operated by a user are connected to a network 1 such as the Internet. The terminal device 2 includes a general browser (Web browser) 21. The browser 21 performs request / acquisition / display of page data described in a language such as HTML (Hyper Text Markup Language), transmission of form data, and the like according to HTTP (Hyper Text Transfer Protocol) which is a standard protocol of the Internet. It has a function.
一方、ネットワーク1には、端末装置2のブラウザ21に対して広告情報を提供する広告情報提供装置3が接続されている。 On the other hand, an advertisement information providing device 3 that provides advertisement information to the browser 21 of the terminal device 2 is connected to the network 1.
広告情報提供装置3は、機能部として、特徴量生成部301と対象広告選択部302と初期配信確率設定部303と係数ベクトル初期設定部304と予測CTR算出部305と広告情報配信・CTR記録部306と配信確率算出・設定部307と係数ベクトル更新部308とを備えている。 The advertisement information providing apparatus 3 includes, as function units, a feature amount generation unit 301, a target advertisement selection unit 302, an initial distribution probability setting unit 303, a coefficient vector initial setting unit 304, a predicted CTR calculation unit 305, and an advertisement information distribution / CTR recording unit. 306, a distribution probability calculation / setting unit 307, and a coefficient vector update unit 308.
これらの機能部は、広告情報提供装置3を構成するコンピュータのCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等のハードウェア資源上で実行されるコンピュータプログラムによって実現されるものである。これらの機能部は、単一のコンピュータ上に配置される必要はなく、必要に応じて分散される形態であってもよい。 These functional units are realized by a computer program executed on a hardware resource such as a CPU (Central Processing Unit), a ROM (Read Only Memory), and a RAM (Random Access Memory) of the computer constituting the advertisement information providing apparatus 3. It is what is done. These functional units do not need to be arranged on a single computer, and may be distributed as necessary.
また、広告情報提供装置3が利用するデータベースとして、広告DB(Data Base)309が設けられている。このデータベースは、広告情報提供装置3を構成するコンピュータ内のHDD(Hard Disk Drive)等の記憶媒体上に所定のデータを体系的に保持するものである。なお、広告DB309は広告情報提供装置3内に配置される必要はなく、他の装置上に配置してもよい。 An advertisement DB (Data Base) 309 is provided as a database used by the advertisement information providing apparatus 3. This database systematically holds predetermined data on a storage medium such as an HDD (Hard Disk Drive) in a computer constituting the advertisement information providing apparatus 3. Note that the advertisement DB 309 does not need to be arranged in the advertisement information providing apparatus 3 and may be arranged on another apparatus.
図3は広告DB309のデータ構造例を示す図である。広告DB309は、「広告ID」「広告コンテンツ数」「広告コンテンツID」「広告コンテンツデータ/リファレンス」「特徴量」「実績CTR」「予測CTR(Q値)」「配信確率」等の項目を含んでいる。「広告ID」は、一の広告主の一の商材にかかる一群の広告コンテンツを識別する情報である。「広告コンテンツ数」は、一の広告主の一の商材にかかる一群の広告コンテンツに含まれる広告コンテンツの数である。「広告コンテンツID」は、個々の広告コンテンツを識別する情報である。「広告コンテンツデータ/リファレンス」は、広告コンテンツの実データもしくは格納場所の情報である。 FIG. 3 is a diagram illustrating an example of the data structure of the advertisement DB 309. The advertisement DB 309 includes items such as “advertisement ID”, “number of advertisement contents”, “advertisement content ID”, “advertisement content data / reference”, “feature amount”, “actual CTR”, “predicted CTR (Q value)”, and “delivery probability”. It is out. “Advertisement ID” is information for identifying a group of advertisement contents related to one product of one advertiser. The “number of advertisement contents” is the number of advertisement contents included in a group of advertisement contents related to one product of one advertiser. The “advertisement content ID” is information for identifying individual advertisement content. “Advertisement content data / reference” is actual data or storage location information of the advertisement content.
「特徴量」は、各広告コンテンツの特徴を表わす情報である。詳細については後述する。「実績CTR」は、その広告コンテンツについてのCTRの実績値の記録である。「予測CTR(Q値)」は、各広告コンテンツについて「特徴量」に基づいて算出した予測されるCTRである。詳細については後述する。「配信確率」は、算出されて決定された広告コンテンツ毎の配信確率である。 The “feature amount” is information representing the feature of each advertisement content. Details will be described later. “Actual CTR” is a record of a CTR actual value for the advertisement content. The “predicted CTR (Q value)” is a predicted CTR calculated based on the “feature amount” for each advertisement content. Details will be described later. “Distribution probability” is a distribution probability for each advertisement content calculated and determined.
図2に戻り、広告情報提供装置3の特徴量生成部301は、広告DB309の各広告コンテンツに対して特徴量を生成し、広告DB309に設定する機能を有している。 Returning to FIG. 2, the feature amount generation unit 301 of the advertisement information providing device 3 has a function of generating a feature amount for each advertisement content in the advertisement DB 309 and setting it in the advertisement DB 309.
対象広告選択部302は、広告DB309から処理対象となる広告(一の広告主の一の商材にかかる一群の広告コンテンツ)を選択する機能を有している。 The target advertisement selection unit 302 has a function of selecting an advertisement to be processed (a group of advertisement contents related to one product of one advertiser) from the advertisement DB 309.
初期配信確率設定部303は、対象広告選択部302の選択した一群の広告コンテンツにつき、初期の配信確率を設定する機能を有している。 The initial distribution probability setting unit 303 has a function of setting an initial distribution probability for a group of advertisement contents selected by the target advertisement selection unit 302.
係数ベクトル初期設定部304は、予測CTRの算出に用いる係数ベクトルを初期化する機能を有している。 The coefficient vector initial setting unit 304 has a function of initializing a coefficient vector used for calculating a predicted CTR.
予測CTR算出部305は、各広告コンテンツにつき、特徴量と係数ベクトルを用いて予測CTRを算出する機能を有している。 The predicted CTR calculation unit 305 has a function of calculating a predicted CTR using a feature amount and a coefficient vector for each advertisement content.
広告情報配信・CTR記録部306は、広告DB309に登録された広告コンテンツを、設定された配信確率に基づいて端末装置2のブラウザ21に配信(一般には、端末装置2からページ要求が行われた場合に、本来のページ内容に付加する形で広告コンテンツの配信を行う)するとともに、端末装置2のブラウザ21による広告コンテンツの選択操作(バナー広告のクリック操作等)を検出し、実績CTRとして広告DB309に記録する機能を有している。 The advertisement information distribution / CTR recording unit 306 distributes the advertisement content registered in the advertisement DB 309 to the browser 21 of the terminal device 2 based on the set distribution probability (generally, a page request is made from the terminal device 2). The advertisement content is distributed in a form added to the original page content), and an advertisement content selection operation (such as a click operation of a banner advertisement) by the browser 21 of the terminal device 2 is detected and the advertisement is displayed as the actual CTR. It has a function of recording in the DB 309.
配信確率算出・設定部307は、広告DB309に記録された広告コンテンツ毎の所定期間の予測CTRに基づき、強化学習の手法により新たな配信確率を広告コンテンツ毎に算出して広告DB309に設定する機能を有している。強化学習は、大きい報酬に続く行動はより再現しやすく、小さい報酬に続く行動はより再現しづらくなるという経験的事実を基本とした方法であり、数値化された報酬信号を最大にするために、何をすべきか(どのようにして状況に基づく動作選択を行うか)を学習する(「強化学習」、三上貞芳・皆川雅章 訳、森北出版株式会社、2000年12月20日発行等を参照。)。 The distribution probability calculation / setting unit 307 calculates a new distribution probability for each advertising content by a reinforcement learning method based on the predicted CTR for each advertising content recorded in the advertising DB 309 and sets the advertising probability in the advertising DB 309. have. Reinforcement learning is based on the empirical fact that behavior following large rewards is more reproducible and behavior following small rewards is more difficult to reproduce, in order to maximize the quantified reward signal , Learn what to do (how to choose action based on the situation) ("Reinforcement learning", translation by Sadayoshi Mikami, Masaaki Minagawa, Morikita Publishing Co., Ltd., issued on December 20, 2000) reference.).
すなわち、配信確率算出・設定部307は、広告コンテンツ毎の所定期間の予測CTRを報酬として、当該報酬に基づき複数の広告コンテンツの中から一の広告コンテンツの配信確率を最大化しつつ、残りの広告コンテンツにも最小限の配信確率を残すように強化学習を行い、新たな配信確率を広告コンテンツ毎に算出して設定する。 That is, the distribution probability calculation / setting unit 307 uses the predicted CTR for a predetermined period for each advertisement content as a reward, maximizes the distribution probability of one advertisement content from the plurality of advertisement contents based on the reward, and performs the remaining advertisements. Reinforcement learning is performed so as to leave a minimum distribution probability in the content, and a new distribution probability is calculated and set for each advertising content.
係数ベクトル更新部308は、実績CTRに基づいて係数ベクトルを更新する機能を有している。 The coefficient vector update unit 308 has a function of updating the coefficient vector based on the actual CTR.
<動作>
図4は上記の実施形態の処理例を示すフローチャートである。
<Operation>
FIG. 4 is a flowchart showing a processing example of the above embodiment.
先ず、図4(a)において、広告情報提供装置3の特徴量生成部301は、広告DB309の各広告コンテンツに対して特徴量を生成し、広告DB309に設定する(ステップS100)。 First, in FIG. 4A, the feature value generation unit 301 of the advertisement information providing device 3 generates a feature value for each advertisement content in the advertisement DB 309 and sets it in the advertisement DB 309 (step S100).
図5は広告コンテンツの特徴量の生成の例を示す図である。 FIG. 5 is a diagram illustrating an example of generation of feature amounts of advertisement content.
例えば、広告コンテンツがメインビジュアルとキャッチコピーとボタンという種類の異なる構成要素の組み合わせにより構成されるものであり、メインビジュアルが7パターン、キャッチコピーが7パターン、ボタンが4パターンである場合、特徴量のベクトルとして、図5(a)に示すように、先頭からメインビジュアルに対応する7要素、キャッチコピーに対応する7要素、ボタンに対応する4要素の計18要素とする。 For example, if the advertising content is composed of a combination of different types of components such as a main visual, a catch phrase, and a button, the main visual has 7 patterns, the catch phrase has 7 patterns, and the buttons have 4 patterns. As shown in FIG. 5A, there are a total of 18 elements including 7 elements corresponding to the main visual, 7 elements corresponding to the catch phrase, and 4 elements corresponding to the buttons.
そして、例えば、メインビジュアルが第3パターン、キャッチコピーが第4パターン、ボタンが第2パターンの広告コンテンツの場合、特徴量は、図5(b)に示すように、先頭から3要素目と11要素目と16要素目を「1」とし、他を「0」とする。 For example, when the main visual is the third pattern, the catch phrase is the fourth pattern, and the button is the second pattern of the advertising content, as shown in FIG. The elements and 16th element are set to “1”, and the others are set to “0”.
図6は広告コンテンツの特徴量の生成の他の例を示す図であり、広告コンテンツが多様で構成要素の組み合わせで表現できない場合に対応したものである。 FIG. 6 is a diagram showing another example of generation of the feature amount of the advertisement content, and corresponds to a case where the advertisement content is various and cannot be expressed by a combination of components.
この場合、画像類似度に基づいて、各広告コンテンツにつき、他の広告コンテンツ(自己を含む)との距離(画像類似度)を算出し、特徴量として、
(第1の広告コンテンツとの距離,第2の広告コンテンツとの距離,・・・)
というベクトルを生成する。
In this case, based on the image similarity, for each advertising content, the distance (image similarity) from other advertising content (including self) is calculated,
(Distance to first advertising content, distance to second advertising content, ...)
Generates a vector.
図4に戻り、配信確率の設定等の処理を説明する。 Returning to FIG. 4, processing such as setting the distribution probability will be described.
図4(b)において、処理を開始すると(ステップS101)、広告情報提供装置3の対象広告選択部302は、広告DB309から処理対象となる広告(一の広告主の一の商材にかかる一群の広告コンテンツ)を選択する(ステップS102)。図3の広告DB309では広告IDを一つ選択する。 In FIG.4 (b), if a process is started (step S101), the object advertisement selection part 302 of the advertisement information provision apparatus 3 will be processed from the advertisement DB309 by the advertisement (one group concerning one product of one advertiser). Of advertisement content) is selected (step S102). In the advertisement DB 309 of FIG. 3, one advertisement ID is selected.
次いで、図4(b)に戻り、広告情報提供装置3の初期配信確率設定部303は、対象広告選択部302の選択した一群の広告コンテンツにつき、初期の配信確率を設定する(ステップS103)。初期の配信確率は一群の広告コンテンツについて同じ配信確率にすべく、選択した広告IDに対応する広告コンテンツ数を得て、逆数とすることで初期の配信確率を算出する。例えば、196個の広告コンテンツがある場合は1/196=0.0051ずつとなる。図7は初期の配信確率が設定された状態における広告DB309を示している。 4B, the initial distribution probability setting unit 303 of the advertisement information providing apparatus 3 sets an initial distribution probability for the group of advertisement contents selected by the target advertisement selecting unit 302 (step S103). The initial distribution probability is calculated by obtaining the number of advertisement contents corresponding to the selected advertisement ID and taking the reciprocal number to obtain the same distribution probability for a group of advertisement contents. For example, if there are 196 advertisement contents, 1/196 = 0.0001. FIG. 7 shows the advertisement DB 309 in a state where the initial distribution probability is set.
次いで、図4(b)に戻り、広告情報提供装置3の係数ベクトル初期設定部304は、係数ベクトルθ(=A−1b)を規定する行列A、ベクトルbを初期設定する(ステップS104)。すなわち、行列Aに特徴量の要素数に相当するd次元の単位行列を設定し、ベクトルbにd次元のゼロベクトルを設定する。 Next, returning to FIG. 4B, the coefficient vector initial setting unit 304 of the advertisement information providing apparatus 3 initializes the matrix A and the vector b that define the coefficient vector θ (= A −1 b) (step S104). . That is, a d-dimensional unit matrix corresponding to the number of elements of the feature quantity is set in the matrix A, and a d-dimensional zero vector is set in the vector b.
次いで、広告情報提供装置3の予測CTR算出部305は、選択された広告に含まれる全ての広告コンテンツa(特徴量xa)に対して、予測CTR(Q値)であるQaを
Qa←xa Tθ+α・root(xa TA−1xa)
により算出して設定する(ステップS105)。上付きのTは転置を示す。なお、αは誤差の許容範囲を規定する定数である。
Then, the prediction CTR calculation unit 305 of the advertisement information providing device 3, for all advertising content a included in the selected ad (features x a), the Q a is predicted CTR (Q value) Q a ← x a T θ + α · root (x a T A −1 x a )
Is calculated and set (step S105). The superscript T indicates transposition. Α is a constant that defines an allowable range of errors.
次いで、広告情報提供装置3の広告情報配信・CTR記録部306は、広告DB309に登録された広告コンテンツを、端末装置2からページ要求が行われた際に、設定された配信確率に基づいて端末装置2のブラウザ21に配信するとともに、端末装置2のブラウザ21による広告の選択操作(バナー広告のクリック操作等)を検出し、実績CTRを広告DB309に記録する(ステップS106)。 Next, the advertisement information distribution / CTR recording unit 306 of the advertisement information providing device 3 receives the advertisement content registered in the advertisement DB 309 based on the set distribution probability when a page request is made from the terminal device 2. While delivering to the browser 21 of the apparatus 2, the selection operation (click operation etc. of a banner advertisement) by the browser 21 of the terminal device 2 is detected, and the result CTR is recorded in the advertisement DB 309 (step S106).
その後、配信確率を見直す所定の期間経過後、広告情報提供装置3の配信確率算出・設定部307は、広告DB309に記録された広告コンテンツ毎の所定期間の予測CTRに基づき、強化学習の手法により新たな配信確率を広告コンテンツ毎に算出する(ステップS107)。 Thereafter, after the elapse of a predetermined period for reviewing the distribution probability, the distribution probability calculation / setting unit 307 of the advertisement information providing device 3 uses a reinforcement learning method based on the predicted CTR of the predetermined period for each advertising content recorded in the advertisement DB 309. A new distribution probability is calculated for each advertising content (step S107).
例えば、追跡法(Pursuit Methods)を用いる場合、iを広告コンテンツのインデックス(例えば、広告コンテンツが196個の場合はi=0〜195)、aiを広告コンテンツ、Π(ai)を広告コンテンツaiの直前の配信確率、βを所定の学習率(0〜1の間の値)とすると、予測CTRが最大の広告コンテンツの配信確率は、
(Π(ai)+β(1−Π(ai)))/ΣΠ(ai)
その他の広告コンテンツの配信確率は、
(Π(ai)+β(0−Π(ai)))/ΣΠ(ai)
とする。ΣΠ(ai)で割っているのは正規化するためである。
For example, when pursuit methods are used, i is an index of advertising content (for example, if the advertising content is 196, i = 0 to 195), a i is advertising content, and Π (a i ) is advertising content. When the distribution probability immediately before a i and β is a predetermined learning rate (a value between 0 and 1), the distribution probability of the advertising content with the maximum predicted CTR is
(Π (a i ) + β (1−Π (a i ))) / ΣΠ (a i )
The delivery probability of other advertising content is
(Π (a i ) + β (0−Π (a i ))) / ΣΠ (a i )
And The reason for dividing by ΣΠ (a i ) is for normalization.
行動選択規則(εグリーディ手法)を用いる場合、εを所定の定数(0〜1の間の値)、広告コンテンツの数をnとすると、予測CTRが最大の広告コンテンツの配信確率は、
1−ε
その他の広告コンテンツの配信確率は、
ε/(n−1)
とする。
When the action selection rule (ε-greedy method) is used, when ε is a predetermined constant (a value between 0 and 1) and the number of advertising content is n, the distribution probability of the advertising content with the maximum predicted CTR is
1-ε
The delivery probability of other advertising content is
ε / (n-1)
And
次いで、広告情報提供装置3の配信確率算出・設定部307は、算出された新たな配信確率を広告DB309に設定する(ステップS108)。図8は、εグリーディ手法によりε=0.1とした場合に、配信確率が更新された状態の広告DB309を示している。 Next, the distribution probability calculation / setting unit 307 of the advertisement information providing apparatus 3 sets the calculated new distribution probability in the advertisement DB 309 (step S108). FIG. 8 shows the advertisement DB 309 in a state where the distribution probability is updated when ε = 0.1 by the ε greedy method.
次いで、図4(b)に戻り、広告情報提供装置3の係数ベクトル更新部308は、広告コンテンツaの実績CTRの算出の元となるインプレッション数va、クリック数raに基づいて係数ベクトルθを更新する(ステップS109)。すなわち、
A←A+vaxaxa T
b←b+raxa
とする。
Then, back in FIG. 4 (b), the coefficient vector updating unit 308 of the advertisement information providing device 3, the number of impressions the original calculation of the actual CTR of advertisement content a v a, the coefficient vector based on the number of clicks r a theta Is updated (step S109). That is,
A ← A + v a x a x a T
b ← b + r a x a
And
その後、予測CTRの算出(ステップS105)に戻り、同様の処理を繰り返す。 Then, it returns to calculation of prediction CTR (step S105), and repeats the same process.
<総括>
以上説明したように、本実施形態によれば、強化学習の考え方を導入することで、1商材について複数の広告コンテンツが存在する場合の広告効果を高めることができる。
<Summary>
As described above, according to the present embodiment, by introducing the concept of reinforcement learning, it is possible to enhance the advertising effect when there are a plurality of advertising contents for one product.
また、広告コンテンツが大量に存在する場合であっても、全ての広告コンテンツについて予測CTRを付与することで、配信確率の設定の精度を高めることができる。 Further, even when a large amount of advertising content exists, the accuracy of setting the distribution probability can be improved by assigning the predicted CTR for all the advertising content.
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。 The present invention has been described above by the preferred embodiments of the present invention. While the invention has been described with reference to specific embodiments, various modifications and changes may be made to the embodiments without departing from the broad spirit and scope of the invention as defined in the claims. Obviously you can. In other words, the present invention should not be construed as being limited by the details of the specific examples and the accompanying drawings.
1 ネットワーク
2 端末装置
21 ブラウザ
3 広告情報提供装置
301 特徴量生成部
302 対象広告選択部
303 初期配信確率設定部
304 係数ベクトル初期設定部
305 予測CTR算出部
306 広告情報配信・CTR記録部
307 配信確率算出・設定部
308 係数ベクトル更新部
309 広告DB
DESCRIPTION OF SYMBOLS 1 Network 2 Terminal apparatus 21 Browser 3 Advertisement information provision apparatus 301 Feature-value production | generation part 302 Target advertisement selection part 303 Initial delivery probability setting part 304 Coefficient vector initial setting part 305 Predictive CTR calculation part 306 Advertisement information delivery and CTR recording part 307 Delivery probability Calculation / setting unit 308 Coefficient vector update unit 309 Advertising DB
Claims (5)
前記広告データベースから対象となる一群の広告コンテンツを選択する手段と、
選択された一群の広告コンテンツの個々に対して初回の配信確率を設定する手段と、
係数ベクトルを初期設定する手段と、
選択された一群の広告コンテンツの個々に対して前記係数ベクトルと前記特徴量から予測CTRを算出する手段と、
配信確率が設定された広告コンテンツを配信し、実績CTRを記録する手段と、
広告コンテンツ毎の所定期間の前記予測CTRを報酬として、当該報酬に基づき複数の広告コンテンツの中から一の広告コンテンツの配信確率を最大化しつつ、残りの広告コンテンツにも最小限の配信確率を残すように強化学習を行い、新たな配信確率を広告コンテンツ毎に算出して設定する手段と、
前記実績CTRに基づいて前記係数ベクトルを更新する手段と
を備えたことを特徴とするコンテンツ配信装置。 Means for generating, for each advertisement content in an advertisement database that manages a plurality of advertisement contents for one product, a feature value representing the feature of the advertisement content;
Means for selecting a group of targeted advertising content from the advertising database;
A means of setting an initial delivery probability for each of a selected group of advertising content;
Means for initializing the coefficient vector;
Means for calculating a predicted CTR from the coefficient vector and the feature amount for each of the selected group of advertising content;
Means for distributing the advertising content with the distribution probability set and recording the actual CTR;
Using the predicted CTR for a predetermined period for each advertising content as a reward, maximizing the distribution probability of one advertising content out of a plurality of advertising contents based on the reward, leaving the minimum distribution probability for the remaining advertising content Reinforce learning and calculating and setting a new distribution probability for each advertising content,
And a means for updating the coefficient vector based on the actual CTR.
前記特徴量は、広告コンテンツの構成要素の種類毎のパターン数の総和の要素数をもつベクトルであり、実際に用いられる構成要素の種類毎のパターン位置に対応する要素を「1」とし、他の要素を「0」とする
ことを特徴とするコンテンツ配信装置。 The content delivery apparatus according to claim 1,
The feature amount is a vector having the total number of patterns for each type of component of the advertising content, and the element corresponding to the pattern position for each type of component actually used is set to “1”. A content distribution apparatus characterized in that the element of “0” is set to “0”.
前記特徴量は、各広告コンテンツと他の全ての広告コンテンツとの画像類似度を要素にもつベクトルである
ことを特徴とするコンテンツ配信装置。 The content delivery apparatus according to claim 1,
The content distribution apparatus, wherein the feature amount is a vector having an element of image similarity between each advertisement content and all other advertisement content.
前記強化学習として、追跡法もしくは行動選択規則のいずれかを用いる
ことを特徴とするコンテンツ配信装置。 In the content delivery apparatus as described in any one of Claims 1 thru | or 3,
Either of the tracking method or the action selection rule is used as the reinforcement learning.
前記コンテンツ配信装置が、前記広告データベースから対象となる一群の広告コンテンツを選択する工程と、
前記コンテンツ配信装置が、選択された一群の広告コンテンツの個々に対して初回の配信確率を設定する工程と、
前記コンテンツ配信装置が、係数ベクトルを初期設定する工程と、
前記コンテンツ配信装置が、選択された一群の広告コンテンツの個々に対して前記係数ベクトルと前記特徴量から予測CTRを算出する工程と、
前記コンテンツ配信装置が、配信確率が設定された広告コンテンツを配信し、実績CTRを記録する工程と、
前記コンテンツ配信装置が、広告コンテンツ毎の所定期間の前記予測CTRを報酬として、当該報酬に基づき複数の広告コンテンツの中から一の広告コンテンツの配信確率を最大化しつつ、残りの広告コンテンツにも最小限の配信確率を残すように強化学習を行い、新たな配信確率を広告コンテンツ毎に算出して設定する工程と、
前記コンテンツ配信装置が、前記実績CTRに基づいて前記係数ベクトルを更新する工程と
を備えたことを特徴とするコンテンツ配信方法。 A step of generating, for each advertisement content in an advertisement database managing a plurality of advertisement contents for one product, a feature amount representing a feature of the advertisement content;
The content distribution device selecting a target group of advertising content from the advertising database;
The content distribution device setting an initial distribution probability for each of the selected group of advertising content;
The content distribution device initializing a coefficient vector;
The content distribution device calculating a predicted CTR from the coefficient vector and the feature amount for each of the selected group of advertisement content;
The content distribution device distributes the advertising content set with the distribution probability and records the actual CTR;
The content distribution device uses the predicted CTR for a predetermined period for each advertisement content as a reward, and maximizes the distribution probability of one advertisement content out of a plurality of advertisement contents based on the reward, while also minimizing the remaining advertisement content Performing reinforcement learning so as to leave a limited delivery probability, calculating and setting a new delivery probability for each advertising content,
The content distribution method comprising: a step of updating the coefficient vector based on the actual CTR.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012141697A JP5661689B2 (en) | 2012-06-25 | 2012-06-25 | Content distribution device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012141697A JP5661689B2 (en) | 2012-06-25 | 2012-06-25 | Content distribution device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014006684A JP2014006684A (en) | 2014-01-16 |
JP5661689B2 true JP5661689B2 (en) | 2015-01-28 |
Family
ID=50104347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012141697A Active JP5661689B2 (en) | 2012-06-25 | 2012-06-25 | Content distribution device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5661689B2 (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6543986B2 (en) * | 2015-03-25 | 2019-07-17 | 日本電気株式会社 | INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND PROGRAM |
JP6436951B2 (en) * | 2016-09-15 | 2018-12-12 | Necパーソナルコンピュータ株式会社 | ADVERTISEMENT APPARATUS, ADVERTISEMENT APPARATUS PROCESSING METHOD, AND PROGRAM |
JP6229861B1 (en) * | 2016-10-14 | 2017-11-15 | 株式会社セガゲームス | Advertisement control apparatus and program |
JP6870981B2 (en) * | 2016-12-21 | 2021-05-12 | ヤフー株式会社 | Calculation device, calculation method and calculation program |
JP7000200B2 (en) * | 2018-02-22 | 2022-01-19 | 株式会社野村総合研究所 | Advertising effectiveness prediction system, method and program |
JP7275216B2 (en) * | 2021-09-03 | 2023-05-17 | 株式会社サイバーエージェント | ADVERTISING PRODUCTION SUPPORT PROGRAM, ADVERTISING PRODUCTION SUPPORT DEVICE, AND ADVERTISING PRODUCTION SUPPORT METHOD |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4880962B2 (en) * | 2004-09-27 | 2012-02-22 | ヤフー株式会社 | Advertisement content distribution ratio calculation program, advertisement content distribution ratio calculation method, advertisement content distribution ratio calculation system, content distribution control system, advertisement content distribution control system, advertisement content distribution control method, and advertisement content distribution control program |
US9111286B2 (en) * | 2008-02-01 | 2015-08-18 | Qualcomm, Incorporated | Multiple actions and icons for mobile advertising |
JP4702642B2 (en) * | 2008-05-02 | 2011-06-15 | 憲司 須藤 | Creative optimization server, creative optimization system, creative optimization method, and program |
JPWO2011105487A1 (en) * | 2010-02-25 | 2013-06-20 | Fringe81株式会社 | Server device and program for advertisement image distribution |
-
2012
- 2012-06-25 JP JP2012141697A patent/JP5661689B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014006684A (en) | 2014-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Han et al. | Mobile app analytics | |
US20190130457A1 (en) | Methods and systems for modeling campaign goal adjustment | |
JP5661689B2 (en) | Content distribution device | |
US9396444B2 (en) | Predictive analytics with forecasting model selection | |
JP5265659B2 (en) | Advertisement information providing device | |
US9083562B2 (en) | Predictive analysis of network analytics | |
US20170017986A1 (en) | Tracking digital design asset usage and performance | |
EP2590128A1 (en) | Information processing device, information processing method, information processing program, and recording medium in which information processing program is recorded | |
JP5296045B2 (en) | Advertisement information providing device | |
Paulson et al. | Efficient large-scale internet media selection optimization for online display advertising | |
JP5855511B2 (en) | Advertisement distribution support apparatus, advertisement distribution apparatus, advertisement distribution method and program | |
US20160210656A1 (en) | System for marketing touchpoint attribution bias correction | |
EP2297688A2 (en) | Advertising forecast and revenue systems and methods | |
CN103716338A (en) | Information push method and device | |
CN101923694A (en) | Being used for popular product implants | |
CN103329153A (en) | Systems, methods and media for providing virtual badges | |
US11734728B2 (en) | Method and apparatus for providing web advertisements to users | |
US20130066708A1 (en) | Online advertising system and a method of operating the same | |
US9922340B1 (en) | Evaluating attribution models based on simulated activity streams | |
US20140195340A1 (en) | Advertisement information providing device and advertisement information providing method | |
US10181130B2 (en) | Real-time updates to digital marketing forecast models | |
US20150227963A1 (en) | Systems, methods, and apparatus for budget allocation | |
JP5506867B2 (en) | Content distribution device | |
CN108062684B (en) | Method and device for predicting click rate of advertisement | |
US20130006761A1 (en) | Method, system, and article of manufacture for generating ad groups for on-line advertising |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5661689 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |