JP6470965B2 - Advertisement selection device, advertisement selection method and program - Google Patents

Advertisement selection device, advertisement selection method and program Download PDF

Info

Publication number
JP6470965B2
JP6470965B2 JP2014260156A JP2014260156A JP6470965B2 JP 6470965 B2 JP6470965 B2 JP 6470965B2 JP 2014260156 A JP2014260156 A JP 2014260156A JP 2014260156 A JP2014260156 A JP 2014260156A JP 6470965 B2 JP6470965 B2 JP 6470965B2
Authority
JP
Japan
Prior art keywords
advertisement
selection
acquired
unit
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014260156A
Other languages
Japanese (ja)
Other versions
JP2016122241A (en
Inventor
宰 出水
宰 出水
碧 大野木
碧 大野木
義隆 井上
義隆 井上
優 甲谷
優 甲谷
加藤 剛志
剛志 加藤
圭 黒田
圭 黒田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2014260156A priority Critical patent/JP6470965B2/en
Publication of JP2016122241A publication Critical patent/JP2016122241A/en
Application granted granted Critical
Publication of JP6470965B2 publication Critical patent/JP6470965B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、広告選択装置、広告選択方法及びプログラムに関する。   The present invention relates to an advertisement selection device, an advertisement selection method, and a program.

広告を配信する発明として、例えば特許文献1に開示されたシステムがある。このシステムは、複数の広告の配信初期においては、固定された配信比率で複数の広告のそれぞれを配信する。また、このシステムは、クリックされたバナー広告のクリック率を算出し、算出したクリック率を用いて広告の配信比率を決定する。そして、時間が経過するにつれて、決定した配信比率に基づいた広告の配信に重点を移す。特許文献1のシステムによれば、時間が経過すると、配信される広告の候補において、クリック率が高い広告が配信されやすくなる。
また。複数の広告の中から適切な広告を選択するアルゴリズムとして、例えば、バンディットアルゴリズムがある。バンディットアルゴリズムで活用と探索を行うことにより、広告の配信を始めた当初は、配信される候補の広告の中からランダムに広告が選択され、時間が経過するに従って、クリック率が高い広告が選択されやすくなる。
As an invention for distributing advertisements, for example, there is a system disclosed in Patent Document 1. This system distributes each of the plurality of advertisements at a fixed distribution ratio in the initial distribution of the plurality of advertisements. Further, this system calculates a click rate of the clicked banner advertisement, and determines the advertisement distribution ratio using the calculated click rate. Then, as time passes, the emphasis is shifted to the distribution of advertisements based on the determined distribution ratio. According to the system of Patent Literature 1, when time passes, an advertisement with a high click rate is likely to be distributed among the candidates for the advertisement to be distributed.
Also. As an algorithm for selecting an appropriate advertisement from a plurality of advertisements, for example, there is a bandit algorithm. By using and searching with the bandit algorithm, at the beginning of distributing the advertisement, an advertisement is randomly selected from the candidate advertisements to be distributed, and an advertisement with a higher click rate is selected as time passes. It becomes easy.

特開2006−120135号公報JP 2006-120135 A

ところで、広告を配信する際には、複数の広告の配信を開始した後、配信する広告が追加されることがある。追加された広告は、既に配信されている広告より登録されている期間が短く、広告へのアクセス履歴の数が先に配信を始めた広告より少なくなるため、既に配信されている広告とはクリック率も異なり、特許文献1のシステムにおいては、後で追加された広告が選ばれにくくなる虞がある。また、バンディットアルゴリズムを用いた場合には、アニーリングを行うと、時間に伴って探索の機会が減っていくため、追加された広告は選択されず、先に配信を開始している広告ばかりが選択される虞がある。   By the way, when distributing an advertisement, an advertisement to be distributed may be added after the distribution of a plurality of advertisements is started. The added ad has a shorter registered period than the ad that has already been delivered, and the number of visits to the ad is less than that of the ad that has been delivered first. The rates are also different, and in the system of Patent Document 1, there is a possibility that an advertisement added later is difficult to be selected. In addition, when the bandit algorithm is used, since the search opportunity decreases with time when annealing is performed, the added advertisement is not selected, only the advertisement that has started delivery first is selected. There is a risk of being.

本発明は、上述した背景の下になされたものであり、配信する広告を複数の広告の候補の中からパラメータに応じた割合で探索及び活用を行うアルゴリズムにより選択する際に、配信する広告の候補が新たに登録されても、新たに登録された広告が選択される機会を増やすことを目的とする。   The present invention has been made under the above-described background. When an advertisement to be distributed is selected from among a plurality of advertisement candidates by an algorithm that searches and uses the ratio according to a parameter, the advertisement to be distributed is selected. Even if a candidate is newly registered, it aims at increasing the chance that the newly registered advertisement is selected.

本発明は、端末装置へ配信する広告の候補のそれぞれの登録時期を取得する登録時期取得手段と、端末装置へ配信された広告の選択時期を取得する選択時期取得手段と、パラメータに応じた割合で探索及び活用を行うバンディットアルゴリズムにより、前記候補の中から端末装置へ配信する広告を選択する選択手段と、前記候補に含まれる広告のうち、前記登録時期取得手段が取得した時期が、前記選択時期取得手段が取得した選択時期より後の広告がある場合、前記探索を行う割合が増加するように前記パラメータを更新する更新手段と、前記選択手段が選択した広告を識別する情報を出力する出力手段と、を有する広告選択装置を提供する。 The present invention provides a registration time acquisition unit that acquires each registration time of advertisement candidates to be distributed to a terminal device, a selection time acquisition unit that acquires a selection time of an advertisement distributed to a terminal device, and a ratio according to a parameter The selection means for selecting an advertisement to be delivered to the terminal device from among the candidates by the bandit algorithm for searching and utilizing in the above, and the time acquired by the registration time acquisition means among the advertisements included in the candidate is the selection When there is an advertisement after the selection time acquired by the time acquisition means, an update means for updating the parameter so as to increase the ratio of performing the search, and an output for outputting information for identifying the advertisement selected by the selection means And an advertisement selection device.

本発明においては、前記更新手段は、前記候補に含まれる広告のうち、前記登録時期取得手段が取得した登録時期が、前記選択時期取得手段が取得した選択時期より後の広告の数が多くなるにつれて、前記探索を行う割合を多くするように前記パラメータを更新する構成としてもよい。   In the present invention, the updating means increases the number of advertisements after the selection time acquired by the selection time acquisition means in the registration time acquired by the registration time acquisition means among the advertisements included in the candidates. Accordingly, the parameter may be updated so that the ratio of performing the search is increased.

また、本発明においては、前記選択手段は、前記候補に含まれる広告を、前記登録時期取得手段が取得した登録時期が、前記選択時期取得手段が取得した選択時期より後である広告の第1グループと、前記登録時期取得手段が取得した登録時期が、前記選択時期取得手段が取得した選択時期より前である広告の第2グループとに分け、第1パラメータに応じた割合で探索及び活用を行うバンディットアルゴリズムにより、前記第1グループと前記第2グループのいずれかの選択を行い、第2パラメータに応じた割合で探索及び活用を行うバンディットアルゴリズムにより、選択したグループに属する広告から端末装置へ配信する広告を選択し、前記更新手段は、時間の経過に応じて、前記探索を行う割合が減少するように前記第1パラメータ及び前記第2パラメータを減少させる構成としてもよい。 Further, in the present invention, the selection means is a first advertisement for which an advertisement included in the candidate has a registration time acquired by the registration time acquisition means after a selection time acquired by the selection time acquisition means. The group is divided into a second group of advertisements in which the registration time acquired by the registration time acquisition unit is earlier than the selection time acquired by the selection time acquisition unit, and search and utilization are performed at a rate according to the first parameter. the bandit algorithm for, wherein the first group perform one of selection of the second group, the bandit algorithm for searching and utilization at a rate corresponding to the second parameter, served by an ad belonging to the selected group to the terminal device The update means selects the first parameter so that the rate of performing the search decreases with the passage of time. It may be configured to reduce the fine second parameter.

また、本発明においては、前記選択手段は、前記探索を行うときに、前記候補に含まれる広告毎に、選択される確率を登録時期からの経過時間が短くなるにつれて大きくする構成としてもよい。   In the present invention, the selection means may be configured to increase the probability of selection for each advertisement included in the candidate as the elapsed time from the registration time becomes shorter when the search is performed.

また、本発明においては、前記更新手段は、前記候補に含まれる広告のうち、前記登録時期取得手段の取得した登録時期が前記選択時期取得手段の取得した選択時期より後である広告が属するジャンルに含まれる広告のクリック率の分散が、他のジャンルに含まれる広告のクリック率の分散より大きい場合、前記探索を行う割合が増加するように前記パラメータを更新する構成としてもよい。   In the present invention, the update means includes a genre to which an advertisement whose registration time acquired by the registration time acquisition means is later than the selection time acquired by the selection time acquisition means among advertisements included in the candidate. When the distribution of the click rate of advertisements included in is larger than the distribution of the click rate of advertisements included in other genres, the parameter may be updated so that the search rate increases.

また、本発明は、コンピュータ装置の制御部が、端末装置へ配信する広告の候補のそれぞれの登録時期を取得する登録時期取得ステップと、前記制御部が、端末装置へ配信された広告の選択時期を取得する選択時期取得ステップと、前記制御部が、パラメータに応じた割合で探索及び活用を行うバンディットアルゴリズムにより、前記候補の中から端末装置へ配信する広告を選択する選択ステップと、前記制御部が、前記候補に含まれる広告のうち、前記登録時期取得ステップで取得した時期が、前記選択時期取得ステップで取得した選択時期より後の広告がある場合、前記探索を行う割合が増加するように前記パラメータを更新する更新ステップと、前記制御部が、前記選択ステップが選択した広告を識別する情報を出力する出力ステップと、を有する広告選択方法を提供する。 In addition, the present invention provides a registration time acquisition step in which a control unit of a computer device acquires each registration time of advertisement candidates to be distributed to a terminal device, and a selection time of an advertisement distributed to the terminal device by the control unit. A selection time acquisition step of acquiring the selection, a selection step of selecting an advertisement to be delivered to the terminal device from among the candidates by a bandit algorithm in which the control unit searches and uses at a rate according to a parameter, and the control unit However, among the advertisements included in the candidate, if there is an advertisement whose time acquired in the registration time acquisition step is later than the selection time acquired in the selection time acquisition step, the rate of performing the search is increased. output step and update step, the control unit is configured to output information identifying the advertisement said selection step selects to update the parameters , To provide an advertisement selection method with.

また、本発明は、コンピュータを、端末装置へ配信する広告の候補のそれぞれの登録時期を取得する登録時期取得手段と、端末装置へ配信された広告の選択時期を取得する選択時期取得手段と、パラメータに応じた割合で探索及び活用を行うバンディットアルゴリズムにより、前記候補の中から端末装置へ配信する広告を選択する選択手段と、前記候補に含まれる広告のうち、前記登録時期取得手段が取得した時期が、前記選択時期取得手段が取得した選択時期より後の広告がある場合、前記探索を行う割合が増加するように前記パラメータを更新する更新手段と、前記選択手段が選択した広告を識別する情報を出力する出力手段、として機能させるためのプログラムを提供する。 The present invention also provides a computer with registration time acquisition means for acquiring each registration time of advertisement candidates to be distributed to the terminal device, selection time acquisition means for acquiring the selection time of the advertisement distributed to the terminal device, A selection means for selecting an advertisement to be delivered to the terminal device from among the candidates by a bandit algorithm that searches and uses at a rate according to a parameter, and the registration time acquisition means among the advertisements included in the candidates When there is an advertisement whose timing is later than the selection time acquired by the selection time acquisition means, the updating means for updating the parameter so as to increase the ratio of performing the search, and the advertisement selected by the selection means are identified. Provided is a program for functioning as output means for outputting information.

本発明によれば、配信する広告を複数の広告の候補の中からパラメータに応じた割合で探索及び活用を行うアルゴリズムにより選択する際に、配信する広告の候補が新たに登録されても、新たに登録された広告が選択される機会を増やすことができる。   According to the present invention, when an advertisement to be distributed is selected from among a plurality of advertisement candidates by an algorithm that searches and uses the ratio according to a parameter, a new advertisement candidate is newly registered even if it is newly registered. It is possible to increase the chance that an advertisement registered in is selected.

本発明の一実施形態に係る広告配信システム1を構成する装置を示した図。The figure which showed the apparatus which comprises the advertisement delivery system 1 which concerns on one Embodiment of this invention. 広告選択装置20のハードウェア構成を示した図。The figure which showed the hardware constitutions of the advertisement selection apparatus 20. 表示広告候補データベースDB1のフォーマットの一例を示した図。The figure which showed an example of the format of display advertisement candidate database DB1. 表示広告集計データベースDB2のフォーマットの一例を示した図。The figure which showed an example of the format of display advertisement total database DB2. 広告選択履歴データベースDB3のフォーマットの一例を示した図。The figure which showed an example of the format of advertisement selection log | history database DB3. 広告選択装置20の機能ブロック図。The functional block diagram of the advertisement selection apparatus 20. FIG. 第1実施形態の動作例を説明するためのシーケンス図。The sequence diagram for demonstrating the operation example of 1st Embodiment. 広告候補リストの一例を示した図。The figure which showed an example of the advertisement candidate list. 第2実施形態の広告選択装置20の機能ブロック図。The functional block diagram of the advertisement selection apparatus 20 of 2nd Embodiment. 第2広告選択履歴データベースDB32のフォーマットの一例を示した図。The figure which showed an example of the format of 2nd advertisement selection history database DB32. 第2実施形態の動作例を説明するためのシーケンス図。The sequence diagram for demonstrating the operation example of 2nd Embodiment. 第2広告選択履歴データベースDB32に格納された情報の一例を示した図。The figure which showed an example of the information stored in 2nd advertisement selection history database DB32. 第2実施形態の動作例を説明するためのシーケンス図。The sequence diagram for demonstrating the operation example of 2nd Embodiment. 第2広告選択履歴データベースDB32に格納された情報の一例を示した図。The figure which showed an example of the information stored in 2nd advertisement selection history database DB32. 第3実施形態の広告選択装置20の機能ブロック図。The functional block diagram of the advertisement selection apparatus 20 of 3rd Embodiment. 第3広告選択履歴データベースDB33に格納された情報の一例を示した図。The figure which showed an example of the information stored in 3rd advertisement selection log | history database DB33. 第3実施形態の動作例を説明するためのシーケンス図。The sequence diagram for demonstrating the operation example of 3rd Embodiment. 第4実施形態の動作例を説明するためのシーケンス図。The sequence diagram for demonstrating the operation example of 4th Embodiment.

[第1実施形態]
(全体構成)
図1は、本発明の第1実施形態に係る広告配信システム1を構成する装置を示した図である。広告配信システム1は、端末装置30へコンテンツ及び広告を配信するシステムであり、サーバ装置10及び広告選択装置20を含む。通信網2は、データ通信のサービスを提供する通信網である。通信網2は、インターネットや固定電話網、移動体通信網などを含む。
[First Embodiment]
(overall structure)
FIG. 1 is a diagram showing an apparatus constituting the advertisement distribution system 1 according to the first embodiment of the present invention. The advertisement distribution system 1 is a system for distributing contents and advertisements to the terminal device 30 and includes a server device 10 and an advertisement selection device 20. The communication network 2 is a communication network that provides a data communication service. The communication network 2 includes the Internet, a fixed telephone network, a mobile communication network, and the like.

サーバ装置10は、通信網2を介してアクセスしてきた端末装置30へコンテンツ及び広告を配信するコンピュータ装置である。サーバ装置10は、複数の広告を記憶している。サーバ装置10が端末装置30へ配信する広告は、広告選択装置20により決定される。
広告選択装置20は、サーバ装置10から端末装置30へ配信する広告を決定するコンピュータ装置である。広告選択装置20は、サーバ装置10から端末装置30へ配信する広告を、バンディットアルゴリズムの一例であるε−Greedyアルゴリズムにより決定する。
The server device 10 is a computer device that distributes content and advertisements to the terminal device 30 accessed via the communication network 2. The server device 10 stores a plurality of advertisements. The advertisement that the server device 10 distributes to the terminal device 30 is determined by the advertisement selection device 20.
The advertisement selection device 20 is a computer device that determines an advertisement to be distributed from the server device 10 to the terminal device 30. The advertisement selection device 20 determines an advertisement to be delivered from the server device 10 to the terminal device 30 by an ε-Greedy algorithm that is an example of a bandit algorithm.

端末装置30は、本実施形態においてはスマートフォンであり、通信網2を介して音声通信やデータ通信を行う。なお、本実施形態においては、端末装置30はスマートフォンであるが、スマートフォンに限定されるものではなく、タブレットPC(Personal Computer)、フィーチャーフォン又はPDA(Personal Digital Assistant)など、通信網2を介してデータ通信を行う機能を備えているコンピュータ装置であればよい。また、端末装置30は、有線で通信網2に接続されているパーソナルコンピュータであってもよい。   The terminal device 30 is a smartphone in the present embodiment, and performs voice communication and data communication via the communication network 2. In the present embodiment, the terminal device 30 is a smartphone. However, the terminal device 30 is not limited to a smartphone, and may be connected via the communication network 2 such as a tablet PC (Personal Computer), a feature phone, or a PDA (Personal Digital Assistant). Any computer device having a function of performing data communication may be used. The terminal device 30 may be a personal computer connected to the communication network 2 by wire.

(広告選択装置20の構成)
図2は、広告選択装置20のハードウェア構成を示した図である。制御部21は、CPU(Central Processing Unit)、ブートローダを記憶したROM(Read Only Memory)及びRAM(Random Access Memory)を有しており、CPUがプログラムを実行すると、端末装置30へ配信する広告を選択する機能が実現する。
(Configuration of advertisement selection device 20)
FIG. 2 is a diagram illustrating a hardware configuration of the advertisement selection device 20. The control unit 21 has a CPU (Central Processing Unit), a ROM (Read Only Memory) storing a boot loader, and a RAM (Random Access Memory). When the CPU executes a program, an advertisement distributed to the terminal device 30 is displayed. The function to select is realized.

表示部23は、液晶ディスプレイを備えており、広告選択装置20を操作するための画面や記憶部22に記憶されている情報などを表示する。操作部24は、キーボードやマウスなどの入力装置を有している。広告選択装置20は、キーボードやマウスに行われた操作に応じて動作する。通信部25は、サーバ装置10と通信を行う通信インターフェースとして機能する。通信部25は、LAN(Local Area Network)を介してサーバ装置10と接続されてもよく、また、通信網2を介してサーバ装置10と接続されてもよい。   The display unit 23 includes a liquid crystal display, and displays a screen for operating the advertisement selection device 20, information stored in the storage unit 22, and the like. The operation unit 24 has input devices such as a keyboard and a mouse. The advertisement selection device 20 operates in accordance with an operation performed on the keyboard or the mouse. The communication unit 25 functions as a communication interface that communicates with the server device 10. The communication unit 25 may be connected to the server device 10 via a LAN (Local Area Network), or may be connected to the server device 10 via the communication network 2.

記憶部22は、ハードディスク装置を有しており、端末装置30へ配信する広告を選択する機能を実現するプログラムや、端末装置30へ配信する広告を選択するための各種情報を格納したデータベースを記憶する。   The storage unit 22 has a hard disk device, and stores a program that realizes a function of selecting an advertisement to be distributed to the terminal device 30 and a database that stores various information for selecting an advertisement to be distributed to the terminal device 30. To do.

図3〜5は、記憶部22に記憶されるデータベースの一例を示した図である。本実施形態においては、記憶部22は、表示広告候補データベースDB1、表示広告集計データベースDB2及び広告選択履歴データベースDB3を記憶する。   3 to 5 are diagrams illustrating an example of a database stored in the storage unit 22. In the present embodiment, the storage unit 22 stores a display advertisement candidate database DB1, a display advertisement aggregation database DB2, and an advertisement selection history database DB3.

図3は、表示広告候補データベースDB1の一例を示した図である。表示広告候補データベースDB1は、「ID」、「ジャンル」及び「登録時期」のフィールドを有する。「ID」フィールドは、サーバ装置10に登録されている広告の識別子を格納するフィールドである。サーバ装置10が配信する複数の広告は、各々に広告を一意に識別する識別子が付与されており、「ID」フィールドは、この識別子を記憶する。「ジャンル」フィールドは、サーバ装置10に記憶されている広告のジャンルを示す情報を格納するフィールドである。「ジャンル」フィールドには、同じレコードに格納されている識別子で特定される広告が属するジャンルを示す情報が格納される。「登録時期」フィールドは、サーバ装置10から端末装置30へ配信される広告がサーバ装置10へ登録された時期を示す情報が格納されるフィールドである。「登録時期」フィールドには、同じレコードに格納されている識別子で特定される広告がサーバ装置10に登録された日時を示す情報が格納される。表示広告候補データベースDB1においては、サーバ装置10に広告を新たに登録する際に新たなレコードが追加され、追加されたレコードの各フィールドに情報が格納される。   FIG. 3 is a diagram illustrating an example of the display advertisement candidate database DB1. The display advertisement candidate database DB1 has fields of “ID”, “genre”, and “registration time”. The “ID” field is a field for storing an identifier of an advertisement registered in the server device 10. The plurality of advertisements distributed by the server device 10 are each assigned an identifier for uniquely identifying the advertisement, and the “ID” field stores this identifier. The “genre” field is a field for storing information indicating the genre of the advertisement stored in the server device 10. The “genre” field stores information indicating the genre to which the advertisement specified by the identifier stored in the same record belongs. The “registration time” field is a field in which information indicating a time when an advertisement distributed from the server device 10 to the terminal device 30 is registered in the server device 10 is stored. The “registration time” field stores information indicating the date and time when the advertisement specified by the identifier stored in the same record is registered in the server device 10. In the display advertisement candidate database DB1, a new record is added when an advertisement is newly registered in the server device 10, and information is stored in each field of the added record.

図4は、表示広告集計データベースDB2の一例を示した図である。表示広告集計データベースDB2は、「ID」、「ジャンル」、「表示数」、「クリック回数」及び「CTR」のフィールドを有する。「ID」フィールドは、サーバ装置10に登録されている広告の識別子を格納するフィールドである。「ジャンル」フィールドには、同じレコードに格納されている識別子で特定される広告が属するジャンルを示す情報が格納される。「表示数」フィールドは、広告の配信回数を格納するフィールドである。「表示数」フィールドには、同じレコードに格納されている識別子で特定される広告がサーバ装置10から配信された回数が格納される。「クリック回数」フィールドは、配信された広告が端末装置30において操作された回数を示す情報を格納するフィールドである。「クリック回数」フィールドは、同じレコードに格納されている識別子で特定される広告が端末装置30において操作された回数を示す情報を格納する。なお、フィールドの名称が「クリック回数」となっているが、端末装置30がスマートフォンやタブレット端末の場合、広告がタップされるとクリック回数が増加する。「CTR」フィールドは、広告が操作された割合、即ち、クリックスルーレートを示す情報を格納するフィールドである。「CTR」フィールドは、同じレコードに格納されている識別子で特定される広告のクリックスルーレートを示す情報を格納する。なお、フィールドの名称が「CTR」となっているが、端末装置30がスマートフォンやタブレット端末の場合、広告をタップする操作も、広告をクリックする操作と同じものとし、広告をタップする操作に応じてCTRが更新される。   FIG. 4 is a diagram showing an example of the display advertisement total database DB2. The display advertisement aggregation database DB2 has fields of “ID”, “Genre”, “Number of displays”, “Number of clicks”, and “CTR”. The “ID” field is a field for storing an identifier of an advertisement registered in the server device 10. The “genre” field stores information indicating the genre to which the advertisement specified by the identifier stored in the same record belongs. The “number of displays” field is a field for storing the number of times advertisements are distributed. The “number of displays” field stores the number of times the advertisement specified by the identifier stored in the same record has been distributed from the server device 10. The “number of clicks” field is a field for storing information indicating the number of times the distributed advertisement has been operated on the terminal device 30. The “click count” field stores information indicating the number of times the advertisement specified by the identifier stored in the same record has been operated in the terminal device 30. Although the field name is “click count”, when the terminal device 30 is a smartphone or a tablet terminal, the click count increases when the advertisement is tapped. The “CTR” field is a field for storing information indicating a rate at which an advertisement is operated, that is, a click-through rate. The “CTR” field stores information indicating the click-through rate of the advertisement specified by the identifier stored in the same record. Although the field name is “CTR”, when the terminal device 30 is a smartphone or a tablet terminal, the operation of tapping the advertisement is the same as the operation of clicking the advertisement, and depending on the operation of tapping the advertisement. The CTR is updated.

図5は、広告選択履歴データベースDB3の一例を示した図である。広告選択履歴データベースDB3は、「#」、「選択時期」、「パラメータ」、「選択広告」、「選択候補」のフィールドを有する。「#」フィールドは、データベースのレコードの番号を格納する。「選択時期」フィールドは、端末装置30へ配信する広告を広告選択装置20が選択した日時を示す情報を格納し、「選択広告」フィールドは、端末装置30へ配信する広告として広告選択装置20が選択した広告の識別子を格納する。「パラメータ」フィールドは、ε−Greedyアルゴリズムにおいて「探索」を行う割合と「活用」を行う割合を定めるパラメータであるεの値を格納する。なお、εの初期値は「1」にされる。「選択候補」フィールドは、複数のサブフィールドを有し、端末装置30へ配信する広告を選択する際に選択の候補となった広告の識別子を格納する。   FIG. 5 is a diagram illustrating an example of the advertisement selection history database DB3. The advertisement selection history database DB3 has fields of “#”, “selection time”, “parameter”, “selected advertisement”, and “selection candidate”. The “#” field stores the record number of the database. The “selection time” field stores information indicating the date and time when the advertisement selection device 20 has selected the advertisement to be distributed to the terminal device 30, and the “selection advertisement” field is the advertisement selection device 20 as an advertisement to be distributed to the terminal device 30. Stores the identifier of the selected advertisement. The “parameter” field stores the value of ε, which is a parameter that determines the ratio of performing “search” and the ratio of performing “utilization” in the ε-Greyy algorithm. The initial value of ε is set to “1”. The “selection candidate” field has a plurality of subfields, and stores identifiers of advertisements that are candidates for selection when an advertisement to be distributed to the terminal device 30 is selected.

図6は、広告選択装置20において実現する機能の構成を示した機能ブロック図である。広告情報取得部201は、広告候補リストを生成する機能を有し、表示広告候補データベースDB1に格納されている情報と、表示広告集計データベースDB2に格納されている情報を取得する。広告情報取得部201は、端末装置30へ配信する広告の候補のそれぞれの登録時期を取得する登録時期取得手段の一例である。広告情報取得部201は、端末装置30へ配信する広告を選択する際に選択の候補となる広告の識別子と、当該広告のCTRとを対応付けた広告候補リストを、取得した情報を用いて生成する。広告情報取得部201は、生成した広告候補リストをパラメータ更新部203へ送る。   FIG. 6 is a functional block diagram illustrating a configuration of functions realized in the advertisement selection device 20. The advertisement information acquisition unit 201 has a function of generating an advertisement candidate list, and acquires information stored in the display advertisement candidate database DB1 and information stored in the display advertisement aggregation database DB2. The advertisement information acquisition unit 201 is an example of a registration time acquisition unit that acquires each registration time of advertisement candidates to be distributed to the terminal device 30. The advertisement information acquisition unit 201 uses the acquired information to generate an advertisement candidate list in which identifiers of advertisements that are candidates for selection when selecting an advertisement to be distributed to the terminal device 30 and the CTR of the advertisement. To do. The advertisement information acquisition unit 201 sends the generated advertisement candidate list to the parameter update unit 203.

新規広告判断部202は、広告選択装置20が広告を選択した後に、サーバ装置10に新たな広告が登録されたか否かを判断する機能を有する。新規広告判断部202は、表示広告候補データベースDB1に格納されている情報と、広告選択履歴データベースDB3に格納されている情報を取得する。新規広告判断部202は、表示広告候補データベースDB1から取得した登録時期と、広告選択履歴データベースDB3から取得した選択時期とを用いて、広告選択装置20が広告を選択した後に、サーバ装置10に新たな広告が登録されたか判断し、判断結果をパラメータ更新部203へ送る。新規広告判断部202は、端末装置30へ配信された広告の選択時期を取得する選択時期取得手段の一例である。   The new advertisement determination unit 202 has a function of determining whether or not a new advertisement is registered in the server device 10 after the advertisement selection device 20 selects an advertisement. The new advertisement determination unit 202 acquires information stored in the display advertisement candidate database DB1 and information stored in the advertisement selection history database DB3. The new advertisement determination unit 202 uses the registration time acquired from the display advertisement candidate database DB1 and the selection time acquired from the advertisement selection history database DB3, and then selects a new advertisement in the server device 10 after the advertisement selection device 20 selects an advertisement. It is determined whether a correct advertisement has been registered, and the determination result is sent to the parameter update unit 203. The new advertisement determination unit 202 is an example of a selection time acquisition unit that acquires the selection time of advertisements distributed to the terminal device 30.

パラメータ更新部203は、ε−Greedyアルゴリズムで用いるパラメータのεを更新する機能を有する。パラメータ更新部203は、広告候補リストと、新規広告判断部202の判断結果を取得する。また、パラメータ更新部203は、広告選択履歴データベースDB3に格納されているパラメータを取得し、取得した広告候補リストと判断結果に応じてパラメータを更新し、取得した広告候補リストと、更新したパラメータとを表示広告計算部204へ送る。パラメータ更新部203は、パラメータを更新する更新手段の一例である。   The parameter update unit 203 has a function of updating ε of a parameter used in the ε-Greedy algorithm. The parameter update unit 203 acquires the advertisement candidate list and the determination result of the new advertisement determination unit 202. Further, the parameter update unit 203 acquires parameters stored in the advertisement selection history database DB3, updates the parameters according to the acquired advertisement candidate list and the determination result, and acquires the acquired advertisement candidate list, the updated parameter, Is sent to the display advertisement calculation unit 204. The parameter update unit 203 is an example of an update unit that updates parameters.

表示広告計算部204は、サーバ装置10から端末装置30へ配信する広告をε−Greedyアルゴリズムにより選択する機能を有する。表示広告計算部204は、広告候補リストとパラメータのεを取得する。表示広告計算部204は、取得したεに応じて、ε−Greedyアルゴリズムの「探索」及び「活用」を行い端末装置30へ配信する広告を選択する。表示広告計算部204は、選択した広告を示す識別子を、通信部25を制御してサーバ装置10へ送信する。表示広告計算部204は、端末装置30へ配信する広告を選択する選択手段と、選択した広告を識別する情報を出力する出力手段の一例である。   The display advertisement calculation unit 204 has a function of selecting an advertisement to be distributed from the server device 10 to the terminal device 30 using the ε-Greedy algorithm. The display advertisement calculation unit 204 acquires an advertisement candidate list and a parameter ε. The display advertisement calculation unit 204 performs “search” and “utilization” of the ε-Greyy algorithm in accordance with the acquired ε, and selects an advertisement to be distributed to the terminal device 30. The display advertisement calculation unit 204 controls the communication unit 25 to transmit an identifier indicating the selected advertisement to the server device 10. The display advertisement calculation unit 204 is an example of a selection unit that selects an advertisement to be distributed to the terminal device 30 and an output unit that outputs information for identifying the selected advertisement.

(第1実施形態の動作例)
次に、第1実施形態の動作例について、図7のシーケンス図を用いて説明する。端末装置30がサーバ装置10へアクセスすると、サーバ装置10は、広告の選択指示を広告選択装置20へ送信する。広告選択装置20は、この選択指示を取得すると、以下の動作を行う。
(Operation example of the first embodiment)
Next, an operation example of the first embodiment will be described with reference to the sequence diagram of FIG. When the terminal device 30 accesses the server device 10, the server device 10 transmits an advertisement selection instruction to the advertisement selection device 20. When the advertisement selection device 20 acquires this selection instruction, it performs the following operation.

選択指示を取得した広告選択装置20においては、まず、広告情報取得部201が、表示広告候補データベースDB1に格納されている情報を取得する(ステップS1)。例えば、図3に例示したように、配信する広告の候補として3つの広告の情報が表示広告候補データベースDB1に格納されている場合、広告情報取得部201は、図3に示した3つのレコードを取得する。次に広告情報取得部201は、取得したレコードにある識別子の広告のCTRを表示広告集計データベースDB2から取得し(ステップS2)、広告候補リストを生成する(ステップS3)。広告情報取得部201は、生成した広告候補リストをパラメータ更新部203へ送る(ステップS4)。   In the advertisement selection device 20 that has acquired the selection instruction, first, the advertisement information acquisition unit 201 acquires information stored in the display advertisement candidate database DB1 (step S1). For example, as illustrated in FIG. 3, when information about three advertisements is stored in the display advertisement candidate database DB <b> 1 as advertisement candidates to be distributed, the advertisement information acquisition unit 201 stores the three records illustrated in FIG. 3. get. Next, the advertisement information acquisition unit 201 acquires the CTR of the advertisement with the identifier in the acquired record from the display advertisement total database DB2 (step S2), and generates an advertisement candidate list (step S3). The advertisement information acquisition unit 201 sends the generated advertisement candidate list to the parameter update unit 203 (step S4).

図8は、ステップS3で生成された広告候補リストの一例を示した図である。広告候補リストは、広告の識別子とCTRとを対応付けたリストであり、「ID」及び「CTR」のフィールドを有する。
例えば、広告情報取得部201は、上述したように、図3に示した3つのレコードを取得した場合、識別子が「1」である広告のCTRは、表示広告集計データベースDB2においては、0.6となっているため、図8に示したように、広告候補リストにおいて、識別子の「1」とCTRの「0.6」を対応付ける。ここで、新たに登録されてから配信がされていないためにCTRの情報がない識別子が「3」の広告の場合、図8に示したように、CTRとして「Null」を対応付ける。
FIG. 8 is a diagram showing an example of the advertisement candidate list generated in step S3. The advertisement candidate list is a list in which an advertisement identifier and a CTR are associated with each other, and includes fields of “ID” and “CTR”.
For example, as described above, when the advertisement information acquisition unit 201 acquires the three records shown in FIG. 3, the CTR of the advertisement whose identifier is “1” is 0.6 in the display advertisement total database DB2. Therefore, as shown in FIG. 8, the identifier “1” is associated with the CTR “0.6” in the advertisement candidate list. Here, in the case of an advertisement with an identifier “3” having no CTR information because it has not been newly distributed since registration, “Null” is associated with the CTR as shown in FIG.

次に、新規広告判断部202は、表示広告候補データベースDB1に格納されている情報を取得する(ステップS5)。例えば、上述したように、配信する広告の候補として3つの広告がサーバ装置10に登録されている場合、新規広告判断部202は、図3に示した3つのレコードを取得する。また、新規広告判断部202は、広告選択履歴データベースDB3に格納されているレコードのうち、選択時期が最新のレコードを取得する(ステップS6)。   Next, the new advertisement determination unit 202 acquires information stored in the display advertisement candidate database DB1 (step S5). For example, as described above, when three advertisements are registered in the server apparatus 10 as advertisement candidates to be distributed, the new advertisement determination unit 202 acquires the three records shown in FIG. Further, the new advertisement determination unit 202 acquires a record having the latest selection time among the records stored in the advertisement selection history database DB3 (step S6).

新規広告判断部202は、ステップS5で取得した情報と、ステップS6で取得したレコードを用いて、広告を選択した後にサーバ装置10へ新たに登録された広告があるか判断する(ステップS7)。例えば、図3に示したレコードと図5に示したレコードとを比較した場合、広告を選択した最後の日時より後に、識別子が「3」の広告が登録されていることがわかる。この場合、新規広告判断部202は、広告を選択した後に新たに登録された広告がサーバ装置10にあると判断する。一方、新規広告判断部202は、選択時期が最新のレコードに格納されている選択時期より登録時期が後の広告がない場合、広告を選択した後に新たに登録された広告はないものと判断する。 The new advertisement determination unit 202 determines whether there is an advertisement newly registered in the server device 10 after selecting an advertisement, using the information acquired in step S5 and the record acquired in step S6 (step S7). For example, when the record shown in FIG. 3 is compared with the record shown in FIG. 5, it can be seen that the advertisement with the identifier “3” is registered after the last date and time when the advertisement is selected. In this case, the new advertisement determination unit 202 determines that the server apparatus 10 has an advertisement newly registered after selecting the advertisement. On the other hand, when there is no advertisement whose registration time is later than the selection time stored in the latest record, the new advertisement determination unit 202 determines that there is no newly registered advertisement after selecting the advertisement. .

新規広告判断部202は、ステップS7の判断結果をパラメータ更新部203へ送り、パラメータ更新部203は、新規広告判断部202から送られた判断結果を取得する(ステップS8)。パラメータ更新部203は、新規広告判断部202の判断結果を取得した後、広告選択履歴データベースDB3に格納されているパラメータのうち、選択時期が最新のレコードに格納されているパラメータであるεの値を取得する(ステップS9)。   The new advertisement determination unit 202 sends the determination result of step S7 to the parameter update unit 203, and the parameter update unit 203 acquires the determination result sent from the new advertisement determination unit 202 (step S8). After the parameter update unit 203 obtains the determination result of the new advertisement determination unit 202, the value of ε, which is the parameter stored in the record with the latest selection time among the parameters stored in the advertisement selection history database DB3 Is acquired (step S9).

パラメータ更新部203は、ステップS7の判断結果と、εの値を取得すると、εの値を更新する(ステップS10)。具体的には、パラメータ更新部203は、ステップS7の判断結果が、「新たに登録された広告がない」との判断結果の場合、ε=1/ln(T)という式を用いてεの値を減少させる。ここで「T」はインプレッション数であり、表示広告集計データベースDB2に格納されている表示数を合算した値となる。   When the parameter updating unit 203 acquires the determination result of step S7 and the value of ε, the parameter updating unit 203 updates the value of ε (step S10). Specifically, when the determination result in step S7 is “no newly registered advertisement”, the parameter update unit 203 uses the expression ε = 1 / ln (T) to Decrease the value. Here, “T” is the number of impressions, and is a value obtained by adding the display numbers stored in the display advertisement total database DB2.

一方、パラメータ更新部203は、ステップS7の判断結果が、「新たに登録された広告がある」との判断結果の場合、εの値を以下の数1の式により更新する。

Figure 0006470965
On the other hand, the parameter update unit 203 updates the value of ε according to the following equation 1 when the determination result in step S7 is a determination result that “a newly registered advertisement exists”.
Figure 0006470965

数1の式において、Naは、広告を選択した最後の日時より前にサーバ装置10に登録されていた広告の数であり、Nbは、広告を選択した最後の日時より後にサーバ装置10に新たに登録された広告の数である。また、ε1は、広告選択履歴データベースDB3から取得したεの値である。パラメータ更新部203は、εの値を更新すると、ステップS4で取得した広告候補リストと、更新したεの値を表示広告計算部204へ送る(ステップS11)。   In Equation 1, Na is the number of advertisements registered in the server device 10 before the last date and time when the advertisement is selected, and Nb is newly added to the server device 10 after the last date and time when the advertisement is selected. The number of advertisements registered in. Further, ε1 is the value of ε acquired from the advertisement selection history database DB3. When the value of ε is updated, the parameter updating unit 203 sends the advertisement candidate list acquired in step S4 and the updated value of ε to the display advertisement calculating unit 204 (step S11).

表示広告計算部204は、広告候補リストと、更新されたεの値を取得すると、取得した広告候補リストにあるCTRと、取得したεの値を使用し、端末装置30へ配信する広告を選択する(ステップS12)。具体的には、表示広告計算部204は、バンディットテストにおいて、取得したεの値の確率で「探索」を行い、1−εの値の確率で「活用」を行う。「探索」においては、広告候補リストにある広告の識別子の中からランダムに識別子を選択し、「活用」においては、広告候補リストにおいて最も大きいCTRの値が対応付けられている識別子を選択する。   When the display advertisement calculation unit 204 acquires the advertisement candidate list and the updated value of ε, the display advertisement calculation unit 204 selects an advertisement to be distributed to the terminal device 30 using the CTR in the acquired advertisement candidate list and the acquired value of ε. (Step S12). Specifically, the display advertisement calculation unit 204 performs “search” with the probability of the acquired value of ε and “utilizes” with the probability of the value of 1−ε in the bandit test. In “search”, an identifier is randomly selected from the identifiers of advertisements in the advertisement candidate list, and in “utilization”, an identifier associated with the largest CTR value in the advertisement candidate list is selected.

表示広告計算部204は、サーバ装置10から端末装置30へ配信する広告の識別子を選択すると、広告選択履歴データベースDB3に新たにレコードを追加し、選択した広告の識別子や取得したεの値などを格納する(ステップS13)。具体的には、表示広告計算部204は、広告の選択を行った日時を、新たに追加したレコードの「選択時期」のフィールドに格納し、パラメータ更新部203から取得したεの値を、新たに追加したレコードの「パラメータ」のフィールドに格納し、選択した広告の識別子を、新たに追加したレコードの「選択広告」のフィールドに格納する。また、表示広告計算部204は、取得した広告候補リストに含まれている広告の識別子を、新たに追加したレコードの「選択候補」のフィールドに格納する。   When the display advertisement calculation unit 204 selects an identifier of an advertisement to be distributed from the server device 10 to the terminal device 30, the display advertisement calculation unit 204 newly adds a record to the advertisement selection history database DB3, and displays the identifier of the selected advertisement, the acquired value of ε, and the like. Store (step S13). Specifically, the display advertisement calculation unit 204 stores the date and time when the advertisement is selected in the “selection time” field of the newly added record, and sets the value of ε acquired from the parameter update unit 203 to the new value. Is stored in the “parameter” field of the added record, and the identifier of the selected advertisement is stored in the “selected advertisement” field of the newly added record. Further, the display advertisement calculation unit 204 stores the identifier of the advertisement included in the acquired advertisement candidate list in the “selection candidate” field of the newly added record.

次に表示広告計算部204は、選択した広告の識別子を、通信部25を制御してサーバ装置10へ送信する(ステップS14)。サーバ装置10は、広告選択装置20からされた識別子を取得すると、取得した識別子の広告を端末装置30へ配信する。サーバ装置10が広告を端末装置30へ配信すると、表示広告集計データベースDB2において、配信された広告に対応するレコードの「表示数」のフィールドが更新される。また、送信された広告が端末装置30において操作されると、表示広告集計データベースDB2において、操作された広告に対応するレコードの「クリック回数」のフィールドと「CTR」のフィールドの値が更新される。   Next, the display advertisement calculation unit 204 transmits the identifier of the selected advertisement to the server device 10 by controlling the communication unit 25 (step S14). When the server device 10 acquires the identifier made from the advertisement selection device 20, the server device 10 distributes the advertisement with the acquired identifier to the terminal device 30. When the server device 10 distributes the advertisement to the terminal device 30, the “display number” field of the record corresponding to the distributed advertisement is updated in the display advertisement aggregation database DB2. Further, when the transmitted advertisement is operated in the terminal device 30, the values of the “click count” field and the “CTR” field of the record corresponding to the operated advertisement are updated in the display advertisement total database DB2. .

以上説明したように、本実施形態においては、εの値の初期値を1とすることにより、まず探索を中心に行う。そして、広告を最後に選択した後に、新たに登録された広告がない場合、自然対数を使用し、インプレッション数のTが増えるに従ってεの値を減少させることにより、活用の機会を増やしていき、広告が追加された場合には、数1の式によりεの値を増加させ、探索の機会を増やしている。この構成によれば、端末装置30へ配信する広告が新たに登録された場合、εの値が増加される。これにより、新たに登録された広告が探索される機会が増え、探索が十分に行われるため、真にクリック率が高い広告が選択されることとなる。   As described above, in this embodiment, the initial value of ε is set to 1, so that the search is first performed. And if there are no newly registered ads after the last selection of ads, the natural logarithm is used, and the value of ε decreases as the number of impressions T increases, increasing opportunities for utilization, When an advertisement is added, the value of ε is increased according to the formula 1 to increase the search opportunity. According to this configuration, when an advertisement to be distributed to the terminal device 30 is newly registered, the value of ε is increased. As a result, an opportunity to search for a newly registered advertisement is increased, and the search is sufficiently performed. Therefore, an advertisement with a truly high click rate is selected.

[第2実施形態]
次に、本発明の第2実施形態について説明する。本発明の第2実施形態に係る広告配信システム1は、第1実施形態と同じく、サーバ装置10と広告選択装置20を含む。第2実施形態に係るサーバ装置10と広告選択装置20のハードウェア構成は第1実施形態と同じである。第2実施形態においては、広告選択装置20が行う処理が第1実施形態と異なる。また、第2実施形態においては、広告選択装置20においてグループ選択部205が実現する点と、広告選択履歴データベースDB3に替えて、第2広告選択履歴データベースDB32を有する点が第1実施形態と異なる。以下、第1実施形態と同じ構成については説明を省略し、第1実施形態との相違点について説明する。
[Second Embodiment]
Next, a second embodiment of the present invention will be described. The advertisement delivery system 1 according to the second embodiment of the present invention includes a server device 10 and an advertisement selection device 20 as in the first embodiment. The hardware configuration of the server device 10 and the advertisement selection device 20 according to the second embodiment is the same as that of the first embodiment. In 2nd Embodiment, the process which the advertisement selection apparatus 20 performs differs from 1st Embodiment. Further, the second embodiment differs from the first embodiment in that the group selection unit 205 is realized in the advertisement selection device 20 and that a second advertisement selection history database DB32 is provided instead of the advertisement selection history database DB3. . Hereinafter, description of the same configuration as that of the first embodiment will be omitted, and differences from the first embodiment will be described.

図9は、第2実施形態に係る広告選択装置20において実現する機能の構成を示した機能ブロック図である。
グループ選択部205は、端末装置30へ配信する広告の候補を、新たにサーバ装置10に登録された新規広告のグループと、新規広告より前に登録された既存広告のグループとに分けたときに、いずれかのグループを選択する機能を有する。
表示広告計算部204は、グループ選択部205が選択したグループに含まれる広告の中から、端末装置30へ配信する広告を選択する機能を有する。
FIG. 9 is a functional block diagram showing a configuration of functions realized in the advertisement selection device 20 according to the second embodiment.
When the group selection unit 205 divides the advertisement candidates to be distributed to the terminal device 30 into a new advertisement group newly registered in the server apparatus 10 and an existing advertisement group registered before the new advertisement. , And has a function of selecting any group.
The display advertisement calculation unit 204 has a function of selecting an advertisement to be distributed to the terminal device 30 from advertisements included in the group selected by the group selection unit 205.

図10は、第2広告選択履歴データベースDB32の一例を示した図である。第2広告選択履歴データベースDB32は、「#」、「選択時期」、「選択広告」、「選択グループ」、「パラメータ」、「選択候補」のフィールドを有する。「#」フィールドは、データベースのレコードの番号を格納する。「選択時期」フィールドは、端末装置30へ配信する広告を広告選択装置20が選択した日時を示す情報を格納し、「選択広告」フィールドは、端末装置30へ配信する広告として広告選択装置20が選択した広告の識別子を格納する。また、「選択グループ」のフィールドは、新規広告のグループと既存広告のグループとのうち、グループ選択部205が選択したグループを示す情報を格納する。   FIG. 10 is a diagram illustrating an example of the second advertisement selection history database DB32. The second advertisement selection history database DB32 has fields of “#”, “selection time”, “selection advertisement”, “selection group”, “parameter”, and “selection candidate”. The “#” field stores the record number of the database. The “selection time” field stores information indicating the date and time when the advertisement selection device 20 has selected the advertisement to be distributed to the terminal device 30, and the “selection advertisement” field is the advertisement selection device 20 as an advertisement to be distributed to the terminal device 30. Stores the identifier of the selected advertisement. Further, the “selected group” field stores information indicating a group selected by the group selection unit 205 from among a new advertisement group and an existing advertisement group.

「パラメータ」フィールドは、さらに「ε」、「γ」、「εa」、「εb」のフィールドを有する。「ε」フィールドは、ε−Greedyアルゴリズムにおいて「探索」を行う割合と「活用」を行う割合を定めるパラメータであるεの値を格納する。「γ」フィールドは、端末装置30へ配信する広告の候補を、新たにサーバ装置10に登録された新規広告のグループと、新規広告より前に登録された既存広告のグループとに分けたときに、これらのグループについてε−Greedyアルゴリズムで「探索」を行う割合と「活用」を行う割合を定めるパラメータであるγの値を格納する。「εa」フィールドは、既存広告のグループに属する広告について、ε−Greedyアルゴリズムで「探索」を行う割合と「活用」を行う割合を定めるパラメータであるεaを格納し、「εb」フィールドは、新規広告のグループに属する広告について、ε−Greedyアルゴリズムで「探索」を行う割合と「活用」を行う割合を定めるパラメータであるεbを格納する。   The “parameter” field further includes fields of “ε”, “γ”, “εa”, and “εb”. The “ε” field stores the value of ε, which is a parameter that determines the rate of performing “search” and the rate of performing “utilization” in the ε-Greyy algorithm. The “γ” field is used when the advertisement candidates to be distributed to the terminal device 30 are divided into a new advertisement group newly registered in the server apparatus 10 and an existing advertisement group registered before the new advertisement. Then, for these groups, the value of γ, which is a parameter for determining the ratio of performing “search” and the ratio of performing “utilization” by the ε-Greyy algorithm, is stored. The “εa” field stores εa, which is a parameter for determining the rate of performing “search” and the rate of performing “utilization” with the ε-Greedy algorithm for the advertisements belonging to the existing advertisement group, and the “εb” field is a new For the advertisements belonging to the advertisement group, εb, which is a parameter for determining the ratio of performing “search” and the ratio of performing “utilization” by the ε-Greedy algorithm, is stored.

「選択候補」フィールドは、「既存G」及び「新規G」のフィールドを有し、「既存G」及び「新規G」は、複数のサブフィールドを有する。「既存G」のフィールドは、既存広告のグループに属する広告の識別子を格納し、「新規G」のフィールドは、新規広告のグループに属する広告の識別子を格納する。 The “selection candidate” field has fields of “existing G” and “new G”, and “existing G” and “new G” have a plurality of subfields. The “existing G” field stores identifiers of advertisements belonging to the group of existing advertisements, and the “new G” field stores identifiers of advertisements belonging to the group of new advertisements.

(第2実施形態の動作例)
次に、第2実施形態の動作例について、図11、13のシーケンス図を用いて説明する。なお、以下の説明においては、識別子が「1」の広告と識別子が「2」の広告が登録されている状態において、図10に示した時期に広告の選択を行った後、識別子が「3」の広告が新たに登録された状態を想定して動作例の説明を行う。
(Operation example of the second embodiment)
Next, the operation example of 2nd Embodiment is demonstrated using the sequence diagram of FIG. In the following description, in the state where the advertisement with the identifier “1” and the advertisement with the identifier “2” are registered, after the advertisement is selected at the time shown in FIG. An example of the operation will be described on the assumption that a new advertisement is registered.

まず、端末装置30がサーバ装置10へアクセスすると、サーバ装置10は、広告の選択指示を広告選択装置20へ送信する。広告選択装置20は、この選択指示を取得すると、図11に示した動作を行う。なお、図11のステップS21〜S25までの処理は、第1実施形態のステップS1〜S5までの処理と同じであるため、その説明を省略する。   First, when the terminal device 30 accesses the server device 10, the server device 10 transmits an advertisement selection instruction to the advertisement selection device 20. Upon obtaining this selection instruction, the advertisement selection device 20 performs the operation shown in FIG. Note that the processing from steps S21 to S25 in FIG. 11 is the same as the processing from steps S1 to S5 in the first embodiment, and thus description thereof is omitted.

新規広告判断部202は、ステップS25の処理が終了すると、第2広告選択履歴データベースDB32に格納されている情報を取得する(ステップS26)。次に新規広告判断部202は、ステップS25で取得した情報と、ステップS26で取得したレコードを用いて、広告を選択した後にサーバ装置10へ新たに登録された広告があるか判断する(ステップS27)。
具体的には、新規広告判断部202は、表示広告候補データベースDB1から取得したレコードにおいて、登録時期が第2広告選択履歴データベースDB32から取得した選択時期より後のものがある場合、又は第2広告選択履歴データベースDB32から取得したγが予め定められた閾値(例えば0.5)を超える値である場合、「新たに登録された広告がある」と判断する。また、新規広告判断部202は、表示広告候補データベースDB1から取得したレコードにおいて、登録時期が第2広告選択履歴データベースDB32から取得した選択時期より後のものがなく、且つ、第2広告選択履歴データベースDB32から取得したγの値が予め定められた閾値以下である場合、「新たに登録された広告がない」と判断する。
When the process of step S25 ends, the new advertisement determination unit 202 acquires information stored in the second advertisement selection history database DB32 (step S26). Next, the new advertisement determination unit 202 determines whether there is an advertisement newly registered in the server device 10 after selecting an advertisement, using the information acquired in step S25 and the record acquired in step S26 (step S27). ).
Specifically, the new advertisement determination unit 202 determines that the record acquired from the display advertisement candidate database DB1 has a registration time later than the selection time acquired from the second advertisement selection history database DB32, or the second advertisement When γ acquired from the selection history database DB32 is a value that exceeds a predetermined threshold (for example, 0.5), it is determined that “there is a newly registered advertisement”. In addition, the new advertisement determination unit 202 has a record acquired from the display advertisement candidate database DB1 that does not have a registration time later than the selection time acquired from the second advertisement selection history database DB32, and the second advertisement selection history database When the value of γ acquired from the DB 32 is equal to or less than a predetermined threshold value, it is determined that “there is no newly registered advertisement”.

例えば、図3に示したレコードと図10に示したレコードとを比較した場合、広告を選択した最後の日時より後に、識別子が「3」の広告が登録されていることがわかる。この場合、新規広告判断部202は、広告を選択した後に新たに登録された広告がサーバ装置10にあると判断する。新規広告判断部202は、ステップS27の判断結果をパラメータ更新部203へ送り、パラメータ更新部203は、新規広告判断部202の判断結果を取得する(ステップS28)。パラメータ更新部203は、新規広告判断部202の判断結果を取得した後、第2広告選択履歴データベースDB32に格納されているパラメータのうち、選択時期が最新のレコードに格納されているパラメータを取得する(ステップS29)。   For example, when the record shown in FIG. 3 is compared with the record shown in FIG. 10, it can be seen that the advertisement with the identifier “3” is registered after the last date and time when the advertisement is selected. In this case, the new advertisement determination unit 202 determines that the server apparatus 10 has an advertisement newly registered after selecting the advertisement. The new advertisement determination unit 202 sends the determination result of step S27 to the parameter update unit 203, and the parameter update unit 203 acquires the determination result of the new advertisement determination unit 202 (step S28). The parameter update unit 203 acquires the parameter stored in the record with the latest selection time among the parameters stored in the second advertisement selection history database DB 32 after acquiring the determination result of the new advertisement determination unit 202. (Step S29).

パラメータ更新部203は、新規広告判断部202の判断結果とパラメータとを取得した後、広告を選択するときに用いるパラメータを更新する(ステップS30)。具体的には、パラメータ更新部203は、ステップS27の判断結果が、「新たに登録された広告がない」との判断結果の場合、例えば、ε=1/ln(t)という式を用いてεの値を減少させる。ここで「t」は、例えば、サーバ装置10が広告の配信を始めてから経過した時間を用いる。   The parameter update unit 203 updates the parameters used when selecting an advertisement after acquiring the determination result and parameters of the new advertisement determination unit 202 (step S30). Specifically, the parameter update unit 203 uses, for example, an equation ε = 1 / ln (t) when the determination result in step S27 is a determination result that “there is no newly registered advertisement”. Decrease the value of ε. Here, “t” uses, for example, the time that has elapsed since the server device 10 started distributing the advertisement.

一方、パラメータ更新部203は、ステップS27の判断結果が、「新たに登録された広告がある」との判断結果の場合、γ、εa及びεbの値を更新する。例えば、識別子が「1」の広告と識別子が「2」の広告が記憶されている状態から新たに識別子が「3」である広告が登録された場合、ステップS27の判断結果が、「新たに登録された広告がある」との判断結果になる。ここで、パラメータ更新部203は、第2広告選択履歴データベースDB32から取得したγの値が「Null」である場合、γの値を初期値の「1」にする。また、パラメータ更新部203は、第2広告選択履歴データベースDB32から取得したεaの値が「Null」である場合、εaの値を取得したεの値と同じ値とし、第2広告選択履歴データベースDB32から取得したεaの値が「Null」である場合、εbの値を、初期値の「1」とする。   On the other hand, the parameter update unit 203 updates the values of γ, εa, and εb when the determination result in step S27 is a determination result that “there is a newly registered advertisement”. For example, when an advertisement with an identifier “3” is newly registered from a state in which an advertisement with an identifier “1” and an advertisement with an identifier “2” are stored, the determination result in step S27 is “newly It is judged that there is a registered advertisement. Here, when the value of γ acquired from the second advertisement selection history database DB32 is “Null”, the parameter update unit 203 sets the value of γ to the initial value “1”. In addition, when the value of εa acquired from the second advertisement selection history database DB32 is “Null”, the parameter update unit 203 sets the value of εa to the same value as the acquired value of εa, and the second advertisement selection history database DB32 When the value of εa acquired from the above is “Null”, the value of εb is set to the initial value “1”.

パラメータ更新部203は、ε、γ、εa及びεbの値を更新すると、取得した広告候補リストと、取得したεの値と、更新したγ、εa及びεbの値をグループ選択部205へ送り、グループ選択部205は、送られた広告候補リスト、ε、γ、εa及びεbの値を取得する(ステップS31)。   When the parameter update unit 203 updates the values of ε, γ, εa, and εb, it sends the acquired advertisement candidate list, the acquired value of ε, and the updated values of γ, εa, and εb to the group selection unit 205, The group selection unit 205 acquires the sent advertisement candidate list and the values of ε, γ, εa, and εb (step S31).

グループ選択部205は、取得したγの値が「Null」ではない場合、取得したγを用いて、新たに登録された新規広告のグループと、新たに登録された広告より前に登録された既存広告のグループのいずれかを選択する(ステップS32)。
具体的には、グループ選択部205は、第2広告選択履歴データベースDB32において新たなレコードを生成し、取得した広告候補リストにおいてCTRの値が「Null」となっている識別子の「3」を、図12(a)に示したように、新規Gのフィールドに格納する。また、グループ選択部205は、取得した広告候補リストにおいてCTRの値が「Null」以外となっている識別子の「1」と「2」を、既存Gのフィールドに格納する。また、グループ選択部205は、取得したγの値を「γ」のフィールドに格納し、取得したεaの値を「εa」のフィールドに格納し、取得したεbの値を「εb」のフィールドに格納する。次に、グループ選択部205は、取得したγの値をε−Greedyアルゴリズムにおける「探索」と「活用」を行うときのパラメータとし、γの値の確率で「探索」を行い、1−γの値の確率で「活用」を行い、既存広告のグループと、新規広告のグループのいずれかを選択する。
When the acquired value of γ is not “Null”, the group selection unit 205 uses the acquired γ to newly register a new advertisement group and an existing registration registered before the newly registered advertisement. One of the advertisement groups is selected (step S32).
Specifically, the group selection unit 205 generates a new record in the second advertisement selection history database DB32, and sets the identifier “3” whose CTR value is “Null” in the acquired advertisement candidate list, As shown in FIG. 12A, the new G field is stored. Further, the group selection unit 205 stores the identifiers “1” and “2” whose CTR value is other than “Null” in the acquired advertisement candidate list in the existing G field. The group selection unit 205 stores the acquired γ value in the “γ” field, stores the acquired εa value in the “εa” field, and stores the acquired εb value in the “εb” field. Store. Next, the group selection unit 205 uses the acquired value of γ as a parameter for performing “search” and “utilization” in the ε-Greyy algorithm, performs “search” with the probability of the value of γ, and 1−γ “Utilize” with the probability of the value, and select either an existing advertisement group or a new advertisement group.

次にグループ選択部205は、選択したグループを示す情報を、「選択グループ」のフィールドに格納する(ステップS33)。例えば、グループ選択部205が、新規広告のグループを選択すると、ここまでで第2広告選択履歴データベースDB32は、図12(a)に示した状態となる。   Next, the group selection unit 205 stores information indicating the selected group in the “selected group” field (step S33). For example, when the group selection unit 205 selects a new advertisement group, the second advertisement selection history database DB32 is in the state shown in FIG.

次にグループ選択部205は、広告候補リストと、選択したグループから広告を選択するときに用いるパラメータと、選択したグループに含まれる広告の識別子を、表示広告計算部204へ送る(ステップS34)。例えば、グループ選択部205が、新規広告のグループを選択した場合、広告候補リストと、εbと、識別子の「3」が表示広告計算部204へ送られる。なお、グループ選択部205が、既存広告のグループを選択した場合、広告候補リストと、εaと、識別子の「1」及び「2」が表示広告計算部204へ送られる。   Next, the group selection unit 205 sends the advertisement candidate list, the parameters used when selecting an advertisement from the selected group, and the identifier of the advertisement included in the selected group to the display advertisement calculation unit 204 (step S34). For example, when the group selection unit 205 selects a new advertisement group, the advertisement candidate list, εb, and the identifier “3” are sent to the display advertisement calculation unit 204. When the group selection unit 205 selects an existing advertisement group, the advertisement candidate list, εa, and identifiers “1” and “2” are sent to the display advertisement calculation unit 204.

表示広告計算部204は、広告候補リストと、広告の識別子と、εbを取得すると、取得したεbの値を使用し、端末装置30へ配信する広告を選択する(ステップS35)。具体的には、表示広告計算部204は、バンディットテストにおいて、取得したεbの値の確率で「探索」を行い、1−εbの値の確率で「活用」を行う。「探索」においては、取得した識別子の中からランダムに識別子を選択し、「活用」においては、取得した識別子のうち、広告候補リストにおいて最も大きいCTRの値が対応付けられている識別子を選択する。なお、新規広告のグループに属する広告について、CTRの値が表示広告集計データベースDB2にない場合には、ランダムに選択する構成としてもよい。   When the display advertisement calculation unit 204 acquires the advertisement candidate list, the advertisement identifier, and εb, the display advertisement calculation unit 204 uses the acquired value of εb to select an advertisement to be distributed to the terminal device 30 (step S35). Specifically, the display advertisement calculation unit 204 performs “search” with the probability of the acquired value of εb and “utilizes” with the probability of the value of 1−εb in the bandit test. In “search”, an identifier is randomly selected from the acquired identifiers. In “utilization”, an identifier associated with the largest CTR value in the advertisement candidate list is selected from the acquired identifiers. . In addition, about the advertisement which belongs to the group of a new advertisement, when the value of CTR is not in display advertisement total database DB2, it is good also as a structure selected at random.

表示広告計算部204は、サーバ装置10から端末装置30へ配信する広告の識別子を選択すると、選択した広告の識別子をステップS32で生成したレコードの「選択広告」のフィールドに格納し、選択した日時を「選択時期」のフィールドに格納する(ステップS36)。例えば、識別子が「3」の広告が選択された場合、第2広告選択履歴データベースDB32は、図12(b)に示した状態となる。   When the display advertisement calculation unit 204 selects the identifier of the advertisement distributed from the server device 10 to the terminal device 30, the display advertisement calculation unit 204 stores the identifier of the selected advertisement in the “selected advertisement” field of the record generated in step S32, and the selected date and time. Is stored in the “selection time” field (step S36). For example, when the advertisement with the identifier “3” is selected, the second advertisement selection history database DB32 is in the state shown in FIG.

次に表示広告計算部204は、選択した広告の識別子を、通信部25を制御してサーバ装置10へ送信する(ステップS37)。サーバ装置10は、広告選択装置20からされた識別子を取得すると、取得した識別子の広告を端末装置30へ配信する。   Next, the display advertisement calculation unit 204 transmits the identifier of the selected advertisement to the server device 10 by controlling the communication unit 25 (step S37). When the server device 10 acquires the identifier made from the advertisement selection device 20, the server device 10 distributes the advertisement with the acquired identifier to the terminal device 30.

この後、端末装置30がサーバ装置10へアクセスすると、ステップS21〜S24と同様に、広告情報取得部201が表示広告候補データベースDB1にある情報と、表示広告集計データベースDB2にあるCTRを取得し、広告候補リストを生成してパラメータ更新部203へ送る(図13のステップS41〜S44)。また、新規広告判断部202は、表示広告候補データベースDB1に格納されている情報を取得する(ステップS45)。例えば、広告情報取得部201は、図3に示したレコードを取得する。また、新規広告判断部202は、第2広告選択履歴データベースDB32に格納されている最新のレコードとして、図12(b)に示したレコードのうち2行目のレコードを取得する(ステップS46)。   Thereafter, when the terminal device 30 accesses the server device 10, as in steps S21 to S24, the advertisement information acquisition unit 201 acquires information in the display advertisement candidate database DB1 and CTR in the display advertisement aggregation database DB2, An advertisement candidate list is generated and sent to the parameter update unit 203 (steps S41 to S44 in FIG. 13). Further, the new advertisement determination unit 202 acquires information stored in the display advertisement candidate database DB1 (step S45). For example, the advertisement information acquisition unit 201 acquires the record shown in FIG. Further, the new advertisement determination unit 202 acquires the record in the second row among the records shown in FIG. 12B as the latest record stored in the second advertisement selection history database DB32 (step S46).

次に新規広告判断部202は、ステップS45で取得した情報と、ステップS46で取得したレコードを用いて、広告を選択した後にサーバ装置10へ新たに登録された広告があるか判断する(ステップS47)。ここで、ステップS46で取得した図12(b)の2行目のレコードにおいては、γの値が1となっている。新規広告判断部202は、γの値が「Null」ではなく、γの値が予め定められた値を超える値であると、「新たに登録された広告がある」と判断する。新規広告判断部202は、ステップS47の判断結果をパラメータ更新部203へ送り、パラメータ更新部203は、新規広告判断部202の判断結果を取得する(ステップS48)。パラメータ更新部203は、新規広告判断部202の判断結果を取得した後、第2広告選択履歴データベースDB32に格納されているパラメータのうち、選択時期が最新のレコードに格納されているパラメータを取得する(ステップS49)。   Next, the new advertisement determination unit 202 determines whether there is an advertisement newly registered in the server device 10 after selecting an advertisement, using the information acquired in step S45 and the record acquired in step S46 (step S47). ). Here, the value of γ is 1 in the record in the second row of FIG. The new advertisement determination unit 202 determines that “there is a newly registered advertisement” if the value of γ is not “Null” but the value of γ exceeds a predetermined value. The new advertisement determination unit 202 sends the determination result of step S47 to the parameter update unit 203, and the parameter update unit 203 acquires the determination result of the new advertisement determination unit 202 (step S48). The parameter update unit 203 acquires the parameter stored in the record with the latest selection time among the parameters stored in the second advertisement selection history database DB 32 after acquiring the determination result of the new advertisement determination unit 202. (Step S49).

パラメータ更新部203は、新規広告判断部202の判断結果とパラメータとを取得した後、広告を選択するときに用いるパラメータを更新する(ステップS50)。ここでパラメータ更新部203は、ステップS47の判断結果が、「新たに登録された広告がある」の場合、γ、εa及びεbを更新する。具体的には、γについては、第2広告選択履歴データベースDB32から取得したγの値が「Null」ではない場合、γ=1/ln(t1)とする。ここで「t1」は、例えば、サーバ装置10に新規広告が登録されてから経過した時間とする。また、εaは、第2広告選択履歴データベースDB32から取得したεaの値が「Null」ではない場合、εa=1/ln(t1)とし、εbは、第2広告選択履歴データベースDB32から取得したεbの値が「Null」ではない場合、εb=1/ln(t1)とする。   The parameter update unit 203 updates the parameters used when selecting an advertisement after acquiring the determination result and parameters of the new advertisement determination unit 202 (step S50). Here, the parameter updating unit 203 updates γ, εa, and εb when the determination result in step S47 is “There is a newly registered advertisement”. Specifically, for γ, if the value of γ acquired from the second advertisement selection history database DB32 is not “Null”, γ = 1 / ln (t1). Here, “t1” is, for example, the time that has elapsed since the new advertisement was registered in the server device 10. Εa is εa = 1 / ln (t1) when the value of εa acquired from the second advertisement selection history database DB32 is not “Null”, and εb is εb acquired from the second advertisement selection history database DB32. Is not “Null”, εb = 1 / ln (t1).

パラメータ更新部203は、ε、γ、εa及びεbの値を更新すると、取得した広告候補リストと、取得したεの値と、更新したγ、εa及びεbの値をグループ選択部205へ送り、グループ選択部205は、送られた広告候補リスト、ε、γ、εa及びεbの値を取得する(ステップS51)。   When the parameter update unit 203 updates the values of ε, γ, εa, and εb, it sends the acquired advertisement candidate list, the acquired value of ε, and the updated values of γ, εa, and εb to the group selection unit 205, The group selection unit 205 acquires the sent advertisement candidate list and the values of ε, γ, εa, and εb (step S51).

グループ選択部205は、取得したγの値が「Null」ではない場合、取得したγを用いて、新たに登録された新規広告のグループと、新たに登録された広告より前に登録された既存広告のグループのいずれかを選択する(ステップS52)。
具体的には、グループ選択部205は、第2広告選択履歴データベースDB32において新たなレコードを生成し、生成した一つ前のレコードの「既存G」のフィールドにある情報を、生成したレコードの「既存G」のフィールドにコピーし、生成した一つ前のレコードの「新規G」のフィールドにある情報を、生成したレコードの「新規G」のフィールドにコピーする。また、グループ選択部205は、取得したγの値を「γ」のフィールドに格納し、取得したεaの値を「εa」に格納し、取得したεbの値を「εb」のフィールドに格納する。次に、グループ選択部205は、取得したγの値をε−Greedyアルゴリズムにおける「探索」と「活用」を行うときのパラメータとし、γの値の確率で「探索」を行い、1−γの値の確率で「活用」を行い、既存広告のグループと、新規広告のグループのいずれかを選択する。
When the acquired value of γ is not “Null”, the group selection unit 205 uses the acquired γ to newly register a new advertisement group and an existing registration registered before the newly registered advertisement. One of the advertisement groups is selected (step S52).
Specifically, the group selection unit 205 generates a new record in the second advertisement selection history database DB32, and uses the information in the “existing G” field of the generated previous record as “ The information in the “new G” field of the previous record generated is copied to the “new G” field of the generated record. The group selection unit 205 stores the acquired γ value in the “γ” field, stores the acquired εa value in “εa”, and stores the acquired εb value in the “εb” field. . Next, the group selection unit 205 uses the acquired value of γ as a parameter for performing “search” and “utilization” in the ε-Greyy algorithm, performs “search” with the probability of the value of γ, and 1−γ “Utilize” with the probability of the value, and select either an existing advertisement group or a new advertisement group.

次にグループ選択部205は、選択したグループを示す情報を「選択グループ」のフィールドに格納する(ステップS53)。例えば、グループ選択部205が、新規広告のグループを選択すると、ここまでで第2広告選択履歴データベースDB32は、図14(a)に示した状態となる。   Next, the group selection unit 205 stores information indicating the selected group in the “selected group” field (step S53). For example, when the group selection unit 205 selects a new advertisement group, the second advertisement selection history database DB32 is in the state shown in FIG.

次にグループ選択部205は、広告候補リストと、選択したグループから広告を選択するときに用いるパラメータのεaと、選択したグループに含まれる広告の識別子の「1」と「2」を、表示広告計算部204へ送る(ステップS54)。表示広告計算部204は、広告候補リストと、広告の識別子と、パラメータを取得すると、取得したパラメータの値を使用し、端末装置30へ配信する広告を選択する(ステップS55)。具体的には、表示広告計算部204は、バンディットテストにおいて、取得したεaの値の確率で「探索」を行い、1−εaの値の確率で「活用」を行う。「探索」においては、取得した識別子の中からランダムに識別子を選択し、「活用」においては、取得した識別子のうち、広告候補リストにおいて最も大きいCTRの値が対応付けられている識別子を選択する。   Next, the group selection unit 205 displays the advertisement candidate list, the parameter εa used when selecting an advertisement from the selected group, and the identifiers “1” and “2” of the advertisements included in the selected group. The data is sent to the calculation unit 204 (step S54). When the display advertisement calculation unit 204 acquires the advertisement candidate list, the advertisement identifier, and the parameter, the display advertisement calculation unit 204 uses the acquired parameter value to select an advertisement to be distributed to the terminal device 30 (step S55). Specifically, the display advertisement calculation unit 204 performs “search” with the probability of the acquired value of εa and “utilizes” with the probability of the value of 1−εa in the bandit test. In “search”, an identifier is randomly selected from the acquired identifiers. In “utilization”, an identifier associated with the largest CTR value in the advertisement candidate list is selected from the acquired identifiers. .

表示広告計算部204は、サーバ装置10から端末装置30へ配信する広告の識別子を選択すると、選択した広告の識別子をステップS52で生成したレコードの「選択広告」のフィールドに格納し、選択した日時を「選択時期」のフィールドに格納する(ステップS56)。例えば、識別子が「2」の広告が選択された場合、第2広告選択履歴データベースDB32は、図14(b)に示した状態となる。   When the display advertisement calculation unit 204 selects the identifier of the advertisement distributed from the server device 10 to the terminal device 30, the display advertisement calculation unit 204 stores the identifier of the selected advertisement in the “selected advertisement” field of the record generated in step S52. Is stored in the “selection time” field (step S56). For example, when the advertisement with the identifier “2” is selected, the second advertisement selection history database DB32 is in the state shown in FIG.

次に表示広告計算部204は、選択した広告の識別子を、通信部25を制御してサーバ装置10へ送信する(ステップS57)。サーバ装置10は、広告選択装置20からされた識別子を取得すると、取得した識別子の広告を端末装置30へ配信する。   Next, the display advertisement calculation unit 204 transmits the identifier of the selected advertisement to the server device 10 by controlling the communication unit 25 (step S57). When the server device 10 acquires the identifier made from the advertisement selection device 20, the server device 10 distributes the advertisement with the acquired identifier to the terminal device 30.

この後、端末装置30がサーバ装置10へアクセスをする毎に、上述したように、パラメータの更新、既存広告のグループ又は新規広告のグループの選択、及び選択したグループの中からの広告の選択が行われ、第2広告選択履歴データベースDB32が更新されていく。パラメータのγ、εa及びεbは、時間の経過によって減少するため、広告の選択が行われるたびに、第2広告選択履歴データベースDB32に格納されるパラメータの値は減少していく。   Thereafter, each time the terminal device 30 accesses the server device 10, as described above, update of parameters, selection of an existing advertisement group or new advertisement group, and selection of an advertisement from the selected group are performed. The second advertisement selection history database DB32 is updated. Since the parameters γ, εa, and εb decrease with the passage of time, the value of the parameter stored in the second advertisement selection history database DB32 decreases each time an advertisement is selected.

そして、新規広告判断部202が新規広告の有無を判断する際に、第2広告選択履歴データベースDB32から取得した最新のレコードにおいて、γの値が予め定められた閾値の0.5以下となっている場合、新規広告判断部202は、「新たに登録された広告がない」と判断する。新規広告判断部202の判断結果が、「新たに登録された広告がない」との結果であると、パラメータ更新部203は、広告を選択するときのパラメータを更新する。具体的には、パラメータ更新部203は、εの値を、「εa」のフィールドに格納されている値と同じ値とし、γ、εa及びεbの値を「Null」とする。   When the new advertisement determination unit 202 determines the presence or absence of a new advertisement, the value of γ in the latest record acquired from the second advertisement selection history database DB32 is 0.5 or less, which is a predetermined threshold value. If so, the new advertisement determination unit 202 determines that “there is no newly registered advertisement”. If the determination result of the new advertisement determination unit 202 is a result that “there is no newly registered advertisement”, the parameter update unit 203 updates a parameter when selecting an advertisement. Specifically, the parameter updating unit 203 sets the value of ε to the same value as the value stored in the field “εa”, and sets the values of γ, εa, and εb to “Null”.

パラメータ更新部203は、ε、γ、εa及びεbの値を更新すると、取得した広告候補リストと、更新したε、γ、εa及びεbの値をグループ選択部205へ送り、グループ選択部205は、送られたε、γ、εa及びεbの値を取得する。グループ選択部205は、γの値が「Null」である場合、既存広告のグループを選択する。ここで、グループ選択部205は、第2広告選択履歴データベースDB32において新たなレコードを生成する。グループ選択部205は、選択したグループを示す情報を、生成したレコードの「選択グループ」のフィールドに格納し、一つ前のレコードにおいて「既存G」のフィールドにあった識別子の「1」と「2」を、新たなレコードの「既存G」のフィールドに格納し、一つ前のレコードにおいて「新規G」のフィールドにあった識別子も、新たなレコードの「既存G」のフィールドに格納する。また、グループ選択部205は、取得したγの値(Null)を、新たなレコードの「γ」のフィールドに格納し、取得したεaの値(Null)を、新たなレコードの「εa」に格納し、取得したεbの値(Null)を、新たなレコードの「εb」に格納する。   When the parameter update unit 203 updates the values of ε, γ, εa, and εb, it sends the acquired advertisement candidate list and the updated values of ε, γ, εa, and εb to the group selection unit 205, and the group selection unit 205 Obtain the values of ε, γ, εa and εb sent. When the value of γ is “Null”, the group selection unit 205 selects an existing advertisement group. Here, the group selection unit 205 generates a new record in the second advertisement selection history database DB32. The group selection unit 205 stores information indicating the selected group in the “selected group” field of the generated record, and identifiers “1” and “1” that were in the “existing G” field in the previous record. 2 ”is stored in the“ existing G ”field of the new record, and the identifier that was in the“ new G ”field in the previous record is also stored in the“ existing G ”field of the new record. The group selection unit 205 stores the acquired γ value (Null) in the “γ” field of the new record, and stores the acquired εa value (Null) in “εa” of the new record. Then, the acquired value of εb (Null) is stored in “εb” of the new record.

次にグループ選択部205は、選択したグループに属する広告を選択するときのパラメータと、取得した広告候補リストを表示広告計算部204へ送る。例えば、上述したように、グループ選択部205が、既存広告のグループを選択し、γの値が「Null」となっている場合、取得したεと、取得した広告候補リストが表示広告計算部204へ送られる。   Next, the group selection unit 205 sends parameters for selecting an advertisement belonging to the selected group and the acquired advertisement candidate list to the display advertisement calculation unit 204. For example, as described above, when the group selection unit 205 selects a group of existing advertisements and the value of γ is “Null”, the acquired ε and the acquired advertisement candidate list are displayed advertisement calculation units 204. Sent to.

表示広告計算部204は、広告候補リストと、εを取得すると、取得したεの値を使用し、端末装置30へ配信する広告を、既存広告のグループに属する広告、即ち、識別子が「1」の広告、識別子が「2」の広告及び識別子が「3」の広告の中から、ε−Greedyアルゴリズムを用いて選択する。表示広告計算部204は、配信する広告を選択すると、選択した広告の識別子を第2広告選択履歴データベースDB32の「選択広告」のフィールドに格納する。
次に表示広告計算部204は、選択した広告の識別子をサーバ装置10へ送信する。サーバ装置10は、広告選択装置20からされた識別子を取得すると、取得した識別子の広告を端末装置30へ配信する。
When the display advertisement calculating unit 204 acquires the advertisement candidate list and the value of ε, the display advertisement calculating unit 204 uses the acquired value of ε to distribute the advertisement to be distributed to the terminal device 30 to an advertisement that belongs to the existing advertisement group, that is, the identifier is “1”. , An advertisement with an identifier “2”, and an advertisement with an identifier “3” are selected using the ε-Greedy algorithm. When the advertisement to be distributed is selected, the display advertisement calculation unit 204 stores the identifier of the selected advertisement in the “selected advertisement” field of the second advertisement selection history database DB32.
Next, the display advertisement calculation unit 204 transmits the identifier of the selected advertisement to the server device 10. When the server device 10 acquires the identifier made from the advertisement selection device 20, the server device 10 distributes the advertisement with the acquired identifier to the terminal device 30.

以上説明したように、第2実施形態によれば、広告を新たに登録されたグループと、新規広告より前に登録された既存広告のグループに分け、グループを分けた当初は、新規広告を選択する確率を高くし、新規広告を選択する確率を時間の経過に伴って低くしていくことにより、新たに登録された広告が探索される機会が増え、探索が十分に行われるため、真にクリック率が高い広告が選択されることとなる。   As described above, according to the second embodiment, the advertisement is divided into a newly registered group and an existing advertisement group registered before the new advertisement, and the new advertisement is selected when the group is initially divided. By increasing the probability of selecting a new advertisement and decreasing the probability of selecting a new advertisement over time, the chances for newly registered advertisements to be increased will increase, and the search will be performed sufficiently. An advertisement with a high click rate is selected.

[第3実施形態]
次に、本発明の第3実施形態について説明する。本発明の第3実施形態に係る広告配信システム1は、第1実施形態と同じく、サーバ装置10と広告選択装置20を含む。第3実施形態に係るサーバ装置10と広告選択装置20のハードウェア構成は第1実施形態と同じである。第3実施形態においては、広告選択装置20が行う処理が第1実施形態と異なる。また、第3実施形態においては、広告選択装置20において選択確率更新部206が実現する点と、広告選択履歴データベースDB3に替えて、第3広告選択履歴データベースDB33を有する点が第1実施形態と異なる。以下、第1実施形態と同じ構成については説明を省略し、第1実施形態との相違点について説明する。
[Third Embodiment]
Next, a third embodiment of the present invention will be described. The advertisement delivery system 1 according to the third embodiment of the present invention includes a server device 10 and an advertisement selection device 20 as in the first embodiment. The hardware configuration of the server device 10 and the advertisement selection device 20 according to the third embodiment is the same as that of the first embodiment. In 3rd Embodiment, the process which the advertisement selection apparatus 20 performs differs from 1st Embodiment. Moreover, in 3rd Embodiment, the point which the selection probability update part 206 implement | achieves in the advertisement selection apparatus 20, and the point which has 3rd advertisement selection history database DB33 instead of advertisement selection history database DB3 are 1st Embodiment. Different. Hereinafter, description of the same configuration as that of the first embodiment will be omitted, and differences from the first embodiment will be described.

図15は、第3実施形態に係る広告選択装置20において実現する機能の構成を示した機能ブロック図である。選択確率更新部206は、配信する候補となる広告のそれぞれについて、選択される確率を更新する機能を有しており、選択される確率を登録されてからの経過時間に応じて更新する。表示広告計算部204は、選択確率更新部206が更新した選択確率を使用し、端末装置30へ配信する広告を選択する機能を有する。   FIG. 15 is a functional block diagram illustrating a configuration of functions realized in the advertisement selection device 20 according to the third embodiment. The selection probability update unit 206 has a function of updating the probability of selection for each advertisement that is a candidate for distribution, and updates the probability of selection according to the elapsed time since registration. The display advertisement calculation unit 204 has a function of selecting an advertisement to be distributed to the terminal device 30 using the selection probability updated by the selection probability update unit 206.

図16は、第3広告選択履歴データベースDB33の一例を示した図である。第3広告選択履歴データベースDB33は、「#」、「選択時期」、「選択広告」、「パラメータ」、「選択候補」、及び「選択確率」のフィールドを有する。「#」フィールドは、データベースのレコードの番号を格納する。「選択時期」フィールドは、端末装置30へ配信する広告を広告選択装置20が選択した日時を示す情報を格納し、「選択広告」フィールドは、端末装置30へ配信する広告として広告選択装置20が選択した広告の識別子を格納する。「パラメータ」フィールドは、ε−Greedyアルゴリズムにおいて「探索」を行う割合と「活用」を行う割合を定めるパラメータであるεの値を格納する。「選択候補」フィールドは、複数のサブフィールドを有し、端末装置30へ配信する広告を選択する際に選択の候補となった広告の識別子を格納する。「選択確率」フィールドは、複数のサブフィールドを有し、配信する候補となる広告のそれぞれが選択される確率が格納される。   FIG. 16 is a diagram illustrating an example of the third advertisement selection history database DB33. The third advertisement selection history database DB33 has fields of “#”, “selection time”, “selection advertisement”, “parameter”, “selection candidate”, and “selection probability”. The “#” field stores the record number of the database. The “selection time” field stores information indicating the date and time when the advertisement selection device 20 has selected the advertisement to be distributed to the terminal device 30, and the “selection advertisement” field is the advertisement selection device 20 as an advertisement to be distributed to the terminal device 30. Stores the identifier of the selected advertisement. The “parameter” field stores the value of ε, which is a parameter that determines the ratio of performing “search” and the ratio of performing “utilization” in the ε-Greyy algorithm. The “selection candidate” field has a plurality of subfields, and stores identifiers of advertisements that are candidates for selection when an advertisement to be distributed to the terminal device 30 is selected. The “selection probability” field has a plurality of subfields, and stores the probability that each advertisement to be distributed is selected.

(第3実施形態の動作例)
次に、第3実施形態の動作例について、図17のシーケンス図を用いて説明する。なお、以下の説明においては、識別子が「1」の広告と識別子が「2」の広告が登録されている状態において、識別子が「3」の広告が新たに登録された状態を想定して動作例の説明を行う。
(Operation example of the third embodiment)
Next, an operation example of the third embodiment will be described with reference to the sequence diagram of FIG. In the following description, it is assumed that an advertisement with an identifier “3” is newly registered while an advertisement with an identifier “1” and an advertisement with an identifier “2” are registered. An example will be explained.

端末装置30がサーバ装置10へアクセスすると、サーバ装置10は、広告の選択指示を広告選択装置20へ送信する。広告選択装置20は、この選択指示を取得すると、図17に示した動作を行う。なお、図17のステップS61〜S63までの処理は、第1実施形態のステップS1〜S3までの処理と同じであるため、その説明を省略する。広告情報取得部201は、ステップS63で広告候補リストを生成すると、生成した広告候補リストをパラメータ更新部203と選択確率更新部206へ送る(ステップS64)。   When the terminal device 30 accesses the server device 10, the server device 10 transmits an advertisement selection instruction to the advertisement selection device 20. When the advertisement selection device 20 acquires this selection instruction, it performs the operation shown in FIG. Note that the processing from Steps S61 to S63 in FIG. 17 is the same as the processing from Steps S1 to S3 in the first embodiment, and thus description thereof is omitted. When the advertisement information acquisition unit 201 generates the advertisement candidate list in step S63, the advertisement information acquisition unit 201 sends the generated advertisement candidate list to the parameter update unit 203 and the selection probability update unit 206 (step S64).

次に、新規広告判断部202は、表示広告候補データベースDB1に格納されている情報を取得する(ステップS65)。例えば、上述したように、配信する広告の候補として3つの広告がサーバ装置10に登録されている場合、新規広告判断部202は、図3に示した3つのレコードを取得する。また、新規広告判断部202は、第3広告選択履歴データベースDB33に格納されているレコードのうち、選択時期が最新のレコードを取得する(ステップS66)。   Next, the new advertisement determination unit 202 acquires information stored in the display advertisement candidate database DB1 (step S65). For example, as described above, when three advertisements are registered in the server apparatus 10 as advertisement candidates to be distributed, the new advertisement determination unit 202 acquires the three records shown in FIG. Also, the new advertisement determination unit 202 acquires a record having the latest selection time among the records stored in the third advertisement selection history database DB33 (step S66).

新規広告判断部202は、ステップS65で取得した情報と、ステップS66で取得したレコードを用いて、広告を選択した後にサーバ装置10へ新たに登録された広告があるか判断し(ステップS67)、判断結果をパラメータ更新部203へ通知する(ステップS68)。例えば、取得した図3に示したレコードと、取得した図15に示したレコードとを比較した場合、広告を選択した最後の日時より後に、識別子が「3」の広告が登録されていることがわかる。この場合、新規広告判断部202は、広告を選択した後に新たに登録された広告がサーバ装置10にあると判断する。   The new advertisement determination unit 202 determines whether there is an advertisement newly registered in the server device 10 after selecting an advertisement using the information acquired in step S65 and the record acquired in step S66 (step S67). The determination result is notified to the parameter update unit 203 (step S68). For example, when the acquired record shown in FIG. 3 is compared with the acquired record shown in FIG. 15, the advertisement with the identifier “3” is registered after the last date and time when the advertisement is selected. Recognize. In this case, the new advertisement determination unit 202 determines that the server apparatus 10 has an advertisement newly registered after selecting the advertisement.

新規広告判断部202は、ステップS67の判断結果をパラメータ更新部203へ送り、パラメータ更新部203は、新規広告判断部202の判断結果を取得する(ステップS68)。パラメータ更新部203は、新規広告判断部202の判断結果を取得すると、ε−Greedyアルゴリズムにより広告を選択するときのパラメータであるεの値を更新する(ステップS69)。具体的には、パラメータ更新部203は、新規広告判断部202の判断結果にかかわらず、εの値を減少させ、例えば、ε=1/ln(t)とする。ここで「t」は、例えば、サーバ装置10が広告の配信を始めてから経過した時間を用いる。パラメータ更新部203は、εの値を更新すると、更新した値と、取得した広告候補リストを選択確率更新部206へ送り、選択確率更新部206は、送られたεの値と、広告候補リストを取得する(ステップS70)。また、パラメータ更新部203は、更新したεの値と、取得した広告候補リストを表示広告計算部204へ送り、表示広告計算部204は、送られたεの値と、広告候補リストを取得する(ステップS71)。   The new advertisement determination unit 202 sends the determination result of step S67 to the parameter update unit 203, and the parameter update unit 203 acquires the determination result of the new advertisement determination unit 202 (step S68). When the parameter update unit 203 acquires the determination result of the new advertisement determination unit 202, the parameter update unit 203 updates the value of ε, which is a parameter for selecting an advertisement by the ε-Greyy algorithm (step S69). Specifically, the parameter update unit 203 decreases the value of ε regardless of the determination result of the new advertisement determination unit 202, for example, ε = 1 / ln (t). Here, “t” uses, for example, the time that has elapsed since the server device 10 started distributing the advertisement. When the parameter updating unit 203 updates the value of ε, the parameter updating unit 203 sends the updated value and the acquired advertisement candidate list to the selection probability updating unit 206, and the selection probability updating unit 206 sends the value of ε sent to the advertisement candidate list. Is acquired (step S70). The parameter updating unit 203 sends the updated ε value and the acquired advertisement candidate list to the display advertisement calculating unit 204, and the display advertisement calculating unit 204 acquires the sent ε value and the advertisement candidate list. (Step S71).

選択確率更新部206は、εの値と、広告候補リストを取得すると、選択の候補となる広告のそれぞれの選択確率Pを、サーバ装置10へ登録されてからの期間Tが短いほど値が大きくなるように重み付けをして更新する(ステップS72)。
具体的には、選択確率更新部206は、広告候補リストにある識別子の広告の登録時期を、表示広告候補データベースDB1から取得し、識別子の広告が登録されてからの経過時間を求める。そして、選択確率更新部206は、識別子をi、識別子がiの広告がサーバ装置10へ登録されてからの経過時間をTi、選択される候補となる広告の数をN、識別子がiの広告の選択が選択される確率の選択確率をPiとしたとき、選択確率Piは、Pi=kε/(TiN)として計算される。但し、kは数2の式を満たすための定数である。

Figure 0006470965
When the selection probability updating unit 206 acquires the value of ε and the advertisement candidate list, the selection probability P of each advertisement that is a candidate for selection increases as the period T from when it is registered in the server device 10 is shorter. The weight is updated so as to become (step S72).
Specifically, the selection probability update unit 206 obtains the registration time of the advertisement with the identifier in the advertisement candidate list from the display advertisement candidate database DB1, and obtains the elapsed time after the advertisement with the identifier is registered. Then, the selection probability updating unit 206 sets the elapsed time since the advertisement with the identifier i, the identifier i is registered in the server device 10 to Ti, the number of advertisements to be selected as N, and the advertisement with the identifier i. The selection probability Pi is calculated as Pi = kε / (TiN), where Pi is the selection probability of the probability that the selection is selected. However, k is a constant for satisfying the formula (2).
Figure 0006470965

選択確率更新部206は、選択される候補となる広告のそれぞれについて、選択確率を計算し終えると、計算した選択確率と、広告候補リストを表示広告計算部204へ送る(ステップS73)。表示広告計算部204は、広告候補リストと、選択確率を取得すると、取得した広告候補リストにあるCTRと、パラメータ更新部203から取得したεの値を使用し、端末装置30へ配信する広告を選択する(ステップS74)。具体的には、表示広告計算部204は、バンディットテストにおいて、取得したεの値の確率で「探索」を行い、1−εの値の確率で「活用」を行う。「探索」においては、広告候補リストにある広告の識別子の中から取得した選択確率で広告を選択し、「活用」においては、広告候補リストにおいて最も大きいCTRの値が対応付けられている識別子を選択する。   When the selection probability update unit 206 finishes calculating the selection probability for each of the advertisements that are candidates for selection, the selection probability update unit 206 sends the calculated selection probability and the advertisement candidate list to the display advertisement calculation unit 204 (step S73). When the display advertisement calculation unit 204 acquires the advertisement candidate list and the selection probability, the display advertisement calculation unit 204 uses the CTR in the acquired advertisement candidate list and the value of ε acquired from the parameter update unit 203 to transmit an advertisement to be distributed to the terminal device 30. Select (step S74). Specifically, the display advertisement calculation unit 204 performs “search” with the probability of the acquired value of ε and “utilizes” with the probability of the value of 1−ε in the bandit test. In “search”, an advertisement is selected with the selection probability acquired from the advertisement identifiers in the advertisement candidate list. In “utilization”, an identifier associated with the largest CTR value in the advertisement candidate list is selected. select.

表示広告計算部204は、サーバ装置10から端末装置30へ配信する広告を選択すると、第3広告選択履歴データベースDB33に新たにレコードを追加し、選択した広告の識別子や取得したεの値、取得した選択確率などを格納する(ステップS75)。
具体的には、表示広告計算部204は、広告の選択を行った日時を、新たに追加したレコードの「選択時期」のフィールドに格納し、パラメータ更新部203から取得したεの値を、新たに追加したレコードの「パラメータ」のフィールドに格納し、選択した広告の識別子を、新たに追加したレコードの「選択広告」のフィールドに格納する。また、表示広告計算部204は、取得した広告候補リストに含まれている識別子を、「選択候補」のフィールドに格納し、取得した選択確率を、「選択確率」のフィールドに格納する。
When the display advertisement calculation unit 204 selects an advertisement to be distributed from the server device 10 to the terminal device 30, the display advertisement calculation unit 204 newly adds a record to the third advertisement selection history database DB33, and acquires the identifier of the selected advertisement and the acquired value of ε. The selected selection probability and the like are stored (step S75).
Specifically, the display advertisement calculation unit 204 stores the date and time when the advertisement is selected in the “selection time” field of the newly added record, and sets the value of ε acquired from the parameter update unit 203 to the new value. Is stored in the “parameter” field of the added record, and the identifier of the selected advertisement is stored in the “selected advertisement” field of the newly added record. The display advertisement calculation unit 204 stores the identifier included in the acquired advertisement candidate list in the “selection candidate” field, and stores the acquired selection probability in the “selection probability” field.

次に表示広告計算部204は、選択した広告の識別子を、通信部25を制御してサーバ装置10へ送信する(ステップS76)。サーバ装置10は、広告選択装置20からされた識別子を取得すると、取得した識別子の広告を端末装置30へ配信する。   Next, the display advertisement calculation unit 204 transmits the identifier of the selected advertisement to the server device 10 by controlling the communication unit 25 (step S76). When the server device 10 acquires the identifier made from the advertisement selection device 20, the server device 10 distributes the advertisement with the acquired identifier to the terminal device 30.

以上説明したように、第3実施形態によれば、広告が登録されてからの経過時間に応じて広告の選択確率が決まるため、広告が頻繁に登録される場合でも、新たに登録された広告について、探索が十分に行われ、真にクリック率が高い広告が選択されることとなる。   As described above, according to the third embodiment, since the advertisement selection probability is determined according to the elapsed time after the advertisement is registered, even if the advertisement is frequently registered, the newly registered advertisement Thus, the search is sufficiently performed, and an advertisement with a truly high click rate is selected.

[第4実施形態]
次に、本発明の第4実施形態について説明する。本発明の第4実施形態に係る広告配信システム1は、第1実施形態と同じく、サーバ装置10と広告選択装置20を含む。本実施形態に係るサーバ装置10と広告選択装置20のハードウェア構成は第1実施形態と同じである。本実施形態においては、広告選択装置20が行う処理が第1実施形態と異なり、具体的には、パラメータ更新部203の動作が異なる。以下、本実施形態の動作例について説明する。
[Fourth Embodiment]
Next, a fourth embodiment of the present invention will be described. The advertisement distribution system 1 according to the fourth embodiment of the present invention includes a server device 10 and an advertisement selection device 20 as in the first embodiment. The hardware configuration of the server device 10 and the advertisement selection device 20 according to this embodiment is the same as that of the first embodiment. In the present embodiment, the processing performed by the advertisement selection device 20 is different from that in the first embodiment, and specifically, the operation of the parameter update unit 203 is different. Hereinafter, an operation example of this embodiment will be described.

(第4実施形態の動作例)
第4実施形態の動作例について、図18のシーケンス図を用いて説明する。まず、端末装置30がサーバ装置10へアクセスすると、サーバ装置10は、広告の選択指示を広告選択装置20へ送信する。広告選択装置20は、この選択指示を取得すると、図18に示した動作を行う。なお、図18のステップS81〜S89までの処理は、第1実施形態のステップS1〜S9までの処理と同じであるため、その説明を省略する。
(Operation example of the fourth embodiment)
An operation example of the fourth embodiment will be described with reference to the sequence diagram of FIG. First, when the terminal device 30 accesses the server device 10, the server device 10 transmits an advertisement selection instruction to the advertisement selection device 20. When the advertisement selection device 20 acquires this selection instruction, it performs the operation shown in FIG. Note that the processing from steps S81 to S89 in FIG. 18 is the same as the processing from steps S1 to S9 in the first embodiment, and thus description thereof is omitted.

パラメータ更新部203は、新規広告判断部202の判断結果を取得すると、表示広告集計データベースDB2に格納されている情報を取得する(ステップS90)。パラメータ更新部203は、表示広告集計データベースDB2から情報を取得すると、ステップS89で取得したεの値を更新する(ステップS91)。   When the parameter update unit 203 acquires the determination result of the new advertisement determination unit 202, the parameter update unit 203 acquires information stored in the display advertisement tabulation database DB2 (step S90). When the parameter update unit 203 acquires information from the display advertisement total database DB2, the parameter update unit 203 updates the value of ε acquired in step S89 (step S91).

具体的には、パラメータ更新部203は、取得した新規広告判断部202の判断結果が、「新たに登録された広告がある」との判断結果の場合、表示広告集計データベースDB2から情報を取得すると、新たに登録された広告より前に登録されていた広告のジャンル毎にCTRの平均と分散を計算する。また、新たに登録された広告のCTRについては、当該広告が属するジャンルにおけるCTRの平均値を初期値とし、新たに登録された広告が属するジャンルが新たなジャンルである場合、例えば、予め定められた初期値として、CTRの平均と分散を計算する。   Specifically, the parameter update unit 203 acquires information from the display advertisement total database DB2 when the determination result of the acquired new advertisement determination unit 202 is a determination result that “there is a newly registered advertisement”. The average and variance of the CTR are calculated for each genre of advertisement registered before the newly registered advertisement. In addition, regarding the CTR of a newly registered advertisement, when the average value of the CTR in the genre to which the advertisement belongs is an initial value and the genre to which the newly registered advertisement belongs is a new genre, for example, As an initial value, the average and variance of the CTR are calculated.

次に、パラメータ更新部203は、新たに追加された広告のジャンルについて、算出したCTRの分散が、他のジャンルのCTRの分散より大きい場合には、パラメータのεの値を初期化して1にする。また、パラメータ更新部203は、新たに追加された広告のジャンルについて、算出したCTRの分散が、他のジャンルのCTRの分散以下である場合には、例えば、ε=1/ln(t)とし、εの値を減少させる。なお、ここで「t」は、例えば、εの値を1に設定してから経過した時間を用いる。   Next, the parameter updating unit 203 initializes the value of ε of the parameter to 1 when the calculated CTR variance for the newly added genre is larger than the variance of the CTR of other genres. To do. The parameter updating unit 203 sets ε = 1 / ln (t), for example, when the calculated CTR variance is less than or equal to the variance of the CTR of other genres for the newly added advertisement genre. , Decrease the value of ε. Here, “t” is, for example, the time elapsed since the value of ε was set to 1.

パラメータ更新部203は、εの値を更新すると、取得した広告候補リストと、更新したεの値を表示広告計算部204へ送る(ステップS92)。表示広告計算部204は、広告候補リストと、更新されたεの値を取得すると、第1実施形態と同様に、取得した広告候補リストにあるCTRと、取得したεの値を使用し、端末装置30へ配信する広告を選択する(ステップS93)。   When updating the value of ε, the parameter update unit 203 sends the acquired advertisement candidate list and the updated value of ε to the display advertisement calculation unit 204 (step S92). When the display advertisement calculation unit 204 acquires the advertisement candidate list and the updated value of ε, similarly to the first embodiment, the display advertisement calculation unit 204 uses the CTR in the acquired advertisement candidate list and the acquired value of ε, An advertisement to be distributed to the device 30 is selected (step S93).

表示広告計算部204は、サーバ装置10から端末装置30へ配信する広告の識別子を選択すると、第1実施形態と同様に、広告選択履歴データベースDB3に新たにレコードを追加し、選択した広告の識別子や取得したεの値などを格納する(ステップS94)。
次に表示広告計算部204は、選択した広告の識別子をサーバ装置10へ送信する(ステップS95)。サーバ装置10は、広告選択装置20からされた識別子を取得すると、取得した識別子の広告を端末装置30へ配信する。
When the display advertisement calculation unit 204 selects an identifier of an advertisement distributed from the server device 10 to the terminal device 30, the display advertisement calculation unit 204 adds a new record to the advertisement selection history database DB3 and selects the identifier of the selected advertisement, as in the first embodiment. And the acquired value of ε and the like are stored (step S94).
Next, the display advertisement calculation unit 204 transmits the identifier of the selected advertisement to the server device 10 (step S95). When the server device 10 acquires the identifier made from the advertisement selection device 20, the server device 10 distributes the advertisement with the acquired identifier to the terminal device 30.

以上説明したように、本実施形態によれば、新たに登録された広告が探索される機会が増え、探索が十分に行われるため、真にクリック率が高い広告が選択されることとなる。   As described above, according to the present embodiment, an opportunity for searching for a newly registered advertisement is increased, and the search is sufficiently performed. Therefore, an advertisement with a truly high click rate is selected.

[変形例]
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。例えば、上述の実施形態を以下のように変形して本発明を実施してもよい。なお、上述した実施形態及び以下の変形例は、各々を組み合わせてもよい。
[Modification]
As mentioned above, although embodiment of this invention was described, this invention is not limited to embodiment mentioned above, It can implement with another various form. For example, the present invention may be implemented by modifying the above-described embodiment as follows. In addition, you may combine each of embodiment mentioned above and the following modifications.

上述した実施形態においては、サーバ装置10と広告選択装置20は、別々の装置となっているが、サーバ装置10が広告選択装置20の機能を備えた構成、即ち、サーバ装置10と広告選択装置20とが一体化された構成であってもよい。   In the embodiment described above, the server device 10 and the advertisement selection device 20 are separate devices. However, the server device 10 has the function of the advertisement selection device 20, that is, the server device 10 and the advertisement selection device. 20 may be integrated.

本発明に係る機能を実現するプログラムは、磁気記録媒体(磁気テープ、磁気ディスク(HDD(Hard Disk Drive)、FD(Flexible Disk))など)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリーなどのコンピュータ読取り可能な記録媒体に記憶した状態で提供し、各装置にインストールしてもよい。また、通信網2を介してプログラムをダウンロードして各装置にインストールしてもよい。   The program for realizing the functions according to the present invention includes a magnetic recording medium (magnetic tape, magnetic disk (HDD (Hard Disk Drive), FD (Flexible Disk)), etc.), optical recording medium (optical disk, etc.), magneto-optical recording medium, It may be provided in a state stored in a computer-readable recording medium such as a semiconductor memory and installed in each device. Alternatively, the program may be downloaded via the communication network 2 and installed in each device.

1…広告配信システム、2…通信網、10…サーバ装置、20…広告選択装置、30…端末装置、21…制御部、22…記憶部、23…表示部、24…操作部、25…通信部、201…広告情報取得部、202…新規広告判断部、203…パラメータ更新部、204…表示広告計算部、205…グループ選択部、206…選択確率更新部、DB1…表示広告候補データベース、DB2…表示広告集計データベース、DB3…広告選択履歴データベース、DB32…第2広告選択履歴データベース、DB33…第3広告選択履歴データベース   DESCRIPTION OF SYMBOLS 1 ... Advertisement delivery system, 2 ... Communication network, 10 ... Server apparatus, 20 ... Advertisement selection apparatus, 30 ... Terminal device, 21 ... Control part, 22 ... Memory | storage part, 23 ... Display part, 24 ... Operation part, 25 ... Communication , 201 ... Advertisement information acquisition unit, 202 ... New advertisement determination unit, 203 ... Parameter update unit, 204 ... Display advertisement calculation unit, 205 ... Group selection unit, 206 ... Selection probability update unit, DB1 ... Display advertisement candidate database, DB2 ... display advertisement total database, DB3 ... advertisement selection history database, DB32 ... second advertisement selection history database, DB33 ... third advertisement selection history database

Claims (7)

端末装置へ配信する広告の候補のそれぞれの登録時期を取得する登録時期取得手段と、
端末装置へ配信された広告の選択時期を取得する選択時期取得手段と、
パラメータに応じた割合で探索及び活用を行うバンディットアルゴリズムにより、前記候補の中から端末装置へ配信する広告を選択する選択手段と、
前記候補に含まれる広告のうち、前記登録時期取得手段が取得した時期が、前記選択時期取得手段が取得した選択時期より後の広告がある場合、前記探索を行う割合が増加するように前記パラメータを更新する更新手段と、
前記選択手段が選択した広告を識別する情報を出力する出力手段と、
を有する広告選択装置。
Registration time acquisition means for acquiring the registration time of each of the advertisement candidates to be distributed to the terminal device;
Selection time acquisition means for acquiring the selection time of the advertisement distributed to the terminal device;
Selection means for selecting an advertisement to be delivered to the terminal device from among the candidates by a bandit algorithm that searches and uses at a rate according to a parameter;
Among the advertisements included in the candidate, when there is an advertisement whose time acquired by the registration time acquisition unit is later than the selection time acquired by the selection time acquisition unit, the parameter is set so that the rate of performing the search increases. Updating means for updating
Output means for outputting information for identifying the advertisement selected by the selection means;
An advertisement selection device.
前記更新手段は、前記候補に含まれる広告のうち、前記登録時期取得手段が取得した登録時期が、前記選択時期取得手段が取得した選択時期より後の広告の数が多くなるにつれて、前記探索を行う割合を多くするように前記パラメータを更新する
請求項1に記載の広告選択装置。
The update means performs the search as the number of advertisements after the registration time acquired by the registration time acquisition means among the advertisements included in the candidates increases after the selection time acquired by the selection time acquisition means. The advertisement selection device according to claim 1, wherein the parameter is updated so as to increase a ratio to be performed.
前記選択手段は、
前記候補に含まれる広告を、前記登録時期取得手段が取得した登録時期が、前記選択時期取得手段が取得した選択時期より後である広告の第1グループと、前記登録時期取得手段が取得した登録時期が、前記選択時期取得手段が取得した選択時期より前である広告の第2グループとに分け、
第1パラメータに応じた割合で探索及び活用を行うバンディットアルゴリズムにより、前記第1グループと前記第2グループのいずれかの選択を行い、第2パラメータに応じた割合で探索及び活用を行うバンディットアルゴリズムにより、選択したグループに属する広告から端末装置へ配信する広告を選択し、
前記更新手段は、時間の経過に応じて、前記探索を行う割合が減少するように前記第1パラメータ及び前記第2パラメータを減少させる
請求項1に記載の広告選択装置。
The selection means includes
A first group of advertisements whose registration time acquired by the registration time acquisition means is later than the selection time acquired by the selection time acquisition means and the registration acquired by the registration time acquisition means for the advertisement included in the candidate Divided into a second group of advertisements whose time is before the selection time acquired by the selection time acquisition means,
The bandit algorithm for searching and utilization at a rate corresponding to the first parameter, do one of the selection of the first group and the second group, the bandit algorithm for searching and utilization at a rate corresponding to the second parameter , Select an advertisement to be delivered to the terminal device from advertisements belonging to the selected group,
The advertisement selection device according to claim 1, wherein the update unit decreases the first parameter and the second parameter so that a rate of performing the search decreases as time elapses.
前記選択手段は、前記探索を行うときに、前記候補に含まれる広告毎に、選択される確率を登録時期からの経過時間が短くなるにつれて大きくする
請求項1に記載の広告選択装置。
The advertisement selection device according to claim 1, wherein, when performing the search, the selection unit increases the probability of selection for each advertisement included in the candidate as the elapsed time from the registration time becomes shorter.
前記更新手段は、前記候補に含まれる広告のうち、前記登録時期取得手段の取得した登録時期が前記選択時期取得手段の取得した選択時期より後である広告が属するジャンルに含まれる広告のクリック率の分散が、他のジャンルに含まれる広告のクリック率の分散より大きい場合、前記探索を行う割合が増加するように前記パラメータを更新する
請求項1に記載の広告選択装置。
The update means includes, among the advertisements included in the candidate, a click rate of advertisements included in a genre to which an advertisement whose registration time acquired by the registration time acquisition means is later than the selection time acquired by the selection time acquisition means The advertisement selection device according to claim 1, wherein when the distribution of is larger than a distribution of click rates of advertisements included in other genres, the parameter is updated so that the ratio of the search is increased.
コンピュータ装置の制御部が、端末装置へ配信する広告の候補のそれぞれの登録時期を取得する登録時期取得ステップと、
前記制御部が、端末装置へ配信された広告の選択時期を取得する選択時期取得ステップと、
前記制御部が、パラメータに応じた割合で探索及び活用を行うバンディットアルゴリズムにより、前記候補の中から端末装置へ配信する広告を選択する選択ステップと、
前記制御部が、前記候補に含まれる広告のうち、前記登録時期取得ステップで取得した時期が、前記選択時期取得ステップで取得した選択時期より後の広告がある場合、前記探索を行う割合が増加するように前記パラメータを更新する更新ステップと、
前記制御部が、前記選択ステップが選択した広告を識別する情報を出力する出力ステップと、
を有する広告選択方法。
A registration time acquisition step in which the control unit of the computer device acquires the registration time of each of the advertisement candidates to be distributed to the terminal device;
A selection time acquisition step in which the control unit acquires a selection time of an advertisement distributed to the terminal device; and
A selection step in which the control unit selects an advertisement to be delivered to the terminal device from among the candidates by a bandit algorithm that searches and uses at a rate according to a parameter;
When the control unit has an advertisement whose time acquired in the registration time acquisition step is later than the selection time acquired in the selection time acquisition step among the advertisements included in the candidate, the ratio of performing the search increases. An updating step for updating the parameters to:
An output step wherein said control unit is configured to output information identifying the advertisement said selection step selects,
An advertisement selection method.
コンピュータを、
端末装置へ配信する広告の候補のそれぞれの登録時期を取得する登録時期取得手段と、
端末装置へ配信された広告の選択時期を取得する選択時期取得手段と、
パラメータに応じた割合で探索及び活用を行うバンディットアルゴリズムにより、前記候補の中から端末装置へ配信する広告を選択する選択手段と、
前記候補に含まれる広告のうち、前記登録時期取得手段が取得した時期が、前記選択時期取得手段が取得した選択時期より後の広告がある場合、前記探索を行う割合が増加するように前記パラメータを更新する更新手段と、
前記選択手段が選択した広告を識別する情報を出力する出力手段、
として機能させるためのプログラム。
Computer
Registration time acquisition means for acquiring the registration time of each of the advertisement candidates to be distributed to the terminal device;
Selection time acquisition means for acquiring the selection time of the advertisement distributed to the terminal device;
Selection means for selecting an advertisement to be delivered to the terminal device from among the candidates by a bandit algorithm that searches and uses at a rate according to a parameter;
Among the advertisements included in the candidate, when there is an advertisement whose time acquired by the registration time acquisition unit is later than the selection time acquired by the selection time acquisition unit, the parameter is set so that the rate of performing the search increases. Updating means for updating
Output means for outputting information for identifying the advertisement selected by the selection means;
Program to function as.
JP2014260156A 2014-12-24 2014-12-24 Advertisement selection device, advertisement selection method and program Active JP6470965B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014260156A JP6470965B2 (en) 2014-12-24 2014-12-24 Advertisement selection device, advertisement selection method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014260156A JP6470965B2 (en) 2014-12-24 2014-12-24 Advertisement selection device, advertisement selection method and program

Publications (2)

Publication Number Publication Date
JP2016122241A JP2016122241A (en) 2016-07-07
JP6470965B2 true JP6470965B2 (en) 2019-02-13

Family

ID=56328955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014260156A Active JP6470965B2 (en) 2014-12-24 2014-12-24 Advertisement selection device, advertisement selection method and program

Country Status (1)

Country Link
JP (1) JP6470965B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6229861B1 (en) * 2016-10-14 2017-11-15 株式会社セガゲームス Advertisement control apparatus and program
JP6944360B2 (en) * 2017-12-11 2021-10-06 株式会社Nttドコモ Devices, methods, and programs that control the presentation order of content
JP6755904B2 (en) * 2018-07-11 2020-09-16 楽天株式会社 Selection system, selection method, and program
JP7047911B2 (en) * 2018-07-12 2022-04-05 日本電気株式会社 Information processing system, information processing method and storage medium
JP7290170B2 (en) * 2019-10-07 2023-06-13 日本電気株式会社 Optimization device, optimization method and optimization program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4880962B2 (en) * 2004-09-27 2012-02-22 ヤフー株式会社 Advertisement content distribution ratio calculation program, advertisement content distribution ratio calculation method, advertisement content distribution ratio calculation system, content distribution control system, advertisement content distribution control system, advertisement content distribution control method, and advertisement content distribution control program
JP5265659B2 (en) * 2010-12-28 2013-08-14 ヤフー株式会社 Advertisement information providing device
JP5068888B1 (en) * 2012-02-24 2012-11-07 スキルアップジャパン株式会社 Advertisement distribution device and advertisement distribution program

Also Published As

Publication number Publication date
JP2016122241A (en) 2016-07-07

Similar Documents

Publication Publication Date Title
US11263217B2 (en) Method of and system for determining user-specific proportions of content for recommendation
US20200128097A1 (en) Optimizing user interface data caching for future actions
CN107111652B (en) System and method for selecting device content based on probability of device being linked
US11587143B2 (en) Neural contextual bandit based computational recommendation method and apparatus
JP6470965B2 (en) Advertisement selection device, advertisement selection method and program
US20160188733A1 (en) Generating Recommendations Based on Clustered Application States
CN103348342A (en) Personal content stream based on user-topic profile
US20150186535A1 (en) Determining an Active Persona of a User Device
US10089652B2 (en) Generating advertisements for search results that reference software applications
CN102150158A (en) Method, system, and apparatus for arranging content search results
JP6522129B2 (en) Information processing method and device
JP6543774B2 (en) Information ranking based on computing device properties
US10331680B2 (en) Ranking of search results
WO2023142520A1 (en) Information recommendation method and apparatus
JP5264813B2 (en) Evaluation apparatus, evaluation method, and evaluation program
TWI682341B (en) Promotion information display method and device
US20200394194A1 (en) Multi-vertical entity-based search system
JP6113797B2 (en) Determination apparatus, determination method, and determination program
WO2018202127A1 (en) Information pushing method and device, storage medium, and electronic device
JP6414192B2 (en) Information processing apparatus, information processing method, and information processing program
CN108055387A (en) Recommendation information display method and device, electronic equipment and readable storage medium
US20180204230A1 (en) Demographic prediction for unresolved users
JP6601889B1 (en) Information processing apparatus, information processing method, and information processing program
JP6584584B1 (en) Information processing apparatus, information processing method, and information processing program
JP2015187887A (en) Information processing apparatus, terminal device, information processing method, display method, information processing program, and display program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190121

R150 Certificate of patent or registration of utility model

Ref document number: 6470965

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250