JP5787924B2 - クラスタ形成装置、クラスタ形成方法及びクラスタ形成プログラム - Google Patents
クラスタ形成装置、クラスタ形成方法及びクラスタ形成プログラム Download PDFInfo
- Publication number
- JP5787924B2 JP5787924B2 JP2013054654A JP2013054654A JP5787924B2 JP 5787924 B2 JP5787924 B2 JP 5787924B2 JP 2013054654 A JP2013054654 A JP 2013054654A JP 2013054654 A JP2013054654 A JP 2013054654A JP 5787924 B2 JP5787924 B2 JP 5787924B2
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- advertisement
- user
- group
- impressions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 56
- 239000011159 matrix material Substances 0.000 claims description 46
- 230000008569 process Effects 0.000 claims description 34
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 238000009499 grossing Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 10
- 230000008859 change Effects 0.000 description 8
- 238000000605 extraction Methods 0.000 description 8
- 230000004044 response Effects 0.000 description 5
- 230000008685 targeting Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
クラスタリング処理に関連する技術として、例えば、非特許文献2、非特許文献3には、対象としている情報の密度に基づいたクラスタリング手法が開示されている。
本発明は、このような背景技術の状況の中でなされたもので、ターゲティング広告の配信精度を高めるために、行列内の各セルの実績ログから算出したCTRの精度が高くなるように、ユーザとコンテンツのクラスタを形成するようにしたクラスタ形成装置、クラスタ形成方法及びクラスタ形成プログラムを提供することを目的としている。
(1)ユーザに適したコンテンツを決定するにあたって、ユーザとコンテンツの関係を示す行列を生成するためにユーザとコンテンツのクラスタを形成するクラスタ形成装置であって、ユーザ又はコンテンツである要素に対して、その属性に基づいた多次元空間におけるクラスタ間の距離に応じて、そのクラスタを並べる階層型クラスタリング手法によるクラスタリング処理を行い、該クラスタは隣合うクラスタ間において親子関係を有する階層的構成であり、上位のクラスタは下位のクラスタ内の要素を含むように第1のクラスタ群を形成する第1のクラスタリング手段と、前記第1のクラスタリング手段によって形成された前記第1のクラスタ群内の要素のインプレッション数に基づいて、予め定められた条件に合致するクラスタに対して、該クラスタとしての形態を取り除くことによって第2のクラスタ群を形成する第2のクラスタリング手段を具備し、前記第2のクラスタリング手段は、予め定められた条件として、第1のクラスタ群のクラスタ内の要素のインプレッション数が閾値を超えている場合は、該クラスタを第2のクラスタ群のクラスタとして採用し、第1のクラスタ群のクラスタ内の要素のインプレッション数が該閾値を超えていない場合は、該クラスタを削除し、該削除対象のクラスタの要素を親クラスタ内に残すことによって第2のクラスタ群を形成することを特徴とするクラスタ形成装置である。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
OPTICS−DeliClu以外の階層型クラスタリング手法として、例えば、ユーザに対しては、予め定められたルール(例えば、国籍、性別、年代等にクラスタを分けるルール)に基づいてクラスタを形成するようにしてもよい。そのルールによって階層構造クラスタになればよい。例えば、国籍のルールの場合は「不明→ヨーロッパ→北欧→フィンランド」という順序の親子関係を形成することによって階層構造クラスタになる。
あるクラスタの要素はそのクラスタの親クラスタの要素にもなる。同じく、そのクラスタの親クラスタの親クラスタ(祖父の関係にあるクラスタ)の要素にもなる。つまり、ある要素は複数のクラスタに属することが可能である。また、同様に要素のインプレッションの数もそのクラスタの親クラスタのインプレッションとしても数えられることになる。 なお、後述するように、あるクラスタのインプレッションの数が閾値未満ならば、最終的なクラスタにならない。その場合、そのクラスタの親クラスタは、子クラスタが一つ減ることになる。すなわち、閾値未満の要素を持つクラスタは単にその形態として取り除かれたことになる。しかし、そのクラスタに含まれている全ての要素は、親クラスタの要素になる。したがって、クラスタの形態としては削除されるが、そのクラスタの要素はそのまま親クラスタ内にあることになる。つまり、クラスタが削除される以前と同じ状態である。そして、その要素のインプレッションは、親クラスタのインプレッションの対象となる。
より具体的には、第2クラスタ形成部2314は、予め定められた条件として、第1のクラスタ内の要素のインプレッション数が閾値を超えている場合は、そのクラスタを第2のクラスタ群のクラスタとして採用し、第1のクラスタ群のクラスタ内の要素のインプレッション数がその閾値を超えていない場合は、そのクラスタとしての形態を取り除きその第2のクラスタ群を形成するようにしてもよい。閾値は、予め定められた値(例えば、10万等)であり、高ければ高いほど後述のCTR行列のセルの値は信頼度(質)が高くなるという影響がある。一方、前記の閾値は高ければ高いほどクラスタの要素の類似度が低くなり、あまり似ていない要素を集合する事になるという影響がある。つまり、閾値はこの2つの影響のバランスをとるための数値である。第1のクラスタ群のクラスタ内の要素のインプレッション数が閾値を超えている場合とは、インプレッション数がクラスタを形成するに十分である場合である。第1のクラスタ内の要素のインプレッション数がその閾値を超えていない場合とは、クラスタを形成するのにインプレッション数が不足している状態であり、その第1のクラスタ群のクラスタは、最終的なクラスタとしては採用すべきではないこととなる。そこで、OPTICS−DeliCluによってクラスタリング処理を行った場合の結果を第1のクラス群とする。「クラスタとしての形態を取り除く」(「クラスタを削除する」ともいう)とは、クラスタ内の要素までを削除するわけではなく、クラスタの形態は消去するが、そのクラスタ内の要素は親クラスタに含まれたままである。結果として、階層構造内の1つのクラスタは消去されたことになるが、そのクラスタ内にあった要素は、上位のクラスタ(親クラスタ)に含まれたままである。なお、階層的クラスタであるので、クラスタを削除する前から親のクラスタの要素として、子クラスタの要素は含まれている。したがって、第1のクラスタ群と第2のクラスタ群における全ての要素数は、クラスタを削除した場合であっても変化することはない。さらに、親クラスタ(A)に属する下位のクラスタ(子クラスタ)を全て削除しても、その親クラスタ(A)のインプレッション数が不足している場合は、その上の親クラスタ(B)に属するクラスタ(親クラスタ(A)の兄弟関係にあるクラスタ)に対して、同様の処理を行う。これを第1のクラスタ群に属する全てのクラスタに対して処理する。
このようにクラスタを形成するので、そのクラスタを縦と横(例えば、コンテンツクラスタを縦、ユーザクラスタを横)としたCTR行列を生成し、各セルの実績ログから算出したCTR(Click Through Rate(クリック・スルー・レート))の精度が高くなるため、ターゲティング広告の配信精度が高くなる。なお、CTRは、コンテンツ(広告)がクリックされた割合を示しているが、詳細については次に説明する。
例えば、CTR行列は図6の例に示すようになる。このCTR行列600は、列(横軸)に各ユーザクラスタ(ユーザの階層構造クラスタ620内の各クラスタ)を並べ、行(縦軸)に各広告クラスタ(広告の階層構造クラスタ610内の各クラスタ)を並べたものである。なお、CTR行列600の(1,1)のセル(図6では左上のセル)内は、平均CTR650を示している。
全てのインプレッション数(I)と全てのクリック数(C)を集計する。
CTRは単純な(クリック数/インップレション数)を用いるのではなく、スムージングCTRを用いるものとする。つまり、スムージングCTRは(c+k×C)/(i+k×I)によって算出する。そのために、各ユーザクラスタに対して各広告クラスタのクリック数(c)とインプレッションの数(i)を集計する。kはスムージングパラメータであり、0ではないが0に近い値であればよい。スムージングCTRを用いることによって、ゼロで除算することを避けることができる。そして、あるクラスタのペアのインプレッション数が少ない場合に極端な値となることを防止することにもなる。例えば、全てのクリック数(C)を2.3万、全てのインプレッション数(I)を1000万とした場合は、平均CTR=C/I=2.3万/1000万=0.23%である。ここであるクラスタのクリック数が0.4万、インプレッション数が50万である場合は、平均CTR=0.8%となるが、スムージングCTRは、(0.4万+0.001×2.3万)/(50万+0.001×1000万)=4023/51万=0.79%となる。ここで、0.001は、スムージングパラメータkである。
a.ユーザの操作によって新しいウェブページが表示される。その際、操作を行ったユーザ(ユーザの属性等)が入力となる。
b.そのユーザが属するユーザクラスタを検索する。なお、そのユーザが属するクラスタは複数となる可能性がある。
c.前述の通り作成したCTR行列を対象として、検索したユーザクラスタに対応する行において、その行(複数の行であってもよい)の中で最も高いCTRのセルを抽出する。(広告選択の第1ステップ)。
セル内の広告毎に算出したスムージングCTRの順位(昇順)に応じて、広告を選択し、配信する(広告選択の第2ステップ)。
e.なお、セルの広告の数が予め定められた広告の数未満(つまり、広告数不足)であるならば、そのセルを除いて、次の最も高いスムージングCTRのセルを検索する。
ステップS2002では、第1クラスタ形成部2312が、OPTICS−DeliCluを用いたクラスタリングを行う。図3を用いて説明する。図3(a)は、ユーザ又はコンテンツをプロットした多次元空間の例を示している。図3(a)内の1つ1つの点が、多次元空間内におけるユーザ又はコンテンツである。図3(b)の例に示すように、7つのクラスタ(図ではA〜G)が生成される。
本実施の形態の第1クラスタ形成部2312で用いるクラスタ手法は、非特許文献2に記載されているOPTICS階層型クラスタ手法であるが、以下に概要を説明する。
ReachabilityPlotの作成:
a.最初に任意の点を選び、その点のラベルを(X)変数に保存する。
b.MinPtsというOPTICS手法のパラメターをNとする。
c.ReachabilityPlotに横軸の(x)に(X)を記入して、縦軸(y)に∞(無限な距離)を記入する。(X)点は「処理済」となる。
d.(X)点に最も近いN点を検索し、その点の中で一番遠い点を抽出し、その点への距離を(y0)として保存する。
e.(X)点に一番近いが、処理済ではない点を検索する。その点への距離を(y1)とする。その点のラベルを(X)変数に保存する(変数の値の更新)。
f.ReachabilityPlotの横軸(x)に(X)を記入し、縦軸(y)に(y0)と(y1)の最大値を記入する。(X)点は「処理済」になる。
g.処理済ではない点がなくなるまで、(d.)ステップからの処理を繰り返す。
h.この手順の出力はReachabilityPlotとなる。横軸は点のラベルの並びであり、縦軸はReachabilityDistanceという距離となる。例えば、図3(b)と図4(b)のようなグラフとなる。
a.ReachabilityPlotの点はいくつの種類がある。説明を分かりやすくするために、以下のような用語を定義する。
(a−i)「下がる」:点の(y)の値にξパラメータを乗算し、その値が次の点の(y)の値より高い場合である。ξの値は、例えば0.99のような1未満で1に近い値である。
(a−ii)「上がる」:次の点の(y)の値にξパラメータを乗算し、その値はこの点の(y)の値より高い場合である。
(a−iii)「変更なし」:上がる点でなく、下がる点でもない点である。
(a−iv)「頂点」:条件が2つある。条件は、1)下がる点、2)前の点が下がる点ではないことである。
b.ReachabilityPlotにおいて、クラスタの境界は左端と右端が両方「頂点」となるが、右端はクラスタの要素にはならない。左端と右端のペアの間にどちらの高さより高い頂点があれば、そのペアはクラスタにはならない。クラスタになる場合は、その頂点のペアより高くない頂点は子クラスタの境界になる。
c.なお、「変更なし」の点も複数あることが可能である。隣接する「変更なし」点のインプレッションの数が閾値以上ならクラスタになる。なお、その場合はξパラメータの値を少し増加すれば「変更なし」点は、「上がる」点か「下がる」点になる。したがって、隣接する「変更なし」点のインプレッションの数が閾値未満になり、上記bを適用すればよい。
ステップS2006では、第2クラスタ形成部2314が、その第1クラスタを第2クラスタとして採用する。図4では、クラスタC、F、Gは、それぞれそのままクラスタ2、4、5として最終的なクラスタとする。
ステップS2010では、クラスタリング処理部231が、全ての第1クラスタに対しての処理が終了したか否かを判断し、終了した場合は処理を終了し、それ以外の場合はステップS2004に戻る。
インプレッション数によるクラスタの階層構造の変更:
a.前述のように各「頂点」のペアは、一つのクラスタ候補になる。しかし、第2クラスタ形成部2314の処理によって、そのクラスタの要素のインプレッション数が閾値未満ならば、最終的なクラスタにはならない(「クラスタを削除」という意味である)。
b.一つの要素でも、インプレッション数が閾値以上となるならば、最終的なクラスタになる。すなわち、そのクラスタは要素が一つだけある。
c.前述のとおり、隣接する「変更なし」点のインプレッション数が閾値以上ならば、クラスタになる。
d.つまり、クラスタには上記の3つの種類がある。具体的には、(1)「頂点」のペア、(2)一つの要素のクラスタ、(3)隣接する「変更なし」、の3種類のクラスタがある。
図5(b)の例に示す階層構造は、図5(a)の例に示す階層構造に対して、第2クラスタ形成部2314が処理を行った結果の第2のクラスタ群の階層構造を示すものである。閾値を10万とした場合の処理結果である。つまり、インプレッション数が10万未満であるクラスタA(4万)とクラスタB(6.5万)を削除し、その親のクラスタ1(10.5万)はそのまま採用されている。また、インプレッション数が10万未満であるクラスタD(3.2万)とクラスタE(6.9万)を削除し、その親のクラスタ3(10.1万)はそのまま採用されている。他のクラスタ(クラスタC、F、G)、もちろんのことながら、その親のクラスタ(クラスタX、Y、All data(ルート))は、そのまま第2のクラスタ群として採用されている。
図7は本実施の形態の広告配信システムの全体構成例を示す図である。本実施の形態の広告配信システムは、ユーザ端末10と通信ネットワーク30を介して通信可能に接続されるWebサーバ20を含んで構成される。
通信ネットワーク30は、例えば公衆電話回線網や専用通信回線網、携帯電話回線網、無線通信網、イーサネット(登録商標)などにより構築される、インターネットやLAN(Local Area Network)である。
Webサーバ20は、画像や動画、テキストなどの各種のコンテンツをHTTP(HyperText Transfer Protocol)に従って提供する、例えばワークステーションやパーソナルコンピュータなどのコンピュータである。ユーザ端末10は、Webサーバ20が提供する各種のWebページを閲覧するブラウザを動作させる、例えばパーソナルコンピュータやタブレットコンピュータ、携帯電話端末、PDA(Personal Digital Assistant)などのコンピュータである。
図8はWebサーバ20のハードウェア構成例を示す図である。Webサーバ20は、CPU201、メモリ202、記憶装置203、通信インタフェース204、入力装置205、出力装置206を備える。記憶装置203は、各種のデータやプログラムを記憶する、例えばハードディスクドライブやソリッドステートドライブ、フラッシュ・メモリなどである。通信インタフェース204は、通信ネットワーク30に接続するためのインタフェースであり、例えばイーサネット(登録商標)に接続するためのアダプタ、公衆電話回線網に接続するためのモデム、無線通信を行うための無線通信機、シリアル通信のためのUSB(Universal Serial Bus)コネクタやRS232Cコネクタなどである。入力装置205は、データを入力する、例えばキーボードやマウス、タッチパネル、ボタン、マイクロフォンなどである。出力装置206は、データを出力する、例えばディスプレイやプリンタ、スピーカなどである。
図9はWebサーバ20のソフトウェア構成例を示す図である。Webサーバ20は、HTTP処理部211、Webページ作成部212、広告選択部213、ログ収集部214及び解析処理部215の機能部と、Web情報データベース251、広告データベース252、ユーザデータベース253、インプレッションログ記憶部255及びクリックログ記憶部256の記憶部とを備えている。
なお、上記各機能部は、Webサーバ20が備えるCPU201が記憶装置203に記憶されているプログラムを実行することにより実現され、上記各記憶部は、Webサーバ20が備えるメモリ202及び記憶装置203が提供する記憶領域の一部として実現される。
(1)Web情報データベース251
Web情報データベース251は、Webページを作成するための情報(以下、Web情報という。)を記憶する。Web情報は、例えば、HTMLで記述されたファイルや、CGI(Common Gateway Interface)などの仕組みにより実行されるプログラムを格納したプログラムファイル、画像ファイルなどである。Web情報データベース251は、例えば、Webサーバ20で動作するオペレーティングシステムが提供するファイルシステムのディレクトリやフォルダにより実現することができる。
広告データベース252は、広告を表示するための情報(以下、広告情報という。)を記憶する。図10は、広告データベース252に記憶される広告情報の構成例を示す図である。広告情報には、広告の識別情報である広告IDに対応付けて、広告のカテゴリ、広告に関するURL(Uniform Resource Locator)、広告のタイトル、入札額、及び実CTR(前述の平均CTR)が含まれる。広告情報のURLが示すWebページはランディングページとも呼ばれ、広告がクリックされるとランディングページにリダイレクトされることになる。
本実施の形態ではタイトルの文字列をWebページの広告として表示するものとする。広告には広告IDを指定した所定のURL(ホスト名にWebサーバ20が指定されるものとする。以下、リダイレクトURLという。)へのリンクが設定される。Webページにおいて広告がクリックされると、広告IDを含むリクエストがWebサーバ20に送信され、後述するログ収集部214によりクリックされたことのログが収集され、HTTP処理部211により広告IDに対応する広告情報のURLにリダイレクトされる(例えば、当該URLをリダイレクト先として指定した応答が送信される。)。これにより、広告に応じたユーザの行動(クリック)を検知することができる。
ユーザデータベース253は、ユーザに関する情報(以下、ユーザ情報という。)を記憶する。図11はユーザデータベース253に記憶されるユーザ情報の構成例を示す図である。ユーザ情報には、ユーザの識別情報であるユーザIDに対応付けて、ユーザの性別やユーザが現在する都道府県、ユーザの趣味などのユーザの属性とが含まれる。なお、性別、都道府県、趣味以外にも各種のユーザについての属性をユーザ情報に含めることができる。
インプレッションログ記憶部255は、Webページに広告が表示されたこと(インプレッションと呼ばれる。)を示す情報(以下、インプレッションログという。)を記憶する。図12は、インプレッションログ記憶部255に記憶されるインプレッションログの構成例を示す図である。インプレッションログには、Webページに広告が表示された日時(すなわち、WebページがWebサーバ20から送信された日時である。以下、配信日時という。)、Webページを示すURL、表示された広告を示す広告ID、Webページを閲覧したユーザを示すユーザIDが含まれる。インプレッションログは1つの広告が表示されるにつき1つ登録される。すなわち、例えば1つのWebページに3つの広告が表示された場合には、3つのインプレッションログが登録されることになる。
クリックログ記憶部256は、Webページに表示された広告がクリックされたことを示す情報(以下、クリックログという。)を記憶する。図13は、クリックログ記憶部256に記憶されるクリックログの構成例を示す図である。クリックログには、クリックされた広告を示す広告ID、広告をクリックしたユーザを示すユーザID、広告が表示されたWebページを示すURL、及び広告がクリックされた日時(クリック日時)が含まれる。
(1)HTTP処理部211
HTTP処理部211は、HTTPの処理を行う。HTTP処理部211は、ユーザ端末10から送信されるHTTPのリクエストを受信する。
リクエストにリダイレクトURLが指定されていた場合、HTTP処理部211は、ログ収集部214を呼び出してクリックログを登録させた上で、リクエストに含まれている広告IDに対応する広告情報を広告データベース252から読み出し、読み出した広告情報に含まれているURLをリダイレクト先として指定した応答をユーザ端末10に応答する。
Webページ作成部212は、Webページを表示するための画面情報を作成する。Webページ作成部212は、広告選択部213を呼び出してWebページに表示させる広告を選択させ、選択された広告がWebページに表示され、広告がクリックされた場合にはリダイレクトURLにアクセスするように、例えばリンクタグを設定した文字列を画面情報に挿入する。なお、Webページ作成部212が、広告以外の各種のコンテンツを作成する処理については、一般的なWebサーバによる処理を用いるものとして、ここでは説明を省略する。
広告選択部213は、Webページに表示する広告を選択する。
広告選択部213は、配信候補抽出部221、広告決定部223を備えている。なお、配信候補抽出部221、広告決定部223も、CPU201が記憶装置203に記憶されているプログラムをメモリ202に読み出して実行することにより実現される。
配信候補抽出部221は、広告の候補を決定する。配信候補抽出部221は、前述した広告選択の第1ステップの処理を行う。つまり、クラスタ処理された広告クラスタの中からユーザクラスタに対応する広告クラスタを選択する。
(3−2)広告決定部223
広告決定部223は、配信候補抽出部221が決定した候補の中から表示する広告を、前述した広告選択の第2ステップの処理によって決定する。つまり、広告クラスタ内から個別の広告を選択する。
ログ収集部214は、インプレッションログ及びクリックログを登録する。ログ収集部214は、HTTPにリダイレクトURLが指定されていた場合には、リダイレクトURLに指定されている広告IDに対応するカテゴリを広告データベース252から読み出し、当該広告ID、読み出したカテゴリ、及び現在の日時を設定したクリックログを作成してクリックログ記憶部256に登録する。HTTPにリダイレクトURL以外のURLが指定されていた場合には、ログ収集部214は、広告選択部213が選択した広告のそれぞれについて、現在日時、広告を示す広告ID、及び当該広告のカテゴリを含むインプレッションログを作成してインプレッションログ記憶部255に登録する。
解析処理部215は、クラスタリング処理部231、及び行列生成部232を備える。なお、クラスタリング処理部231、及び行列生成部232も、CPU201が記憶装置203に記憶されているプログラムをメモリ202に読み出して実行することにより実現される。
クラスタリング処理部231はクラスタリング処理を行い、ユーザをユーザクラスタに分類し、広告を広告クラスタに分類する。図1〜5を用いて前述した通りの処理を行う。
(5−2)行列生成部232
行列生成部232は、ユーザが広告をクリックしたスムージングCTRからCTR行列を生成する。行列生成部232は、ユーザクラスタと広告クラスタとの全ての組み合わせについて、当該ユーザクラスタに帰属するユーザが、当該広告クラスタに帰属する広告を閲覧したインプレッション数及び当該ユーザが当該広告をクリックしたクリック数を取得して、スムージングCTRを算出する。
図14は解析処理部215による解析処理の流れを示す図である。
クラスタリング処理部231は、例えばユーザ情報に含まれている属性、インプレッションログ及びクリックログなどに基づく行動履歴などを用いて、前述したようにユーザのクラスタリングを行い、ユーザクラスタを決定する(S311)。
図16は、Webサーバ20により行われる処理の流れを示す図である。
HTTP処理部211は、ユーザ端末10からHTTPのリクエストを受信する(S401)。なおリクエストには、URL、ユーザID及び現在日時が設定されているものとする。
広告がクリックされたと判定した場合(S408:YES)、ログ収集部214は、リダイレクトURLに設定されている広告IDに対応する広告情報を広告データベース252から読み出し、リクエストに設定されているユーザID及び現在日時ならびに広告ID、カテゴリを含むクリックログを作成してクリックログ記憶部256に登録する(S409)。HTTP処理部211は、広告情報のURLにリダイレクトするようにHTTPのレスポンスをユーザ端末10に送信する(S410)。
一方、広告がクリックされていないと判断した場合には(S408:NO)、処理の流れは終了となる。
図17は、ステップS405における広告の選択処理の流れを示す図である。
配信候補抽出部221は、広告データベース252から前述した広告選択の第1ステップの処理を行う(S421)。つまり、広告クラスタを選択する。
次に、広告決定部223は、広告データベース252から前述した広告選択の第2ステップの処理を行う(S422)。つまり、広告クラスタ内から個別の広告を選択する。
広告決定部223は、CTRの大きい順にn個の広告情報を選択して広告リストとする(S423)。なお、広告決定部223は、CTRに広告情報の入札額を乗じた値の大きい順にn個の広告情報を選択するようにしてもよい。
本実施の形態では広告の配信を想定しているが、広告の配信に限らず、各種のコンテンツの提供を行うシステムに適用してもよい。また、コンテンツとユーザとの関係性もクリック率に限らず、ユーザがコンテンツを嗜好する度合いなど各種の関係性とすることができる。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
2312…第1クラスタ形成部
2314…第2クラスタ形成部
211…HTTP処理部
212…Webページ作成部
213…広告選択部
214…ログ収集部
215…解析処理部
221…配信候補抽出部
223…広告決定部
231…クラスタリング処理部
232…行列生成部
251…Web情報データベース
252…広告データベース
253…ユーザデータベース
255…インプレッションログ記憶部
256…クリックログ記憶部
Claims (3)
- ユーザに適したコンテンツを決定するにあたって、ユーザとコンテンツの関係を示す行列を生成するためにユーザとコンテンツのクラスタを形成するクラスタ形成装置であって、
ユーザ又はコンテンツである要素に対して、その属性に基づいた多次元空間におけるクラスタ間の距離に応じて、そのクラスタを並べる階層型クラスタリング手法によるクラスタリング処理を行い、該クラスタは隣合うクラスタ間において親子関係を有する階層的構成であり、上位のクラスタは下位のクラスタ内の要素を含むように第1のクラスタ群を形成する第1のクラスタリング手段と、
前記第1のクラスタリング手段によって形成された前記第1のクラスタ群内の要素のインプレッション数に基づいて、予め定められた条件に合致するクラスタに対して、該クラスタとしての形態を取り除くことによって第2のクラスタ群を形成する第2のクラスタリング手段
を具備し、
前記第2のクラスタリング手段は、予め定められた条件として、第1のクラスタ群のクラスタ内の要素のインプレッション数が閾値を超えている場合は、該クラスタを第2のクラスタ群のクラスタとして採用し、第1のクラスタ群のクラスタ内の要素のインプレッション数が該閾値を超えていない場合は、該クラスタを削除し、該削除対象のクラスタの要素を親クラスタ内に残すことによって第2のクラスタ群を形成する
ことを特徴とするクラスタ形成装置。 - ユーザに適したコンテンツを決定するにあたって、ユーザとコンテンツの関係を示す行列を生成するためにユーザとコンテンツのクラスタを形成するクラスタ形成装置が行うクラスタ形成方法であって、
第1のクラスタリング手段が、ユーザ又はコンテンツである要素に対して、その属性に基づいた多次元空間におけるクラスタ間の距離に応じて、そのクラスタを並べる階層型クラスタリング手法によるクラスタリング処理を行い、該クラスタは隣合うクラスタ間において親子関係を有する階層的構成であり、上位のクラスタは下位のクラスタ内の要素を含むように第1のクラスタ群を形成し、
第2のクラスタリング手段が、前記第1のクラスタリング手段によって形成された前記第1のクラスタ群内の要素のインプレッション数に基づいて、予め定められた条件に合致するクラスタに対して、該クラスタとしての形態を取り除くことによって第2のクラスタ群を形成し、
前記第2のクラスタリング手段は、予め定められた条件として、第1のクラスタ群のクラスタ内の要素のインプレッション数が閾値を超えている場合は、該クラスタを第2のクラスタ群のクラスタとして採用し、第1のクラスタ群のクラスタ内の要素のインプレッション数が該閾値を超えていない場合は、該クラスタを削除し、該削除対象のクラスタの要素を親クラスタ内に残すことによって第2のクラスタ群を形成する
ことを特徴とするクラスタ形成方法。 - ユーザに適したコンテンツを決定するにあたって、ユーザとコンテンツの関係を示す行列を生成するためにユーザとコンテンツのクラスタを形成するクラスタ形成プログラムであって、
コンピュータを、
ユーザ又はコンテンツである要素に対して、その属性に基づいた多次元空間におけるクラスタ間の距離に応じて、そのクラスタを並べる階層型クラスタリング手法によるクラスタリング処理を行い、該クラスタは隣合うクラスタ間において親子関係を有する階層的構成であり、上位のクラスタは下位のクラスタ内の要素を含むように第1のクラスタ群を形成する第1のクラスタリング手段と、
前記第1のクラスタリング手段によって形成された前記第1のクラスタ群内の要素のインプレッション数に基づいて、予め定められた条件に合致するクラスタに対して、該クラスタとしての形態を取り除くことによって第2のクラスタ群を形成する第2のクラスタリング手段
として機能させ、
前記第2のクラスタリング手段は、予め定められた条件として、第1のクラスタ群のクラスタ内の要素のインプレッション数が閾値を超えている場合は、該クラスタを第2のクラスタ群のクラスタとして採用し、第1のクラスタ群のクラスタ内の要素のインプレッション数が該閾値を超えていない場合は、該クラスタを削除し、該削除対象のクラスタの要素を親クラスタ内に残すことによって第2のクラスタ群を形成する
ことを特徴とするクラスタ形成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013054654A JP5787924B2 (ja) | 2013-03-18 | 2013-03-18 | クラスタ形成装置、クラスタ形成方法及びクラスタ形成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013054654A JP5787924B2 (ja) | 2013-03-18 | 2013-03-18 | クラスタ形成装置、クラスタ形成方法及びクラスタ形成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014182421A JP2014182421A (ja) | 2014-09-29 |
JP5787924B2 true JP5787924B2 (ja) | 2015-09-30 |
Family
ID=51701118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013054654A Active JP5787924B2 (ja) | 2013-03-18 | 2013-03-18 | クラスタ形成装置、クラスタ形成方法及びクラスタ形成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5787924B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6726955B2 (ja) * | 2015-12-04 | 2020-07-22 | ヤフー株式会社 | 決定装置、決定方法、及び決定プログラム |
JP6957275B2 (ja) * | 2017-09-05 | 2021-11-02 | 株式会社電通 | ユーザ施策システム |
JP2020119220A (ja) * | 2019-01-23 | 2020-08-06 | Line株式会社 | 情報処理方法、プログラム、端末、サーバ、情報処理装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003303209A (ja) * | 2002-04-11 | 2003-10-24 | Interlogics Inc | 情報提供システム、サーバ、プログラム、記録媒体 |
JP5281104B2 (ja) * | 2011-02-28 | 2013-09-04 | 楽天株式会社 | 広告管理装置、広告選択装置、広告管理方法、広告管理プログラム及び広告管理プログラムを記録した記録媒体 |
-
2013
- 2013-03-18 JP JP2013054654A patent/JP5787924B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014182421A (ja) | 2014-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114238573B (zh) | 基于文本对抗样例的信息推送方法及装置 | |
CN104662529B (zh) | 用于高性能分析的数据精炼引擎的系统和方法 | |
US9990422B2 (en) | Contextual analysis engine | |
CN105765573B (zh) | 网站通信量优化方面的改进 | |
JP5438087B2 (ja) | 広告配信装置 | |
US9798820B1 (en) | Classification of keywords | |
JP6435426B1 (ja) | 情報分析装置、情報分析方法および情報分析プログラム | |
CN109684538A (zh) | 一种基于用户个人特征的推荐方法及推荐系统 | |
US20110119267A1 (en) | Method and system for processing web activity data | |
TW201417019A (zh) | 搜尋結果的排序方法和裝置 | |
TW201118620A (en) | Systems and methods for providing advanced search result page content | |
US20150026105A1 (en) | Systems and method for determining influence of entities with respect to contexts | |
US20110246462A1 (en) | Method and System for Prompting Changes of Electronic Document Content | |
CN102254004A (zh) | 一种网络日志挖掘中的Web建模方法及系统 | |
JP2011022705A (ja) | 証跡管理方法、システム、及びプログラム | |
CN110674178B (zh) | 构建用户画像标签的方法及其系统 | |
JP2018169986A (ja) | 企業情報提供システムおよびプログラム | |
KR20100023630A (ko) | 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체 | |
Han et al. | Fitnet: Identifying fashion influencers on twitter | |
US9020962B2 (en) | Interest expansion using a taxonomy | |
JP5787924B2 (ja) | クラスタ形成装置、クラスタ形成方法及びクラスタ形成プログラム | |
US20160086499A1 (en) | Knowledge brokering and knowledge campaigns | |
JP5284064B2 (ja) | 商品idサーバ装置、および商品idサーバ装置の制御方法 | |
JP7065718B2 (ja) | 判断支援装置および判断支援方法 | |
JP7474120B2 (ja) | ビジネスマッチング支援装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140916 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150331 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150714 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150728 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5787924 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |