JP5507607B2 - コンテンツ提供装置、低ランク近似行列生成装置、コンテンツ提供方法、低ランク近似行列生成方法およびプログラム - Google Patents

コンテンツ提供装置、低ランク近似行列生成装置、コンテンツ提供方法、低ランク近似行列生成方法およびプログラム Download PDF

Info

Publication number
JP5507607B2
JP5507607B2 JP2012087707A JP2012087707A JP5507607B2 JP 5507607 B2 JP5507607 B2 JP 5507607B2 JP 2012087707 A JP2012087707 A JP 2012087707A JP 2012087707 A JP2012087707 A JP 2012087707A JP 5507607 B2 JP5507607 B2 JP 5507607B2
Authority
JP
Japan
Prior art keywords
content
user
reliability
advertisement
observation matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012087707A
Other languages
English (en)
Other versions
JP2013218485A (ja
Inventor
玲 田島
大偉 赤星
幸浩 田頭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2012087707A priority Critical patent/JP5507607B2/ja
Publication of JP2013218485A publication Critical patent/JP2013218485A/ja
Application granted granted Critical
Publication of JP5507607B2 publication Critical patent/JP5507607B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、コンテンツ提供装置、低ランク近似行列生成装置、コンテンツ提供方法、低ランク近似行列生成方法およびプログラムに関する。
オンラインショッピングにおける商品のレコメンド処理において協調フィルタリングを行う場合などにはユーザや商品の間の関係性を行列で管理することが行われている。さらにこの関係性の行列を複数の低ランクの行列に分解する近似処理が行われている。例えば特許文献1では無限次元の行列因子分解を行うことにより大規模な関係性を処理することができるシステムが開示されている。
特開2006−48286号公報
オンラインでの広告の配信に係るクリック率を広告の関係性として管理しようとする場合、広告のクリック率は低い(1%未満であることも多い)ことが知られている。したがって、1回のクリックがクリック率に与える影響が非常に大きく、特に広告の配信数が少ない場合には、クリック率自体の信頼度が低いことが生じうる。しかしながら、従来の低ランク近似では観測値自体は絶対的に正しいものとして近似処理を行っていたため、配信数が少ない広告のクリック率を観測して低ランク近似を行っても正確な関係性を予測することができないことがあった。
本発明は、このような背景を鑑みてなされたものであり、正確な関係性の予測を行うことのできるようにすることを目的とする。
上記課題を解決するための本発明の主たる発明は、ユーザにコンテンツを提供する装置であって、前記ユーザと前記コンテンツとの関係性を評価した実績値を要素とする観測行列を生成する観測行列生成部と、前記実績値のそれぞれについて前記実績値の信頼度を算出する信頼度算出部と、前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させる低ランク近似処理部と、前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツ及び前記ユーザに対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出する評価値算出部と、前記評価値に応じて、前記ユーザに提供する前記コンテンツである提供コンテンツを前記候補コンテンツの中から決定する提供コンテンツ決定部と、を備えることとする。
また、本発明のコンテンツ提供装置では、前記コンテンツはオンラインで提供される広告であり、前記観測行列生成部は、前記ユーザによる前記広告のクリック率を前記実績値として算出し、前記信頼度算出部は、前記広告のクリック数および前記広告の閲覧数の少なくともいずれかに応じて前記信頼度を算出するようにしてもよい。
また、本発明のコンテンツ提供装置では、前記信頼度算出部は、前記広告を前記ユーザが閲覧した閲覧数と、前記広告を前記ユーザがクリックしたクリック数とを取得し、ベータ分布Be(p,q)を事前分布として、前記クリック率のベイズ推定による事後分布Be(p+クリック数,q+閲覧数+クリック数)の分散を算出し、前記分散が小さいほど前記信頼度が高くなるように前記信頼度を決定するようにしてもよい。
また、本発明のコンテンツ提供装置では、前記信頼度算出部は、前記実績値に応じて所定の確率分布における分散を算出し、算出した分散を底とするべき乗値の逆数を前記信頼度として算出するようにしてもよい。
また、本発明のコンテンツ提供装置では、前記確率分布はベータ分布であり、前記信頼度算出部は、所定の事前分布からベイズ推定を行った事後分布の分散を算出するようにしてもよい。
また、本発明の他の態様は、ユーザにコンテンツを提供する装置であって、前記ユーザを1つの以上の第1の分類に分類分けするユーザ分類部と、前記コンテンツを1つ以上の第2の分類に分類分けするユーザ分類部と、前記第1および第2の分類の間の関係性を評価した実績値を要素とする観測行列を生成する観測行列生成部と、前記実績値のそれぞれについて前記実績値の信頼度を算出する信頼度算出部と、前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させる低ランク近似処理部と、前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツが属する前記第1の分類および前記ユーザが属する前記第2の分類に対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出する評価値算出部と、前記ユーザに提供する前記コンテンツである提供コンテンツを前記評価値に応じて前記候補コンテンツの中から決定する提供コンテンツ決定部と、を備えることとする。
また、本発明のコンテンツ提供装置では、前記信頼度算出部は、前記実績値に応じて所定の確率分布における分散を算出し、算出した分散を底とするべき乗値の逆数を前記信頼度として算出するようにしてもよい。
また、本発明の他の態様は、コンテンツを当該コンテンツに関係するユーザに提供するための、前記コンテンツと前記ユーザとの関係性を評価した評価値を要素とする関係行列に、低ランク近似により近似させた複数の行列を生成する装置であって、前記関係性を評価した実績値を要素とする観測行列を生成する観測行列生成部と、前記実績値のそれぞれについて前記実績値の信頼度を算出する信頼度算出部と、前記実績値に対して前記信頼度に応じた重み付けをしたうえで、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させる低ランク近似処理部と、を備えることとする。
また、本発明の低ランク近似行列生成装置では、前記信頼度算出部は、前記実績値に応じて所定の確率分布における分散を算出し、算出した分散を底とするべき乗値の逆数を前記信頼度として算出するようにしてもよい。
また、本発明の他の態様は、ユーザにコンテンツを提供する方法であって、コンピュータが、前記ユーザと前記コンテンツとの関係性を評価した実績値を要素とする観測行列を生成するステップと、前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツ及び前記ユーザに対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出するステップと、前記評価値に応じて、前記ユーザに提供する前記コンテンツである提供コンテンツを前記候補コンテンツの中から決定するステップと、を実行することとする。
また、本発明の他の態様は、コンテンツを当該コンテンツに関係するユーザに提供するための、前記コンテンツと前記ユーザとの関係性を評価した評価値を要素とする関係行列に、低ランク近似により近似させた複数の行列を生成する方法であって、コンピュータが、前記関係性を評価した実績値を要素とする観測行列を生成するステップと、前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、前記実績値に対して前記信頼度に応じた重み付けをしたうえで、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、を実行することとする。
また、本発明の他の態様は、ユーザにコンテンツを提供するためのプログラムであって、コンピュータに、前記ユーザと前記コンテンツとの関係性を評価した実績値を要素とする観測行列を生成するステップと、前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、
前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツ及び前記ユーザに対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出するステップと、前記評価値に応じて、前記ユーザに提供する前記コンテンツである提供コンテンツを前記候補コンテンツの中から決定するステップと、を実行させることとする。
また、本発明の他の態様は、コンテンツを当該コンテンツに関係性するユーザに提供するための、前記コンテンツと前記ユーザとの関係性を評価した評価値を要素とする関係行列に、低ランク近似により近似させた複数の行列を生成するためのプログラムであって、コンピュータに、前記関係性を評価した実績値を要素とする観測行列を生成するステップと、前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、前記実績値に対して前記信頼度に応じた重み付けをしたうえで、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、を実行させることとする。
その他本願が開示する課題やその解決方法については、発明の実施形態の欄及び図面により明らかにされる。
本発明によれば、正確な関係性の予測を行うことができる。
ユーザベクトル、性向行列、広告ベクトルから期待クリック性向を算出することを説明する図である。 本実施形態の広告配信システムの全体構成を示す図である。 Webサーバ20のハードウェア構成例を示す図である。 Webサーバ20のソフトウェア構成例を示す図である。 広告データベース252に記憶される広告情報の構成例を示す図である。 ユーザデータベース253に記憶されるユーザ情報の構成例を示す図である。 近似行列記憶部254の構成例を示す図である。 インプレッションログ記憶部255に記憶されるインプレッションログの構成例を示す図である。 クリックログ記憶部256に記憶されるクリックログの構成例を示す図である。 解析処理部215による解析処理の流れを示す図である。 観測行列の作成処理の一例を示す図である。 Webサーバ20により行われる処理の流れを示す図である。 広告の選択処理の流れを示す図である。
==(1)発明の概要==
以下、本発明の一実施形態に係る広告配信システムについて説明する。本実施形態において広告とは、Webページにおいてコンテンツの内容等に応じて表示される広告(リスティング広告と呼ばれる。)を想定する。
本実施形態では、ユーザおよび広告に対してそれぞれクラスタリング処理を行い、ユーザに関するクラスタ(以下、ユーザクラスタという。)と広告に関するクラスタ(以下、広告クラスタという。)とを求め、ユーザクラスタと広告クラスタとの間でのクリック性向を示す行列(以下、性向行列という。)を作成する。ユーザは複数のユーザクラスタに属することができ、広告も複数の広告クラスタに属することができるものとする。また、ユーザは各ユーザクラスタに属する度合い(帰属度)が算出され、広告も各広告クラスタに対する帰属度が算出されるものとする。以下の説明において、ユーザの各ユーザクラスタに対する帰属度を要素とするベクトルをユーザベクトルといい、広告の各広告クラスタに対する帰属度を要素とするベクトルを広告ベクトルという。なお、クラスタリング処理には複数のクラスタへの帰属度を算出することのできる一般的な手法を用いるものとして本明細書では説明を省略する。
ユーザクラスタの数をN、広告クラスタの数をMとすると、性向行列はN×Mの行列になる。性向行列は、ユーザクラスタと広告クラスタの各ペアについて、当該ユーザクラスタに帰属するユーザに対して当該広告クラスタに帰属する広告が表示された回数(インプレッション数と呼ばれる。)と、当該ユーザクラスタに属するユーザが当該広告クラスタに属する広告をクリックしたクリック数とをログから取得して、クリック率をインプレッション数で割った実クリック率(以下、実CTRと表記する。)を求めるものとする。なお、あるユーザがあるユーザクラスタに帰属するとは、当該ユーザの当該ユーザクラスタに対する帰属度が所定値(例えば0)より大きいことを意味し、同様にある広告がある広告クラスタに帰属するとは、当該広告の当該広告クラスタに対する帰属度が所定値(例えば0)より大きいことを意味するものとする。
図1に示すように、あるユーザについてのユーザベクトル1(の転置ベクトル)と、性向ベクトル2と、ある広告についての広告ベクトル3とを乗算することにより、当該ユーザによる当該広告のクリック性向(期待クリック性向)が算出される。本実施形態では、この期待CTRを広告の評価値として、表示する広告を決定する。
本実施形態では、性向行列を複数の行列の積として分解する。行列の分解は例えば特異値分解(Singular Value Decomposition;SVD)や行列因子分解(Matrix Factorization)などが知られている。ユーザクラスタおよび広告クラスタは数百〜数千作られることが考えられるため、性向行列を複数の(性向行列よりも低ランクの)行列の積として表現することにより、性向行列を管理する情報量を圧縮することができる。また、ノイズが除去されるいわゆるスムージング効果も期待できる。
==(2)行列因子分解(Matrix Factorization)==
本実施形態では、行列因子分解により性向行列を2つの行列に分解するものとする。行列因子分解では、ユーザクラスタと広告クラスタとに対応する広告の実CTRを観察値とした観察行列を作成し、観察値と2つの行列の積における対応する要素との差の合計が最小になるように2つの行列を決定する。例えばクラスタリングにより数百、数千のクラスタが作成されたときなどには、あるユーザクラスタのユーザにある広告クラスタの広告が配信されていないという状態、すなわち欠損値が存在する状態が発生し得るが、行列因子分解による低ランク近似を行うことにより欠損値を補完することもできる。
本実施形態では、観察行列における欠損値(すなわちインプレッション数が0である場合)以外の観測値のそれぞれについて、2つの行列UおよびAの積の対応する要素との差を最小化するように最適化計算を行う。なお、行列Uはユーザの属性を表す行列、行列Aは広告の属性を表す行列となる。ここで2つの低ランク行列UおよびAの積UAの要素である予測クリック率(以下、予測CTRと表記する。)の予測モデルは、予測CTRをr’、予測クリック率の平均をμ、ユーザクラスタの影響(例えば、気軽に広告をクリックしがちなユーザクラスタである場合など)による平均クリック率からの偏差をbuser、広告クラスタの影響(例えば、大ヒット商品の広告クラスタである場合など)による平均クリック率からの偏差をbadとして、次式とする。
Figure 0005507607
一般的な行列因子分解の手法において、行列UおよびAを決定するための最適計算は、観測値(本実施形態の場合は、実クリック率である。以下、実CTRと表記する。)をr、予測CTRをr’として次式のような目的関数の最小化を行うことになる。
Figure 0005507607
ここで、式E2の目的関数において、実CTRと予測CTRとの差を底とし2を指数としたべき乗の項を損失関数といい、buser、bad、U、Aを含む第2項を正則化項という。また、行列因子分解は観測行列から性向行列に近似した行列を学習することができることから上記の目的関数を学習モデルとも称する。なお、正則化項においてどのような説明変数を用いるかについては一般的な行列因子分解の手法によるものとし本明細書では説明を省略する。
上記のように一般的な行列因子分解の手法では、観測値(実CTR)の信頼度は考慮されていない。しかしながら、特に広告のクリック率のように通常非常に小さい値(広告のクリック率は一般に1%未満であることが多いことが知られている。)の場合には、クリックが発生せずに実CTRが0のままの状態が続いたり、インプレッション数が少ない間にたまたまクリックが発生したときには期待されるクリック率よりも非常に大きな値となってしまったりすることが考えられ、特にインプレッション数が少ない場合には実CTRの信頼度は低い。そこで本実施形態では、行列因子分解の最小化計算における目的関数に含まれる損失関数において信頼度を評価する。すなわち、実CTRと予測CTRとの差(上記E2式では差の二乗)に信頼度を乗じた値を最小化するようにする。
本実施形態では、実CTRがベータ分布に従うものとして、ベータ分布の分散の逆数を信頼度として用いるものとする。ここで、事前分布をBe(p,q)とし、クリック数がcua、インプレッション数がiuaであった場合、ベイズ推定による事後分布はBe(p+cua,q+iua−cua)となり、この事後分布の分散vuaは次式で表される。

Figure 0005507607
この分散vuaを底としたべき乗値(指数sは1であってもよい。)の1/vua を信頼度として用いることにより、実CTRのばらつきが少ないほど信頼度が高くなることになる。なお、指数sには任意の値を設定することができる。また、事前分布Be(p,q)のパラメータp,qには任意の値を設定することが可能であり、例えば解析者が過去の実CTRの分布を解析して決定することができる。また、事前分布は一様分布であるものとして、Be(1,1)を事前分布として採用するようにしてもよい。
以上より、本実施形態では次式を学習モデルとして最小化することになる。
Figure 0005507607
このようにベイズ推定の事後分布の分散の逆数(のべき乗)を信頼度とすることにより、インプレッション数が増えて実CTRのばらつきが小さくなるほど予測CTRと実CTRとの差を大きく評価し、インプレッション数が少なく実CTRのばらつきが大きい間の予測CTRと実CTRとの差は小さく評価した上で低ランク近似を行うことができる。
==(3)システム構成==
図2は本実施形態の広告配信システムの全体構成を示す図である。本実施形態の広告配信システムは、ユーザ端末10と通信ネットワーク30を介して通信可能に接続されるWebサーバ20を含んで構成される。
通信ネットワーク30は、例えば公衆電話回線網や専用通信回線網、携帯電話回線網、無線通信網、イーサネット(登録商標)などにより構築される、インターネットやLAN(Local Area Network)である。
Webサーバ20は、画像や動画、テキストなどの各種のコンテンツをHTTP(HyperText Transfer Protocol)に従って提供する、例えばワークステーションやパーソナルコンピュータなどのコンピュータである。ユーザ端末10は、Webサーバ20が提供する各種のWebページを閲覧するブラウザを動作させる、例えばパーソナルコンピュータやタブレットコンピュータ、携帯電話端末、PDA(Personal Digital Assistant)などのコンピュータである。
==(4)Webサーバ20のハードウェア構成==
図3はWebサーバ20のハードウェア構成例を示す図である。Webサーバ20は、CPU201、メモリ202、記憶装置203、通信インタフェース204、入力装置205、出力装置206を備える。記憶装置203は、各種のデータやプログラムを記憶する、例えばハードディスクドライブやソリッドステートドライブ、フラッシュメモリなどである。通信インタフェース204は、通信ネットワーク30に接続するためのインタフェースであり、例えばイーサネット(登録商標)に接続するためのアダプタ、公衆電話回線網に接続するためのモデム、無線通信を行うための無線通信機、シリアル通信のためのUSB(Universal Serial Bus)コネクタやRS232Cコネクタなどである。入力装置205は、データを入力する、例えばキーボードやマウス、タッチパネル、ボタン、マイクロフォンなどである。出力装置206は、データを出力する、例えばディスプレイやプリンタ、スピーカなどである。
==(5)Webサーバ20のソフトウェア構成==
図4はWebサーバ20のソフトウェア構成例を示す図である。Webサーバ20は、HTTP処理部211、Webページ作成部212、広告選択部213、ログ収集部214および解析処理部215の機能部と、Web情報データベース251、広告データベース252、ユーザデータベース253、近似行列記憶部254、インプレッションログ記憶部255およびクリックログ記憶部256の記憶部とを備えている。
なお、上記各機能部は、Webサーバ20が備えるCPU201が記憶装置202に記憶されているプログラムを実行することにより実現され、上記各記憶部は、Webサーバ20が備えるメモリ202及び記憶装置203が提供する記憶領域の一部として実現される。
==(6)記憶部の説明==
(6−1)Web情報データベース251
Web情報データベース251は、Webページを作成するための情報(以下、Web情報という。)を記憶する。Web情報は、例えば、HTMLで記述されたファイルや、CGI(Common Gateway Interface)などの仕組みにより実行されるプログラムを格納したプログラムファイル、画像ファイルなどである。Web情報データベース251は、例えば、Webサーバ20で動作するオペレーティングシステムが提供するファイルシステムのディレクトリやフォルダにより実現することができる。
(6−2)広告データベース252
広告データベース252は、広告を表示するための情報(以下、広告情報という。)を記憶する。図5は、広告データベース252に記憶される広告情報の構成例を示す図である。広告情報には、広告の識別情報である広告IDに対応付けて、広告のカテゴリ、広告に関するURL(Uniform Resource Locator)、広告のタイトル、入札額、実CTRおよび当該広告の各広告クラスタへの帰属度が含まれる。広告情報のURLが示すWebページはランディングページとも呼ばれ、広告がクリックされるとランディングページにリダイレクトされることになる。
入札額は、広告がクリックされた場合に広告主から支払われる最大の単価であり、広告主により決定される。
本実施形態ではタイトルの文字列をWebページの広告として表示するものとする。広告には広告IDを指定した所定のURL(ホスト名にWebサーバ20が指定されるものとする。以下、リダイレクトURLという。)へのリンクが設定される。Webページにおいて広告がクリックされると、広告IDを含むリクエストがWebサーバ20に送信され、後述するログ収集部214によりクリックされたことのログが収集され、HTTP処理部211により広告IDに対応する広告情報のURLにリダイレクトされる(例えば、当該URLをリダイレクト先として指定した応答が送信される。)。これにより、広告に応じたユーザの行動(クリック)を検知することができる。
なお、広告として画像や動画などを表示し、あるいは音声を出力させるようにしてもよく、その場合には、例えば広告情報には、広告として表示する画像や動画のデータを示すURLを追加するようにすることができる。
(6−3)ユーザデータベース253
ユーザデータベース253は、ユーザに関する情報(以下、ユーザ情報という。)を記憶する。図6はユーザデータベース253に記憶されるユーザ情報の構成例を示す図である。ユーザ情報には、ユーザの識別情報であるユーザIDに対応付けて、ユーザの性別やユーザが現在する都道府県、ユーザの趣味などのユーザの属性と、当該ユーザの各ユーザクラスタへの帰属度とが含まれる。なお、性別、都道府県、趣味以外にも各種のユーザについての属性をユーザ情報に含めることができる。
(6−4)近似行列記憶部254
図7は、近似行列記憶部254の構成例を示す図である。近似行列記憶部254は、観測行列の低ランク近似させた複数の行列(本実施形態では行列Uおよび行列A)を記憶する。行列AおよびUは、たとえば表形式で保存するようにしてもよいし、数式として記憶するようにしてもよい。図7に示すように、行列Uの行数はユーザクラスタの数Nであり、行列Aの列数は広告クラスタの数Mである。行列Uの列数および行列Aの行数はともにkであり、低ランク近似により設定される数である。行列Uと行列Aとを乗算することにより性向行列(の近似行列)を復元することができる。なお、kは解析者が任意の値に設定できるものとしてもよい。
(6−5)インプレッションログ記憶部255
インプレッションログ記憶部255は、Webページに広告が表示されたこと(インプレッションと呼ばれる。)を示す情報(以下、インプレッションログという。)を記憶する。図8は、インプレッションログ記憶部255に記憶されるインプレッションログの構成例を示す図である。インプレッションログには、Webページに広告が表示された日時(すなわち、WebページがWebサーバ20から送信された日時である。以下、配信日時という。)、Webページを示すURL、表示された広告を示す広告ID、Webページを閲覧したユーザを示すユーザIDが含まれる。インプレッションログは1つの広告が表示されるにつき1つ登録される。すなわち、たとえば1つのWebページに3つの広告が表示された場合には、3つのインプレッションログが登録されることになる。
(6−6)クリックログ記憶部256
クリックログ記憶部256は、Webページに表示された広告がクリックされたことを示す情報(以下、クリックログという。)を記憶する。図9は、クリックログ記憶部256に記憶されるクリックログの構成例を示す図である。クリックログには、クリックされた広告を示す広告ID、広告をクリックしたユーザを示すユーザID、広告が表示されたWebページを示すURL、および広告がクリックされた日時(クリック日時)が含まれる。
==(7)機能部の説明==
(7−1)HTTP処理部211
HTTP処理部211は、HTTPの処理を行う。HTTP処理部211は、ユーザ端末10から送信されるHTTPのリクエストを受信する。
リクエストにリダイレクトURLが指定されていた場合、HTTP処理部211は、ログ収集部214を呼び出してクリックログを登録させた上で、リクエストに含まれている広告IDに対応する広告情報を広告データベース252から読み出し、読み出した広告情報に含まれているURLをリダイレクト先として指定した応答をユーザ端末10に応答する。
リクエストにリダイレクトURL以外の、Webページを示すURLが指定された場合には、HTTP処理部211は、Webページ作成部212を呼び出してWebページを表示するための情報(以下、画面情報という。画面情報は例えばHTMLファイルである。)を作成させ、Webページ作成部212が作成した画像情報をユーザ端末10に応答し、ログ収集部214を呼び出してインプレッションログを登録させる。
(7−2)Webページ作成部212
Webページ作成部212は、Webページを表示するための画面情報を作成する。Webページ作成部212は、広告選択部213を呼び出してWebページに表示させる広告を選択させ、選択された広告がWebページに表示され、広告がクリックされた場合にはリダイレクトURLにアクセスするように、例えばリンクタグを設定した文字列を画面情報に挿入する。なお、Webページ作成部212が、広告以外の各種のコンテンツを作成する処理については、一般的なWebサーバによる処理を用いるものとして、ここでは説明を省略する。
(7−3)広告選択部213
広告選択部213は、Webページに表示する広告を選択する。
広告選択部213は、配信候補抽出部221、評価値算出部222、広告決定部223を備えている。なお、配信候補抽出部221、評価値算出部222、広告決定部223も、CPU201が記憶装置203に記憶されているプログラムをメモリ202に読み出して実行することにより実現される。
(7−3−1)配信候補抽出部221
配信候補抽出部221は、広告の候補を決定する。配信候補抽出部221は、広告データベース252から所定数(例えば10個や50個、100個など、任意の数を指定することができる。)の広告情報を読み出す。本実施形態では、配信候補抽出部221は、ランダムに所定数の広告情報を読み出すものとするが、例えば、コンテンツの内容やユーザの属性に応じて広告情報を読み出すようにしてもよい。なお、配信候補抽出部221が、数ある広告の中から所定数の広告を選択する処理については、一般的な広告の選択処理を用いることもできる。
(7−3−2)評価値算出部222
評価値算出部222は、広告の評価値を算出する。上述したように、期待クリック性向が評価値として用いられる。期待クリック性向は、ユーザが帰属するユーザクラスタおよび広告が帰属する広告クラスタに対応する行列U、Aの要素に基づいて算出される。本実施形態では、ユーザベクトル(の転置ベクトル)、行列U、行列Aおよび広告ベクトルを乗算して算出されるスカラ値を期待クリック性向とするが、ユーザが帰属するユーザクラスタと広告が帰属する広告クラスタとに対応する行列U,Aの要素(または行列U,Aを乗じて求められる性向行列の要素)に基づいて、合計、平均等任意の演算を行うことにより算出される値を期待クリック性向とすることができる。
(7−3−3)広告決定部223
広告決定部223は、配信候補抽出部221が決定した候補の中から表示する広告を決定する。広告決定部223は、評価値算出部222が算出したxCTRの大きい順に所定数(図1の例では3)の広告を、表示する広告として決定する。
(7−4)ログ収集部214
ログ収集部214は、インプレッションログ及びクリックログを登録する。ログ収集部214は、HTTPにリダイレクトURLが指定されていた場合には、リダイレクトURLに指定されている広告IDに対応するカテゴリを広告データベース252から読み出し、当該広告ID、読み出したカテゴリ、及び現在の日時を設定したクリックログを作成してクリックログ記憶部256に登録する。HTTPにリダイレクトURL以外のURLが指定されていた場合には、ログ収集部214は、広告選択部213が選択した広告のそれぞれについて、現在日時、広告を示す広告ID、及び当該広告のカテゴリを含むインプレッションログを作成してインプレッションログ記憶部255に登録する。
(7−5)解析処理部215
解析処理部215は、低ランク近似により行列Uおよび行列Aを求める。解析処理部215は、クラスタリング処理部231、観測行列生成部232、信頼度算出部233、および低ランク近似処理部234を備える。なお、クラスタリング処理部231、観測行列生成部232、信頼度算出部233、および低ランク近似処理部234も、CPU201が記憶装置203に記憶されているプログラムをメモリ202に読み出して実行することにより実現される。
(7−5−1)クラスタリング処理部231
クラスタリング処理部231はデータクラスタリングを行い、ユーザをユーザクラスタに分類し、広告を広告クラスタに分類する。なお、クラスタリング処理部231が行うデータクラスタリングの処理は一般的なものを採用するものとするが、対象データが複数のクラスタの所属することを許容するソフトクラスタリングの手法を採用するものとする。
(7−5−2)観測行列生成部232
観測行列生成部232は、ユーザが広告をクリックした実CTRを観測値として観測行列を生成する。観測行列生成部232は、ユーザクラスタと広告クラスタとの全ての組合せについて、当該ユーザクラスタに帰属するユーザが、当該広告クラスタに帰属する広告を閲覧したインプレッション数および当該ユーザが当該広告をクリックしたクリック数を取得して、クリック数をインプレッション数で割って実CTRを算出する。
(7−5−3)信頼度算出部233
信頼度算出部233は、観測行列の要素の信頼度を算出する。上述したように本実施形態では観測行列の要素の信頼度はベータ分布の分散のべき乗の逆数1/vua であるものとする。なお、事前分布Be(p,q)のp、qは予め設定されているものとする。また、指数sも予め定められているものとする。
(7−5−4)低ランク近似処理部234
低ランク近似処理部234は、信頼度による重み付けを行った上で観測行列に対する低ランク近似を行う。低ランク近似処理部234は、重み付けした観測行列に行列U,Aを近似させて、近似させた行列U,Aを近似行列記憶部254に登録する。本実施形態では、低ランク近似として行列因子分解を用いるものとするが、特異値分解その他の各種の低ランク近似の手法を採用することができる。欠損値を許容しない低ランク近似の手法を採用する場合に欠損値が発生したときは、例えば0%を観測値として補完するなど、一般的な手法により欠損値を補完した上で低ランク近似を行うようにすることができる。
==(8)解析処理==
図10は解析処理部215による解析処理の流れを示す図である。
クラスタリング処理部231は、例えばユーザ情報に含まれている属性、インプレッションログおよびクリックログなどに基づく行動履歴などを用いてユーザのクラスタリングを行い、ユーザクラスタを決定し、各ユーザの各ユーザクラスタへの帰属度を算出する(S311)。クラスタリング処理部231は、算出した帰属度を対応するユーザ情報に設定するようにユーザデータベース253を更新する(S312)。
クラスタリング処理部231は、広告についても広告情報に含まれている項目の内容や、広告情報のURLが示すランディングページの内容を用いて広告のクラスタリングを行い、広告クラスタを決定し、各広告の各広告クラスタへの帰属度を算出する(S313)。クラスタリング処理部231は、算出した帰属度を広告情報に設定するように広告データベース252を更新する(S314)。
これにより各ユーザの各ユーザクラスタに対する帰属度がユーザ情報に設定され、各広告の各広告クラスタに対する帰属度が広告情報に設定される。
観測行列生成部232は、ユーザクラスタおよび広告クラスタについての実CTRを要素とする観測行列を作成する(S315)。図11は観測行列の作成処理の一例を示す図である。観測行列生成部232は、ユーザクラスタおよび各広告クラスタについて、以下の処理を行う。すなわち、観測行列生成部232は、当該ユーザクラスタへの帰属度が0(または所定の閾値)より大きいユーザ情報のユーザIDをユーザデータベース253から読み出してULとする(S331)。
観測行列生成部232は、当該広告クラスタへの帰属度が0(または所定の閾値)より大きい広告情報の広告IDを広告データベース252から読み出してALとする(S332)。観測行列生成部232は、インプレッションログ記憶部255に登録されているインプレッションログのうち、ユーザIDがULに含まれており、かつ、広告IDがALに含まれているものをカウントしてインプレッション数iuaとして算出する(S333)。観測行列生成部232は、クリックログ記憶部256に登録されているクリックログのうち、ユーザIDがULに含まれており、かつ、広告IDがALに含まれているものをカウントしてクリック数cuaとして算出する(S334)。
観測行列生成部232は、インプレッション数iuaが0でなければ(S335:YES)、クリック数cuaをインプレッション数iuaで割って実CTRを算出し(S336)、インプレッション数iuaが0であれば(S335:NO)、欠損値を表す値(例えば−1あるいはnull値とすることができる。)を実CTRとする(S337)。
観測行列生成部232は、以上の処理を各ユーザクラスタおよび広告クラスタについて繰り返した後、実CTRを要素とした観測行列を作成する(S338)。
次に信頼度算出部233が、欠損値以外の要素について、要素に対応するインプレッション数iuaおよびクリック数cuaと事前分布のパラメータp、qとを式E3に代入して分散vuaを算出し、算出した分散のvuaを底としsを指数とするべき乗値で1を割った値を信頼度1/vua として算出する(S317)。
低ランク近似処理部234は、観測行列の欠損値以外の各要素について上述した式E4の目的関数を適用した値の合計が最小となるように、行列UおよびAを決定し(S318)、決定した行列UおよびAを近似行列記憶部254に登録する(S320)。
以上のようにして、観測行列の要素に信頼度を乗じたうえで低ランク近似が行われ、近似された行列U,Aが近似行列記憶部254に登録される。
==(9)リクエスト処理==
図12は、Webサーバ20により行われる処理の流れを示す図である。
HTTP処理部211は、ユーザ端末10からHTTPのリクエストを受信する(S401)。なおリクエストには、URL、ユーザIDおよび現在日時が設定されているものとする。HTTP処理部211は、リクエストにリダイレクトURLが指定されているか否かにより、広告がクリックされたか否かを判定する(S402)。
広告がクリックされたと判定した場合(S402:YES)、ログ収集部214は、リダイレクトURLに設定されている広告IDに対応する広告情報を広告データベース252から読み出し、リクエストに設定されているユーザIDおよび現在日時ならびに広告IDを含むクリックログを作成してクリックログ記憶部256に登録する(S403)。HTTP処理部211は、広告情報のURLにリダイレクトするようにHTTPのレスポンスをユーザ端末10に送信する(S404)。
一方、広告がクリックされていないと判断した場合には(S402:NO)、図13の処理により、広告選択部213が選択した広告の広告情報を含む広告リストを作成する(S405)。なお、図13に示す広告情報の選択処理については後述する。
Webページ作成部212は、リクエストに応じて各種のコンテンツを表示するためのHTMLファイルなどの画面情報を作成する(S406)。なお、ステップS406における画面情報の作成処理は、一般的なWebサーバによる処理を採用することができる。
Webページ作成部212は、広告リストに含まれる各広告情報について、所定のURLの引数に広告情報に含まれる広告IDを設定したリダイレクトURLを作成する(S407)。リダイレクトURLは、例えば「www.foobar.com/ad?id=xxxx」という形式とすることができる。Webページ作成部212は、広告リストに含まれる各広告情報について、広告情報に含まれるタイトルを内容として含むリダイレクトURLへのリンクタグ(例えば、「<a href="http://www.foobar.com/ad?id=xxxx">タイトル</a>」という形式とすることができる。)を画面情報に挿入する(S408)。
HTTP処理部211は、作成された画面情報をリクエストへの応答としてユーザ端末10に送信する(S409)。ログ収集部214は、広告リストに含まれる各広告情報について、広告情報に含まれる広告IDと、リクエストに含まれていたURL、ユーザIDおよび現在日時とを含むインプレッションログを作成してインプレッションログ記憶部255に登録する(S410)。
==(10)広告の選択処理==
図13は、ステップS408における広告の選択処理の流れを示す図である。
配信候補抽出部221は、広告データベース252から所定数m個の広告情報を抽出する(S421)。なお、広告データベース252からどのような広告情報を抽出するかは任意に設定可能である。例えば、ランダムにm個の広告情報を抽出するようにしてもよいし、広告情報のタイトルがコンテンツにマッチする度合いの高い順にm個の広告情報を抽出するようにしてもよいし、ユーザが興味を有しているカテゴリをユーザ情報の属性として記憶しておき、そのカテゴリにマッチする広告情報をm個抽出するようにしてもよい。
評価値算出部222は、リクエストに設定されているユーザIDに対応するユーザ情報をユーザデータベース253から読み出し、読み出したユーザ情報に含まれている各ユーザクラスタへの帰属度を要素とするユーザベクトルuを作成する(S422)。評価値算出部222は、近似行列記憶部254から行列UおよびAを読み出す(S423)。
評価値算出部222は、抽出した広告情報のそれぞれについて以下の処理を行う。すなわち、評価値算出部222は、広告情報に含まれている各広告クラスタへの帰属度を要素とする広告ベクトルaを生成し(S424)、ユーザベクトルuの転置ベクトル、行列U、広告ベクトルaおよび行列Aを乗じた値を、当該広告IDが当該ユーザによりクリックされる傾向の評価値(期待クリック性向)を算出する(S425)。
評価値算出部222が以上の処理を各広告情報について行った後、広告決定部223は、期待クリック性向の大きい順にn個の広告情報を選択して広告リストとする(S425)。なお、広告決定部223は、期待クリック性向に広告情報の入札額を乗じた値の大きい順にn個の広告情報を選択するようにしてもよい。
==(11)効果==
以上説明したように、本実施形態の広告配信システムでは、ユーザと広告との関係性の観測値(本実施形態では実CTR)に、その信頼度による重み付けをする補正をしたうえで、低ランク近似を行っている。したがって、例えば信頼度の小さな観測値については観測値と予測値との差が小さく評価され、信頼度の高い観測値については観測値と予測値との差が大きく評価され、この評価値を最小化するように近似が行われるので、結果として信頼度の高い関係性を予測可能な近似の行列を作成することができる。
また、低ランク近似を行うことにより行列のランクを低くすることができるので、関係性(クリック率)に関するノイズを除去することができる。
また、本実施形態では、関係性としてクリック率を想定しているところ、オンライン広告におけるクリック率は非常に小さい値(1%未満であることも多い。)となることが知られている。したがって、特にインプレッション数が少ない間では、1度のクリックによる関係性への影響は非常に大きく、商品の購入回数が少ない間における1度の購入や、ランキングの評価回数が少ない間における1度のランキング付けなどを行った場合に比べて、関係性の予測値としては信頼度が著しく低くなる。よって、本実施形態のように信頼度を用いて観測値を補正することにより、クリックによる過度な影響を抑えることが可能となり、近似によるノイズ除去をより効果的に行うことができる。
また、本実施形態では観測値(実CTR)の分散を底とするべき乗値の逆数を信頼度として使用している。したがって、観測値のばらつきが小さいほど信頼度が高くなるようにすることができる。低ランク近似は観測値と近似行列の積との差を最小化することになるため、観測値自体にばらつきが大きい場合には、最小化による近似の信頼度も低くなると考えられる。よって、本実施形態のように、ばらつきが小さい程信頼度を高くすることにより、最小化による近似の結果の信頼度も高くなることが期待される。
また、本実施形態の広告配信システムでは、クリック率はベータ分布に従うものとし、ベイズ推定による推定後の事後分布の分散が小さいほど信頼度が高くなるようにしている。一般に広告のインプレッション数が増えるに従って実クリック率の信頼度も上がると考えられるところ、ベイズ推定でも学習が進むにつれて分散が小さくなっていく。したがって、本実施形態のように事後分布の分散の小ささを信頼度とする妥当性が担保され、妥当な信頼度を用いて観測値を補正することができる。
また、本実施形態の広告配信システムでは、ユーザおよび広告をクラスタに分類した上で関係性(クリック率)を観測し行列で管理しているので、大量のユーザや広告が存在する場合であっても、関係性の管理を容易に行うことが可能となり、観測値や関係性の管理にかかるリソースを低減することができる。また、広告クラスタごとにクリック率を観測することができるので欠損値を減らすことができる。よって、近似させた行列を用いた関係性の予測の精度を向上することができる。
また、本実施形態の広告配信システムでは、配信する広告を決定する際に、期待クリック性向の大きい順に広告を選択しているので、ユーザのニーズに合わせた広告を配信することを可能とするとともに、広告のクリックによる広告収益を向上させることができる。
==(11)変形例==
なお、本実施形態では、クリック率はベータ分布に従うものとしてベイズ推定の事後分布の分散に応じて信頼度を決定するものとしたが、クリック率は正規分布に従うものとして正規分布の分散に応じて信頼度を決定するようにしてもよい。この場合、分散vuaはクリック率をrとして、次式により算出することができる。
Figure 0005507607
この分散を底として指数をsとするべき乗値の逆数を信頼度としてもよい。
また、クリック数およびインプレッション数の少なくともいずれかに応じて信頼度を決定してもよい。例えばインプレッション数やクリック数そのものを信頼度としてもよい。また、クリック数を底としたべき乗値とインプレッション数を底としたべき乗値との積を信頼度としてもよい。また、クリック数またはインプレッション数の対数を信頼度としてもよいし、クリック数の対数とインプレッション数の対数との合計値を信頼度としてもよい。
また、本実施形態ではインプレッション数を問わずに分散に応じて信頼度を決定するものとしたが、インプレッション数が所定の閾値を超えた場合には信頼度を1として補正を行わないようにしてもよい。
また、本実施形態では、ユーザベクトル、行列U、行列Aおよび広告ベクトルを乗算して期待クリック性向を算出するものとしたが、行列UおよびAを乗じて性向行列を作成し、作成した性向行列を近似行列記憶部254に記憶するようにして、ユーザベクトルと性向行列と広告ベクトルを乗算して期待クリック性向を算出するようにしてもよい。
また、予測モデルE1を用いて予測CTRを算出し、予測CTRを広告の評価値として算出するようにしてもよい。
また、本実施形態ではソフトクラスタリングによりユーザおよび広告はそれぞれ複数のクラスタの帰属することが可能であるものとしたが、ハードクラスタリングにより1つのクラスタにのみ帰属可能としてもよい。この場合、評価値算出部222は、ユーザが帰属するユーザクラスタに対応する要素を行列Uから読み出し、広告が帰属する広告クラスタに対応する要素を行列Aから読み出し、読み出した要素に基づいて評価値を決定することができる。この場合、読み出した要素は、平均をとってもよいし、合計してもよい。また、行列Uおよび行列Aを乗じて性向行列を作成し、作成した性向行列からユーザが帰属するユーザクラスタと広告が所属する広告クラスタとに対応する要素を読み出し、読み出した要素に応じて評価値を決定するようにしてもよい。
==(12)他の適用例==
本実施形態では広告の配信を想定しているが、広告の配信に限らず、各種のコンテンツの提供を行うシステムに適用してもよい。また、コンテンツとユーザとの関係性もクリック率に限らず、ユーザがコンテンツを嗜好する度合いなど各種の関係性とすることができる。また、本実施形態の低ランク近似の処理は商品のレコメンド処理における協調フィルタリングなどに適用することもできる。
以上、本実施形態について説明したが、上記実施形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物も含まれる。
211 HTTP処理部
212 Webページ作成部
213 広告選択部
214 ログ収集部
215 解析処理部
221 配信候補抽出部
222 評価値算出部
223 広告決定部
231 クラスタリング処理部
232 観測行列生成部
233 信頼度算出部
234 低ランク近似処理部
251 Web情報データベース
252 広告データベース
253 ユーザデータベース
254 近似行列記憶部
255 インプレッションログ記憶部
256 クリックログ記憶部

Claims (13)

  1. ユーザにコンテンツを提供する装置であって、
    前記ユーザと前記コンテンツとの関係性を評価した実績値を要素とする観測行列を生成する観測行列生成部と、
    前記実績値のそれぞれについて前記実績値の信頼度を算出する信頼度算出部と、
    前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させる低ランク近似処理部と、
    前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツ及び前記ユーザに対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出する評価値算出部と、
    前記評価値に応じて、前記ユーザに提供する前記コンテンツである提供コンテンツを前記候補コンテンツの中から決定する提供コンテンツ決定部と、
    を備えることを特徴とするコンテンツ提供装置。
  2. 請求項1に記載のコンテンツ提供装置であって、
    前記コンテンツはオンラインで提供される広告であり、
    前記観測行列生成部は、前記ユーザによる前記広告のクリック率を前記実績値として算出し、
    前記信頼度算出部は、前記広告のクリック数および前記広告の閲覧数の少なくともいずれかに応じて前記信頼度を算出すること、
    を特徴とするコンテンツ提供装置。
  3. 請求項2に記載のコンテンツ提供装置であって、
    前記信頼度算出部は、前記広告を前記ユーザが閲覧した閲覧数と、前記広告を前記ユーザがクリックしたクリック数とを取得し、ベータ分布Be(p,q)を事前分布として、前記クリック率のベイズ推定による事後分布Be(p+クリック数,q+閲覧数+クリック数)の分散を算出し、前記分散が小さいほど前記信頼度が高くなるように前記信頼度を決定すること、
    を特徴とするコンテンツ提供装置。
  4. 請求項1に記載のコンテンツ提供装置であって、
    前記信頼度算出部は、前記実績値に応じて所定の確率分布における分散を算出し、算出した分散を底とするべき乗値の逆数を前記信頼度として算出すること、
    を特徴とするコンテンツ提供装置。
  5. 請求項4に記載のコンテンツ提供装置であって、
    前記確率分布はベータ分布であり、
    前記信頼度算出部は、所定の事前分布からベイズ推定を行った事後分布の分散を算出すること、
    を特徴とするコンテンツ提供装置。
  6. ユーザにコンテンツを提供する装置であって、
    前記ユーザを1つの以上の第1の分類に分類分けするユーザ分類部と、
    前記コンテンツを1つ以上の第2の分類に分類分けするユーザ分類部と、
    前記第1および第2の分類の間の関係性を評価した実績値を要素とする観測行列を生成する観測行列生成部と、
    前記実績値のそれぞれについて前記実績値の信頼度を算出する信頼度算出部と、
    前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させる低ランク近似処理部と、
    前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツが属する前記第1の分類および前記ユーザが属する前記第2の分類に対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出する評価値算出部と、
    前記ユーザに提供する前記コンテンツである提供コンテンツを前記評価値に応じて前記候補コンテンツの中から決定する提供コンテンツ決定部と、
    を備えることを特徴とするコンテンツ提供装置。
  7. 請求項6に記載のコンテンツ提供装置であって、
    前記信頼度算出部は、前記実績値に応じて所定の確率分布における分散を算出し、算出した分散を底とするべき乗値の逆数を前記信頼度として算出すること、
    を特徴とするコンテンツ提供装置。
  8. コンテンツを当該コンテンツに関係するユーザに提供するための、前記コンテンツと前記ユーザとの関係性を評価した評価値を要素とする関係行列に、低ランク近似により近似させた複数の行列を生成する装置であって、
    前記関係性を評価した実績値を要素とする観測行列を生成する観測行列生成部と、
    前記実績値のそれぞれについて前記実績値の信頼度を算出する信頼度算出部と、
    前記実績値に対して前記信頼度に応じた重み付けをしたうえで、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させる低ランク近似処理部と、
    を備えることを特徴とする低ランク近似行列生成装置。
  9. 請求項8に記載の低ランク近似行列生成装置であって、
    前記信頼度算出部は、前記実績値に応じて所定の確率分布における分散を算出し、算出した分散を底とするべき乗値の逆数を前記信頼度として算出すること、
    を特徴とする低ランク近似行列生成装置。
  10. ユーザにコンテンツを提供する方法であって、
    コンピュータが、
    前記ユーザと前記コンテンツとの関係性を評価した実績値を要素とする観測行列を生成するステップと、
    前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、
    前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、
    前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツ及び前記ユーザに対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出するステップと、
    前記評価値に応じて、前記ユーザに提供する前記コンテンツである提供コンテンツを前記候補コンテンツの中から決定するステップと、
    を実行することを特徴とするコンテンツ提供方法。
  11. コンテンツを当該コンテンツに関係するユーザに提供するための、前記コンテンツと前記ユーザとの関係性を評価した評価値を要素とする関係行列に、低ランク近似により近似させた複数の行列を生成する方法であって、
    コンピュータが、
    前記関係性を評価した実績値を要素とする観測行列を生成するステップと、
    前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、
    前記実績値に対して前記信頼度に応じた重み付けをしたうえで、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、
    を実行することを特徴とする低ランク近似行列生成方法。
  12. ユーザにコンテンツを提供するためのプログラムであって、
    コンピュータに、
    前記ユーザと前記コンテンツとの関係性を評価した実績値を要素とする観測行列を生成するステップと、
    前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、
    前記実績値に対して前記信頼度に応じた重み付けをして、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、
    前記ユーザに提供可能な前記コンテンツである候補コンテンツのそれぞれについて、当該候補コンテンツ及び前記ユーザに対応する前記複数の行列の要素に基づいて前記候補コンテンツの評価値を算出するステップと、
    前記評価値に応じて、前記ユーザに提供する前記コンテンツである提供コンテンツを前記候補コンテンツの中から決定するステップと、
    を実行させるためのプログラム。
  13. コンテンツを当該コンテンツに関係性するユーザに提供するための、前記コンテンツと前記ユーザとの関係性を評価した評価値を要素とする関係行列に、低ランク近似により近似させた複数の行列を生成するためのプログラムであって、
    コンピュータに、
    前記関係性を評価した実績値を要素とする観測行列を生成するステップと、
    前記実績値のそれぞれについて前記実績値の信頼度を算出するステップと、
    前記実績値に対して前記信頼度に応じた重み付けをしたうえで、前記観測行列よりも低ランクの複数の行列の積を前記観測行列に近似させるステップと、
    を実行させるためのプログラム。
JP2012087707A 2012-04-06 2012-04-06 コンテンツ提供装置、低ランク近似行列生成装置、コンテンツ提供方法、低ランク近似行列生成方法およびプログラム Active JP5507607B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012087707A JP5507607B2 (ja) 2012-04-06 2012-04-06 コンテンツ提供装置、低ランク近似行列生成装置、コンテンツ提供方法、低ランク近似行列生成方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012087707A JP5507607B2 (ja) 2012-04-06 2012-04-06 コンテンツ提供装置、低ランク近似行列生成装置、コンテンツ提供方法、低ランク近似行列生成方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2013218485A JP2013218485A (ja) 2013-10-24
JP5507607B2 true JP5507607B2 (ja) 2014-05-28

Family

ID=49590519

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012087707A Active JP5507607B2 (ja) 2012-04-06 2012-04-06 コンテンツ提供装置、低ランク近似行列生成装置、コンテンツ提供方法、低ランク近似行列生成方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5507607B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6389057B2 (ja) * 2014-04-25 2018-09-12 Kddi株式会社 メニュー生成サーバ、メニュー表示プログラム、メニュー表示方法及びメニュー表示システム
JP6226846B2 (ja) * 2014-09-19 2017-11-08 ヤフー株式会社 情報分析装置、情報分析方法および情報分析プログラム
JP6355582B2 (ja) * 2015-03-20 2018-07-11 ヤフー株式会社 評価値算出方法、評価値算出プログラム、及び評価値算出装置
JP6703822B2 (ja) * 2015-11-27 2020-06-03 ヤフー株式会社 選択装置、選択方法、及び選択プログラム
CN105678586B (zh) 2016-01-12 2020-09-29 腾讯科技(深圳)有限公司 一种信息扶持方法和装置
JP6085700B2 (ja) * 2016-03-16 2017-02-22 ヤフー株式会社 情報処理装置、端末装置、情報処理方法及び情報処理プログラム
JP6990983B2 (ja) 2017-04-18 2022-01-12 ヤフー株式会社 推定装置、推定方法、及び推定プログラム
US20210357983A1 (en) * 2020-05-14 2021-11-18 Nanning Fugui Precision Industrial Co., Ltd. System for presenting advertisements online and method thereof
KR102391644B1 (ko) * 2020-09-10 2022-04-27 주식회사 엘지유플러스 Vod 컨텐츠 추천 방법 및 장치
CN116547685A (zh) * 2020-11-18 2023-08-04 索尼集团公司 信息处理装置、信息处理方法和程序

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3788254B2 (ja) * 2001-03-13 2006-06-21 日本電気株式会社 情報フィルタリングシステムとそのフィルタリング方法、及び情報フィルタリングプログラム
JP4428036B2 (ja) * 2003-12-02 2010-03-10 ソニー株式会社 情報処理装置および方法、プログラム、並びに、情報処理システムおよび方法
JP5531443B2 (ja) * 2009-04-08 2014-06-25 ソニー株式会社 情報処理装置および方法、並びにプログラム

Also Published As

Publication number Publication date
JP2013218485A (ja) 2013-10-24

Similar Documents

Publication Publication Date Title
JP5507607B2 (ja) コンテンツ提供装置、低ランク近似行列生成装置、コンテンツ提供方法、低ランク近似行列生成方法およびプログラム
US10825047B2 (en) Apparatus and method of selection and placement of targeted messages into a search engine result page
US20170091805A1 (en) Advertisement Recommendation Method and Advertisement Recommendation Server
US20140278939A1 (en) Advertisement extraction device and advertisement extraction method
US20120150626A1 (en) System and Method for Automated Recommendation of Advertisement Targeting Attributes
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
JP5438087B2 (ja) 広告配信装置
EP3126940A1 (en) Systems and methods for optimizing content layout using behavior metrics
CN111095330B (zh) 用于预测在线用户交互的机器学习方法和系统
JP5485311B2 (ja) 広告評価装置、広告評価方法およびプログラム
JP6679451B2 (ja) 選択装置、選択方法および選択プログラム
JP6976207B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5507622B2 (ja) 広告課金額決定装置、広告課金額決定方法およびプログラム
CN111400613A (zh) 物品推荐方法、装置、介质及计算机设备
CN111429214B (zh) 一种基于交易数据的买卖双方匹配方法及装置
CN113032668A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
US8423558B2 (en) Targeting online ads by grouping and mapping user properties
CN102243659A (zh) 基于动态贝叶斯模型的网页垃圾检测方法
JP5506867B2 (ja) コンテンツ配信装置
CN115204943A (zh) 一种广告召回方法、装置、设备以及存储介质
JP6228719B2 (ja) 文書配布装置、文書配布方法、プログラム、および非一時的な記録媒体
JP6100741B2 (ja) 抽出装置、抽出方法および抽出プログラム
JP6362577B2 (ja) 情報処理装置及び表示記事選択システム
JP5847867B2 (ja) 広告主向け参考情報提供装置
JP2019113945A (ja) 情報処理装置、情報処理方法、およびプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140319

R150 Certificate of patent or registration of utility model

Ref document number: 5507607

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250