JP5325280B2 - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
JP5325280B2
JP5325280B2 JP2011239851A JP2011239851A JP5325280B2 JP 5325280 B2 JP5325280 B2 JP 5325280B2 JP 2011239851 A JP2011239851 A JP 2011239851A JP 2011239851 A JP2011239851 A JP 2011239851A JP 5325280 B2 JP5325280 B2 JP 5325280B2
Authority
JP
Japan
Prior art keywords
user
content
feature vector
user feature
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011239851A
Other languages
English (en)
Other versions
JP2013097582A (ja
Inventor
正一 飯塚
祐介 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2011239851A priority Critical patent/JP5325280B2/ja
Publication of JP2013097582A publication Critical patent/JP2013097582A/ja
Application granted granted Critical
Publication of JP5325280B2 publication Critical patent/JP5325280B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、インターネット等のネットワークを介して広告等のコンテンツを配信する技術に関する。
ユーザがインターネット上のWebページを表示する際に、バナー広告等のコンテンツをWebページ内に表示することが多く行われている(特許文献1〜3を参照。)。この場合、ユーザの特性(属性)に応じて選択(クリック)されやすいコンテンツを表示することが広告等のコンテンツ配信の効果を高める上で望ましい。
従来、コンテンツの選択されやすさを示すCTR(Click Through Rate:広告等のコンテンツがクリックされた回数を当該コンテンツを表示した回数で除した値。コンテンツ選択率)をユーザ特徴ベクトルとコンテンツ毎の係数ベクトルとの積(内積)で表現することで、配信候補となる複数のコンテンツのCTRを予測し、原則としてCTRが最大となるコンテンツを配信するようにしていた。
ここで、ユーザ特徴ベクトルは、ユーザ属性をソフトクラスタリング(データが複数のクラスタに属することを許容するクラスタリング手法)することで生成される。ソフトクラスタリングの対象となるユーザ属性は、性別や年齢、コンテンツのジャンル別の視聴頻度等により分類されたものであり、最大でユーザ数まで分類することが可能であるが、計算量の観点から数十程度に分類される。ソフトクラスタリングによりユーザ特徴ベクトルを生成するのは、ユーザ属性の微妙な違いを損なうことなくいくつかのクラスタに集約するとともに、後の演算に適するデータ量に圧縮するためである。また、係数ベクトルは、全コンテンツ均等に初期のCTR(例えばCTR=0等)により計算された後、実際のクリック実績に基づいて回帰分析により調整され、予測値の精度が向上される。
特開2009−252217号公報 特開2006−120135号公報 特開2000−163477号公報
上述したユーザ特徴ベクトルとコンテンツ毎の係数ベクトルとの積でCTRを予測する手法は、広告等のコンテンツ配信の効果を高める上で有用な手法であるが、時間の経過とともにCTR予測の精度が低下するという問題があった。すなわち、ユーザ属性の分類やソフトクラスタリングにおいて決定される各クラスタは所定の時点におけるユーザの行動に基づいて定義しているため、時間の経過により当初の範囲から実態が逸脱する場合があり、クリック実績により係数ベクトルの調整を行ったとしても精度が低下していくことがあるためである。
従って、所定の期間経過後は、再びユーザ属性の分類やソフトクラスタリングのクラスタを再定義し、ユーザ特徴ベクトルを再生成する必要がある。しかし、再生成によりユーザ特徴ベクトルは従前とは異なる指標となるため、係数ベクトルとして従前の係数ベクトルを使用することはできず、初期状態から改めて調整を開始する必要がある。
図1は従来における時間経過とCTR予測精度の関係の例を示す図であり、ユーザ特徴ベクトルの生成から期間T1はCTR予測精度が上昇していくが、期間T2になるとCTR予測精度が低下していく。そのため、ユーザ特徴ベクトルの再生成を行うことになるが、係数ベクトルが初期状態に戻ってしまうため、期間T3の当初はCTR予測精度が期間T1の初期と同程度に落ちてしまう。
その結果、ユーザ特徴ベクトルの再生成の後の当初は低いCTR予測精度に基づいてコンテンツ配信を行わなければならず、広告等のコンテンツ配信の効果が低下してしまうという問題があった。
本発明は上記の従来の問題点に鑑み提案されたものであり、その目的とするところは、ユーザ特徴ベクトルの再生成を行っても直前までと同等のCTR予測精度を維持し、広告等のコンテンツ配信の効果の維持・向上を図ることにある。
上記の課題を解決するため、本発明にあっては、ユーザ情報に対してソフトクラスタリングを行ってユーザ群毎にユーザ特徴ベクトルを生成するユーザ特徴ベクトル生成手段と、前記ユーザ特徴ベクトル生成手段により生成されたユーザ特徴ベクトルに基づいて初期状態のコンテンツ選択率により配信候補となる複数のコンテンツ毎の係数ベクトルを計算する係数ベクトル計算手段と、ユーザ端末からコンテンツ配信要求を受け付けるコンテンツ配信要求受付手段と、前記ユーザ端末のコンテンツ配信対象ユーザに対応する前記ユーザ特徴ベクトルと配信候補となる複数のコンテンツ毎の前記係数ベクトルの積によりコンテンツ選択率予測値をコンテンツ毎に算出し、コンテンツ選択率予測値が最大となるコンテンツを配信対象に決定する配信コンテンツ決定手段と、前記配信コンテンツ決定手段により決定されたコンテンツを前記ユーザ端末に送信するコンテンツ送信手段と、前記ユーザ端末からコンテンツの選択動作を示す情報を受け付けてログ情報を出力するユーザ選択行動受付手段と、前記ユーザ選択行動受付手段が受け付けたコンテンツの選択動作に基づいて前記係数ベクトルの調整を行う係数ベクトル調整手段と、所定のタイミングで、現時点のユーザ情報に対してソフトクラスタリングを行ってユーザ群毎にユーザ特徴ベクトルを再生成するユーザ特徴ベクトル再生成手段と、前記ユーザ特徴ベクトル再生成手段により生成されたユーザ特徴ベクトルに基づいて初期状態のコンテンツ選択率により配信候補となる複数のコンテンツ毎の係数ベクトルを計算するとともに、前記ログ情報の過去のユーザ選択実績に基づいて係数ベクトルの再調整を行う係数ベクトル再計算・再調整手段とを備える。
本発明の情報処理装置にあっては、ユーザ特徴ベクトルの再生成を行っても直前までと同等のCTR予測精度を維持することができるので、広告等のコンテンツ配信の効果の維持・向上を図ることができる。
従来における時間経過とCTR予測精度の関係の例を示す図である。 本発明の一実施形態にかかるシステムの構成例を示す図である。 ユーザ情報DBのデータ構造例を示す図である。 コンテンツDBのデータ構造例を示す図である。 ユーザ特徴ベクトルDBのデータ構造例を示す図である。 係数ベクトルDBのデータ構造例を示す図である。 クリックログDBのデータ構造例を示す図である。 コンテンツ配信装置のハードウェア構成例を示す図である。 実施形態の処理例を示すフローチャート(その1)である。 ユーザ特徴ベクトルの生成手法の例を示す図である。 係数ベクトルの計算手法の例を示す図である。 係数ベクトルの調整手法の例を示す図である。 実施形態の処理例を示すフローチャート(その2)である。 実施形態における時間経過とCTR予測精度の関係の例を示す図である。
以下、本発明の好適な実施形態につき説明する。
<システム構成>
図2は本発明の一実施形態にかかるシステムの構成例を示す図である。
図2において、インターネット等のネットワーク1には、ユーザが操作するPC(Personal Computer)、スマートフォン、携帯電話、PDA(Personal Digital Assistants)等のユーザ端末2が複数接続されている。ユーザ端末2は、一般的なブラウザ(Webブラウザ)21を備えている。ブラウザ21は、インターネットの標準プロトコルであるHTTP(Hyper Text Transfer Protocol)等に従い、HTML(Hyper Text Markup Language)等の言語で記述されたページデータの要求・取得・表示およびフォームデータの送信等を行う機能を有している。
一方、ネットワーク1には、ユーザ端末2のブラウザ21に対して広告等のコンテンツを配信するコンテンツ配信装置3が接続されている。
コンテンツ配信装置3は、機能部として、コンテンツ配信要求受付部301と配信コンテンツ決定部302とコンテンツ送信部303とユーザクリック行動受付部304と係数ベクトル調整部305とユーザ特徴ベクトル生成部306と係数ベクトル計算部307とユーザ特徴ベクトル再生成部308と係数ベクトル再計算・再調整部309とを備えている。これらの機能部は、コンテンツ配信装置3を構成するコンピュータのCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等のハードウェア資源上で実行されるコンピュータプログラムによって実現されるものである。これらの機能部は、単一のコンピュータ上に配置される必要はなく、必要に応じて分散される形態であってもよい。
また、コンテンツ配信装置3は、処理の過程で参照・更新される情報を保持する、ユーザ情報DB(Database)311とコンテンツDB312とユーザ特徴ベクトルDB313と係数ベクトルDB314とクリックログDB315とを備えている。これらデータベースは、コンテンツ配信装置3を構成するコンピュータ内のHDD(Hard Disk Drive)等の記憶媒体上に所定のデータを体系的に保持するものである。これらのデータベースは、単一のコンピュータ上に配置される必要はなく、必要に応じて分散される形態であってもよい。
<データベース構造>
図3はユーザ情報DB311のデータ構造例を示す図であり、「ユーザID」「性別」「年齢」「PVサマリ」「ユーザ群ID」等の項目を有している。「ユーザID」は、ユーザを特定する情報である。「ユーザ群ID」は、当該ユーザが含まれるユーザ群を特定する情報であり、ユーザ群を個々のユーザまで細分化する場合はユーザIDで足りるため不要となる。ユーザ群とは、性別、年齢、閲覧頻度等が同等のものとして分類されたユーザのグループである。「性別」は、当該ユーザの性別を示す情報であり、「男性」「女性」「不明」等の値が設定される。「年齢」は、当該ユーザの年齢もしくは年齢層を示す情報であり、「40代」「20代」等の値が設定される。「PVサマリ」は、当該ユーザのWebページの閲覧頻度(PV:Page View)等から得られる情報であり、「スポーツ」「ショッピング」等のジャンルに対して「H」「M」「L」等の値が設定される。
図4はコンテンツDB312のデータ構造例を示す図であり、「コンテンツID」「コンテンツデータ/コンテンツURL」等の項目を有している。「コンテンツID」は、配信対象となるコンテンツを特定する情報である。「コンテンツデータ/コンテンツURL」は、当該コンテンツのデータ本体もしくはデータ本体の保存場所(URL:Uniform Resource Locator)を示す情報である。
図5はユーザ特徴ベクトルDB313のデータ構造例を示す図であり、「ユーザ群ID」「m1」「m2」・・・等の項目と、補助情報としての「生成日時」とを有している。「ユーザ群ID」は、ユーザ群を特定する情報である。「m1」「m2」・・・は、当該ユーザのユーザ特徴ベクトルの要素である。「生成日時」は、ユーザ特徴ベクトルの生成および再生成の日時を示す情報である。
図6は係数ベクトルDB314のデータ構造例を示す図であり、「コンテンツID」「n1」「n2」・・・「CTR/表示回数/クリック回数」等の項目を有している。「コンテンツID」は、配信対象となるコンテンツを特定する情報である。「n1」「n2」・・・は、当該コンテンツの係数ベクトルの要素である。「CTR/表示回数・クリック回数」は、当該コンテンツについての最新のCTR実測値と表示回数とクリック回数である。クリック回数を表示回数で割ることでCTR実測値が得られるため、CTR実測値は省略することもできる。また、「CTR/表示回数・クリック回数」はコンテンツDB312においてコンテンツIDと対応付けて保持するようにしてもよい。
図7はクリックログDB315のデータ構造例を示す図であり、「ユーザID」「日時」「クリックしたコンテンツID」「レコメンドしたコンテンツID」等の項目を有している。「ユーザID」は、ユーザを特定する情報である。「日時」は、ログを取得した日時の情報である。「クリックしたコンテンツID」は、当該ユーザがクリックしたコンテンツを特定する情報である。「レコメンドしたコンテンツID」は、当該ユーザのクリックに際し、当初に配信されたコンテンツを特定する情報である。
<各部機能>
図2に戻り、コンテンツ配信要求受付部301は、ユーザ端末2のブラウザ21からネットワーク1を介してコンテンツ配信要求を受け付け、コンテンツ配信要求を受け付けた旨と要求元のユーザIDと配信先情報(ユーザ端末2のブラウザ21のアドレスおよびポート番号等)を後続に伝える機能を有している。一般に、ユーザ端末2のブラウザ21に図示しないサーバから提供されるWebページにはコンテンツの表示フレームが設けられており、ブラウザ21はコンテンツの表示フレームの部分を処理する過程で当該部分に埋め込まれたコンテンツ配信装置3のアドレスにコンテンツ配信要求を行い、その要求をコンテンツ配信要求受付部301が受け付ける。また、図示しないサーバを利用する際には、予めユーザログインが行われており、ユーザIDを識別可能な情報がクッキー等によりブラウザ21に保持されており、コンテンツ配信要求に伴われる。
配信コンテンツ決定部302は、コンテンツ配信要求受付部301から引き渡された、コンテンツ配信要求を受け付けた旨と要求元のユーザIDに基づいてユーザ情報DB311からユーザ群を特定し、そのユーザ群に基づいてユーザ特徴ベクトルDB313を検索して該当するユーザ特徴ベクトルを取得するとともに、予め配信候補として用意されたコンテンツのコンテンツIDに基づいて係数ベクトルDB314を検索して該当するコンテンツ毎の係数ベクトルを取得し、ユーザ特徴ベクトルと係数ベクトルとの積(内積)をとることでコンテンツ毎のCTR予測値を算出し、CTR予測値が最大となるコンテンツを配信対象に決定する機能を有している。なお、CTR予測値に偏りが発生しないように、所定の比率の数の配信(例えば、10回につき1回)については均等の確率でコンテンツを決定する。
コンテンツ送信部303は、配信コンテンツ決定部302により配信対象として決定されたコンテンツのコンテンツIDに基づいてコンテンツDB312を検索してコンテンツデータを取得し、要求元のユーザ端末2のブラウザ21にコンテンツデータを送信する機能を有している。
ユーザクリック行動受付部304は、ユーザ端末2のブラウザ21でのコンテンツの選択動作を示す情報を受け付け、クリックログDB315にログ情報を出力する機能を有している。一般に、Webページに表示されるコンテンツには、クリック状況取得のために所定のアドレスに対してユーザIDを識別可能な情報と、クリックしたコンテンツIDを識別可能な情報と、レコメンドされたコンテンツIDを識別可能な情報とを送信する機能が埋め込まれており、その送信内容をユーザクリック行動受付部304が受け付ける。
係数ベクトル調整部305は、ユーザクリック行動受付部304がユーザクリック行動を受け付けた場合に、必要に応じて(CTR実測値に変化が生ずる場合等)、ユーザクリック行動をしたユーザIDに基づいてユーザ情報DB311からユーザ群を特定し、該当するユーザ特徴ベクトルDB313のユーザ特徴ベクトルと現時点のCTR実測値とに基づいて係数ベクトルの調整を行い、係数ベクトルDB314の係数ベクトルを更新する機能を有している。処理の詳細については後述する。
ユーザ特徴ベクトル生成部306は、ユーザ情報DB311からユーザ情報を取得し、ユーザ属性から複数のユーザ群に分類した上で、Fuzzy-c-Means等の手法によりソフトクラスタリングを行ってユーザ特徴ベクトルを生成し、生成したユーザ特徴ベクトルをユーザ特徴ベクトルDB313に格納する機能を有している。処理の詳細については後述する。
係数ベクトル計算部307は、ユーザ特徴ベクトル生成部306により生成されたユーザ特徴ベクトルに基づいて初期状態のCTR(CTR=0等)により係数ベクトルを計算し、計算した係数ベクトルを係数ベクトルDB314に格納する機能を有している。
ユーザ特徴ベクトル再生成部308は、ユーザ特徴ベクトル生成部306によるユーザ特徴ベクトルの生成もしくは自己のユーザ特徴ベクトル再生成部308によるユーザ特徴ベクトルの再生成から所定の期間が経過し、または、CTR予測値のCTR実測値に対する誤差が所定の割合まで低下した場合に、ユーザ情報DB311からユーザ情報を取得し、ユーザ属性から複数のユーザ群に再び分類した上で、Fuzzy-c-Means等の手法によりソフトクラスタリングを再び行ってユーザ特徴ベクトルを生成し、生成したユーザ特徴ベクトルをユーザ特徴ベクトルDB313に格納する機能を有している。処理の詳細については後述する。
係数ベクトル再計算・再調整部309は、ユーザ特徴ベクトル再生成部308により再生成されたユーザ特徴ベクトルに基づいて初期状態のCTR(CTR=0等)により係数ベクトルを計算するとともに、クリックログDB315からログ情報を取得して過去のユーザクリック実績に基づいて係数ベクトルの再調整(再計算)を行い、算出した係数ベクトルを係数ベクトルDB314に格納する機能を有している。
図8はコンテンツ配信装置3のハードウェア構成例を示す図である。
図8において、コンテンツ配信装置3は、システムバス31に接続されたCPU32、ROM33、RAM34、NVRAM(Non-Volatile Random Access Memory)35、I/F(Interface)36と、I/F36に接続された、キーボード、マウス、モニタ、CD/DVD(Compact Disk/Digital Versatile Disk)ドライブ等のI/O(Input/Output Device)37、HDD38、NIC(Network Interface Card)39等を備えている。Mはプログラムもしくはデータが格納されたCD/DVD等のメディア(記録媒体)である。
<ユーザ特徴ベクトル/係数ベクトルの算出の処理>
図9は上記の実施形態におけるユーザ特徴ベクトルおよび係数ベクトルの算出の処理例を示すフローチャートである。
図9において、コンテンツ配信装置3の管理者等が起動を指令し、あるいは予め設定されたスケジューリングにより自動起動することで処理が開始すると、ユーザ特徴ベクトル生成部306は、ユーザ情報DB311からユーザ情報を取得し、ユーザ属性から複数のユーザ群に分類した上で、Fuzzy-c-Means等の手法によりソフトクラスタリングを行ってユーザ特徴ベクトルを生成し、生成したユーザ特徴ベクトルをユーザ特徴ベクトルDB313に格納する(ステップS101)。
図10はユーザ特徴ベクトル生成部306によるユーザ特徴ベクトルの生成手法の例を示す図である。
図10において、ユーザ特徴ベクトル生成部306は、ユーザ情報DB311から取得したユーザ情報から、性別や年齢、コンテンツのジャンル別の視聴頻度等により複数のユーザ群A、B、C、D、・・に分類を行い、それをユーザ情報表現データに変換する。図示の例では、最初の3桁が性別を表わし(先頭が「1」の場合は「男性」、次が「1」の場合は「女性」、次が「1」の場合は「不明」)、次の7桁は年齢を表わし(先頭から順に「1」の場合は「10代」「20代」「30代」「40代」「50代」「60代」「70代」)、以降の桁はPVサマリ(例えば、先頭から3番目はジャンル「スポーツ」、4番目はジャンル「ショッピング」で、「3」は「H」、「2」は「M」、「1」は「L」)を表わしている。
また、ユーザ特徴ベクトル生成部306は、c個(図示の例では5個)のクラスタの中心となる分類初期値データをランダムもしくは運用経験に基づいて設定する。
そして、ユーザ特徴ベクトル生成部306は、ユーザ情報表現データと分類初期値データに基づき、Fuzzy-c-Meansの場合、
・ユーザ情報表現データと各クラスタの分類初期値データとのベクトル間距離(2乗距離)を計算し、第1〜第cのクラスタとの距離をユーザ特徴ベクトルの第1〜第cの要素に設定
・クラスタ毎に中心を再計算し、全てのクラスタの中心が変化しなければ終了し、変化した場合は再計算したクラスタの中心に基づいてベクトル間距離の計算から繰り返し
を実行することで、ユーザ群毎のユーザ特徴ベクトルXを生成する。
図9に戻り、ユーザ特徴ベクトルが生成されると、係数ベクトル計算部307は、ユーザ特徴ベクトル生成部306により生成されたユーザ特徴ベクトルに基づいて初期状態のCTR(例えば、CTR=0)により係数ベクトルを計算し、計算した係数ベクトルを係数ベクトルDB314に格納する(ステップS102)。
図11は係数ベクトル計算部307による係数ベクトルの計算手法の例を示す図である。
図11において、係数ベクトル計算部307は、ユーザ特徴ベクトルXと初期CTRデータに基づき、ユーザ特徴ベクトルX、コンテンツ毎の係数ベクトルΘとし、
CTR予測値=Y=ΘX
に対し、コンテンツ毎に、ユーザ特徴ベクトルXの独立変数間の変動・共変動行列Sを
ij=Σk=1〜n(Xki−XAV )(Xkj−XAV
により計算し(XAV :Xの平均値)、独立変数と従属変数Y間の共変動ベクトルCを
=Σk=1〜n(Xki−XAV )(Y−YAV
により計算し(Y:k番目のユーザ特徴ベクトルに対するCTR実測値、YAV:CTR実測値の平均値)、
Θ=S−1
により係数ベクトルΘを計算する(S−1:変動・共変動行列Sの逆行列)。n個のユーザ特徴ベクトルは、ユーザ群の数だけのユーザ特徴ベクトルである。
なお、初期状態として全てのコンテンツにつきCTR実測値=0とする場合は、係数ベクトルΘの要素は全て0となるため、上記の計算をすることなく、係数ベクトルΘをゼロベクトルに設定してもよい。
図9に戻り、係数ベクトルが計算された後は、ユーザクリック行動受付部304がユーザクリック状況を取得すると(ステップS103)、係数ベクトル調整部305は、ユーザクリック行動をしたユーザIDに基づいてユーザ情報DB311からユーザ群を特定し、該当するユーザ特徴ベクトルDB313のユーザ特徴ベクトルと、ユーザクリック行動受付部304が受け付けたユーザクリック状況を反映させたCTR実測値とに基づいて係数ベクトルの調整を行い、係数ベクトルDB314の係数ベクトルを更新する(ステップS104)。
図12は係数ベクトル調整部305による係数ベクトルの調整手法の例を示す図である。
図12において、係数ベクトル調整部305は、ユーザ群毎のユーザ特徴ベクトルXと実測CTRデータ(各コンテンツのCTR実測値)に基づき、ユーザ特徴ベクトルX、コンテンツ毎の係数ベクトルΘとし、
CTR予測値=Y=ΘX
に対し、コンテンツ毎に、ユーザ特徴ベクトルXの独立変数間の変動・共変動行列Sを
ij=Σk=1〜n(Xki−XAV )(Xkj−XAV
により計算し(XAV :Xの平均値)、独立変数と従属変数Y間の共変動ベクトルCを
=Σk=1〜n(Xki−XAV )(Y−YAV
により計算し(Y:k番目のユーザ特徴ベクトルに対するCTR実測値、YAV:CTR実測値の平均値)、
Θ=S−1
により係数ベクトルΘを計算する(S−1:変動・共変動行列Sの逆行列)。
図9に戻り、係数ベクトルの調整が行われると、係数ベクトル調整部305もしくはユーザ特徴ベクトル再生成部308は、前回のユーザ特徴ベクトルの生成(再生成を含む)から所定期間経過したか否か判断し(ステップS105)、所定期間経過していない場合はユーザクリック状況取得(ステップS103)に戻る。なお、前述したように、所定期間経過の判断に代えて、CTR予測値のCTR実測値に対する誤差が所定の割合まで低下したか否かを判定するようにしてもよい。この場合、CTR予測値のCTR実測値に対する誤差が所定の割合まで低下していない場合はユーザクリック状況取得(ステップS103)に戻る。
一方、ユーザ特徴ベクトルの生成から所定期間経過したと判断した場合(あるいはCTR予測値のCTR実測値に対する誤差が所定の割合まで低下したと判断した場合)、ユーザ特徴ベクトル再生成部308は、ユーザ情報DB311からユーザ情報を取得し、ユーザ属性から複数のユーザ群に再び分類した上で、Fuzzy-c-Means等の手法によりソフトクラスタリングを再び行ってユーザ特徴ベクトルを生成し、生成したユーザ特徴ベクトルをユーザ特徴ベクトルDB313に格納する(ステップS106)。処理内容は図10に示したのと同様であるが、ユーザ情報が更新されている場合には最新のユーザ情報が用いられる点と、ユーザ群の分類の見直しが行われる場合にはユーザ情報表現データが変化する点と、分類初期値データに見直しが行われる場合には、分類初期値データとして運用経験等に基づき、新たな視点に基づく値の設定を行う点とが異なる。
次いで、図9において、係数ベクトル再計算・再調整部309は、ユーザ特徴ベクトル再生成部308により再生成されたユーザ特徴ベクトルに基づいて初期状態のCTR(=0)により係数ベクトルを計算する(ステップS107)。処理内容は図11に示したのと同様であるが、再生成によりユーザ特徴ベクトルXの値は異なるものとなる。
次いで、図9において、係数ベクトル再計算・再調整部309は、クリックログDB315から過去のユーザクリック状況を取得し(ステップS108)、取得したユーザクリック状況に基づいて係数ベクトルの再調整を行い、算出した係数ベクトルを係数ベクトルDB314に格納する(ステップS109)。処理内容は図12に示したのと同様であるが、実測CTRデータがクリックログDB315から取得したデータである点が異なる。
次いで、図9において、係数ベクトル再計算・再調整部309は、所定の期間分(例えば、直近のログまで)について再調整を行ったか否か判断し(ステップS110)、まだであればクリックログDB315からのユーザクリック状況の取得(ステップS108)に戻り、完了していればユーザクリック状況取得(ステップS103)に戻る。
<コンテンツ配信時の処理>
次に、図13はコンテンツ配信時の処理例を示すフローチャートである。
図13において、コンテンツ配信要求受付部301がユーザ端末2のブラウザ21からネットワーク1を介してコンテンツ配信要求を受け付けると(ステップS201)、配信コンテンツ決定部302は、コンテンツ配信要求受付部301から引き渡されたユーザIDに基づいてユーザ情報DB311からユーザ群を特定し、そのユーザ群に基づいてユーザ特徴ベクトルDB313を検索して該当するユーザ特徴ベクトルを取得するとともに、予め配信候補として用意されたコンテンツのコンテンツIDに基づいて係数ベクトルDB314を検索して該当するコンテンツ毎の係数ベクトルを取得し、ユーザ特徴ベクトルと係数ベクトルとの積(内積)をとることでコンテンツ毎のCTR予測値を算出する(ステップS202)。
次いで、配信コンテンツ決定部302は、算出したコンテンツ毎のCTR予測値から、CTR予測値が最大となるコンテンツを配信対象に決定する(ステップS203)。なお、CTR予測値に偏りが発生しないように、所定の比率の数の配信(例えば、10回につき1回)については均等の確率でコンテンツを決定する。
次いで、コンテンツ送信部303は、配信コンテンツ決定部302により配信対象として決定されたコンテンツのコンテンツIDに基づいてコンテンツDB312を検索してコンテンツデータを取得し、要求元のユーザ端末2のブラウザ21にコンテンツデータを送信する(ステップS204)。
次いで、ユーザクリック行動受付部304がユーザ端末2のブラウザ21でのコンテンツの選択動作を示す情報を受け付けると(ステップS205)、ユーザクリック行動受付部304はクリックログDB315にログ情報を出力する(ステップS206)。
<CTR予測精度>
図14は上記の実施形態における時間経過とCTR予測精度の関係の例を示す図である。
図14において、期間T11においてユーザ特徴ベクトルの生成からCTR予測精度が上昇していき、CTR予測精度が低下し始めた時点でユーザ特徴ベクトルの再作成および係数ベクトルの再計算・再調整を行って期間T2に入るため、図1に示した従来のように期間T1の開始時と同程度までCTR予測精度が大幅に低下することはなく、更に上昇させることができる。また、期間T12でCTR予測精度が低下し始めた時点でユーザ特徴ベクトルの再作成および係数ベクトルの再計算・再調整を行って期間T13に入る場合も同様である。
<総括>
以上説明したように、本実施形態によれば、次のような利点がある。
(1)ユーザ特徴ベクトルの再生成を行っても直前と同等のCTR予測精度を維持することができるので、広告等のコンテンツ配信の効果の維持・向上を図ることができる。
(2)前回のユーザ特徴ベクトルの生成もしくは再生成から所定の期間の経過を検出した場合にユーザ特徴ベクトルの再生成を行うことで、CTR予測精度の低下を防止することができる。
(3)CTR予測値のCTR実測値に対する誤差が所定の割合まで低下したことを検出した場合にユーザ特徴ベクトルの再生成を行うことで、CTR予測精度の低下を防止することができる。
(4)ユーザ情報に性別、年齢、コンテンツジャンル毎閲覧頻度を含むことで、ユーザの特性を的確にコンテンツ配信に反映させることができる。
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。
1 ネットワーク
2 ユーザ端末
21 ブラウザ
3 コンテンツ配信装置
301 コンテンツ配信要求受付部
302 配信コンテンツ決定部
303 コンテンツ送信部
304 ユーザクリック行動受付部
305 係数ベクトル調整部
306 ユーザ特徴ベクトル生成部
307 係数ベクトル計算部
308 ユーザ特徴ベクトル再生成部
309 係数ベクトル再計算・再調整部
311 ユーザ情報DB
312 コンテンツDB
313 ユーザ特徴ベクトルDB
314 係数ベクトルDB
315 クリックログDB

Claims (7)

  1. ユーザ情報に対してソフトクラスタリングを行ってユーザ群毎にユーザ特徴ベクトルを生成するユーザ特徴ベクトル生成手段と、
    前記ユーザ特徴ベクトル生成手段により生成されたユーザ特徴ベクトルに基づいて初期状態のコンテンツ選択率により配信候補となる複数のコンテンツ毎の係数ベクトルを計算する係数ベクトル計算手段と、
    ユーザ端末からコンテンツ配信要求を受け付けるコンテンツ配信要求受付手段と、
    前記ユーザ端末のコンテンツ配信対象ユーザに対応する前記ユーザ特徴ベクトルと配信候補となる複数のコンテンツ毎の前記係数ベクトルの積によりコンテンツ選択率予測値をコンテンツ毎に算出し、コンテンツ選択率予測値が最大となるコンテンツを配信対象に決定する配信コンテンツ決定手段と、
    前記配信コンテンツ決定手段により決定されたコンテンツを前記ユーザ端末に送信するコンテンツ送信手段と、
    前記ユーザ端末からコンテンツの選択動作を示す情報を受け付けてログ情報を出力するユーザ選択行動受付手段と、
    前記ユーザ選択行動受付手段が受け付けたコンテンツの選択動作に基づいて前記係数ベクトルの調整を行う係数ベクトル調整手段と、
    所定のタイミングで、現時点のユーザ情報に対してソフトクラスタリングを行ってユーザ群毎にユーザ特徴ベクトルを再生成するユーザ特徴ベクトル再生成手段と、
    前記ユーザ特徴ベクトル再生成手段により生成されたユーザ特徴ベクトルに基づいて初期状態のコンテンツ選択率により配信候補となる複数のコンテンツ毎の係数ベクトルを計算するとともに、前記ログ情報の過去のユーザ選択実績に基づいて係数ベクトルの再調整を行う係数ベクトル再計算・再調整手段と
    を備えたことを特徴とする情報処理装置。
  2. ユーザ情報に対してソフトクラスタリングを行ってユーザ群毎にユーザ特徴ベクトルを生成するユーザ特徴ベクトル生成手段と、
    前記ユーザ特徴ベクトル生成手段により生成されたユーザ特徴ベクトルに基づいて初期状態のコンテンツ選択率により配信候補となる複数のコンテンツ毎の係数ベクトルを計算する係数ベクトル計算手段と、
    ユーザ端末のコンテンツの選択動作に基づいて前記係数ベクトルの調整を行う係数ベクトル調整手段と、
    所定のタイミングで、現時点のユーザ情報に対してソフトクラスタリングを行ってユーザ群毎にユーザ特徴ベクトルを再生成するユーザ特徴ベクトル再生成手段と、
    前記ユーザ特徴ベクトル再生成手段により生成されたユーザ特徴ベクトルに基づいて初期状態のコンテンツ選択率により配信候補となる複数のコンテンツ毎の係数ベクトルを計算するとともに、前記ユーザ端末のコンテンツの選択動作を示す情報を記録したログ情報の過去のユーザ選択実績に基づいて係数ベクトルの再調整を行う係数ベクトル再計算・再調整手段と
    を備えたことを特徴とする情報処理装置。
  3. 請求項1または2のいずれか一項に記載の情報処理装置において、
    前記ユーザ特徴ベクトル再生成手段は、前記ユーザ特徴ベクトルの生成もしくは再生成から所定の期間の経過を検出した場合にユーザ特徴ベクトルの再生成を行う
    ことを特徴とする情報処理装置。
  4. 請求項1または2のいずれか一項に記載の情報処理装置において、
    前記ユーザ特徴ベクトル再生成手段は、コンテンツ選択率予測値のコンテンツ選択率実測値に対する誤差が所定の割合まで低下したことを検出した場合にユーザ特徴ベクトルの再生成を行う
    ことを特徴とする情報処理装置。
  5. 請求項1乃至4のいずれか一項に記載の情報処理装置において、
    前記ユーザ情報は、性別、年齢、コンテンツジャンル毎閲覧頻度を含む
    ことを特徴とする情報処理装置。
  6. 情報処理装置が、ユーザ情報に対してソフトクラスタリングを行ってユーザ群毎にユーザ特徴ベクトルを生成するユーザ特徴ベクトル生成工程と、
    前記情報処理装置が、前記ユーザ特徴ベクトル生成工程により生成されたユーザ特徴ベクトルに基づいて初期状態のコンテンツ選択率により配信候補となる複数のコンテンツ毎の係数ベクトルを計算する係数ベクトル計算工程と、
    前記情報処理装置が、ユーザ端末からコンテンツ配信要求を受け付けるコンテンツ配信要求受付工程と、
    前記情報処理装置が、前記ユーザ端末のコンテンツ配信対象ユーザに対応する前記ユーザ特徴ベクトルと配信候補となる複数のコンテンツ毎の前記係数ベクトルの積によりコンテンツ選択率予測値をコンテンツ毎に算出し、コンテンツ選択率予測値が最大となるコンテンツを配信対象に決定する配信コンテンツ決定工程と、
    前記情報処理装置が、前記配信コンテンツ決定工程により決定されたコンテンツを前記ユーザ端末に送信するコンテンツ送信工程と、
    前記情報処理装置が、前記ユーザ端末からコンテンツの選択動作を示す情報を受け付けてログ情報を出力するユーザ選択行動受付工程と、
    前記情報処理装置が、前記ユーザ選択行動受付工程が受け付けたコンテンツの選択動作に基づいて前記係数ベクトルの調整を行う係数ベクトル調整工程と、
    前記情報処理装置が、所定のタイミングで、現時点のユーザ情報に対してソフトクラスタリングを行ってユーザ群毎にユーザ特徴ベクトルを再生成するユーザ特徴ベクトル再生成工程と、
    前記情報処理装置が、前記ユーザ特徴ベクトル再生成工程により生成されたユーザ特徴ベクトルに基づいて初期状態のコンテンツ選択率により配信候補となる複数のコンテンツ毎の係数ベクトルを計算するとともに、前記ログ情報の過去のユーザ選択実績に基づいて係数ベクトルの再調整を行う係数ベクトル再計算・再調整工程と
    を備えたことを特徴とする情報処理方法。
  7. 情報処理装置が、ユーザ情報に対してソフトクラスタリングを行ってユーザ群毎にユーザ特徴ベクトルを生成するユーザ特徴ベクトル生成工程と、
    前記情報処理装置が、前記ユーザ特徴ベクトル生成工程により生成されたユーザ特徴ベクトルに基づいて初期状態のコンテンツ選択率により配信候補となる複数のコンテンツ毎の係数ベクトルを計算する係数ベクトル計算工程と、
    前記情報処理装置が、ユーザ端末のコンテンツの選択動作に基づいて前記係数ベクトルの調整を行う係数ベクトル調整工程と、
    前記情報処理装置が、所定のタイミングで、現時点のユーザ情報に対してソフトクラスタリングを行ってユーザ群毎にユーザ特徴ベクトルを再生成するユーザ特徴ベクトル再生成工程と、
    前記情報処理装置が、前記ユーザ特徴ベクトル再生成工程により生成されたユーザ特徴ベクトルに基づいて初期状態のコンテンツ選択率により配信候補となる複数のコンテンツ毎の係数ベクトルを計算するとともに、前記ユーザ端末のコンテンツの選択動作を示す情報を記録したログ情報の過去のユーザ選択実績に基づいて係数ベクトルの再調整を行う係数ベクトル再計算・再調整工程と
    を備えたことを特徴とする情報処理方法。
JP2011239851A 2011-11-01 2011-11-01 情報処理装置 Active JP5325280B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011239851A JP5325280B2 (ja) 2011-11-01 2011-11-01 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011239851A JP5325280B2 (ja) 2011-11-01 2011-11-01 情報処理装置

Publications (2)

Publication Number Publication Date
JP2013097582A JP2013097582A (ja) 2013-05-20
JP5325280B2 true JP5325280B2 (ja) 2013-10-23

Family

ID=48619460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011239851A Active JP5325280B2 (ja) 2011-11-01 2011-11-01 情報処理装置

Country Status (1)

Country Link
JP (1) JP5325280B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5442806B2 (ja) * 2012-06-06 2014-03-12 ヤフー株式会社 コンテンツ配信装置
JP6590880B2 (ja) * 2017-09-01 2019-10-16 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342360A (ja) * 2001-05-18 2002-11-29 Sharp Corp 情報提供装置、その方法、そのコンピュータ・プログラムおよびそのプログラムを記録した記録媒体
JP2010140433A (ja) * 2008-12-15 2010-06-24 Nec Corp コンテンツ推薦システム、コンテンツ推薦方法及びコンテンツ推薦プログラム
JP2011096173A (ja) * 2009-11-02 2011-05-12 Nec Corp 情報提供システム、情報提供端末、情報提供サーバ、情報提供方法および情報提供プログラム

Also Published As

Publication number Publication date
JP2013097582A (ja) 2013-05-20

Similar Documents

Publication Publication Date Title
US11531867B2 (en) User behavior prediction method and apparatus, and behavior prediction model training method and apparatus
US10380649B2 (en) System and method for logistic matrix factorization of implicit feedback data, and application to media environments
US20220245013A1 (en) Detecting, diagnosing, and alerting anomalies in network applications
US20160285672A1 (en) Method and system for processing network media information
US20200286154A1 (en) Utilizing item-level importance sampling models for digital content selection policies
US11971922B2 (en) Methods and apparatus for estimating total unique audiences
US20150227964A1 (en) Revenue Estimation through Ensemble Modeling
JP6059314B1 (ja) 推定装置、推定方法及び推定プログラム
JP2010204966A (ja) サンプリング装置、サンプリング方法、サンプリングプログラム、クラス判別装置およびクラス判別システム。
CN111159563A (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
US8868565B1 (en) Calibrating click duration according to context
JP5813052B2 (ja) 情報処理装置、方法及びプログラム
JP2019503522A (ja) 最適化されたデジタル・コンポーネント分析システム
JP5325280B2 (ja) 情報処理装置
KR20220137943A (ko) 패턴 기반 분류
JP6692739B2 (ja) 抽出装置、抽出方法及び抽出プログラム
CN112218114B (zh) 视频缓存控制方法、装置和计算机可读存储介质
US11687967B2 (en) Methods and apparatus to estimate the second frequency moment for computer-monitored media accesses
CN110020129B (zh) 点击率校正方法、预估方法、装置、计算设备及存储介质
JP2011227720A (ja) 推薦システム、推薦方法、及び推薦プログラム
US20230126932A1 (en) Recommended audience size
JP7223164B2 (ja) データインテグリティの最適化
JP6696018B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
CN114600125A (zh) 相同组内跨异类子组的鲁棒模型性能
CN112966210A (zh) 一种存储用户数据的方法和装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130719

R150 Certificate of patent or registration of utility model

Ref document number: 5325280

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250