JP5507613B2 - 興味推定装置、興味推定方法およびプログラム - Google Patents

興味推定装置、興味推定方法およびプログラム Download PDF

Info

Publication number
JP5507613B2
JP5507613B2 JP2012115791A JP2012115791A JP5507613B2 JP 5507613 B2 JP5507613 B2 JP 5507613B2 JP 2012115791 A JP2012115791 A JP 2012115791A JP 2012115791 A JP2012115791 A JP 2012115791A JP 5507613 B2 JP5507613 B2 JP 5507613B2
Authority
JP
Japan
Prior art keywords
interest
user
file
advertisement
file format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012115791A
Other languages
English (en)
Other versions
JP2013242718A (ja
Inventor
康司 曽根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2012115791A priority Critical patent/JP5507613B2/ja
Publication of JP2013242718A publication Critical patent/JP2013242718A/ja
Application granted granted Critical
Publication of JP5507613B2 publication Critical patent/JP5507613B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、興味推定装置、興味推定方法およびプログラムに関する。
広告の配信手法として、ユーザの行動を解析することでユーザの興味を推測し、ユーザの興味に合った広告を配信する行動ターゲティング広告が知られている。広告は通常コンテンツとともに表示されるように配信されるが、特許文献1に記載のシステムでは、ダウンロードしたコンテンツのファイル名に広告を挿入する手法が提案されている。
特開2003−323142号公報
行動ターゲティング広告では、ユーザがどのようなコンテンツを閲覧したのかを把握するために、コンテンツに含まれている単語を抽出するなどの解析処理が行われているが、ユーザの興味を精度良く推定するためには、より幅広い情報を解析することが求められている。
本発明は、このような背景を鑑みてなされたものであり、ユーザの興味を精度良く推定することのできる、興味推定装置、興味推定方法およびプログラムを提供することを目的とする。
上記課題を解決するための本発明の主たる発明は、ユーザの興味に応じたコンテンツを配信するために前記興味を推定する装置であって、ユーザがダウンロードしたファイルのファイル形式を含むダウンロード履歴情報を取得する行動履歴取得手段と、前記ダウンロード履歴情報に含まれる前記ファイル形式に応じて前記ユーザの前記興味を推定する興味推定手段と、を備えることとする。
また、本発明の興味推定装置では、前記行動履歴取得手段は、複数の前記ダウンロード履歴情報を取得し、前記興味推定手段は、前記ファイル形式ごとに前記ダウンロード履歴情報の数をカウントして前記ユーザが前記ファイル形式の前記ファイルをダウンロードした回数を算出し、前記ファイル形式および前記回数に応じて前記興味を推定するようにしてもよい。
また、本発明の興味推定装置では、前記興味推定手段は、前記回数が所定数を超えた前記ファイル形式のみに応じて前記ユーザの興味を推定するようにしてもよい。
また、本発明の興味推定装置は、前記ファイルを前記ユーザに提供するサーバと通信可能に接続され、前記行動履歴取得手段は、前記サーバから前記ダウンロード履歴情報を取得するようにしてもよい。
また、本発明の興味推定装置は、前記ユーザごとに前記ダウンロード履歴情報を記憶するダウンロード履歴記憶手段をさらに備え、前記行動履歴取得手段は、前記ダウンロード履歴記憶手段から前記ダウンロード履歴情報を読み出すようにしてもよい。
また、本発明の興味推定装置では、前記興味推定手段は、前記ファイル形式が音声形式である場合に前記ユーザの興味には音楽が含まれることと、前記ファイル形式が動画形式である場合に前記ユーザの興味には映画およびビデオの少なくともいずれかが含まれることと、の少なくともいずれかを推定するようにしてもよい。
また、本発明の興味推定装置では、前記ファイル形式ごとに、当該ファイル形式のファイルを提供する提供者を記憶する提供者記憶手段をさらに備え、前記興味推定手段は、前記取得したファイル形式に対応する前記提供者を前記提供者記憶手段から特定し、前記特定した提供者が前記ユーザの前記興味に含まれると推定するようにしてもよい。
また、本発明の他の態様は、ユーザの興味に応じたコンテンツを配信するために前記興味を推定する方法であって、コンピュータが、前記ユーザがダウンロードしたファイルのファイル形式を含むダウンロード履歴情報を取得するステップと、前記ダウンロード履歴情報に含まれる前記ファイル形式に応じて前記ユーザの前記興味を推定するステップと、を実行することとする。
また、本発明の他の態様は、ユーザの興味に応じたコンテンツを配信するために前記興味を推定するためのプログラムであって、コンピュータに、前記ユーザがダウンロードしたファイルのファイル形式を含むダウンロード履歴情報を取得するステップと、前記ダウンロード履歴情報に含まれる前記ファイル形式に応じて前記ユーザの前記興味を推定するステップと、を実行させることとする。
その他本願が開示する課題やその解決方法については、発明の実施形態の欄及び図面により明らかにされる。
本発明によれば、ユーザの興味を精度良く推定することができる。
本実施形態の広告配信装置10を含む広告配信システムの構成例を示す図である。 広告配信装置10、ユーザ端末20およびWebサーバ30に用いられるコンピュータのハードウェア構成例を示す図である。 ユーザ端末20のソフトウェア構成例を示す図である。 Webサーバ30のソフトウェア構成例を示す図である。 閲覧履歴記憶手段331に記憶される閲覧履歴情報の構成例を示す図である。 ダウンロード履歴記憶手段332に記憶されるダウンロード履歴情報の構成例を示す図である。 広告配信装置10のソフトウェア構成例を示す図である。 広告データベース131に記憶される広告情報の構成例を示す図である。 ユーザデータベース132に記憶されるユーザ情報の構成例を示す図である。 関連キーワードデータベース133に登録される関連キーワード情報の構成例を示す図である。 本実施形態の広告配信装置10により行われる、ユーザの興味を推定する処理の流れを説明する図である。 本実施形態の広告配信システムにおける処理の流れの一例を説明する図である。 広告データの抽出処理の流れを説明する図である。
==(1)本実施形態の概要==
以下、本発明の一実施形態に係る広告配信装置10について説明する。本実施形態の広告配信装置10は、ユーザの行動履歴を解析してユーザの興味を推定し、推定した興味に合った広告を配信する行動ターゲティング広告を行う。
本実施形態の広告配信装置10は、ユーザがダウンロードしたファイルのファイル形式をユーザの興味の解析に用いる。ファイル形式からは、ユーザがどのような種類のファイルをダウンロードしたかを判別することができるので、例えば、画像形式のファイルをダウンロードしているユーザは写真に興味があり、音声形式のファイルをダウンロードしているユーザは音楽に興味があり、動画形式のファイルをダウンロードしているユーザは映画およびビデオに興味があると判断することができる。
==(2)システム構成==
図1は、本実施形態の広告配信装置10を含む広告配信システムの構成例を示す図である。本実施形態に係る広告配信システムでは、広告配信装置10、ユーザ端末20およびWebサーバ30はそれぞれ通信ネットワーク40に接続されている。通信ネットワーク40は、例えばイーサネット(登録商標)、公衆電話回線網、携帯電話回線網、無線通信網などにより構築されるインターネットである。
ユーザ端末20は、例えばパーソナルコンピュータ、携帯電話端末、スマートフォン、タブレットコンピュータなどのコンピュータである。ユーザ端末20とWebサーバ30とはHTTP(HyperText Transfer Protocol)により通信を行う。ユーザはユーザ端末20を操作してWebサーバ30にアクセスして各種のコンテンツをダウンロード可能となっている。
Webサーバ30は、例えばパーソナルコンピュータやワークステーションなどのコンピュータである。Webサーバ30はユーザ端末20からのHTTPリクエストに応じてコンテンツを配信する、例えば、検索サービスを提供する検索エンジンとすることができる。
広告配信装置10は、行動ターゲティング広告の手法により選択した広告を配信する、例えばパーソナルコンピュータやワークステーションなどのコンピュータである。本実施形態では、広告配信装置10は、ユーザ端末20からのリクエストに応じて広告を配信するものとする。本実施形態の広告配信装置10は、いわゆる行動ターゲティング広告の手法により、配信すべき広告を決定する。すなわち、広告配信装置10は、一般的な行動ターゲティング広告の手法により、Webページの閲覧履歴に基づいてユーザの興味を推定する。さらに本実施形態では、ユーザがファイルをダウンロードしたダウンロード履歴を用いてユーザの興味を推定する。なお、ダウンロード履歴を用いた興味の推定を除く一般的な行動ターゲティング広告の手法については説明を省略する。
==(3)ハードウェア構成==
図2は、広告配信装置10、ユーザ端末20およびWebサーバ30に用いられるコンピュータのハードウェア構成例を示す図である。コンピュータは、CPU101、メモリ102、記憶装置103、通信インタフェース104、入力装置105、出力装置106を備える。記憶装置103は、各種のデータやプログラムを記憶する、例えばハードディスクドライブやソリッドステートドライブ、フラッシュメモリなどである。CPU101は記憶装置103に記憶されているプログラムをメモリ102に読み出して実行することにより各種の機能を実現する。通信インタフェース104は、通信ネットワーク40に接続するためのインタフェースであり、例えば、イーサネット(登録商標)に接続するためのアダプタ、公衆電話回線網に接続するためのモデム、無線通信網に接続するための無線通信機などである。入力装置105は、データの入力を受け付ける、例えばキーボードやマウス、トラックボール、タッチパネル、マイクロフォンなどである。出力装置106は、データを出力する、例えばディスプレイやプリンタ、スピーカなどである。
==(4)ユーザ端末20のソフトウェア構成==
図3はユーザ端末20のソフトウェア構成例を示す図である。ユーザ端末20は、Webページ取得手段211、広告取得手段212およびファイルダウンロード手段213を備えている。なお、Webページ取得手段211、広告取得手段212およびファイルダウンロード手段213は、ユーザ端末20が備えるCPU101が記憶装置103に記憶されているプログラムをメモリ102に読み出して実行することにより実現される。
Webページ取得手段211は、Webページを表示するための情報(以下、画面データという。)をWebサーバ30から取得する。Webページ取得手段211は、HTTPのリクエストをWebサーバ30に送信し、リクエストに応じて送信される画面データを受信し、受信した画面データに基づいてWebページを出力する。
広告取得手段212は、広告を表示するための情報(以下、広告データという。)を広告配信装置10から取得する。広告データは、画像データであってもよいし、動画データ、音声データ、テキストデータ、HTMLデータなどであってもよい。本実施形態では、画面データには、広告を取得するための情報(以下、広告取得情報という。)が含まれており、広告取得手段212は、広告取得情報に基づいて広告データを取得することができる。例えば、画面データはHTML(HyperText Markup Language)で記載され、画面データの中には、広告の画像を示すURLを指定したIMGタグ、広告の動画や音声などのマルチメディアデータを示すURLを指定したEMBEDタグやOBJECTタグ、HTMLで記載された広告を示すURLを指定したIFRAMEタグ、広告データにアクセスするためにWebブラウザが実行するプログラムを内容として含むSCRIPTタグなどが広告取得情報として画面データに含めることができる。この場合、広告取得手段212は、上記各タグに指定されているURLからコンテンツを受信し、受信したコンテンツを広告として出力することができる。なお本実施形態では説明を簡単にするため、広告データはテキストデータであるものとする。
ファイルダウンロード手段213は、Webサーバ30からファイルをダウンロードする。ファイルダウンロード手段213は、コンテンツを含むファイルをダウンロードするための所定のパス(以下、ダウンロードパスという。)の含まれたURLに対するリンクが画面データに含まれている場合に、当該URLを指定したHTTPリクエストをWebサーバ30に送信することによりファイルをダウンロードする。ファイルダウンロード手段213は、ダウンロードしたファイルを例えばメモリ102や記憶装置103に格納したり、出力装置106に出力したりすることができる。
なお、画面データも広告データもコンテンツに含まれる。したがって、Webページ取得手段211、広告取得手段212およびファイルダウンロード手段213は、コンテンツ取得手段として1つの機能として実現することもできる。また、コンテンツ取得手段は、一般的なWebブラウザが提供する機能として実現することができる。
==(5)Webサーバ30のソフトウェア構成==
図4はWebサーバ30のソフトウェア構成例を示す図である。Webサーバ30は、HTTP処理手段311、閲覧履歴登録手段312、ダウンロード履歴登録手段313、閲覧履歴記憶手段331、ダウンロード履歴記憶手段332を備える。なお、HTTP処理手段311、閲覧履歴登録手段312およびダウンロード履歴登録手段313は、Webサーバ30が備えるCPU101が記憶装置103に記憶されているプログラムをメモリ102に読み出して実行することにより実現され、閲覧履歴記憶手段331およびダウンロード履歴記憶手段332は、Webサーバ30が備えるメモリ302および記憶装置303が提供する記憶領域の一部として実現される。
HTTP処理手段311は、いわゆるWebサーバとしての機能を提供する。HTTP処理手段311は、ユーザ端末20からのリクエストに応じてファイルを送信したり、リクエストに指定されたプログラムを起動し、プログラムの実行結果を送信したりする。なお、HTTP処理手段311が提供するWebサーバとしての機能は一般的なWebサーバが提供するものであり、ここでは説明を省略する。
閲覧履歴記憶手段331は、ユーザが閲覧したコンテンツを示す情報(以下、閲覧履歴情報という。)を記憶する。図5は、閲覧履歴記憶手段331に記憶される閲覧履歴情報の構成例を示す図である。閲覧履歴情報には、ユーザの識別情報(以下、ユーザIDという。)、コンテンツを示すURL(以下、コンテンツURLという。)、閲覧した日時、コンテンツの内容を示すキーワードが含まれる。ユーザが閲覧するコンテンツとは、HTMLにより記述されるWebページ以外にも、静止画像、動画像、音声、平文テキストなど、ユーザ端末20において出力可能なコンテンツであれば何でもよい。コンテンツIDには、例えば、ファイルのパスを採用することができるが、コンテンツごとにコンテンツIDを割り当ててもよい。
閲覧履歴登録手段312は、閲覧履歴情報を閲覧履歴記憶手段331に登録する。閲覧履歴登録手段312は、HTTP処理手段311がリクエストを受信するごとに、リクエストを送信したユーザを特定し、特定したユーザIDと、HTTP処理手段311が送出したファイルあるいはHTTP処理手段311が起動したプログラムを示すURLと、リクエストを受信した日時とを含む閲覧履歴情報を作成する。また、閲覧履歴登録手段312は、コンテンツに割り当てられているキーワードを取得して、取得したキーワードも閲覧履歴情報に含める。閲覧履歴登録手段312は、例えば、コンテンツにテキストデータが含まれている場合には、コンテンツに含まれている単語のTF−IDF値などに応じて、コンテンツの特徴語を決定してキーワードとして閲覧履歴情報に含めることができる。また、Webサーバ30は、コンテンツごとにコンテンツが所属するカテゴリやコンテンツに対応するキーワードを予め記憶装置103などに記憶しておき、閲覧履歴登録手段312は、コンテンツに対応するキーワードやカテゴリの名称を記憶装置103から取得して閲覧情報に含めるようにすることもできる。
ダウンロード履歴記憶手段332は、ユーザがダウンロードしたファイルについての情報(以下、ダウンロード履歴情報という。)を記憶する。図6は、ダウンロード履歴記憶手段332に記憶されるダウンロード履歴情報の構成例を示す図である。ダウンロード履歴情報には、ダウンロードしたユーザを示すユーザID、ダウンロードされたファイルを示すURL、ダウンロードされたファイルのファイル形式、当該ファイルのデータサイズ、ダウンロードが行われた日時が含まれる。ファイル形式は、本実施形態では、HTTPレスポンスのヘッダ部に記述されるタイプ(Content-Type)として設定されるMIME(Multipurpose Internet Mail Extension)タイプであるものとする。
ダウンロード履歴登録手段313は、ファイルがダウンロードされた場合に、ダウンロード履歴情報をダウンロード履歴記憶手段332に登録する。本実施形態では、ダウンロード履歴登録手段313は、HTTP処理手段311が受信したリクエストに指定されたURLにダウンロードパスが含まれている場合に、ダウンロードがされると判定するものとする。ダウンロード履歴登録手段313は、ダウンロードがされると判定した場合、リクエストのURLが示すファイルまたは当該URLが示すプログラムが出力するデータのファイル形式を取得する。本実施形態では、ダウンロード履歴登録手段313は、HTTP処理手段311が作成したHTTPレスポンスのヘッダ部分に含まれるタイプ(Content-Type)として設定されている値をファイル形式として取得するものとする。ダウンロード履歴登録手段313は、リクエストの送信元のユーザを特定し、特定したユーザを示すユーザIDと、リクエストに指定されていたURLと、取得したファイル形式と、ダウンロードされたデータのデータサイズと、現在の日時とを含むダウンロード履歴情報を作成して、ダウンロード履歴記憶手段332に登録する。
==(6)広告配信装置10のソフトウェア構成==
図7は広告配信装置10のソフトウェア構成例を示す図である。広告配信装置10は、行動履歴入力手段111、興味解析手段112、広告配信手段113、広告データベース131、ユーザデータベース132、関連キーワードデータベース133を備える。なお、行動履歴入力手段111、興味解析手段112および広告配信手段113は、広告配信装置10が備えるCPU101が記憶装置103に記憶されているプログラムをメモリ102に読み出して実行することにより実現され、広告データベース131、ユーザデータベース132および関連キーワードデータベース133は、広告配信装置10が備えるメモリ102や記憶装置103が提供する記憶領域の一部として実現される。
広告データベース131は、広告データを含む情報(以下、広告情報という。)を記憶する。図8は広告データベース131に記憶される広告情報の構成例を示す図である。広告情報には、広告を特定する情報(以下、広告IDという。)と広告データと、広告を表示させるキーワードごとの当該広告についての入札額とが含まれる。1つの広告情報について複数のキーワードの入札を行うことが可能である。広告がクリックされると、入札額を上限とした金額が広告主に課金されることになる。上述したように広告データは、画像データであってもよいし、動画データ、音声データ、テキストデータ、HTMLデータなどであってもよい。すなわち、広告データはユーザ端末20で実行されるWebブラウザが表示できる形式であればよい。なお、広告情報は予め広告データベース131に登録されているものとする。
ユーザデータベース132は、ユーザに関する情報(以下、ユーザ情報という。)を記憶する。図9はユーザデータベース132に記憶されるユーザ情報の構成例を示す図である。ユーザ情報には、ユーザIDに対応付けてユーザの興味を示すキーワード(以下、興味キーワードという。)が含まれる。ユーザ情報には、興味キーワードが複数含まれていてもよい。また、ユーザ情報には、ユーザの属性に関する各種の情報(例えば、ユーザの性別や年代、居住地域など)や、ユーザ認証に関する情報などを含めるようにしてもよい。ユーザ情報は、興味キーワードを除き、予めユーザデータベース132に登録されているものとする。
関連キーワードデータベース133(本発明の提供者記憶手段に対応する。)は、ファイル形式に関係する興味キーワードを含む情報(以下、関連キーワード情報という。)を記憶する。例えば、ある企業が独自のファイル形式を提案している場合や、ファイルを提供するサービスにおいて特定のファイル形式が用いられていることが広く知られている場合などには、当該ファイル形式に対応する興味キーワードとして、企業やサービスの名称を登録することができる。図10は関連キーワードデータベース133に登録される関連キーワード情報の構成例を示す図である。関連キーワード情報には、ファイル形式に対応付けて当該ファイル形式に対応する興味キーワードが含まれる。キーワードは複数含まれていてもよい。図10の例では、音声形式(audio/*)について「音楽」や「作曲」などのキーワードが、ビデオ形式(video/*)について「映画」や「動画」「ビデオ」などのキーワードが、画像形式(image/*)について「写真」などのキーワードが、電子書籍形式(application/epub+zip)について「本」や「書籍」などのキーワードが、それぞれ対応付けられている。
行動履歴入力手段111は、ユーザの行動履歴の入力を受け付ける。本実施形態では、行動履歴入力手段111は、少なくともWebサーバ30が蓄積しているダウンロード履歴情報の入力を受け付けるものとする。また本実施形態では、行動履歴入力手段111は、Webサーバ30が蓄積している閲覧履歴情報の入力も受け付けるものとする。なお、行動履歴入力手段111は、一般的な行動ターゲティング広告の手法に用いられる、例えば、ユーザが商品を購入した購買履歴や、ユーザがサービスを利用した利用履歴など、ユーザの興味を解析するために用いられる行動履歴の入力を受け付けるようにしてもよい。行動履歴入力手段111は、例えばオペレータから行動履歴の入力を受け付けるようにしてもよいし、Webサーバ30にアクセスして、閲覧履歴情報とダウンロード履歴情報とをダウンロードするようにしてもよい。
興味解析手段112は、ユーザの行動履歴に基づいてユーザの興味を推定する。本実施形態の興味解析手段112は、一般的な行動ターゲティング広告の手法を用いて閲覧履歴情報を解析してユーザの興味を推定するとともに、ダウンロード履歴情報に含まれるファイル形式に応じてユーザの興味を推定し、推定した興味を示す興味キーワードをユーザ情報に登録する。本実施形態では、興味解析手段112は、ファイル形式に対応する興味キーワードを関連キーワードデータベース133から読み出すことにより、興味を推定するものとする。
また、興味解析手段112は、ユーザに対応するダウンロード履歴情報に含まれるファイル形式ごとに数をカウントしてファイル形式ごとにファイルのダウンロード回数を算出し、ダウンロード回数が所定数を超えるか否か、あるいは、ダウンロード回数の合計に対する当該ダウンロード回数の割合が所定値を超えるか否かにより、ダウンロード回数が多いか否かを判定する。興味解析手段112は、ダウンロード回数の多いファイル形式についてのみ、当該ファイル形式に対応する興味キーワードを決定するものとする。
広告配信手段113は、広告を配信する。広告配信手段113は、ユーザ端末20からのリクエストを受信すると、リクエストの送信元のユーザを特定し、特定したユーザに対応するユーザ情報をユーザデータベース132から読み出し、読み出したユーザ情報に含まれる興味キーワードのいずれかがカテゴリに含まれている広告情報を広告データベース131から読み出し、読み出した広告情報に含まれる広告データをユーザ端末20に送信する。なお、複数の広告情報が該当する場合には、広告配信手段113は、例えば、広告情報のカテゴリに含まれている興味キーワードの数の最も多い広告情報の広告データのみを送信するようにしてもよいし、広告の入札額を広告情報に含めるようにして、入札額の最も大きい広告情報の広告データのみを送信するようにしてもよい。複数の広告情報の中から、ユーザ端末20に送信する所定数の広告を選択する手法については、行動ターゲティング広告に用いられている各種の公知の手法を用いることができる。
==(7)ユーザの興味の推定処理==
図11は、本実施形態の広告配信装置10により行われる、ユーザの興味を推定する処理の流れを説明する図である。
行動履歴入力手段111は、閲覧履歴情報とダウンロード履歴情報との入力を受け付ける(S501)。上述したように、行動履歴入力手段111は、Webサーバ30にアクセスして閲覧履歴情報とダウンロード履歴情報とを取得するようにしてもよい。興味解析手段112は、各ユーザについて以下の処理を行う。
興味解析手段112は、当該ユーザを示すユーザIDに対応する閲覧履歴情報を抽出し(S502)、抽出した閲覧履歴情報に応じてユーザの興味を示す興味キーワードを決定する(S503)。なお、S503における興味キーワードの決定処理には、一般的な行動ターゲティング広告に用いられる処理を採用することができる。興味解析手段112は、決定した興味キーワードを、ユーザIDに対応するユーザ情報の興味キーワードに含ませるようにユーザデータベース132を更新する(S504)。
興味解析手段112は、ユーザIDに対応するダウンロード履歴情報を抽出し(S505)、抽出したダウンロード履歴情報について、ファイル形式ごとにダウンロード履歴情報の数をカウントする(S506)。興味解析手段112は、所定数よりも多いファイル形式の上位所定数を抽出する(S507)。興味解析手段112は、抽出した各ファイル形式について、ファイル形式に対応する関連キーワード情報を関連キーワードデータベース133から検索し(S508)、関連キーワード情報があれば(S509:YES)、関連キーワード情報に含まれているキーワードを、ユーザのユーザ情報の興味キーワードに追加する(S510)。
以上の処理を各ユーザについて繰り返すことにより、ユーザの興味を表す興味キーワードがユーザデータベース132に登録される。
==(8)広告の配信処理==
図12は、本実施形態の広告配信システムにおける処理の流れの一例を説明する図である。
ユーザ端末20のWebページ取得手段211がWebサーバ30に対してWebページを取得するためのHTTPのリクエストを送信すると(S601)、Webサーバ30では、HTTP処理手段311がWebページを表示するための画面データを応答するとともに(S602)、閲覧履歴登録手段312は当該Webページが閲覧された旨の閲覧履歴情報を閲覧履歴記憶部331に登録する(S603)。
画面データには広告を取得するための広告取得情報が含まれており、ユーザ端末20は広告取得情報に応じて広告データを取得するためのHTTPリクエストを広告配信装置10に送信する(S604)。広告配信装置10の広告配信手段113は、図13に示す広告データの抽出処理により、リクエストの送信元のユーザの興味に応じた広告データを広告データベース131から読み出す(S605)。
図13において、広告配信手段113は、リクエストの送信元のユーザを特定し(S621)、特定したユーザを示すユーザIDに対応するユーザ情報をユーザデータベース132から読み出し(S622)、読み出したユーザ情報に含まれる興味キーワードを含む広告情報を広告データベース131から読み出す(S623)。広告配信手段113は、広告情報ごとに、ユーザ情報に含まれる興味キーワードに対応する入札額の合計を算出し(S624)、入札額の合計が大きい順に所定数の広告情報に含まれる広告データを抽出する(S625)。
図12に戻り、広告配信装置10の広告配信手段113は、抽出した広告データを含むレスポンスをユーザ端末20に応答する(S606)。ユーザ端末20では、広告データに基づく広告がブラウザ上に表示されることになる。
ユーザ端末20が取得したWebページにファイルをダウンロードするためのリンクが含まれており、それがクリックされると(S607)、ユーザ端末20のファイルダウンロード手段213は、ファイルをダウンロードするためのHTTPリクエストをWebサーバ30に送信する(S608)。
Webサーバ30のHTTP処理手段311がリクエストに応じてファイルをユーザ端末20に送信すると(S609)、ダウンロード履歴登録手段313は当該ファイルがダウンロードされた旨のダウンロード履歴情報をダウンロード履歴記憶部332に登録する(S610)。
==(9)効果==
以上説明したように、本実施形態の広告配信装置10によれば、ファイルのダウンロード履歴に応じてユーザの興味を推定することができる。したがって、閲覧履歴だけではなくダウンロード履歴をも使用することにより、より幅広い情報に基づいてユーザの興味を推定することができるので、興味の推定の精度の向上が期待される。
動画や音声などではデータからその内容を把握することが難しく、動画や音声の内容に応じてユーザの興味を特定することも難しいところ、本実施形態の広告配信装置10によれば、動画や音声のファイル形式に応じてユーザの興味を推定することができる。すなわち、動画や音声などについても内容がどのようなものであるかを解析することなくユーザの興味を推定することができる。したがって、ダウンロードされた動画や音声などに応じてさらにユーザの興味を推定することが可能となり、興味の推定の精度の向上が期待される。また、動画や音声の内容を解析して興味を推定する場合に比べ、興味の推定にかかる処理負荷を軽減することができる。
また、ある企業が独自のファイル形式を考え出した場合や、サービスにおいて積極的に特定のファイル形式でのファイルが提供されている場合などには、ファイル形式から企業やサービスなどが想定されることも多い。本実施形態の広告配信装置10では、このようなファイル形式から想定される企業やサービスなどを示す興味キーワードを興味キーワードデータベース153に登録しておくことで、このようなファイル形式から想定される企業やサービスなどをユーザの興味対象としてファイル形式から容易に推定することができる。
また、本実施形態の広告配信装置10では、ダウンロードされた回数が所定数以上のファイル形式のみに基づいて興味を推定しているので、少ない回数しかダウンロードされていないファイル形式については興味を有していないものと判定することができる。したがって、ノイズを除去して正確にユーザの興味を推定することができる。
==(10)変形例1:コンテンツマッチ広告==
なお、本実施形態では、行動ターゲティング広告においてファイル形式を用いてユーザの興味を推定するものとしたが、これに限らず、例えば広告の分類を、ファイル形式を用いて行い、Webページの内容に合った広告を配信するコンテンツマッチ広告に利用することもできる。
例えば、広告配信装置10は、各広告のランディングページにおいて配信されているファイルのファイル形式を取得し、取得したファイル形式に対応するキーワードを関連キーワードデータベース133から取得して、取得したキーワードを広告のキーワードとして決定することができる。ここで、広告配信装置10は、広告のキーワードがWebサーバ30の配信したWebページにどれくらい含まれているかに応じて、ユーザ端末20に配信する広告を決定することができる。
さらに、本実施形態で説明したように、ユーザの興味についてファイル形式を用いて推定するとともに、広告の分類もファイル形式を用いて行うようにしてもよい。この場合、Webページに広告のキーワードがどれくらい含まれているかに加えて、ユーザの興味を示す興味キーワードと広告のキーワードがどれくらい一致するかに応じて、配信する広告を決定することができる。
==(11)変形例2:購買履歴==
また、本実施形態では、閲覧履歴とダウンロード履歴とに基づいてユーザの興味を推定するものとしたが、これらに加えて、あるいは閲覧履歴に代えて購買履歴に基づいて興味を推定するようにしてもよい。この場合も、一般的な行動ターゲティング広告の手法を用いて購買履歴からユーザの興味を推定することができる。
==(12)変形例3:推定処理==
また、本実施形態では、ファイル形式に対応する興味キーワードは関連キーワードデータベース133から特定するものとしたが、興味解析手段112が場合分けを行ってファイル形式から興味キーワードを推定するようにしてもよい。例えば、興味解析手段112は、例えばMP3やAACなど、音声形式のダウンロード回数が多い場合には、当該ユーザは「音楽」に興味があると推定して、「音楽」を興味キーワードとして決定し、MPGやAVIなど、動画形式のダウンロード回数が多い場合には、当該ユーザは「ビデオ」に興味があると推定して「ビデオ」を興味キーワードとして決定することができる。また、Webサーバ30が映画に関する動画をダウンロードさせている場合に、動画形式のダウンロード回数が多いときは、興味解析手段112は、当該ユーザは「映画」に興味があると推定して「映画」を興味キーワードとして決定することができる。興味解析手段112は、プレゼンテーションソフトウェアのファイル形式のダウンロード回数が多い場合には、「プレゼンテーション」に興味があると推定することができ、例えばEPUBなど電子書籍形式のダウンロード回数が多い場合には、「読書」や「本」に興味があると推定することができる。また、Webサーバ30がアプリケーションプログラムのダウンロードサービスを提供している場合には、プログラムのダウンロード回数がおおいときは、興味解析手段112は、当該ユーザは「ソフトウェア」や「アプリケーション」に興味があると推定することもできる。
==(13)その他変形例==
また、本実施形態では、広告配信装置10やWebサーバ30はそれぞれ1台のコンピュータであるものとしたが、複数のコンピュータにより構成するようにしてもよい。また、本実施形態では、ユーザ端末20は1台のみがアクセスするような説明としたが、もちろん複数のユーザ端末20がWebサーバ30や広告配信装置10にアクセスするようにしてもよい。
また、本実施形態では、Webサーバ30と広告配信装置10とが別のコンピュータであるものとしたが、1台のコンピュータで実現するようにしてもよいし、複数のコンピュータが、Webサーバ30および広告配信装置10が備える全ての機能を備えるようにしてもよい。この場合、ユーザ端末20からWebページに対するリクエストを受信した時点で、送信元のユーザを特定し、ユーザの興味に応じた広告データを抽出して、抽出した広告データをWebページの画面データの中に予め組み入れてユーザ端末20に応答するようにしてもよい。
また、本実施形態では、ダウンロードパスを含むURLへのリクエストに対する応答は全てファイルのダウンロードであるものとしたが、例えば、Webサーバ30がダウンロード用のCGIプログラムを実行し、当該CGIプログラムがダウンロード履歴登録手段313を実現するようにして、送出したファイルの情報をダウンロード履歴情報として登録するようにすることもできる。
また、本実施形態では、HTTPレスポンスに含まれるタイプ(Content-Type)の値をファイル形式として取得するものとしたが、例えば、ダウンロードされたファイルの拡張子からファイル形式を決定するようにしてもよいし、ファイルの先頭部分を解析してファイル形式を推定するようにしてもよい。
また、本実施形態では、1つのファイル形式に興味キーワードが対応付けられているものとしたが、2つ以上のファイル形式に組み合わせに対して興味キーワードを対応付けるようにしてもよい。例えば、ワードプロセッサのファイル形式と表計算ソフトウェアのファイル形式との2つのファイル形式に対応付けて「ビジネス」などの興味キーワードを設定するようにすることができる。この場合、例えば同じ「application/mp4」のファイル形式についても、音声形式である「audio/mp3」との組み合わせに対しては「音楽」の興味キーワードを設定し、ビデオ形式である「video/mpeg」との組み合わせに対しては「ビデオ」の興味キーワードを設定するようにすることもできる。
また、本実施形態では、広告配信装置10は、ユーザ端末20からのリクエストに応じて広告を提供するものとしたが、広告配信装置10側からユーザ端末20に対して能動的に広告データを送信するようにしてもよい。例えば、広告配信装置10は、電子メールにより広告を提供するようにすることもできる。
また、本実施形態では、ファイル形式の例として、音声形式、ビデオ形式、画像形式および電子書籍形式を取り上げたが、これに限らず各種のファイル形式について興味キーワードを設定することができる。
また、本実施形態では、ファイル形式はMIME形式であるものとしたが、これに限らず、ファイルの形式を表すものであればどのような表現形式であってもよい。
また、本実施形態では、興味キーワードに対応する広告情報からユーザ端末20に配信するものを決定する際に、興味キーワードに対応する入札額を用いるものとしたが、これに限らず、任意の処理を用いるようにすることもできる。例えば、興味キーワードに対応する広告情報からランダムに所定数を配信するようにしてもよい。
以上、本実施形態について説明したが、上記実施形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物も含まれる。
10 広告配信装置
20 ユーザ端末
30 Webサーバ
40 通信ネットワーク
111 行動履歴入力手段
112 興味解析手段
113 広告配信手段
131 広告データベース
132 ユーザデータベース
133 提供者データベース
211 Webページ取得手段
212 広告取得手段
213 ファイルダウンロード手段
311 HTTP処理手段
312 閲覧履歴登録手段
313 ダウンロード履歴登録手段
331 閲覧履歴記憶手段
332 ダウンロード履歴記憶手段

Claims (9)

  1. ユーザの興味に応じたコンテンツを配信するために前記興味を推定する装置であって、
    ユーザがダウンロードしたファイルのファイル形式を含むダウンロード履歴情報を取得する行動履歴取得手段と、
    前記ダウンロード履歴情報に含まれる前記ファイル形式に応じて前記ユーザの前記興味を推定する興味推定手段と、
    を備えることを特徴とする興味推定装置。
  2. 請求項1に記載の興味推定装置であって、
    前記行動履歴取得手段は、複数の前記ダウンロード履歴情報を取得し、
    前記興味推定手段は、前記ファイル形式ごとに前記ダウンロード履歴情報の数をカウントして前記ユーザが前記ファイル形式の前記ファイルをダウンロードした回数を算出し、前記ファイル形式および前記回数に応じて前記興味を推定すること、
    を特徴とする興味推定装置。
  3. 請求項2に記載の興味推定装置であって、
    前記興味推定手段は、前記回数が所定数を超えた前記ファイル形式のみに応じて前記ユーザの興味を推定すること、
    を特徴とする興味推定装置。
  4. 請求項1ないし3のいずれか1項に記載の興味推定装置であって、
    前記ファイルを前記ユーザに提供するサーバと通信可能に接続され、
    前記行動履歴取得手段は、前記サーバから前記ダウンロード履歴情報を取得すること、
    を特徴とする興味推定装置。
  5. 請求項1ないし3のいずれか1項に記載の興味推定装置であって、
    前記ユーザごとに前記ダウンロード履歴情報を記憶するダウンロード履歴記憶手段をさらに備え、
    前記行動履歴取得手段は、前記ダウンロード履歴記憶手段から前記ダウンロード履歴情報を読み出すこと、
    を特徴とする興味推定装置。
  6. 請求項1ないし5のいずれか1項に記載の興味推定装置であって、
    前記興味推定手段は、前記ファイル形式が音声形式である場合に前記ユーザの興味には音楽が含まれることと、前記ファイル形式が動画形式である場合に前記ユーザの興味には映画およびビデオの少なくともいずれかが含まれることと、の少なくともいずれかを推定すること、
    を特徴とする興味推定装置。
  7. 請求項1ないし6のいずれか1項に記載の興味推定装置であって、
    前記ファイル形式ごとに、当該ファイル形式のファイルを提供する提供者を記憶する提供者記憶手段をさらに備え、
    前記興味推定手段は、前記ファイル形式に対応する前記提供者を前記提供者記憶手段から特定し、前記特定した提供者が前記ユーザの前記興味に含まれると推定すること、
    を特徴とする興味推定装置。
  8. ユーザの興味に応じたコンテンツを配信するために前記興味を推定する方法であって、
    コンピュータが、
    前記ユーザがダウンロードしたファイルのファイル形式を含むダウンロード履歴情報を取得するステップと、
    前記ダウンロード履歴情報に含まれる前記ファイル形式に応じて前記ユーザの前記興味を推定するステップと、
    を実行すること特徴とする興味推定方法。
  9. ユーザの興味に応じたコンテンツを配信するために前記興味を推定するためのプログラムであって、
    コンピュータに、
    前記ユーザがダウンロードしたファイルのファイル形式を含むダウンロード履歴情報を取得するステップと、
    前記ダウンロード履歴情報に含まれる前記ファイル形式に応じて前記ユーザの前記興味を推定するステップと、
    を実行させるためのプログラム。
JP2012115791A 2012-05-21 2012-05-21 興味推定装置、興味推定方法およびプログラム Active JP5507613B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012115791A JP5507613B2 (ja) 2012-05-21 2012-05-21 興味推定装置、興味推定方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012115791A JP5507613B2 (ja) 2012-05-21 2012-05-21 興味推定装置、興味推定方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2013242718A JP2013242718A (ja) 2013-12-05
JP5507613B2 true JP5507613B2 (ja) 2014-05-28

Family

ID=49843546

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012115791A Active JP5507613B2 (ja) 2012-05-21 2012-05-21 興味推定装置、興味推定方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5507613B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6070612B2 (ja) * 2014-03-20 2017-02-01 フリュー株式会社 サーバ、その制御方法、制御プログラム、および記憶媒体
JP5713249B1 (ja) * 2014-06-14 2015-05-07 株式会社ウィリルモバイル マーケティングシステム及びマーケティング方法
JP6185005B2 (ja) * 2015-05-07 2017-08-23 株式会社CMerTV 動画提供方法
JP6524047B2 (ja) * 2016-10-26 2019-06-05 フリュー株式会社 サーバ、その制御方法、制御プログラム、および記憶媒体
JP7031931B2 (ja) * 2018-03-28 2022-03-08 Necソリューションイノベータ株式会社 広告配信制御装置、広告配信制御方法、プログラム、および記録媒体
CN112084410B (zh) * 2020-09-10 2023-07-25 北京百度网讯科技有限公司 文档类型的推荐方法、装置、电子设备及可读存储介质
JP2023171998A (ja) * 2022-05-23 2023-12-06 株式会社プレイド 情報処理装置、情報処理方法、およびプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4660475B2 (ja) * 2004-06-10 2011-03-30 パナソニック株式会社 ユーザプロファイル管理システム
JP2010140433A (ja) * 2008-12-15 2010-06-24 Nec Corp コンテンツ推薦システム、コンテンツ推薦方法及びコンテンツ推薦プログラム
US20110196711A1 (en) * 2010-02-05 2011-08-11 Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America Content personalization system and method

Also Published As

Publication number Publication date
JP2013242718A (ja) 2013-12-05

Similar Documents

Publication Publication Date Title
JP5507613B2 (ja) 興味推定装置、興味推定方法およびプログラム
AU2010315818B2 (en) Multimode online advertisements and online advertisement exchanges
US9710555B2 (en) User profile stitching
JP5814772B2 (ja) 広告決定システム、広告決定方法およびプログラム
JP2007164710A (ja) バナー配信システム及びバナー配信方法
US20150356627A1 (en) Social media enabled advertising
US20140089080A1 (en) Advertisement choosing device and advertisement choosing method
JP2014182437A (ja) 広告抽出装置、広告抽出方法及び広告抽出プログラム
AU2007362608B2 (en) Online advertisement exposure tracking system
JP5229504B2 (ja) 広告提示方法、広告提示システム及びプログラム
US20220374481A1 (en) System and method of content selection using selection activity in digital messaging
JP2013161358A (ja) 広告評価装置、広告評価方法およびプログラム
US20220019619A1 (en) Computerized system and method for display of modified machine-generated messages
JP5727869B2 (ja) 情報配信装置
KR20170004251A (ko) 인터넷 광고 제공장치 및 방법
JP5475829B2 (ja) 情報処理装置、貢献度算出方法及び貢献度算出プログラム
JP5646546B2 (ja) 広告配信装置、広告配信方法およびプログラム
CN106709749B (zh) 媒体信息的投放方法及服务器
JP4879941B2 (ja) 情報管理システム、広告出力方法及びプログラム
JP5847099B2 (ja) 情報配信装置、及び、情報配信方法
JP5520913B2 (ja) 広告出力装置、広告出力方法及びプログラム
JP5869931B2 (ja) 批評者に批評すべきアイテムを検出するレコメンドアイテム検出プログラム、装置及び方法
JP5856010B2 (ja) 広告提供装置、広告提供方法、およびプログラム
KR101726345B1 (ko) 내부 링크 기반 네이티브 광고 방법 및 장치
JP2005070889A (ja) 属性判定システム及び方法、ならびに、コンピュータプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140319

R150 Certificate of patent or registration of utility model

Ref document number: 5507613

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250