JP5891213B2 - 事後確率算出装置、事後確率算出方法、およびプログラム - Google Patents

事後確率算出装置、事後確率算出方法、およびプログラム Download PDF

Info

Publication number
JP5891213B2
JP5891213B2 JP2013192521A JP2013192521A JP5891213B2 JP 5891213 B2 JP5891213 B2 JP 5891213B2 JP 2013192521 A JP2013192521 A JP 2013192521A JP 2013192521 A JP2013192521 A JP 2013192521A JP 5891213 B2 JP5891213 B2 JP 5891213B2
Authority
JP
Japan
Prior art keywords
user
information
probability
calculation
posterior probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013192521A
Other languages
English (en)
Other versions
JP2015060331A (ja
Inventor
大偉 赤星
大偉 赤星
カルロス コバシカワ
カルロス コバシカワ
佑太 菊池
佑太 菊池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2013192521A priority Critical patent/JP5891213B2/ja
Priority to US14/329,048 priority patent/US20150081431A1/en
Publication of JP2015060331A publication Critical patent/JP2015060331A/ja
Application granted granted Critical
Publication of JP5891213B2 publication Critical patent/JP5891213B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics

Landscapes

  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、ユーザがあるユーザ属性を有する確率を算出する事後確率算出装置等に関するものである。
従来、ウェブ広告において、オーディエンス拡張と呼ばれる手法が用いられている。そのオーディエンス拡張は、ウェブページの閲覧履歴や検索履歴を用いてユーザ属性を推測し、目的とするユーザ属性を有していると推測されるユーザに対して広告を配信する手法である。
なお、関連する技術として、例えば、ウェブページに含まれる文字列を解析し、そのページにあった広告を選択することで、ユーザに合った広告を提供する方法が開発されている(例えば、特許文献1参照)。
特開2009−145968号公報
そのようなオーディエンス拡張において、あるウェブサイトを訪問したユーザや、ある検索キーワードを入力したユーザに対して、リアルタイムでオーディエンス拡張を行ないたいという要望があった。
一般的にいえば、あるユーザがウェブページに関して何らかのイベントを行なった場合に、そのユーザがあるユーザ属性を有する確率を短時間で算出したいという要望があった。
本発明は、上記問題点を解決するためになされたものであり、ウェブページに関するイベントを行ったユーザが、あるユーザ属性を有する確率を短時間で算出することができる事後確率算出装置等を提供することである。
本第一の発明の事後確率算出装置等は、ユーザを識別するユーザ識別子と、ユーザのユーザ属性と、ユーザがウェブページに関して行ったイベントの履歴である履歴情報とを対応付ける情報であるユーザ情報が複数格納されるユーザ情報格納手段と、複数のユーザ情報を用いて、ユーザがあるユーザ属性を有する確率である事前確率を、ユーザ属性ごとに算出する事前確率算出手段と、複数のユーザ情報を用いて、あるユーザ属性を有するユーザが、あるイベントを行った確率である尤度を、ユーザ属性およびイベントの組み合わせごとに算出する尤度算出手段と、イベントの履歴情報とユーザ属性とを有する算出対象情報を受け付ける受付手段と、受付手段が受け付けた算出対象情報が有する履歴情報に含まれる各イベントを行ったユーザが、算出対象情報に含まれるユーザ属性を有する確率である事後確率を、事前確率および尤度を用いて、ナイーブベイズ法によって算出する事後確率算出手段と、事後確率算出手段が算出した事後確率に関する出力を行う出力手段と、を備えた事後確率算出装置である。
また、本第二の発明の事後確率算出装置は、第一の発明に対して、事後確率算出手段は、算出対象情報に対応する事後確率に応じた値である正規化前事後確率を算出し、受付手段が受け付けた算出対象情報に含まれるユーザ属性を、ユーザ全体に対応するユーザ属性の集合から除いた集合に含まれる各ユーザ属性についても正規化前事後確率を算出し、正規化前事後確率を用いて、算出対象情報に対応する正規化前事後確率を正規化することによって算出対象情報に対応する事後確率を算出する、事後確率算出装置である。
また、本第三の発明の事後確率算出装置は、第一または第二の発明に対して、イベントの履歴は、イベントの行われたデバイスの種類ごとのイベントの履歴であり、事前確率算出手段は、デバイスの種類ごとに事前確率を算出し、尤度算出手段は、デバイスの種類ごとに尤度を算出し、受付手段は、デバイスの種類を示すデバイス種類情報をも有する算出対象情報を受け付け、事後確率算出手段は、受付手段が受け付けた算出対象情報に含まれるデバイス種類情報の示すデバイスの種類に応じた事前確率および尤度を用いて、デバイスの種類に対応する事後確率を算出する、事後確率算出装置である。
また、本第四の発明の事後確率算出装置は、第一から第三のいずれかの発明に対して、イベントは、ウェブページの閲覧、および検索キーワードの入力の少なくとも一方である、事後確率算出装置である。
また、本第五の発明の事後確率算出装置は、第一から第四のいずれかの発明に対して、受付手段が受け付けた算出対象情報に含まれるイベントの履歴の各イベントを行ったユーザが、算出対象情報に含まれるユーザ属性を有するかどうかを、算出対象情報に応じて算出された事後確率が、あらかじめ決められた閾値より大きいかどうかによって判断する判断手段をさらに備え、出力手段は、判断手段による判断結果を出力する、事後確率算出装置である。
本発明による事後確率算出装置等によれば、ウェブページに関するイベントを行ったユーザが、あるユーザ属性を有する確率を短時間で算出することができる。
実施の形態1における事後確率算出装置の構成を示すブロック図 同実施の形態における事後確率算出装置の動作を示すフローチャート 同実施の形態におけるユーザ情報格納手段に格納されているユーザ情報の一例を示す図 同実施の形態における算出用情報格納手段に格納されている事前確率等の一例を示す図 同実施の形態における出力手段による表示例を示す図 同実施の形態におけるコンピュータシステムの外観の一例を示す図 同実施の形態におけるコンピュータシステムの構成の一例を示す図
以下、事後確率算出装置等の実施の形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
本実施の形態において、すでに分かっているユーザ属性の情報を用いて、受け付けたイベントの履歴情報に対応するユーザが、受け付けたユーザ属性を有するかどうかに関する確率を算出する事後確率算出装置1について説明する。
図1は、本実施の形態における事後確率算出装置1のブロック図である。事後確率算出装置1は、ユーザ情報格納手段101、算出用情報格納手段102、事前確率算出手段103、尤度算出手段104、受付手段105、事後確率算出手段106、判断手段107、および出力手段108を備える。
ユーザ情報格納手段101には、ユーザ情報が複数格納される。ユーザ情報は、ユーザを識別するユーザ識別子と、そのユーザのユーザ属性と、そのユーザの履歴情報とを対応付ける情報である。ユーザ識別子は、ユーザを識別できる情報であればどのようなものであっても良く、例えば、ユーザの氏名、住所、電話番号、それらの2以上の組合せであっても良く、ユーザに対して付与されたID等であっても良い。また、ユーザ識別子は、例えば、ユーザ情報格納手段101に格納されているユーザ情報を識別するIDの情報であっても良い。ユーザ情報格納手段101において、ユーザ識別子は、同一のユーザの情報が複数存在する場合に、それらの情報をユニークにマージするために用いられる情報であっても良い。
ユーザ属性とは、ユーザの属性を示す情報である。ユーザ属性は、通常、ユーザの申告により取得した情報であるが、ユーザの行動から取得された情報であっても良い。例えば、ユーザ属性は、ユーザの性別を示す情報であっても良く、ユーザの年齢を示す情報であっても良く、ユーザの世代を示す情報であっても良く、ユーザが住んでいる地域を示す情報であっても良く、ユーザの家族構成を示す情報であっても良く、ユーザの職業を示す情報であっても良く、ユーザの学歴を示す情報であっても良く、ユーザの所得を示す情報であっても良く、ユーザの買い物の趣向を示す情報であっても良く、ユーザの行動の傾向を示す情報等であっても良く、それらの任意の2以上の組合せであっても良い。
履歴情報とは、ユーザがウェブページに関して行ったイベントの履歴を示す情報である。つまり、履歴情報は、1または2以上のイベントを含む情報である。イベントとは、ウェブページの閲覧、検索キーワードの入力、および広告の選択の少なくともいずれかであっても良く、または、それ以外のウェブページに関して行なわれるイベントであっても良い。したがって、履歴情報に含まれるイベントの情報は、例えば、ユーザが特定のウェブページを閲覧したことを示す情報であっても良く、ユーザが入力した各検索キーワードであっても良く、ユーザが選択した各広告を示す情報であっても良い。ユーザが特定のウェブページを閲覧したことを示す情報は、そのウェブページの識別子であっても良い。なお、ウェブページの識別子は、例えば、URLであっても良く、図示しない格納部に格納されたそのウェブページを識別するID等であっても良く、ウェブページそのものであっても良い。また、ユーザが入力した検索キーワードは、1つのキーワードであっても良く、2以上のキーワードの組み合わせであっても良い。また、ユーザが選択した広告を識別する情報は、その広告そのものであっても良く、図示しない格納部に格納されたその広告を識別するID等であっても良い。なお、本実施の形態では、イベントが、ウェブページの閲覧と、検索キーワードの入力とである場合について主に説明する。つまり、本実施の形態では、履歴情報が、ウェブページの識別子、および検索キーワードの少なくとも一方を有する情報である場合について主に説明する。また、履歴情報には、上述した以外の情報が含まれていても良い。例えば、履歴情報には、イベントごとに、そのイベントの発生した日時が含まれていても良い。
履歴情報は、その履歴情報に含まれるイベントの行われたデバイスの種類ごとのイベントの履歴であっても良い。つまり、異なるデバイスを用いて、同一のユーザが実行したイベントは、異なる履歴情報と扱っても良く、同一の履歴情報と扱っても良い。履歴情報がデバイスの種類ごとの情報である場合は、ユーザ情報格納手段101には、デバイスの種類を示すデバイス種類情報と履歴情報とが対応付けられて格納されていても良く、デバイス種類情報を含む履歴情報が格納されていても良い。なお、デバイスの種類は、例えば、PC、タブレット、スマートフォン等であっても良い。
なお、ユーザ識別子とユーザ属性と履歴情報とを対応付けるとは、そのいずれかの情報から対応する他の情報を特定できればよいという意味である。したがって、対応情報は、ユーザ識別子、ユーザ属性、および履歴情報を有する情報であっても良く、それらの情報をリンク付ける情報であっても良い。また、対応情報は、2以上の情報に分かれていても良い。例えば、対応情報は、ユーザ識別子と、ユーザ属性とを対応付ける情報と、ユーザ識別子と、履歴情報とを対応付ける情報との集合であっても良い。
算出用情報格納手段102には、事後確率算出手段106で事後確率を算出するために用いられる事前確率と尤度とが格納される。なお、事前確率は、何の事前確率であるかを識別する情報と対応付けられて格納されても良い。また、尤度は、何の尤度であるかを識別する情報と対応付けて格納されても良い。なお、事前確率は、事前確率算出手段103によって蓄積される。また、尤度は、尤度算出手段104によって蓄積される。事前確率、および尤度については、それぞれ後述する。
事前確率算出手段103は、複数のユーザ情報を用いて、事前確率を、ユーザ属性ごとに算出する。事前確率は、ユーザがあるユーザ属性を有する確率である。事前確率とは、ユーザ情報格納手段101に格納されているすべてのユーザ情報において、特定のユーザ属性を有するユーザの割合のことである。事前確率は、ユーザ情報格納手段101に格納されているすべての情報のうち、ユーザ情報から取得できるあらゆる集合の割合であっても良い。例えば、ユーザ属性に性別が含まれている場合には、事前確率は、ユーザ属性が示す性別が男性である割合、すなわちユーザが男性である確率であっても良く、ユーザ属性が示す性別が女性である割合、すなわちユーザが女性である確率であっても良い。ユーザが男性である事前確率は、例えば、次のようにして算出することができる。なお、男性のユーザ数は、ユーザ属性「男性」に対応するユーザ識別子の個数(ユニーク数)であっても良く、全ユーザ数は、ユーザ識別子の個数(ユニーク数)であっても良い。
事前確率=男性のユーザ数/全ユーザ数
また、例えば、ユーザ属性に年齢や年代が含まれている場合には、事前確率は、ユーザ属性が示す年齢や年代が20代である割合、すなわちユーザが20代である確率等であっても良い。
なお、事前確率算出手段103は、ユーザ識別子を用いて、同一のユーザを2回以上カウントせずに事前確率を算出することが好適である。また、事前確率算出手段103は、デバイスの種類ごとに履歴情報が異なる場合は、デバイスの種類ごとに事前確率を算出しても良い。例えば、事前確率算出手段103は、タブレットを使用しているユーザが男性である確率を算出しても良い。また、事前確率算出手段103は、ユーザ属性を変換して事前確率を算出しても良い。例えば、ユーザ属性が23歳である場合に、20代に変換しても良く、20歳以上30歳未満等に変換しても良い。また、事前確率算出手段103は、算出した事前確率を何の事前確率かを識別する識別子(例えば、「男性」、「女性」や「20代」、「30代」等)と対応付けて、算出用情報格納手段102に蓄積しても良い。
尤度算出手段104は、複数のユーザ情報を用いて、あるユーザ属性を有するユーザが、あるイベントを行った確率である尤度を算出する。尤度算出手段104が算出する尤度は、ユーザ属性およびイベントの組み合わせごとの割合である。尤度は、ユーザ情報格納手段101に格納されている特定のユーザ属性を有するユーザ情報において、特定のイベントが含まれる割合である。例えば、尤度は、ユーザ属性「男性」を有するユーザ情報において、特定のウェブページの閲覧の履歴が含まれる割合であっても良く、特定の検索キーワードの履歴が含まれる割合であっても良く、特定の広告の選択の履歴が含まれる割合であっても良い。具体的には、ユーザ属性「男性」を有するユーザが、ウェブページAを閲覧した確率である尤度は、次のようになる。
尤度=男性のユーザによってウェブページAが閲覧された回数/男性のユーザによってウェブページが閲覧された総数
また同様に、ユーザ属性「男性」を有するユーザが、検索キーワードBで検索した確率である尤度は、次のようになる。
尤度=男性のユーザによって検索キーワードBで検索された回数/男性のユーザによって検索がなされた総数
このように、尤度を算出する際の分子は、特定のユーザ属性を有するユーザが、特定のイベントを行った回数である。また、その分母は、その特定のユーザ属性を有するユーザが、分子のイベントを含むイベントの種類に関するイベントを行った総数である。イベントの種類とは、例えば、ウェブページの閲覧や、検索キーワードの入力、広告の選択等である。したがって、上述したように、分子が特定のユーザ属性を有するユーザによる「ウェブページAの閲覧」であれば、分母は、特定のユーザ属性を有するユーザによる「ウェブページの閲覧総数」となる。
なお、上記尤度の例は、ユーザ属性が女性である場合、ユーザ属性が示す年齢が20代である場合、ユーザ属性が示す家族構成が4人である場合等、ユーザ属性に含まれるあらゆる属性に関する各割合であっても良い。なお、尤度は、割合の値が0にならないようにスムージングした値であっても良い。スムージングは、加算スムージングであっても良く、ヒューリスティックな手法を用いたスムージングであっても良い。例えば、加算スムージングを行った尤度は、分子が、あるユーザ属性を有するユーザが特定のイベントを行った回数(例えば、男性のユーザによってウェブページAが閲覧された回数)とNとの和であり、分母が、あるユーザ属性を有するユーザが、そのイベントの属するイベントの種類に関する各イベントを行った総数(例えば、男性のユーザによってウェブページが閲覧された総数)と、N×(そのイベントの種類における異なるイベント数)との和である。なお、そのイベントの種類における異なるイベント数とは、そのイベントの種類におけるイベントのユニーク数を示す。つまり、異なるイベント数の数え方は、履歴情報に3つのウェブページの識別子がある場合には、3個と数える。例えば、イベントの種類がウェブページの閲覧である場合には、そのウェブページの閲覧に関する異なるイベント数は、履歴情報に含まれるウェブページの識別子のユニーク数であり、イベントの種類が検索キーワードの入力である場合には、その検索キーワードの入力に関する異なるイベント数は、履歴情報に含まれる検索キーワードのユニーク数である。また、Nは、1以上の自然数であるものとする。加算スムージングを含む各スムージングの手法は、公知技術であるため、詳細な説明を省略する。
なお、尤度算出手段104は、ユーザ識別子を用いて、同一のユーザを2回以上カウントせずに尤度を算出することが好適である。この場合は、尤度算出手段104は、同じユーザ識別子に対応している履歴情報をマージして尤度を算出することが好適である。尤度算出手段104は、例えば、同一のユーザ識別子に対応する異なる履歴情報がある場合には、その履歴情報を合成しても良い。例えば、尤度算出手段104は、同一のユーザ識別子に対応する一方の履歴情報がウェブページの識別子「ページA」を有し、他方の履歴情報がウェブページの識別子「ページB」を有している場合に、そのユーザ識別子に対応するユーザ属性が、ウェブページの識別子「ページA」と「ページB」の2つのウェブページを閲覧したことを示す履歴情報として扱っても良い。また、尤度算出手段104は、デバイスの種類ごとに履歴情報が異なる場合は、デバイスの種類ごとに尤度を算出しても良い。例えば、尤度算出手段104は、タブレットを使用している男性のユーザが、ウェブページAを閲覧した尤度を算出しても良い。また、尤度算出手段104は、ユーザ属性を変換して尤度を算出しても良い。例えば、ユーザ属性が23歳である場合に、20代に変換しても良く、20歳以上30歳未満等に変換しても良い。また、尤度算出手段104は、算出した尤度を何の尤度かを識別する識別子(例えば、「ユーザ属性:男性、イベント:ページA」、「ユーザ属性:20代、イベント:検索キーワードX」等)と対応付けて、算出用情報格納手段102に蓄積しても良い。
受付手段105は、イベントの履歴情報とユーザ属性とを有する算出対象情報を受け付ける。また、受付手段105は、デバイスの種類を示すデバイス種類情報をも有する算出対象情報を受け付けても良い。受付手段105は、マウスやキーボード等の入力デバイスを介してユーザ属性を受け付けても良い。また、受付手段105は、図示しない格納手段に格納されている算出対象情報を受け付けても良い。また、受付手段105は、有線または無線の通信回線を介して算出対象情報を受信しても良い。通信回線は、例えば、インターネットやイントラネット、LAN(Local Area Network)、公衆電話回線等である。また、受付手段105は、算出対象情報のうち、履歴情報を入力デバイスや通信デバイスを介して受け付け、ユーザ属性は、図示しない格納手段から読み出しても良い。その格納手段では、ユーザ全体に対応する各ユーザ属性が記憶されており、受付手段105は、そのユーザ全体に対応する各ユーザ属性を順次、読み出すことによって、算出対象情報を受け付けても良い。例えば、その格納手段で、ユーザ属性「男性」、「女性」が格納されていても良く、ユーザ属性「10歳未満」、「10代」、「20代」、…、「80代」、「90代」、「100歳以上」が格納されていても良い。そして、受付手段105は、例えば、イベントの履歴情報を受信した場合に、その履歴情報と、ユーザ属性「男性」とを含む算出対象情報と、その履歴情報と、ユーザ属性「女性」とを含む算出対象情報とを受け付けても良い。このようにすることで、受け付けたイベントの履歴情報に対応する各ユーザ属性の事後確率を算出することができるようになる。
事後確率算出手段106は、事後確率を算出する。事後確率は、受付手段105が受け付けた算出対象情報が有する履歴情報に含まれる各イベントを行ったユーザが、算出対象情報に含まれるユーザ属性を有する確率である。なお、事後確率算出手段106は、事後確率を、事前確率および尤度を用いて、ナイーブベイズ法によって算出する。事後確率算出手段106は、具体的には、履歴情報に含まれるイベント1〜MをそれぞれN1〜NM回ずつ行ったユーザが、ユーザ属性Aを有する事後確率を、次のように算出しても良い。
事後確率∝P(イベント1/ユーザ属性A)N1
×P(イベント2/ユーザ属性A)N2×…
×P(イベントM−1/ユーザ属性A)N(M−1)
×P(イベントM/ユーザ属性A)NM×P(ユーザ属性A)
ここで、P(ユーザ属性A)は、ユーザがユーザ属性Aを有する事前確率であり、P(イベント1/ユーザ属性A)等は、ユーザ属性Aを有するユーザが、イベント1を行った尤度である。したがって、事後確率算出手段106は、上記右辺の値を、事前確率算出手段103が算出した事前確率や、尤度算出手段104が算出した尤度を用いて算出できる。なお、上記右辺は、事後確率に比例する値であるため、後述するように正規化を行っても良い。また、その右辺の値は、事後確率に応じた値であるため、正規化前事後確率と呼ぶことにする。ここで、事後確率に応じた値とは、事後確率にある値を掛けた値であると考えても良い。その「ある値」は、ナイーブベイズ法における分母の逆数であっても良い。また、ナイーブベイズ法は、公知技術であるため、その詳細な説明については省略する。
また、確率の積によって事後確率を算出した場合には、計算誤差が大きくなるため、事後確率算出手段106は、事後確率の対数を算出するようにしても良い。すなわち、事後確率算出手段106は、事後確率の対数を次のように算出しても良い。
log(事後確率)∝N1×log(P(イベント1/ユーザ属性A))
+N2×log(P(イベント2/ユーザ属性A))+…
+N(M−1)×log(P(イベントM−1/ユーザ属性A))
+NM×log(P(イベントM/ユーザ属性A))
+log(P(ユーザ属性A))
なお、このようにして算出した上記右辺の値を正規化前事後確率としても良く、このようにして算出した値をlogの真数にした値を正規化前事後確率としても良い。
なお、事後確率算出手段106は、前述のように、正規化前事後確率を用いて、算出対象情報に対応する正規化前事後確率を正規化することによって、その算出対象情報に対応する事後確率を算出しても良い。この場合は、事後確率算出手段106は、受付手段105が受け付けた算出対象情報に含まれるユーザ属性を、ユーザ全体に対応するユーザ属性の集合から除いた集合に含まれる各ユーザ属性についても正規化前事後確率を算出しても良い。なお、算出対象情報に含まれるユーザ属性と、そのユーザ属性をユーザ全体に対応するユーザ属性の集合から除いた集合に含まれる各ユーザ属性とによって、全ユーザをカバーできるものとする。また、ユーザ全体に対応するユーザ属性の集合に含まれるユーザ属性は、その集合の他のユーザ属性と重複していないことが好適である。また、ユーザ全体に対応するユーザ属性の集合は、例えば、「男性、女性」であっても良く、「20歳未満、20歳以上40歳未満、40歳以上」等であっても良い。例えば、算出対象情報にユーザ属性「男性」が含まれている場合には、ユーザ全体に対応するユーザ属性の集合{男性、女性}から、そのユーザ属性「男性」を除いた集合は、ユーザ属性「女性」となる。また、例えば、算出対象情報にユーザ属性「10代」が含まれている場合には、ユーザ全体に対応するユーザ属性の集合{10歳未満、10代、20代、30代…}から、そのユーザ属性「10代」を除いたユーザ属性の集合は{10歳未満、20代、30代…}となる。また、事後確率算出手段106は、算出対象情報に対応する正規化前事後確率を、全ユーザに対応する正規化前事後確率の和で割ることによって、その算出対象情報に対応する正規化前事後確率を正規化しても良い。その正規化後の値が、その算出対象情報に対応する事後確率となる。なお、正規化前事後確率を、logを用いて算出した場合は、その正規化前事後確率をlogの真数とした正規化前事後確率を用いて正規化しても良い。また、事後確率算出手段106は、算出対象情報に含まれるユーザ属性と補集合の関係にあるユーザ属性に関する正規化前事後確率を算出することによって、正規化を行うということもできる。
また、事後確率算出手段106は、受け付けた算出対象情報のユーザ属性を変換しても良い。例えば、ユーザ属性が23歳である場合に、20代に変換しても良く、20歳以上30歳未満等に変換しても良い。なお、事後確率算出手段106は、デバイスの種類ごとに履歴情報が異なる場合は、受付手段105が受け付けた算出対象情報に含まれるデバイス種類情報の示すデバイスの種類に応じた事前確率および尤度を用いて、デバイスの種類に対応する事後確率を算出しても良い。例えば、事後確率算出手段106は、算出対象情報に含まれる履歴情報の各イベントを、タブレットを用いて行ったユーザが、算出対象情報に含まれるユーザ属性を有する事後確率を算出しても良い。
判断手段107は、受付手段105が受け付けた算出対象情報に含まれるイベントの履歴の各イベントを行ったユーザが、算出対象情報に含まれるユーザ属性を有するかどうかを、算出対象情報に応じて算出された事後確率が、あらかじめ決められた閾値より大きいかどうかによって判断する。あらかじめ決められた閾値は、例えば、経験的に定められた数値であっても良く、計算で得られた数値であっても良い。あらかじめ決められた閾値は、例えば、開発者や管理者等が設定しても良い。その閾値は、図示しない記録媒体に格納されており、判断手段107は、それを読み出して使用しても良い。また、判断手段107は、事後確率があらかじめ決められた閾値を超えた場合にそのユーザ属性を有すると判断しても良い。
出力手段108は、事後確率算出手段106が算出した事後確率に関する出力を行う。出力手段108は、例えば、事後確率そのものを出力しても良く、事後確率に対する判断結果、すなわち判断手段107による判断結果を出力しても良く、事後確率に関するその他の出力を行っても良い。本実施の形態では、出力手段108が、事後確率に対する判断結果を出力する場合について主に説明する。
なお、出力手段108が出力する情報を用いて、事後確率算出装置1以外の図示しない装置において、広告の引き当てに用いられても良い。図示しない装置は、ユーザ情報に対応付けられた広告が格納されており、事後確率があらかじめ決められた閾値以上のユーザ属性に対応する広告を選択する装置であっても良い。
ユーザ情報格納手段101、および算出用情報格納手段102は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。なお、ユーザ情報格納手段101にユーザ情報が記憶される過程は問わない。例えば、記録媒体を介してユーザ情報がユーザ情報格納手段101で記憶されるようになっても良く、通信回線等を介して送信されたユーザ情報がユーザ情報格納手段101で記憶されるようになっても良く、あるいは、入力デバイスを介して入力されたユーザ情報がユーザ情報格納手段101で記憶されるようになっても良い。
事前確率算出手段103、尤度算出手段104、事後確率算出手段106、判断手段107、および出力手段108は、通常、MPUやメモリ等から実現され得る。事前確率算出手段103の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
出力手段108は、ディスプレイへの表示、プロジェクターを用いた投影、スピーカー等への出力、プリンタでの印字、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラム等への処理結果の引渡し等を行っても良い。
次に、事後確率算出装置1の動作について図2のフローチャートを用いて説明する。
(ステップS201)事前確率算出手段103は、事前確率を算出するかどうか判断する。そして、事前確率を算出する場合には、ステップS202へ進み、そうでない場合には、ステップS204に進む。なお、事前確率算出手段103は、例えば、事前確率を算出すると定期的(例えば、1日ごとや、1週間ごと等)に判断しても良く、算出用情報格納手段102に事前確率が格納されていない場合に事前確率を算出すると判断しても良い。
(ステップS202)事前確率算出手段103は、ユーザ情報格納手段101に格納されているユーザ情報を用いて、デバイスの種類ごとに、すべてのユーザ属性に対応する事前確率を算出する。
(ステップS203)事前確率算出手段103は、ステップS202で算出したすべての事前確率を算出用情報格納手段102に蓄積する。そして、ステップS201へ戻る。なお、事前確率算出手段103は、デバイスの種類ごとに、またユーザ属性ごとに事前確率の算出と、蓄積とを繰り返しても良い。その場合には、デバイスの種類ごと、またユーザ属性ごとに、ステップS202,S203の処理が繰り返して実行されることになる。
(ステップS204)尤度算出手段104は、尤度を算出するかどうか判断する。そして、尤度を算出する場合には、ステップS205に進み、そうでない場合には、ステップS207に進む。なお、尤度算出手段104は、例えば、尤度を算出すると定期的(例えば、1日ごとや、1週間ごと等)に判断しても良く、算出用情報格納手段102に尤度が格納されていない場合に尤度を算出すると判断しても良い。
(ステップS205)尤度算出手段104は、ユーザ情報格納手段101に格納されているユーザ情報を用いて、デバイスの種類ごとに、すべてのユーザ属性とイベントとの組み合わせに対応する尤度を算出する。
(ステップS206)尤度算出手段104は、ステップS205で算出したすべての尤度を算出用情報格納手段102に蓄積する。そして、ステップS201へ戻る。なお、尤度算出手段104は、デバイスの種類ごとに、またユーザ属性ごとに尤度の算出と、蓄積とを繰り返しても良い。その場合には、デバイスの種類ごと、またユーザ属性ごとに、ステップS205,S206の処理が繰り返して実行されることになる。
(ステップS207)受付手段105は、算出対象情報を受け付けたかどうかを判断する。算出対象情報を受け付けた場合は、ステップS208へ進み、受け付けなかった場合は、ステップS201へ戻る。
(ステップS208)事後確率算出手段106は、ステップS202で算出された事前確率と、ステップS205で算出された尤度とを用いて、ステップS207で受け付けた算出対象情報に含まれるユーザ属性に関する正規化前事後確率を算出する。
(ステップS209)事後確率算出手段106は、ステップS202で算出された事前確率と、ステップS205で算出された尤度とを用いて、ステップS207で受け付けた算出対象情報に含まれるユーザ属性の補集合に含まれるすべてのユーザ属性の正規化前事後確率を算出する。
(ステップS210)事後確率算出手段106は、ステップS208,S209で算出した正規化前事後確率を用いて、算出対象情報に含まれるユーザ属性に関する正規化前事後確率を正規化することによって、そのユーザ属性に関する事後確率を算出する。
(ステップS211)判断手段107は、ステップS210で算出した事後確率が、あらかじめ決められた閾値以上であるかどうかを判断する。
(ステップS212)出力手段108は、ステップS210における判断結果を出力する。そして、ステップS201へ戻る。
なお、ステップS207において、受付手段105は、履歴情報を受け付けた場合に、図示しない格納手段からユーザ属性を読み出すことによって、算出対象情報、すなわち履歴情報とユーザ属性とを受け付けても良い。また、履歴情報を受け付けた場合に、受付手段105は、ユーザ全体に対応する各ユーザ属性を図示しない格納手段から順次、読み出し、各ユーザ属性についてステップS208からステップS212の処理を繰り返すことによって、受け付けた履歴情報の各イベントを実行したユーザが、ユーザ全体に対応する各ユーザ属性を有するかどうかの判断を行っても良い。そのようにすることで、例えば、ある履歴情報に対応するユーザは、「男性」であるが「女性」ではないと判断されたり、「10代」、「20代」、「30代」であるが、「10歳未満」、「40代」、「50代」、…ではないと判断されたりすることになる。また、図2のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
以下、本実施の形態における事後確率算出装置1の具体的な動作について説明する。本具体例において、算出用情報格納手段102には、データが格納されていないものとする。また、本具体例において、ユーザ属性は、そのユーザ属性が示すユーザが男性か女性かを示す情報であるとする。また、本具体例において、履歴情報は、閲覧したウェブページを識別する情報であるとする。
本具体例において、ユーザ情報格納手段101に格納されているユーザ情報は、図3で示されているものであるとする。図3のテーブルは、ユーザ識別子とユーザ属性とデバイス種類情報と履歴情報とを有している。例えば、図3のテーブルに含まれる1番目のユーザ情報(レコード)は、「ユーザ識別子:1」、「ユーザ属性:男性」、「デバイス種類情報:スマートフォン」、および「履歴情報:ページA」を有している。このユーザ情報は、ユーザ識別子「1」で識別されるユーザが男性であり、スマートフォンを用いてページAを閲覧したことを示しているものとする。この図3のテーブルに含まれるユーザ情報は、例えば、検索エンジンやポータルサイト等のユーザIDを有しているユーザの情報であっても良い。そして、そのユーザ属性は、そのユーザID取得時にユーザが入力したものであり、また履歴情報は、ユーザがユーザIDでログインした状態で検索や閲覧を行った際に取得された情報であっても良い。
ユーザが、事後確率算出装置1を起動し、処理を開始させたとする。事前確率算出手段103は、ユーザ情報格納手段101に格納されているユーザ情報を用いて、デバイスの種類情報ごとに、すべてのユーザ属性に対応する事前確率を算出する(ステップS201からステップS202)。そして、事前確率算出手段103は、算出された事前確率を算出用情報格納手段102に蓄積する(ステップS203)。例えば、図4の1番目から4番目のレコードは、そのようにして蓄積された情報である。
尤度算出手段104は、ユーザ情報格納手段101に格納されているユーザ情報を用いて、デバイスの種類情報ごとに、すべてのユーザ属性とイベントとの組み合わせに対応する尤度を算出する(ステップS204からステップS205)。そして、尤度算出手段104は、算出した尤度を算出用情報格納手段102に蓄積する(ステップS206)。例えば、図4の識別する情報「男性がページAを閲覧する尤度」や「スマートフォン:男性がページAを閲覧する尤度」を含むレコードは、そのようにして蓄積された情報である。
その後、あるユーザがウェブページを閲覧しており、そのユーザに対して広告引当を行うことになったとする。すると、そのユーザの使用しているデバイスのデバイス種類情報「スマートフォン」と、履歴情報{ページA:4,ページB:1,ページC:3・・・}とが事後確率算出装置1に渡される。なお、デバイス種類情報は、ユーザエージェントを用いて取得することができる。また、履歴情報は、Cookie等を用いて取得することができる。事後確率算出装置1の受付手段105は、そのデバイス種類情報および履歴情報を受け付けると、図示しない格納手段で格納されているユーザ属性「男性」を読み出すことによって、デバイス種類情報「スマートフォン」と、履歴情報{ページA:4,ページB:1,ページC:3・・・}と、ユーザ属性「男性」とを含む算出対象情報を受け付ける(ステップS207)。すると、事後確率算出手段106は、算出対象情報に含まれるユーザ属性「男性」に関する正規化前事後確率「1.34」と、ユーザ属性「男性」の補集合であるユーザ属性「女性」に関する正規化前事後確率「0.66」とを取得する(ステップS208からステップS209)。また、事後確率算出手段106は、それらの正規化前事後確率を用いて、ユーザ属性「男性」に関する正規化前事後確率を正規化し、ユーザ属性「男性」に対応する事後確率「0.67」(=1.34/(1.34+0.66))を算出する(ステップS210)。事後確率算出手段106は、同様の処理をユーザ属性「女性」についても実行し、ユーザ属性「女性」に対応する事後確率「0.33」を算出する(ステップS208〜S212)。
判断手段107は、事後確率算出手段106による事後確率の算出が終了すると、その事後確率が、閾値「0.6」より大きいかどうかどうかを判断する(ステップS210)。判断手段107は、ユーザ属性「男性」に対応する事後確率「0.67」が、閾値「0.6」より大きいことから、算出対象情報の履歴情報が男性のものであると判断する。また、判断手段107は、ユーザ属性「女性」に対応する事後確率「0.33」が、閾値「0.6」より小さいことから、算出対象情報の履歴情報が女性のものではないと判断する。そして、出力手段108は、その判断結果を、広告引当を行う装置に引渡すと共に、事後確率算出装置1のディスプレイに、図5で示されるように表示する。なお、広告引当を行う装置では、受け取った判断結果に応じて、ユーザに対して男性向けの広告を引き当てることになる。
なお、本具体例では、図3で示されるように、一の履歴情報に一のウェブページの識別子が含まれている場合について説明したが、そうでなくても良い。一の履歴情報に二以上のウェブページの識別子が含まれていてもよいことは言うまでもない。また、本具体例において、ユーザ属性「男性」の補集合であるユーザ属性「女性」に関する正規化前事後確率「0.66」を一時的に記憶しておき、それを用いることによって、ユーザ属性「女性」に対応する事後確率を算出しても良い。
以上のように、本実施の形態による事後確率算出装置1によれば、例えば、ユーザIDを登録していないユーザについても、そのユーザの履歴情報を用いることにより、そのユーザがあるユーザ属性を有する確率を算出することができる。また、事後確率算出手段106があらかじめ計算されている事前確率や尤度を用いて事後確率を算出することにより、短時間で事後確率を算出することができる。また、事後確率算出手段106が正規化を行って事後確率を算出することによって、ナイーブベイズ法における分母を計算することなく事後確率を算出することができる。また、ユーザ情報格納手段101がデバイスごとにユーザ情報を格納されることにより、事後確率算出手段106はデバイスごとの事後確率も算出することができるようになる。例えば、デバイスごとに閲覧傾向の異なるユーザに対しても、精度の高い推定が可能となる。また、判断手段107が閾値を用いて判断することにより、ユーザがあるユーザ属性を有するかどうかを判断できる。したがって、その判断結果を用いて、広告引当等を行うこともできるようになる。また、上述のように事前確率や尤度を算出する際には、ユーザ情報を用いて単に分子や分母の数を数えるだけで算出することができるため、ループに対応できないソフトウェアを用いることも可能となる。
また、本実施の形態において、算出用情報格納手段102を含む場合について説明したが、事後確率算出装置1は、算出用情報格納手段102を含まなくても良い。事後確率算出装置1が算出用情報格納手段102を含まない場合は、事前確率算出手段103と尤度算出手段104とは、算出した各確率を、外部の格納装置に蓄積しても良く、受付手段105が算出対象情報を受け付ける度に算出しても良い。
また、本実施の形態において、判断手段107を含む場合について説明したが、事後確率算出装置1は、判断手段107を含まなくても良い。事後確率算出装置1が判断手段107を含まない場合は、出力手段108は、事後確率算出手段106が算出した事後確率を出力しても良い。
また、本実施の形態では、事後確率算出手段106が正規化前事後確率を正規化することによって事後確率を算出する場合について主に説明したが、そうでなくても良い。ナイーブベイズ法における分母をも算出し、正規化前事後確率をその分母で割ることによって、事後確率を算出しても良い。
また、本実施の形態における事後確率算出装置1を実現するソフトウェアは、以下のようなプログラムである。つまり、プログラムは、ユーザを識別するユーザ識別子と、ユーザのユーザ属性と、ユーザがウェブページに関して行ったイベントの履歴である履歴情報とを対応付ける情報であるユーザ情報が複数格納されるユーザ情報格納手段にアクセス可能なコンピュータを、複数のユーザ情報を用いて、ユーザがあるユーザ属性を有する確率である事前確率を、ユーザ属性ごとに算出する事前確率算出手段、複数のユーザ情報を用いて、あるユーザ属性を有するユーザが、あるイベントを行った確率である尤度を、ユーザ属性およびイベントの組み合わせごとに算出する尤度算出手段、イベントの履歴情報とユーザ属性とを有する算出対象情報を受け付ける受付手段、受付手段が受け付けた算出対象情報が有する履歴情報に含まれる各イベントを行ったユーザが、算出対象情報に含まれるユーザ属性を有する確率である事後確率を、事前確率および尤度を用いて、ナイーブベイズ法によって算出する事後確率算出手段、事後確率算出手段が算出した事後確率に関する出力を行う出力手段として機能させるためのプログラムである。
なお、本実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されても良く、または、複数の装置によって分散処理されることによって実現されても良い。また、本実施の形態において、一の装置に存在する2以上の通信手段は、物理的に一の手段で実現されても良いことは言うまでもない。
また、本実施の形態において、各構成要素は、専用のハードウェアにより構成されても良く、または、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されても良い。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行手段が読み出して実行することによって、各構成要素が実現され得る。
なお、上記プログラムにおいて、上記プログラムが実現する機能には、ハードウェアでしか実現できない機能は含まれない。例えば、情報を取得する取得手段や、情報を出力する出力手段等におけるモデムやインターフェースカード等のハードウェアでしか実現できない機能は、上記プログラムが実現する機能には含まれない。
図6は、上記プログラムを実行して、上記実施の形態による本発明を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェアおよびその上で実行されるコンピュータプログラムによって実現され得る。
図6において、コンピュータシステム1100は、CD−ROMドライブ1105、FDドライブ1106を含むコンピュータ1101と、キーボード1102と、マウス1103と、モニタ1104とを備える。
図7は、コンピュータシステム1100の内部構成を示す図である。図7において、コンピュータ1101は、CD−ROMドライブ1105、FDドライブ1106に加えて、MPU1111と、ブートアッププログラム等のプログラムを蓄積するためのROM1112と、MPU1111に接続され、アプリケーションプログラムの命令を一時的に蓄積すると共に、一時記憶空間を提供するRAM1113と、アプリケーションプログラム、システムプログラム、およびデータを蓄積するハードディスク1114と、MPU1111と、ROM1112等を相互に接続するバス1115とを備える。なお、コンピュータ1101は、LANへの接続を提供する図示しないネットワークカードを含んでいても良い。
コンピュータシステム1100に、上記実施の形態による本発明等の機能を実行させるプログラムは、CD−ROM1121、またはFD1122に蓄積されて、CD−ROMドライブ1105、またはFDドライブ1106に挿入され、ハードディスク1114に転送されても良い。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ1101に送信され、ハードディスク1114に蓄積されても良い。プログラムは実行の際にRAM1113にロードされる。なお、プログラムは、CD−ROM1121やFD1122、またはネットワークから直接、ロードされても良い。
プログラムは、コンピュータ1101に、上記実施の形態による本発明の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいても良い。コンピュータシステム1100がどのように動作するのかについては周知であり、詳細な説明は省略する。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。また、本発明における各手段の「手段」は、「部」や「回路」と読み替えても良い。
以上のように、本発明にかかる事後確率算出装置等は、事後確率を短時間で取得できるという効果を有し、あるイベントを行ったユーザが、そのユーザ属性を有する事後確率を算出する事後確率算出装置等として有用である。
1 事後確率算出装置
101 ユーザ情報格納手段
102 算出用情報格納手段
103 事前確率算出手段
104 尤度算出手段
105 受付手段
106 事後確率算出手段
107 判断手段
108 出力手段

Claims (7)

  1. ユーザを識別するユーザ識別子と、当該ユーザのユーザ属性と、当該ユーザがウェブページに関して行ったイベントの履歴である履歴情報とを対応付ける情報であるユーザ情報が複数格納されるユーザ情報格納手段と、
    前記複数のユーザ情報を用いて、ユーザがあるユーザ属性を有する確率である事前確率を、ユーザ属性ごとに算出する事前確率算出手段と、
    前記複数のユーザ情報を用いて、あるユーザ属性を有するユーザが、あるイベントを行った確率である尤度を、ユーザ属性およびイベントの組み合わせごとに算出する尤度算出手段と、
    イベントの履歴情報とユーザ属性とを有する算出対象情報を受け付ける受付手段と、
    前記受付手段が受け付けた算出対象情報が有する履歴情報に含まれる各イベントを行ったユーザが、当該算出対象情報に含まれるユーザ属性を有する確率である事後確率を、前記事前確率および前記尤度を用いて、ナイーブベイズ法によって算出する事後確率算出手段と、
    前記事後確率算出手段が算出した事後確率に関する出力を行う出力手段と、を備えた事後確率算出装置。
  2. 前記事後確率算出手段は、
    前記算出対象情報に対応する事後確率に応じた値である正規化前事後確率を算出し、
    前記受付手段が受け付けた算出対象情報に含まれるユーザ属性を、ユーザ全体に対応するユーザ属性の集合から除いた集合に含まれる各ユーザ属性についても正規化前事後確率を算出し、当該正規化前事後確率を用いて、当該算出対象情報に対応する正規化前事後確率を正規化することによって当該算出対象情報に対応する事後確率を算出する、請求項1記載の事後確率算出装置。
  3. 前記イベントの履歴は、イベントの行われたデバイスの種類ごとのイベントの履歴であり、
    前記事前確率算出手段は、デバイスの種類ごとに事前確率を算出し、
    前記尤度算出手段は、デバイスの種類ごとに尤度を算出し、
    前記受付手段は、デバイスの種類を示すデバイス種類情報をも有する算出対象情報を受け付け、
    前記事後確率算出手段は、前記受付手段が受け付けた算出対象情報に含まれるデバイス種類情報の示すデバイスの種類に応じた事前確率および尤度を用いて、当該デバイスの種類に対応する事後確率を算出する、請求項1または請求項2記載の事後確率算出装置。
  4. 前記イベントは、ウェブページの閲覧、および検索キーワードの入力の少なくとも一方である、請求項1から請求項3のいずれか記載の事後確率算出装置。
  5. 前記受付手段が受け付けた算出対象情報に含まれるイベントの履歴の各イベントを行ったユーザが、当該算出対象情報に含まれるユーザ属性を有するかどうかを、当該算出対象情報に応じて算出された事後確率が、あらかじめ決められた閾値より大きいかどうかによって判断する判断手段をさらに備え、
    前記出力手段は、前記判断手段による判断結果を出力する、請求項1から請求項4のいずれか記載の事後確率算出装置。
  6. ユーザを識別するユーザ識別子と、当該ユーザのユーザ属性と、当該ユーザがウェブページに関して行ったイベントの履歴である履歴情報とを対応付ける情報であるユーザ情報が複数格納されるユーザ情報格納手段と、事前確率算出手段と、尤度算出手段と、受付手段と、事後確率算出手段と、出力手段とを用いて処理される確率算出方法であって、
    前記事前確率算出手段が、前記複数のユーザ情報を用いて、ユーザがあるユーザ属性を有する確率である事前確率を、ユーザ属性ごとに算出する事前確率算出ステップと、
    前記尤度算出手段が、前記複数のユーザ情報を用いて、あるユーザ属性を有するユーザが、あるイベントを行った確率である尤度を、ユーザ属性およびイベントの組み合わせごとに算出する尤度算出ステップと、
    前記受付手段が、イベントの履歴情報とユーザ属性とを有する算出対象情報を受け付ける受付ステップと、
    前記事後確率算出手段が、前記受付ステップで受け付けた算出対象情報が有する履歴情報に含まれる各イベントを行ったユーザが、当該算出対象情報に含まれるユーザ属性を有する確率である事後確率を、前記事前確率および前記尤度を用いて、ナイーブベイズ法によって算出する事後確率算出ステップと、
    前記出力手段が、前記事後確率算出ステップで算出した事後確率に関する出力を行う出力ステップと、を備えた事後確率算出方法。
  7. ユーザを識別するユーザ識別子と、当該ユーザのユーザ属性と、当該ユーザがウェブページに関して行ったイベントの履歴である履歴情報とを対応付ける情報であるユーザ情報が複数格納されるユーザ情報格納手段にアクセス可能なコンピュータを、
    前記複数のユーザ情報を用いて、ユーザがあるユーザ属性を有する確率である事前確率を、ユーザ属性ごとに算出する事前確率算出手段、
    前記複数のユーザ情報を用いて、あるユーザ属性を有するユーザが、あるイベントを行った確率である尤度を、ユーザ属性およびイベントの組み合わせごとに算出する尤度算出手段、
    イベントの履歴情報とユーザ属性とを有する算出対象情報を受け付ける受付手段、
    前記受付手段が受け付けた算出対象情報が有する履歴情報に含まれる各イベントを行ったユーザが、当該算出対象情報に含まれるユーザ属性を有する確率である事後確率を、前記事前確率および前記尤度を用いて、ナイーブベイズ法によって算出する事後確率算出手段、
    前記事後確率算出手段が算出した事後確率に関する出力を行う出力手段として機能させるためのプログラム。
JP2013192521A 2013-09-18 2013-09-18 事後確率算出装置、事後確率算出方法、およびプログラム Active JP5891213B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013192521A JP5891213B2 (ja) 2013-09-18 2013-09-18 事後確率算出装置、事後確率算出方法、およびプログラム
US14/329,048 US20150081431A1 (en) 2013-09-18 2014-07-11 Posterior probability calculating apparatus, posterior probability calculating method, and non-transitory computer-readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013192521A JP5891213B2 (ja) 2013-09-18 2013-09-18 事後確率算出装置、事後確率算出方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2015060331A JP2015060331A (ja) 2015-03-30
JP5891213B2 true JP5891213B2 (ja) 2016-03-22

Family

ID=52668823

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013192521A Active JP5891213B2 (ja) 2013-09-18 2013-09-18 事後確率算出装置、事後確率算出方法、およびプログラム

Country Status (2)

Country Link
US (1) US20150081431A1 (ja)
JP (1) JP5891213B2 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2529150B (en) 2014-08-04 2022-03-30 Darktrace Ltd Cyber security
US9699205B2 (en) * 2015-08-31 2017-07-04 Splunk Inc. Network security system
GB2547202B (en) 2016-02-09 2022-04-20 Darktrace Ltd An anomaly alert system for cyber threat detection
US10027671B2 (en) * 2016-06-16 2018-07-17 Ca, Inc. Restricting access to content based on a posterior probability that a terminal signature was received from a previously unseen computer terminal
US10032116B2 (en) * 2016-07-05 2018-07-24 Ca, Inc. Identifying computer devices based on machine effective speed calibration
CN106202049A (zh) * 2016-07-18 2016-12-07 合网络技术(北京)有限公司 一种热词确定方法及装置
US10692127B1 (en) 2016-10-12 2020-06-23 Amazon Technologies, Inc. Inferring user demographics from user behavior using Bayesian inference
US10237294B1 (en) 2017-01-30 2019-03-19 Splunk Inc. Fingerprinting entities based on activity in an information technology environment
CA3034176A1 (en) 2018-02-20 2019-08-20 Timothy BAZALGETTE An artificial intelligence cyber security analyst
US11477222B2 (en) 2018-02-20 2022-10-18 Darktrace Holdings Limited Cyber threat defense system protecting email networks with machine learning models using a range of metadata from observed email communications
US11924238B2 (en) 2018-02-20 2024-03-05 Darktrace Holdings Limited Cyber threat defense system, components, and a method for using artificial intelligence models trained on a normal pattern of life for systems with unusual data sources
US11985142B2 (en) 2020-02-28 2024-05-14 Darktrace Holdings Limited Method and system for determining and acting on a structured document cyber threat risk
US11962552B2 (en) 2018-02-20 2024-04-16 Darktrace Holdings Limited Endpoint agent extension of a machine learning cyber defense system for email
US11463457B2 (en) 2018-02-20 2022-10-04 Darktrace Holdings Limited Artificial intelligence (AI) based cyber threat analyst to support a cyber security appliance
JP7112896B2 (ja) * 2018-06-22 2022-08-04 株式会社Nttドコモ 推定装置
US10986121B2 (en) 2019-01-24 2021-04-20 Darktrace Limited Multivariate network structure anomaly detector
EP3786823A1 (en) 2019-08-29 2021-03-03 Darktrace Limited An endpoint agent extension of a machine learning cyber defense system for email
CN110706029A (zh) * 2019-09-26 2020-01-17 恩亿科(北京)数据科技有限公司 广告定向投放方法和装置、电子设备及存储介质
JP7099719B2 (ja) * 2019-10-29 2022-07-12 Necプラットフォームズ株式会社 表示装置、表示システム、表示制御方法及び表示制御プログラム
WO2021171093A1 (en) 2020-02-28 2021-09-02 Darktrace, Inc. Cyber security for a software-as-a-service factoring risk
IL295937A (en) 2020-02-28 2022-10-01 Darktrace Holdings Ltd Red team of AI opponents
CN113158234B (zh) * 2021-03-29 2022-09-27 上海雾帜智能科技有限公司 一种安全事件发生频率量化方法、装置、设备及介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0013011D0 (en) * 2000-05-26 2000-07-19 Ncr Int Inc Method and apparatus for determining one or more statistical estimators of customer behaviour
US7162522B2 (en) * 2001-11-02 2007-01-09 Xerox Corporation User profile classification by web usage analysis
US8364540B2 (en) * 2005-09-14 2013-01-29 Jumptap, Inc. Contextual targeting of content using a monetization platform
US7818290B2 (en) * 2006-06-14 2010-10-19 Identity Metrics, Inc. System to associate a demographic to a user of an electronic system
JP4808207B2 (ja) * 2007-12-11 2011-11-02 ヤフー株式会社 広告配信装置、広告配信方法、広告配信プログラム及び広告入札方法
US10075554B2 (en) * 2012-12-20 2018-09-11 Facebook, Inc. Detecting mobile device attributes

Also Published As

Publication number Publication date
US20150081431A1 (en) 2015-03-19
JP2015060331A (ja) 2015-03-30

Similar Documents

Publication Publication Date Title
JP5891213B2 (ja) 事後確率算出装置、事後確率算出方法、およびプログラム
US10277480B2 (en) Method, apparatus, and system for determining a location corresponding to an IP address
KR101999471B1 (ko) 정보 추천 방법 및 장치
JP5916959B2 (ja) 動的データ取得方法およびシステム
JP5485311B2 (ja) 広告評価装置、広告評価方法およびプログラム
EP2407897A1 (en) Device for determining internet activity
JP2016522475A (ja) 複数ヴァージョンをテストするための方法及びデバイス
EP2941724A1 (en) Method and apparatus for generating webpage content
US20120066359A1 (en) Method and system for evaluating link-hosting webpages
CN103530292A (zh) 网页显示方法和装置
US9633103B2 (en) Identifying product groups in ecommerce
CN105069036A (zh) 一种信息推荐方法及装置
US20150095202A1 (en) Recommending Product Groups in Ecommerce
US20110029377A1 (en) System and method for forecasting an inventory of online advertisement impressions by sampling in a map-reduce framework
JP5425941B2 (ja) 広告評価装置、広告評価方法およびプログラム
JP6870467B2 (ja) 広告効果推定装置、広告効果推定方法及び広告効果推定プログラム
US20110015951A1 (en) Evaluation of website visitor based on value grade
JP5312083B2 (ja) 広告決定方法及び装置
JP6956564B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US20160055203A1 (en) Method for record selection to avoid negatively impacting latency
JP2020154880A (ja) 算出装置、算出方法及び算出プログラム
WO2011035059A1 (en) Determining usage of computing devices that store state information on host computer systems
JP6034584B2 (ja) 特許調査支援装置、特許調査支援方法、およびプログラム
AU2015298135A1 (en) Method and system for performing online advertisement monitoring
JP2020154879A (ja) 決定装置、決定方法及び決定プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160222

R150 Certificate of patent or registration of utility model

Ref document number: 5891213

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350