JP4907712B2 - デモグラフィック情報推定装置及びその方法 - Google Patents

デモグラフィック情報推定装置及びその方法 Download PDF

Info

Publication number
JP4907712B2
JP4907712B2 JP2009250944A JP2009250944A JP4907712B2 JP 4907712 B2 JP4907712 B2 JP 4907712B2 JP 2009250944 A JP2009250944 A JP 2009250944A JP 2009250944 A JP2009250944 A JP 2009250944A JP 4907712 B2 JP4907712 B2 JP 4907712B2
Authority
JP
Japan
Prior art keywords
user
information
demographic
query
demographic information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009250944A
Other languages
English (en)
Other versions
JP2011096099A (ja
Inventor
麻紀 富田
慎平 牧本
慶太 箱田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2009250944A priority Critical patent/JP4907712B2/ja
Publication of JP2011096099A publication Critical patent/JP2011096099A/ja
Application granted granted Critical
Publication of JP4907712B2 publication Critical patent/JP4907712B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、デモグラフィック情報推定装置及びその方法に関する。
従来より、ネットワークに接続された端末を利用する複数のユーザの情報、すなわち、デモグラフィック情報を統計的に処理して、マーケティングに役立てる手法が提案されている。
例えば、Web物販サイトに対するユーザ端末のアクセス履歴と購入履歴とを記憶し、このアクセス履歴と購入履歴とに基づいて、物販対象商品の販売数予測を行うマーケティングシステムが提案されている(特許文献1参照)。
特許文献1で提案されるマーケティングシステムでは、Web物販サイトに対してアクセスしたユーザ端末を利用するユーザのデモグラフィック情報を利用して、限定された属性における販売促進対象商品を特定する。
具体的には、特許文献1で提案されるマーケティングシステムは、Web物販サイトにおけるユーザ端末からのアクセス履歴と、購入履歴とから解析して得た、時系列相関係数、1次回帰係数、時系列相関係数周期関数に基づいて、相関周期、相関持続時間、相関レベル等を算出する。続いて、このマーケティングシステムは、相関周期、相関持続時間、相関レベルに基づいて、ユーザ端末を利用する各ユーザを点数化するとともに、各ユーザのデモグラフィック情報に基づいて、デモグラフィック毎に各ユーザを分類する。続いて、このマーケティングシステムは、デモグラフィック毎に分類されたユーザの、商品に対するアクセス頻度及び購入頻度を算出する。続いて、このマーケティングシステムは、アクセス頻度及び購入頻度の高い商品順に、デモグラフィック毎の嗜好商品順位を決定することで、販売促進対象商品を特定する。
このように、特許文献1で提案されるマーケティングシステムは、Web物販サイトにおけるユーザ端末からのアクセス履歴と、購入履歴と、ユーザ端末を利用するユーザのデモグラフィック情報とから、デモグラフィック毎に商品販売予測を行うことができる。
特開2002−157394号公報
しかしながら、特許文献1で提案されるマーケティングシステムでは、ユーザ端末を利用するユーザに、デモグラフィック情報が関連付けられていることを前提として、デモグラフィック毎に商品販売予測を行っている。このため、デモグラフィック情報が関連付けられていないユーザが利用するユーザ端末から、Web物販サイトに対する、アクセス履歴及び購入履歴を取得できたとしても、このアクセス履歴及び購入履歴に基づいて商品販売予測を行うことはできなかった。
本発明は、デモグラフィック情報の複数の要素の少なくとも一部が関連付けられていないユーザのデモグラフィック情報を推定できるデモグラフィック情報推定装置及びその方法を提供することを目的とする。
(1) ユーザ端末を利用するユーザの特性を分類する複数の要素から構成されるデモグラフィック情報を推定するデモグラフィック情報推定装置であって、不特定のユーザが使用する各々の前記ユーザ端末より、Webページの検索を行う検索エンジンに入力されたクエリと、該クエリを入力した前記ユーザの識別情報と、を関連付けて検索ログとして記憶する検索ログ記憶手段と、前記デモグラフィック情報の前記複数の要素の全てと関連付けられている前記ユーザの識別情報と、該デモグラフィック情報の前記複数の要素の少なくとも一部が関連付けられていない前記ユーザの識別情報と、を記憶するユーザ情報記憶手段と、前記検索ログ記憶手段に記憶されている前記検索ログに含まれる前記クエリと、該クエリに対応する前記ユーザの識別情報に関連付けられているデモグラフィック情報とに基づいて、前記クエリ毎に、該クエリと関連付けられるデモグラフィック情報の要素の値を、該要素毎に集計する第1集計手段と、前記第1集計手段により集計した前記要素毎の集計値をデモグラフィック分布情報として記憶する分布情報記憶手段と、前記検索ログ記憶手段に記憶されている検索ログから、前記デモグラフィック情報の前記複数の要素の少なくとも一部が関連付けられていない前記ユーザの識別情報に対応する前記検索ログを抽出する抽出手段と、前記抽出手段により抽出された前記ユーザの識別情報のそれぞれに対して、該識別情報に対応する前記クエリの前記デモグラフィック分布情報の値を、前記デモグラフィック情報の要素毎に集計する第2集計手段と、前記第2集計手段により集計された前記ユーザの識別情報のそれぞれの集計値で、所定の条件を満たすデモグラフィック情報の要素に対応する特性を、前記抽出手段により抽出された前記ユーザの識別情報に対応する前記ユーザの特性と推定する推定手段と、を備えるデモグラフィック情報推定装置。
(1)のデモグラフィック情報推定装置は、第1集計手段により、クエリ毎に、該クエリと関連付けられるデモグラフィック情報の要素の値を、該要素毎に集計し、分布情報記憶手段により、第1集計手段が集計した要素毎の集計値をデモグラフィック分布情報として記憶する。また、このデモグラフィック情報推定装置は、抽出手段により、デモグラフィック情報の複数の要素の少なくとも一部が関連付けられていないユーザの識別情報に対応する検索ログを抽出し、第2集計手段により、抽出手段により抽出されたユーザの識別情報のそれぞれに対して、該識別情報に対応するクエリのデモグラフィック分布情報の値を、デモグラフィック情報の要素毎に集計し、推定手段により、第2集計手段が集計したユーザの識別情報のそれぞれの集計値で、所定の条件を満たすデモグラフィック情報の要素に対応する特性を、抽出手段により抽出されたユーザの識別情報に対応するユーザの特性と推定する。
このように、デモグラフィック情報推定装置は、不特定ユーザが使用したクエリに対するデモグラフィック分布情報を生成するので、クエリとデモグラフィック情報とを統計的に関連付けることができる。そして、このデモグラフィック情報推定装置は、デモグラフィック情報の複数の要素の少なくとも一部と識別情報とが関連付けられていないユーザが使用したクエリのデモグラフィック分布情報を集計し、この集計値により、このユーザのデモグラフィック情報を推定するので、デモグラフィック情報の複数の要素の少なくとも一部が関連付けられていないユーザの特性、すなわち、デモグラフィック情報を推定できる。
(2) デモグラフィック情報推定装置が、ユーザ端末を利用するユーザの特性を分類する複数の要素から構成されるデモグラフィック情報を推定するデモグラフィック情報推定方法であって、不特定のユーザが使用する各々の前記ユーザ端末より、Webページの検索を行う検索エンジンに入力されたクエリと、該クエリを入力した前記ユーザの識別情報と、を関連付けて検索ログとして、前記デモグラフィック情報推定装置が備える検索ログ記憶手段に記憶させる検索ログ記憶ステップと、前記デモグラフィック情報の前記複数の要素の全てと関連付けられている前記ユーザの識別情報と、該デモグラフィック情報の前記複数の要素の少なくとも一部が関連付けられていない前記ユーザの識別情報と、を前記デモグラフィック情報推定装置が備えるユーザ情報記憶手段に記憶させるユーザ情報記憶ステップと、前記検索ログ記憶手段に記憶されている前記検索ログに含まれる前記クエリと、該クエリに対応する前記ユーザの識別情報に関連付けられているデモグラフィック情報とに基づいて、前記クエリ毎に、該クエリと関連付けられているデモグラフィック情報の要素の値を、該要素毎に集計する第1集計ステップと、前記第1集計ステップにより集計した前記要素毎の集計値をデモグラフィック分布情報として前記デモグラフィック情報推定装置が備える分布情報記憶手段に記憶させる分布情報記憶ステップと、前記検索ログ記憶手段に記憶されている検索ログから、前記デモグラフィック情報の前記複数の要素の少なくとも一部が関連付けられていない前記ユーザの識別情報に対応する前記検索ログを抽出する抽出ステップと、前記抽出ステップにより抽出された前記ユーザの識別情報のそれぞれに対して、該識別情報に対応する前記クエリの前記デモグラフィック分布情報の値を、前記デモグラフィック情報の要素毎に集計する第2集計ステップと、前記第2集計ステップにより集計された前記ユーザの識別情報のそれぞれの集計値で、所定の条件を満たすデモグラフィック情報の要素に対する特性を、前記抽出ステップにより抽出された前記ユーザの識別情報に対応する前記ユーザの特性と推定する推定手段と、を備えるデモグラフィック推定方法。
この方法によれば、(1)に係る発明と同様の効果を奏する。
本発明によれば、デモグラフィック情報が関連付けられていないユーザのデモグラフィック情報を推定できるデモグラフィック情報推定装置及び方法を提供できる。
本実施形態に係るデモグラフィック情報推定装置10が適用されたデモグラフィック情報推定システム1の全体構成図である。 本実施形態に係る検索ログDB131を示す図である。 本実施形態に係るユーザDB132を示す図である。 本実施形態に係る分布情報DB133を示す図である。 本実施形態のデモグラフィック情報推定装置10により、デモグラフィック情報が関連付けられていないユーザのデモグラフィック情報を推定する処理の流れを示すフローチャートである。
以下、本発明の一実施形態を図面に基づいて説明する。
本実施形態は、コンピュータ及びその周辺装置に適用される。本実施形態における各部は、コンピュータ及びその周辺装置が備えるハードウェア並びに当該ハードウェアを制御するソフトウェアによって構成される。
上記ハードウェアには、制御部としてのCPU(Central Processing Unit)の他、記憶部、通信装置、表示装置及び入力装置が含まれる。記憶部としては、例えば、メモリ(RAM:Random Access Memory、ROM:Read Only Memory等)、ハードディスクドライブ(HDD:Hard Disk Drive)及び光ディスク(CD:Compact Disk、DVD:Digital Versatile Disk等)ドライブが挙げられる。通信装置としては、例えば、各種有線及び無線インターフェース装置が挙げられる。表示装置としては、例えば、液晶ディスプレイやプラズマディスプレイ等の各種ディスプレイが挙げられる。入力装置としては、例えば、キーボード及びポインティング・デバイス(マウス、トラッキングボール等)が挙げられる。
上記ソフトウェアには、上記ハードウェアを制御するコンピュータ・プログラムやデータが含まれる。コンピュータ・プログラムやデータは、記憶部により記憶され、制御部により適宜実行、参照される。また、コンピュータ・プログラムやデータは、通信回線を介して配布されることも可能であり、CD−ROM等のコンピュータ可読媒体に記録して配布されることも可能である。
図1は、本実施形態に係るデモグラフィック情報推定装置10が適用されたデモグラフィック情報推定システム1の全体構成図である。
デモグラフィック情報推定システム1は、デモグラフィック情報推定装置10と、不特定のユーザが使用する各々のユーザ端末20と、を備える。
デモグラフィック情報推定装置10は、ネットワークNを介して、ユーザ端末20と接続可能である。
デモグラフィック情報推定装置10は、このデモグラフィック情報推定装置10の操作者から直接的な入力を受け付ける操作部11と、このデモグラフィック情報推定装置10の機能に関する情報を表示する表示部12と、デモグラフィック情報推定装置10として機能させるための各種プログラム(図示省略)及び本発明の機能を実行するプログラム(図示省略)等を記憶する記憶部13と、デモグラフィック情報推定装置10に係る各機能を統括的に制御する制御部14と、を備える。
操作部11は、例えば、キーボード及びポインティング・デバイス(マウス、トラッキングボール等)により実装される。
表示部12は、例えば、液晶ディスプレイやプラズマディスプレイ等の各種ディスプレイにより実装される。
記憶部13は、上述の各種プログラムの他に、Webページの検索に用いられた検索ログを記憶する検索ログ記憶手段としての検索ログDB131と、ユーザ端末20を使用するユーザに係る情報を記憶するユーザ情報記憶手段としてのユーザDB132と、検索ログに含まれるクエリのデモグラフィック分布情報を記憶する分布情報記憶手段としての分布情報DB133と、を備える。
図2は、本実施形態に係る検索ログDB131を示す図である。検索ログDB131は、ユーザ端末20より、Webページの検索を行う検索エンジンに入力されたクエリと、このクエリを入力したユーザの識別情報と、を関連付けて検索ログとして記憶する。この検索ログDB131は、検索に用いられたクエリを示すクエリ131Aと、クエリを使用したユーザの識別情報としての識別IDを示す識別ID131Bと、を含む。
図3は、本実施形態に係るユーザDB132を示す図である。ユーザDB132は、ユーザ端末20を使用するユーザの識別IDを記憶する。また、ユーザDB132は、ユーザの識別IDにデモグラフィック情報の複数の要素の全てが関連付けられている場合には、この識別IDとデモグラフィック情報とを記憶する。このユーザDB132は、ユーザの識別IDを示す識別ID132Aと、デモグラフィック情報を示すデモグラフィック情報132Bと、を含む。これらのデモグラフィック情報は、ユーザ端末20のCookieから予め抽出され、このユーザDB132に記憶されるものである。また、ユーザDB132は、ユーザの識別IDにデモグラフィック情報の複数の要素の少なくとも一部が関連付けられていない場合には、この識別IDと、この識別IDに関連付けられているデモグラフィック情報の要素とを記憶する。
デモグラフィック情報とは、ユーザの特性を示す情報の集合であり、性別、年齢、住所、職業といった特性情報である。ユーザDB132のデモグラフィック情報132Bには、これらの特性情報それぞれに対応する複数の要素(分類値)が含まれている。また、これらの要素の値は、ユーザのデモグラフィックに対応する場合は1に、対応しない場合は0に設定されている。このように、デモグラフィック情報132Bは、値が1又は0のいずれかである複数の要素から構成されている。また、ユーザの特性情報が不明である場合には、この特性情報の値は、Null値に設定されている。なお、本実施形態では、ユーザの特性情報が不明である場合には、この特性情報の値は、Null値に設定されていることとしたが、これに限らず、0に設定してもよい。
例えば、デモグラフィック情報132Bには、年齢情報として、10代を示す要素、20代を示す要素、30代を示す要素といった複数の要素が対応付けられており、ユーザが20代の場合には、20代を示す要素の値が1、それ以外の年代を示す要素が0に設定される。また、ユーザの年齢情報が不明、すなわち、識別IDに年齢情報が関連付けられていない場合には、このユーザの識別IDに対応する年齢情報を示す要素の全てがNull値に設定される。
図4は、本実施形態に係る分布情報DB133を示す図である。分布情報DB133は、検索に用いられたクエリに対応付けられるデモグラフィック情報を構成する複数の要素それぞれの値を、デモグラフィック情報を構成する要素毎に集計した値、すなわち、デモグラフィック分布情報を記憶する。この分布情報DB133は、検索に用いられたクエリを示すクエリ133Aと、集計値、すなわち、デモグラフィック分布情報を示すデモグラフィック分布133Bと、を含む。
図1に戻り、制御部14は、CPU等により構成されており、デモグラフィック情報推定装置10の各処理動作の制御や情報の通信制御を行う。この制御部14は、検索ログ抽出部141と、検索ログ記憶制御部142と、第1集計手段としての第1集計部143と、集計結果記憶制御部144と、抽出手段としての特定検索ログ抽出部145と、第2集計手段としての第2集計部146と、推定手段としての推定部147と、を備える。
検索ログ抽出部141は、ユーザ端末20から、検索ログを抽出する。より具体的には、検索ログ抽出部141は、ユーザ端末20から、検索ログを含むCookieを抽出する。なお、本実施形態では、検索ログ抽出部141は、Cookieに含まれる検索ログを抽出することとしたが、これに限らない。例えば、セッションログやクリックログに検索ログを記憶させておいて、検索ログ抽出部141は、これらのログから検索ログを抽出してもよい。
検索ログ記憶制御部142は、検索ログ抽出部141により抽出された検索ログを検索ログDB131に記憶させる。ここで、検索ログ記憶制御部142は、検索ログに含まれるクエリで、1回の検索において複数のクエリが使用されている場合には、複数のクエリのそれぞれと、ユーザの識別IDを関連付けて検索ログDB131に記憶させる。つまり、1回の検索において、クエリに「A」と「B」とが使用され、識別IDが「0000」である場合には、検索ログ記憶制御部142は、クエリとして「A」、識別IDとして「0000」を検索ログDB131に記憶させ、さらに、クエリとして「B」、識別IDとして「0000」を検索ログDB131に記憶させる。
第1集計部143は、検索ログに含まれるクエリと、このクエリに対応するユーザの識別IDに関連付けられているデモグラフィック情報とに基づいて、クエリ毎に、クエリと関連付けられるデモグラフィック情報の要素の値を、この要素毎に集計する。
具体的には、第1集計部143は、ユーザDB132を参照して、デモグラフィック情報の複数の要素の少なくとも一部が関連付けられている識別IDを抽出する。続いて、第1集計部143は、検索ログDB131より、この抽出された識別IDに一致する識別IDの検索ログを抽出する。続いて、第1集計部143は、抽出された検索ログのクエリに関連付けられるデモグラフィック情報を、デモグラフィック情報を構成する要素毎に集計する。
ここで、デモグラフィック情報を構成する要素の値は、1又は0である。例えば、デモグラフィック情報としてユーザの年齢区分(10代、20代・・・)が含まれ、クエリ「A」が検索に複数回使用されている場合には、第1集計部143は、クエリ「A」の使用された回数を、年齢区分を示す要素毎に集計する。
集計結果記憶制御部144は、第1集計部143により集計された値をデモグラフィック分布情報として分布情報DB133に記憶させる。
特定検索ログ抽出部145は、検索ログDB131に記憶されている検索ログから、デモグラフィック情報の複数の要素の少なくとも一部が関連付けられていないユーザの識別IDに対応する検索ログを抽出する。具体的には、特定検索ログ抽出部145は、ユーザDB132を参照して、デモグラフィック情報の複数の要素の少なくとも一部が関連付けられていない識別IDを抽出する。続いて、特定検索ログ抽出部145は、検索ログDB131より、この抽出された識別IDに一致する識別IDの検索ログを抽出する。
第2集計部146は、特定検索ログ抽出部145により抽出されたユーザの識別IDのそれぞれに対して、この識別IDに対応するクエリのデモグラフィック分布情報の値を、デモグラフィック情報の要素毎に集計する。具体的には、第2集計部146は、特定検索ログ抽出部145により抽出された識別ID毎に、分布情報DB133から、この識別IDに関連付けられるクエリのデモグラフィック分布情報を抽出する。続いて、第2集計部146は、抽出したデモグラフィック分布情報に含まれるデモグラフィック分布の値を、デモグラフィック情報の要素毎に集計する。
推定部147は、第2集計部146により集計されたユーザの識別IDのそれぞれの集計値で、所定の条件を満たすデモグラフィック情報の要素に対応する特性を、特定検索ログ抽出部145により抽出されたユーザの識別IDに対応するユーザの特性と推定する。具体的には、第2集計部146により集計されたデモグラフィック分布の集計値は、デモグラフィック情報を構成する要素毎に集計されている。推定部147は、同一の特性情報に対応する複数の要素の集計値の中で、最も値が高い要素に対応する特性をユーザの特性と推定する。
なお、本実施形態では、推定部147は、同一の特定情報に対する複数の要素の集計値の中で、最も値が高い要素に対応する特性をユーザの特性と推定したが、これに限らない。例えば、デモグラフィック情報推定装置10に、特性毎に使用頻度が異なるクエリと、この特性とを関連付けて記憶する辞書テーブルを備え、推定部147は、複数の要素の集計値の中で、値が相対的に高い要素が複数ある場合に、これらの要素に対応する特性と関連付けられているクエリを辞書テーブルより抽出する。そして、推定部147は、抽出したクエリがユーザが使用しているクエリに含まれていたり、使用頻度が高い場合に、抽出したクエリに対応する特性をユーザの特性と推定してもよい。このようにすることで、デモグラフィック情報推定装置10は、単に値が高い要素に基づいてユーザの特性を推定するだけでなく、辞書も用いてユーザの特性を推定するので、推定の精度を高めることができる。
デモグラフィック情報にユーザの年齢区分が含まれている場合の推定部147の処理について説明する。年齢情報を示す要素の全てがNull値に設定されているデモグラフィック情報に対応する識別IDに対して、第2集計部146によりデモグラフィック分布が集計されているとする。集計されたデモグラフィック分布のうち、年齢区分に対応する要素の集計値が、10代=34、20代=79、30代=28、40代=8、50代以上=21である場合、推定部147は、集計値が最も高い要素、すなわち、20代を、この識別IDに対応するデモグラフィック情報と推定する。
次にデモグラフィック情報推定装置10の処理について説明する。図5は、本実施形態のデモグラフィック情報推定装置10により、デモグラフィック情報が関連付けられていないユーザのデモグラフィック情報を推定する処理の流れを示すフローチャートである。
ステップS1では、制御部14(検索ログ抽出部141)は、ユーザ端末20より、検索ログを抽出する。
ステップS2では、制御部14(検索ログ記憶制御部142)は、ステップS1にて抽出された検索ログを検索ログDB131に記憶させる。
ステップS3では、制御部14(第1集計部143)は、ユーザDB132を参照して、デモグラフィック情報の複数の要素の少なくとも一部が関連付けられている識別IDを抽出する。
ステップS4では、制御部14(第1集計部143)は、ステップS3にて抽出された識別IDに対応する検索ログを検索ログDB131より抽出する。
ステップS5では、制御部14(第1集計部143)は、ステップS4にて抽出された検索ログに含まれるクエリに関連付けられるデモグラフィック情報を集計する。具体的には、制御部14(第1集計部143)は、クエリに関連付けられるデモグラフィック情報を、デモグラフィック情報を構成する要素毎に集計する。
ステップS6では、制御部14(集計結果記憶制御部144)は、ステップS5にて集計された値をクエリ毎のデモグラフィック分布情報として、分布情報DB133に記憶させる。
ステップS7では、制御部14(特定検索ログ抽出部145)は、ユーザDB132を参照して、デモグラフィック情報の複数の要素の少なくとも一部が関連付けられていない識別IDを抽出する。ここで抽出される識別IDは、1又は複数存在するものとする。
ステップS8では、制御部14(特定検索ログ抽出部145)は、ステップS7にて抽出された識別IDに対応する検索ログを検索ログDB131より抽出する。
ステップS9では、制御部14(第2集計部146)は、ステップS7にて抽出された識別ID毎に、分布情報DB133から、デモグラフィック情報の複数の要素の少なくとも一部に関連付けられていない識別IDに対応するデモグラフィック分布情報を抽出する。具体的には、制御部14(第2集計部146)は、ステップS7にて抽出された識別IDに対応するユーザが使用したクエリを、ステップS8にて抽出された検索ログから抽出し、抽出したクエリに対応するデモグラフィック分布情報を、分布情報DB133から抽出する。
ステップS10では、制御部14(第2集計部146)は、ステップS9にて抽出されたデモグラフィック分布情報を集計する。具体的には、制御部14(第2集計部146)は、抽出したデモグラフィック分布情報に含まれるデモグラフィック分布の値を、デモグラフィック情報の要素毎に集計する。
ステップS11では、制御部14(推定部147)は、ステップS10にて集計された値において、同一の特性情報に対応する複数の要素のそれぞれの集計値の中で、最も値が高い要素の特性を、ユーザの特性と推定する。
本実施形態によれば、デモグラフィック情報推定装置10は、第1集計部143により、クエリ毎に、該クエリと関連付けられるデモグラフィック情報の要素の値を、この要素毎に集計し、分布情報DB133により、第1集計部143が集計した値をデモグラフィック分布情報として記憶する。また、このデモグラフィック情報推定装置10は、特定検索ログ抽出部145により、デモグラフィック情報の要素の少なくとも一部が関連付けられていないユーザの識別IDに対応する検索ログを抽出し、第2集計部146により、特定検索ログ抽出部145により抽出されたユーザの識別IDのそれぞれに対して、この識別IDに対応するクエリのデモグラフィック分布情報の値を、デモグラフィック情報の要素毎に集計し、推定部147により、第2集計部146が集計したユーザの識別情報のそれぞれの集計値で、所定の条件を満たすデモグラフィック情報の要素に対応する特性を、特定検索ログ抽出部145により抽出されたユーザの識別IDに対応するユーザの特性と推定する。
このように、デモグラフィック情報推定装置10は、不特定ユーザが使用したクエリに対するデモグラフィック分布情報を生成するので、クエリとデモグラフィック情報とを統計的に関連付けることができる。そして、このデモグラフィック情報推定装置10は、デモグラフィック情報の複数の要素の少なくとも一部と識別情報とが関連付けられていないユーザが使用したクエリのデモグラフィック分布情報を集計し、この集計値により、このユーザの特性を推定するので、デモグラフィック情報の複数の要素の少なくとも一部が関連付けられていないユーザの特性、すなわち、デモグラフィック情報を推定できる。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
1 デモグラフィック情報推定システム
10 デモグラフィック情報推定装置
11 操作部
12 表示部
13 記憶部
14 制御部
20 ユーザ端末
131 検索ログDB
132 ユーザDB
133 分布情報DB
141 検索ログ抽出部
142 検索ログ記憶制御部
143 第1集計部
144 集計結果記憶制御部
145 特定検索ログ抽出部
146 第2集計部
147 推定部
N ネットワーク

Claims (2)

  1. ユーザ端末を利用するユーザの特性を分類する複数の要素から構成されるデモグラフィック情報を推定するデモグラフィック情報推定装置であって、
    不特定のユーザが使用する各々の前記ユーザ端末より、Webページの検索を行う検索エンジンに入力されたクエリと、該クエリを入力した前記ユーザの識別情報と、を関連付けて検索ログとして記憶する検索ログ記憶手段と、
    前記デモグラフィック情報の前記複数の要素の全てと関連付けられている前記ユーザの識別情報と、該デモグラフィック情報の前記複数の要素の少なくとも一部が関連付けられていない前記ユーザの識別情報と、を記憶するユーザ情報記憶手段と、
    前記検索ログ記憶手段に記憶されている前記検索ログに含まれる前記クエリと、該クエリに対応する前記ユーザの識別情報に関連付けられているデモグラフィック情報とに基づいて、前記クエリ毎に、該クエリと関連付けられるデモグラフィック情報の要素の値を、該要素毎に集計する第1集計手段と、
    前記第1集計手段により集計した前記要素毎の集計値をデモグラフィック分布情報として記憶する分布情報記憶手段と、
    前記検索ログ記憶手段に記憶されている検索ログから、前記デモグラフィック情報の前記複数の要素の少なくとも一部が関連付けられていない前記ユーザの識別情報に対応する前記検索ログを抽出する抽出手段と、
    前記抽出手段により抽出された前記ユーザの識別情報のそれぞれに対して、該識別情報に対応する前記クエリの前記デモグラフィック分布情報の値を、前記デモグラフィック情報の要素毎に集計する第2集計手段と、
    前記第2集計手段により集計された前記ユーザの識別情報のそれぞれの集計値で、所定の条件を満たすデモグラフィック情報の要素に対応する特性を、前記抽出手段により抽出された前記ユーザの識別情報に対応する前記ユーザの特性と推定する推定手段と、を備えるデモグラフィック情報推定装置。
  2. デモグラフィック情報推定装置が、ユーザ端末を利用するユーザの特性を分類する複数の要素から構成されるデモグラフィック情報を推定するデモグラフィック情報推定方法であって、
    不特定のユーザが使用する各々の前記ユーザ端末より、Webページの検索を行う検索エンジンに入力されたクエリと、該クエリを入力した前記ユーザの識別情報と、を関連付けて検索ログとして、前記デモグラフィック情報推定装置が備える検索ログ記憶手段に記憶させる検索ログ記憶ステップと、
    前記デモグラフィック情報の前記複数の要素の全てと関連付けられている前記ユーザの識別情報と、該デモグラフィック情報の前記複数の要素の少なくとも一部が関連付けられていない前記ユーザの識別情報と、を前記デモグラフィック情報推定装置が備えるユーザ情報記憶手段に記憶させるユーザ情報記憶ステップと、
    前記検索ログ記憶手段に記憶されている前記検索ログに含まれる前記クエリと、該クエリに対応する前記ユーザの識別情報に関連付けられているデモグラフィック情報とに基づいて、前記クエリ毎に、該クエリと関連付けられているデモグラフィック情報の要素の値を、該要素毎に集計する第1集計ステップと、
    前記第1集計ステップにより集計した前記要素毎の集計値をデモグラフィック分布情報として前記デモグラフィック情報推定装置が備える分布情報記憶手段に記憶させる分布情報記憶ステップと、
    前記検索ログ記憶手段に記憶されている検索ログから、前記デモグラフィック情報の前記複数の要素の少なくとも一部が関連付けられていない前記ユーザの識別情報に対応する前記検索ログを抽出する抽出ステップと、
    前記抽出ステップにより抽出された前記ユーザの識別情報のそれぞれに対して、該識別情報に対応する前記クエリの前記デモグラフィック分布情報の値を、前記デモグラフィック情報の要素毎に集計する第2集計ステップと、
    前記第2集計ステップにより集計された前記ユーザの識別情報のそれぞれの集計値で、所定の条件を満たすデモグラフィック情報の要素に対する特性を、前記抽出ステップにより抽出された前記ユーザの識別情報に対応する前記ユーザの特性と推定する推定手段と、を備えるデモグラフィック推定方法。
JP2009250944A 2009-10-30 2009-10-30 デモグラフィック情報推定装置及びその方法 Active JP4907712B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009250944A JP4907712B2 (ja) 2009-10-30 2009-10-30 デモグラフィック情報推定装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009250944A JP4907712B2 (ja) 2009-10-30 2009-10-30 デモグラフィック情報推定装置及びその方法

Publications (2)

Publication Number Publication Date
JP2011096099A JP2011096099A (ja) 2011-05-12
JP4907712B2 true JP4907712B2 (ja) 2012-04-04

Family

ID=44112917

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009250944A Active JP4907712B2 (ja) 2009-10-30 2009-10-30 デモグラフィック情報推定装置及びその方法

Country Status (1)

Country Link
JP (1) JP4907712B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8108245B1 (en) * 1999-09-17 2012-01-31 Cox Communications, Inc. Method and system for web user profiling and selective content delivery
JP2002157394A (ja) * 2000-11-20 2002-05-31 Sheena Kk ネットワークマーケティングシステム
JP2006127320A (ja) * 2004-10-29 2006-05-18 Solid Technology Kk 端末属性推定装置および端末属性推定方法
JP5034279B2 (ja) * 2006-03-15 2012-09-26 富士通株式会社 属性推定プログラムおよび属性情報提供システム

Also Published As

Publication number Publication date
JP2011096099A (ja) 2011-05-12

Similar Documents

Publication Publication Date Title
US10348550B2 (en) Method and system for processing network media information
JP6152173B2 (ja) 商品検索結果の順位付け
US9965522B2 (en) Mobile application search ranking
JP5551704B2 (ja) オンライン・マーケティング効率の評価
US20190311395A1 (en) Estimating click-through rate
US8171228B2 (en) Garbage collection in a cache with reduced complexity
JP2015515686A (ja) ネットワーク仮想ユーザリスク抑制方法およびシステム
KR101363171B1 (ko) 하이브리드 협업적 여과 방법을 이용한 코사인 유사도 기반 전문가 추천 장치 및 방법
US20170046735A1 (en) Visitor Identification based on Feature Selection
US20150095202A1 (en) Recommending Product Groups in Ecommerce
US20150095291A1 (en) Identifying Product Groups in Ecommerce
CN111966886A (zh) 对象推荐方法、对象推荐装置、电子设备及存储介质
CN106910135A (zh) 用户推荐方法及装置
JP2009244981A (ja) 解析装置、解析方法及び解析プログラム
US10394804B1 (en) Method and system for increasing internet traffic to a question and answer customer support system
CN110807667A (zh) 一种激活沉睡客户的方法和装置
KR101274759B1 (ko) 광고 시스템 및 광고 성과 평가 방법
KR101879829B1 (ko) 클릭 로그 데이터를 이용하여 이상 사용자를 검출하는 방법 및 장치
JP6702625B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP4907712B2 (ja) デモグラフィック情報推定装置及びその方法
JP6018541B2 (ja) 推薦ルール生成装置、推薦ルール生成方法および推薦ルール生成プログラム
US20160055203A1 (en) Method for record selection to avoid negatively impacting latency
JP2010282561A (ja) 情報処理装置、情報処理システム、情報処理方法および情報処理プログラム
JP6142617B2 (ja) 情報処理装置、情報処理方法及び情報処理用プログラム
CN111694872B (zh) 一种业务处置的数据化方案的提供方法及装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111220

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150120

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4907712

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350