JP5536531B2 - ユーザ属性推定装置、ユーザ属性推定方法、およびプログラム - Google Patents

ユーザ属性推定装置、ユーザ属性推定方法、およびプログラム Download PDF

Info

Publication number
JP5536531B2
JP5536531B2 JP2010111166A JP2010111166A JP5536531B2 JP 5536531 B2 JP5536531 B2 JP 5536531B2 JP 2010111166 A JP2010111166 A JP 2010111166A JP 2010111166 A JP2010111166 A JP 2010111166A JP 5536531 B2 JP5536531 B2 JP 5536531B2
Authority
JP
Japan
Prior art keywords
attribute
geographic
user attribute
item
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010111166A
Other languages
English (en)
Other versions
JP2011238169A (ja
Inventor
佳林 前橋
秀豪 桑野
行信 谷口
明人 阿久津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010111166A priority Critical patent/JP5536531B2/ja
Publication of JP2011238169A publication Critical patent/JP2011238169A/ja
Application granted granted Critical
Publication of JP5536531B2 publication Critical patent/JP5536531B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、デジタルサイネージ向け広告配信サービスなど屋外空間向けICT(Information and Communication Technology)サービスにおいて、駅や街などの場所の特徴を効率的に記述するために利用されるユーザ属性推定装置、ユーザ属性推定方法、およびプログラムに関する。
近年、屋外空間向けICTサービスが浸透している。例えば、位置情報を取得して知人と共有するICTサービスや、位置情報の取得だけでなく位置情報に合わせて自動的にお薦め情報を選択して携帯電話に配信するICTサービスなどが知られている。
なかでも、デジタルサイネージ(電子看板)の設置数は増加し、ネットワーク化の進行も顕著である。デジタルサイネージにおける広告配信は、時間と場所に合わせて最適化することが可能である。デジタルサイネージの設置数が増加すると、全て人手により最適化させるのは困難であるため、ある程度自動的に広告配信を最適化する必要がある。広告に関する情報は広告主より取得することが可能であるが、場所についての情報を得ることは困難である。そこで、デジタルサイネージ設置場所などの場所の特徴(以下、「場所特徴」という。)を自動的に記述・蓄積し、システムで活用可能にすることが必要である。
場所特徴は、地理属性とユーザ属性により構成される。地理属性とは、その場所周辺の施設に関する情報や天候についての情報など、建造物や自然環境等の地理的な特徴を示す情報をいう。ユーザ属性とは、その場所を往来する人々の基本属性や行動特性など、集団の典型的特徴を示す情報をいう。ユーザ属性は、年代、利用目的、同行者などいくつかの項目を持つ。現状では、ユーザ属性は調査等によりコストをかけて取得することが必要であり、これを自動化することが望まれている。ユーザ属性の記述に応用可能な従来技術としては、以下のものが挙げられる。
すなわち、ある場所に設置されたカメラの映像を解析し、往来する人々の年齢、性別等の属性を推定する映像解析技術が知られている。例えば、非特許文献1には、画像から人々のおおよその人数(混雑度)を推定する技術が開示されている。また、GPS(Global Positioning System)対応端末を利用して取得したデータを解析し、行動動線を抽出する位置情報解析技術も知られている(非特許文献2参照)。
杵渕哲也他、「画像処理による広告効果測定技術」、NTT技術ジャーナル2009.7、P16−19 西野正彬他、「滞在地情報からの行動パターン抽出方式の検討」、社団法人 情報処理学会 研究報告 IPSJ SIG Technical Report、2008−UBI−20 (10) 2008/11/13、P57−64
しかしながら、従来の映像解析技術によるとカメラを設置する必要があり、従来の位置情報解析技術によるとユーザがGPS端末を持ち歩き、位置情報を公開する必要がある。すなわち、従来技術によると設備やユーザ側の制約があるため、量的に十分なデータが得られにくく、ユーザ属性を多くの場所について取得することが困難である。
本発明は、上述した従来技術に鑑み、ユーザ属性を効率よく取得することができるユーザ属性推定装置、ユーザ属性推定方法、およびプログラムを提供することを目的とする。
上記目的を達成するため、第1の態様に係る発明は、ユーザ属性を推定するユーザ属性推定装置であって、既知のユーザ属性を蓄積する既知ユーザ属性蓄積部と、地理属性項目をユーザ属性との関連性の観点からツリー構造で蓄積するとともにそのツリー構造を構成する各ノードの参照番号を蓄積する地理属性項目構造蓄積部と、推定対象であるユーザ属性項目と前記ノードの参照番号との対応関係を示す情報を蓄積するユーザ属性−地理項目構造関係蓄積部と、前記既知ユーザ属性蓄積部に蓄積された既知のユーザ属性に基づいて地理属性とユーザ属性の関係を学習して学習モデルを生成するモデル生成部と、前記モデル生成部により生成された学習モデルに基づいて地理属性から未知のユーザ属性を推定するユーザ属性推定部とを備え、前記モデル生成部は、前記ユーザ属性−地理項目構造関係蓄積部を参照して推定対象であるユーザ属性項目に対応する前記ノードの参照番号を取得し、取得した前記ノードの参照番号に基づいて前記地理属性項目構造蓄積部に蓄積された地理属性項目を選択し、選択された地理属性項目を学習モデルに利用することを要旨とする。
第2の態様に係る発明は、第1の態様に係る発明において、前記モデル生成部は、推定対象であるユーザ属性項目に対応する前記ノードの参照番号の地理属性項目の中から、1つ以上選択した地理属性項目の組み合わせから学習モデルを生成し、複数の地理属性項目の組み合わせを試し、もっとも精度のよい地理属性項目の組み合わせを求めることを要旨とする。
また、上記目的を達成するため、第の態様に係る発明は、ユーザ属性を推定するユーザ属性推定方法であって、コンピュータが、既知のユーザ属性を既知ユーザ属性蓄積部に蓄積する既知ユーザ属性蓄積ステップと、地理属性項目をユーザ属性との関連性の観点からツリー構造で蓄積するとともにそのツリー構造を構成する各ノードの参照番号を地理属性項目構造蓄積部に蓄積する地理属性項目構造蓄積ステップと、推定対象であるユーザ属性項目と前記ノードの参照番号との対応関係を示す情報をユーザ属性−地理項目構造関係蓄積部に蓄積するユーザ属性−地理項目構造関係蓄積ステップと、前記既知ユーザ属性蓄積部に蓄積された既知のユーザ属性に基づいて地理属性とユーザ属性の関係を学習して学習モデルを生成するモデル生成ステップと、前記モデル生成ステップで生成された学習モデルに基づいて地理属性から未知のユーザ属性を推定するユーザ属性推定ステップとを実行し、前記モデル生成ステップでは、前記ユーザ属性−地理項目構造関係蓄積部を参照して推定対象であるユーザ属性項目に対応する前記ノードの参照番号を取得し、取得した前記ノードの参照番号に基づいて前記地理属性項目構造蓄積部に蓄積された地理属性項目を選択し、選択された地理属性項目を学習モデルに利用することを要旨とする。
第4の態様に係る発明は、第3の態様に係る発明において、前記モデル生成ステップでは、推定対象であるユーザ属性項目に対応する前記ノードの参照番号の地理属性項目の中から、1つ以上選択した地理属性項目の組み合わせから学習モデルを生成し、複数の地理属性項目の組み合わせを試し、もっとも精度のよい地理属性項目の組み合わせを求めることを要旨とする。
また、上記目的を達成するため、第の態様に係る発明は、ユーザ属性を推定するためのプログラムであって、既知のユーザ属性を既知ユーザ属性蓄積部に蓄積する既知ユーザ属性蓄積ステップと、地理属性項目をユーザ属性との関連性の観点からツリー構造で蓄積するとともにそのツリー構造を構成する各ノードの参照番号を地理属性項目構造蓄積部に蓄積する地理属性項目構造蓄積ステップと、推定対象であるユーザ属性項目と前記ノードの参照番号との対応関係を示す情報をユーザ属性−地理項目構造関係蓄積部に蓄積するユーザ属性−地理項目構造関係蓄積ステップと、前記既知ユーザ属性蓄積部に蓄積された既知のユーザ属性に基づいて地理属性とユーザ属性の関係を学習して学習モデルを生成するモデル生成ステップと、前記モデル生成ステップで生成された学習モデルに基づいて地理属性から未知のユーザ属性を推定するユーザ属性推定ステップとをコンピュータに実行させ、前記モデル生成ステップでは、前記ユーザ属性−地理項目構造関係蓄積部を参照して推定対象であるユーザ属性項目に対応する前記ノードの参照番号を取得し、取得した前記ノードの参照番号に基づいて前記地理属性項目構造蓄積部に蓄積された地理属性項目を選択し、選択された地理属性項目を学習モデルに利用することを要旨とする。
本発明によれば、ユーザ属性を効率よく取得することができるユーザ属性推定装置、ユーザ属性推定方法、およびプログラムを提供することができる。
本発明の実施の形態におけるユーザ属性推定装置の構成図である。 本発明の実施の形態における場所特徴の例を示す図である。 本発明の実施の形態におけるユーザ属性の説明図である。 本発明の実施の形態における地理属性項目構造蓄積部に蓄積されるデータの例を示す図である。 本発明の実施の形態におけるユーザ属性−地理項目構造関係蓄積部に蓄積されるデータの例を示す図である。 本発明の実施の形態における指標選択ルール蓄積部に蓄積されるデータの例を示す図である。 本発明の実施の形態における既知ユーザ属性蓄積部に蓄積されるデータの例を示す図である。 本発明の実施の形態におけるユーザ属性推定装置の動作を示すフローチャートである。 本発明の実施の形態における学習モデルを生成するステップを詳細に示すフローチャートである。
以下、本発明の実施の形態について図面を参照して詳細に説明する。
まず、本発明の実施の形態の概要を説明する。本発明の実施の形態では、地理属性とユーザ属性の関係性を利用してユーザ属性を推定する。すなわち、地理属性は、各種DBを参照することで、ユーザ属性よりは低コストに生成することが可能である。そこで、既知のユーザ属性を利用して、地理属性とユーザ属性の関係モデルを学習などの手法を用いて構築し、その学習モデルに基づいて未知のユーザ属性を推定する。
ここで、学習モデルに用いる変数(地理属性項目)の候補は多数に上るため、推定に効果のある変数を取捨選択する必要がある。しかし、学習等に用いるサンプル(既知のユーザ属性データ)を数千〜数万オーダーで収集することはコスト面から困難である。よって、少ないサンプルから学習モデルを構築しなければない。過学習等を防ぐために、学習モデルで用いられる変数は少ない方がよく、多数の変数候補から取捨選択を行い、少数の変数を選択する必要がある。すべての組合せを調べると、計算量が膨大になるからである。
そこで、変数の取捨選択を効率的に行うために、ユーザ属性との関連性の観点から地理属性項目をツリー構造として記述する。ユーザ属性の推定に対する効果が似ていると考えられる地理属性項目は同じノード下に配置し、変数選択の際に、同一ノードからは1つもしくは少数の変数のみ取捨選択の対象とする。これにより、効率よく推定に効果のある変数を選択することができる。推定するユーザ属性項目と、取捨選択対象にするツリー部分の対応関係は、あらかじめユーザ属性と地理属性の関係性の仮説もしくは実証結果より決めておく。この仮説の例については後述する。
図1は、本発明の実施の形態におけるユーザ属性推定装置の構成図である。このユーザ属性推定装置は、屋外空間向けICTサービスにおいて駅や街などの場所特徴(図2参照)を効率的に記述するために利用される装置であって、機能的には、指標蓄積部31と、地理属性項目構造蓄積部401と、ユーザ属性−地理項目構造関係蓄積部402と、指標選択部404と、指標選択ルール蓄積部405と、モデル生成部500と、場所ID−位置変換部504と、既知ユーザ属性蓄積部505と、入力部51と、ユーザ属性推定部600と、入力部61と、出力部62とを備えている。モデル生成部500には、変数選択部501と、アルゴリズム選択部502と、モデル蓄積部503とが含まれる。ユーザ属性推定部600には、モデル選択部601と、推定計算部602とが含まれる。
指標蓄積部31は、店舗情報、地価情報、乗換案内情報、催事情報、気象情報、時刻情報、曜日情報など(以下、「指標」という。)の各種外部DB(database)を蓄積する。地理属性項目構造蓄積部401は、地理属性項目をユーザ属性との関連性の観点からツリー構造で蓄積するとともに、そのツリー構造を構成する各ノードの参照番号を蓄積する。ユーザ属性−地理項目構造関係蓄積部402は、推定対象であるユーザ属性項目と、ノードの参照番号(以下、「ノード番号」という。)との対応関係を示す情報を蓄積する。指標選択部404は、指標選択ルール蓄積部405に蓄積された指標選択テーブルを参照し、地理属性項目構造蓄積部401とユーザ属性−地理項目構造関係蓄積部402の各変数群の計算に必要な指標を指標蓄積部31の各々のDBから取得する。指標選択ルール蓄積部405は、地理属性項目構造蓄積部401とユーザ属性−地理項目構造関係蓄積部402のsupply,context変数群の計算に必要な指標の種類と取得先アドレスの対応テーブルを蓄積する。モデル生成部500は、既知ユーザ属性蓄積部505に蓄積された既知のユーザ属性に基づいて地理属性とユーザ属性の関係を学習して学習モデルを生成する。具体的には、ユーザ属性−地理項目構造関係蓄積部402を参照して推定対象であるユーザ属性項目に対応するノード番号を取得し、取得したノード番号に基づいて地理属性項目構造蓄積部401に蓄積された地理属性項目を選択することにより、学習モデルで用いられる変数を取捨選択する。既に説明した通り、モデル生成部500には、変数選択部501とアルゴリズム選択部502とモデル蓄積部503とが含まれる。変数選択部501は、学習モデル構築に用いるsupply,context変数群の中から変数群の組合せをユーザ属性−地理項目構造関係蓄積部402を参照して決定する。また、supply,context変数群を構成する指標の選択も行う。アルゴリズム選択部502は、学習モデル構築に用いる関数/アルゴリズムを選択する。モデル蓄積部503は、変数選択部501とアルゴリズム選択部502により構築されたモデルを蓄積する。場所ID−位置変換部504は、ユーザ属性にふられている場所IDを位置情報(住所、緯度経度等)に変換する。既知ユーザ属性蓄積部505は、既知のユーザ属性とその場所IDを蓄積する。入力部51は、学習モデルを生成したいユーザ属性項目を入力する。入力部61は、推定したい場所とユーザ属性項目名、曜日・時間を入力する。ユーザ属性推定部600は、モデル生成部500により生成された学習モデルに基づいて地理属性から未知のユーザ属性を推定する。既に説明した通り、ユーザ属性推定部600には、モデル選択部601と推定計算部602とが含まれる。モデル選択部601は、モデル蓄積部503に蓄積された学習モデルより入力部61からの入力に合った学習モデルを選択する。推定計算部602は、モデル選択部601およびモデル生成部500を介して必要な変数を地理属性項目構造蓄積部401およびユーザ属性−地理項目構造関係蓄積部402より取得し、該当ユーザ属性の推定を行う。出力部62は、推定計算部602の推定結果を出力する。
次に、地理属性項目のツリー構造について説明する。ツリーの構成は、例えば以下のような仮説により決定することができる。
すなわち、ユーザ属性は広告配信に用いるので、広告接触シーンとしてはビジネスシーン、余暇シーン、家庭生活のシーンなどを想定することができる。例えば、「仕事上の移動中に広告を見る」「休日に遊びに行く途中に広告を見る」といったシーンである。シーンの違いは、その場所が一般に何をする場所であるかということと、時間帯などの場所以外の要因とに関係すると考え、図3に示すように、それぞれをsupply変数群とcontext変数群の2変数群により表現する。例えば、仕事中に訪れそうなオフィス数が多い場所であるかどうかはsupply変数で表現し、仕事中の可能性が高い時間帯であるかどうかはcontext変数で表現する。
ここで、supply変数群の構成変数について説明する。supply変数群は、その場所が一般に何をする場所であるかを表す。上述のように、例えば余暇シーン、ビジネスシーン、家庭生活のシーンを広告接触シーンとして想定し、「購買の機会」「娯楽の機会」「ビジネスの機会」「居住の機会」の多さを表現する以下の4種類の指数を用いてsupply変数群を表現してもよい。
supply変数群 ← { 購買指数、娯楽指数、ビジネス指数、居住指数}
以下、各指数を求めるにあたり、必要な指標の例を示す。指数の算出にあたっては、購買指数、娯楽指数、ビジネス指数、居住指数のうち用意できるだけのものを用意し、変数選択部501により最適なものを数個選出する。購買指数は、その場所における小売業年間売上高、流通小売チェーンの出店数、商業用地の平均地価などを表す。娯楽指数は、その場所における飲食チェーンの出店数、遊園地等大規模娯楽施設の有無などを表す。ビジネス指数は、その場所における従業者数、大企業事業所数、1事業所あたりの従業者数などを表す。居住指数は、その場所における世帯数、1世帯あたりの平均人員、総宅地面積などを表す。これらの指標は、市販されているDB、API(Application Program Interface)サービス、行政発行の統計資料、公示地価より入手することが可能である。
次いで、context変数群の構成変数について説明する。context変数群は、supply変数では表現できない、時間によって変化する変数により構成される。上述のように、例えば余暇シーン、ビジネスシーン、家庭生活のシーンを広告接触シーンとして想定し、余暇シーンとビジネスシーンの切り分けに有効な「曜日」や「時間帯」、余暇シーンの中でもどのような余暇シーンなのか(購買なのか娯楽なのかなど)の切り分けに有効な「気象情報」や「催事情報」いとった時間変動のある変数によりcontext変数群を構成してもよい。
context変数群 ← {曜日、時間帯、気象情報、催事情報}
以下、各指数を求めるにあたり、必要な指標の例を示す。指数の算出にあたっては、曜日、時間帯、気象情報、催事情報のうち用意できるだけのものを用意し、変数選択部501により最適なものを数個選出する。曜日は、平日・休日などを表す。時間帯は、朝(6:00−11:00)、昼(11:00−17:00)、夜(17:00−24:00)などを表す。催事情報は、周辺における催事開催時間帯、終了時間帯、催事のジャンルなどを表す。気象情報は、各時間帯における予想天候と気温を表す。これらの指標うち、曜日や時間帯はユーザ属性の観測時刻より算出し、その他は気象情報提供サービスや、各催事主催団体や催事会場の催事情報を参照することにより取得することが可能である。
図4は、地理属性項目構造蓄積部401に蓄積されるデータの例を示す図である。この図に示すように、ツリー構造を構成する各ノードにはノード番号が付されている。ここでは、supply変数群にはノード番号1、context変数群にはノード番号2、購買指数にはノード番号11、娯楽指数にはノード番号12、ビジネス指数にはノード番号13、居住指数にはノード番号14、曜日・時間帯にはノード番号21、気象情報にはノード番号22、催事情報には23がそれぞれ付されているものとする。
図5は、ユーザ属性−地理項目構造関係蓄積部402に蓄積されるデータの例を示す図である。この図に示すように、ユーザ属性−地理項目構造関係蓄積部402は、推定対象であるユーザ属性項目とノード番号との対応関係を示す情報を蓄積する。ノード番号は、モデル生成部500が変数選択に用いる変数の組合せを意味している。すなわち、モデル生成部500は、地理属性項目構造蓄積部401の地理属性項目のツリー構造を参照し、ノード番号で指定されたノードの地理属性項目を変数選択の対象とする。
図6は、指標選択ルール蓄積部405に蓄積されるデータの例を示す図である。この図に示すように、指標選択ルール蓄積部405は、ユーザ属性項目と、supply,context変数群の計算に必要な指標の組合せと、それら指標の取得先データベースのアドレスとの対応関係を示す情報を蓄積している。指標と取得先との対応は、あらかじめ取得先より提供される指標をもとに決めておく。取得先としては、データとして公開・販売されているものや、APIとして提供されているものを利用してもよい。具体的には、国勢調査のデータや、公示地価のデータ、住宅地図API等を用いることができる。ただし、context変数の曜日、時間帯に関しては、既知ユーザ属性蓄積部505よりデータを取得する際に提供されるデータの観測時間帯を用いる。
図7は、既知ユーザ属性蓄積部505に蓄積されるデータの例を示す図である。この図に示すように、既知ユーザ属性蓄積部505は、場所IDと、場所名と、観測時期(曜日・時間帯)と、そのユーザ属性との対応関係を示す情報を蓄積する。ユーザ属性は、その観測時期にその場所を訪れる人々について、該当ユーザ属性項目の典型的な値を1つ記してもよい。
図8は、本発明の実施の形態におけるユーザ属性推定装置の動作を示すフローチャートである。以下、このユーザ属性推定装置の動作を図8に従って説明する。
まず、指標蓄積部31、地理属性項目構造蓄積部401、ユーザ属性−地理項目構造関係蓄積部402、指標選択ルール蓄積部405、既知ユーザ属性蓄積部505にそれぞれ必要な情報を蓄積しておく(S1)。次いで、モデル生成部500が後述する手法で学習モデルを生成・蓄積した後(S2)、入力部61が推定対象を入力すると(S3)、入力部61からの入力に合った学習モデルをモデル選択部601がモデル蓄積部503から選択する(S4)。これにより、選択された学習モデルに基づいて推定計算部602がユーザ属性を推定すると(S5)、その推定結果を出力部62が出力する(S6)。
図9は、学習モデルを生成するステップ(図8のS2)を詳細に示すフローチャートである。以下、図9を用いて、ユーザ属性項目「利用目的」を推定するための学習モデルを生成する場合について説明する。
まず、モデル生成部500は、ユーザ属性項目のうち「利用目的」の指定を入力部51より受けると(S11)、「利用目的」の値が記されているデータの場所IDと、その「利用目的」の値と、そのデータの観測時刻を既知ユーザ属性蓄積部505から取得する(S12)。「利用目的」の値は、「仕事」「ショッピング」等の離散値(ラベル)で表現してもよいし、全体のうち仕事の目的で利用する人の割合を「仕事度」と定義するなどして連続量で表現してもよい。
次いで、モデル生成部500は、場所ID−位置変換部504に場所IDを渡し、場所ID−位置変換部504から位置情報を取得する(S13)。位置情報は、住所や緯度経度など、指標蓄積部31の各種指標に対応する系に合わせる。
次いで、変数選択部501は、ユーザ属性−地理項目構造関係蓄積部402を参照し、地理属性項目ツリー構造のうち、「利用目的」を推定する場合のノード番号“11−14, 21,23”を取得する(S14)。「利用目的」を推定するにあたり、学習モデルに使用する変数の候補となる地理属性項目は、このノード番号で指定された部分の地理属性項目である。
次いで、変数選択部501は、地理属性項目構造蓄積部401を参照し、地理属性項目ツリー構造のノード番号11−14,21,23にあたるノードから「小売業年間売上高」「飲食チェーンの出店数」などの地理属性項目を変数候補として選択する(S15)。そして、ステップS15で選択した地理属性項目名およびステップS13で取得した位置情報を指標選択部404に通知する(S16)。
次いで、指標選択部404は、指標選択ルール蓄積部405を参照し、各地理属性項目の取得先と位置情報を利用して指標蓄積部31の各種DBより必要な指標を選択し、変数選択部501に渡す(S17)。ただし、ノード21については、ステップS12で既に取得している各データの観測時刻から曜日と時間帯を算出する。
次いで、変数選択部501は、上記で得られた各場所ごとの地理属性項目の値をアルゴリズム選択部502に通知する(S18)。
次いで、アルゴリズム選択部502は、ステップS18で得た地理属性項目の一部と、既知ユーザ属性蓄積部505から取得しておいたユーザ属性項目「利用目的」の値を利用して幾つかのアルゴリズムを試し、もっとも推定精度のよいアルゴリズムを選択する(S19)。あるいは、既に同種のデータを用いてモデル生成を行った履歴がある場合は、そのアルゴリズムと同様のものを始めから用いてもよい。一方、履歴がない場合は、「利用目的」の値がラベルデータのような離散値であれば、サポートベクターマシン等の識別アルゴリズムを試してもよいし、「利用目的」の値が連続値であれば、非線形回帰モデルなどの多変量解析手法の中から精度のよいモデルを求めてもよい。多変量解析手法としては、公知の様々な手法を採用することができる(水野欽司(著),「多変量データ解析講義」,朝倉書店)。
次いで、変数選択部501は、ステップS19の結果を受けて地理属性項目構造蓄積部401を参照し、ノード番号11に該当する地理属性項目のうち1つもしくは数個を選択し、残りのノードについても同様に変数を選択する(S20)。そして、ステップS19で求めたアルゴリズム/モデルを用いて、既知ユーザ属性蓄積部505に蓄積されている既知のユーザ属性データのうち一部をテストデータ、残りを訓練データとし、訓練データより学習モデルを作成するとともにテストデータで該当学習モデルの性能を評価する。
次いで、変数選択部501は、各ノードから選択する地理属性項目の組合せを変えてステップS17〜S20を繰り返し、性能が最もよい指標の組合せを決定する(S21)。計算量に余裕があれば全組合せを試し、もっとも精度のよい組み合わせを求めてもよい。この結果、例えば、ノード番号11の購買指数には「小売店の数」を、ノード番号12の娯楽指数には「大規模娯楽施設の有無」を、ノード番号13のビジネス指数には「従業者数」を、ノード番号14の居住指数には「世帯数」を・・・、といったように指標の組合せを決定することができる。このように、売店数、大規模娯楽施設の有無、従業者数、世帯数、・・・という6変数をステップS19で求めたアルゴリズム/モデルに適用して学習モデルとする(S22)。
上記の学習モデルを求めるステップを全ユーザ属性項目について行い(S23)、ユーザ属性項目ごとに作成された学習モデルをモデル蓄積部503に蓄積する(S24)。
以上のように、ユーザ属性項目との関係より地理属性項目のツリー構造を規定することで、全ての地理属性項目の組合せを調べることなく、多数の地理属性項目の中から効率よく最適な少数の組合せを発見することができる。
次に、モデル蓄積部503に蓄積された学習モデルを用いてユーザ属性未知の場所のユーザ属性を推定する場合の一例について説明する。ここでは、「自由が丘」における利用目的を求めたいとする。この場合は、ユーザ属性が未知のスポット名「自由が丘」とユーザ属性項目「利用目的」が入力部61に入力される。これにより、未知のユーザ属性をモデル蓄積部503から参照し、ユーザ属性項目に合わせてモデルを選択、推定する。その結果、「自由が丘」の「利用目的」は「ショッピング」もしくは「仕事度:21%」などと推定されることになる。
以上のように、本発明の実施の形態におけるユーザ属性推定装置によれば、ユーザ属性を効率よく取得することができる。すなわち、一部の場所についてユーザ属性を取得することができれば、ユーザ属性よりも低コストで取得することができる地理属性というデータよりユーザ属性が推定される。その結果、全ての場所についてユーザ属性を調査などする必要がなくなり、コストの削減を期待することができる。
より具体的に説明すると、地理属性とユーザ属性の関係に基づいた地理属性項目のツリー構造を作成し、ユーザ属性項目とそれに関係するツリー部分を指定し、学習モデルに用いる地理属性項目の組合せを取捨選択することで、既知のユーザ属性データの数が少なく地理属性項目の数が多い場合にも、ユーザ属性の推定に効果のある地理属性項目を効率よく選択して学習モデルを生成することができる。その結果、多くの場所についてユーザ属性を取得することができ、設置場所に最適化された広告配信を低コストに実現することが可能である。
なお、本発明は、ユーザ属性推定装置として実現することができるだけでなく、このようなユーザ属性推定装置が備える特徴的な処理部をステップとするユーザ属性推定方法として実現したり、それらのステップをコンピュータに実行させるプログラムとして実現したりすることもできる。このようなプログラムは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのはいうまでもない。
また、上記の説明では特に言及しなかったが、本発明には、公知の機械学習手法や特徴選択手法を採用することができる。例えば、公知の機械学習手法としては、「N. Cristianini and J. Shawe-Taylor 著,大北剛訳,"サポートベクターマシン入門", pp.128-149, 共立出版, 東京, 2005.」や「柳井啓司, "サポートベクターマシン関連ツール", 映像情報メディア学会誌, Vol.63, No.12,」に開示されている手法を採用することができる。また、公知の特徴選択手法としては、「Guyon, I. and Eliseeff, A. “An introduction to variable and feature selection,” Journal of Machine Learning Research, 3, pp1157-1182., 2003.」に開示されている手法を採用することができる。
505…既知ユーザ属性蓄積部
500…モデル生成部
600…ユーザ属性推定部
401…地理属性項目構造蓄積部
402…ユーザ属性−地理項目構造関係蓄積部

Claims (5)

  1. ユーザ属性を推定するユーザ属性推定装置であって、
    既知のユーザ属性を蓄積する既知ユーザ属性蓄積部と、
    地理属性項目をユーザ属性との関連性の観点からツリー構造で蓄積するとともにそのツリー構造を構成する各ノードの参照番号を蓄積する地理属性項目構造蓄積部と、
    推定対象であるユーザ属性項目と前記ノードの参照番号との対応関係を示す情報を蓄積するユーザ属性−地理項目構造関係蓄積部と、
    前記既知ユーザ属性蓄積部に蓄積された既知のユーザ属性に基づいて地理属性とユーザ属性の関係を学習して学習モデルを生成するモデル生成部と、
    前記モデル生成部により生成された学習モデルに基づいて地理属性から未知のユーザ属性を推定するユーザ属性推定部と、
    を備え
    前記モデル生成部は、前記ユーザ属性−地理項目構造関係蓄積部を参照して推定対象であるユーザ属性項目に対応する前記ノードの参照番号を取得し、取得した前記ノードの参照番号に基づいて前記地理属性項目構造蓄積部に蓄積された地理属性項目を選択し、選択された地理属性項目を学習モデルに利用する
    ことを特徴とするユーザ属性推定装置。
  2. 前記モデル生成部は、推定対象であるユーザ属性項目に対応する前記ノードの参照番号の地理属性項目の中から、1つ以上選択した地理属性項目の組み合わせから学習モデルを生成し、複数の地理属性項目の組み合わせを試し、もっとも精度のよい地理属性項目の組み合わせを求める
    ことを特徴とする請求項1記載のユーザ属性推定装置。
  3. ユーザ属性を推定するユーザ属性推定方法であって、
    コンピュータが、
    既知のユーザ属性を既知ユーザ属性蓄積部に蓄積する既知ユーザ属性蓄積ステップと、
    地理属性項目をユーザ属性との関連性の観点からツリー構造で蓄積するとともにそのツリー構造を構成する各ノードの参照番号を地理属性項目構造蓄積部に蓄積する地理属性項目構造蓄積ステップと、
    推定対象であるユーザ属性項目と前記ノードの参照番号との対応関係を示す情報をユーザ属性−地理項目構造関係蓄積部に蓄積するユーザ属性−地理項目構造関係蓄積ステップと、
    前記既知ユーザ属性蓄積部に蓄積された既知のユーザ属性に基づいて地理属性とユーザ属性の関係を学習して学習モデルを生成するモデル生成ステップと、
    前記モデル生成ステップで生成された学習モデルに基づいて地理属性から未知のユーザ属性を推定するユーザ属性推定ステップと、
    実行し、
    前記モデル生成ステップでは、前記ユーザ属性−地理項目構造関係蓄積部を参照して推定対象であるユーザ属性項目に対応する前記ノードの参照番号を取得し、取得した前記ノードの参照番号に基づいて前記地理属性項目構造蓄積部に蓄積された地理属性項目を選択し、選択された地理属性項目を学習モデルに利用する
    ことを特徴とするユーザ属性推定方法。
  4. 前記モデル生成ステップでは、推定対象であるユーザ属性項目に対応する前記ノードの参照番号の地理属性項目の中から、1つ以上選択した地理属性項目の組み合わせから学習モデルを生成し、複数の地理属性項目の組み合わせを試し、もっとも精度のよい地理属性項目の組み合わせを求める
    ことを特徴とする請求項3記載のユーザ属性推定方法。
  5. ユーザ属性を推定するためのプログラムであって、
    既知のユーザ属性を既知ユーザ属性蓄積部に蓄積する既知ユーザ属性蓄積ステップと、
    地理属性項目をユーザ属性との関連性の観点からツリー構造で蓄積するとともにそのツリー構造を構成する各ノードの参照番号を地理属性項目構造蓄積部に蓄積する地理属性項目構造蓄積ステップと、
    推定対象であるユーザ属性項目と前記ノードの参照番号との対応関係を示す情報をユーザ属性−地理項目構造関係蓄積部に蓄積するユーザ属性−地理項目構造関係蓄積ステップと、
    前記既知ユーザ属性蓄積部に蓄積された既知のユーザ属性に基づいて地理属性とユーザ属性の関係を学習して学習モデルを生成するモデル生成ステップと、
    前記モデル生成ステップで生成された学習モデルに基づいて地理属性から未知のユーザ属性を推定するユーザ属性推定ステップと、
    をコンピュータに実行させ
    前記モデル生成ステップでは、前記ユーザ属性−地理項目構造関係蓄積部を参照して推定対象であるユーザ属性項目に対応する前記ノードの参照番号を取得し、取得した前記ノードの参照番号に基づいて前記地理属性項目構造蓄積部に蓄積された地理属性項目を選択し、選択された地理属性項目を学習モデルに利用する
    ことを特徴とするプログラム。
JP2010111166A 2010-05-13 2010-05-13 ユーザ属性推定装置、ユーザ属性推定方法、およびプログラム Expired - Fee Related JP5536531B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010111166A JP5536531B2 (ja) 2010-05-13 2010-05-13 ユーザ属性推定装置、ユーザ属性推定方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010111166A JP5536531B2 (ja) 2010-05-13 2010-05-13 ユーザ属性推定装置、ユーザ属性推定方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2011238169A JP2011238169A (ja) 2011-11-24
JP5536531B2 true JP5536531B2 (ja) 2014-07-02

Family

ID=45326052

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010111166A Expired - Fee Related JP5536531B2 (ja) 2010-05-13 2010-05-13 ユーザ属性推定装置、ユーザ属性推定方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5536531B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5846002B2 (ja) * 2012-03-28 2016-01-20 富士通株式会社 サーバ装置、情報提供プログラム、情報提供方法及び情報提供システム
JP5791565B2 (ja) * 2012-05-18 2015-10-07 日本電信電話株式会社 ユーザ属性推定装置、ユーザ属性推定方法、及びプログラム
US20200042924A1 (en) * 2016-10-07 2020-02-06 Nec Corporation Validation system, validation execution method, and validation program
JP7308603B2 (ja) * 2018-10-16 2023-07-14 株式会社Nttドコモ 経済指標算出装置
JP7157681B2 (ja) * 2019-03-01 2022-10-20 東京瓦斯株式会社 属性推定装置、方法、およびプログラム
US20220083822A1 (en) * 2020-09-11 2022-03-17 Actapio, Inc. Classification apparatus, classification method, a non-transitory computer-readable storage medium

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3501957B2 (ja) * 1998-08-28 2004-03-02 日本電信電話株式会社 位置関連情報検索方式
JP3488104B2 (ja) * 1998-11-18 2004-01-19 富士通株式会社 移動体の特性抽出装置,特性抽出方法およびそのプログラム記録媒体
JP4163725B2 (ja) * 2006-06-07 2008-10-08 裕一 磯邉 情報検索装置、情報検索方法、情報検索プログラム及びそのプログラムを記録した記録媒体
US20090048977A1 (en) * 2007-07-07 2009-02-19 Qualcomm Incorporated User profile generation architecture for targeted content distribution using external processes

Also Published As

Publication number Publication date
JP2011238169A (ja) 2011-11-24

Similar Documents

Publication Publication Date Title
CN106991576B (zh) 一种地理区域的热力展现方法和装置
Hasan et al. Urban activity pattern classification using topic models from online geo-location data
JP5536531B2 (ja) ユーザ属性推定装置、ユーザ属性推定方法、およびプログラム
US7984006B2 (en) Learning a user's activity preferences from GPS traces and known nearby venues
US10003926B2 (en) Predicting human movement behaviors using location services model
Nilbe et al. Evaluating the travel distances of events visitors and regular visitors using mobile positioning data: The case of Estonia
US20110071881A1 (en) Mining life pattern based on location history
JP2021534499A (ja) モバイル機器位置予測システム及び方法
US9584836B2 (en) Mobility enhanced advertising on internet protocol television
US9858610B2 (en) Product recommendation based on geographic location and user activities
KR101810169B1 (ko) 유동인구 패턴정보 기반의 미래입점객수 예측방법 및 장치
KR101312927B1 (ko) 광고 제공 시스템
Marshall et al. A forecasting system for movie attendance
Wynen Explaining travel distance during same-day visits
CN109903065B (zh) 一种确定候选点的候选分值的方法和装置
US20140172542A1 (en) Event based advertisement selection
CN110191416A (zh) 用于分析目标实体的移动的装置、系统和方法
JP2011108245A (ja) 文脈情報からユーザに対する行動種別を決定する推論モデルを生成するプログラム
Balandina et al. Innovative e-tourism services on top of Geo2Tag LBS platform
KR20150037769A (ko) 모바일 애플리케이션 사용자의 관심 프로파일
JP2020537252A (ja) 類似のモバイル装置を予測するためのシステムと方法
CN111626777B (zh) 选址方法、选址决策系统、存储介质及电子设备
EP3711013A1 (fr) Dispositif et procédé de traitement de données hétérogènes pour déterminer des affluences spatio-temporelles
Wu et al. Examining the effects of the built environment on topological properties of the bike-sharing network in Suzhou, China
KR101513347B1 (ko) 공간 정보 제공 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121102

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130829

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131001

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140422

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140424

R150 Certificate of patent or registration of utility model

Ref document number: 5536531

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees