JP2013131170A - 行動属性分析方法および装置 - Google Patents

行動属性分析方法および装置 Download PDF

Info

Publication number
JP2013131170A
JP2013131170A JP2011282015A JP2011282015A JP2013131170A JP 2013131170 A JP2013131170 A JP 2013131170A JP 2011282015 A JP2011282015 A JP 2011282015A JP 2011282015 A JP2011282015 A JP 2011282015A JP 2013131170 A JP2013131170 A JP 2013131170A
Authority
JP
Japan
Prior art keywords
scene
vector
life pattern
pattern
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011282015A
Other languages
English (en)
Other versions
JP5785869B2 (ja
Inventor
Toshiko Aizono
敏子 相薗
Takashi Suzuki
敬 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2011282015A priority Critical patent/JP5785869B2/ja
Priority to PCT/JP2012/081662 priority patent/WO2013094426A1/ja
Priority to US14/367,422 priority patent/US20150051948A1/en
Priority to CN201280063302.2A priority patent/CN104011720B/zh
Publication of JP2013131170A publication Critical patent/JP2013131170A/ja
Application granted granted Critical
Publication of JP5785869B2 publication Critical patent/JP5785869B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】人の行動が蓄積された履歴データから利用者の行動パタンを抽出し、このパタンを用いて利用者の行動の傾向や特徴を、場所や時間など多様な観点から、網羅的かつ効率的に分析する技術を提供する。
【解決手段】本発明に係る行動属性分析装置は、人集合の行動を時間帯毎のシーン値として記載したシーンベクトルによって行動パタンを表現し、シーンベクトルをクラスタリングすることによって人集合全体に含まれる生活パタンを抽出した後、各人がどの生活パタンに当てはまるかに基づき分類する。
【選択図】図1

Description

本発明は、人の行動属性を用いて分析対象を分類する方法およびその装置に関するものである。
携帯電話のような携帯通信機器とその基地局との間の無線通信記録や、道路交通システムにおける自動車のプローブ情報は、人の移動履歴を表している。同様に交通系ICカードの利用履歴も人の移動履歴を表していると言える。交通系ICカードに電子マネー機能が付いている場合は、カードが移動履歴と併せて買い物という人の行動履歴も蓄積していると考えることができる。買い物という観点では、クレジットカードの利用履歴も人の行動履歴である。また人に装着可能なセンサ端末を使って測定した人の生体情報(体温、脈拍、腕の加速度等)は、生理学的な観点からの人の行動履歴である。
これら履歴は、記録の目的・手段が異なるため一日の生活において履歴に残る部分はそれぞれであるが、人がいつ、どこで、なにをしていたかを表している。これら多様な人の行動履歴から人の行動パタンを抽出し、個々の利用者にマッチした情報を提供するサービスやマーケティングに活用する技術が、下記特許文献1および特許文献2に開示されている。
特許文献1には、交通系ICカードの利用履歴から利用者の移動や買い物などの行動パタンを抽出し、このパタンを使って利用者の行動にマッチした情報を提供する技術が開示されている。特許文献1において行動パタンとは、交通系ICカードの利用者が利用した駅や店舗のリストである。このパタンを用いることによって利用者の移動や買い物の傾向を把握することができる。
特許文献2には、利用者が携帯する移動端末と店舗に設置された無線局とを使って利用者の来店履歴を蓄積し、この来店履歴から利用者の店舗の遷移パタンを抽出し、このパタンを使って利用者が次に来店する可能性の高い店舗の情報を利用者の下へ配信する技術が開示されている。特許文献2において行動パタンとは、ある店舗に関して次に来店した店舗のID(識別子)と来店した回数、および来店回数に基づく店舗間の遷移確率のリストである。この行動パタンを利用者毎に作成することにより、利用者の店舗利用の傾向を把握することができる。
特開2010−157055号公報 特開2004−70419号公報
上記特許文献1および2に記載されている行動パタンを用いることにより、利用者の移動や買い物など行動の傾向を把握し、個人にマッチしたサービスを実現することができるが、その一方で次のような課題がある。
(課題その1)
上記特許文献1および2に記載されている行動パタンは、利用者が駅、施設、店舗名を「いつ」利用したかが考慮されていない。例えば、ある駅の利用者が駅構内のコンビニエンスストアを利用するケースでは、早朝に利用する利用者、日中に利用する利用者、あるいは平日のみ/休日のみ利用する利用者では、それぞれ利用の目的が異なると考えられるが、特許文献1および2に記載されている行動パタンでは同じパタンとして扱われる。そのため利用者の行動のパタンから把握できるのは、駅、施設、店舗の「場所」の観点からのみであり、早朝、日中、平日、休日など「時間」の観点から利用者の傾向を把握することは難しい。
(課題その2)
利用者の数あるいは行動履歴を取得する期間が拡大すると行動パタンの数が爆発的に増加するため、利用者の傾向を網羅的に把握することが困難になる。特許文献1に記載されている行動パタンは、利用者が利用した駅、施設、店舗名をパタンの属性とし、特許文献2に記載されている行動パタンは、店舗、施設のコードをパタンの属性としているので、駅、施設、店舗が異なれば別のパタンとなる。そのため、これら文献に記載されている技術では、行動パタンは無数に生成される。そこで現実的には、パタンの出現頻度を手掛かりに「よくある」すなわち高頻度のパタンのみを分析対象とすることになる。この場合、店舗名は異なるがタイプは同じ店舗を繰り返し利用しているパタンや、各利用者の利用頻度は低いが全体では特定の傾向がみられるパタン(理容店の後に電車で出かけるなど)などが見つけにくい。
利用者の行動履歴から利用者の行動パタンを抽出して情報提供やマーケティングに活用するには、ある程度の規模で(1万人以上など)かつ網羅的に利用者の行動を分析できることが望ましい。しかし特許文献1および2に記載されている技術では、観点の多様性や処理の効率性に課題があるといえる。
本発明は、上記のような課題を解決するためになされたものであり、人の行動が蓄積された履歴データから利用者の行動パタンを抽出し、このパタンを用いて利用者の行動の傾向や特徴を、場所や時間など多様な観点から、網羅的かつ効率的に分析する技術を提供するものである。
本発明に係る行動属性分析装置は、人集合の行動を時間帯毎のシーン値として記載したシーンベクトルによって行動パタンを表現し、シーンベクトルをクラスタリングすることによって人集合全体に含まれる生活パタンを抽出した後、各人がどの生活パタンに当てはまるかを分類する。
本発明に係る行動属性分析装置によれば、利用者の行動の傾向や特徴を場所や時間など多様な観点から、網羅的かつ効率的に分析できる。
実施形態1に係る行動属性分析装置1の構成図である。 行動属性分析装置1のハードウェア構成を示す図である。 ICカード利用履歴103のデータ構成を示す図である。 クレジットカード利用履歴104のデータ構成を示す図である。 シーンリスト105のデータ構成を示す図である。 イベントリスト106のデータ構成を示す図である。 シーンベクトルテーブル107のデータ構成を示す図である。 ターゲットシーンベクトルテーブル205のデータ構成を示す図である。 生活パタンテーブル206のデータ構成を示す図である。 ユーザ情報209のデータ構成を示す図である。 場所情報210のデータ構成を示す図である。 カレンダ情報211のデータ構成を示す図である。 特徴ベクトルテーブル305のデータ構成を示す図である。 クラスタテーブル306のデータ構成を示す図である。 抽出条件207の一例を示す図である。 抽出パラメタ208の一例を示す図である。 分析条件307の一例を示す図である。 分析パラメタ308の一例を示す図である。 実施形態1における行動属性分析装置1の処理手順を示すフローチャートである。 ステップS10の処理手順を示すフローチャートである。 ステップS20の処理手順を示すフローチャートである。 ステップS30の処理手順を示すフローチャートである。 行動属性分析装置1のシーン抽出ルールおよびシーンを表す数値を説明する図である。 シーン抽出部101が実施するステップS101の詳細な処理手順を示すフローチャートである。 生活パタン抽出条件設定部201が実施するステップS201の詳細な処理手順を示すフローチャートである。 生活パタン抽出条件設定部201が表示する生活パタン抽出条件設定画面の一例を示す図である。 生活パタン抽出条件設定部201が表示する重みづけ設定画面の一例を示す図である。 生活パタン抽出条件設定部201が表示する属性追加設定画面の一例を示す図である。 生活パタン抽出条件設定部201が表示するパラメタ設定画面の一例を示す図である。 抽出した生活パタンを表示する画面の一例を示す図である。 クラスタ分析条件設定部301が実施するステップS301の詳細な処理手順を示すフローチャートである。 クラスタ分析条件設定部301がステップS301で表示する生活パタンクラスタ分析条件設定画面の一例を示す図である。 抽出条件表示ボタン301112をクリックしたときに表示される生活パタン抽出条件表示画面の一例を示す図である。 パラメタ設定指示ボタン301131をクリックしたときに表示されるパラメタ設定画面の一例を示す図である。 特徴ベクトル生成部302が実施するステップS302の詳細な処理手順を示すフローチャートである。 クラスタ表示部304部がクラスタを表示する画面の一例を示す図である。 詳細分析の画面の一例を示す図である。 詳細分析の画面の一例を示す図である。 円グラフ表示の一例を示す図である。 マトリクス表示の一例を示す図である。 実施形態2に係る行動属性分析装置1の構成図である。 パタンベクトルテーブル405のデータ構成を示す図である。 期間生活パタンテーブル406のデータ構成を示す図である。 抽出条件407の一例を示す図である。 抽出パラメタ408の一例を示す図である。 実施形態2における行動属性分析装置1の処理手順を示すフローチャートである。 期間生活パタン抽出部40の処理手順を示すフローチャートである。 パタン抽出条件設定部401における期間生活パタン抽出条件設定画面の一例を示す図である。 パラメタ設定指示ボタン40141をクリックしたときに表示されるパラメタ設定画面の一例を示す図である。 生成されたクラスタを期間生活パタン表示部404が一日のパタンの遷移として表現し、分析者に表示する画面の一例を示す図である。 実施形態3に係る行動属性分析装置1の全体構成を示す図である。
以下ではまず本発明の考え方について概略を説明し、その後に具体的な実施形態について説明する。
<本発明の概略>
本発明では、以下の3つの手法(1)シーンベクトル生成〜(3)生活パタンクラスタ分析により、人集合の行動属性を用いて分析対象を分析する。(1)シーンベクトル生成では行動履歴を後述するシーンベクトルとして表現し、(2)生活パタン抽出ではシーンベクトルの集合から生活パタンを抽出し、(3)生活パタンクラスタ分析では分析対象が各生活パタンのいずれに属するかに基づいて分類する。以下、各手法の概略を説明する。
(1)シーンベクトル生成
利用者の行動を場所だけでなく時間や行動の目的など多様な観点から傾向を把握できるよう、本発明では利用者の一日を「シーン」の遷移ととらえ、時刻(または時間帯)を要素番号とし、シーンを表す値を要素値とするベクトル(「シーンベクトル」と呼ぶ)によって人の行動を表現する。例えば利用者の行動を1時間毎のシーン遷移として表現する場合、シーンベクトルは24個(1日=24時間に対応)の要素を持ち、各要素値は当該利用者が1時間毎に過ごしたシーンを表す値となる。具体的には以下の処理によりシーンベクトルを生成する。
(1.1)シーンの抽出
シーンとは、「自宅で過ごす」、「職場や学校で過ごす」、「遊びにでかける」など、人がある目的を持ってある場所で過ごした時間を指す。人が一日に過ごすシーンの数は高々10個未満と考えられる。本発明ではこのシーンを、利用者の行動履歴に記録された移動時間、移動先の場所に滞在した長さ、その場所に滞在した頻度などに基づき推定して抽出する。具体的には、平日の朝から夕方/夜まで長時間滞在した場所は「職場」もしくは「学校」と推定し、曜日に限らず夕方/夜から次の日の朝まで滞在した場所は「家」と推定し、休日の日中や夕方に短時間滞在した場所は「買い物」や「娯楽/余暇」のための場所であると推定し、それぞれ利用者は「仕事」、「自宅」、「遊び」というシーンを過ごしたと考える。抽出可能なシーンは、利用する行動履歴の特性によって異なる。例えば学生証や社員証の機能を有する交通系ICカードの利用履歴を利用する場合は、入退室管理記録から「図書館で過ごす」、「5Fの居室で過ごす」、「6Fの会議室で過ごす」などのシーンも抽出できるであろう。
人がある目的を持ってある場所で過ごす「シーン」は、数時間を単位とするものもあれば、「電話をかける」「何かを買う(支払い)」「(簡単な)食事をする」など数秒から数十分しか要しないものもある。本発明では後者の比較的短時間の過ごし方を「シーン」と区別して「イベント」と呼ぶ。人の行動履歴から抽出可能なイベントには、例えば携帯電話の移動履歴から「通話」というイベントが、あるいは電子マネー機能の付いた交通系ICカードの利用履歴からは「支払い」というイベントがある。さらに利用者を紐づけることができれば複数の行動の履歴からイベントを抽出することができる。例えば、自動車の利用者がプローブ情報を用いた有料のサービス(一例として「オペレーターによる情報提供」)に加入しており、その料金の支払いを自動車会社提携のクレジットカードで行っていれば、自動車の利用者とクレジットカードの利用者を紐づけることができる。そこで自動車のプローブ情報を人の行動履歴として利用し、さらにクレジットカードの利用履歴を第2の履歴として利用すると、移動から推定されるシーンに加えて店舗での「支払い」をイベントとして抽出できる。このように主たる行動履歴を利用者と対応づけることができれば、イベントを抽出するための第2の履歴として次のような履歴を利用することができる。例えば店舗の会員カードやポイントカードの利用履歴(来店や購入といったイベント)、会員制HPのWebアクセス履歴(Web閲覧やネット通販での注文といったイベント)などがある。それぞれの履歴に出現する利用者の対応付け、すなわち名寄せは、その氏名、性別、住所などの登録情報を利用することにより実現できる。
一日のシーン遷移は、基本的には数時間を単位とするシーンを対象とし、「イベント」は「シーン」の中で発生するものととらえる。例えば「買い物」は「遊びにでかける」というシーンで発生するイベントである。しかし分析の目的によっては数十分のイベントでもシーンとして扱ってもよい。例えば前述の社員証機能を持った交通系ICカードの利用履歴を使って社員の会社生活にフォーカスして一日の過ごし方を分析したい場合は、「社員食堂で食事する」という時間の過ごし方をシーンとして扱ってもよい。
抽出したシーンおよびイベントは、「何の」シーン/イベントを「誰が」「いつ」「どこで」過ごしたかという要素で表現する。各要素の具体的な値はシーンおよびイベントを抽出した行動履歴の特性によって決定される。交通系ICカードの利用履歴の場合は、「誰が」はICカードの利用者ID、「いつ」はICカードを改札機またはカード端末機にタッチした時刻、「どこで」は改札機がある駅名または端末機がある店舗名、「どのシーン」はICカードの利用履歴から抽出可能なシーンまたはイベント名となる。携帯電話の基地局との無線通信記録や自動車のプローブ情報を利用した場合は、「どこで」は基地局や自動車の位置情報(緯度・経度)となるであろう。また前述のようにクレジットカードの利用履歴から抽出した「支払い」イベントの場合、「どこで」は店舗名となり、上記4つの要素に加えて「いくら」(金額)を抽出することができる。
(1.2)シーンの数値への変換
次に一日をシーンベクトルで表現するため、抽出したシーンを数値に変換する。シーンの数値への変換は、具体的には次のような方法が考えられる。まず抽出可能なシーンの数をNとしたとき、最も出現頻度の高いシーンの値を「1」、その次に出現頻度の高いシーンの値を「N」とする。その次に頻度の高いシーンの値を「N−1」、さらにその次に頻度の高いシーンの値を「N−2」、以下同様にN個シーンの値を設定する。これによれば後述の生活パタン抽出のためのクラスタリングにおいて、同じ時刻に出現したシーンのうち出現頻度の高いシーン同士をベクトル空間上離れた位置に置くことができる。
シーンの値は「1」「N」「N−1」・・・に限定されるものではない。最も頻度の高いシーンの値を「N」とし、その次に頻度の高いシーンの値は「1」、「2」、「3」、・・・としてもよく、1から0までの小数値でもよい。またシーンの値を決める順序は、上記では出現頻度の降順としたが、例えば複数シーンが同じ日において同時に出現する頻度を共起頻度または共起確率として計算しておき、最も出現頻度の高いシーンの値を「1」とするとき、このシーンに対して同時に出現しやすいシーンの値は「N」、このシーンに対して同時に出現しやすいシーンは「N−1」・・・としてもよい。
あるいは各シーンに対応する値は、分析システムの管理者がシーンの意味を考慮し任意で設定してもよい。具体的には、「自宅」と「遊び」はプライベートなシーンなのでそれぞれ「1」と「2」、「仕事」はプライベートなシーンとは差がでるよう「5」にする、などである。
(1.3)シーンベクトルの値の設定
本発明では利用者の一日をシーン遷移で捉えるため、利用者の一日を、時刻(または時間帯)を要素番号とするシーンベクトルで表現する。一日の範囲の捉え方には、午前0時から翌午前0時まで、あるいは朝の4時から翌日の朝の4時までなどいくつか考えられる。また時刻は1時間単位、30分単位などがあるが、一定の長さを単位としなくてもよく、活動の多い日中は30分単位、深夜は2時間単位などでもよい。シーンベクトルの各時刻において利用者が過ごしたシーンを表す数値をセットしてベクトルを生成する。
なお利用者の行動の傾向や特徴を多様な観点から効率的に分析できるよう、シーンベクトルは行動履歴からあらかじめ生成しておき、これらを基本データとして分析の目的に応じた抽出・加工を行って生活パタンを抽出してもよい。
一日のシーンの遷移は、人が同じであれば、あるいは人が違っても職業(会社員、学生など)や年代、性別などが同じであればある程度似たような傾向があると考えられる。そこでシーンベクトルのデータを利用者ごと日ごとに生成すると重複が多いデータとなることが予想されるため、シーンベクトルはユニークなリストとなるよう生成しておき、利用者ごと日ごとのデータはそのリストへのポインタとしてもよい。これにより膨大なデータを効率的に蓄積することができる。
(2)生活パタン抽出
一日のシーン遷移は、夜は自宅、日中は仕事や学校などのようにいくつかの典型的なパタンがあると想定される。そこで本発明では、一日のシーン遷移を表すシーンベクトルをクラスタリングし、一日のシーン遷移のパタン(「生活パタン」と呼ぶ)を抽出する。本処理により、人集合の中にどのような生活パタンが存在するかを概略的に把握することができる。具体的には次の処理により生活パタンを抽出する。
(2.1)生活パタン抽出条件設定
まず生活パタンを抽出したい対象者を絞り込むための条件を設定する。具体的には次のような情報を用いて条件を設定する。
(2.1.1)利用者の属性
利用者の年代、性別、住所などのユーザ情報があればそれらを生活パタンの抽出条件として利用することができる。例えば対象者を「30代の男性」あるいは「都内在住の20代女性」と設定すると、人集合のなかで上記条件に合致する者について、それぞれの典型的な一日の過ごし方、すなわち生活パタンを抽出することができる。
(2.1.2)シーンの属性
前述のようにシーンは「誰」が「いつ」「どこ」で「何」をして過ごしたかで表現される。これらシーンの属性を生活パタンの抽出条件とすることができる。例えば「緯度x経度yの範囲内に自宅がある人」(どこで、何を)、「×月△日に○駅にきた人」(いつ、どこで)、「平日、仕事をしている人」(いつ、何を)などがある。このような条件を使うと、前記例では「緯度x経度yの範囲内に自宅がある人」の典型的な一日の過ごし方(自宅から仕事に行ってそのまま帰宅する、あるいは帰りに寄り道をするなど)を抽出することができる。
(2.1.3)イベントの属性
イベントもシーンと同様、「誰」が「いつ」「どこ」で「何」をして過ごしたかで表現され、加えて「いくら」(金額)などの履歴に依存した要素がありうる。これらを使った抽出条件として「○月×日△△デパートで買い物をした人」(いつ、どこで、何を)、「×月社員食堂を○回以上利用した人」(いつ、どこで)などがある。
(2.2)シーンベクトルの抽出
(2.1)で説明した生活パタンの抽出条件にしたがい、条件にマッチするシーンベクトルを抽出し、分析の目的に合致する生活パタンが抽出され易いようにシーンベクトルを加工した上で、クラスタリング対象のシーンベクトル(「ターゲットシーンベクトル」と呼ぶ)を生成する。条件にマッチするシーンベクトルは、ユーザ情報やベクトルに含まれるシーン/イベントの属性を参照することにより抽出することができる。シーンベクトルの加工手法としては、例えばシーン値の重みづけ、シーンベクトルへの属性付加などがある。これらの処理は、抽出条件を特に設定する場合のみ実施すればよい。以下、シーン値の重みづけと属性付加について説明する。
(2.2.1)シーンベクトルの重みづけ
シーンベクトルの重み付けとは、(2.1)で説明した生活パタンを抽出したい対象者を絞り込むための条件に合致するシーンベクトルが、条件に合致しないシーンベクトルとは異なる値となるように、シーン値を変換する処理である。これにより、同様の傾向を有しそのままでは同じ生活パタンの中に埋没してしまうようなシーンベクトルのなかから、抽出条件に合致するものを有意に抽出することができる。シーンベクトルの重みづけの一例として、ここではシーンによる重みづけとイベントによる重みづけの2つの観点からの重みづけについて説明する。
(a)シーンによる重みづけ
本発明では一日をシーン遷移、すなわちシーンを表す数値を値とするベクトルで表現するが、そのうち分析者が着目しているシーンに重みづけをする。例えば分析の目的が「×月△日に○駅に来た利用者について、○駅でどのようなシーンを過ごしたか」である場合、まず日付が「×月△日」で場所が「○駅」のシーン(シーンのタイプはこだわらない)を含んだシーンベクトル(一日のシーンの遷移)を取得し、場所が「○駅」であるシーン値のみに重みをつける。重みの一例としては、値を10倍にするなどが考えられる。あるいは「×月に○駅に来た利用者について、○駅でどのようなシーンを過ごしたか、平日と休日でわけて分析したい」場合、上記と同様「×月に○駅に来た人」のシーンベクトルを取得し場所が「○駅」であるシーンに重みを付け、さらに平日のベクトルと休日のベクトルがベクトル空間上離れて位置するよう、日付が休日(土/日)であるシーンベクトルの値にすべて−1をかけるという方法があげられる。
ここでは分析者が着目しているシーンへの重みづけの具体的な手段として、シーンの値を整数倍する、あるいは−1をかけるという手段をあげたが、これに限られるものではなく、抽出条件に合致するシーンベクトルとその他のシーンベクトルを区別できればよい。シーンベクトルのベクトル空間上の位置を考慮した様々な重みづけ手段が考えられる。
(b)イベントによる重みづけ
シーンベクトルはシーンの遷移から構成され、比較的短時間の時間の過ごし方であるイベントはシーンベクトル上に表現されていない。これに対して分析者がイベントに着目して分析したい場合、シーンベクトル中、イベントが発生したシーンあるいはイベントが発生した時刻に重みを付ける。
例えば、分析者がクレジットカードによる「支払い」というイベントに着目し「×月△日に○駅に来て、Aデパートで買い物をした人は、どのようなシーンで買い物したのか」(「仕事」の途中?「遊び」の途中?)を知りたい場合、「×月△日に○駅に来て、かつその日、Aデパートでのクレジットカードの利用履歴がある人」のシーンベクトルを抽出し、クレジットカードの精算時刻を含むシーンに重みづけ(例えば値を10倍にする)をする。さらには「支払い」イベントがシーン最初のほうにあるのか、最後のほうにあるのか知りたい場合は、精算時刻に対応する時刻の値のみ重みづけする。例えば、ある利用者が×月△日の○駅で「遊び」というシーンを13時から18時まで過ごし、14時にAデパートでクレジットカードを利用した履歴がある場合、シーンベクトル中、14時の値を10倍にする。着目したイベントが「支払い」である場合、支払い金額で重みを加重することも可能である。例えば、支払い金額が3万円以上ならシーンの値を20倍、それ以外は10倍にするなどである。
(2.2.2)ベクトルの属性の付加
抽出条件に合致するシーンベクトルを、他のシーンベクトルとは異なるものとして抽出したい場合には、(2.2.1)記載の重み付けが適していると思われる。一方、同じ生活パタンとしていったん抽出されたシーンベクトルのなかで、さらにどのようなパタンが存在しているかを掘り下げて分析したい(いわゆるドリルダウン分析)場合には、シーン値そのものを加工するよりも、掘り下げのための予備的属性をシーンベクトルにあらかじめ追加しておき、掘り下げが必要になった時点でその予備的属性を参照してさらに生活パタンを細分するとよいと思われる。この予備的属性を、本発明ではシーンベクトルの属性と呼ぶ。以下、シーンベクトルの属性が必要になる場面と併せて説明する。
利用者の生活パタンをシーン以外の観点も加えて抽出したい場合は、ベクトルに属性を付加し観点に対応する値を追加する。一例として「×月△日に○駅に来た人で、年代別の傾向があれば知りたい」という分析ニーズを想定する。このような場合「×月△日に○駅に来た人」を年代別に分けて、それぞれ生活パタンを抽出するという方法が考えられる。具体的には年代別に(例えば20代未満、20代、30代、40代、50代、60代以上の6つ)同じ数ずつ(例えば10パタンずつ)生活パタンを抽出し、それらをまとめて「×月△日に○駅に来た人」の生活パタンとする。
しかしこの方法によれば抽出される生活パタンの数が増え6つの年代×10パタン=60パタン)、かつそれぞれの年代の利用者数が異なるため生成されるパタンの粒度が一様ではなくなってしまう(例えば60代以上の利用者数が少ない場合、生成されるパタンは他の年代のパタンより差異が小さいものになる)。この問題点に対して、年代別に抽出した生活パタンのうち年代に共通する似たようなパタンはまとめるという方法が考えられるが、まとめるためにはパタン間の類似度を計算する、または人手でパタン間の類似性を判断する必要があり、手間がかかる。
一方で「×月△日に○駅に来た人で、年代別の傾向があれば知りたい」という分析ニーズは、「年代別の傾向をそれぞれ知りたい」というよりは、「ある年代に特有のパタンが見られればその部分はその年代のパタンとして抽出し、年代かかわらず共通のパタンはひとつのパタンとしたい」と解釈することもできる。実際、クラスタリング対象のデータの状況によって柔軟にクラスタリング結果を得たいというニーズは多いと思われる。
以上の検討に鑑みると、上記のような分析ニーズに対しては、シーンベクトルを重み付けして抽出条件に合致するシーンベクトルを他のシーンベクトルとは異なるものとして取り扱うよりは、いったん同じパタンのシーンベクトルとして抽出しておき、必要に応じて抽出条件を掘り下げていくほうが望ましいと思われる。
そこで本発明では、上記ニーズに対応するためクラスタリング対象のシーンベクトルに属性を付加する。付加できる属性としては、利用者の年代、性別、住所などの利用者の属性があげられる。上記分析ニーズの場合は、シーンベクトルに年代を表す「20代未満」、「20代」、「30代」、「40代」、「50代」、「60代以上」の6つの次元(属性)を追加し、ユーザ情報などを参照してシーンベクトルの利用者の年代を取得し、該当する属性値に「1」を、それ以外の属性値には「0」をセットするなどする。その他、住所(「東京都」「神奈川県」「埼玉県」「千葉県」「その他」の5次元を追加)、何らかの手段によって得られた利用者の嗜好(アンケートの結果など。「サービスに満足」「ほぼ満足」「不満」の3次元)などが、掘り下げに利用する属性として考えられる。
(2.3)シーンベクトルクラスタリング
生成したシーンベクトルをクラスタリングする。クラスタリングのアルゴリズムには、いくつか既存のものがある。例えばk−means法は、非階層型クラスタリングの代表的なアルゴリズムであるが、これに限られるものではない。なおk−means法のようにあらかじめクラスタ数を指定する必要があるアルゴリズムを用いる場合は、あらかじめデフォルト値を設定してクラスタリングを実施する。あるいはクラスタ数を変更してクラスタリングを何回か試行し、生成されたクラスタの評価関数を用いて最適なクラスタ数を選択できるようにしてもよい。
シーンベクトルをクラスタリングすることにより、一日のシーン遷移が類似しているシーンベクトルがまとめられたクラスタが生成される。このクラスタは、同じような行動パタンを表すシーンベクトルの集合であり、本発明では「生活パタン」と呼ぶ。あるいはクラスタに属するシーンベクトルを平均したベクトル(代表ベクトル)を「生活パタン」と呼ぶこともある。すなわち、類似するシーンベクトルの全体的な傾向のことを「生活パタン」と呼ぶことにする。「×月△日に○駅にきた人」の生活パタンの一例を示す。
・朝自宅を出て、○駅に仕事にきたパタン
・朝自宅を出て、仕事に行き、仕事の帰りに○駅に遊びに来たパタン
・昼自宅を出て、○駅に遊びにきたパタン
・夕方自宅を出て、○駅に遊びに来たパタン
(2.4)生活パタン表示
(2.3)で抽出した生活パタンを分析者に表示する。シーンベクトルをk−means法などによってクラスタリングした結果は、クラスタのIDとそのクラスタに属するシーンベクトルのIDリストとなる。このリストを分析者にそのまま表示する、あるいはクラスタの重心(平均ベクトル)を表示しても、分析者はどのような生活パタンが抽出されたか即座に理解することは難しい。そこで本発明では、分析者による理解を容易にするため、クラスタの特徴を表す「代表シーンベクトル」を生成して、各クラスタ、すなわち生活パタンに特徴的なシーン遷移を可視化して表示する。以下詳細に説明する。
(2.4.1)代表シーンベクトルの生成
シーンベクトルはシーン遷移を表し、シーンベクトルの要素番号は一日のうちの各時刻を表し、要素値は各時刻におけるシーンを表す。この構造は、生活パタンについても同様である。そこで、各クラスタに属するシーンベクトルから各時刻における典型的なシーンを抽出し、その値を属性値とするシーンベクトルを生成して「代表シーンベクトル」とする。シーンベクトルと生活パタン(クラスタ)の構造は同じであるので、クラスタの代表シーンベクトルを、そのクラスタの特徴とすることができる。具体的には、以下のような手順で代表シーンベクトルを生成する。
まずクラスタに属するシーンベクトルを参照し、シーンまたはイベントの出現頻度を時刻ごとに集計する。各時刻におけるシーンのうち最も頻度が高い、または所定割合以上(例えば50%以上)を占めるシーン(1つ以上)をその時刻における典型的なシーンとし、そのシーンを表す数値を当該時刻に対応する代表シーンベクトルのシーン値とする。このとき各時刻におけるシーンの頻度分布を記録しておき、後の代表シーンベクトルの可視化において分析者の指示によりシーンの分布情報(分散値など)を提示してもよい。
(2.4.2)代表シーンベクトルの可視化
生成した代表シーンベクトルを表示する際、シーン毎に色を設定して表示する。これにより、シーンの遷移をより視覚的に把握することができる。さらには、シーン遷移を状態遷移図として表示してもよい。具体的には、シーン毎にノードの色を設定し、さらにシーンの長さ(時間長)にしたがってノードの大きさを設定してシーン間の遷移を矢印で表現する。これにより、クラスタの特徴をより視覚的に把握することができる。
(2.5)補足
(2.1)生活パタン抽出条件設定、(2.2)シーンベクトルの抽出、(2.3)シーンベクトルクラスタリング、(2.4)生活パタン表示は、それぞれ1回のみの実行とは限らない。本発明の行動属性分析装置1では、(2.4)生活パタン表示の結果を受けて生活パタンの抽出条件を変え、再度シーンベクトルを抽出しクラスタリングを実行するなど、試行を繰り返して所望の分析結果を得ることができる構成とする。そのため抽出した生活パタンは、分析者からの削除の指示がない限り抽出条件とともに保存しておく。
分析者によるパタン抽出の試行を効率化するため、パタンの抽出条件を統計的に分析する機能を有してもよい。具体的には、抽出条件に含まれる項目についてそれぞれマッチするシーンベクトルの数を表示する、あるいは各項目をクロス集計して表示するなどである。例えば、「×月○日から□日までx駅に来た人」を「日付」と「x駅に滞在したときのシーン」別に集計してマトリクス表示するなどである。
(2.4)生活パタン表示では、分析者が興味を持ったクラスタにマッチする利用者についてドリルダウン分析できるよう、クラスタに属するシーンベクトルに対応する利用者のIDを出力できる機能を設ける。
上記説明は、パタンの抽出条件を設定し、シーンベクトルを抽出してクラスタリングするというものであったが、これに限らない。基本となる抽出条件があり、それに対し少しずつ条件を変えて生活パタンを抽出したい場合は、まず基本となる抽出条件を用いて生活パタンを抽出しておき、次回以降はクラスタリングを実行せずに前記基本となる抽出条件から抽出した生活パタンにシーンベクトルを割り振るようにしてもよい。例えば「ある駅に来る人の生活パタンを毎月知りたい」場合、まず数カ月分の行動の履歴から生活パタンを抽出し、各クラスタの平均ベクトル(重心)を計算しておく。次に最新の行動履歴が1カ月分蓄積されたら、対象となるシーンベクトル(「ある駅に来る人のシーンベクトル」)を抽出し、各シーンベクトルに対して次の処理を実施する。すなわち当該シーンベクトルと前記計算しておいた各クラスタの平均ベクトルとの間の類似度を計算し、もっとも類似度の高い平均ベクトルのクラスタにシーンベクトルを割り振る。各クラスタに割り振られたシーンベクトルの数に偏りがある、あるいはどの平均ベクトルとも類似度が低いシーンベクトルがあるなど、クラスタに均等にシーンベクトルを割り振ることができなくなれば、あらためてシーンベクトルをクラスタリングして生活パタンを再抽出する。
さらには生活パタンの代表シーンベクトルに相当するシーンベクトルを人手で生成し、生活パタン抽出条件にマッチするシーンベクトルを当該人手で作成した代表シーンベクトルに割り振ってもよい。本発明では一日のシーンの遷移をベクトルで表現するため、代表シーンベクトルは分析者が遷移するシーンの種類と順序、および遷移する時刻を指定することにより容易に生成できる。
(3)生活パタンクラスタ分析
クラスタリングにより抽出された生活パタンは、人々が過ごしている典型的な一日を表す。しかし同じ利用者でも例えば平日と休日では一日の過ごし方は異なることが多い。その一方である程度の期間でみると一人の利用者が過ごす典型的な一日には一定の傾向が見られ、「その人らしさ」を表している。あるいはある特定の場所(街、お店、観光スポットなど)に集まる人にはある種の傾向があり(「アクティブなサラリーマン」「普段は家にいることが多い人」など)、その「場所らしさ」を表していることがある。
そこで本発明では、利用者ごとに行動履歴のなかで各生活パタンが出現する頻度を取得し、これを各利用者の特徴量としてクラスタリングを実施する。あるいは場所(街の中心となる駅や施設など)が分析対象である場合は、当該場所を利用した利用者の生活パタンを収集し、その出現頻度をもって当該場所の特徴量とする。これらの特徴量は、利用者あるいはある場所を利用する利用者がどのようなシーンをどのような遷移でどのよう割合で過ごしているかという生活のスタイルを表現している。本発明では、この特徴量を用いて利用者や場所をクラスタリングすることにより、利用者や場所を生活スタイルに基づき分類する。
本ステップの生活パタンクラスタ分析においては、まずクラスタ分析の条件を設定し、分析対象を特徴づけるベクトルを生成し、クラスタリングを実行して、結果を分析者に表示する。以下、各ステップについて説明する。
(3.1)クラスタ分析条件設定
分析のニーズにしたがって、クラスタ分析の対象および対象の特徴付けに用いる生活パタンを分析者が設定する。一例を示す。
(3.1:分析条件の例1)
分析ニーズ:「×月△日○駅に遊びに来た人の普段の生活が知りたい」
分析対象:「×月△日○駅に遊びに来た人」
利用する生活パタン:「×月△人○駅に来た人の1カ月のシーンベクトルから抽出した生活パタン」
(3.1:分析条件の例2)
分析ニーズ:「都内在住の20代女性がどのようなシーンでコンビニを利用しているのか知りたい」
分析対象:「コンビニ」
利用する生活パタン:「コンビニの利用実績がある都内在住20代女性のシーンベクトルに利用時刻で重みづけして抽出した生活パタン」
例1は分析ニーズが「×月△日○駅に遊びに来た人の普段の生活」であるため、分析対象者のその日の生活パタンではなく、例えば×月1カ月間など長い期間から抽出した生活パタンを用いる。一方で例2はコンビニの利用のされ方を知りたいので、コンビニが利用された日のシーンベクトルで、かつコンビニでの利用時刻に重みを付けたシーンベクトルから抽出した生活パタンを用いる。
(3.2)特徴ベクトル生成
(3.1)で設定したクラスタ分析対象(「遊びに来た人」「コンビニ」など)について、設定した生活パタンの出現頻度をカウントし、生活パタン数を次元数とし各生活パタンの出現頻度を値とする特徴ベクトルを生成する(表示例は図36参照)。
このとき、生活パタンの出現頻度に重みをつけてもよい。生活パタンによっては分析対象に共通して出現するものもあれば、少数の分析対象のみに出現するものもある。前者は分析対象の特徴付けには効果がなく、かえってノイズになると思われる生活パタンであり、後者はその逆である。これに対してtf−idf法などを用いて生活パタンの出現頻度に重みづけする。
(3.3)特徴ベクトルクラスタリング
生成した特徴ベクトルを用いて、分析対象をクラスタリングする。すなわち、生活パタンの出現頻度が類似している分析対象をまとめる。クラスタリングの具体的な手段はシーンベクトルクラスタリングと同様であるので、ここでは説明を省略する。これにより、例えば平日は朝自宅を出て仕事に行くパタンが多く、休日は午後遊びに行くパタンが多い利用者のクラスタ、平日も休日も昼自宅を出て遊びに行くパタンが多い利用者のクラスタなど生活パタンの出現頻度に応じたクラスタが生成される。
(3.4)クラスタ表示
生活パタン抽出と同様に、クラスタリングの結果は、自動的に生成されたクラスタのIDと、各クラスタに属する特徴ベクトルのIDのリストである。これらを分析者にわかりやすく表示するため本発明では次のような手段を提供する。
まず各クラスタを各クラスタにおいて特徴的に出現する生活パタンで特徴づける。具体的には、各クラスタに属する特徴ベクトルの平均ベクトルを生成し、平均ベクトルにおいてベクトル値が閾値以上の属性、すなわち生活パタンのIDを取得して代表生活パタンとする。次にこの代表生活パタンの代表シーンベクトルを取得し、シーンの遷移として分析者に表示する。代表シーンベクトルおよびその可視化については、(2)生活パタン抽出の(2.4)生活パタン表示で述べたのでここでは説明を省略する。
また各クラスタについて分析者が容易にドリルダウン分析やスライス&ダイス分析を実施できるよう、本発明では次のような手段を提供する。
(3.4.1)グラフ表示機能
分析者が選択したクラスタについて、当該クラスタに属する分析対象の詳細をグラフ表示する。具体的には、分析対象が利用者の場合は利用者の性別、年代、住所など利用者の属性を参照して、場所の場合は住所や場所の分類(駅や店舗など)などの属性を参照して、各生活パタンクラスタに属する分析対象の内訳をグラフ表示する。グラフは、円グラフや棒グラフなどいくつかのタイプから選択できるものとする。さらに内訳として利用する属性はシステム提供以外のものでもよい。分析者が何らかの手段を使って得た利用者または場所の属性、例えば利用者ごとのクレジットカードの利用金額や、ある店舗におけるクレジットカードの利用金額などをシステムに読み込ませ、それらを属性として参照し、クラスタの内訳をグラフ表示してもよい。
(3.4.2)マトリクス表示
分析者が1つ以上選択した生活パタンクラスタについて、当該クラスタに属する分析対象の詳細をマトリクス表示する。具体的には、分析者が選択した属性(例えば利用者の性別や年代など、上記参照)を分析軸とし、生活パタンクラスタごとに分析軸に対応する分析対象の数をマトリクス形式で表示する。例えば、「生活パタンクラスタ1に属する利用者は男性が51人で女性が69人」などである。さらに分析軸は、階層的に設定できるものとする。例えば分析者は分析軸としてまず性別、その下位の分析軸として年代を設定することができ、この場合「生活パタンクラスタ1に属する利用者は男性51人で、そのうち30代が17人、40代が12人・・・」のようにマトリクス表示する。さらには前述の分析者が読み込ませた属性も分析軸として設定可能とする。例えば「生活パタンクラスタ1に属する利用者は男性51人で、そのうちクレジットカードの利用金額が1万円以上は14人、3万円以上は9人・・・」などをマトリクス表示する。また上記マトリクス表示において分析軸間の関連性を統計的に分析するための機能を有してもよい。具体的には分析軸間の独立性(x自乗検定)や無相関の検定機能、相関行列や分散行列の生成析機能などである。
(3.5)補足
(3.1)クラスタ分析条件設定、(3.2)特徴ベクトル生成、(3.3)特徴ベクトルクラスタリング、(3.4)クラスタ表示はそれぞれ1回のみの実行とは限らない。本発明の行動属性分析装置1では、(3.4)クラスタ表示の結果を受けてクラスタ分析の条件を変え、再度特徴ベクトルを生成しクラスタリングを実行するなど、試行を繰り返して所望の分析結果を得ることができる構成とする。そのため生活パタンクラスタ分析で生成したクラスタは、分析者からの削除の指示がない限り生成条件とともに保存しておく。また(3.4)クラスタ表示では、分析者が興味を持った生活パタンクラスタについてドリルダウン分析できるよう、各生活パタンクラスタに属する分析対象(利用者または場所)のIDを出力できる機能を設ける。
さらに(2)生活パタン抽出と(3)生活パタンクラスタ分析は、1回の分析でそれぞれ1回のみの実行とは限らない。データ分析においては、同じデータに対していくつかの異なる観点から分析したり、あるデータを分析した結果に基づきデータを絞り込んでさらに分析したりすることが一般的である。本発明の行動属性分析装置1では、(3)生活パタンクラスタ分析の結果に基づき、生活パタン抽出の条件を変えて再度(2)生活パタン抽出を実行することができる。
以上、上記説明では(2)において一日を単位とする生活パタンを抽出し、(3)において生活パタンの出現頻度を特徴量とするベクトルを生成して利用者や場所などをクラスタリングするという「2段階クラスタリング」の手法を説明した。
(4)2段階クラスタリング以外の手段
クラスタリングは2段階のみとは限らない。ここでは他の手段として(3)の利用者や場所などのクラスタリングにおいて利用者や場所の特徴ベクトルをクラスタリング以外の手段で分類する手法を説明する。また、(2)において抽出された一日の生活パタンを使ってある期間の生活パタンを抽出し、利用者や場所などをクラスタリングする手法について説明する。
(4.1)ペルソナを利用した利用者/場所の分類
上記(3)ではクラスタ分析の分析条件を設定し、特徴ベクトルを生成してクラスタリングするが、クラスタリングの手法はこれに限らない。例えば、分析者が具体的に想定している利用者像(ペルソナ)や場所の使われ方のイメージがあり、それに沿った形態で利用者/場所を分類したい場合は、抽出した生活パタンを使って人為的に特徴ベクトルを生成し、抽出した生活パタンによって特徴づけられた利用者/場所を人為的に生成した特徴ベクトルに割り振ることにより、分析対象を分類する。
例えば「平日の生活パタンは直行直帰が主で、休日は朝から出かけて夕方早目に帰宅する生活パタンの利用者」「平日は帰宅時に寄り道する生活パタンが多く、休日は遅めに出かけて深夜に帰宅する生活パタンの利用者」といった利用者像があらかじめ想定されており、ある駅を利用する人をこれら利用者像にあてはめて分類したい場合、分析者はすでに抽出された生活パタンを使ってこれら利用者像を特徴ベクトルで表現する。具体的には、1カ月間において平日の直行直帰の生活パタンが○回、休日の朝から出かける生活パタンが×回など、利用者像にマッチする生活パタンを選択して期間における出現頻度を分析者が指定する。この分析者が指定した特徴ベクトルに対して分析対象の利用者/場所の特徴ベクトルとの類似度を計算して、もっとも類似度の高い利用者度像に分析対象の利用者/場所を割り振る。
(4.2)多段階クラスタリング
「多段階クラスタリング」とは、一日を単位とする生活パタンを使って、1週間あるいは10日間など一定の期間を単位とする期間の生活パタンを抽出し、当該パタンの出現頻度を特徴量とするベクトルを生成して利用者や場所などをクラスタリングする手法である。「多段階クラスタリング」において一日の生活パタンの抽出は(2)生活パタン抽出と同じであるので説明を省略する。この一日の生活パタンを用いて一例として利用者の1週間の生活パタンを生成する。そして1週間の生活パタンの出現頻度を用いて利用者の特徴ベクトルを生成しクラスタリングを実施する。この処理は(3)生活パタンクラスタリング分析と同様であるので説明を省略する。1週間の生活パタンを抽出する処理手順の詳細について説明する。
(4.2.1)
生活パタン抽出において生成された生活パタンに、識別可能なIDを付与する。クラスタリングではアルゴリズムが自動的にクラスタ番号を付与するが、このクラスタ番号をクラスタ間の類似度に基づいて振り直す。具体的には各クラスタの平均ベクトル(クラスタに属するシーンベクトルの平均)を生成し、平均ベクトルを長さの降順にソートしてその結果順に1から始まるIDを振る、あるいは平均ベクトルのうち任意の1つを選択し、残りのベクトルについて前記選択したベクトルとの類似度(ユークリッド距離など)を計算しその値の降順に残りのベクトルをソートしてその結果順(一番最初は選択したベクトル)に1から始まるIDを振る、などの手順が考えられる。
(4.2.2)
生活パタン抽出で対象としたシーンベクトルにはクラスタリングによって自動的に生成されたクラスタIDが付与されているが、それらを上記ふり直したクラスタIDに変換し、利用者を第1キー、日付を第2キーとしてシーンベクトルをソートする。
(4.2.3)
生活パタンを抽出した利用者ごとに次の処理を実施する。まず利用者のシーンベクトルを日付順に7日間に分割し、シーンベクトルが属する生活パタンのID(振り直したID)を属性値とする7次元の属性ベクトルを生成する。シーンベクトルを抽出した期間が7の倍数でない場合、7日間(7次元)に満たない余りが生じるが、ここではそれらは無視する。また該当するシーンベクトルがない日付があればその日の値は「0」とする。
(4.2.4)
全利用者に関して上記(4.2.3)の処理を実施して7次元の属性ベクトルを複数生成し、それらをクラスタリングして7日間の生活パタンを抽出する。
以上、本発明の概要について説明した。以下では具体的な実施形態について、図面を参照して説明する。
<実施の形態1>
本発明の実施形態1では、交通系ICカードの利用履歴を用いて利用者の生活パタンを抽出し、当該生活パタンを用いて利用者をクラスタリングする行動属性分析装置について説明する。
(システムの全体構成)
図1は、本実施形態1に係る行動属性分析装置1の構成図である。行動属性分析装置1は、ICカード利用履歴103およびクレジットカード利用履歴104を入力とし、分析リポート309を出力とする。ICカード利用履歴103は、交通系ICカード81の利用者が交通系ICカード81を駅の改札機82や店舗に設置された端末機83で利用した履歴を格納したデータである。クレジットカード利用履歴104は、クレジットカード(図示せず)の利用者がクレジットカードを店舗などで支払いに利用した履歴を格納したデータである。分析レポート309は分析対象をクラスタ分析した結果を格納したレポートである。
行動属性分析装置1は、人集合の行動属性を用いて分析対象を分類する装置であり、大きく次の3つの機能部から構成される。すなわちシーンベクトル生成部10、生活パタン抽出部20、生活パタンクラスタ分析部30である。
(システムの機能構成:シーンベクトル生成部10)
シーンベクトル生成部10は、人の行動履歴から利用者の一日のシーンの遷移を表すシーンベクトルを生成する。その入力はICカード利用履歴103およびクレジットカード利用履歴104に格納されたデータであり、シーンリスト105、イベントリスト106、およびシーンベクトルテーブル107にデータを出力する。これら入出力データの詳細については、データ構成の説明において図を用いて詳述する。
シーンベクトル生成部10は、さらにシーン抽出部101、およびイベント抽出部102の2つの機能部を有する。これら機能部の詳細については、処理手順の説明においてフローチャートを使って詳述する。
(システムの機能構成:生活パタン抽出部20)
生活パタン抽出部20は、分析者が設定した抽出条件にしたがってシーンベクトルを抽出し、これに対してクラスタリングを実行して生活パタンを抽出する。その入力は、シーンリスト105、イベントリスト106、およびシーンベクトルテーブル107に格納されたデータであり、ターゲットシーンベクトルテーブル205および生活パタンテーブル206にデータを出力する。またテンポラリデータとして抽出条件207およびパラメタ208を生成する。さらに参照データとして、ユーザ情報209、場所情報210およびカレンダ情報211に格納されたデータを利用することもある。これら入出力データ並びに参照データの詳細およびテンポラリデータの一例については、データ構成およびテンポラリデータの説明において図を用いて詳述する。
生活パタン抽出部20は、さらにパタン抽出条件設定部201、シーンベクトル抽出部202、シーンベクトルクラスタリング部203、および生活パタン表示部204の4つの機能部を有する。これら機能部の詳細については、処理手順の説明においてフローチャートを使って詳述する。
(システムの機能構成:生活パタンクラスタ分析部30)
生活パタンクラスタ分析部30は、分析者が設定した分析条件にしたがって分析対象の特徴ベクトルを生成し、クラスタリングを実行して分析対象のクラスタを生成する。その入力は、ターゲットシーンベクトルテーブル205および生活パタンテーブル206に格納されたデータであり、特徴ベクトルテーブル305およびクラスタテーブル306にデータを出力する。またテンポラリデータとして分析条件307およびパラメタ308を生成する。これら入出力データの詳細およびテンポラリデータの一例については、データ構成およびテンポラリデータの説明において図を用いて詳述する。
生活パタンクラスタ分析部30は、さらにクラスタ分析条件設定部301、特徴ベクトル生成部302、特徴ベクトルクラスタリング部303、およびクラスタ表示部304の4つの機能部を有する。これら機能部の詳細については、処理手順の説明においてフローチャートを使って詳述する。
上記各機能部は、これらの機能を実現する回路デバイスなどのハードウェアを用いて構成することもできるし、CPU(Central Processing Unit)などの演算装置とその動作を規定するプログラムによって構成することもできる。以下では上記各機能部をプログラムとして実装したものと想定する。上記各データ、テーブル、リストなどのデータ類は、ハードディスクなどの記憶装置に格納することができる。
(ハードウェア構成)
図2は、行動属性分析装置1のハードウェア構成を示す図である。図2に示すように行動属性分析装置1は、CPU2、ハードディスク3、メモリ4、ディスプレイ制御部5、ディスプレイ51、キーボード制御部6、キーボード61、マウス制御部7、およびマウス71を備える。CPU2は、データの入出力、読み込み、格納、および図1で説明した各機能部を実装したプログラムを実行する。ハードディスク3は図1で説明した各データを保存する記憶装置、メモリ4はプログラムおよびデータを一時的にロードして記憶する装置である。ディスプレイ51はユーザにデータを表示する装置であり、ディスプレイ制御部5によって制御される。キーボード61およびマウス71はユーザからの入力を受け付ける装置であり、それぞれキーボード制御部6およびマウス制御部7によって制御される。
(データ構成)
次に、図1で説明した各データの構成について図3〜図18を用いて説明する。
(データ構成:ICカード利用履歴103)
図3は、ICカード利用履歴103のデータ構成を示す図である。ICカード利用履歴103は、利用者が交通系ICカードを利用した履歴を格納したデータであり、利用者が駅の改札機や精算機、店舗などに設置された端末機などにおいてカードをタッチした記録が格納されている。
ICカード利用履歴103は、利用者ID10301、時刻10302、駅名/店舗名10303、端末機タイプ10304、および金額10305を有する。利用者ID10301は、交通系ICカード81の利用者のIDを格納するエリアであり、ICカード乗車券81に格納されている利用者のIDを改札機82や端末機83のリーダライタ装置が読み込むことにより取得される。時刻10302は、利用者が改札機82や端末機83を利用した時刻を格納するエリアである。駅名/店舗名10303は、交通系ICカードが利用された駅名または店舗名を格納するエリアである。端末機タイプ10304は、交通系ICカードが利用された端末機のタイプを格納するエリアであり、本実施形態1では「入場改札機」、「出場改札機」、「店舗端末」および「チャージ端末」の4種類があるものとする。金額10305は、改札機82や端末機83で支払われた金額を格納するエリアである。
(データ構成:クレジットカード利用履歴104)
図4は、クレジットカード利用履歴104のデータ構成を示す図である。クレジットカード利用履歴104は、利用者がクレジットカードを利用した履歴を格納したデータであり、利用者の第2の行動履歴として用いられる。
クレジットカード利用履歴104は、カードID10401、時刻10402、店舗名10403、および金額10404を有する。カードID10401は、クレジットカードのIDを格納するエリアである。時刻10402は、クレジットカードが利用された時刻を格納するエリアである。店舗名10403は、クレジットカードが利用された店舗名を格納するエリアである。金額10404は、利用者がクレジットカードを利用して精算した金額を格納するエリアである。
(データ構成:シーンリスト105)
図5は、シーンリスト105のデータ構成を示す図である。シーンリスト105は、利用者が過ごしたシーンを格納したデータであり、シーン抽出部101によって生成される。シーンリスト105は、利用者ID10501、シーン名10502、開始時刻10503、終了時刻10504、場所ID10505、およびシーンベクトルID10506を有する。
利用者ID10501は、交通系ICカード81の利用者のIDを格納するエリアである。シーン名10502は、ICカード利用履歴103から抽出したシーン名を格納する。本実施形態1では、シーンには平日/休日を問わず夜から朝にかけて過ごす「自宅」、平日の日中に長時間過ごす「仕事」、休日出かけ先で長時間過ごす「レジャー」、および平日/休日問わず出かけ先で短時間過ごす「おでかけ」の4つがあるものとする。これらシーンの抽出手順については後述する。開始時刻10503はシーンが開始した時刻を、終了時刻10504はシーンが終了した時刻を格納する。本実施形態1では改札機の通過を持ってシーンが切り替わると考える。具体的にはある駅に入場した時点でそれまでのシーンが次のシーンに切り替わるとする。また一般的に人は朝は自宅から出発して夜自宅に戻ると考えられる。そこで本実施形態1ではその日最初のシーンは「自宅」であり、最初の改札機の通過(入場)を境に次のシーンへ切り替わる。すなわち一日の最初のシーン「自宅」は一日の最初の改札機の通過時刻で終了し、次のシーンが「仕事」であれば改札機の通過時刻をもって「仕事」のシーンの開始時刻とする。利用者が勤め先の最寄り駅に到着して出場改札機を通過(出場)し、何時間かその場所に滞在したあと、同じ駅で入場改札機を通過(入場)すると「仕事」のシーンは終了し、次のシーンが開始する。このように交通系ICカードの利用履歴からシーン抽出する場合、シーンの開始・終了時刻は改札機の通過(入場)時刻であり、シーンを過ごした場所は駅名(出場駅名)となる。したがって場所ID10505は、利用者がシーンを過ごした場所、すなわち出場した駅のIDを格納する。シーンベクトルID10506は、当該レコードに格納されたシーンを含むシーンベクトルのIDを格納する。
シーンリスト105はこれまで抽出したすべての利用者の全てのシーンをまとめて格納しているが、これに限らない。例えば一日、一週間、一か月などの期間ごとに、あるいは利用者のIDごと、シーンごとに分割して格納してもよい。
(データ構成:イベントリスト106)
図6は、イベントリスト106のデータ構成を示す図である。イベントリスト106は、利用者が過ごしたイベントを格納したデータであり、イベント抽出部102によって生成される。図6に示すようにイベントリスト106は、利用者ID10601、イベント名10602、時刻10603、場所ID10604、金額10605、およびシーンベクトルID10606を有する。
利用者ID10601は、交通系ICカードの利用者のIDを格納するエリアである。イベント名10602は、ICカード利用履歴103およびクレジットカード利用履歴104から抽出したイベントの名称を格納する。本実施形態1では、イベントは交通系ICカードの電子マネー機能またはクレジットカードによる「支払い」、および交通系ICカードのチャージ機能による「入金」の2つがあるものとする。これらイベントの定義および抽出手順については後述する。時刻10603はイベントが発生した時刻を、場所ID10604はイベントが発生した場所のIDを格納する。金額10605は「支払い」および「入金」によって取引された金額を格納する。シーンベクトルID10606は、当該レコードに格納されたイベントを対応付け可能なシーンベクトルのIDを格納する。
本実施形態1におけるイベントリスト106はこれまで抽出したすべての利用者の全てのイベントをまとめて格納しているが、これに限らない。例えば一日、一週間、一か月などの期間ごとに、あるいは利用者のIDごと、イベントごとに分割して格納してもよい。
(データ構成:シーンベクトルテーブル107)
図7は、シーンベクトルテーブル107のデータ構成を示す図である。シーンベクトルテーブル107は、シーンベクトルを格納したデータであり、シーンベクトル生成部10によって生成される。本実施形態1では、一日を午前3時から翌日の午前3時までとし、シーンベクトルは1時間を単位とする24次元のベクトルとして表現する。また前述のように本実施形態1では、シーンは「自宅」「仕事」「レジャー」「おでかけ」の4つであり、それぞれシーンを表す数値は「1」、「4」、「2」、「3」とする。したがって、本実施形態1におけるシーンベクトルは、「1」、「4」、「2」、「3」のいずれかが値にセットされた24次元のベクトルである。
シーンベクトルテーブル107は、シーンベクトルID10701、利用者ID10702、日付10703および時刻10704を有する。ID10701はシーンベクトルを識別するIDを格納する。利用者ID10702は、シーンベクトルに対応する利用者のIDを、日付10703はシーンベクトルに対応する日付を格納する。時刻10704は、各時刻におけるシーン値を格納する。時刻10704は24に分割され、午前3時のシーンの値を格納する「3」から翌日の午前2時のシーンの値を格納する「26」のエリアがある。
本実施形態1におけるシーンベクトルテーブル107はこれまで抽出したすべての利用者の全てのシーンベクトルをまとめて格納しているが、これに限らない。例えば一日、一週間、一か月などの期間ごとに、あるいは利用者のIDごとに分割して格納してもよい。
(データ構成:ターゲットシーンベクトルテーブル205)
図8は、ターゲットシーンベクトルテーブル205のデータ構成を示す図である。ターゲットシーンベクトルテーブル205は、生活パタン抽出部20が抽出条件にしたがってクラスタリング対象となるシーンベクトル(以下、ターゲットシーンベクトルと呼ぶ)を抽出したデータである。ターゲットシーンベクトルテーブル205には、シーンベクトルテーブル107に格納されたシーンベクトルのうち生活パタン抽出の条件にマッチしたものが格納される。生活パタン抽出の条件によってはベクトル値に重みを付けたり、属性を付加することがある。
ターゲットシーンベクトルテーブル205は、ターゲットシーンベクトルID20501、利用者ID20502、場所ID20503、日付20504、時刻20505、属性20506およびパタンID20507を有する。
ターゲットシーンベクトルID20501は、ターゲットシーンベクトルを識別するIDを格納する。利用者ID20502は当該レコードに格納されたターゲットシーンベクトルの利用者IDを、場所ID20503は当該レコードに格納されたターゲットシーンベクトルに含まれるシーン/イベントが発生した場所のIDを格納する。日付20504は日付を格納する。時刻20505は、各時刻におけるシーンの値または重みづけられたシーンの値を格納する。属性20506は、抽出条件に応じて付加された属性を格納する。属性の数は抽出条件によって異なるため属性の数は不定である。パタンID20507は、生活パタン抽出部20のシーンベクトルクラスタリング部203がターゲットベクトルをクラスタリングした結果、当該レコードのターゲットシーンベクトルが属することになったクラスタのID(=生活パタンのID)を格納する。
ターゲットシーンベクトルテーブル205は、生活パタン抽出部20がシーンベクトルを抽出するごとに生成される。生成されたターゲットシーンベクトルテーブル205はターゲットシーンベクトルテーブルIDによって識別され、分析者からの削除の指示がない限り保存される。
(データ構成:生活パタンテーブル206)
図9は、生活パタンテーブル206のデータ構成を示す図である。生活パタンテーブル206は、ターゲットシーンベクトルをクラスタリングした結果を格納したデータである。本実施形態1では、クラスタリングのアルゴリズムとしてk−means法を用いる。生成するクラスタの数は生活パタン抽出部20のパラメタとして指定する。また生成されるクラスタのIDはアルゴリズムが自動的に付与するが、このIDを各クラスタに対応する生活パタンのIDとして用いる。
生活パタンテーブル206は、図9(a)に示す生活パタンリストテーブル20600と(b)に示すクラスタリング結果テーブル20610を有する。生活パタンリストテーブル20600は、これまでに抽出した生活パタンの抽出条件やパラメタなどを格納したデータであり、クラスタリング結果テーブル20610はターゲットシーンベクトルをクラスタリングした結果を格納したデータである。クラスタリング結果テーブル20610は、生活パタン抽出部20がクラスタリングを実行するごとに生成される。生成されたクラスタリング結果テーブル20610はクラスタリング結果IDで識別され、分析者からの削除の指示がない限り保存される。
生活パタンリストテーブル20600は、生活パタンリストID20601、生活パタンリスト名称20602、生成日20603、ターゲットシーンベクトルテーブルID20604、抽出条件20605、クラスタリング結果ID20606、およびパラメタ20607を有する。
生活パタンリストID20601は、生活パタンリストテーブル20600に格納されたシーンベクトルの抽出条件やクラスタリング結果を識別するためのIDを格納する。生活パタンリスト名称20602は、シーンベクトルの抽出条件やクラスタリング結果に対して分析者がわかりやすさのために付与した名称を格納する。生活パタンリスト名称20602は、初期状態では生活パタンリストIDを格納する。生成日20603はクラスタリングを実行した日付を格納し、ターゲットシーンベクトルテーブルID20604はターゲットシーンベクトルテーブル205の説明で述べたターゲットシーンベクトルテーブル205を識別するためのIDを格納する。抽出条件20605は、ターゲットシーンベクトルを生成するために分析者が設定した条件を格納する。図9中、抽出条件20605には一例として「2010年12月1日にX駅に・・・」等の自然文で記載された抽出条件を格納しているが、これはわかりやすさのためであり、実際にはパタン抽出条件設定部201が設定した条件と値の組のリストである。クラスタリング結果ID20606は、ターゲットシーンベクトルをクラスタリングした結果を格納したクラスタリング結果テーブル20610に付与されるIDを格納する。パラメタ20607は、ターゲットシーンベクトルをクラスタリングするために分析者が設定したパラメタを格納する。
クラスタリング結果テーブル20610は、パタンID20611、パタン名称20612、平均ベクトル20613、代表シーンベクトル20614、ベクトル件数20615、およびターゲットシーンベクトルID20616を有する。
パタンID20611は、シーンベクトルクラスタリング部203が各クラスタに付与したIDを格納する。パタン名称20612は、各クラスタに対して分析者がわかりやすさのため付与した名称を格納する。パタン名称20612は、初期状態ではパタンIDを格納する。平均ベクトル20613は、当該クラスタに属するシーンベクトルの平均ベクトルを格納する。代表シーンベクトル20614は、クラスタを代表するシーンベクトルを格納する。代表シーンベクトル20614は、分析者に表示するためのベクトルであり、当該クラスタの特徴を表すベクトルである。代表シーンベクトルの生成については後述する。ベクトル件数20615は、クラスタに属するターゲットシーンベクトルの件数を格納する。ターゲットシーンベクトルID20616は、クラスタに属するターゲットシーンベクトルのIDを格納する。このターゲットシーンベクトルは、生活パタンリストテーブル20600のターゲットシーンベクトルテーブルID20604に格納されたIDで識別されるターゲットシーンベクトルテーブル205に格納されている。
(データ構成:ユーザ情報209)
図10は、ユーザ情報209のデータ構成を示す図である。ユーザ情報209は、利用者の氏名、性別、生年月日などの利用者の属性情報を格納したデータである。本実施形態1では、交通系ICカードの利用履歴およびクレジットカードの利用履歴を利用者の行動の履歴として用いる。そのためユーザ情報209には、交通系ICカードおよびクレジットカードの利用者の情報が格納されている。
ユーザ情報209は、交通系ICカード利用者情報20900とクレジットカード所有者情報20910を有する。図10(a)は交通系ICカード利用者情報20900のデータ構成を示す図、図10(b)はクレジットカード所有者情報20910のデータ構成を示す図である。
交通系ICカード利用者情報20900は、利用者ID20901、氏名20902、生年月日20903、性別20904、住所20905、電話番号20906、およびe−mail20907を有する。利用者ID20901は、交通系ICカードの利用者のIDを格納する。氏名20902は、利用者の氏名を格納する。生年月日20903は利用者の生年月日を格納し、性別20904は利用者の性別を格納する。住所20905は利用者の住所を格納し、電話番号20906は利用者の電話番号を格納する。e−mail20907は、利用者のメールアドレスを格納する。
クレジットカード所有者情報20910は、カードID20911、氏名20912、生年月日20913、性別20914、住所20915、および電話番号20916を有する。カードID20911は、クレジットカードのIDを格納する。氏名20912は、カード所有者の氏名を格納する。生年月日20913はカード所有者の生年月日を格納し、性別20914はカード所有者の性別を格納する。住所20915はカード所有者の住所を格納し、電話番号20916はカード所有者の電話番号を格納する。
(データ構成:場所情報210)
図11は、場所情報210のデータ構成を示す図である。場所情報210は、場所の属性情報を格納したデータである。本実施形態1では、交通系ICカードの利用履歴およびクレジットカードの利用履歴を利用者の行動の履歴として用いるので、場所情報210には、交通系ICカード履歴103およびクレジットカード利用履歴104内に格納されている、交通系ICカードおよびクレジットカードを利用可能な駅や店舗の情報が格納されている。
場所情報210は、場所ID21001、名称21002、分類21003、エリア21004、住所21005およびe−mail21006を有する。場所ID21001は、場所のIDを格納する。名称21002は、場所の名称を格納する。分類21003は場所の分類を格納する。本実施形態1では場所は「駅」、「店舗」、「施設」の3種類があるものとする。エリア21004は駅や店舗、施設が立地しているエリア名を格納する。駅の場合は路線名、店舗や施設の場合は店舗が立地しているビルやエリアの名称を格納する。住所21005は、駅や店舗の住所を格納する。e−mail21006は駅や店舗に送信される情報の宛先となるメールアドレスを格納する。
(データ構成:カレンダ情報211)
図12は、カレンダ情報211のデータ構成を示す図である。カレンダ情報211は、曜日や祝日などのカレンダ情報を格納したデータである。本実施形態1では、日本の一般的なカレンダ情報を用いる。すなわち月〜金が平日、土日および祝祭日を休日とする。
カレンダ情報211は、日付21101、曜日21102、および平日/休日21103を有する。日付21101は、ICカード利用履歴103に格納されている期間の日付を格納する。曜日21102は、日付21101に格納された日付の曜日を格納する。平日/休日21103は、日付21103に格納された日付が平日か休日かの区別を格納する。
(データ構成:特徴ベクトルテーブル305)
図13は、特徴ベクトルテーブル305のデータ構成を示す図である。特徴ベクトルテーブル305は、利用者/場所など生活パタンクラスタ分析部30が分析対象とする特徴ベクトルを格納したデータである。
特徴ベクトルテーブル305は、特徴ベクトルID30501、分析対象ID30502、および生活パタンID30503を有する。特徴ベクトルテーブル30501は、特徴ベクトルを識別するIDを格納する。分析対象ID30502は、生活パタンクラスタ分析の対象を識別するIDを格納する。具体的には、分析対象が利用者の場合は利用者のIDを、場所の場合は場所のIDを格納する。生活パタンID30503は、分析対象を特徴づける生活パタンのIDを要素番号とし、その出現頻度(重み付き)を要素値とするベクトルを格納する。具体的には、生活パタンテーブル206のクラスタリング結果テーブル20610のパタンID20611に格納された生活パタンのIDを要素番号とすればよい。
特徴ベクトルテーブル305は、生活パタンクラスタ分析部30が特徴ベクトルを生成するごとに生成される。生成された特徴ベクトルテーブル305は特徴ベクトルリストIDで識別され、分析者からの削除の指示がない限り保存される。
(データ構成:クラスタテーブル306)
図14は、クラスタテーブル306のデータ構成を示す図である。クラスタテーブル306は、特徴ベクトルをクラスタリングした結果を格納する。本実施形態1では、クラスタリングのアルゴリズムとしてk−means法を用いる。生成するクラスタの数は生活パタンクラスタ分析部30のパラメタとして指定する。また生成されるクラスタのIDは、アルゴリズムが自動的に付与する。
クラスタテーブル306は、図14(a)に示すクラスタリストテーブル30600、図14(b)に示すクラスタリング結果テーブル30610を有する。クラスタリストテーブル30600は、これまでに生成したクラスタの生成条件やパラメタなどを格納したデータである。クラスタリング結果テーブル30610は、特徴ベクトルをクラスタリングした結果を格納したデータである。クラスタリング結果テーブル30610は、生活パタンクラスタ分析部30が特徴ベクトルのクラスタリングを実行するごとに生成される。生成されたクラスタリング結果テーブル30610は、クラスタリストテーブル30600のクラスタリング結果ID30608に格納されたIDによって識別され、分析者からの削除の指示がない限り保存される。
クラスタリストテーブル30600は、クラスタリストID30601、クラスタリスト名称30602、生成日30603、生活パタンリストID30604、特徴ベクトルリストID30605、分析対象設定条件30606、分析対象30607、クラスタリング結果ID30608、およびパラメタ30609を有する。
クラスタリストID30601は、クラスタリストテーブル30600に格納された分析対象設定条件やクラスタリング結果を識別するためのIDを格納する。クラスタリスト名称30602は、分析対象設定条件やクラスタリング結果に対して分析者がわかりやすさのために付与した名称を格納する。クラスタリスト名称30602は、初期状態ではクラスタリストIDを格納する。生成日30603はクラスタリングを実行した日付を格納し、生活パタンリストID30604は、分析対象を特徴づけるために利用した生活パタンのリストIDを格納する。特徴ベクトルリストID30605は、生活パタンを用いて分析対象を特徴づけた特徴ベクトルを格納した特徴ベクトルテーブル305のIDを格納する。分析対象設定条件30606は、分析対象を抽出するために分析者が設定した条件を格納する。図14中、分析対象設定条件30606には一例として「2010年12月1日にX駅に・・・」等の自然文で記載された設定条件を格納しているが、これはわかりやすさのためであり、実際にはクラスタ分析条件設定部301が設定した条件と値の組のリストである。分析対象30607は、分析対象が利用者か場所かを示すデータを格納する。クラスタ分析条件設定部301が分析対象として利用者を選択すると「利用者」、場所を選択すると「場所」を格納する。クラスタリング結果ID30608は、特徴ベクトルをクラスタリングした結果を格納したクラスタリング結果テーブルのIDを格納する。パラメタ30609は、特徴ベクトルをクラスタリングするために分析者が設定したパラメタを格納する。
クラスタリング結果テーブル30610は、クラスタID30611、クラスタ名称30612、平均ベクトル30613、代表生活パタン30614、特徴ベクトル数30615、および特徴ベクトルID30616を有する。
クラスタID30611は、特徴ベクトルクラスタリング部303が各クラスタに付与しれたIDを格納する。クラスタ名称30612は、各クラスタに対して分析者がわかりやすさのため付与した名称を格納する。クラスタ名称30612は、初期状態ではクラスタIDを格納する。平均ベクトル30613は、当該クラスタに属する特徴ベクトルの平均ベクトルを格納する。代表生活パタン30614は、当該クラスタを特徴づける生活パタンのIDを格納する。具体的には当該クラスタに属する特徴ベクトルの平均ベクトルのうち重みが大きい、すなわち出現頻度が高い生活パタンのIDを上位数個、あるいは重みが閾値以上の生活パタンのIDを格納する。特徴ベクトル数30615はクラスタに属する特徴ベクトルの数を、特徴ベクトルID30616にはクラスタに属する特徴ベクトルのIDを格納する。
(テンポラリデータ)
次に、図1に示すテンポラリデータについて図15〜図18にその一例を示す。
(テンポラリデータ:抽出条件207)
図15は、抽出条件207の一例を示す図である。抽出条件207は、生活パタン抽出部20において分析者が設定したシーンベクトルの抽出条件を格納したテンポラリデータである。
(テンポラリデータ:抽出パラメタ208)
図16は、抽出パラメタ208の一例を示す図である。抽出パラメタ208は、生活パタン抽出部20において分析者が設定したシーンベクトルのクラスタリング条件を格納したテンポラリデータであり、具体的には生成するクラスタ数を格納する。
(テンポラリデータ:分析条件307)
図17は、分析条件307の一例を示す図である。分析条件307は、生活パタンクラスタ分析部30において分析者が設定した特徴ベクトルの生成条件を格納したテンポラリデータである。
(テンポラリデータ:分析パラメタ308)
図18は、分析パラメタ308の一例を示す図である。分析パラメタ308は、生活パタンクラスタ分析部30において分析者が設定した特徴ベクトルのクラスタリング条件を格納したテンポラリデータであり、具体的には生成するクラスタ数を格納する。
(処理手順)
次に図19〜図39を用いて行動属性分析装置1の処理手順について説明する。
(処理手順:全体の処理手順)
図19は、本実施形態1における行動属性分析装置1の処理手順を示すフローチャートである。シーンベクトル生成部10は、まず利用者の行動の履歴が蓄積されたICカード利用履歴103およびクレジットカード利用履歴104を用いてあらかじめシーンベクトルを生成しておく(S10)。次に生活パタン抽出部20は、分析者の指定した条件にマッチするシーンベクトルを抽出してクラスタリングを実行し、生活パタンを抽出する(S20)。次に生活パタンクラスタ分析部30は、ステップS20で抽出した生活パタンを用いて分析対象の特徴ベクトルを生成し、クラスタリングを実行して分析対象のクラスタを生成する(S30)。各ステップの詳細は以下に説明する。
(シーンベクトル生成部10の処理手順)
図20は、ステップS10の処理手順を示すフローチャートである。シーンベクトル生成部10のシーン抽出部101は、ICカード利用履歴103からシーンおよびイベントを抽出してシーンリスト105およびイベントリスト106に格納し、同時に抽出したシーンをシーン値に変換してシーンベクトルテーブル107に格納する(S101)。次にイベント抽出部102は、クレジットカード利用履歴104からイベントを抽出しイベントリスト106に格納する(S102)。
なお本実施形態1におけるシーンベクトル生成部10の処理は、バッチ処理により実行する。初期状態においてはそれまでに蓄積されたすべてのICカード利用履歴103に対して上記処理を実行し、以降は毎日、その日に蓄積された利用履歴に対して処理を実行し、シーン、イベント、シーンベクトルを抽出して、それぞれシーンリスト105、イベントリスト106、およびシーンベクトルテーブル107に追加格納するものとする。
(生活パタン抽出部20の処理手順)
図21は、ステップS20の処理手順を示すフローチャートである。生活パタン抽出部20のパタン抽出条件設定部201は、分析者が指定したクラスタリングの対象となるシーンベクトルを抽出する条件およびクラスタリングのパラメタを設定し、抽出条件をシーンベクトル抽出部202に、パラメタをシーンベクトルクラスタリング部203にそれぞれ引き渡す(S201)。
シーンベクトル抽出部202は、引き渡された条件にマッチするシーンベクトルをシーンベクトルテーブル107から抽出して条件に応じて加工し、ターゲットシーンベクトルを生成する。シーンベクトル抽出部202は、そのターゲットシーンベクトルをターゲットシーンベクトルテーブル205に格納し、そのIDとシーンベクトルの抽出条件をシーンベクトルクラスタリング部203に引き渡す(S202)。
シーンベクトルクラスタリング部203は、引き渡されたパラメタ、ターゲットシーンベクトルテーブルのID、シーンベクトルの抽出条件、およびクラスタリングを実行した日付を生活パタンテーブル206の生活パタンリストテーブル20600に格納し、ターゲットシーンベクトルのテーブルIDをキーにターゲットシーンベクトルテーブル205からクラスタリング対象のシーンベクトルを取得しパラメタにしたがってクラスタリングを実行する。シーンベクトルクラスタリング部203は、クラスタリングの結果を生活パタンテーブル206のクラスタリング結果テーブル20610に格納して、生活パタンのリストのIDを生活パタン表示部204に引き渡す(S203)。
生活パタン表示部204は、引き渡された生活パタンのリストのIDをキーに生活パタンテーブル206の生活パタンリストテーブル20600およびクラスタリング結果テーブル20610から生成された生活パタンを取得して分析者に表示する(S204)。
(生活パタンクラスタ分析部30の処理手順)
図22は、ステップS30の処理手順を示すフローチャートである。生活パタンクラスタ分析部30のクラスタ分析条件設定部301は、まず分析者が指定したクラスタリングの対象となる特徴ベクトルを生成する条件およびクラスタリングのパラメタを設定する(S301)。特徴ベクトル生成部302は、設定された条件に従って特徴ベクトルを生成する(S302)。特徴ベクトルクラスタリング部303は、生成した特徴ベクトルをクラスタリングしてその結果をクラスタテーブル306に格納する(S303)。クラスタ表示部304は、分析者にクラスタを表示する(S304)。
(処理手順:シーンベクトル生成部10の詳細な処理手順)
次にシーンベクトル生成部10の詳細な処理手順について説明する。
(処理手順:シーンベクトル生成部10におけるシーン抽出部101の詳細な処理手順)
図23は、行動属性分析装置1のシーン抽出ルールおよびシーンを表す数値を説明する図である。前述したように本実施形態1では「自宅」「仕事」「レジャー」「おでかけ」の4つのシーンを抽出する。これらシーン抽出するため本実施形態1では、利用者がシーンを過ごした時間帯、その長さ、および曜日の3つを用いたルールを定義した。すなわち一日の最初と最後に出現するシーンは「自宅」、一日の最初と最後以外でかつ平日の7時間以上であれば「仕事」、「休日」であれば「レジャー」、それ以外は「おでかけ」である。それぞれシーンを表す数値は「1」「4」「2」「3」とする。シーンベクトル生成部10は、図23に示すルールを用いてICカード利用履歴103からシーンを抽出してシーンリスト105に格納し、シーンベクトルを生成してシーンベクトルテーブル107に格納する。
図24は、シーン抽出部101が実施するステップS101の詳細な処理手順を示すフローチャートである。図24においてiはICカード利用履歴103に格納された履歴のインデクスを示す変数である。本実施形態1ではICカード利用履歴103は、利用者IDおよび日づけをキーにソートされており、かつ格納されているすべての履歴が未処理であると想定する。したがってiの初期値に0をセットするが、すでに過去分の履歴からはシーンを抽出済みで、追加されたICカード利用履歴からシーンを抽出する場合、iは追加された履歴のインデクスを指す。他の変数としてUidは利用者IDをセットする変数、Pidは場所IDをセットする変数であり、それぞれnullで初期化しておく。Svは24次元のシーンベクトルをセットする変数であり、ベクトルの値はすべてnullで初期化しておく。またStおよびEtは、シーンの開始・終了時刻をセットする変数であり、それぞれnullで初期化しておく。以下図24の各ステップについて説明する。
(図24:ステップS101001〜S101003)
シーン抽出部101はiに0をセットする(S101001)。シーン抽出部101はiに1を加え(S101002)、ICカード利用履歴103のi番目の利用履歴の利用者ID10301がUidと同じであればステップS101007にスキップし、同じでなければステップS101004に進む(S101003)。
(図24:ステップS101004)
シーン抽出部101は、Uidにセットされた利用者の全利用履歴について処理が終了したと判断し、シーンの終了時刻を表す変数Etに一日の最後の時刻“26:59”をセットし、「自宅」シーンを抽出する。具体的にはシーンリスト105の末尾の利用者ID10501にUidをセットし、シーン名10502に「自宅」をセットし、開始時刻10503にStの値をセットし、終了時刻10504にEtの値をセットし、場所ID10505にPidの値(一日の最後に出場した駅の場所ID)をセットし、シーンベクトルSvの時刻Stから時刻Etまでの値に「自宅」を表す数値「1」をセットする。
(図24:ステップS101005)
シーン抽出部101は、シーンベクトルテーブル107を参照し、Svと一致するシーンベクトルが既に格納されているか検索する。既に格納されていればそのシーンベクトルが格納されているレコードの利用者ID10702にUidをセットし、日付10703にStの日付部分を(ただし24時を過ぎればその前日)セットする。Svがシーンベクトルテーブル107に格納されていなければシーンベクトルテーブル107の末尾の時刻10704にSvをセットし、利用者ID10702にUidを、日付10703にStの日付部分を(ただし24時を過ぎればその前日)セットする。さらに当該レコードのシーンベクトルID10701を取得し、シーンリスト105の末尾からリスト先頭に向かって順に利用者ID10501がUidと一致しているレコードを検索し、一致したレコードのシーンベクトルID10506へ、取得したシーンベクトルID10701をセットする。またイベントリスト106についても同様に、シーンベクトルID10606へ、取得したシーンベクトルID10701をセットする。
(図24:ステップS101006)
シーン抽出部101は、UidにICカード利用履歴103のi番目の利用者ID10301の値をセットし、シーンの開始時刻を表す変数Stに一日の最初の時刻“03:00”をセットしSvを初期化する。
(図24:ステップS101007)
iがICカード利用履歴103に格納された履歴数よりも大きければ本処理を終了し、それ以外であればステップS101008に進む。
(図24:ステップS101008)
ICカード利用履歴103のi番目の端末機タイプ10304が「入場改札機」であればステップS101009に進み、それ以外であればステップS101019に進む。
(図24:ステップS101009)
シーン抽出部101は、ステップS101008において利用履歴の端末機が入場改札機であれば、シーンが遷移したと判断し、シーンの終了時刻を表す変数EtにICカード利用履歴103のi番目の時刻10302に格納された時刻に1分を減じて格納する。
(図24:ステップS101010)
Stの値が一日の最初のシーンを示している場合(St=“03:00”)はステップS101011に進み、それ以外であればステップS101013に進む。
(図24:ステップS101011)
シーン抽出部101は、ICカード履歴103のi番目の駅名/店舗名10303を取得してこれに対応する場所情報210のレコードを参照し、入場駅の場所ID21001を取得してPidにセットする。
(図24:ステップS101012)
シーン抽出部101は、シーンリスト105の末尾の利用者ID10501にUidをセットし、シーン名10502に「自宅」をセットし、開始時刻10503にStにセットされた値をセットし、終了時刻10504にEtにセットされた値をセットし、場所ID10505にPidの値(一日の最初に入場した駅の場所ID)をセットする。
(図24:ステップS101012:補足)
1日のうち最初に改札機に入場した場合、その直前までは自宅に滞在していたと考えられる。そこで、1つ前のシーン(i−1番目のシーン)は自宅シーンとして抽出することとした。
(図24:ステップS101013)
シーン抽出部101は、シーン開始時刻Stと終了時刻Etから滞在時間(シーンの長さ)を計算する。滞在時間が所定時間以上(たとえば7時間以上)であればステップS101014に進み、それ以外であればステップS101017に進む。
(図24:ステップS101014)
シーン抽出部101は、ICカード利用履歴103の時刻10302から日付を取得し、さらにカレンダ情報211の曜日21102を参照し、当該履歴の日付を取得する。日付が平日であればステップS101015に進み、それ以外であればステップS101016に進む。
(図24:ステップS101015)
改札機に入場したのが1日のうち2回目以降であり、かつ直前の場所に滞在していたのが平日の7時間以上である場合、その入場の直前までは仕事中であったと考えられる。そこでシーン抽出部101は、1つ前のシーン(i−1番目のシーン)として「仕事」シーンを抽出する。シーン抽出部101は、ステップS101012と同様に各テーブルの値をセットする。
(図24:ステップS101016)
改札機に入場したのが1日のうち2回目以降であり、かつ直前の場所に滞在していたのが平日以外の7時間以上である場合、その入場の直前までは行楽外出していたと考えられる。そこでシーン抽出部101は、1つ前のシーン(i−1番目のシーン)として「レジャー」シーンを抽出する。シーン抽出部101は、ステップS101012と同様に各テーブルの値をセットする。
(図24:ステップS101017)
改札機に入場したのが1日のうち2回目以降であり、かつ直前の場所に滞在していたのが7時間未満である場合、その入場の直前まではその他一般的な外出をしていたと考えられる。そこでシーン抽出部101は、1つ前のシーン(i−1番目のシーン)として「おでかけ」シーンを抽出する。シーン抽出部101は、ステップS101012と同様に各テーブルの値をセットする。
(図24:ステップS101018)
シーン抽出部101は、シーンの開始時刻を表す変数StにICカード利用履歴103のi番目の時刻10302をセットし、ステップS101002に戻る。
(図24:ステップS101019)
ICカード利用履歴103のi番目の端末機タイプ10304が「出場改札機」であればステップS101020に進み、それ以外であればステップS101021に進む。
(図24:ステップS101020)
利用者が改札機を出場した場合、その出場駅がシーン場所となる。そこでシーン抽出部101は、ICカード利用履歴103のi番目の駅名/店舗名10303を取得し、場所情報210から対応する場所ID21001を取得してPidにセットした上でステップS101002に戻る。
(図24:ステップS101021)
ICカード利用履歴103のi番目の端末機タイプ10304が「店舗端末」であればステップS101022へ進み、それ以外であればステップS101002へ戻る。
(図24:ステップS101022)
利用履歴が店舗内のものである場合は、利用者が電子マネー機能等を用いて支払いをしたと考えられる。そこでシーン抽出部101は、Pidに当該店舗の場所ID21001をセットし、「支払い」イベントを抽出してイベントリスト106にセットし、ステップS101002に戻る。具体的には、イベントリスト106の末尾の利用者ID10601にUidをセットし、イベント名10602に「支払い」をセットし、時刻10603にICカード利用履歴103のi番目の時刻10302をセットし、場所ID10604にPidをセットし、金額10605にICカード利用履歴103のi番目の金額10305をセットする。
(処理手順:シーンベクトル生成部10におけるイベント抽出部102の詳細な処理手順)
図20のステップS102において、イベント抽出部102は、クレジットカード利用歴104からイベントを抽出してイベントリスト106に格納する。具体的には、クレジットカード利用履歴104に格納された履歴のうち未処理の履歴に対して、次の処理を実施する。
イベント抽出部102は、クレジットカード利用履歴104のカードID10401の値を取得し、ユーザ情報209のクレジットカード所有者情報20910から所有者の氏名、生年月日、性別、住所などの情報を取得する。次にイベント抽出部102は、ユーザ情報209の交通系ICカード利用者情報20900を参照し、利用者の氏名、生年月日、性別、住所が一致するIDを利用者ID20901から取得し、イベントリスト106の末尾の利用者ID10601にセットする。
イベント抽出部102は、さらにイベント名10602に「支払い」をセットし、時刻10603にクレジットカード利用履歴104の時刻10402をセットする。さらにクレジットカード利用履歴104の店舗名10403にセットされた店舗名の場所ID21001を場所情報210から取得して場所ID10604にセットし、金額10605にクレジットカード利用履歴104の金額10404をセットする。イベント抽出部102は、利用者ID10601と時刻10603の値をキーにしてシーンベクトルテーブル107から当該利用者の当該時刻を含むシーンベクトルのIDを取得し、シーンベクトルID10606にセットする。
(処理手順:生活パタン抽出部20の詳細な処理手順)
次に前述の生活パタン抽出部20の詳細な処理手順について、フローチャートおよび画面例を用いて説明する。
(処理手順:生活パタン抽出部20における生活パタン抽出条件設定部201の詳細な処理手順)
図25は、生活パタン抽出条件設定部201が実施するステップS201の詳細な処理手順を示すフローチャートである。以下図25の各ステップについて説明する。
生活パタン抽出条件設定部201は、まずステップS201001において抽出対象設定画面を表示する。本ステップにおける画面の構成および分析者による抽出条件の入力の詳細については図を用いて後述する。ステップS201002において分析者が抽出条件を入力し、設定の完了を指示すると本処理を終了する。それ以外はステップS201003に進む。ステップS201003において分析者が生活パタンを抽出する対象者のIDのリストの読み込みを指示した場合はステップS201004に進み、それ以外はステップS201005に進む。ステップS201004では分析者が指定したファイルから対象者の利用者のIDを読み込む。ステップ201005では分析者が過去に生成した生活パタンの抽出条件の読み込みを指示した場合はステップS201006に進み、それ以外はステップS201007に進む。ステップS201006では、分析者が選択した生活パタンの抽出条件を読み込む。ステップS201007において分析者が重みづけを指示した場合はステップS201008に進み、それ以外はステップS201009に進む。ステップ201008では、分析者が生活パタンの抽出にあたって重みづけしたい項目(「いつ」「誰が」「どこで」「どのシーン」)を指定する。重みづけの指定については図を用いて後述する。ステップS201009において分析者が属性の追加を指示した場合はステップS201010に進み、それ以外はステップS201011に進む。ステップS201010では、分析者が追加したい属性を追加する。属性の追加については図を用いて後述する。ステップS201011において分析者が抽出するパタン数の指定を指示した場合はステップS201012に進み、それ以外はステップS201001に戻る。ステップS201012では、分析者が抽出する生活パタンの数を指定する。生活パタンの数の指定については図を用いて後述する。
(画面例:生活パタン抽出部20の生活パタン抽出条件設定部201における生活パタン抽出条件設定画面の一例)
図26は、生活パタン抽出条件設定部201が表示する生活パタン抽出条件設定画面の一例を示す図である。生活パタン抽出条件設定画面は、日付設定エリア201110、対象者設定エリア201120、シーン/イベント設定エリア201130、および指示ボタンエリア201140を有する。以下、分析者が各エリアで設定可能な条件について説明するが、わかりやすさのため、設定された条件に対してどのようにシーンベクトルを抽出するかというシーンベクトル抽出ステップ202の処理についても適宜説明する。
日付設定エリア201110は、分析者が生活パタンを抽出する期間や曜日を設定するエリアであり、期間201111、曜日201112、および平休201113を有する。期間201111は生活パタンを抽出する期間を指定するエリアである。分析者が期間を指定すると、行動属性分析装置1は指定された期間の日付にマッチするシーンベクトルのみから生活パタンを抽出する。この期間201111の指定は、本実施形態1では必須とするが、それに限らない。期間が指定されていない場合は、シーンベクトルテーブル107に格納されている全期間のシーンベクトルから生活パタンを抽出してもよい。曜日201112は生活パタンを抽出する曜日を1つ以上選択するエリアである。分析者が曜日を選択すると、行動属性分析装置1は期間201111において指定された期間中、選択された曜日にマッチするシーンベクトルのみから生活パタンを抽出する。曜日が選択されていない場合は、すべての曜日から生活パタンを抽出する。平休201113は生活パタンを抽出する日のタイプを選択するエリアである。分析者が日のタイプを選択すると、行動属性分析装置1は期間201111において指定された期間中、選択されたタイプ(平日か休日)にマッチするシーンベクトルのみから生活パタンを抽出する。日のタイプが選択されていない場合は、平日/休日両方のシーンベクトルから生活パタンを抽出する。
対象者設定エリア201120は、分析者が生活パタンを抽出する対象者を設定するエリアであり、性別201121、住所201122、年代201123およびID201124を有する。性別201121は、生活パタンを抽出する対象者の性別を選択するエリアである。分析者が性別を選択すると、行動属性分析装置1は選択された性別にマッチする対象者のシーンベクトルのみから生活パタンを抽出する。性別が選択されていない場合は、性別にかかわりなく全対象者のシーンベクトルから生活パタンを抽出する。住所201122は、生活パタンを抽出する対象者の住所を選択するエリアである。本実施形態1では住所の選択は、都道府県名をリストで選択する構成となっているが、これに限らない。分析者によるテキスト入力や、市区町村名の選択も可能である。分析者が住所を選択すると、行動属性分析装置1は選択された都道府県を住所とする対象者のシーンベクトルのみから生活パタンを抽出する。住所が選択されていない場合は、住所の都道府県にかかわりなく全対象者のシーンベクトルから生活パタンを抽出する。年代201123は、生活パタンを抽出する対象者の年代を選択するエリアである。分析者が年代を1つ以上選択すると、行動属性分析装置1は生年月日が選択された年代にマッチする対象者のシーンベクトルのみから生活パタンを抽出する。年代が選択されていない場合は、生年月日にかかわりなく全対象者のシーンベクトルから生活パタンを抽出する。ID201124は、生活パタンを抽出する対象者のIDを指定するエリアである。分析者がIDを1つ以上指定すると、行動属性分析装置1はIDが指定されたIDにマッチする対象者のシーンベクトルのみから生活パタンを抽出する。IDが指定されていない場合は、IDにかかわりなく全対象者のシーンベクトルから生活パタンを抽出する。なお分析者によるIDの指定は、ファイルからの読み込みも可能である。
シーン/イベント設定エリア201130は、分析者が生活パタンを抽出するシーンベクトル(一日のシーンの遷移)に含まれるシーンまたはイベントを選択するエリアであり、シーン/イベント201131、場所201132、および回数201133を有する。シーン/イベント201131は、生活パタンを抽出するシーンベクトルに含まれるシーン/イベントを選択するエリアである。分析者がシーン(本実施形態1では「自宅」「仕事」「レジャー」「おでかけ」の4つ)またはイベント(本実施形態1では「支払い」と「入金」)のいずれかを選択すると、行動属性分析装置1は選択されたシーンまたはイベントを含むシーンベクトルのみから生活パタンを抽出する。場所201132は、生活パタンを抽出するシーンベクトルに含まれるシーン/イベントが発生した場所を選択するエリアである。分析者が場所を指定すると、行動属性分析装置1はシーンまたはイベントの発生した場所が指定された場所にマッチするものを含むシーンベクトルのみから生活パタンを抽出する。より詳細には場所情報210を参照して分析者が入力した場所のIDを取得し、シーンリスト105またはイベントリスト106を参照してその場所IDを含むシーンベクトルのIDを取得し、シーンベクトルテーブル107からシーンベクトルを取得してターゲットシーンベクトルテーブル205にセットする。なお場所は、場所情報210の名称21002に格納されている場所名だけでなく分類21003に格納されている分類名(「駅」「店舗」「施設」)やエリア21004に格納されているエリア名を指定することもできる。それらが指定された場合は、当該選択された分類またはエリアに該当する場所のIDを取得し、シーンリスト105またはイベントリスト106を参照する。回数201133は、シーンまたはイベントが発生した回数を指定するエリアである。日付設定エリア201110の期間201111において期間が指定されており、かつシーン/イベント設定エリア201130のシーン/イベント201131および場所201132においてシーンまたはイベントと場所が設定されているとき、当該期間において当該場所をシーンまたはイベントとして指定回数滞在している利用者のシーンベクトルのみから生活パタンを抽出する。なお図26の画面例においてシーン/イベント設定エリア201130で設定可能なシーン/イベント201131、場所201132、および回数201133はそれぞれ2つのみであるが、これに限らない。分析者の指示があればさらに設定可能なシーン/イベント201131、場所201132、および回数201133の数を増やすこともできる。
指示ボタンエリア201140は、分析者が生活パタンを抽出するオプションやパラメタや生活パタン抽出の実行を指示するエリアであり、対象者読み込みボタン201141、生活パタン読み込みボタン201142、重みづけボタン201143、属性追加ボタン201144、パラメタボタン201145、およびパタン抽出実行ボタン201146を有する。分析者が対象者読み込みボタン201141をクリックすると、行動属性分析装置1は、対象者のIDが格納されたファイルを指定するための画面を表示する。対象者のIDが格納されたファイルを分析者が指定すると、行動属性分析装置1はファイルを読み込み、対象者設定エリア201120のID201124に表示する。分析者が生活パタン読み込みボタン201142をクリックすると、行動属性分析装置1は、過去に生成された生活パタンを選択するための画面を表示する。過去に生成された生活パタンを分析者が選択すると、行動属性分析装置1は生活パタンの抽出条件を読み込み、生活パタン抽出条件設定画面に表示する。分析者が重みづけボタン201143をクリックすると、行動属性分析装置1は図27で説明する重みづけ設定画面を表示する。分析者は重みづけ設定画面にてシーンベクトルに重みづけする。分析者が属性追加ボタン201144をクリックすると、行動属性分析装置1は図28で説明する属性追加設定画面を表示する。分析者は属性追加設定画面にてシーンベクトルに属性を追加する。分析者がパラメタボタン201145をクリックすると、行動属性分析装置1は図29で説明するパラメタ設定画面を表示する。分析者はパラメタ設定画面にて生活パタン抽出のパラメタを設定する。分析者がパタン抽出実行ボタン201146をクリックすると、行動属性分析装置1は抽出条件設定画面で設定された条件にマッチする抽出対象者のシーンベクトルを抽出してクラスタリングを実行し生活パタンを抽出する。
(画面例:生活パタン抽出部20の生活パタン抽出条件設定部201における重みづけ設定画面の一例)
図27は、生活パタン抽出条件設定部201が表示する重みづけ設定画面の一例を示す図である。重みづけ設定画面は、日重みづけ設定エリア2011431、対象者重みづけ設定エリア2011432、シーン/イベント重みづけ設定エリア2011433、および指示ボタンエリア2011434を有する。
日重みづけ設定エリア2011431は、分析者が重みづけしたい日が含まれる期間、曜日、平日/休日を設定するエリアであり、期間20114311、曜日20114312、および平休20114313を有する。分析者が期間20114311を指定すると、行動属性分析装置1は指定された期間の日付にマッチするシーンベクトルに重みを付ける。具体的には当該重みづけが指定されると、シーンベクトル抽出部202が各シーンベクトルにすべての値が「−1」であるベクトルをかける。分析者が曜日20114312を選択すると、行動属性分析装置1は選択された曜日にマッチするシーンベクトルに重みを付ける。具体的には当該重みづけが指定されると、シーンベクトル抽出部202が各シーンベクトルにすべての値が「−1」であるベクトルをかける。分析者が平休20114313を選択すると、行動属性分析装置1は平日または休日(含む祝日)のうち選択された一方にマッチするシーンベクトルに重みを付ける。具体的には当該重みづけが指定されると、シーンベクトル抽出部202が各シーンベクトルにすべての値が「−1」であるベクトルをかける。上記のように日に重みを付けることにより、重みを付けた日の生活パタンと重みを付けていない日の生活パタンを分けて抽出することができる。なお重みづけ設定画面では日への重みづけの値は「−1」としたがこれに限らない。デフォルトのシーンを表す数値(本実施形態1では「1」「2」「3」「4」)を値とするベクトルと、指定した条件にマッチするベクトルとを、ベクトル空間上で分離できる値であればよい。
対象者重みづけ設定エリア2011432は、分析者が重みづけしたい対象者の属性を設定するエリアであり、性別20114321、住所20114322、および年代20114323を有する。分析者が性別20114321で重みを付ける対象者の性別を選択すると、行動属性分析装置1は選択された性別にマッチする対象者のシーンベクトルに重みを付ける。具体的には当該重みづけが指定されると、シーンベクトル抽出部202が各シーンベクトルにすべての値が「−1」であるベクトルをかける。分析者が住所20114322で重みを付ける対象者の住所の都道府県を選択すると、行動属性分析装置1は選択された都道府県を住所とする対象者のシーンベクトルに重みを付ける。具体的には当該重みづけが指定されると、シーンベクトル抽出部202が各シーンベクトルにすべての値が「−1」であるベクトルをかける。分析者が年代20114323で重みを付ける対象者の年代を選択すると、行動属性分析装置1は生年月日が選択された年代とマッチする対象者のシーンベクトルに重みを付ける。具体的には当該重みづけが指定されると、シーンベクトル抽出部202が各シーンベクトルにすべての値が「−1」であるベクトルをかける。上記のように対象者に重みを付けることにより、重みを付けた対象者の生活パタンと重みを付けていない対象者の生活パタンを分けて抽出することができる。なお重みづけ設定画面では対象者への重みづけの値は「−1」としたがこれに限らない。デフォルトのシーンを表す数値(本実施形態1では「1」「2」「3」「4」)を値とするベクトルと、指定した条件にマッチするベクトルとを、ベクトル空間上で分離できる値であればよい。
シーン/イベント重みづけ設定エリア2011433は、分析者が重みづけしたいシーンまたはイベントの名称および場所を設定するエリアであり、シーン/イベント20114331および場所20114332を有する。分析者がシーン/イベント20114331を選択すると、行動属性分析装置1は選択されたシーンまたはイベントを含むシーンベクトルの当該シーンまたはイベントの時刻に重みを付ける。具体的には当該重みづけが指定されると、シーンベクトル抽出部202が当該シーンまたはイベントの時刻に対応するシーン値に「10」をかける。分析者が場所20114332を選択すると、行動属性分析装置1はシーンベクトル中、指定された場所で発生したシーンまたはイベントの時刻に重みを付ける。具体的には当該重みづけが指定されると、シーンベクトル抽出部202が当該シーンまたはイベントの時刻に対応するシーン値に「10」をかける。
図27の画面例においてシーン/イベント重みづけ設定エリア2011433で設定可能なシーン/イベント20114331および場所20114332はそれぞれ2つのみであるが、これに限らない。分析者の指示があればさらに設定可能なシーン/イベント20114331および場所20114332の数を増やすこともできる。
指示ボタンエリア2011434は、分析者が重みづけのキャンセルや完了を指示するエリアであり、キャンセルボタン20114341および完了ボタン20114342を有する。分析者がキャンセルボタン20114341をクリックすると、行動属性分析装置1はそれまでに入力された重みづけの設定をすべてクリアして生活パタン抽出条件設定画面に戻る。分析者が完了ボタン20114342をクリックすると、行動属性分析装置1は分析者による重みづけの設定を記憶して生活パタン抽出条件設定画面に戻る。
(画面例:生活パタン抽出部20の生活パタン抽出条件設定部201における属性追加設定画面の一例)
図28は、生活パタン抽出条件設定部201が表示する属性追加設定画面の一例を示す図である。図28に示すように属性追加設定画面は、日属性追加設定エリア2011441、利用者属性追加設定エリア2011442、および指示ボタンエリア2011443を有する。
日属性追加設定エリア2011441は、曜日20114411および平休20114412を有する。分析者が曜日20114411を選択すると、行動属性分析装置1はシーンベクトルに曜日の属性を追加する。具体的には当該属性追加が指定されると、シーンベクトル抽出部202は、シーンベクトルテーブル107の日付10703を参照し、カレンダ情報211から日付に対応する曜日を取得して、月〜日までに対応する7次元のベクトルを生成し対応する曜日のベクトル値を1にそれ以外に0をセットして、ターゲットシーンベクトルテーブル205の属性20506に格納する。分析者が平休20114412を選択すると、行動属性分析装置1はシーンベクトルに平日/休日を表す属性を追加する。具体的には当該属性追加が指定されると、シーンベクトル抽出部202は、シーンベクトルテーブル107の日付10703を参照し、カレンダ情報211から日付に対応する平日/休日のタイプを取得して、平日と休日のタイプを表す1次元のベクトルを生成し、平日ならベクトル値を1にそれ以外なら0をセットして、ターゲットシーンベクトルテーブル205の属性20506に格納する。
利用者属性設定エリア2011442は、性別20114421、住所20114422、および年代20114423を有する。分析者が性別20114421を選択すると、行動属性分析装置1はシーンベクトルに性別を表す属性を追加する。具体的には当該属性追加が指定されると、シーンベクトル抽出部202は、シーンベクトルテーブル107の利用者ID10702を参照し、ユーザ情報209の交通系ICカード利用者情報20900の性別20904を取得して、性別を表す1次元のベクトルを生成し、男性ならベクトル値を1にそれ以外なら0をセットして、ターゲットシーンベクトルテーブル205の属性20506にセットする。分析者が住所20114422を選択すると、行動属性分析装置1はシーンベクトルに利用者の住所を表す属性を追加する。具体的には当該属性追加が指定されると、シーンベクトル抽出部202は、シーンベクトルテーブル107の利用者ID10702を参照し、ユーザ情報209の交通系ICカード利用者情報20900の住所20905を取得して、住所を表すベクトル(本実施形態1では住所は「東京都」、「神奈川県」、「埼玉県」、「千葉県」、「その他」を属性とする5次元のベクトル)を生成し、利用者の住所に対応する属性の値を1にそれ以外を0にセットして、ターゲットシーンベクトルテーブル205の属性20506にセットする。分析者が年代20114423を選択すると、行動属性分析装置1はシーンベクトルに年代を表す属性を追加する。具体的には当該属性追加が指定されると、シーンベクトル抽出部202は、シーンベクトルテーブル107の利用者ID10702を参照し、ユーザ情報209の交通系ICカード利用者情報20900の生年月日20903を取得して、年代を表すベクトル(本実施形態1では年代は「10代」、「20代」、「30代」、「40代」、「50代」、「60代」、「それ以上」を属性とする7次元のベクトル)を生成し、利用者の年齢に対応する属性の値を1にそれ以外に0をセットして、ターゲットシーンベクトルテーブル205の属性20506にセットする。
指示ボタンエリア2011443は、分析者が属性追加のキャンセルや完了を指示するエリアであり、キャンセルボタン20114431および完了ボタン20114432を有する。分析者がキャンセルボタン20114431をクリックすると、行動属性分析装置1はそれまでに入力された属性追加の設定をすべてクリアして生活パタン抽出条件設定画面に戻る。分析者が完了ボタン20114432をクリックすると、行動属性分析装置1は分析者による属性追加の設定を記憶して生活パタン抽出条件設定画面に戻る。
(画面例:生活パタン抽出部20の生活パタン抽出条件設定部201におけるパラメタ設定画面の一例)
図29は、生活パタン抽出条件設定部201が表示するパラメタ設定画面の一例を示す図である。パラメタ設定画面は、パタン数設定エリア2011451、および指示ボタンエリア2011452を有する。
分析者がパタン数設定エリア2011451でパタン数を指定すると、シーンベクトルクラスタリング部203は、ターゲットシーンベクトルを指定された数のクラスタにクラスタリングする。指示ボタンエリア2011452は、分析者がパラメタ設定のキャンセルや完了を指示するエリアであり、キャンセルボタン20114521および完了ボタン20114522を有する。分析者がキャンセルボタン20114521をクリックすると、行動属性分析装置1はそれまでに入力されたパタン数の設定をすべてクリアして生活パタン抽出条件設定画面に戻る。分析者が完了ボタン20114522をクリックすると、行動属性分析装置1は分析者によるパタン数の設定を記憶して生活パタン抽出条件設定画面に戻る。なお分析者がパタン数を指定しない場合、本実施形態1ではデフォルトのクラスタ数は12とするが、これに限らない。
(処理手順:生活パタン抽出部20におけるシーンベクトル抽出部202の詳細な処理手順)
ステップS202において、シーンベクトル抽出部202は、生活パタン抽出条件設定部201において分析者によって設定された条件にマッチするシーンベクトルを適宜ユーザ情報209およびカレンダ情報211を参照しながらシーンベクトルテーブル107から抽出し、属性の追加が設定されていれば属性を追加して、ターゲットシーンベクトルテーブル205の時刻20505および属性20506に格納する。また、利用者ID20502に利用者のIDを格納し、場所ID20503にシーンまたはイベントが発生した場所のIDを格納し、日付20504にシーンベクトルの日付を格納する。各設定条件に対するシーンベクトルの抽出手順、重みづけ手順、および属性の追加手順は、生活パタン抽出条件設定部201における画面の説明等で述べたのでここでは省略する。
(処理手順:生活パタン抽出部20におけるシーンベクトルクラスタリング部203の詳細な処理手順)
ステップS203において、シーンベクトルクラスタリング部203は、ターゲットシーンベクトルテーブル205に格納されたターゲットシーンベクトルにk−means法を適用してクラスタリングを実行し、クラスタリング結果を生活パタンテーブル206のクラスタリング結果テーブル20610に格納する。具体的にはクラスタリング結果テーブル20610のパタンID20611の値にクラスタIDを格納し、当該クラスタに属するターゲットシーンベクトルの平均ベクトルを平均ベクトル20613に格納する(代表ベクトル20614については後述する)。さらに当該クラスタに属するターゲットシーンベクトルの数をベクトル件数20615に格納し、ターゲットシーンベクトルのIDをターゲットシーンベクトルID20616に格納する。また当該クラスタに属するターゲットシーンベクトルIDをキーにしてターゲットシーンベクトルテーブル205を参照し、ターゲットシーンベクトルID20501の値がターゲットシーンベクトルIDと一致するレコードのパタンID20507に当該パタンIDをセットする。なおクラスタリングのクラスタ数は生活パタン抽出条件設定部201において設定されたクラスタ数とする。未設定の場合はクラスタ数を例えば12とする。
シーンベクトルクラスタリング部203がクラスタリング結果テーブル20610の代表シーンベクトル20614を生成する手順について説明する。具体的には、生成された各クラスタについて以下の処理を実施する。まずクラスタに属するシーンベクトルを参照し、シーンまたはイベントの出現頻度を時刻ごとに集計する。各時刻におけるシーンのうち最も頻度が高い、あるいは例えば50%以上を占めるシーン(1つ以上)をその時刻における典型的なシーンとし、そのシーンを表す数値を当該時刻に対応する代表ベクトルの要素値として代表ベクトルを生成し、クラスタリング結果テーブル20610の代表シーンベクトル20614に格納する。
(処理手順:生活パタン抽出部20における生活パタン表示部204の詳細な処理手順)
生活パタン表示部204は、ステップS201〜S203によって抽出された生活パタンを表示する。以下、画面例を用いて生活パタン表示の処理手順について説明する。
図30は、抽出した生活パタンを表示する画面の一例を示す図である。本画面は、ステップS201〜S203によって生成されたクラスタ(=生活パタン)を、シーンベクトルと同じ形式でシーン遷移として表現し、分析者に表示する画面である。図30(a)はシーン遷移を状態遷移図で表現した一例、図30(b)はシーン遷移をシーン値で表現した一例である。
図30(a)に示すように、生活パタン表示画面は生活パタン表示エリア20400および指示ボタンエリア20410を有する。
生活パタン表示エリア20400は、抽出された生活パタンを表示するエリアであり、選択チェックボックス20401、パタン名20402、生活パタン20403、および件数20404を有する。選択チェックボックス20401は、分析者が「対象ID出力」を実行する際にクラスタを選択するためのチェックボックスである。パタン名20402は、パタン名を表示するエリアである。パタン名は生活パタンテーブル206のクラスタリング結果テーブル20610のパタン名称20612に格納されている値を表示する。分析者がパタンに名称を付与していない状態では、「パタン1」、「パタン2」・・・のように自動的に付与した文字列を表示する。この文字列は分析者によって任意に書き換えることができる。例えば、図30(a)において「パタン1」は「直行直帰パタン」、「パタン2」は「仕事帰りに寄り道パタン」などである。生活パタン204003は、抽出した生活パタンを表示する。具体的にはクラスタリング結果テーブル20610の代表シーンベクトル20614に格納されているシーン値を取得し、シーン毎にノードの色を設定し、さらにシーンの長さ(時間長)にしたがってノードの大きさを設定してシーン間の遷移を矢印で表現する。件数20404は、クラスタに属するターゲットシーンベクトルの数を表示する。ターゲットシーンベクトルの数はクラスタリング結果テーブル20610のベクトル件数20615から取得する。
指示ボタンエリア20410は、抽出条件表示指示ボタン20411、対象ID出力指示ボタン20412、および保存指示ボタン20413を有する。抽出条件表示指示ボタン20411は、生活パタン抽出条件設定部201が設定した条件を表示するよう指示するためのボタンである。分析者が本ボタンをクリックすると、生活パタン表示部204は図26に示す生活パタン抽出設定画面を表示して、生活パタンを抽出した設定条件を分析者に提示する。対象者ID出力指示ボタン20412は、分析者が選択したクラスタ(生活パタン)内に出現する利用者のIDをファイル出力するためのボタンである。この機能は、分析者が着目した生活パタンに該当する利用者についてさらに詳しくまたは別の観点から分析したい場合に、該当する利用者のIDを取得するためのものである。出力した利用者のIDのリストは、対象者読み込みボタン201141などを介して利用できる。分析者が選択したクラスタに出現する利用者のIDは、次の手順で取得できる。クラスタリング結果テーブル20610中、分析者が選択したパタンのIDとパタンID20611が一致するレコードを参照し、当該レコードのターゲットシーンベクトルID20616に格納されているターゲットシーンベクトルIDを取得してターゲットシーンベクトルテーブル205を参照し、利用者ID20502に格納されている利用者IDを取得する。保存指示ボタン20413は抽出した生活パタンを保存するよう指示するためのボタンであり、分析者にとって理解しやすい名称、例えば「○駅滞在パタン」などの名称を付して記録することができる。
図30(b)は、シーンの遷移をベクトルで示した一例であり、シーン毎にベクトルの値の色を設定し、時刻ごとにシーンを表す数値をセットして表現されている。図30(b)中の画面の構成および機能は図30(a)と同様であるので説明を省略する。
(処理手順:生活パタンクラスタ分析部30の詳細な処理手順)
次に前述の生活パタンクラスタ分析部30の詳細な処理手順について説明する。
(処理手順:生活パタンクラスタ分析部30における生活パタンクラスタ分析条件設定部301の詳細な処理手順)
図31は、クラスタ分析条件設定部301が実施するステップS301の詳細な処理手順を示すフローチャートである。以下図31の各ステップについて説明する。
クラスタ分析条件設定部301は、分析対象の特徴付けに使う生活パタンを分析者が選択した結果を受け取る(S30101)。分析者が選択した生活パタンの抽出条件を表示するよう指示するとステップ30103に進み、それ以外はステップS30104にスキップする(S30102)。ステップS30103では選択された生活パタンの抽出条件を分析者に表示する。抽出条件の表示については図を用いて後述する。ステップS30104で分析者が生活パタンを抽出したシーンベクトルに出現する利用者または場所を分析対象とするように指示するとステップS30105に進み、それ以外はステップS30107に進む。ステップS30105で分析者が分析対象を絞り込むように指示するとステップS30106に進み、それ以外はステップS30108にスキップする。ステップS30106では選択された生活パタンの抽出条件を分析者に表示し、分析者が条件を絞り込む。分析対象の絞り込みについては後述する。ステップS30107では分析者が分析対象を設定してステップS30108に進む。分析対象の設定については後述する。ステップS30108で分析者が生活パタンクラスタ分析の条件設定を終了するよう指示すると本処理を終了し、それ以外はステップS30101に戻る。
(画面例:生活パタンクラスタ分析部30の生活パタンクラスタ分析条件設定部301における生活パタンクラスタ分析条件設定画面の一例)
図32は、クラスタ分析条件設定部301がステップS301で表示する生活パタンクラスタ分析条件設定画面の一例を示す図である。生活パタンクラスタ分析条件設定画面は、生活パタン選択エリア301110、分析対象設定エリア301120、および指示ボタンエリア301130を有する。
生活パタン選択エリア301110は、生活パタン選択301111および抽出条件表示ボタン301112を有する。生活パタン選択301111は、分析者が生成された生活パタンのなかから分析対象の特徴付けに用いるものを選択するエリアである。抽出条件表示ボタン301112は、分析者が選択した生活パタンの抽出条件の表示を指示するボタンである。分析者が抽出条件表示ボタン301112をクリックすると、行動属性分析装置1は図33で説明する生活パタン抽出条件表示画面を表示し、選択された生活パタンの抽出条件を表示する。
分析対象設定エリア301120は、分析対象を利用者とすることを指示するラジオボタン301121、場所とすることを指示するラジオボタン301122、および分析対象設定ボタン301123を有する。分析者が分析対象設定ボタン301123をクリックすると、行動属性分析装置1は分析対象設定画面を表示する。分析対象設定画面は図33に示す生活パタン抽出条件設定画面と同様なので詳細な説明は省略する。分析対象設定画面は、デフォルトで選択された生活パタン抽出条件を表示する。分析者はこの抽出条件を変更することにより分析対象を設定する。例えば、生活パタンの抽出条件が「2010年12月1日にX駅に滞在した人の1カ月の生活パタン」であるとき、利用者の性別を女性のみに絞り込む、あるいは「X駅」ではなく「Y駅に滞在した人」に変更するなどである。分析者が分析対象を利用者とすることを指示するラジオボタン301121を選択すると、行動属性分析装置1はその分析条件にマッチする利用者を分析対象とする。一方で分析対象を場所とすることを指示するラジオボタン301122を選択すると、行動属性分析装置1はシーンベクトルに出現した場所を分析対象とする。
指示ボタンエリア301130は、パラメタ設定指示ボタン301131、およびクラスタ分析実行ボタン301132を有する。分析者がパラメタ設定指示ボタン301131をクリックすると、行動属性分析装置1は図34に示すパラメタ設定画面を表示する。分析者はパラメタ設定画面にて生活パタン抽出のパラメタを設定する。分析者がクラスタ分析実行ボタン301132をクリックすると、行動属性分析装置1は分析対象設定エリア301120で設定された条件にマッチする分析対象を抽出し、生活パタンの出現頻度をカウントして特徴ベクトルを生成し、クラスタリングを実行してクラスタを生成する。
図33は、抽出条件表示ボタン301112をクリックしたときに表示される生活パタン抽出条件表示画面の一例を示す図である。図33は図26に示す生活パタン抽出条件設定画面の構成と同じ(ただし指示ボタンエリア201140は除く)であるため、詳細な説明は省略する。
図34は、パラメタ設定指示ボタン301131をクリックしたときに表示されるパラメタ設定画面の一例を示す図である。パラメタ設定画面は、クラスタ数設定エリア3011311および指示ボタンエリア3011312を有する。分析者がクラスタ数設定エリア3011311でクラスタ数を指定すると、特徴ベクトルクラスタリング部303は特徴ベクトルを指定された数のクラスタにクラスタリングする。指示ボタンエリア3011312は、分析者がクラスタ設定のキャンセルや完了を指示するエリアであり、キャンセルボタン30113121および完了ボタン30113122を有する。分析者がキャンセルボタン30113121をクリックすると、行動属性分析装置1はそれまでに入力されたクラスタ数の設定をすべてクリアして生活パタンクラスタ分析条件設定画面に戻る。分析者が完了ボタン30113122をクリックすると、行動属性分析装置1はクラスタ数の設定を記憶して生活パタンクラスタ分析条件設定画面に戻る。なお分析者がクラスタ数を指定しない場合、本実施形態1ではデフォルトのクラスタ数は20とするが、これに限らない。
(処理手順:生活パタンクラスタ分析部30における特徴ベクトル生成部302の詳細な処理手順)
特徴ベクトル生成部302は、ステップS302において、分析対象を生活パタンの出現頻度で特徴づけた特徴ベクトルを生成する。詳細には、分析対象に係るターゲットシーンベクトルについて、各ターゲットシーンベクトルがどの生活パタンにマッチするかチェックして、生活パタンごとにマッチしたターゲットシーンベクトルの数をカウントし、生活パタンを要素番号、マッチしたターゲットシーンベクトルの数を要素値とするベクトルを生成する。
頻度をカウントする対象とするターゲットシーンベクトルは、分析対象の設定条件が生活パタンを抽出した抽出条件と同じであれば、その生活パタン抽出において生成したターゲットシーンベクトルとすればよい。一方で分析対象の設定条件が生活パタン抽出の抽出条件とは異なる場合、シーンベクトル抽出部202と同様の手順で分析対象にかかるターゲットシーンベクトルを生成し、その各ターゲットシーンベクトルがどの生活パタンにマッチするか類似度を計算して最も類似度が高い生活パタンにターゲットシーンベクトルを割りつけてから、生活パタンごとにマッチしたターゲットシーンベクトルの数をカウントする。
分析対象は前述の通り利用者または場所である。利用者を分析対象とする場合は、ターゲットシーンベクトルの利用者IDを参照して利用者ごとにマッチした生活パタンの頻度をカウントすればよい。場所を分析対象とする場合は、ターゲットシーンベクトルの利用者IDと日付をキーに、シーンベクトルテーブル107、シーンリスト105、およびイベントリスト106から場所IDを取得して、場所ごとにマッチした生活パタンの頻度をカウントする。
図35は、特徴ベクトル生成部302が実施するステップS302の詳細な処理手順を示すフローチャートである。以下図35の各ステップについて説明する。
(図35:ステップS30201)
特徴ベクトル生成部302は、クラスタ分析条件設定部301が選択した生活パタンの抽出条件と、クラスタ分析対象設定画面にて設定されたクラスタ分析対象設定条件が同じかどうかをチェックする。同じであればステップS30204にスキップし、それ以外はステップS30202へ進む。
(図35:ステップS30202)
特徴ベクトル生成部302は、クラスタ分析条件にマッチするターゲットシーンベクトルを生成し、ターゲットシーンベクトルテーブル205に格納する。ターゲットシーンベクトルを生成する処理手順についてはシーンベクトル抽出部202の処理手順と同様なのでここでは説明を省略する。
(図35:ステップS30203)
特徴ベクトル生成部302は、ステップS30202が生成したターゲットシーンベクトルそれぞれについて次の処理を実施する。ターゲットシーンベクトルと、クラスタリング結果テーブル20610に格納された各生活パタンの平均ベクトル20613との間の類似度を計算し、最も類似度が高い生活パタンのIDを取得してターゲットシーンベクトルテーブル205のパタンID20507に格納する。ターゲットシーンベクトルと生活パタンの平均ベクトルとの間の類似度は、ベクトル間の距離(ユークリッド距離)を求めて類似度とするなどの方法を適用すればよい。
(図35:ステップS30204)
分析者が分析対象として利用者を選択していればステップS30205に進み、それ以外はステップS30206に進む。
(図35:ステップS30205)
特徴ベクトル生成部302は、ターゲットシーンベクトルテーブル205を参照して、利用者ごとに生活パタンの出現頻度を取得して特徴ベクトルテーブル305に格納する。具体的には、特徴ベクトルテーブル305の分析対象30502に利用者IDをセットし、ターゲットシーンベクトルテーブル205の利用者ID20502が利用者IDと同じであればパタンID20507に格納されている生活パタンIDを取得し、特徴ベクトルテーブル305の生活パタンID30503のうち取得したパタンIDに対応する値に1を加算する。
(図35:ステップS30206)
特徴ベクトル生成部302は、ステップS30205と同様に生活パタンの出現頻度をカウントする。ただし利用者IDごとではなく場所IDごとにカウントして特徴ベクトルテーブル305に格納する。具体的には特徴ベクトルテーブル305の分析対象305002に場所IDをセットし、ターゲットシーンベクトルテーブル205の場所ID20503が場所IDと同じであればパタンID20507に格納されている生活パタンIDを取得し、特徴ベクトルテーブル305の生活パタンID30503のうち取得したパタンIDに対応する値に1を加算する。
(図35:ステップS30207)
特徴ベクトル生成部302は、カウントされた生活パタンの出現頻度に対して重みづけする。生活パタンによっては多くの分析対象に出現しているものもあれば、特定の分析対象のみに出現しているものもある。前者のような生活パタンの出現頻度は高くても特徴づけには有用ではなく、後者のほうを重要視すべきである。そこで本実施形態1においては、前者のような出現頻度は小さく、後者のほうの出現頻度はより大きくなるよう重みづけをおこなう。具体的にはベクトル空間モデルにおけるtf−idf法を適用する。tf−idf法については多くの文献に記載されている公知技術であるため、説明は省略する。
(処理手順:生活パタンクラスタ分析部30における特徴ベクトルクラスタリング部303の詳細な処理手順)
特徴ベクトルクラスタリング部303は、ステップS303において、特徴ベクトルテーブル305に格納された特徴ベクトルにk−means法を適用してクラスタリングを実行し、クラスタリング結果テーブル30610に格納する。具体的にはクラスタリング結果テーブル30610のクラスタID30611の値にクラスタIDを格納し、当該クラスタに属する特徴ベクトルの平均ベクトルを平均ベクトル30613に格納する。代表生活パタン30614は、当該クラスタを特徴づける生活パタンのIDを格納する。具体的には当該クラスタに属する特徴ベクトルの平均ベクトルを参照し、ベクトル値が閾値以上の要素番号、すなわち生活パタンのIDを取得して格納する。さらに当該クラスタに属する特徴ベクトルの数をベクトル数30615に格納し、特徴ベクトルのIDを特徴ベクトルID30616に格納する。クラスタリングのクラスタ数は生活パタンクラスタ分析条件設定部301が設定したクラスタ数(または未設定の場合は20)とする。
(処理手順:生活パタンクラスタ分析部30におけるクラスタ表示304の詳細な処理手順)
クラスタ表示部304は、ステップS304において、生成したクラスタを表示する。以下、画面例を用いてクラスタ表示304の処理の手順について説明する。なお以下の説明では、クラスタリストテーブル30600の生活パタンリストID30604に格納されている生活パタンリストIDをキーにして生活パタンリストテーブル20600を検索して生活パタンリストIDに対応するクラスタリング結果テーブル20610が取得済みであり、クラスタ分析に用いた生活パタンが格納されたクラスタリング結果テーブル20610が参照できる状態になっているものとする。
図36は、クラスタ表示部304がクラスタを表示する画面の一例を示す図である。図36に示すようにクラスタ表示画面は、クラスタ表示エリア30400と指示ボタンエリア30410を有する。
クラスタ表示エリア30400は、生成されたクラスタを表示するエリアであり、選択チェックボックス30401、クラスタ名30402、代表生活パタン30403、および件数30404を有する。選択チェックボックス30401は、分析者が「詳細分析」および「対象ID出力」を実行する際にクラスタを選択するためのチェックボックスである。クラスタ名30402は、クラスタ名を表示するエリアである。クラスタ名はクラスタテーブル306のクラスタリング結果テーブル30610のクラスタ名称30612に格納されている値を表示する。分析者がクラスタに名称を付与していない状態では、「クラスタ1」、「クラスタ2」・・・のように自動的に付与した文字列を表示する。この文字列は分析者によって任意に書き換え可能である。代表生活パタン30403は、クラスタを特徴づける生活パタンを表示する。具体的にはクラスタリング結果テーブル30610の代表生活パタン30614に格納されている生活パタンのIDを取得し、当該生活パタンIDをキーに生活パタンテーブル206のクラスタリング結果テーブル20610を検索し、当該生活パタンに対応する代表ベクトル20614を取得し、代表ベクトルを用いて図30(a)と同様のシーン遷移図を生成して表示する。件数30404は、クラスタに属する特徴ベクトルの数を表示する。特徴ベクトルの数はクラスタリング結果テーブル30610の特徴ベクトル数30615から取得する。なおクラスタ分析では、利用者または場所の分析対象ごとに特徴ベクトルが生成される。したがって特徴ベクトル数はそのクラスタに属する利用者または場所の数を表している。
指示ボタンエリア30410は、詳細分析指示ボタン30411、対象ID出力指示ボタン30412、および保存指示ボタン30413を有する。詳細分析指示ボタン30411は、クラスタについて詳細に分析するよう分析者が指示するためのボタンである。詳細分析については、画面例を用いて後述する。対象ID出力指示ボタン30412は、選択したクラスタに属する分析対象のIDのファイルを出力するよう分析者が指示するためのボタンである。クラスタを選択して対象IDをファイル出力することにより、出力されたIDを対象に別の条件で生活パタンを抽出する、あるいはクラスタ分析をすることができる。保存指示ボタン30413は、分析者がクラスタにわかりやすい名称を付与して保存を指示するボタンである。
次に詳細分析について説明する。詳細分析は、分析者が各クラスタに属する分析対象をシーンベクトルの属性別などで詳しく分析したい場合に用いる機能である。分析者がクラスタ表示画面においてクラスタを選択し詳細分析指示ボタン30411をクリックすると詳細分析画面を表示する。
図37は、詳細分析の画面の一例を示す図である。詳細分析画面は、表示形式選択エリア3041110、軸設定エリア3041120、分析軸リスト3041130、および指示ボタンエリア3041140を有する。
表示形式選択エリア3041110において、分析者はグラフ表示3041111またはマトリクス表示3041116を選択することができる。グラフ表示3041111が選択されると、選択されたクラスタの属性別の内訳をグラフ表示する。表示可能なグラフには、円グラフ3041112、棒グラフ3041113、折れ線グラフ3041114、および帯グラフ3041115があるが、これに限らない。グラフ表示については画面例を用いて後述する。マトリクス表示が選択されると、選択されたクラスタの属性別の内訳をマトリクス表示する。マトリクス表示については画面例を用いて後述する。
軸設定エリア3041120は、分析者が分析の観点としたい軸を分析軸リスト3041130からドラッグ&ドロップするためのエリアである。軸は複数選択することが可能であり、さらに選択した各軸を独立に使用するのか、あるいは依存させて使用するのかを指定することができる。具体的には、分析軸リスト3041130から使用したい軸をドラッグして、軸設定エリア3041120にドロップする際、分析者が既に設定されている軸と同じレベルにドロップすると軸を独立に使用する。一方で分析者が既に設定されている軸の下位のレベルにドロップするとドロップした軸は既に設定されている軸の下位の軸として使用する。図37の画面例では軸設定エリア3041120に「性別」「年代」「住所」の3つの軸が設定されているが、それぞれ同じレベルで設定されているので、行動属性分析装置1は分析者が選択したクラスタについて「男女別」、「年代別」、「住所別」の内訳をそれぞれ表示する。一方で後述する図38の画面例では「性別」と「購買傾向」の2つの軸が設定されているが、「購買傾向」は「性別」の下位のレベルで設定されている。そのため行動属性分析装置1は、分析者が選択したクラスタに属する利用者をまず男女別に分けて、次に男女別に購買傾向に分けて表示する。
分析軸リスト3041130は、分析の観点となる軸を表示するエリアである。分析軸には利用者属性3041131、場所属性3041132、およびユーザが設定したユーザ設定属性3041133の3種類がある。利用者属性3041131は分析対象が利用者であるとき有効である軸であり、年代、住所、性別の3種類がある。これらは利用者IDをキーにユーザ情報209から取得することができる。場所属性3041132は、分析対象が場所であるとき有効である軸であり、タイプおよび住所がある。これらは場所IDをキーに場所情報210から取得することができる。利用者属性および場所属性はあらかじめ行動属性分析装置1が用意する軸であるのに対して、ユーザ設定属性は分析者が設定する軸である。具体的には分析対象のID(利用者IDまたは場所ID)とその属性を格納したデータを分析者があらかじめ用意しておき、そのデータを詳細分析画面にて読み込ませることによってユーザ設定の軸を利用することができる。ユーザ設定の軸の一例として、図37では「購買傾向」を示している。この軸は利用者の購買の傾向、すなわちどのくらいの金額を購買で使用しているかの傾向を示す軸であり、分析者が何らかの手段(本明細書には記載せず)を用いて利用者IDごとに「〜¥10000」「〜¥3000」・・・のいずれのタイプに属するか分析してデータを生成し読み込ませたものである。
指示ボタンエリア3041140は、分析軸読み込み指示ボタン3041141および表示指示ボタン3041142を有する。分析軸読み込み指示ボタン3041141は、前述のユーザ設定の軸のデータを外部データから読み込むことを指示するボタンである。表示指示ボタン3041142は分析者が選択した表示形式および分析軸にしたがって選択したクラスタの詳細を表示することを指示するボタンである。
図37では詳細分析の一例として分析者が「性別」、「年代」、「住所」を独立の軸に設定し、円グラフ表示を指示している。この状態で分析者が表示指示ボタン3041142をクリックすると、後述の図39に示すような画面を表示する。
図38は、詳細分析の画面の一例を示す図である。本図では、詳細分析の一例として分析者が複数のクラスタを選択し、軸設定エリア3041120において「性別」を第1の軸に設定し、さらにその軸の下位の軸として「購買傾向」を設定して、マトリクス表示を指示している。この状態で分析者が表示指示ボタン3041142をクリックすると、図40に示すような画面が表示される。
図39は、円グラフ表示の一例を示す図である。本画面では、分析者が選択したクラスタに属する利用者の内訳を、(a)では男女別、(b)では年代別、(c)では住所の都道府県別の割合で表示している。
図40は、マトリクス表示の一例を示す図である。本画面では、行動属性分析装置1は分析者が選択したクラスタに属する利用者をまず性別で分け、次に購買傾向で分けて各セルに対応する人数を表示している。
<実施の形態1:まとめ>
以上のように、本実施形態1に係る行動属性分析装置1は、以下のような効果を発揮することができる。
(1)網羅性とスケーラビリティ
本発明では、利用者の1日をシーン遷移ととらえ、さらにシーン遷移をシーンベクトルで表現する。これにより、利用者が1日に過ごしたシーンの数にかかわらずベクトルの次元数は一定であり、かつ利用者の1日をカバーすることができるので、利用者の数にかかわらず利用者の1日を網羅的にかつスケーラブルに対象とすることができる。利用者の1日の生活パタンはシーンベクトルをクラスタリングすることによって抽出する。そのため利用者の数が膨大になっても生活パタンの数を妥当な範囲内に収めることができる。また抽出した生活パタンを属性として分析対象を特徴づけるため、生成された特徴ベクトルはスパースではないことが期待でき、良好なクラスタリング結果を得ることができる。
(2)分析の多様性とユーザビリティ
1日のシーン遷移を表すベクトルは、分析者が着目した日や利用者への重み付け、あるいは1日の中の着目したシーンへの重み付け、あるいは属性付加が容易である。また1日の生活パタンを用いて、1週間のパタンや1カ月のパタンを抽出することができる。よって分析者は、分析の目的に応じた行動のパタンの抽出を柔軟に行うことができ、所望の分析を容易に実行することができる。
<実施の形態2>
本発明の実施形態2では、一日を単位とする生活パタンを使って一定の期間(1週間あるいは10日間など)を単位とする期間の生活パタンを抽出し、期間の生活パタンの出現頻度を特徴量とするベクトルを生成して利用者や場所などをクラスタリングする多段階クラスタリングを実施する構成例について説明する。本実施形態2における行動属性分析装置1のハードウェアの構成は実施形態1と同じであるので説明を省略する。
(システムの全体構成)
図41は、本実施形態2に係る行動属性分析装置1の構成図である。本実施形態2における行動属性分析装置1は、大きく次の4つの機能から構成される。すなわちシーンベクトル生成部10、生活パタン抽出部20、期間生活パタン抽出部40、および生活パタンクラスタ分析部30である。これら機能のうち、シーンベクトル生成部10、生活パタン抽出部20、および生活パタンクラスタ分析部30は、実施形態1にかかる行動属性分析装置1と同様であるので詳細な説明は省略する。
(システムの機能構成:期間生活パタン抽出部40)
期間生活パタン抽出部40は、生活パタン抽出部20が抽出した一日の生活パタンを用いて期間の生活パタンを抽出する。その入力は生活パタンテーブル206であり、パタンベクトルテーブル405および期間生活パタンテーブル406にデータを出力する。またテンポラリデータとして抽出条件407およびパラメタ408を生成する。入力データの詳細は本実施形態1と同じである。出力データの詳細およびテンポラリデータの一例については、図を用いて詳述する。
期間生活パタン抽出部40は、さらにパタン抽出条件設定部401、パタンベクトル抽出部402、パタンベクトルクラスタリング部403、および期間生活パタン表示部404の4つの機能部を備える。これら機能部の詳細についてはフローチャートを使って説明する。
(データ構成:パタンベクトルテーブル405)
図42は、パタンベクトルテーブル405のデータ構成を示す図である。パタンベクトルテーブル405は、一日の生活パタンの並びを表すパタンベクトルを格納したデータである。パタンベクトルテーブル405は、パタンベクトルID40501、利用者ID40502、生活パタンID40503、および期間の生活パタンID40504を有する。パタンベクトルID40501はパタンベクトルを識別するIDを格納する。利用者ID40502は期間の生活パタンに対応する利用者のIDを格納する。生活パタンID40503は期間における一日の生活パタンのIDを格納する。期間の生活パタンID40504は、パタンベクトルをクラスタリングした結果抽出された期間の生活パタンのIDを格納する。
(データ構成:期間生活パタンテーブル406)
期間生活パタンテーブル406は、パタンベクトルをクラスタリングした結果を格納する。本実施形態2では、実施形態1同様、クラスタリングのアルゴリズムはk−means法を用いる。生成するクラスタの数は期間の生活パタン抽出のパラメタとして指定する。生成されるクラスタのIDは、アルゴリズムが自動的に付与する。
図43は、期間生活パタンテーブル406のデータ構成を示す図である。期間生活パタンテーブル406は、図43(a)に示す期間の生活パタンリストテーブル40600と、図43(b)に示すクラスタリング結果テーブル40610を有する。
期間の生活パタンリストテーブル40600は、これまでに生成した期間の生活パタンの抽出条件やパラメタなどを格納したテーブルであり、クラスタリング結果テーブル40610は、期間生活パタン抽出部40がパタンベクトルのクラスタリングを実行するごとに生成される。生成されたクラスタリング結果テーブル40610は期間の生活パタンリストテーブル40600のクラスタリング結果ID40607に格納されたIDで識別され、分析者から削除の指示がない限り保存される。
期間の生活パタンリストテーブル40600は、期間の生活パタンリストID40601、期間の生活パタンリスト名称40602、生成日40603、生活パタンリストID40604、パタンベクトルテーブルID40605、抽出条件40606、クラスタリング結果ID40607、およびパラメタ40608を有する。期間の生活パタンリストID40601は、期間の生活パタンリストテーブル40600に格納された抽出条件やクラスタリング結果を識別するためのIDを格納する。期間の生活パタンリスト名称40602は、抽出条件やクラスタリング結果に対して分析者がわかりやすさのために付与した名称を格納する。生活パタンリスト名称40602は、初期状態では期間の生活パタンリストIDを格納する。生成日40603はクラスタリングを実行した日付を格納する。生活パタンリストID40604は、パタンベクトルの生成に用いた一日の生活パタンが格納されている生活パタンテーブル206の生活パタンリストID20601を格納する。パタンベクトルテーブルID40605は、クラスタリング対象としたパタンベクトルテーブル405を識別するためのIDを格納する。抽出条件40606は、パタンベクトルを生成するために分析者が設定した条件を格納する。図43中、抽出条件40606は一例として「X駅に滞在した人の12月の・・・」といった自然文で記載された抽出条件を格納しているが、これはわかりやすさのためであり、実際にはパタン抽出条件設定部401が設定した条件と値の組のリストである。クラスタリング結果ID40607は、パタンベクトルをクラスタリングした結果を格納したクラスタリング結果テーブル40610に付与されるIDを格納する。パラメタ40608は、パタンベクトルをクラスタリングするために分析者が設定したパラメタを格納する。
クラスタリング結果テーブル40610は、パタンID40611、パタン名称40612、平均ベクトル40613、代表パタンベクトル40614、ベクトル件数40615、およびパタンベクトルID40616を有する。パタンID40611は、パタンベクトルクラスタリング部403が各クラスタに付与したIDを格納する。パタン名称40612は、各クラスタに対して分析者がわかりやすさのため付与した名称を格納する。パタン名称40612は、初期状態ではパタンIDを格納する。平均ベクトル406013は、当該クラスタに属するパタンベクトルの平均ベクトルを格納する。代表パタンベクトル40614は、クラスタを代表するパタンベクトルを格納する。代表パタンベクトル40614は、分析者に表示するためのベクトルであり、当該クラスタの特徴を表すベクトルである。代表パタンベクトルは、シーンベクトルクラスタリング部203が代表ベクトルを生成する手順と同様の手順で生成する。ベクトル件数40615は、クラスタに属するパタンベクトルの件数を格納する。パタンベクトルID40616は、クラスタに属するパタンベクトルのIDを格納する。このパタンベクトルは、パタンベクトルテーブル405に格納されている。
(テンポラリデータ:抽出条件407)
図44は、抽出条件407の一例を示す図である。抽出条件407は、分析者が設定したパタンベクトルの抽出条件を期間生活パタン抽出部40が格納したテンポラリデータである。
(テンポラリデータ:抽出パラメタ408)
図45は、抽出パラメタ408の一例を示す図である。抽出パラメタ408は、分析者が設定したパタンベクトルのクラスタリング条件を期間生活パタン抽出部40が格納したテンポラリデータである。
(処理手順)
次に図46〜図50を用いて本実施形態2における行動属性分析装置1の処理手順について説明する。
(処理手順:全体の処理手順)
図46は、本実施形態2における行動属性分析装置1の処理手順を示すフローチャートである。ステップS10のシーンベクトル生成、ステップS20の生活パタン抽出は、実施形態1と同様であるので説明を省略する。ステップS20とS30の間に、新たにステップS40が追加されている。
ステップS40において、行動属性分析装置1は、ステップS20で抽出した一日の生活パタンを使って分析者が指定した期間(日の並び)のパタンを抽出する。次に行動属性分析装置1は、ステップS40で抽出した期間の生活パタンを用いて分析対象の特徴ベクトルを生成し、クラスタリングを実行して分析対象のクラスタを生成する(S30)。
(期間生活パタン抽出部40の処理手順)
図47は、期間生活パタン抽出部40の処理手順を示すフローチャートである。以下図47の各ステップについて説明する。
(図47:ステップS401)
期間生活パタン抽出部40のパタン抽出条件設定部401は、分析者が指定したクラスタリングの対象となるパタンベクトルを抽出する条件およびクラスタリングのパラメタを設定し、抽出条件をパタンベクトル抽出部402に、パラメタをパタンベクトルクラスタリング部403に引き渡す。
(図47:ステップS402)
パタンベクトル抽出部402は、引き渡された条件に含まれる一日の生活パタンリストIDをキーに、クラスタリング結果テーブル20610を参照し、抽出条件にマッチする対象者の対象期間における一日の生活パタンのIDを取得して、パタンベクトルを生成しパタンベクトルテーブル405に格納して、そのテーブルIDと、パタンベクトルの抽出条件をパタンベクトルクラスタリング部403に引き渡す。
(図47:ステップS403)
パタンベクトルクラスタリング部403は、引き渡されたパラメタ、パタンベクトルテーブルのID、パタンベクトルの抽出条件、およびクラスタリングを実行した日付を期間の生活パタンリストテーブル40600に格納し、パタンベクトルテーブルのIDをキーにパタンベクトルテーブル405からクラスタリング対象のパタンベクトルを取得しパラメタにしたがってクラスタリングを実行し、結果をクラスタリング結果テーブル40610に格納して、期間の生活パタンリストテーブル40600のIDを期間生活パタン表示部404に引き渡す。
(図47:ステップS404)
期間生活パタン表示部404は、引き渡された期間の生活パタンリストテーブル40600のIDをキーに期間の生活パタンリストテーブル40600およびクラスタリング結果テーブル40610から生成された期間の生活パタンを取得して分析者に表示する。
(画面例:期間生活パタン抽出部40の期間の生活パタン抽出条件設定部401における期間の生活パタン抽出条件設定画面の一例)
図48は、パタン抽出条件設定部401における期間生活パタン抽出条件設定画面の一例を示す図である。期間生活パタン抽出条件設定画面は、生活パタン選択エリア40110、対象者設定エリア40120、対象期間設定エリア40130、および指示ボタンエリア40140を有する。
生活パタン選択エリア40110は、期間の生活パタンを抽出するにあたって用いる生活パタンを選択するエリアである。分析者がこれまでに抽出した生活パタンからひとつ選択すると、その生活パタンの抽出条件を対象者設定エリア40120に表示する。期間の生活パタンの抽出では、対象期間における対象者の一日がどの生活パタンにマッチするか分析しておく必要がある。そのため期間の生活パタンの抽出において、対象者として選択することができるのは、1日の生活パタンを抽出した対象者内に限定される。新たに分析対象を設定した場合は、当該対象者のターゲットシーンベクトルを生成し、既に抽出されている生活パタンとの類似度を計算して割り付けることができるが、本実施形態2では前述の通り限定しているものとする。分析者は、対象者設定エリア40120に表示された条件を絞り込むことによって期間の生活パタン抽出の対象者を設定する。表示された生活パタン抽出条件をそのまま使用する場合は、生活パタンを抽出した対象者全員が期間の生活パタン抽出の対象者となる。対象期間も分析者が選択した生活パタンの抽出期間内に限定される。
分析者は対象期間設定エリア40130で、いつから何日間のパタンを抽出するのかを設定する。なおオプションとして曜日を選択することができる。曜日が選択されると、当該設定された期間のうち、設定された曜日のみを対象にパタンベクトルを生成する。
指示ボタンエリア40140は、パラメタ設定指示ボタン40141、およびパタン抽出実行ボタン40142を有する。分析者がパラメタ設定指示ボタン40141をクリックすると、行動属性分析装置1は図49に示すパラメタ設定画面を表示する。分析者はパラメタ設定画面にて期間の生活パタン抽出パラメタを設定する。分析者がパタン抽出実行ボタン40142をクリックすると、行動属性分析装置1は生活パタン選択エリア40110と対象者設定エリア40120で設定された条件にマッチする生活パタンを抽出し、クラスタリングを実行してクラスタを生成する。
図49は、パラメタ設定指示ボタン40141をクリックしたときに表示されるパラメタ設定画面の一例を示す図である。パラメタ設定画面は、クラスタ数設定エリア401411および指示ボタンエリア401412を有する。分析者がクラスタ数設定エリア401411でクラスタ数を指定すると、パタンベクトルクラスタリング部403は特徴ベクトルを指定された数のクラスタにクラスタリングする。指示ボタンエリア401412は、分析者がクラスタ設定のキャンセルや完了を指示するエリアであり、キャンセルボタン4014121および完了ボタン4014122を有する。これらの動作は図34と同様である。
(処理手順:期間生活パタン抽出部40におけるパタンベクトル抽出部402の詳細な処理手順)
パタンベクトル抽出部402の処理手順について説明する。なお以下の説明では、期間の生活パタン抽出条件における期間の条件が1週間の生活パタン(月〜日の生活パタン)であることを想定する。
まず期間の生活パタン抽出条件において分析者が選択した一日の生活パタンに、パタン間の類似度に基づくIDを付与する。シーンベクトルクラスタリング部203はアルゴリズムが自動的に付与したクラスタ番号をパタンIDとして利用しているが、このパタンIDをクラスタ間の類似度に基づいて振り直す。具体的には各パタンに対応するクラスタの平均ベクトル(クラスタに属するシーンベクトルの平均)を生活パタンテーブル206の平均ベクトル20613から取得してその長さを計算し、その値の降順にパタンをソートし、ソートの結果順に1から始まるIDを振る、あるいは平均ベクトルのうち任意の1つを選択し、残りのベクトルについて前記選択したベクトルとの間の類似度(ユークリッド距離など)を計算しその値の降順に残りのベクトルをソートしてその結果順(一番最初は選択したベクトル)に1から始まるIDを振るなどを行う。
次に振り直したパタンIDを用いてターゲットシーンベクトルテーブル205のパタンID20507を書き換える。具体的には、生活パタンテーブル206のターゲットシーンベクトルテーブルID20604からターゲットシーンベクトルのリストIDを取得し、当該リストIDに対応するターゲットシーンベクトルテーブル205を取得し、ターゲットシーンベクトルテーブル205のパタンID20507を、振り直したIDに書き換える。そして、ターゲットシーンベクトルテーブル205を、利用者を第1キー、日付を第2キーとしてソートする。
パタン抽出条件設定部401は設定された対象者ごとに次の処理を実施する。まず利用者のシーンベクトルを日付順に7日間に分割し、シーンベクトルが属する生活パタンのID(振り直したID)を属性値とする7次元のベクトルを生成しパタンベクトルテーブル405の生活パタンID40503に格納する。シーンベクトルを抽出した期間が7の倍数でない場合、7日間(7次元)に満たない余りが生じるが、ここではそれらは無視する。また該当するシーンベクトルがない日付があればその日の値は「0」とする。
(処理手順:期間生活パタン抽出部40におけるパタンベクトルクラスタリング部403の詳細な処理手順)
パタンベクトルクラスタリング部403は、パタンベクトルテーブル405に格納されたパタンベクトルにk−means法を適用してクラスタリングを実行し、クラスタリング結果をクラスタリング結果テーブル40610に格納する。具体的にはクラスタリング結果テーブル40610のパタンID40611の値にクラスタIDを格納し、当該クラスタに属するパタンベクトルの平均ベクトルを平均ベクトル40613に格納する。代表ベクトル40614には、当該クラスタに属するパタンベクトルの代表ベクトルを格納する。なお代表ベクトルの生成手順は実施形態1におけるターゲットシーンベクトルクラスタリング20610の代表ベクトル生成手順と同様である。さらに当該クラスタに属するパタンベクトルの数をベクトル件数40615に格納し、パタンベクトルのIDをパタンベクトルID40616に格納する。また当該クラスタに属するパタンベクトルIDをキーにパタンベクトルテーブル405を参照し、パタンベクトルID40501の値がパタンベクトルIDと一致するレコードの生活パタンID40503に当該パタンIDをセットする。なおクラスタリングのクラスタ数はパタン抽出条件設定部401において設定されたクラスタ数(未設定の場合は10)とする。
(処理手順:期間生活パタン抽出部40における期間生活パタン表示部404の詳細な処理手順)
図50は、生成されたクラスタを期間生活パタン表示部404が一日のパタンの遷移として表現し、分析者に表示する画面の一例を示す図である。期間の生活パタン表示画面は、期間のパタン表示エリア40400と指示ボタンエリア40410を有する。
期間のパタン表示エリア40400は、生成された期間の生活パタンを表示するエリアであり、選択チェックボックス40401、パタン名40402、代表期間パタン40403、および件数40404を有する。選択チェックボックス40401は、分析者が「利用者ID出力」を実行する際にクラスタを選択するためのチェックボックスである。パタン名40402は、パタン名を表示するエリアである。パタン名は期間生活パタンテーブル406のクラスタリング結果テーブル40610のパタン名称40612に格納されている値を表示する。分析者がクラスタに名称を付与していない状態では、「パタン1」、「パタン2」・・・のように自動的に付与した文字列を表示する。この文字列は分析者によって任意に書き換え可能である。例えば、図50において「パタン1」は「平日仕事休日レジャーパタン」、「パタン2」は「平日寄り道あり休日おでかけパタン」などである。代表期間パタン40403は、クラスタを特徴づける期間の生活パタンを表示する。具体的にはクラスタリング結果テーブル40610のパタンID40611に格納されている生活パタンIDを取得し、当該生活パタンIDをキーにクラスタリング結果テーブル20610を検索し、当該生活パタンに対応するパタン名称20612を取得し、代表パタンベクトル40614を用いて図50に示す一日の生活パタンの遷移図を生成して表示する。件数40404は、クラスタに属するパタンベクトルの数を表示する。パタンベクトルの数はクラスタリング結果テーブル40610のベクトル件数40615から取得する。なお期間生活パタン抽出部40は、利用者ごとにパタンベクトルを生成する。したがってパタンベクトル数がすなわちそのクラスタに属する利用者の数である。
指示ボタンエリア40410は、抽出条件表示指示ボタン40411、生活パタン表示指示ボタン40412、利用者ID出力指示ボタン40413、および保存指示ボタン40414を有する。抽出条件表示指示ボタン40411は、パタン抽出条件設定部401が設定した条件を表示するように分析者が指示するためのボタンである。分析者が当該ボタンをクリックすると、期間生活パタン表示部404は図48に示す期間の生活パタン抽出設定画面を表示して、期間の生活パタンを抽出した設定条件を分析者に提示する。生活パタン表示指示ボタン40412は、期間の生活パタンに使用した生活パタンを表示するように分析者が指示するボタンである。分析者が当該ボタンをクリックすると、期間生活パタン表示部404は、期間生活パタンテーブル406の生活パタンリストID40604を取得し、生活パタンテーブル206の生活パタンリストID20601を参照して、対応する一日の生活パタンのリストを取得して、図30に示した一日の生活パタン表示画面に生活パタンを表示する。利用者ID出力指示ボタン40413は、分析者が選択したパタンにマッチする利用者のIDをファイル出力するように指示するボタンである。分析者が選択チェックボックス40401においてパタンを選択して、利用者ID出力指示ボタン40413をクリックすると、期間生活パタン表示部404は、期間生活パタンテーブル406を参照し選択されたパタンベクトルID40616を取得して、パタンベクトルテーブル405のパタンベクトルID40501を参照し、対応する利用者ID40502を取得して、ファイルに出力する。これにより、出力されたIDの利用者を対象として別条件で期間生活パタンを抽出することができる。保存指示ボタ40414は、分析者がパタンにわかりやすい名称を付与して保存を指示するボタンである。
<実施の形態2:まとめ>
以上のように、本実施形態2に係る行動属性分析装置1は、人集合内に含まれる1日の生活パタンからさらに、ある期間にわたる生活パタンを抽出し、これを用いて分析対象を分析することができる。
<実施の形態3>
本発明の実施形態3では、分析者が利用者の行動属性を分析し、配信したいコンテンツに対してその効果が期待される利用者または場所を選択して、コンテンツを配信するコンテンツ配信機能を有する構成例を説明する。行動属性分析装置1のハードウェアの構成は実施形態1と同じであるので説明を省略する。
(システムの全体構成)
図51は、本実施形態3に係る行動属性分析装置1の全体構成を示す図である。本実施形態3における行動属性分析装置1は、大きく次の4つの機能を有する。すなわちシーンベクトル生成部10、生活パタン抽出部20、生活パタンクラスタ分析部30、およびコンテンツ配信部91である。シーンベクトル生成部10、生活パタン抽出部20、および生活パタンクラスタ分析部30は、実施形態1と同様であるので詳細な説明は省略する。
コンテンツ配信部91は、生活パタン抽出部20または生活パタンクラスタ分析部30が抽出した利用者または場所のIDに対して分析者が選択したコンテンツを配信する。コンテンツテーブル92は、配信するコンテンツを格納したデータである。コンテンツ93は、利用者の携帯電話94や駅のデジタルサイネージ95に対して送信し、これらデバイスが表示するデータであり、例えば、駅ナカの店舗広告や駅近隣の地域情報などが考えられる。携帯電話94は交通系ICカードの利用者の携帯電話であり、そのe−mailアドレスはユーザ情報209のe−mail20907に格納されている。デジタルサイネージ95は、駅や公共施設などに設置された情報提供装置であり、その設置場所は場所情報210に格納された場所と紐づいているものとする。すなわち場所情報210に格納されたe−mail21006にコンテンツ93を送信すると、当該場所に設置されたデジタルサイネージにコンテンツが表示される。
(処理手順)
次に本実施形態3に係る行動属性分析装置1の処理手順について説明する。シーンベクトル生成部10は、まず利用者の行動の履歴が蓄積されたICカード利用履歴103およびクレジットカード利用履歴104を用いてあらかじめシーンベクトルを生成しておく。次に生活パタン抽出部20は、分析者の指定した条件にマッチするシーンベクトルを抽出してクラスタリングを実行して生活パタンを抽出する、生活パタンクラスタ分析部30は、抽出した生活パタンを用いて分析対象の特徴ベクトルを生成し、クラスタリングを実行して分析対象のクラスタを生成する。分析者が、生活パタン抽出部20または生活パタンクラスタ分析部30の処理結果に基づきコンテンツを配信すべき利用者または場所が発見したら、利用者または場所のIDを適当なファイル等にIDリストとして出力する。コンテンツ配信部91は、そのIDに対応する利用者の携帯電話94、またはそのIDに対応する場所のデジタルサイネージ95へ、コンテンツを送信する。
例えば、生活パタンクラスタ分析部30が、仕事帰りにx駅に寄り道する「寄り道パタン」を主な生活パタンとしている20代から30代の女性の利用者IDをIDリストとして出力すると、コンテンツ配信部91は当該利用者IDに対応するメールアドレスをユーザ情報209から取得する。分析者がコンテンツテーブル92からx駅の駅ビルに開店した若い女性向けの店舗(雑貨店など)の広告のコンテンツを指定すると、コンテンツ配信部91は当該コンテンツを上記メールアドレスに配信する。
<実施の形態3:まとめ>
以上のように、本実施形態3に係る行動属性分析装置1は、生活パタンの分析結果に基づき、利用者または場所に適したコンテンツを配信することができる。
以上、本発明者によってなされた発明を実施形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。例えば、ある実施形態における構成を他の実施形態において組み合わせたり、置き換えたりすることができる。
また、上記各構成、機能、処理部などは、それらの全部または一部を、例えば集積回路で設計することによりハードウェアとして実現することもできるし、プロセッサがそれぞれの機能を実現するプログラムを実行することによりソフトウェアとして実現することもできる。各機能を実現するプログラム、テーブルなどの情報は、メモリやハードディスクなどの記憶装置、ICカード、DVDなどの記憶媒体に格納することができる。
1 行動属性分析装置
10 シーンベクトル生成部
20 生活パタン抽出部
30 生活パタンクラスタ分析部
40 期間生活パタン抽出部
91 コンテンツ配信部
92 コンテンツテーブル
101 シーン抽出部
102 イベント抽出部
103 ICカード利用履歴
104 クレジットカード利用履歴
105 シーンリスト
106 イベントリスト
107 シーンベクトルテーブル
201 パタン抽出条件設定部
202 シーンベクトル抽出部
203 シーンベクトルクラスタリング部
204 生活パタン表示部
205 ターゲットシーンベクトルテーブル
206 生活パタンテーブル
207 抽出条件
208 抽出パラメタ
209 ユーザ情報
210 場所情報
211 カレンダ情報
301 クラスタ分析条件設定部
302 特徴ベクトル生成部
303 特徴ベクトルクラスタリング部
304 クラスタ表示部
305 特徴ベクトルテーブル
306 クラスタテーブル
307 分析条件
308 分析パラメタ
309 分析レポート
401 パタン抽出条件設定部
402 パタンベクトル抽出部
403 パタンベクトルクラスタリング部
404 期間生活パタン表示部

Claims (14)

  1. 人集団の行動履歴を記録した履歴データから、前記人集団に属する人物が行動したシーンを抽出するシーン抽出部と、
    前記シーン抽出部が抽出したシーンの個人毎の遷移を、1日の時間帯を要素番号とし、前記時間帯に対応するシーンを表す値を前記要素番号に対応する要素値として持つ、シーンベクトルとして表現し、前記シーンベクトルを記述したシーンベクトルデータを記憶装置に格納するシーンベクトル生成部と、
    前記シーンベクトルをクラスタリングして前記シーンの遷移パタンを抽出することにより、前記遷移パタンを前記人集団内に含まれる生活パタンとして抽出する生活パタン抽出部と、
    前記履歴データのなかで前記生活パタンが分析対象に関連して出現する頻度によって前記分析対象を特徴付けて前記分析対象をクラスタリングする生活パタン分析部と、
    を備えることを特徴とする行動属性分析装置。
  2. 前記シーン抽出部は、
    前記履歴データが記述している前記行動履歴の発生場所、発生時間帯、および継続時間に基づき前記行動履歴の目的を推定することにより、前記履歴データから前記目的に対応するシーンを抽出する
    ことを特徴とする請求項1記載の行動属性分析装置。
  3. 前記シーン抽出部は、
    前記履歴データが駅の改札に入場したことを示している場合、
    その駅入場が1日のうち最初の駅入場であれば、当該駅入場の直前の前記行動履歴をその人物が自宅にいたことを示すシーンとして抽出し、その駅入場が1日のうち最初の駅入場でなければ、当該駅入場の直前の前記行動履歴を前記人物が外出していたことを示すシーンとして抽出し、
    前記人物が外出していたことを示すシーンを抽出する場合においては、
    当該駅入場の直前の前記行動履歴が平日に所定時間以上同じ場所に滞在していたことを示している場合は前記人物が仕事をしていたことを示すシーンとして抽出し、当該駅入場の直前の前記行動履歴が平日以外で所定時間以上同じ場所に滞在していたことを示している場合は前記人物が行楽外出していたことを示すシーンとして抽出する
    ことを特徴とする請求項2記載の行動属性分析装置。
  4. 前記シーンベクトル生成部は、
    前記シーンを表す値として用いることができる値を前記シーンベクトルの要素値として割り当てる際に、シーン間のベクトル空間上における距離がシーンの出現頻度または意味に応じた大きさとなるように、前記割り当てを実施する
    ことを特徴とする請求項1記載の行動属性分析装置。
  5. 前記生活パタン抽出部は、
    特定のシーンを含む生活パタンを抽出すべき旨の指定を受け取ると、前記シーンベクトルのうちそのシーンを含むもののみから前記生活パタンを抽出する
    ことを特徴とする請求項1記載の行動属性分析装置。
  6. 前記生活パタン抽出部は、
    特定の分析目的に適した前記生活パタンを抽出すべき旨の指定を受け取ると、前記シーンベクトルの要素のうちその分析目的に合致する部分の要素値を、同じ前記生活パタンに属する他の前記シーンベクトルの要素値とは異なる値に変換する
    ことを特徴とする請求項1記載の行動属性分析装置。
  7. 前記生活パタン抽出部は、
    前記変換後のシーンベクトルおよび前記変換前にこれと同じ前記生活パタンに属していたシーンベクトルを、互いに異なる前記生活パタンとして抽出する
    ことを特徴とする請求項6記載の行動属性分析装置。
  8. 前記生活パタン抽出部は、
    特定の分析目的に適した前記生活パタンを掘り下げて抽出したい旨の要求を受け取ると、
    その分析目的に対応する付加属性を前記シーンベクトルに追加する
    ことを特徴とする請求項1記載の行動属性分析装置。
  9. 前記生活パタン分析部は、
    前記分析対象をクラスタリングした後、前記生活パタンに属する前記シーンベクトルのなかで特定の分析目的に適したものをさらに抽出すべき旨の指定を受け取ると、
    その分析目的に対応する前記付加属性が追加されている前記シーンベクトルを、前記クラスタリング後の分析対象からさらに抽出する
    ことを特徴とする請求項8記載の行動属性分析装置。
  10. 前記生活パタン抽出部は、
    抽出した前記生活パタン内における最も典型的な前記シーンの遷移を特定し、前記生活パタン毎に可視化して出力する
    ことを特徴とする請求項1記載の行動属性分析装置。
  11. 前記生活パタン抽出部は、
    前記クラスタリングによって生成されたクラスタに属する前記シーンの遷移を表すベクトルを参照して、前記クラスタ内の各前記時間帯における前記シーンのうち最も頻度の高いものを、前記クラスタ内の当該時間帯における典型的なシーンとし、
    前記典型的なシーンを表す値を当該時間帯に対応する要素値として有するシーンベクトルを生成してこれを前記クラスタの特徴とし、
    前記生活パタン分析部は、
    前記履歴データのなかで分析対象が前記クラスタの特徴に合致する頻度によって前記分析対象を特徴付けて前記分析対象をクラスタリングする
    ことを特徴とする請求項10記載の行動属性分析装置。
  12. 前記生活パタン抽出部は、
    抽出した前記生活パタンのなかからさらに、ある期間における前記人集合の1日の生活パタンの並びをクラスタリングすることにより、前記人集合の前記期間における典型的な生活パタンを期間生活パタンとして抽出し、
    前記生活パタン分析部は、
    前記履歴データのなかで前記期間生活パタンが分析対象に関連して出現する頻度によって前記分析対象を特徴付けて前記分析対象をクラスタリングする
    ことを特徴とする請求項1記載の行動属性分析装置。
  13. 前記生活パタンに対応するコンテンツ情報をその生活パタンに対応する場所に配信するコンテンツ配信部を備えた
    ことを特徴とする請求項1記載の行動属性分析装置。
  14. 人集団の行動履歴を記録した履歴データからシーンを抽出するシーン抽出ステップ、
    前記シーン抽出ステップで抽出したシーンの個人毎の遷移を、1日の時間帯を要素番号とし、前記時間帯に対応するシーンを表す値を前記要素番号に対応する要素値として持つ、シーンベクトルとして表現し、前記シーンベクトルを記述したシーンベクトルデータを記憶装置に格納するステップ、
    前記シーンベクトルをクラスタリングして前記シーンの遷移パタンを抽出することにより、前記遷移パタンを前記人集団の生活パタンとして抽出するステップ、
    前記履歴データのなかで前記生活パタンが分析対象に関連して出現する頻度によって前記分析対象を特徴付けて前記分析対象をクラスタリングするステップ、
    を有することを特徴とする行動属性分析方法。
JP2011282015A 2011-12-22 2011-12-22 行動属性分析プログラムおよび装置 Active JP5785869B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2011282015A JP5785869B2 (ja) 2011-12-22 2011-12-22 行動属性分析プログラムおよび装置
PCT/JP2012/081662 WO2013094426A1 (ja) 2011-12-22 2012-12-06 行動属性分析方法および装置
US14/367,422 US20150051948A1 (en) 2011-12-22 2012-12-06 Behavioral attribute analysis method and device
CN201280063302.2A CN104011720B (zh) 2011-12-22 2012-12-06 行动属性分析方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011282015A JP5785869B2 (ja) 2011-12-22 2011-12-22 行動属性分析プログラムおよび装置

Publications (2)

Publication Number Publication Date
JP2013131170A true JP2013131170A (ja) 2013-07-04
JP5785869B2 JP5785869B2 (ja) 2015-09-30

Family

ID=48668322

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011282015A Active JP5785869B2 (ja) 2011-12-22 2011-12-22 行動属性分析プログラムおよび装置

Country Status (4)

Country Link
US (1) US20150051948A1 (ja)
JP (1) JP5785869B2 (ja)
CN (1) CN104011720B (ja)
WO (1) WO2013094426A1 (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015046152A (ja) * 2013-07-31 2015-03-12 技研商事インターナショナル株式会社 行動ログ分析システム及びそのプログラム
JP2015103018A (ja) * 2013-11-25 2015-06-04 ヤフー株式会社 行動パターン分析装置および行動パターン分析方法
JP2015135589A (ja) * 2014-01-17 2015-07-27 株式会社日立製作所 情報分析システム、及び情報分析方法
JP2015187760A (ja) * 2014-03-26 2015-10-29 株式会社豊田中央研究所 人物動態計算装置、人物動態計算システム、及びプログラム
WO2016067460A1 (ja) * 2014-10-31 2016-05-06 株式会社日立製作所 交通行動推定システム、交通シミュレーションシステム、交通行動推定方法
JPWO2015049802A1 (ja) * 2013-10-04 2017-03-09 株式会社日立製作所 データベース生成装置およびその生成方法
JP2018133028A (ja) * 2017-02-17 2018-08-23 日本電信電話株式会社 行動パターン分類装置、行動パターン分類方法、及び行動パターン分類プログラム
JP2019194884A (ja) * 2016-11-23 2019-11-07 アクセンチュア グローバル ソリューションズ リミテッド 認知ロボット工学アナライザ
JPWO2019102533A1 (ja) * 2017-11-22 2020-02-27 花王株式会社 文献分類装置
JP2020107171A (ja) * 2018-12-28 2020-07-09 株式会社日立製作所 行動パタン分析支援装置、行動パタン分析支援システム及び行動パタン分析支援方法
KR102197660B1 (ko) * 2019-10-23 2021-01-04 숭실대학교산학협력단 고령자 생활 패턴 인지 시스템 및 방법
JP2021056591A (ja) * 2019-09-27 2021-04-08 楽天株式会社 教師データ生成システム、教師データ生成方法、及びプログラム
JP2021103585A (ja) * 2020-06-30 2021-07-15 北京百度網訊科技有限公司 ユーザグループ化方法、装置、コンピュータデバイス、媒体およびコンピュータプログラム

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8036979B1 (en) 2006-10-05 2011-10-11 Experian Information Solutions, Inc. System and method for generating a finance attribute from tradeline data
US8606626B1 (en) 2007-01-31 2013-12-10 Experian Information Solutions, Inc. Systems and methods for providing a direct marketing campaign planning environment
US8606666B1 (en) 2007-01-31 2013-12-10 Experian Information Solutions, Inc. System and method for providing an aggregation tool
US8543523B1 (en) * 2012-06-01 2013-09-24 Rentrak Corporation Systems and methods for calibrating user and consumer data
US9953304B2 (en) * 2012-12-30 2018-04-24 Buzd, Llc Situational and global context aware calendar, communications, and relationship management
CN103810241B (zh) * 2013-11-22 2017-04-05 北京奇虎科技有限公司 一种低频点击的过滤方法和装置
US10262362B1 (en) 2014-02-14 2019-04-16 Experian Information Solutions, Inc. Automatic generation of code for attributes
US9576030B1 (en) 2014-05-07 2017-02-21 Consumerinfo.Com, Inc. Keeping up with the joneses
US9928233B2 (en) * 2014-11-12 2018-03-27 Applause App Quality, Inc. Computer-implemented methods and systems for clustering user reviews and ranking clusters
US10242019B1 (en) * 2014-12-19 2019-03-26 Experian Information Solutions, Inc. User behavior segmentation using latent topic detection
JP6575091B2 (ja) * 2015-03-20 2019-09-18 富士ゼロックス株式会社 旅程推定装置及びプログラム
EP3423962A4 (en) * 2016-03-04 2019-10-02 Axon Vibe AG SYSTEMS AND METHOD FOR PREDICTING THE USER BEHAVIOR BASED ON LOCATION DATA
US20190207946A1 (en) * 2016-12-20 2019-07-04 Google Inc. Conditional provision of access by interactive assistant modules
US10592995B1 (en) 2017-01-27 2020-03-17 Intuit Inc. Methods, systems, and computer program product for providing expense information for an electronic tax return preparation and filing software delivery model
US11270185B1 (en) 2017-01-27 2022-03-08 Intuit Inc. Methods, systems, and computer program product for generating a personalized flow for a software delivery model
US11436417B2 (en) 2017-05-15 2022-09-06 Google Llc Providing access to user-controlled resources by automated assistants
US10127227B1 (en) 2017-05-15 2018-11-13 Google Llc Providing access to user-controlled resources by automated assistants
US11328260B2 (en) * 2017-07-19 2022-05-10 Mitsubishi Electric Corporation Behavior visualization device and behavior visualization method
JP6904426B2 (ja) * 2017-10-13 2021-07-14 日本電信電話株式会社 擬似データ生成装置、その方法、およびプログラム
US20210225050A1 (en) * 2018-03-17 2021-07-22 Dataspark Pte Ltd. Human Daily Activity Represented by and Processed as Images
WO2019203724A1 (en) * 2018-04-17 2019-10-24 Dataspark Pte. Ltd. Image analysis of human daily activity represented by layered images
US11455418B2 (en) 2018-08-07 2022-09-27 Google Llc Assembling and evaluating automated assistant responses for privacy concerns
CN111461153B (zh) * 2019-01-22 2023-08-04 刘宏军 人群特征深度学习方法
JP7173315B2 (ja) * 2019-05-21 2022-11-16 日本電信電話株式会社 分析装置、分析システム、分析方法及びプログラム
CN111080339B (zh) * 2019-11-18 2024-01-30 口口相传(北京)网络技术有限公司 基于场景的类目偏好数据生成方法及装置
US20210312224A1 (en) * 2020-04-02 2021-10-07 Goldenspear Llc System and method for creating per-customer machine vision personas based on mobile network metadata
US11977523B1 (en) * 2020-04-27 2024-05-07 Splunk Inc. Enhanced data extraction via efficient extraction rule matching
CN111680248A (zh) * 2020-04-28 2020-09-18 五八有限公司 一种生成消息的推送批次号的方法及装置
US20230134941A1 (en) * 2021-11-02 2023-05-04 At&T Intellectual Property I, L. P. Automated security hangar for private cellular networks
CN114936959B (zh) * 2022-06-17 2023-05-23 上海市城乡建设和交通发展研究院 实现车辆匹配和乘客上车点的识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005531845A (ja) * 2002-06-28 2005-10-20 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 確率分布関数を用いて行動をモデル化するための方法及び装置
JP2010072727A (ja) * 2008-09-16 2010-04-02 Nippon Telegr & Teleph Corp <Ntt> 履歴処理装置、履歴処理方法および履歴処理プログラム
WO2011070831A1 (ja) * 2009-12-11 2011-06-16 株式会社日立製作所 生活パターン分類装置及び生活パターン分類システム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6327574B1 (en) * 1998-07-07 2001-12-04 Encirq Corporation Hierarchical models of consumer attributes for targeting content in a privacy-preserving manner
US6430539B1 (en) * 1999-05-06 2002-08-06 Hnc Software Predictive modeling of consumer financial behavior
WO2001065453A1 (en) * 2000-02-29 2001-09-07 Expanse Networks, Inc. Privacy-protected targeting system
JP2003256466A (ja) * 2002-03-04 2003-09-12 Denso Corp 適応的情報検索システム
EP1779269A1 (en) * 2004-07-26 2007-05-02 Panthaen Informatics, Inc. Context-based search engine residing on a network
US8019692B2 (en) * 2004-10-19 2011-09-13 Yahoo! Inc. System and method for location based social networking
US7835859B2 (en) * 2004-10-29 2010-11-16 Aol Inc. Determining a route to a destination based on partially completed route
US7672865B2 (en) * 2005-10-21 2010-03-02 Fair Isaac Corporation Method and apparatus for retail data mining using pair-wise co-occurrence consistency
US7974889B2 (en) * 2007-10-19 2011-07-05 Raimbeault Sean M Social networking interactive shopping system
CN102017550A (zh) * 2007-11-14 2011-04-13 高通股份有限公司 用于确定地理用户简档以基于所述简档确定有目标的内容消息的适宜性的方法和系统
US8271413B2 (en) * 2008-11-25 2012-09-18 Google Inc. Providing digital content based on expected user behavior
AU2010271244B2 (en) * 2009-07-09 2014-12-11 Cubic Corporation Predictive techniques in transit alerting
US20110178845A1 (en) * 2010-01-20 2011-07-21 American Express Travel Related Services Company, Inc. System and method for matching merchants to a population of consumers
US20120042262A1 (en) * 2010-08-11 2012-02-16 Apple Inc. Population segmentation based on behavioral patterns

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005531845A (ja) * 2002-06-28 2005-10-20 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 確率分布関数を用いて行動をモデル化するための方法及び装置
JP2010072727A (ja) * 2008-09-16 2010-04-02 Nippon Telegr & Teleph Corp <Ntt> 履歴処理装置、履歴処理方法および履歴処理プログラム
WO2011070831A1 (ja) * 2009-12-11 2011-06-16 株式会社日立製作所 生活パターン分類装置及び生活パターン分類システム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6015022317; 河本 健、外4名: '典型日遷移列に基づく生活モデルの提案' 電子情報通信学会技術研究報告 第110巻,第207号, 20100914, p.19-24, 社団法人電子情報通信学会 *
JPN6015022318; 森 武俊: '生活支援のためのセンサデータマイニング -「みまもり工学」への展開-' 電子情報通信学会誌 第94巻,第4号, 20110401, p.276-281, 社団法人電子情報通信学会 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015046152A (ja) * 2013-07-31 2015-03-12 技研商事インターナショナル株式会社 行動ログ分析システム及びそのプログラム
JPWO2015049802A1 (ja) * 2013-10-04 2017-03-09 株式会社日立製作所 データベース生成装置およびその生成方法
JP2015103018A (ja) * 2013-11-25 2015-06-04 ヤフー株式会社 行動パターン分析装置および行動パターン分析方法
JP2015135589A (ja) * 2014-01-17 2015-07-27 株式会社日立製作所 情報分析システム、及び情報分析方法
JP2015187760A (ja) * 2014-03-26 2015-10-29 株式会社豊田中央研究所 人物動態計算装置、人物動態計算システム、及びプログラム
WO2016067460A1 (ja) * 2014-10-31 2016-05-06 株式会社日立製作所 交通行動推定システム、交通シミュレーションシステム、交通行動推定方法
US10970639B2 (en) 2016-11-23 2021-04-06 Accenture Global Solutions Limited Cognitive robotics analyzer
JP2019194884A (ja) * 2016-11-23 2019-11-07 アクセンチュア グローバル ソリューションズ リミテッド 認知ロボット工学アナライザ
JP2018133028A (ja) * 2017-02-17 2018-08-23 日本電信電話株式会社 行動パターン分類装置、行動パターン分類方法、及び行動パターン分類プログラム
JPWO2019102533A1 (ja) * 2017-11-22 2020-02-27 花王株式会社 文献分類装置
US10984344B2 (en) 2017-11-22 2021-04-20 Kao Corporation Document classifying device
JP2020107171A (ja) * 2018-12-28 2020-07-09 株式会社日立製作所 行動パタン分析支援装置、行動パタン分析支援システム及び行動パタン分析支援方法
JP7343973B2 (ja) 2018-12-28 2023-09-13 株式会社日立製作所 行動パタン分析支援装置、行動パタン分析支援システム及び行動パタン分析支援方法
JP2021056591A (ja) * 2019-09-27 2021-04-08 楽天株式会社 教師データ生成システム、教師データ生成方法、及びプログラム
KR102197660B1 (ko) * 2019-10-23 2021-01-04 숭실대학교산학협력단 고령자 생활 패턴 인지 시스템 및 방법
WO2021080073A1 (ko) * 2019-10-23 2021-04-29 숭실대학교산학협력단 고령자 생활 패턴 인지 시스템 및 방법
JP2021103585A (ja) * 2020-06-30 2021-07-15 北京百度網訊科技有限公司 ユーザグループ化方法、装置、コンピュータデバイス、媒体およびコンピュータプログラム
US11580136B2 (en) 2020-06-30 2023-02-14 Beijing Baidu Netcom Science Technology Co., Ltd. Method and apparatus of user clustering, computer device and medium
JP7269980B2 (ja) 2020-06-30 2023-05-09 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド ユーザグループ化方法、装置、コンピュータデバイス、媒体およびコンピュータプログラム

Also Published As

Publication number Publication date
WO2013094426A1 (ja) 2013-06-27
CN104011720A (zh) 2014-08-27
US20150051948A1 (en) 2015-02-19
CN104011720B (zh) 2017-05-24
JP5785869B2 (ja) 2015-09-30

Similar Documents

Publication Publication Date Title
JP5785869B2 (ja) 行動属性分析プログラムおよび装置
Celik Turkoglu et al. A comparative survey of service facility location problems
Schenk et al. Agent-based simulation of consumer behavior in grocery shopping on a regional level
JP5414562B2 (ja) 情報処理装置及び情報処理システム
Deschaintres et al. Analyzing transit user behavior with 51 weeks of smart card data
KR20220168961A (ko) 인공지능 기반 프랜차이즈 컨설팅 시스템 및 이에 의해 수행되는 카드사 회원의 회원 분류 정보 생성 방법
Millward et al. Activity travel of population segments grouped by daily time-use: GPS tracking in Halifax, Canada
Yoshimura et al. Urban association rules: uncovering linked trips for shopping behavior
JP2017228040A (ja) 加盟店舗情報提供方法
JPH11296539A (ja) データ処理装置
Rohani et al. Location analytics for optimal business retail site selection
Wang et al. A reliable location design of unmanned vending machines based on customer satisfaction
CN115315736A (zh) 簇生成装置、簇生成方法以及簇生成程序
Romero Palop et al. Determining the usual environment of cardholders as a key factor to measure the evolution of domestic tourism
Cook Heterogeneous Preferences for Neighborhood Amenities: Evidence from GPS data
JP2023133469A (ja) 情報可視化処理装置、情報可視化処理システム、情報可視化処理方法、及び情報可視化処理コンピュータプログラム
JP2015135589A (ja) 情報分析システム、及び情報分析方法
WO2022201512A1 (ja) 受注予測装置、受注予測方法、学習装置、学習方法、及び、記録媒体
US20150161743A1 (en) System and method for automatically classifying transaction information
JP2015146145A (ja) 顧客分析プログラム、顧客分析方法、及び顧客分析装置
JP7033325B2 (ja) 情報可視化処理装置、情報可視化処理システム、情報可視化処理方法、及び情報可視化処理コンピュータプログラム
Lysenko et al. Combination of individual and group patterns for time-sensitive purchase recommendation
WO2024038689A1 (ja) プログラム、方法、情報処理装置、およびシステム
Gohil CEvaluating Geospatial Methods for Marketing Concert Tickets in Rock Music
JP7228208B2 (ja) 潜在顧客発掘支援システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140604

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150609

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150622

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150727

R151 Written notification of patent or utility model registration

Ref document number: 5785869

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151