JP2013131170A - 行動属性分析方法および装置 - Google Patents
行動属性分析方法および装置 Download PDFInfo
- Publication number
- JP2013131170A JP2013131170A JP2011282015A JP2011282015A JP2013131170A JP 2013131170 A JP2013131170 A JP 2013131170A JP 2011282015 A JP2011282015 A JP 2011282015A JP 2011282015 A JP2011282015 A JP 2011282015A JP 2013131170 A JP2013131170 A JP 2013131170A
- Authority
- JP
- Japan
- Prior art keywords
- scene
- vector
- life pattern
- pattern
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0204—Market segmentation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】本発明に係る行動属性分析装置は、人集合の行動を時間帯毎のシーン値として記載したシーンベクトルによって行動パタンを表現し、シーンベクトルをクラスタリングすることによって人集合全体に含まれる生活パタンを抽出した後、各人がどの生活パタンに当てはまるかに基づき分類する。
【選択図】図1
Description
上記特許文献1および2に記載されている行動パタンは、利用者が駅、施設、店舗名を「いつ」利用したかが考慮されていない。例えば、ある駅の利用者が駅構内のコンビニエンスストアを利用するケースでは、早朝に利用する利用者、日中に利用する利用者、あるいは平日のみ/休日のみ利用する利用者では、それぞれ利用の目的が異なると考えられるが、特許文献1および2に記載されている行動パタンでは同じパタンとして扱われる。そのため利用者の行動のパタンから把握できるのは、駅、施設、店舗の「場所」の観点からのみであり、早朝、日中、平日、休日など「時間」の観点から利用者の傾向を把握することは難しい。
利用者の数あるいは行動履歴を取得する期間が拡大すると行動パタンの数が爆発的に増加するため、利用者の傾向を網羅的に把握することが困難になる。特許文献1に記載されている行動パタンは、利用者が利用した駅、施設、店舗名をパタンの属性とし、特許文献2に記載されている行動パタンは、店舗、施設のコードをパタンの属性としているので、駅、施設、店舗が異なれば別のパタンとなる。そのため、これら文献に記載されている技術では、行動パタンは無数に生成される。そこで現実的には、パタンの出現頻度を手掛かりに「よくある」すなわち高頻度のパタンのみを分析対象とすることになる。この場合、店舗名は異なるがタイプは同じ店舗を繰り返し利用しているパタンや、各利用者の利用頻度は低いが全体では特定の傾向がみられるパタン(理容店の後に電車で出かけるなど)などが見つけにくい。
本発明では、以下の3つの手法(1)シーンベクトル生成〜(3)生活パタンクラスタ分析により、人集合の行動属性を用いて分析対象を分析する。(1)シーンベクトル生成では行動履歴を後述するシーンベクトルとして表現し、(2)生活パタン抽出ではシーンベクトルの集合から生活パタンを抽出し、(3)生活パタンクラスタ分析では分析対象が各生活パタンのいずれに属するかに基づいて分類する。以下、各手法の概略を説明する。
利用者の行動を場所だけでなく時間や行動の目的など多様な観点から傾向を把握できるよう、本発明では利用者の一日を「シーン」の遷移ととらえ、時刻(または時間帯)を要素番号とし、シーンを表す値を要素値とするベクトル(「シーンベクトル」と呼ぶ)によって人の行動を表現する。例えば利用者の行動を1時間毎のシーン遷移として表現する場合、シーンベクトルは24個(1日=24時間に対応)の要素を持ち、各要素値は当該利用者が1時間毎に過ごしたシーンを表す値となる。具体的には以下の処理によりシーンベクトルを生成する。
シーンとは、「自宅で過ごす」、「職場や学校で過ごす」、「遊びにでかける」など、人がある目的を持ってある場所で過ごした時間を指す。人が一日に過ごすシーンの数は高々10個未満と考えられる。本発明ではこのシーンを、利用者の行動履歴に記録された移動時間、移動先の場所に滞在した長さ、その場所に滞在した頻度などに基づき推定して抽出する。具体的には、平日の朝から夕方/夜まで長時間滞在した場所は「職場」もしくは「学校」と推定し、曜日に限らず夕方/夜から次の日の朝まで滞在した場所は「家」と推定し、休日の日中や夕方に短時間滞在した場所は「買い物」や「娯楽/余暇」のための場所であると推定し、それぞれ利用者は「仕事」、「自宅」、「遊び」というシーンを過ごしたと考える。抽出可能なシーンは、利用する行動履歴の特性によって異なる。例えば学生証や社員証の機能を有する交通系ICカードの利用履歴を利用する場合は、入退室管理記録から「図書館で過ごす」、「5Fの居室で過ごす」、「6Fの会議室で過ごす」などのシーンも抽出できるであろう。
次に一日をシーンベクトルで表現するため、抽出したシーンを数値に変換する。シーンの数値への変換は、具体的には次のような方法が考えられる。まず抽出可能なシーンの数をNとしたとき、最も出現頻度の高いシーンの値を「1」、その次に出現頻度の高いシーンの値を「N」とする。その次に頻度の高いシーンの値を「N−1」、さらにその次に頻度の高いシーンの値を「N−2」、以下同様にN個シーンの値を設定する。これによれば後述の生活パタン抽出のためのクラスタリングにおいて、同じ時刻に出現したシーンのうち出現頻度の高いシーン同士をベクトル空間上離れた位置に置くことができる。
本発明では利用者の一日をシーン遷移で捉えるため、利用者の一日を、時刻(または時間帯)を要素番号とするシーンベクトルで表現する。一日の範囲の捉え方には、午前0時から翌午前0時まで、あるいは朝の4時から翌日の朝の4時までなどいくつか考えられる。また時刻は1時間単位、30分単位などがあるが、一定の長さを単位としなくてもよく、活動の多い日中は30分単位、深夜は2時間単位などでもよい。シーンベクトルの各時刻において利用者が過ごしたシーンを表す数値をセットしてベクトルを生成する。
一日のシーン遷移は、夜は自宅、日中は仕事や学校などのようにいくつかの典型的なパタンがあると想定される。そこで本発明では、一日のシーン遷移を表すシーンベクトルをクラスタリングし、一日のシーン遷移のパタン(「生活パタン」と呼ぶ)を抽出する。本処理により、人集合の中にどのような生活パタンが存在するかを概略的に把握することができる。具体的には次の処理により生活パタンを抽出する。
まず生活パタンを抽出したい対象者を絞り込むための条件を設定する。具体的には次のような情報を用いて条件を設定する。
利用者の年代、性別、住所などのユーザ情報があればそれらを生活パタンの抽出条件として利用することができる。例えば対象者を「30代の男性」あるいは「都内在住の20代女性」と設定すると、人集合のなかで上記条件に合致する者について、それぞれの典型的な一日の過ごし方、すなわち生活パタンを抽出することができる。
前述のようにシーンは「誰」が「いつ」「どこ」で「何」をして過ごしたかで表現される。これらシーンの属性を生活パタンの抽出条件とすることができる。例えば「緯度x経度yの範囲内に自宅がある人」(どこで、何を)、「×月△日に○駅にきた人」(いつ、どこで)、「平日、仕事をしている人」(いつ、何を)などがある。このような条件を使うと、前記例では「緯度x経度yの範囲内に自宅がある人」の典型的な一日の過ごし方(自宅から仕事に行ってそのまま帰宅する、あるいは帰りに寄り道をするなど)を抽出することができる。
イベントもシーンと同様、「誰」が「いつ」「どこ」で「何」をして過ごしたかで表現され、加えて「いくら」(金額)などの履歴に依存した要素がありうる。これらを使った抽出条件として「○月×日△△デパートで買い物をした人」(いつ、どこで、何を)、「×月社員食堂を○回以上利用した人」(いつ、どこで)などがある。
(2.1)で説明した生活パタンの抽出条件にしたがい、条件にマッチするシーンベクトルを抽出し、分析の目的に合致する生活パタンが抽出され易いようにシーンベクトルを加工した上で、クラスタリング対象のシーンベクトル(「ターゲットシーンベクトル」と呼ぶ)を生成する。条件にマッチするシーンベクトルは、ユーザ情報やベクトルに含まれるシーン/イベントの属性を参照することにより抽出することができる。シーンベクトルの加工手法としては、例えばシーン値の重みづけ、シーンベクトルへの属性付加などがある。これらの処理は、抽出条件を特に設定する場合のみ実施すればよい。以下、シーン値の重みづけと属性付加について説明する。
シーンベクトルの重み付けとは、(2.1)で説明した生活パタンを抽出したい対象者を絞り込むための条件に合致するシーンベクトルが、条件に合致しないシーンベクトルとは異なる値となるように、シーン値を変換する処理である。これにより、同様の傾向を有しそのままでは同じ生活パタンの中に埋没してしまうようなシーンベクトルのなかから、抽出条件に合致するものを有意に抽出することができる。シーンベクトルの重みづけの一例として、ここではシーンによる重みづけとイベントによる重みづけの2つの観点からの重みづけについて説明する。
本発明では一日をシーン遷移、すなわちシーンを表す数値を値とするベクトルで表現するが、そのうち分析者が着目しているシーンに重みづけをする。例えば分析の目的が「×月△日に○駅に来た利用者について、○駅でどのようなシーンを過ごしたか」である場合、まず日付が「×月△日」で場所が「○駅」のシーン(シーンのタイプはこだわらない)を含んだシーンベクトル(一日のシーンの遷移)を取得し、場所が「○駅」であるシーン値のみに重みをつける。重みの一例としては、値を10倍にするなどが考えられる。あるいは「×月に○駅に来た利用者について、○駅でどのようなシーンを過ごしたか、平日と休日でわけて分析したい」場合、上記と同様「×月に○駅に来た人」のシーンベクトルを取得し場所が「○駅」であるシーンに重みを付け、さらに平日のベクトルと休日のベクトルがベクトル空間上離れて位置するよう、日付が休日(土/日)であるシーンベクトルの値にすべて−1をかけるという方法があげられる。
シーンベクトルはシーンの遷移から構成され、比較的短時間の時間の過ごし方であるイベントはシーンベクトル上に表現されていない。これに対して分析者がイベントに着目して分析したい場合、シーンベクトル中、イベントが発生したシーンあるいはイベントが発生した時刻に重みを付ける。
抽出条件に合致するシーンベクトルを、他のシーンベクトルとは異なるものとして抽出したい場合には、(2.2.1)記載の重み付けが適していると思われる。一方、同じ生活パタンとしていったん抽出されたシーンベクトルのなかで、さらにどのようなパタンが存在しているかを掘り下げて分析したい(いわゆるドリルダウン分析)場合には、シーン値そのものを加工するよりも、掘り下げのための予備的属性をシーンベクトルにあらかじめ追加しておき、掘り下げが必要になった時点でその予備的属性を参照してさらに生活パタンを細分するとよいと思われる。この予備的属性を、本発明ではシーンベクトルの属性と呼ぶ。以下、シーンベクトルの属性が必要になる場面と併せて説明する。
生成したシーンベクトルをクラスタリングする。クラスタリングのアルゴリズムには、いくつか既存のものがある。例えばk−means法は、非階層型クラスタリングの代表的なアルゴリズムであるが、これに限られるものではない。なおk−means法のようにあらかじめクラスタ数を指定する必要があるアルゴリズムを用いる場合は、あらかじめデフォルト値を設定してクラスタリングを実施する。あるいはクラスタ数を変更してクラスタリングを何回か試行し、生成されたクラスタの評価関数を用いて最適なクラスタ数を選択できるようにしてもよい。
・朝自宅を出て、仕事に行き、仕事の帰りに○駅に遊びに来たパタン
・昼自宅を出て、○駅に遊びにきたパタン
・夕方自宅を出て、○駅に遊びに来たパタン
(2.3)で抽出した生活パタンを分析者に表示する。シーンベクトルをk−means法などによってクラスタリングした結果は、クラスタのIDとそのクラスタに属するシーンベクトルのIDリストとなる。このリストを分析者にそのまま表示する、あるいはクラスタの重心(平均ベクトル)を表示しても、分析者はどのような生活パタンが抽出されたか即座に理解することは難しい。そこで本発明では、分析者による理解を容易にするため、クラスタの特徴を表す「代表シーンベクトル」を生成して、各クラスタ、すなわち生活パタンに特徴的なシーン遷移を可視化して表示する。以下詳細に説明する。
シーンベクトルはシーン遷移を表し、シーンベクトルの要素番号は一日のうちの各時刻を表し、要素値は各時刻におけるシーンを表す。この構造は、生活パタンについても同様である。そこで、各クラスタに属するシーンベクトルから各時刻における典型的なシーンを抽出し、その値を属性値とするシーンベクトルを生成して「代表シーンベクトル」とする。シーンベクトルと生活パタン(クラスタ)の構造は同じであるので、クラスタの代表シーンベクトルを、そのクラスタの特徴とすることができる。具体的には、以下のような手順で代表シーンベクトルを生成する。
生成した代表シーンベクトルを表示する際、シーン毎に色を設定して表示する。これにより、シーンの遷移をより視覚的に把握することができる。さらには、シーン遷移を状態遷移図として表示してもよい。具体的には、シーン毎にノードの色を設定し、さらにシーンの長さ(時間長)にしたがってノードの大きさを設定してシーン間の遷移を矢印で表現する。これにより、クラスタの特徴をより視覚的に把握することができる。
(2.1)生活パタン抽出条件設定、(2.2)シーンベクトルの抽出、(2.3)シーンベクトルクラスタリング、(2.4)生活パタン表示は、それぞれ1回のみの実行とは限らない。本発明の行動属性分析装置1では、(2.4)生活パタン表示の結果を受けて生活パタンの抽出条件を変え、再度シーンベクトルを抽出しクラスタリングを実行するなど、試行を繰り返して所望の分析結果を得ることができる構成とする。そのため抽出した生活パタンは、分析者からの削除の指示がない限り抽出条件とともに保存しておく。
クラスタリングにより抽出された生活パタンは、人々が過ごしている典型的な一日を表す。しかし同じ利用者でも例えば平日と休日では一日の過ごし方は異なることが多い。その一方である程度の期間でみると一人の利用者が過ごす典型的な一日には一定の傾向が見られ、「その人らしさ」を表している。あるいはある特定の場所(街、お店、観光スポットなど)に集まる人にはある種の傾向があり(「アクティブなサラリーマン」「普段は家にいることが多い人」など)、その「場所らしさ」を表していることがある。
分析のニーズにしたがって、クラスタ分析の対象および対象の特徴付けに用いる生活パタンを分析者が設定する。一例を示す。
分析ニーズ:「×月△日○駅に遊びに来た人の普段の生活が知りたい」
分析対象:「×月△日○駅に遊びに来た人」
利用する生活パタン:「×月△人○駅に来た人の1カ月のシーンベクトルから抽出した生活パタン」
分析ニーズ:「都内在住の20代女性がどのようなシーンでコンビニを利用しているのか知りたい」
分析対象:「コンビニ」
利用する生活パタン:「コンビニの利用実績がある都内在住20代女性のシーンベクトルに利用時刻で重みづけして抽出した生活パタン」
(3.1)で設定したクラスタ分析対象(「遊びに来た人」「コンビニ」など)について、設定した生活パタンの出現頻度をカウントし、生活パタン数を次元数とし各生活パタンの出現頻度を値とする特徴ベクトルを生成する(表示例は図36参照)。
生成した特徴ベクトルを用いて、分析対象をクラスタリングする。すなわち、生活パタンの出現頻度が類似している分析対象をまとめる。クラスタリングの具体的な手段はシーンベクトルクラスタリングと同様であるので、ここでは説明を省略する。これにより、例えば平日は朝自宅を出て仕事に行くパタンが多く、休日は午後遊びに行くパタンが多い利用者のクラスタ、平日も休日も昼自宅を出て遊びに行くパタンが多い利用者のクラスタなど生活パタンの出現頻度に応じたクラスタが生成される。
生活パタン抽出と同様に、クラスタリングの結果は、自動的に生成されたクラスタのIDと、各クラスタに属する特徴ベクトルのIDのリストである。これらを分析者にわかりやすく表示するため本発明では次のような手段を提供する。
分析者が選択したクラスタについて、当該クラスタに属する分析対象の詳細をグラフ表示する。具体的には、分析対象が利用者の場合は利用者の性別、年代、住所など利用者の属性を参照して、場所の場合は住所や場所の分類(駅や店舗など)などの属性を参照して、各生活パタンクラスタに属する分析対象の内訳をグラフ表示する。グラフは、円グラフや棒グラフなどいくつかのタイプから選択できるものとする。さらに内訳として利用する属性はシステム提供以外のものでもよい。分析者が何らかの手段を使って得た利用者または場所の属性、例えば利用者ごとのクレジットカードの利用金額や、ある店舗におけるクレジットカードの利用金額などをシステムに読み込ませ、それらを属性として参照し、クラスタの内訳をグラフ表示してもよい。
分析者が1つ以上選択した生活パタンクラスタについて、当該クラスタに属する分析対象の詳細をマトリクス表示する。具体的には、分析者が選択した属性(例えば利用者の性別や年代など、上記参照)を分析軸とし、生活パタンクラスタごとに分析軸に対応する分析対象の数をマトリクス形式で表示する。例えば、「生活パタンクラスタ1に属する利用者は男性が51人で女性が69人」などである。さらに分析軸は、階層的に設定できるものとする。例えば分析者は分析軸としてまず性別、その下位の分析軸として年代を設定することができ、この場合「生活パタンクラスタ1に属する利用者は男性51人で、そのうち30代が17人、40代が12人・・・」のようにマトリクス表示する。さらには前述の分析者が読み込ませた属性も分析軸として設定可能とする。例えば「生活パタンクラスタ1に属する利用者は男性51人で、そのうちクレジットカードの利用金額が1万円以上は14人、3万円以上は9人・・・」などをマトリクス表示する。また上記マトリクス表示において分析軸間の関連性を統計的に分析するための機能を有してもよい。具体的には分析軸間の独立性(x自乗検定)や無相関の検定機能、相関行列や分散行列の生成析機能などである。
(3.1)クラスタ分析条件設定、(3.2)特徴ベクトル生成、(3.3)特徴ベクトルクラスタリング、(3.4)クラスタ表示はそれぞれ1回のみの実行とは限らない。本発明の行動属性分析装置1では、(3.4)クラスタ表示の結果を受けてクラスタ分析の条件を変え、再度特徴ベクトルを生成しクラスタリングを実行するなど、試行を繰り返して所望の分析結果を得ることができる構成とする。そのため生活パタンクラスタ分析で生成したクラスタは、分析者からの削除の指示がない限り生成条件とともに保存しておく。また(3.4)クラスタ表示では、分析者が興味を持った生活パタンクラスタについてドリルダウン分析できるよう、各生活パタンクラスタに属する分析対象(利用者または場所)のIDを出力できる機能を設ける。
クラスタリングは2段階のみとは限らない。ここでは他の手段として(3)の利用者や場所などのクラスタリングにおいて利用者や場所の特徴ベクトルをクラスタリング以外の手段で分類する手法を説明する。また、(2)において抽出された一日の生活パタンを使ってある期間の生活パタンを抽出し、利用者や場所などをクラスタリングする手法について説明する。
上記(3)ではクラスタ分析の分析条件を設定し、特徴ベクトルを生成してクラスタリングするが、クラスタリングの手法はこれに限らない。例えば、分析者が具体的に想定している利用者像(ペルソナ)や場所の使われ方のイメージがあり、それに沿った形態で利用者/場所を分類したい場合は、抽出した生活パタンを使って人為的に特徴ベクトルを生成し、抽出した生活パタンによって特徴づけられた利用者/場所を人為的に生成した特徴ベクトルに割り振ることにより、分析対象を分類する。
「多段階クラスタリング」とは、一日を単位とする生活パタンを使って、1週間あるいは10日間など一定の期間を単位とする期間の生活パタンを抽出し、当該パタンの出現頻度を特徴量とするベクトルを生成して利用者や場所などをクラスタリングする手法である。「多段階クラスタリング」において一日の生活パタンの抽出は(2)生活パタン抽出と同じであるので説明を省略する。この一日の生活パタンを用いて一例として利用者の1週間の生活パタンを生成する。そして1週間の生活パタンの出現頻度を用いて利用者の特徴ベクトルを生成しクラスタリングを実施する。この処理は(3)生活パタンクラスタリング分析と同様であるので説明を省略する。1週間の生活パタンを抽出する処理手順の詳細について説明する。
生活パタン抽出において生成された生活パタンに、識別可能なIDを付与する。クラスタリングではアルゴリズムが自動的にクラスタ番号を付与するが、このクラスタ番号をクラスタ間の類似度に基づいて振り直す。具体的には各クラスタの平均ベクトル(クラスタに属するシーンベクトルの平均)を生成し、平均ベクトルを長さの降順にソートしてその結果順に1から始まるIDを振る、あるいは平均ベクトルのうち任意の1つを選択し、残りのベクトルについて前記選択したベクトルとの類似度(ユークリッド距離など)を計算しその値の降順に残りのベクトルをソートしてその結果順(一番最初は選択したベクトル)に1から始まるIDを振る、などの手順が考えられる。
生活パタン抽出で対象としたシーンベクトルにはクラスタリングによって自動的に生成されたクラスタIDが付与されているが、それらを上記ふり直したクラスタIDに変換し、利用者を第1キー、日付を第2キーとしてシーンベクトルをソートする。
生活パタンを抽出した利用者ごとに次の処理を実施する。まず利用者のシーンベクトルを日付順に7日間に分割し、シーンベクトルが属する生活パタンのID(振り直したID)を属性値とする7次元の属性ベクトルを生成する。シーンベクトルを抽出した期間が7の倍数でない場合、7日間(7次元)に満たない余りが生じるが、ここではそれらは無視する。また該当するシーンベクトルがない日付があればその日の値は「0」とする。
全利用者に関して上記(4.2.3)の処理を実施して7次元の属性ベクトルを複数生成し、それらをクラスタリングして7日間の生活パタンを抽出する。
本発明の実施形態1では、交通系ICカードの利用履歴を用いて利用者の生活パタンを抽出し、当該生活パタンを用いて利用者をクラスタリングする行動属性分析装置について説明する。
図1は、本実施形態1に係る行動属性分析装置1の構成図である。行動属性分析装置1は、ICカード利用履歴103およびクレジットカード利用履歴104を入力とし、分析リポート309を出力とする。ICカード利用履歴103は、交通系ICカード81の利用者が交通系ICカード81を駅の改札機82や店舗に設置された端末機83で利用した履歴を格納したデータである。クレジットカード利用履歴104は、クレジットカード(図示せず)の利用者がクレジットカードを店舗などで支払いに利用した履歴を格納したデータである。分析レポート309は分析対象をクラスタ分析した結果を格納したレポートである。
シーンベクトル生成部10は、人の行動履歴から利用者の一日のシーンの遷移を表すシーンベクトルを生成する。その入力はICカード利用履歴103およびクレジットカード利用履歴104に格納されたデータであり、シーンリスト105、イベントリスト106、およびシーンベクトルテーブル107にデータを出力する。これら入出力データの詳細については、データ構成の説明において図を用いて詳述する。
生活パタン抽出部20は、分析者が設定した抽出条件にしたがってシーンベクトルを抽出し、これに対してクラスタリングを実行して生活パタンを抽出する。その入力は、シーンリスト105、イベントリスト106、およびシーンベクトルテーブル107に格納されたデータであり、ターゲットシーンベクトルテーブル205および生活パタンテーブル206にデータを出力する。またテンポラリデータとして抽出条件207およびパラメタ208を生成する。さらに参照データとして、ユーザ情報209、場所情報210およびカレンダ情報211に格納されたデータを利用することもある。これら入出力データ並びに参照データの詳細およびテンポラリデータの一例については、データ構成およびテンポラリデータの説明において図を用いて詳述する。
生活パタンクラスタ分析部30は、分析者が設定した分析条件にしたがって分析対象の特徴ベクトルを生成し、クラスタリングを実行して分析対象のクラスタを生成する。その入力は、ターゲットシーンベクトルテーブル205および生活パタンテーブル206に格納されたデータであり、特徴ベクトルテーブル305およびクラスタテーブル306にデータを出力する。またテンポラリデータとして分析条件307およびパラメタ308を生成する。これら入出力データの詳細およびテンポラリデータの一例については、データ構成およびテンポラリデータの説明において図を用いて詳述する。
図2は、行動属性分析装置1のハードウェア構成を示す図である。図2に示すように行動属性分析装置1は、CPU2、ハードディスク3、メモリ4、ディスプレイ制御部5、ディスプレイ51、キーボード制御部6、キーボード61、マウス制御部7、およびマウス71を備える。CPU2は、データの入出力、読み込み、格納、および図1で説明した各機能部を実装したプログラムを実行する。ハードディスク3は図1で説明した各データを保存する記憶装置、メモリ4はプログラムおよびデータを一時的にロードして記憶する装置である。ディスプレイ51はユーザにデータを表示する装置であり、ディスプレイ制御部5によって制御される。キーボード61およびマウス71はユーザからの入力を受け付ける装置であり、それぞれキーボード制御部6およびマウス制御部7によって制御される。
次に、図1で説明した各データの構成について図3〜図18を用いて説明する。
図3は、ICカード利用履歴103のデータ構成を示す図である。ICカード利用履歴103は、利用者が交通系ICカードを利用した履歴を格納したデータであり、利用者が駅の改札機や精算機、店舗などに設置された端末機などにおいてカードをタッチした記録が格納されている。
図4は、クレジットカード利用履歴104のデータ構成を示す図である。クレジットカード利用履歴104は、利用者がクレジットカードを利用した履歴を格納したデータであり、利用者の第2の行動履歴として用いられる。
図5は、シーンリスト105のデータ構成を示す図である。シーンリスト105は、利用者が過ごしたシーンを格納したデータであり、シーン抽出部101によって生成される。シーンリスト105は、利用者ID10501、シーン名10502、開始時刻10503、終了時刻10504、場所ID10505、およびシーンベクトルID10506を有する。
図6は、イベントリスト106のデータ構成を示す図である。イベントリスト106は、利用者が過ごしたイベントを格納したデータであり、イベント抽出部102によって生成される。図6に示すようにイベントリスト106は、利用者ID10601、イベント名10602、時刻10603、場所ID10604、金額10605、およびシーンベクトルID10606を有する。
図7は、シーンベクトルテーブル107のデータ構成を示す図である。シーンベクトルテーブル107は、シーンベクトルを格納したデータであり、シーンベクトル生成部10によって生成される。本実施形態1では、一日を午前3時から翌日の午前3時までとし、シーンベクトルは1時間を単位とする24次元のベクトルとして表現する。また前述のように本実施形態1では、シーンは「自宅」「仕事」「レジャー」「おでかけ」の4つであり、それぞれシーンを表す数値は「1」、「4」、「2」、「3」とする。したがって、本実施形態1におけるシーンベクトルは、「1」、「4」、「2」、「3」のいずれかが値にセットされた24次元のベクトルである。
図8は、ターゲットシーンベクトルテーブル205のデータ構成を示す図である。ターゲットシーンベクトルテーブル205は、生活パタン抽出部20が抽出条件にしたがってクラスタリング対象となるシーンベクトル(以下、ターゲットシーンベクトルと呼ぶ)を抽出したデータである。ターゲットシーンベクトルテーブル205には、シーンベクトルテーブル107に格納されたシーンベクトルのうち生活パタン抽出の条件にマッチしたものが格納される。生活パタン抽出の条件によってはベクトル値に重みを付けたり、属性を付加することがある。
図9は、生活パタンテーブル206のデータ構成を示す図である。生活パタンテーブル206は、ターゲットシーンベクトルをクラスタリングした結果を格納したデータである。本実施形態1では、クラスタリングのアルゴリズムとしてk−means法を用いる。生成するクラスタの数は生活パタン抽出部20のパラメタとして指定する。また生成されるクラスタのIDはアルゴリズムが自動的に付与するが、このIDを各クラスタに対応する生活パタンのIDとして用いる。
図10は、ユーザ情報209のデータ構成を示す図である。ユーザ情報209は、利用者の氏名、性別、生年月日などの利用者の属性情報を格納したデータである。本実施形態1では、交通系ICカードの利用履歴およびクレジットカードの利用履歴を利用者の行動の履歴として用いる。そのためユーザ情報209には、交通系ICカードおよびクレジットカードの利用者の情報が格納されている。
図11は、場所情報210のデータ構成を示す図である。場所情報210は、場所の属性情報を格納したデータである。本実施形態1では、交通系ICカードの利用履歴およびクレジットカードの利用履歴を利用者の行動の履歴として用いるので、場所情報210には、交通系ICカード履歴103およびクレジットカード利用履歴104内に格納されている、交通系ICカードおよびクレジットカードを利用可能な駅や店舗の情報が格納されている。
図12は、カレンダ情報211のデータ構成を示す図である。カレンダ情報211は、曜日や祝日などのカレンダ情報を格納したデータである。本実施形態1では、日本の一般的なカレンダ情報を用いる。すなわち月〜金が平日、土日および祝祭日を休日とする。
図13は、特徴ベクトルテーブル305のデータ構成を示す図である。特徴ベクトルテーブル305は、利用者/場所など生活パタンクラスタ分析部30が分析対象とする特徴ベクトルを格納したデータである。
図14は、クラスタテーブル306のデータ構成を示す図である。クラスタテーブル306は、特徴ベクトルをクラスタリングした結果を格納する。本実施形態1では、クラスタリングのアルゴリズムとしてk−means法を用いる。生成するクラスタの数は生活パタンクラスタ分析部30のパラメタとして指定する。また生成されるクラスタのIDは、アルゴリズムが自動的に付与する。
次に、図1に示すテンポラリデータについて図15〜図18にその一例を示す。
図15は、抽出条件207の一例を示す図である。抽出条件207は、生活パタン抽出部20において分析者が設定したシーンベクトルの抽出条件を格納したテンポラリデータである。
図16は、抽出パラメタ208の一例を示す図である。抽出パラメタ208は、生活パタン抽出部20において分析者が設定したシーンベクトルのクラスタリング条件を格納したテンポラリデータであり、具体的には生成するクラスタ数を格納する。
図17は、分析条件307の一例を示す図である。分析条件307は、生活パタンクラスタ分析部30において分析者が設定した特徴ベクトルの生成条件を格納したテンポラリデータである。
図18は、分析パラメタ308の一例を示す図である。分析パラメタ308は、生活パタンクラスタ分析部30において分析者が設定した特徴ベクトルのクラスタリング条件を格納したテンポラリデータであり、具体的には生成するクラスタ数を格納する。
次に図19〜図39を用いて行動属性分析装置1の処理手順について説明する。
図19は、本実施形態1における行動属性分析装置1の処理手順を示すフローチャートである。シーンベクトル生成部10は、まず利用者の行動の履歴が蓄積されたICカード利用履歴103およびクレジットカード利用履歴104を用いてあらかじめシーンベクトルを生成しておく(S10)。次に生活パタン抽出部20は、分析者の指定した条件にマッチするシーンベクトルを抽出してクラスタリングを実行し、生活パタンを抽出する(S20)。次に生活パタンクラスタ分析部30は、ステップS20で抽出した生活パタンを用いて分析対象の特徴ベクトルを生成し、クラスタリングを実行して分析対象のクラスタを生成する(S30)。各ステップの詳細は以下に説明する。
図20は、ステップS10の処理手順を示すフローチャートである。シーンベクトル生成部10のシーン抽出部101は、ICカード利用履歴103からシーンおよびイベントを抽出してシーンリスト105およびイベントリスト106に格納し、同時に抽出したシーンをシーン値に変換してシーンベクトルテーブル107に格納する(S101)。次にイベント抽出部102は、クレジットカード利用履歴104からイベントを抽出しイベントリスト106に格納する(S102)。
図21は、ステップS20の処理手順を示すフローチャートである。生活パタン抽出部20のパタン抽出条件設定部201は、分析者が指定したクラスタリングの対象となるシーンベクトルを抽出する条件およびクラスタリングのパラメタを設定し、抽出条件をシーンベクトル抽出部202に、パラメタをシーンベクトルクラスタリング部203にそれぞれ引き渡す(S201)。
図22は、ステップS30の処理手順を示すフローチャートである。生活パタンクラスタ分析部30のクラスタ分析条件設定部301は、まず分析者が指定したクラスタリングの対象となる特徴ベクトルを生成する条件およびクラスタリングのパラメタを設定する(S301)。特徴ベクトル生成部302は、設定された条件に従って特徴ベクトルを生成する(S302)。特徴ベクトルクラスタリング部303は、生成した特徴ベクトルをクラスタリングしてその結果をクラスタテーブル306に格納する(S303)。クラスタ表示部304は、分析者にクラスタを表示する(S304)。
次にシーンベクトル生成部10の詳細な処理手順について説明する。
図23は、行動属性分析装置1のシーン抽出ルールおよびシーンを表す数値を説明する図である。前述したように本実施形態1では「自宅」「仕事」「レジャー」「おでかけ」の4つのシーンを抽出する。これらシーン抽出するため本実施形態1では、利用者がシーンを過ごした時間帯、その長さ、および曜日の3つを用いたルールを定義した。すなわち一日の最初と最後に出現するシーンは「自宅」、一日の最初と最後以外でかつ平日の7時間以上であれば「仕事」、「休日」であれば「レジャー」、それ以外は「おでかけ」である。それぞれシーンを表す数値は「1」「4」「2」「3」とする。シーンベクトル生成部10は、図23に示すルールを用いてICカード利用履歴103からシーンを抽出してシーンリスト105に格納し、シーンベクトルを生成してシーンベクトルテーブル107に格納する。
シーン抽出部101はiに0をセットする(S101001)。シーン抽出部101はiに1を加え(S101002)、ICカード利用履歴103のi番目の利用履歴の利用者ID10301がUidと同じであればステップS101007にスキップし、同じでなければステップS101004に進む(S101003)。
シーン抽出部101は、Uidにセットされた利用者の全利用履歴について処理が終了したと判断し、シーンの終了時刻を表す変数Etに一日の最後の時刻“26:59”をセットし、「自宅」シーンを抽出する。具体的にはシーンリスト105の末尾の利用者ID10501にUidをセットし、シーン名10502に「自宅」をセットし、開始時刻10503にStの値をセットし、終了時刻10504にEtの値をセットし、場所ID10505にPidの値(一日の最後に出場した駅の場所ID)をセットし、シーンベクトルSvの時刻Stから時刻Etまでの値に「自宅」を表す数値「1」をセットする。
シーン抽出部101は、シーンベクトルテーブル107を参照し、Svと一致するシーンベクトルが既に格納されているか検索する。既に格納されていればそのシーンベクトルが格納されているレコードの利用者ID10702にUidをセットし、日付10703にStの日付部分を(ただし24時を過ぎればその前日)セットする。Svがシーンベクトルテーブル107に格納されていなければシーンベクトルテーブル107の末尾の時刻10704にSvをセットし、利用者ID10702にUidを、日付10703にStの日付部分を(ただし24時を過ぎればその前日)セットする。さらに当該レコードのシーンベクトルID10701を取得し、シーンリスト105の末尾からリスト先頭に向かって順に利用者ID10501がUidと一致しているレコードを検索し、一致したレコードのシーンベクトルID10506へ、取得したシーンベクトルID10701をセットする。またイベントリスト106についても同様に、シーンベクトルID10606へ、取得したシーンベクトルID10701をセットする。
シーン抽出部101は、UidにICカード利用履歴103のi番目の利用者ID10301の値をセットし、シーンの開始時刻を表す変数Stに一日の最初の時刻“03:00”をセットしSvを初期化する。
iがICカード利用履歴103に格納された履歴数よりも大きければ本処理を終了し、それ以外であればステップS101008に進む。
ICカード利用履歴103のi番目の端末機タイプ10304が「入場改札機」であればステップS101009に進み、それ以外であればステップS101019に進む。
シーン抽出部101は、ステップS101008において利用履歴の端末機が入場改札機であれば、シーンが遷移したと判断し、シーンの終了時刻を表す変数EtにICカード利用履歴103のi番目の時刻10302に格納された時刻に1分を減じて格納する。
Stの値が一日の最初のシーンを示している場合(St=“03:00”)はステップS101011に進み、それ以外であればステップS101013に進む。
シーン抽出部101は、ICカード履歴103のi番目の駅名/店舗名10303を取得してこれに対応する場所情報210のレコードを参照し、入場駅の場所ID21001を取得してPidにセットする。
シーン抽出部101は、シーンリスト105の末尾の利用者ID10501にUidをセットし、シーン名10502に「自宅」をセットし、開始時刻10503にStにセットされた値をセットし、終了時刻10504にEtにセットされた値をセットし、場所ID10505にPidの値(一日の最初に入場した駅の場所ID)をセットする。
1日のうち最初に改札機に入場した場合、その直前までは自宅に滞在していたと考えられる。そこで、1つ前のシーン(i−1番目のシーン)は自宅シーンとして抽出することとした。
シーン抽出部101は、シーン開始時刻Stと終了時刻Etから滞在時間(シーンの長さ)を計算する。滞在時間が所定時間以上(たとえば7時間以上)であればステップS101014に進み、それ以外であればステップS101017に進む。
シーン抽出部101は、ICカード利用履歴103の時刻10302から日付を取得し、さらにカレンダ情報211の曜日21102を参照し、当該履歴の日付を取得する。日付が平日であればステップS101015に進み、それ以外であればステップS101016に進む。
改札機に入場したのが1日のうち2回目以降であり、かつ直前の場所に滞在していたのが平日の7時間以上である場合、その入場の直前までは仕事中であったと考えられる。そこでシーン抽出部101は、1つ前のシーン(i−1番目のシーン)として「仕事」シーンを抽出する。シーン抽出部101は、ステップS101012と同様に各テーブルの値をセットする。
改札機に入場したのが1日のうち2回目以降であり、かつ直前の場所に滞在していたのが平日以外の7時間以上である場合、その入場の直前までは行楽外出していたと考えられる。そこでシーン抽出部101は、1つ前のシーン(i−1番目のシーン)として「レジャー」シーンを抽出する。シーン抽出部101は、ステップS101012と同様に各テーブルの値をセットする。
改札機に入場したのが1日のうち2回目以降であり、かつ直前の場所に滞在していたのが7時間未満である場合、その入場の直前まではその他一般的な外出をしていたと考えられる。そこでシーン抽出部101は、1つ前のシーン(i−1番目のシーン)として「おでかけ」シーンを抽出する。シーン抽出部101は、ステップS101012と同様に各テーブルの値をセットする。
シーン抽出部101は、シーンの開始時刻を表す変数StにICカード利用履歴103のi番目の時刻10302をセットし、ステップS101002に戻る。
ICカード利用履歴103のi番目の端末機タイプ10304が「出場改札機」であればステップS101020に進み、それ以外であればステップS101021に進む。
利用者が改札機を出場した場合、その出場駅がシーン場所となる。そこでシーン抽出部101は、ICカード利用履歴103のi番目の駅名/店舗名10303を取得し、場所情報210から対応する場所ID21001を取得してPidにセットした上でステップS101002に戻る。
ICカード利用履歴103のi番目の端末機タイプ10304が「店舗端末」であればステップS101022へ進み、それ以外であればステップS101002へ戻る。
利用履歴が店舗内のものである場合は、利用者が電子マネー機能等を用いて支払いをしたと考えられる。そこでシーン抽出部101は、Pidに当該店舗の場所ID21001をセットし、「支払い」イベントを抽出してイベントリスト106にセットし、ステップS101002に戻る。具体的には、イベントリスト106の末尾の利用者ID10601にUidをセットし、イベント名10602に「支払い」をセットし、時刻10603にICカード利用履歴103のi番目の時刻10302をセットし、場所ID10604にPidをセットし、金額10605にICカード利用履歴103のi番目の金額10305をセットする。
図20のステップS102において、イベント抽出部102は、クレジットカード利用歴104からイベントを抽出してイベントリスト106に格納する。具体的には、クレジットカード利用履歴104に格納された履歴のうち未処理の履歴に対して、次の処理を実施する。
次に前述の生活パタン抽出部20の詳細な処理手順について、フローチャートおよび画面例を用いて説明する。
図25は、生活パタン抽出条件設定部201が実施するステップS201の詳細な処理手順を示すフローチャートである。以下図25の各ステップについて説明する。
図26は、生活パタン抽出条件設定部201が表示する生活パタン抽出条件設定画面の一例を示す図である。生活パタン抽出条件設定画面は、日付設定エリア201110、対象者設定エリア201120、シーン/イベント設定エリア201130、および指示ボタンエリア201140を有する。以下、分析者が各エリアで設定可能な条件について説明するが、わかりやすさのため、設定された条件に対してどのようにシーンベクトルを抽出するかというシーンベクトル抽出ステップ202の処理についても適宜説明する。
図27は、生活パタン抽出条件設定部201が表示する重みづけ設定画面の一例を示す図である。重みづけ設定画面は、日重みづけ設定エリア2011431、対象者重みづけ設定エリア2011432、シーン/イベント重みづけ設定エリア2011433、および指示ボタンエリア2011434を有する。
図28は、生活パタン抽出条件設定部201が表示する属性追加設定画面の一例を示す図である。図28に示すように属性追加設定画面は、日属性追加設定エリア2011441、利用者属性追加設定エリア2011442、および指示ボタンエリア2011443を有する。
図29は、生活パタン抽出条件設定部201が表示するパラメタ設定画面の一例を示す図である。パラメタ設定画面は、パタン数設定エリア2011451、および指示ボタンエリア2011452を有する。
ステップS202において、シーンベクトル抽出部202は、生活パタン抽出条件設定部201において分析者によって設定された条件にマッチするシーンベクトルを適宜ユーザ情報209およびカレンダ情報211を参照しながらシーンベクトルテーブル107から抽出し、属性の追加が設定されていれば属性を追加して、ターゲットシーンベクトルテーブル205の時刻20505および属性20506に格納する。また、利用者ID20502に利用者のIDを格納し、場所ID20503にシーンまたはイベントが発生した場所のIDを格納し、日付20504にシーンベクトルの日付を格納する。各設定条件に対するシーンベクトルの抽出手順、重みづけ手順、および属性の追加手順は、生活パタン抽出条件設定部201における画面の説明等で述べたのでここでは省略する。
ステップS203において、シーンベクトルクラスタリング部203は、ターゲットシーンベクトルテーブル205に格納されたターゲットシーンベクトルにk−means法を適用してクラスタリングを実行し、クラスタリング結果を生活パタンテーブル206のクラスタリング結果テーブル20610に格納する。具体的にはクラスタリング結果テーブル20610のパタンID20611の値にクラスタIDを格納し、当該クラスタに属するターゲットシーンベクトルの平均ベクトルを平均ベクトル20613に格納する(代表ベクトル20614については後述する)。さらに当該クラスタに属するターゲットシーンベクトルの数をベクトル件数20615に格納し、ターゲットシーンベクトルのIDをターゲットシーンベクトルID20616に格納する。また当該クラスタに属するターゲットシーンベクトルIDをキーにしてターゲットシーンベクトルテーブル205を参照し、ターゲットシーンベクトルID20501の値がターゲットシーンベクトルIDと一致するレコードのパタンID20507に当該パタンIDをセットする。なおクラスタリングのクラスタ数は生活パタン抽出条件設定部201において設定されたクラスタ数とする。未設定の場合はクラスタ数を例えば12とする。
生活パタン表示部204は、ステップS201〜S203によって抽出された生活パタンを表示する。以下、画面例を用いて生活パタン表示の処理手順について説明する。
次に前述の生活パタンクラスタ分析部30の詳細な処理手順について説明する。
図31は、クラスタ分析条件設定部301が実施するステップS301の詳細な処理手順を示すフローチャートである。以下図31の各ステップについて説明する。
図32は、クラスタ分析条件設定部301がステップS301で表示する生活パタンクラスタ分析条件設定画面の一例を示す図である。生活パタンクラスタ分析条件設定画面は、生活パタン選択エリア301110、分析対象設定エリア301120、および指示ボタンエリア301130を有する。
特徴ベクトル生成部302は、ステップS302において、分析対象を生活パタンの出現頻度で特徴づけた特徴ベクトルを生成する。詳細には、分析対象に係るターゲットシーンベクトルについて、各ターゲットシーンベクトルがどの生活パタンにマッチするかチェックして、生活パタンごとにマッチしたターゲットシーンベクトルの数をカウントし、生活パタンを要素番号、マッチしたターゲットシーンベクトルの数を要素値とするベクトルを生成する。
特徴ベクトル生成部302は、クラスタ分析条件設定部301が選択した生活パタンの抽出条件と、クラスタ分析対象設定画面にて設定されたクラスタ分析対象設定条件が同じかどうかをチェックする。同じであればステップS30204にスキップし、それ以外はステップS30202へ進む。
特徴ベクトル生成部302は、クラスタ分析条件にマッチするターゲットシーンベクトルを生成し、ターゲットシーンベクトルテーブル205に格納する。ターゲットシーンベクトルを生成する処理手順についてはシーンベクトル抽出部202の処理手順と同様なのでここでは説明を省略する。
特徴ベクトル生成部302は、ステップS30202が生成したターゲットシーンベクトルそれぞれについて次の処理を実施する。ターゲットシーンベクトルと、クラスタリング結果テーブル20610に格納された各生活パタンの平均ベクトル20613との間の類似度を計算し、最も類似度が高い生活パタンのIDを取得してターゲットシーンベクトルテーブル205のパタンID20507に格納する。ターゲットシーンベクトルと生活パタンの平均ベクトルとの間の類似度は、ベクトル間の距離(ユークリッド距離)を求めて類似度とするなどの方法を適用すればよい。
分析者が分析対象として利用者を選択していればステップS30205に進み、それ以外はステップS30206に進む。
特徴ベクトル生成部302は、ターゲットシーンベクトルテーブル205を参照して、利用者ごとに生活パタンの出現頻度を取得して特徴ベクトルテーブル305に格納する。具体的には、特徴ベクトルテーブル305の分析対象30502に利用者IDをセットし、ターゲットシーンベクトルテーブル205の利用者ID20502が利用者IDと同じであればパタンID20507に格納されている生活パタンIDを取得し、特徴ベクトルテーブル305の生活パタンID30503のうち取得したパタンIDに対応する値に1を加算する。
特徴ベクトル生成部302は、ステップS30205と同様に生活パタンの出現頻度をカウントする。ただし利用者IDごとではなく場所IDごとにカウントして特徴ベクトルテーブル305に格納する。具体的には特徴ベクトルテーブル305の分析対象305002に場所IDをセットし、ターゲットシーンベクトルテーブル205の場所ID20503が場所IDと同じであればパタンID20507に格納されている生活パタンIDを取得し、特徴ベクトルテーブル305の生活パタンID30503のうち取得したパタンIDに対応する値に1を加算する。
特徴ベクトル生成部302は、カウントされた生活パタンの出現頻度に対して重みづけする。生活パタンによっては多くの分析対象に出現しているものもあれば、特定の分析対象のみに出現しているものもある。前者のような生活パタンの出現頻度は高くても特徴づけには有用ではなく、後者のほうを重要視すべきである。そこで本実施形態1においては、前者のような出現頻度は小さく、後者のほうの出現頻度はより大きくなるよう重みづけをおこなう。具体的にはベクトル空間モデルにおけるtf−idf法を適用する。tf−idf法については多くの文献に記載されている公知技術であるため、説明は省略する。
特徴ベクトルクラスタリング部303は、ステップS303において、特徴ベクトルテーブル305に格納された特徴ベクトルにk−means法を適用してクラスタリングを実行し、クラスタリング結果テーブル30610に格納する。具体的にはクラスタリング結果テーブル30610のクラスタID30611の値にクラスタIDを格納し、当該クラスタに属する特徴ベクトルの平均ベクトルを平均ベクトル30613に格納する。代表生活パタン30614は、当該クラスタを特徴づける生活パタンのIDを格納する。具体的には当該クラスタに属する特徴ベクトルの平均ベクトルを参照し、ベクトル値が閾値以上の要素番号、すなわち生活パタンのIDを取得して格納する。さらに当該クラスタに属する特徴ベクトルの数をベクトル数30615に格納し、特徴ベクトルのIDを特徴ベクトルID30616に格納する。クラスタリングのクラスタ数は生活パタンクラスタ分析条件設定部301が設定したクラスタ数(または未設定の場合は20)とする。
クラスタ表示部304は、ステップS304において、生成したクラスタを表示する。以下、画面例を用いてクラスタ表示304の処理の手順について説明する。なお以下の説明では、クラスタリストテーブル30600の生活パタンリストID30604に格納されている生活パタンリストIDをキーにして生活パタンリストテーブル20600を検索して生活パタンリストIDに対応するクラスタリング結果テーブル20610が取得済みであり、クラスタ分析に用いた生活パタンが格納されたクラスタリング結果テーブル20610が参照できる状態になっているものとする。
以上のように、本実施形態1に係る行動属性分析装置1は、以下のような効果を発揮することができる。
本発明では、利用者の1日をシーン遷移ととらえ、さらにシーン遷移をシーンベクトルで表現する。これにより、利用者が1日に過ごしたシーンの数にかかわらずベクトルの次元数は一定であり、かつ利用者の1日をカバーすることができるので、利用者の数にかかわらず利用者の1日を網羅的にかつスケーラブルに対象とすることができる。利用者の1日の生活パタンはシーンベクトルをクラスタリングすることによって抽出する。そのため利用者の数が膨大になっても生活パタンの数を妥当な範囲内に収めることができる。また抽出した生活パタンを属性として分析対象を特徴づけるため、生成された特徴ベクトルはスパースではないことが期待でき、良好なクラスタリング結果を得ることができる。
1日のシーン遷移を表すベクトルは、分析者が着目した日や利用者への重み付け、あるいは1日の中の着目したシーンへの重み付け、あるいは属性付加が容易である。また1日の生活パタンを用いて、1週間のパタンや1カ月のパタンを抽出することができる。よって分析者は、分析の目的に応じた行動のパタンの抽出を柔軟に行うことができ、所望の分析を容易に実行することができる。
本発明の実施形態2では、一日を単位とする生活パタンを使って一定の期間(1週間あるいは10日間など)を単位とする期間の生活パタンを抽出し、期間の生活パタンの出現頻度を特徴量とするベクトルを生成して利用者や場所などをクラスタリングする多段階クラスタリングを実施する構成例について説明する。本実施形態2における行動属性分析装置1のハードウェアの構成は実施形態1と同じであるので説明を省略する。
図41は、本実施形態2に係る行動属性分析装置1の構成図である。本実施形態2における行動属性分析装置1は、大きく次の4つの機能から構成される。すなわちシーンベクトル生成部10、生活パタン抽出部20、期間生活パタン抽出部40、および生活パタンクラスタ分析部30である。これら機能のうち、シーンベクトル生成部10、生活パタン抽出部20、および生活パタンクラスタ分析部30は、実施形態1にかかる行動属性分析装置1と同様であるので詳細な説明は省略する。
期間生活パタン抽出部40は、生活パタン抽出部20が抽出した一日の生活パタンを用いて期間の生活パタンを抽出する。その入力は生活パタンテーブル206であり、パタンベクトルテーブル405および期間生活パタンテーブル406にデータを出力する。またテンポラリデータとして抽出条件407およびパラメタ408を生成する。入力データの詳細は本実施形態1と同じである。出力データの詳細およびテンポラリデータの一例については、図を用いて詳述する。
図42は、パタンベクトルテーブル405のデータ構成を示す図である。パタンベクトルテーブル405は、一日の生活パタンの並びを表すパタンベクトルを格納したデータである。パタンベクトルテーブル405は、パタンベクトルID40501、利用者ID40502、生活パタンID40503、および期間の生活パタンID40504を有する。パタンベクトルID40501はパタンベクトルを識別するIDを格納する。利用者ID40502は期間の生活パタンに対応する利用者のIDを格納する。生活パタンID40503は期間における一日の生活パタンのIDを格納する。期間の生活パタンID40504は、パタンベクトルをクラスタリングした結果抽出された期間の生活パタンのIDを格納する。
期間生活パタンテーブル406は、パタンベクトルをクラスタリングした結果を格納する。本実施形態2では、実施形態1同様、クラスタリングのアルゴリズムはk−means法を用いる。生成するクラスタの数は期間の生活パタン抽出のパラメタとして指定する。生成されるクラスタのIDは、アルゴリズムが自動的に付与する。
図44は、抽出条件407の一例を示す図である。抽出条件407は、分析者が設定したパタンベクトルの抽出条件を期間生活パタン抽出部40が格納したテンポラリデータである。
図45は、抽出パラメタ408の一例を示す図である。抽出パラメタ408は、分析者が設定したパタンベクトルのクラスタリング条件を期間生活パタン抽出部40が格納したテンポラリデータである。
次に図46〜図50を用いて本実施形態2における行動属性分析装置1の処理手順について説明する。
図46は、本実施形態2における行動属性分析装置1の処理手順を示すフローチャートである。ステップS10のシーンベクトル生成、ステップS20の生活パタン抽出は、実施形態1と同様であるので説明を省略する。ステップS20とS30の間に、新たにステップS40が追加されている。
図47は、期間生活パタン抽出部40の処理手順を示すフローチャートである。以下図47の各ステップについて説明する。
期間生活パタン抽出部40のパタン抽出条件設定部401は、分析者が指定したクラスタリングの対象となるパタンベクトルを抽出する条件およびクラスタリングのパラメタを設定し、抽出条件をパタンベクトル抽出部402に、パラメタをパタンベクトルクラスタリング部403に引き渡す。
パタンベクトル抽出部402は、引き渡された条件に含まれる一日の生活パタンリストIDをキーに、クラスタリング結果テーブル20610を参照し、抽出条件にマッチする対象者の対象期間における一日の生活パタンのIDを取得して、パタンベクトルを生成しパタンベクトルテーブル405に格納して、そのテーブルIDと、パタンベクトルの抽出条件をパタンベクトルクラスタリング部403に引き渡す。
パタンベクトルクラスタリング部403は、引き渡されたパラメタ、パタンベクトルテーブルのID、パタンベクトルの抽出条件、およびクラスタリングを実行した日付を期間の生活パタンリストテーブル40600に格納し、パタンベクトルテーブルのIDをキーにパタンベクトルテーブル405からクラスタリング対象のパタンベクトルを取得しパラメタにしたがってクラスタリングを実行し、結果をクラスタリング結果テーブル40610に格納して、期間の生活パタンリストテーブル40600のIDを期間生活パタン表示部404に引き渡す。
期間生活パタン表示部404は、引き渡された期間の生活パタンリストテーブル40600のIDをキーに期間の生活パタンリストテーブル40600およびクラスタリング結果テーブル40610から生成された期間の生活パタンを取得して分析者に表示する。
図48は、パタン抽出条件設定部401における期間生活パタン抽出条件設定画面の一例を示す図である。期間生活パタン抽出条件設定画面は、生活パタン選択エリア40110、対象者設定エリア40120、対象期間設定エリア40130、および指示ボタンエリア40140を有する。
パタンベクトル抽出部402の処理手順について説明する。なお以下の説明では、期間の生活パタン抽出条件における期間の条件が1週間の生活パタン(月〜日の生活パタン)であることを想定する。
パタンベクトルクラスタリング部403は、パタンベクトルテーブル405に格納されたパタンベクトルにk−means法を適用してクラスタリングを実行し、クラスタリング結果をクラスタリング結果テーブル40610に格納する。具体的にはクラスタリング結果テーブル40610のパタンID40611の値にクラスタIDを格納し、当該クラスタに属するパタンベクトルの平均ベクトルを平均ベクトル40613に格納する。代表ベクトル40614には、当該クラスタに属するパタンベクトルの代表ベクトルを格納する。なお代表ベクトルの生成手順は実施形態1におけるターゲットシーンベクトルクラスタリング20610の代表ベクトル生成手順と同様である。さらに当該クラスタに属するパタンベクトルの数をベクトル件数40615に格納し、パタンベクトルのIDをパタンベクトルID40616に格納する。また当該クラスタに属するパタンベクトルIDをキーにパタンベクトルテーブル405を参照し、パタンベクトルID40501の値がパタンベクトルIDと一致するレコードの生活パタンID40503に当該パタンIDをセットする。なおクラスタリングのクラスタ数はパタン抽出条件設定部401において設定されたクラスタ数(未設定の場合は10)とする。
図50は、生成されたクラスタを期間生活パタン表示部404が一日のパタンの遷移として表現し、分析者に表示する画面の一例を示す図である。期間の生活パタン表示画面は、期間のパタン表示エリア40400と指示ボタンエリア40410を有する。
以上のように、本実施形態2に係る行動属性分析装置1は、人集合内に含まれる1日の生活パタンからさらに、ある期間にわたる生活パタンを抽出し、これを用いて分析対象を分析することができる。
本発明の実施形態3では、分析者が利用者の行動属性を分析し、配信したいコンテンツに対してその効果が期待される利用者または場所を選択して、コンテンツを配信するコンテンツ配信機能を有する構成例を説明する。行動属性分析装置1のハードウェアの構成は実施形態1と同じであるので説明を省略する。
図51は、本実施形態3に係る行動属性分析装置1の全体構成を示す図である。本実施形態3における行動属性分析装置1は、大きく次の4つの機能を有する。すなわちシーンベクトル生成部10、生活パタン抽出部20、生活パタンクラスタ分析部30、およびコンテンツ配信部91である。シーンベクトル生成部10、生活パタン抽出部20、および生活パタンクラスタ分析部30は、実施形態1と同様であるので詳細な説明は省略する。
次に本実施形態3に係る行動属性分析装置1の処理手順について説明する。シーンベクトル生成部10は、まず利用者の行動の履歴が蓄積されたICカード利用履歴103およびクレジットカード利用履歴104を用いてあらかじめシーンベクトルを生成しておく。次に生活パタン抽出部20は、分析者の指定した条件にマッチするシーンベクトルを抽出してクラスタリングを実行して生活パタンを抽出する、生活パタンクラスタ分析部30は、抽出した生活パタンを用いて分析対象の特徴ベクトルを生成し、クラスタリングを実行して分析対象のクラスタを生成する。分析者が、生活パタン抽出部20または生活パタンクラスタ分析部30の処理結果に基づきコンテンツを配信すべき利用者または場所が発見したら、利用者または場所のIDを適当なファイル等にIDリストとして出力する。コンテンツ配信部91は、そのIDに対応する利用者の携帯電話94、またはそのIDに対応する場所のデジタルサイネージ95へ、コンテンツを送信する。
以上のように、本実施形態3に係る行動属性分析装置1は、生活パタンの分析結果に基づき、利用者または場所に適したコンテンツを配信することができる。
10 シーンベクトル生成部
20 生活パタン抽出部
30 生活パタンクラスタ分析部
40 期間生活パタン抽出部
91 コンテンツ配信部
92 コンテンツテーブル
101 シーン抽出部
102 イベント抽出部
103 ICカード利用履歴
104 クレジットカード利用履歴
105 シーンリスト
106 イベントリスト
107 シーンベクトルテーブル
201 パタン抽出条件設定部
202 シーンベクトル抽出部
203 シーンベクトルクラスタリング部
204 生活パタン表示部
205 ターゲットシーンベクトルテーブル
206 生活パタンテーブル
207 抽出条件
208 抽出パラメタ
209 ユーザ情報
210 場所情報
211 カレンダ情報
301 クラスタ分析条件設定部
302 特徴ベクトル生成部
303 特徴ベクトルクラスタリング部
304 クラスタ表示部
305 特徴ベクトルテーブル
306 クラスタテーブル
307 分析条件
308 分析パラメタ
309 分析レポート
401 パタン抽出条件設定部
402 パタンベクトル抽出部
403 パタンベクトルクラスタリング部
404 期間生活パタン表示部
Claims (14)
- 人集団の行動履歴を記録した履歴データから、前記人集団に属する人物が行動したシーンを抽出するシーン抽出部と、
前記シーン抽出部が抽出したシーンの個人毎の遷移を、1日の時間帯を要素番号とし、前記時間帯に対応するシーンを表す値を前記要素番号に対応する要素値として持つ、シーンベクトルとして表現し、前記シーンベクトルを記述したシーンベクトルデータを記憶装置に格納するシーンベクトル生成部と、
前記シーンベクトルをクラスタリングして前記シーンの遷移パタンを抽出することにより、前記遷移パタンを前記人集団内に含まれる生活パタンとして抽出する生活パタン抽出部と、
前記履歴データのなかで前記生活パタンが分析対象に関連して出現する頻度によって前記分析対象を特徴付けて前記分析対象をクラスタリングする生活パタン分析部と、
を備えることを特徴とする行動属性分析装置。 - 前記シーン抽出部は、
前記履歴データが記述している前記行動履歴の発生場所、発生時間帯、および継続時間に基づき前記行動履歴の目的を推定することにより、前記履歴データから前記目的に対応するシーンを抽出する
ことを特徴とする請求項1記載の行動属性分析装置。 - 前記シーン抽出部は、
前記履歴データが駅の改札に入場したことを示している場合、
その駅入場が1日のうち最初の駅入場であれば、当該駅入場の直前の前記行動履歴をその人物が自宅にいたことを示すシーンとして抽出し、その駅入場が1日のうち最初の駅入場でなければ、当該駅入場の直前の前記行動履歴を前記人物が外出していたことを示すシーンとして抽出し、
前記人物が外出していたことを示すシーンを抽出する場合においては、
当該駅入場の直前の前記行動履歴が平日に所定時間以上同じ場所に滞在していたことを示している場合は前記人物が仕事をしていたことを示すシーンとして抽出し、当該駅入場の直前の前記行動履歴が平日以外で所定時間以上同じ場所に滞在していたことを示している場合は前記人物が行楽外出していたことを示すシーンとして抽出する
ことを特徴とする請求項2記載の行動属性分析装置。 - 前記シーンベクトル生成部は、
前記シーンを表す値として用いることができる値を前記シーンベクトルの要素値として割り当てる際に、シーン間のベクトル空間上における距離がシーンの出現頻度または意味に応じた大きさとなるように、前記割り当てを実施する
ことを特徴とする請求項1記載の行動属性分析装置。 - 前記生活パタン抽出部は、
特定のシーンを含む生活パタンを抽出すべき旨の指定を受け取ると、前記シーンベクトルのうちそのシーンを含むもののみから前記生活パタンを抽出する
ことを特徴とする請求項1記載の行動属性分析装置。 - 前記生活パタン抽出部は、
特定の分析目的に適した前記生活パタンを抽出すべき旨の指定を受け取ると、前記シーンベクトルの要素のうちその分析目的に合致する部分の要素値を、同じ前記生活パタンに属する他の前記シーンベクトルの要素値とは異なる値に変換する
ことを特徴とする請求項1記載の行動属性分析装置。 - 前記生活パタン抽出部は、
前記変換後のシーンベクトルおよび前記変換前にこれと同じ前記生活パタンに属していたシーンベクトルを、互いに異なる前記生活パタンとして抽出する
ことを特徴とする請求項6記載の行動属性分析装置。 - 前記生活パタン抽出部は、
特定の分析目的に適した前記生活パタンを掘り下げて抽出したい旨の要求を受け取ると、
その分析目的に対応する付加属性を前記シーンベクトルに追加する
ことを特徴とする請求項1記載の行動属性分析装置。 - 前記生活パタン分析部は、
前記分析対象をクラスタリングした後、前記生活パタンに属する前記シーンベクトルのなかで特定の分析目的に適したものをさらに抽出すべき旨の指定を受け取ると、
その分析目的に対応する前記付加属性が追加されている前記シーンベクトルを、前記クラスタリング後の分析対象からさらに抽出する
ことを特徴とする請求項8記載の行動属性分析装置。 - 前記生活パタン抽出部は、
抽出した前記生活パタン内における最も典型的な前記シーンの遷移を特定し、前記生活パタン毎に可視化して出力する
ことを特徴とする請求項1記載の行動属性分析装置。 - 前記生活パタン抽出部は、
前記クラスタリングによって生成されたクラスタに属する前記シーンの遷移を表すベクトルを参照して、前記クラスタ内の各前記時間帯における前記シーンのうち最も頻度の高いものを、前記クラスタ内の当該時間帯における典型的なシーンとし、
前記典型的なシーンを表す値を当該時間帯に対応する要素値として有するシーンベクトルを生成してこれを前記クラスタの特徴とし、
前記生活パタン分析部は、
前記履歴データのなかで分析対象が前記クラスタの特徴に合致する頻度によって前記分析対象を特徴付けて前記分析対象をクラスタリングする
ことを特徴とする請求項10記載の行動属性分析装置。 - 前記生活パタン抽出部は、
抽出した前記生活パタンのなかからさらに、ある期間における前記人集合の1日の生活パタンの並びをクラスタリングすることにより、前記人集合の前記期間における典型的な生活パタンを期間生活パタンとして抽出し、
前記生活パタン分析部は、
前記履歴データのなかで前記期間生活パタンが分析対象に関連して出現する頻度によって前記分析対象を特徴付けて前記分析対象をクラスタリングする
ことを特徴とする請求項1記載の行動属性分析装置。 - 前記生活パタンに対応するコンテンツ情報をその生活パタンに対応する場所に配信するコンテンツ配信部を備えた
ことを特徴とする請求項1記載の行動属性分析装置。 - 人集団の行動履歴を記録した履歴データからシーンを抽出するシーン抽出ステップ、
前記シーン抽出ステップで抽出したシーンの個人毎の遷移を、1日の時間帯を要素番号とし、前記時間帯に対応するシーンを表す値を前記要素番号に対応する要素値として持つ、シーンベクトルとして表現し、前記シーンベクトルを記述したシーンベクトルデータを記憶装置に格納するステップ、
前記シーンベクトルをクラスタリングして前記シーンの遷移パタンを抽出することにより、前記遷移パタンを前記人集団の生活パタンとして抽出するステップ、
前記履歴データのなかで前記生活パタンが分析対象に関連して出現する頻度によって前記分析対象を特徴付けて前記分析対象をクラスタリングするステップ、
を有することを特徴とする行動属性分析方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011282015A JP5785869B2 (ja) | 2011-12-22 | 2011-12-22 | 行動属性分析プログラムおよび装置 |
PCT/JP2012/081662 WO2013094426A1 (ja) | 2011-12-22 | 2012-12-06 | 行動属性分析方法および装置 |
US14/367,422 US20150051948A1 (en) | 2011-12-22 | 2012-12-06 | Behavioral attribute analysis method and device |
CN201280063302.2A CN104011720B (zh) | 2011-12-22 | 2012-12-06 | 行动属性分析方法以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011282015A JP5785869B2 (ja) | 2011-12-22 | 2011-12-22 | 行動属性分析プログラムおよび装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013131170A true JP2013131170A (ja) | 2013-07-04 |
JP5785869B2 JP5785869B2 (ja) | 2015-09-30 |
Family
ID=48668322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011282015A Active JP5785869B2 (ja) | 2011-12-22 | 2011-12-22 | 行動属性分析プログラムおよび装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20150051948A1 (ja) |
JP (1) | JP5785869B2 (ja) |
CN (1) | CN104011720B (ja) |
WO (1) | WO2013094426A1 (ja) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015046152A (ja) * | 2013-07-31 | 2015-03-12 | 技研商事インターナショナル株式会社 | 行動ログ分析システム及びそのプログラム |
JP2015103018A (ja) * | 2013-11-25 | 2015-06-04 | ヤフー株式会社 | 行動パターン分析装置および行動パターン分析方法 |
JP2015135589A (ja) * | 2014-01-17 | 2015-07-27 | 株式会社日立製作所 | 情報分析システム、及び情報分析方法 |
JP2015187760A (ja) * | 2014-03-26 | 2015-10-29 | 株式会社豊田中央研究所 | 人物動態計算装置、人物動態計算システム、及びプログラム |
WO2016067460A1 (ja) * | 2014-10-31 | 2016-05-06 | 株式会社日立製作所 | 交通行動推定システム、交通シミュレーションシステム、交通行動推定方法 |
JPWO2015049802A1 (ja) * | 2013-10-04 | 2017-03-09 | 株式会社日立製作所 | データベース生成装置およびその生成方法 |
JP2018133028A (ja) * | 2017-02-17 | 2018-08-23 | 日本電信電話株式会社 | 行動パターン分類装置、行動パターン分類方法、及び行動パターン分類プログラム |
JP2019194884A (ja) * | 2016-11-23 | 2019-11-07 | アクセンチュア グローバル ソリューションズ リミテッド | 認知ロボット工学アナライザ |
JPWO2019102533A1 (ja) * | 2017-11-22 | 2020-02-27 | 花王株式会社 | 文献分類装置 |
JP2020107171A (ja) * | 2018-12-28 | 2020-07-09 | 株式会社日立製作所 | 行動パタン分析支援装置、行動パタン分析支援システム及び行動パタン分析支援方法 |
KR102197660B1 (ko) * | 2019-10-23 | 2021-01-04 | 숭실대학교산학협력단 | 고령자 생활 패턴 인지 시스템 및 방법 |
JP2021056591A (ja) * | 2019-09-27 | 2021-04-08 | 楽天株式会社 | 教師データ生成システム、教師データ生成方法、及びプログラム |
JP2021103585A (ja) * | 2020-06-30 | 2021-07-15 | 北京百度網訊科技有限公司 | ユーザグループ化方法、装置、コンピュータデバイス、媒体およびコンピュータプログラム |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8036979B1 (en) | 2006-10-05 | 2011-10-11 | Experian Information Solutions, Inc. | System and method for generating a finance attribute from tradeline data |
US8606626B1 (en) | 2007-01-31 | 2013-12-10 | Experian Information Solutions, Inc. | Systems and methods for providing a direct marketing campaign planning environment |
US8606666B1 (en) | 2007-01-31 | 2013-12-10 | Experian Information Solutions, Inc. | System and method for providing an aggregation tool |
US8543523B1 (en) * | 2012-06-01 | 2013-09-24 | Rentrak Corporation | Systems and methods for calibrating user and consumer data |
US9953304B2 (en) * | 2012-12-30 | 2018-04-24 | Buzd, Llc | Situational and global context aware calendar, communications, and relationship management |
CN103810241B (zh) * | 2013-11-22 | 2017-04-05 | 北京奇虎科技有限公司 | 一种低频点击的过滤方法和装置 |
US10262362B1 (en) | 2014-02-14 | 2019-04-16 | Experian Information Solutions, Inc. | Automatic generation of code for attributes |
US9576030B1 (en) | 2014-05-07 | 2017-02-21 | Consumerinfo.Com, Inc. | Keeping up with the joneses |
US9928233B2 (en) * | 2014-11-12 | 2018-03-27 | Applause App Quality, Inc. | Computer-implemented methods and systems for clustering user reviews and ranking clusters |
US10242019B1 (en) * | 2014-12-19 | 2019-03-26 | Experian Information Solutions, Inc. | User behavior segmentation using latent topic detection |
JP6575091B2 (ja) * | 2015-03-20 | 2019-09-18 | 富士ゼロックス株式会社 | 旅程推定装置及びプログラム |
EP3423962A4 (en) * | 2016-03-04 | 2019-10-02 | Axon Vibe AG | SYSTEMS AND METHOD FOR PREDICTING THE USER BEHAVIOR BASED ON LOCATION DATA |
US20190207946A1 (en) * | 2016-12-20 | 2019-07-04 | Google Inc. | Conditional provision of access by interactive assistant modules |
US10592995B1 (en) | 2017-01-27 | 2020-03-17 | Intuit Inc. | Methods, systems, and computer program product for providing expense information for an electronic tax return preparation and filing software delivery model |
US11270185B1 (en) | 2017-01-27 | 2022-03-08 | Intuit Inc. | Methods, systems, and computer program product for generating a personalized flow for a software delivery model |
US11436417B2 (en) | 2017-05-15 | 2022-09-06 | Google Llc | Providing access to user-controlled resources by automated assistants |
US10127227B1 (en) | 2017-05-15 | 2018-11-13 | Google Llc | Providing access to user-controlled resources by automated assistants |
US11328260B2 (en) * | 2017-07-19 | 2022-05-10 | Mitsubishi Electric Corporation | Behavior visualization device and behavior visualization method |
JP6904426B2 (ja) * | 2017-10-13 | 2021-07-14 | 日本電信電話株式会社 | 擬似データ生成装置、その方法、およびプログラム |
US20210225050A1 (en) * | 2018-03-17 | 2021-07-22 | Dataspark Pte Ltd. | Human Daily Activity Represented by and Processed as Images |
WO2019203724A1 (en) * | 2018-04-17 | 2019-10-24 | Dataspark Pte. Ltd. | Image analysis of human daily activity represented by layered images |
US11455418B2 (en) | 2018-08-07 | 2022-09-27 | Google Llc | Assembling and evaluating automated assistant responses for privacy concerns |
CN111461153B (zh) * | 2019-01-22 | 2023-08-04 | 刘宏军 | 人群特征深度学习方法 |
JP7173315B2 (ja) * | 2019-05-21 | 2022-11-16 | 日本電信電話株式会社 | 分析装置、分析システム、分析方法及びプログラム |
CN111080339B (zh) * | 2019-11-18 | 2024-01-30 | 口口相传(北京)网络技术有限公司 | 基于场景的类目偏好数据生成方法及装置 |
US20210312224A1 (en) * | 2020-04-02 | 2021-10-07 | Goldenspear Llc | System and method for creating per-customer machine vision personas based on mobile network metadata |
US11977523B1 (en) * | 2020-04-27 | 2024-05-07 | Splunk Inc. | Enhanced data extraction via efficient extraction rule matching |
CN111680248A (zh) * | 2020-04-28 | 2020-09-18 | 五八有限公司 | 一种生成消息的推送批次号的方法及装置 |
US20230134941A1 (en) * | 2021-11-02 | 2023-05-04 | At&T Intellectual Property I, L. P. | Automated security hangar for private cellular networks |
CN114936959B (zh) * | 2022-06-17 | 2023-05-23 | 上海市城乡建设和交通发展研究院 | 实现车辆匹配和乘客上车点的识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005531845A (ja) * | 2002-06-28 | 2005-10-20 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 確率分布関数を用いて行動をモデル化するための方法及び装置 |
JP2010072727A (ja) * | 2008-09-16 | 2010-04-02 | Nippon Telegr & Teleph Corp <Ntt> | 履歴処理装置、履歴処理方法および履歴処理プログラム |
WO2011070831A1 (ja) * | 2009-12-11 | 2011-06-16 | 株式会社日立製作所 | 生活パターン分類装置及び生活パターン分類システム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6327574B1 (en) * | 1998-07-07 | 2001-12-04 | Encirq Corporation | Hierarchical models of consumer attributes for targeting content in a privacy-preserving manner |
US6430539B1 (en) * | 1999-05-06 | 2002-08-06 | Hnc Software | Predictive modeling of consumer financial behavior |
WO2001065453A1 (en) * | 2000-02-29 | 2001-09-07 | Expanse Networks, Inc. | Privacy-protected targeting system |
JP2003256466A (ja) * | 2002-03-04 | 2003-09-12 | Denso Corp | 適応的情報検索システム |
EP1779269A1 (en) * | 2004-07-26 | 2007-05-02 | Panthaen Informatics, Inc. | Context-based search engine residing on a network |
US8019692B2 (en) * | 2004-10-19 | 2011-09-13 | Yahoo! Inc. | System and method for location based social networking |
US7835859B2 (en) * | 2004-10-29 | 2010-11-16 | Aol Inc. | Determining a route to a destination based on partially completed route |
US7672865B2 (en) * | 2005-10-21 | 2010-03-02 | Fair Isaac Corporation | Method and apparatus for retail data mining using pair-wise co-occurrence consistency |
US7974889B2 (en) * | 2007-10-19 | 2011-07-05 | Raimbeault Sean M | Social networking interactive shopping system |
CN102017550A (zh) * | 2007-11-14 | 2011-04-13 | 高通股份有限公司 | 用于确定地理用户简档以基于所述简档确定有目标的内容消息的适宜性的方法和系统 |
US8271413B2 (en) * | 2008-11-25 | 2012-09-18 | Google Inc. | Providing digital content based on expected user behavior |
AU2010271244B2 (en) * | 2009-07-09 | 2014-12-11 | Cubic Corporation | Predictive techniques in transit alerting |
US20110178845A1 (en) * | 2010-01-20 | 2011-07-21 | American Express Travel Related Services Company, Inc. | System and method for matching merchants to a population of consumers |
US20120042262A1 (en) * | 2010-08-11 | 2012-02-16 | Apple Inc. | Population segmentation based on behavioral patterns |
-
2011
- 2011-12-22 JP JP2011282015A patent/JP5785869B2/ja active Active
-
2012
- 2012-12-06 WO PCT/JP2012/081662 patent/WO2013094426A1/ja active Application Filing
- 2012-12-06 CN CN201280063302.2A patent/CN104011720B/zh not_active Expired - Fee Related
- 2012-12-06 US US14/367,422 patent/US20150051948A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005531845A (ja) * | 2002-06-28 | 2005-10-20 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 確率分布関数を用いて行動をモデル化するための方法及び装置 |
JP2010072727A (ja) * | 2008-09-16 | 2010-04-02 | Nippon Telegr & Teleph Corp <Ntt> | 履歴処理装置、履歴処理方法および履歴処理プログラム |
WO2011070831A1 (ja) * | 2009-12-11 | 2011-06-16 | 株式会社日立製作所 | 生活パターン分類装置及び生活パターン分類システム |
Non-Patent Citations (2)
Title |
---|
JPN6015022317; 河本 健、外4名: '典型日遷移列に基づく生活モデルの提案' 電子情報通信学会技術研究報告 第110巻,第207号, 20100914, p.19-24, 社団法人電子情報通信学会 * |
JPN6015022318; 森 武俊: '生活支援のためのセンサデータマイニング -「みまもり工学」への展開-' 電子情報通信学会誌 第94巻,第4号, 20110401, p.276-281, 社団法人電子情報通信学会 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015046152A (ja) * | 2013-07-31 | 2015-03-12 | 技研商事インターナショナル株式会社 | 行動ログ分析システム及びそのプログラム |
JPWO2015049802A1 (ja) * | 2013-10-04 | 2017-03-09 | 株式会社日立製作所 | データベース生成装置およびその生成方法 |
JP2015103018A (ja) * | 2013-11-25 | 2015-06-04 | ヤフー株式会社 | 行動パターン分析装置および行動パターン分析方法 |
JP2015135589A (ja) * | 2014-01-17 | 2015-07-27 | 株式会社日立製作所 | 情報分析システム、及び情報分析方法 |
JP2015187760A (ja) * | 2014-03-26 | 2015-10-29 | 株式会社豊田中央研究所 | 人物動態計算装置、人物動態計算システム、及びプログラム |
WO2016067460A1 (ja) * | 2014-10-31 | 2016-05-06 | 株式会社日立製作所 | 交通行動推定システム、交通シミュレーションシステム、交通行動推定方法 |
US10970639B2 (en) | 2016-11-23 | 2021-04-06 | Accenture Global Solutions Limited | Cognitive robotics analyzer |
JP2019194884A (ja) * | 2016-11-23 | 2019-11-07 | アクセンチュア グローバル ソリューションズ リミテッド | 認知ロボット工学アナライザ |
JP2018133028A (ja) * | 2017-02-17 | 2018-08-23 | 日本電信電話株式会社 | 行動パターン分類装置、行動パターン分類方法、及び行動パターン分類プログラム |
JPWO2019102533A1 (ja) * | 2017-11-22 | 2020-02-27 | 花王株式会社 | 文献分類装置 |
US10984344B2 (en) | 2017-11-22 | 2021-04-20 | Kao Corporation | Document classifying device |
JP2020107171A (ja) * | 2018-12-28 | 2020-07-09 | 株式会社日立製作所 | 行動パタン分析支援装置、行動パタン分析支援システム及び行動パタン分析支援方法 |
JP7343973B2 (ja) | 2018-12-28 | 2023-09-13 | 株式会社日立製作所 | 行動パタン分析支援装置、行動パタン分析支援システム及び行動パタン分析支援方法 |
JP2021056591A (ja) * | 2019-09-27 | 2021-04-08 | 楽天株式会社 | 教師データ生成システム、教師データ生成方法、及びプログラム |
KR102197660B1 (ko) * | 2019-10-23 | 2021-01-04 | 숭실대학교산학협력단 | 고령자 생활 패턴 인지 시스템 및 방법 |
WO2021080073A1 (ko) * | 2019-10-23 | 2021-04-29 | 숭실대학교산학협력단 | 고령자 생활 패턴 인지 시스템 및 방법 |
JP2021103585A (ja) * | 2020-06-30 | 2021-07-15 | 北京百度網訊科技有限公司 | ユーザグループ化方法、装置、コンピュータデバイス、媒体およびコンピュータプログラム |
US11580136B2 (en) | 2020-06-30 | 2023-02-14 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method and apparatus of user clustering, computer device and medium |
JP7269980B2 (ja) | 2020-06-30 | 2023-05-09 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | ユーザグループ化方法、装置、コンピュータデバイス、媒体およびコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2013094426A1 (ja) | 2013-06-27 |
CN104011720A (zh) | 2014-08-27 |
US20150051948A1 (en) | 2015-02-19 |
CN104011720B (zh) | 2017-05-24 |
JP5785869B2 (ja) | 2015-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5785869B2 (ja) | 行動属性分析プログラムおよび装置 | |
Celik Turkoglu et al. | A comparative survey of service facility location problems | |
Schenk et al. | Agent-based simulation of consumer behavior in grocery shopping on a regional level | |
JP5414562B2 (ja) | 情報処理装置及び情報処理システム | |
Deschaintres et al. | Analyzing transit user behavior with 51 weeks of smart card data | |
KR20220168961A (ko) | 인공지능 기반 프랜차이즈 컨설팅 시스템 및 이에 의해 수행되는 카드사 회원의 회원 분류 정보 생성 방법 | |
Millward et al. | Activity travel of population segments grouped by daily time-use: GPS tracking in Halifax, Canada | |
Yoshimura et al. | Urban association rules: uncovering linked trips for shopping behavior | |
JP2017228040A (ja) | 加盟店舗情報提供方法 | |
JPH11296539A (ja) | データ処理装置 | |
Rohani et al. | Location analytics for optimal business retail site selection | |
Wang et al. | A reliable location design of unmanned vending machines based on customer satisfaction | |
CN115315736A (zh) | 簇生成装置、簇生成方法以及簇生成程序 | |
Romero Palop et al. | Determining the usual environment of cardholders as a key factor to measure the evolution of domestic tourism | |
Cook | Heterogeneous Preferences for Neighborhood Amenities: Evidence from GPS data | |
JP2023133469A (ja) | 情報可視化処理装置、情報可視化処理システム、情報可視化処理方法、及び情報可視化処理コンピュータプログラム | |
JP2015135589A (ja) | 情報分析システム、及び情報分析方法 | |
WO2022201512A1 (ja) | 受注予測装置、受注予測方法、学習装置、学習方法、及び、記録媒体 | |
US20150161743A1 (en) | System and method for automatically classifying transaction information | |
JP2015146145A (ja) | 顧客分析プログラム、顧客分析方法、及び顧客分析装置 | |
JP7033325B2 (ja) | 情報可視化処理装置、情報可視化処理システム、情報可視化処理方法、及び情報可視化処理コンピュータプログラム | |
Lysenko et al. | Combination of individual and group patterns for time-sensitive purchase recommendation | |
WO2024038689A1 (ja) | プログラム、方法、情報処理装置、およびシステム | |
Gohil | CEvaluating Geospatial Methods for Marketing Concert Tickets in Rock Music | |
JP7228208B2 (ja) | 潜在顧客発掘支援システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140604 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150609 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150622 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150714 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150727 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5785869 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |