JP5123422B2 - 地域特性を利用したプロファイリングシステム - Google Patents

地域特性を利用したプロファイリングシステム Download PDF

Info

Publication number
JP5123422B2
JP5123422B2 JP2011242078A JP2011242078A JP5123422B2 JP 5123422 B2 JP5123422 B2 JP 5123422B2 JP 2011242078 A JP2011242078 A JP 2011242078A JP 2011242078 A JP2011242078 A JP 2011242078A JP 5123422 B2 JP5123422 B2 JP 5123422B2
Authority
JP
Japan
Prior art keywords
principal component
factor
processing means
variable
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011242078A
Other languages
English (en)
Other versions
JP2012150786A (ja
Inventor
芳典 松本
勝弘 小野
Original Assignee
技研商事インターナショナル株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 技研商事インターナショナル株式会社 filed Critical 技研商事インターナショナル株式会社
Priority to JP2011242078A priority Critical patent/JP5123422B2/ja
Publication of JP2012150786A publication Critical patent/JP2012150786A/ja
Application granted granted Critical
Publication of JP5123422B2 publication Critical patent/JP5123422B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、行政界等のエリアの地域特性を分析するシステムに係り、特に、エリアを地域特性によって得点化して更に拠点との関係で地域特性のレポートを作成するプロファイリングシステムに関する。
[従来の技術]
従来の商圏分析システム等において、店舗等の拠点における売上や利益を分析するものがあった。
尚、関連する先行技術文献として、特開2003−167880号公報「統計情報集計装置」(花王株式会社)[特許文献1]、特開2003−345962号公報「店舗情報の収集提供装置、店舗情報の収集提供方法とそれを記述したプログラム」(エヌイーシーシステムテクノロジー株式会社)[特許文献2]がある。
特許文献1には、地図上の店舗を指定して店舗の売上額等のデータを地図情報と共に表示する装置であり、POSシステムが持つデータを取得して表示用ファイルを作成し、当該表示用ファイルで表示したいデータを指定すると、地図上に表示して分析作業を支援することが記載されている。
また、特許文献2には、店舗について立地評価し、解析結果を提供する装置であり、店舗位置情報を情報提供者から受信し、ユーザに店舗情報を送信すると共にユーザから応答情報を受信し、情報入手希望者に店舗位置に対応するユーザの評価を送信し、ユーザからの応答情報に基づきユーザの反応行動を数値化して集計し、店舗位置に対するユーザの評価を算出することが記載されている。
特開2003−167880号公報 特開2003−345962号公報
しかしながら、上記従来の分析システムでは、個別の店舗等の分析を行うものではあるが、地域特性によって得点化して評価し、拠点が含まれる特定エリアの地域特性を把握可能とするレポートを生成する機能を備えていないという問題点があった。
本発明は上記実状に鑑みて為されたもので、地域特性のプロファイリングデータを利用して地域特性を分析し、拠点が含まれる特定エリアの地域特性のレポートを生成して当該エリアの地域特性を容易に把握できるプロファイリングシステムを提供することを目的とする。
上記従来例の問題点を解決するための本発明は、地域特性を分析するプロファイリングシステムであって、コンピュータの記憶部に行政界単位又は特定のメッシュ単位に統計データを記憶し、制御部がプログラムを動作させて実行する処理手段として、複数の行政界又は複数のメッシュから成り、統計データ、若しくは統計データを集計した集計データを変数候補として正規化処理し、正規化処理された変数間の相関を演算し、変数間相関表を生成して変数を確定する変数決定処理手段と、確定された変数について主成分分析処理を行い、主成分から因子を特定し、因子の主成分得点を算出し、変数と主成分得点との相関を演算し、相関係数を主成分負荷量とする主成分負荷量行列を生成する主成分分析処理手段と、因子でクラスター分析を行い、行政界単位又は特定のメッシュ単位の因子を用いて小分類のクラスター間の距離を計算して小分類のクラスター分析の表を生成し、小分類のクラスター別の因子毎に平均値を演算して、当該平均値を用いて中分類のクラスター間の距離を計算して、当該計算されたクラスター間の距離の値に応じてクラスターをグループ化して分類し、計算された距離に基づいてグループの結合を行ってクラスター組み替えの適正化を行って、中分類のクラスター別の平均表を生成するクラスター分析処理手段と、主成分負荷行列又は平均表を基に、拠点が含まれる特定エリアについて地域特性のレポートを生成するレポート生成処理手段とを有し、レポート生成処理手段が、拠点が含まれる特定エリアについて、表示された地図上に特定エリア内で行政界又はメッシュを適正化されたクラスター毎に色分け表示する地域特性のレポートを生成することを特徴とする。
本発明は、上記プロファイリングシステムにおいて、レポート生成処理手段が、拠点が含まれる特定エリアについて、1つ又は2つの変数に対する適正化されたクラスター毎の出現率を表示する地域特性のレポートを生成することを特徴とする
本発明は、上記プロファイリングシステムにおいて、クラスター分析処理手段が、因子に加えて変数でクラスター分析を行うことを特徴とする。
本発明は、地域特性を分析するプロファイリングシステムであって、コンピュータの記憶部に行政界単位又は特定のメッシュ単位に統計データを記憶し、制御部がプログラムを動作させて実行する処理手段として、複数の行政界又は複数のメッシュから成り、統計データ、若しくは統計データを集計した集計データを変数候補として正規化処理し、正規化処理された変数間の相関を演算し、変数間相関表を生成して変数を確定する変数決定処理手段と、確定された変数について主成分分析処理を行い、主成分から因子を特定し、因子の主成分得点を算出し、変数と主成分得点との相関を演算し、相関係数を主成分負荷量とする主成分負荷量行列を生成する主成分分析処理手段と、主成分負荷行列を基に、拠点が含まれる特定エリアについて地域特性のレポートを生成するレポート生成処理手段とを有し、レポート生成処理手段が、主成分分析処理手段で生成された主成分負荷行列を基に、行政界又はメッシュと因子得点との関係を表す関係表を作成し、拠点が含まれる特定エリア、特定エリアを含む広域エリア及び広域エリアを含む全国エリアについて、関係表に従って特定エリア、広域エリア及び全国エリアに含まれる行政界又はメッシュについて因子毎に平均得点を算出し、特定エリアの地域特性、広域エリアの地域特性及び全国エリアの地域特性を比較可能に因子名と平均得点で表示する地域特性のレポートを生成することを特徴とする。
本発明は、上記プロファイリングシステムにおいて、主成分分析処理手段が、主成分分析における固有値と累積寄与率によって主成分から因子を特定することを特徴とする。
本発明は、上記プロファイリングシステムにおいて、レポート生成処理手段が、拠点に関するレスポンスデータを重ね合わせて、拠点に対する地域特性の指標を表示することを特徴とする。
本発明によれば、コンピュータの記憶部に行政界単位又は特定のメッシュ単位に統計データを記憶し、制御部がプログラムを動作させて実行する処理手段として、変数決定処理手段が、複数の行政界又は複数のメッシュから成り、統計データ、若しくは統計データを集計した集計データを変数候補として正規化処理し、正規化処理された変数間の相関を演算し、変数間相関表を生成して変数を確定し、主成分分析処理手段が、確定された変数について主成分分析処理を行い、主成分から因子を特定し、因子の主成分得点を算出し、変数と主成分得点との相関を演算し、相関係数を主成分負荷量とする主成分負荷量行列を生成し、クラスター分析処理手段が、因子でクラスター分析を行い、行政界単位又は特定のメッシュ単位の因子を用いて小分類のクラスター間の距離を計算して小分類のクラスター分析の表を生成し、小分類のクラスター別の因子毎に平均値を演算して、当該平均値を用いて中分類のクラスター間の距離を計算して、当該計算されたクラスター間の距離の値に応じてクラスターをグループ化して分類し、計算された距離に基づいてグループの結合を行ってクラスター組み替えの適正化を行って、中分類のクラスター別の平均表を生成し、レポート生成処理手段が、主成分負荷行列又は平均表を基に、拠点が含まれる特定エリアについて地域特性のレポートを生成し、更に、レポート生成処理手段が、拠点が含まれる特定エリアについて、表示された地図上に特定エリア内で行政界又はメッシュを適正化されたクラスター毎に色分け表示する地域特性のレポートを生成するプロファイリングシステムとしているので、地域特性のプロファイリングデータを利用して拠点が含まれる特定エリアの地域特性を分析し、拠点が含まれる特定エリアの地域特性のレポートを生成でき、当該エリアの地域特性を地図上の色分け表示により容易に把握できる効果がある。
本発明によれば、レポート生成処理手段が、拠点が含まれる特定エリアについて、1つ又は2つの変数に対する適正化されたクラスター毎の出現率を表示する地域特性のレポートを生成する上記プロファイリングシステムとしているので、拠点が含まれる特定エリアの地域特性を変数に対するクラスター毎の出現率で表示することにより、地域特性を容易に把握できる効果がある。
本発明によれば、クラスター分析処理手段が、因子に加えて変数でクラスター分析を行う上記プロファイリングシステムとしているので、変数を使ったクラスター分析を行うことができる効果がある。
本発明によれば、コンピュータの記憶部に行政界単位又は特定のメッシュ単位に統計データを記憶し、制御部がプログラムを動作させて実行する処理手段として、変数決定処理手段が、複数の行政界又は複数のメッシュから成り、統計データ、若しくは統計データを集計した集計データを変数候補として正規化処理し、正規化処理された変数間の相関を演算し、変数間相関表を生成して変数を確定し、主成分分析処理手段が、確定された変数について主成分分析処理を行い、主成分から因子を特定し、因子の主成分得点を算出し、変数と主成分得点との相関を演算し、相関係数を主成分負荷量とする主成分負荷量行列を生成し、レポート生成処理手段が、主成分負荷行列を基に、拠点が含まれる特定エリアについて地域特性のレポートを生成し、レポート生成処理手段が、主成分分析処理手段で生成された主成分負荷行列を基に、行政界又はメッシュと因子得点との関係を表す関係表を作成し、拠点が含まれる特定エリア、特定エリアを含む広域エリア及び広域エリアを含む全国エリアについて、関係表に従って特定エリア、広域エリア及び全国エリアに含まれる行政界又はメッシュについて因子毎に平均得点を算出し、特定エリアの地域特性、広域エリアの地域特性及び全国エリアの地域特性を比較可能に因子名と平均得点で表示する地域特性のレポートを生成するプロファイリングシステムとしているので、拠点が含まれる特定エリアの地域特性を広域エリア、全国エリアの地域特性と比較して容易に把握できる効果がある。
本発明によれば、レポート生成処理手段が、拠点に関するレスポンスデータを重ね合わせて、拠点に対する地域特性の指標を表示する上記プロファイリングシステムとしているので、拠点が含まれる特定エリアの地域特性に対するレスポンスデータの関連性を容易に把握できる効果がある。
本発明の実施の形態に係るプロファイリングシステムの構成ブロック図である。 元データを示す図である。 変数間相関表を示す図である。 具体的な変数間相関表を示す図である。 因子数決定を示す図である。 主成分負荷量行列を示す図である。 主成分解釈表を示す図である。 行政界と因子の関係表を示す図である。 クラスター分析(小分類)の表を示す図でである。 クラスター分析(中分類)の表を示す図である。 階層クラスター分析における樹形図である。 エリア別にCLの度数を示す図である。 CL別の変数平均表を示す図である。 因子特性を示す分析グラフである。 レスポンスを用いたクラスター特性を示す図である。 クラスター特性のクロス分析グラフである。
本発明の実施の形態について図面を参照しながら説明する。
[実施の形態の概要]
本発明の実施の形態に係るプロファイリングシステムは、統計データ等を変数候補とし、正規化して変数間相関表を作成し、変数確定する変数決定処理を行い、主成分分析して主成分から因子を特定し、因子の主成分得点を算出し、変数と主成分得点との相関を演算し、相関係数を主成分負荷量とする主成分負荷量行列を生成する主成分分析処理を行い、階層/非階層クラスター分析して、クラスター別の因子毎に平均表を生成する階層/非階層クラスター分析処理を行い、更に拠点を含む特定エリアの地域特性のレポートを生成するものであり、特定エリアの地域特性を、プロファイリングデータを利用して得点化し、拠点との関連で地域特性をレポートできるものである。
[本システム:図1]
本発明の実施の形態に係るプロファイリングシステムについて図1を参照しながら説明する。図1は、本発明の実施の形態に係るプロファイリングシステムの構成ブロック図である。
本発明の実施の形態に係るプロファイリングシステム(本システム)は、図1に示すように、制御部11と、記憶部12と、インタフェース部13とを備えたコンピュータによって実現され、インタフェース部13を介して表示部14と、入力部15とが接続されている。
また、記憶部12には、処理プログラムが記憶されており、記憶部12から処理プログラムを読み込んで動作させることで、各処理を実現している。
また、ネットワークに接続するサーバで処理プログラムを動作させ、当該サーバにネットワークを介して接続するクライアントからの指示を入力し、処理結果をクライアントに表示出力するクライアント・サーバのネットワークシステムとしてもよい。このネットワークシステムにおけるサーバをWebサーバとし、クライアントをWebサーバにアクセスするコンピュータとしたWebシステムであってもよい。
[処理内容]
本システムの制御部11が処理プログラムによって実行する処理は、「変数決定処理」「主成分分析処理」「階層/非階層クラスター分析処理」「レポート生成処理」に分けることができる。
これら処理を処理プログラムによって実現する各処理手段が、「変数決定処理手段」「主成分分析処理手段」「クラスター分析処理手段」「レポート生成処理手段」である。
各処理を具体的に以下説明する。
[1.変数決定処理]
(変数候補決定:図2)
行政界が複数含まれるエリア(例えば、特定地域、首都圏、全国等)を特定して、変数候補を決定する。統計データをそのまま変数候補に決定してもよいし、統計データを集計して変数候補に決定してもよい。
変数の候補としては、例えば、核家族世帯率(計算式:核家族世帯数/世帯数)、若者人口率(計算式:(15〜19歳人口+20〜24歳人口)/人口総数)、一戸建て世帯率(計算式:一戸建世帯数/世帯数)等がある。
変数の候補は、エリアについてプロファイリングを行う操作者によって利用したい統計データ又はその集計データが決定される。
尚、元データの例を図2に示す。図2は、元データを示す図である。
図2に示すように、行政界(例えば、町丁目)毎に、例えば変数1〜4についての数値が演算された状態を示している。
尚、上記エリアを行政界としたが、国勢調査等から提供される1km×1km、500m×500m、250m×250mのメッシュのエリアであってもよい。尚、国勢調査等からは、これらメッシュのエリア単位で統計データが提供される。
また、上記以外の任意のメッシュ、例えば、300m×300m等のエリアを想定する場合には、上記メッシュの面積按分を用いて統計データを按分し、任意のメッシュのエリアに適用することが可能である。
以下において、「行政界」と記載した部分は、上記の「メッシュ」と読み替えることができる。
更に、変数の候補は、静的なデータに限らず、時間、日、月、季節、年によって変動するデータを用いてもよい。変動するデータとしては、携帯電話機、スマートフォン等の位置データ、交通機関の非接触型ICカード等のデータを上記期間で集計したものがある。
また、抽象的なデータであっても、評価して数値に落とし込むことができれば、変数の候補としてもよい。
(正規化処理)
変数となる元データは、正規分布化できるものを用いるのが望ましい。
そのため、元データについて、指数化、比率化、逆数化、対数化して正規分布にする。
また、元データの歪度、尖度を算出し、予め設定した基準値(例えば、±1.5以内)と比較し、正規分布化の適否を判定する。正規分布化が不適であれば、その変数は原則として用いないようにする。但し、正規化できない元データであっても、必要と判断した場合には、あえて用いるようにする。
更に、元データの分位点を抽出し、突出した部分があるか否か判定し、突出したデータ部分があれば、当該テータ部分を取り除く処理を行う。
(変数間相関表作成処理:図3、図4)
正規化処理された変数について全ての変数との相関を演算し、変数間相関表を作成する。
変数間相関表について図3を参照しながら説明する。図3は、変数間相関表を示す図である。
図3に示すように、決定して正規化等された変数の候補は、総当たりで相関演算を行い、算出された相関値を変数間相関表に設定する。
図3では、縦横に同じ変数の候補が配列され、相関値が設定されている。同じ変数同士は相関が「1.00」となり、「0.50」以上であれば、相関が高いことになる。
具体的な変数間相関表を図4に示す。図4は、具体的な変数間相関表を示す図である。
図4に示すように、変数として「若者人口率」「常雇用者率」「完全就業人口率」「65歳以上親族のいる世帯率」「年収1500万円以上世帯率」「一般世帯数」...等を用い、全ての変数同士で相関を演算している。
ここで、上記変数は以下のように定義される。
「若者人口率」(図4では「若者率」)=14〜24歳人口/総人口
「常雇用者率」=常雇用者数/労働力人口(就業者人口+完全失業者人口)
「完全就業人口率」(図4では「完全就業人口2」=完全就業人口/労働力人口
「65歳以上親族のいる世帯率」=65歳以上親族のいる世帯数/世帯総数
「年収1500万円以上世帯率」(図4では「1500万」)=年収1500万円以上世帯数/世帯総数
「一般世帯数」(図4では「一般世帯数05」)=世帯総数
(変数確定処理)
当該変数間相関表において、目安として許容範囲±R(相関値)=0.5などを基準として、0.5以上を有する変数がある場合には、相関係数が低くなる変数の組み合わせを選択することが望ましい。
[2.主成分分析処理]
(主成分分析処理)
主成分分析とは、多くの量的変数が存在する場合に、それらの間の相関構造を考慮して、低い次元の合成変数(主成分)に変換し、データが有している構造より解釈しやすくするための分析である。
主成分分析には、「相関係数行列」を用いる場合と、「分散共分散行列」を用いる2種類があるが、ここでは「相関係数行列」を用いることとする。
相関係数行列Rとして、相関係数行列Rの第1固有値(最大固有値)λ1に対応する固有ベクトルから第1主成分z1を求め、次に、相関係数行列Rの第2固有値λ2に対応する固有ベクトルから第2主成分z2を求める。同様にして、第k主成分を求める。
固有値は、その成分が元の変数何個分の情報を持っているかを表すもので、固有値の合計は、変数の個数に等しい。
そして、それぞれの主成分の寄与率、累積寄与率を算出する。主成分の寄与率とは、主成分が全体の情報(変数の個数)のどのくらいの割合であるかを示すものである。
具体的には、変数x1 ,x2 ,...,xp がある場合、変数の標準化し、以下の式(1)の標準化値u1 ,u2 ,...,up を算出する。
Figure 0005123422
ここで、xバーは平均を、sは標準偏差を示している。
そして、以下の式(2)に示すように、第1主成分z1 を算出する。第2主成分z2以降も同様に算出する。
Figure 0005123422
ここで、aは、固有ベクトルである。
更に、相関係数行列Rを以下の式(3)に示すように、生成する。
Figure 0005123422
次に、第k主成分の寄与率を以下の式(4)で算出する。ここで、λ1 は第1主成分の固有値で、λ2 は第2主成分の固有値、λk は第k主成分の固有値、λp は第p主成分の固有値である。
Figure 0005123422
そして、第k主成分までの累積寄与率を以下の式(5)に示す。
Figure 0005123422
(主成分数決定処理:図5)
主成分分析処理で算出した固有値と累積寄与率について、固有値が「1以上」若しくは累積寄与率が「80%を超える」を目安として主成分を選択する。ここで、選択された主成分の数が決定される。
図5に、主成分を選択する場合を示す。図5は、因子数決定を示す図である。図5に示すように、主成分の固有値を算出して大きい順に並び替え、固有値が「1.0」以上の主成分を「因子」として選択して、因子数が決定される。
(主成分得点算出処理)
因子の数が決定すると、決定した因子(例えば、因子1〜因子9)について、主成分得点(因子得点)を算出する。
(主成分負荷量行列作成処理:図6)
主成分得点算出処理において算出した因子の主成分得点と元の変数との相関を演算し、相関係数を主成分負荷量とし、その行列を主成分負荷量行列として生成する。
第1主成分の主成分負荷量は、以下の式(6)で算出される。第2主成分以降も同様に主成分負荷量が算出される。
Figure 0005123422
ここで、主成分負荷量行列について図6を参照しながら説明する。図6は、主成分負荷量行列を示す図である。
図6に示すように、決定した主成分を因子(因子1〜因子9)として、因子の主成分得点と元の変数との相関を演算して相関係数を求め、行列として作成したものである。
(因子解釈表作成:図7)
因子1〜9について、主成分負荷量行列を参考にして、主成分の特性から因子解釈表が作成される。つまり、因子番号に対する定義付けである。
因子解釈表について図7を参照しながら説明する。図7は、主成分解釈表を示す図である。
図7では、因子番号「1」は、「都心の富裕層、若者単身層混在エリア」の名称とし、「20歳代〜30歳代の人口構成比が高く、単身層が多い。地価が高いエリア。共同住宅が多く、就業人口が多い。年収、貯蓄高の構成比に大きな特徴が見られないが、1平米あたりの貯蓄高が高い人口密集エリア。」という解釈を付与する。...、因子番号「9」は、「社宅住まいが多い高資産層」の名称とし、「社宅住まいが多く、貯蓄レベルが高い層」という解釈を付与する。
また、図示していないが、別の因子解釈表において、例えば、因子番号「1」は、「ニューファミリー性因子(都心・近郊)」の名称とし、「25〜35歳人口、0〜9歳人口が多く、高齢人口は少ない。」という解釈を付与する。...、因子番号「9」は、「公団居住性因子」の名称とし、「公団、公社住居に住む割合が高いエリアで、失業率が高い。」という解釈を付与することもある。
[3.階層/非階層クラスター分析処理]
階層又は非階層のクラスター分析処理を行う。
具体的には、最初に階層クラスター分析処理を行い、収束しない場合又は時間が掛かりすぎる場合に、非階層クラスター分析処理を行うことになる。
クラスター分析では、指定したクラスターに分類するために、2つのステップが反復して計算される。まず、クラスターのシードと呼ばれるn個の点が選択される。シードは、クラスター平均の最初の推定値である。
そして、各測定値が最も近くにあるシードに割り当てられて一時的なクラスターを形成する。次に、シードが新しいクラスター平均に代えられ、その平均に点が再び割り当てられる。この過程が繰り返され、最後にクラスター内に変化が生じない状態になり、クラスター分析が完了する。
そして、階層クラスター分析において階層構造を決めるためのクラスター間の距離を計算する方法には、群平均法、重心法、Ward法、最短距離法、最長距離法等がある。
本システムでは、いずれの方法を用いても構わないが、Ward法を用いている。
Ward法は、2つのクラスター間の距離は、そのクラスター間のANOVA平方和をすべての変数について合計したものとして計算される。クラスター内の平方和が最小化されるように、クラスターを併合していく。
Ward法では、各階層の結合において、多変量の正規混合分布の、球面性の共分散行列、等しい抽出確率の仮定のもとで尤度が最大になるようにクラスターを結合する。
(階層クラスター分析処理:図8〜10)
次に、階層クラスター分析処理について図8〜10を参照しながら説明する。図8は、行政界と因子の関係表を示す図であり、図9は、クラスター分析(小分類)の表を示す図であり、図10は、クラスター分析(中分類)の表を示す図である。
まず、図8に示すように、行政界毎に、例えば、因子1〜3の因子得点を算出して関係表を生成する。図8では、「行政界毎」としたが、「メッシュ毎」でもよい。
尚、行政界毎の因子得点の算出は、図6の主成分負荷量行列を作成した時点で得られる。
次に、行政界毎の因子1〜3の因子得点の状況からクラスター分析処理を行い、行政界毎に因子1〜3を用いて距離を計算し、算出した距離に基づいて、図9に示すように、行政界毎にクラスターを特定し、クラスター番号(小分類のクラスター番号)を付与して、クラスター分析(小分類)の表を生成する。
そして、クラスター番号毎に因子毎に因子得点の平均を算出し、図10に示すように、クラスター番号毎に因子1〜3の因子得点の平均値を設定し、更にクラスター分析処理を行い、小分類のクラスター番号毎に因子1〜3の因子得点の平均値を用いて距離を計算し、算出した距離に基づいて小分類のクラスター毎に中分類のクラスターを特定し、クラスター番号(中分類のクラスター番号)を付与して、クラスター分析(中分類)の表(平均表)を生成する。
クラスター分析で中分類を作成する方法は、上記クラスター番号毎に因子得点の平均値を求めて更にクラスター分析を行う方法と、後述する樹形図から判断して中分類数を決める方法がある。
尚、図10には平均値を設定すると記載したが、実際は、因子毎に集計された平均値に対してプラスマイナスの値(平均値に対する±を数値化したもの)を設定する。
尚、小分類及び中分類とした場合、それぞれの段階で必ずクラスターの解釈を行い、分類数の適正を判定している。
また、上述のクラスター分析処理は、因子だけを使ってクラスター分析を行ったが、ここで変数を使ってクラスター分析を行うようにしてもよい。
このようにして、階層クラスター分析では、クラスター数を収束する。
(階層クラスター分析の樹形図:図11)
次に、階層クラスター分析の樹形図について図11を参照しながら説明する。図11は、階層クラスター分析における樹形図である。
図11において、分析手法は、主因子法を採用し、回転は、直交回転を用い、因子数9に対して、クラスター(CL)数を「50CL」としたものである。
樹形図は、上述したクラスター間の距離を求める計算方法によって算出された距離の値に基づいて生成される。
(クラスター数決定処理)
そして、クラスターの結合化により、クラスター組み替えの適正化を行い、クラスター数を決定する。
例えば、クラスター数は「50CL」あるが、結合化により「20CL」に組み替え可能である。
(エリア別CLの度数作成処理:図12)
エリア別のCLの度数作成処理を行う。
具体的には、図12に示すように、エリア別(都道府県別)にクラスターに因子1〜9に該当する町丁目件数を算出して一覧表を生成する。図12は、エリア別にCLの度数を示す図である。
図12を参照すると、因子に対するエリア別の傾向でクラスターを解釈できる。
(CL別の変数平均表作成処理:図13)
CL別の変数平均表の作成処理について図13を参照しながら説明する。図13は、CL別の変数平均表を示す図である。
図13では、クラスター毎に因子1〜9に対する「町丁字件数」年代別の人口比率、世帯数の比率等について、例えば、Zスコアで得点を算出し、平均表を生成する。
図13を参照すれば、因子に対する変数の傾向でクラスターを解釈できる。
また、変数として業種の就業者比率、年収等によって、Zスコアの得点による変数平均表を生成するようにしてもよい。
[4.レポート生成処理]
上記クラスター分析処理に基づいて、地図を表示し、地図上の行政界をクラスター毎に色分け表示してレポートを生成する。これにより、地図上でのクラスターの分布が容易に認識できる効果がある。
また、上記クラスター分析処理に基づいて、CL毎の人口と構成比、世帯数と構成比、エリア数と構成比を一覧で表示するようにし、特定地域、例えば、首都圏等におけるクラスター特性をレポートとして表示できる。
また、特定地域、例えば、首都圏について、横軸に平均年齢、縦軸に平均世帯年収をとり、CL別に世帯数の大小を円の直径に反映させて分布を表示するようにしてもよい。この場合、CL毎に円の色を変化させるか、主成分得点が近似するCL(距離の近いCL)をグループとして同じ色で表示するようにする。
これにより、特定地域の平均年齢と平均世帯年収の関係がCL毎に認識可能となる。
また、店舗を拠点にする場合に、半径(1km、2km、3km等の距離)又はトラベルタイム(5分、10分、30分等のアクセス時間)で商圏を一つ又は複数設定してエリアを特定してもよい。
(因子特性:図14)
主成分分析によって得られた図8の行政界と因子の関係表から図14に示す因子特性を表示することができる。図14は、因子特性を示す分析グラフである。
図14に示すように、行政界と因子の関係表から、因子に対応する項目(因子名)について、分析地の商圏、全国平均因子、首都圏平均因子、都市圏平均因子、地方圏平均因子を用いた分析グラフを生成し、レポートを生成する。
具体的には、行政界と因子の関係表から、分析対象のエリア(例えば、商圏、都市圏、地方圏等)に含まれる行政界を抽出し、因子毎の平均得点(平均因子)を算出するものである。
ここで、分析地の商圏とは、分析対象の特定エリアにおける因子得点の平均得点(平均因子)であり、全国平均因子とは全国の都道府県の平均因子であり、首都圏平均因子とは、関東(1都3県:東京都、埼玉県、千葉県、神奈川県)の平均因子であり、都市圏平均因子とは、関東、東海(3県:愛知県、岐阜県、三重県)、近畿(2府4県:大阪府、京都府、滋賀県、奈良県、和歌山県、兵庫県)の平均因子であり、地方圏平均因子とは、関東、東海、近畿以外の都道府県の平均因子である。
図14では、特定のエリア(分析地A)の商圏の因子特性と東京都、全国、首都圏、都市圏、地方圏等の平均因子(平均得点)とを比較できる。
図14では、拠点Aの商圏と東京都等のエリアについて地域特性を比較するようになっているが、例えば、拠点B、拠点Cの商圏における地域特性も一つの図でプロットしてもよい。これにより、複数の拠点の商圏について地域特性を比較できる効果がある。
図14では、因子としては、No.1が「ニューファミリー性(都心・近郊)」、No.2が「マイホーム核家族性」、No.3が「三世代大家族性」、No.4が「高齢者農村性」、No.5が「ニューファミリー性(都心・郊外)」、No.6が「製造業性」、No.7が「郊外ファミリー性」、No.8が「社宅住居性」、No.9が「公団住居性」の因子名を採用している。
例えば、No.1の「ニューファミリー性(都心・近郊)」は「25〜39歳人口、0〜9歳人口が多い。逆に高齢人口は極端に低い。マンション住まいが多く、労働力人口はきわめて高い。都心や政令指定都市、県庁所在地など人口密集地で得点が高い。」という特徴がある。
また、No.5の「ニューファミリー性(都心・郊外)」は、「30〜44歳人口、0〜14歳人口が多く、団塊世代の構成比が低い。マンション居住者が多く、因子1と分布エリアが重複するが、こちらの因子の方が郊外にも点在している。」という特徴がある。
(レスポンスを用いたクラスター特性:図15)
店舗を拠点としてとらえてエリア(半径又はドライブタイムで定まるエリア)を特定して商圏を決定する。
そして、クラスター特性に店舗等のレスポンスを重ね合わせて、店舗等の拠点に対する地域特性の指標を表示することも可能である。
レスポンスとは、店舗からのダイレクトに対する来訪者数、または店舗等からのアンケートに対する回答等である。
地域特性の指標とは、当該店舗がどのクラスター番号に属しているのかを示すものである。
また、商圏内の行政界を地図に表示し、行政界又はメッシュをクラスター毎に色分け表示し、更にレスポンスデータとして顧客の住所等の位置情報を用いて、地図上に顧客の位置データを点で表示することができる。これにより、地図上の地域特性に対してレスポンスデータ(顧客の位置データ)の分布状況が容易に把握でき、地域特性に対するレスポンスデータの関連性を容易に把握できる効果がある。
レスポンスを用いたクラスター特性について図15を参照にしながら説明する。図15は、レスポンスを用いたクラスター特性を示す図である。
図15に示すように、各CLに小分類と名称を付与し、CL毎に、レスポンス件数と構成比、中和レスポンス件数と構成比、世帯数と構成比、有効世帯数と構成比、浸透率、インデックス(中和なし)、インデックス(中和あり)を示している。
ここで、レスポンス件数は、世帯数が0の場合、またはレスポンス率が100%を超えた町丁目を除外した各クラスターレスポンス数の和である。構成比は、商圏内における各クラスター別の構成比である。
中和レスポンス件数とは、レスポンス件数に分析地からのトラベルタイムの2乗を乗じたもので、「顧客は距離の2乗に反比例して減衰していく」という考えに基づき、これを打ち消したものである。
有効世帯数は、レスポンス件数、世帯数が0の場合、または、レスポンス率が100%を超えた町丁目を除外した各クラスター世帯数の和である。
浸透率は、レスポンス件数/有効世帯数で算出される。
インデックス(中和なし)は、(各クラスターレスポンス件数/各クラスター有効世帯数)/(全クラスターレスポンス件数/全クラスター有効世帯数)で算出される。
インデックス(中和あり)は、(各クラスター中和レスポンス件数/各クラスター有効世帯数)/(全クラスター中和レスポンス件数/全クラスター有効世帯数)で算出される
[クラスター特性のクロス分析:図16]
図15では、小分類が「首都圏01〜30」分類のものを示したが、それ以外の小分類として「全国01〜30」分類版、「都市圏01〜30」分類版、「地方圏01〜30」分類版等がある。
小分類「全国01〜30」版において、人口密度と世帯年収の変数に対するクラスターの出現率について図16に示す。図16は、クラスターの出現率と人口密度・世帯年収のクロス分析グラフである。
図16における円の大きさが出現率の大きさを表している。
ここで、図16の右側に示したクラスターは中分類であり、「年居住者」「都市近郊居住者」「高齢田園」等になる。その中分類のクラスター内に小分類のクラスターが含まれている。
図16で、同じクラスターの円が複数存在するのは、小分類のクラスターを表示しているためである。従って、図16において、小分類のクラスターとの関係が明確になるように、各円内に小分類のクラスター番号を表示させるとよい。
[実施の形態の効果]
本システムによれば、地域特性のプロファイリングデータを利用して地域特性を分析し、拠点が含まれる特定エリアがどのような地域特性を備えているのかのレポートを生成することができ、拠点が含まれる特定エリアの地域特性を容易に把握できる効果がある。
また、上記レポートに拠点のレスポンスデータを重ね合わせて当該拠点の地域特性の指標を表示でき、拠点が含まれる特定エリアの地域特性に対してレスポンスデータの関連性を容易に把握できる効果がある。
また、地域特性を利用したレポートは、店舗の場合、商品の品揃え、棚割等の参考とすることができ、更に、店舗評価、店舗のスクラップアンドビルド、投資判断にも利用できる効果がある。
本発明は、地域特性のプロファイリングデータを利用して地域特性を分析し、拠点が含まれる特定エリアの地域特性のレポートを生成して当該エリアの地域特性を容易に把握できるプロファイリングシステムに好適である。
11...制御部、 12...記憶部、 13...インタフェース部、 14...表示部、 15...入力部

Claims (6)

  1. 地域特性を分析するプロファイリングシステムであって、
    コンピュータの記憶部に行政界単位又は特定のメッシュ単位に統計データを記憶し、制御部がプログラムを動作させて実行する処理手段として、
    複数の行政界又は複数のメッシュから成り、統計データ、若しくは統計データを集計した集計データを変数候補として正規化処理し、正規化処理された変数間の相関を演算し、変数間相関表を生成して変数を確定する変数決定処理手段と、
    確定された変数について主成分分析処理を行い、主成分から因子を特定し、前記因子の主成分得点を算出し、前記変数と前記主成分得点との相関を演算し、相関係数を主成分負荷量とする主成分負荷量行列を生成する主成分分析処理手段と、
    前記因子でクラスター分析を行い、前記行政界単位又は前記特定のメッシュ単位の因子を用いて小分類のクラスター間の距離を計算して小分類のクラスター分析の表を生成し、前記小分類のクラスター別の因子毎に平均値を演算して、当該平均値を用いて中分類のクラスター間の距離を計算して、当該計算されたクラスター間の距離の値に応じてクラスターをグループ化して分類し、前記計算された距離に基づいてグループの結合を行ってクラスター組み替えの適正化を行って、中分類のクラスター別の平均表を生成するクラスター分析処理手段と、
    前記主成分負荷行列又は前記平均表を基に、拠点が含まれる特定エリアについて地域特性のレポートを生成するレポート生成処理手段とを有し、
    前記レポート生成処理手段が、拠点が含まれる特定エリアについて、表示された地図上に前記特定エリア内で行政界又はメッシュを前記適正化されたクラスター毎に色分け表示する地域特性のレポートを生成することを特徴とするプロファイリングシステム。
  2. レポート生成処理手段が、拠点が含まれる特定エリアについて、1つ又は2つの変数に対する適正化されたクラスター毎の出現率を表示する地域特性のレポートを生成することを特徴とする請求項記載のプロファイリングシステム。
  3. クラスター分析処理手段が、因子に加えて変数でクラスター分析を行うことを特徴とする請求項1又は2記載のプロファイリングシステム。
  4. 地域特性を分析するプロファイリングシステムであって、
    コンピュータの記憶部に行政界単位又は特定のメッシュ単位に統計データを記憶し、制御部がプログラムを動作させて実行する処理手段として、
    複数の行政界又は複数のメッシュから成り、統計データ、若しくは統計データを集計した集計データを変数候補として正規化処理し、正規化処理された変数間の相関を演算し、変数間相関表を生成して変数を確定する変数決定処理手段と、
    確定された変数について主成分分析処理を行い、主成分から因子を特定し、前記因子の主成分得点を算出し、前記変数と前記主成分得点との相関を演算し、相関係数を主成分負荷量とする主成分負荷量行列を生成する主成分分析処理手段と、
    前記主成分負荷行列を基に、拠点が含まれる特定エリアについて地域特性のレポートを生成するレポート生成処理手段とを有し、
    前記レポート生成処理手段が、前記主成分分析処理手段で生成された主成分負荷行列を基に、行政界又はメッシュと因子得点との関係を表す関係表を作成し、拠点が含まれる特定エリア、前記特定エリアを含む広域エリア及び前記広域エリアを含む全国エリアについて、前記関係表に従って前記特定エリア、前記広域エリア及び前記全国エリアに含まれる行政界又はメッシュについて因子毎に平均得点を算出し、前記特定エリアの地域特性、前記広域エリアの地域特性及び前記全国エリアの地域特性比較可能に因子名と前記平均得点で表示する地域特性のレポートを生成することを特徴とするプロファイリングシステム。
  5. 主成分分析処理手段が、主成分分析における固有値と累積寄与率によって主成分から因子を特定することを特徴とする請求項1乃至のいずれか記載のプロファイリングシステム。
  6. レポート生成処理手段が、拠点に関するレスポンスデータを重ね合わせて、前記拠点に対する地域特性の指標を表示することを特徴とする請求項1乃至のいずれか記載のプロファイリングシステム。
JP2011242078A 2010-12-28 2011-11-04 地域特性を利用したプロファイリングシステム Active JP5123422B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011242078A JP5123422B2 (ja) 2010-12-28 2011-11-04 地域特性を利用したプロファイリングシステム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010293784 2010-12-28
JP2010293784 2010-12-28
JP2011242078A JP5123422B2 (ja) 2010-12-28 2011-11-04 地域特性を利用したプロファイリングシステム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012235866A Division JP5214054B2 (ja) 2010-12-28 2012-10-25 地域特性を利用したプロファイリングシステム

Publications (2)

Publication Number Publication Date
JP2012150786A JP2012150786A (ja) 2012-08-09
JP5123422B2 true JP5123422B2 (ja) 2013-01-23

Family

ID=46792948

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2011242078A Active JP5123422B2 (ja) 2010-12-28 2011-11-04 地域特性を利用したプロファイリングシステム
JP2012235866A Active JP5214054B2 (ja) 2010-12-28 2012-10-25 地域特性を利用したプロファイリングシステム
JP2013035351A Active JP5284548B2 (ja) 2010-12-28 2013-02-26 地域特性を利用したプロファイリングシステム

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2012235866A Active JP5214054B2 (ja) 2010-12-28 2012-10-25 地域特性を利用したプロファイリングシステム
JP2013035351A Active JP5284548B2 (ja) 2010-12-28 2013-02-26 地域特性を利用したプロファイリングシステム

Country Status (1)

Country Link
JP (3) JP5123422B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5220894B2 (ja) * 2011-06-28 2013-06-26 ヤフー株式会社 投稿情報による地域プロファイル管理装置
JP2014134940A (ja) * 2013-01-10 2014-07-24 Fujitsu Ltd 情報処理装置、レコメンド情報生成方法、プログラム
JP2015146145A (ja) * 2014-02-04 2015-08-13 富士通株式会社 顧客分析プログラム、顧客分析方法、及び顧客分析装置
JP6317940B2 (ja) * 2014-02-07 2018-04-25 技研商事インターナショナル株式会社 高精度小地域シミュレーションシステム及びそのプログラム
JP6449578B2 (ja) * 2014-05-28 2019-01-09 技研商事インターナショナル株式会社 購買予測分析システム及びそのプログラム
JP6675203B2 (ja) * 2015-01-22 2020-04-01 技研商事インターナショナル株式会社 商圏分析レポートシステム及び商圏分析レポート処理プログラム
JP6646465B2 (ja) * 2015-03-10 2020-02-14 技研商事インターナショナル株式会社 商圏分析システム
EP3460807A1 (en) * 2017-09-20 2019-03-27 Koninklijke Philips N.V. Subject clustering method and apparatus
JP6943436B2 (ja) * 2017-10-04 2021-09-29 技研商事インターナショナル株式会社 来訪者の地域特性分析システム及びそのプログラム
KR101980699B1 (ko) * 2017-10-31 2019-05-22 한국과학기술원 공간 데이터를 분산 처리하는 시스템 및 방법
JP7330141B2 (ja) * 2020-06-24 2023-08-21 株式会社Kddi総合研究所 情報処理装置、情報処理方法およびプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002140490A (ja) * 2000-11-02 2002-05-17 Information Services International Dentsu Ltd マーケティング情報の分析方法、情報処理装置、および媒体
JP2003295804A (ja) * 2002-02-04 2003-10-15 Giken Shoji International Co Ltd メール/メールマガジン配信システム
JP2004185539A (ja) * 2002-12-06 2004-07-02 Yunitekku:Kk 商圏分析システム、方法、プログラム、及び記録媒体
JP4797756B2 (ja) * 2006-04-06 2011-10-19 富士ゼロックス株式会社 購買プロセス評価方法

Also Published As

Publication number Publication date
JP2012150786A (ja) 2012-08-09
JP2013050975A (ja) 2013-03-14
JP5284548B2 (ja) 2013-09-11
JP5214054B2 (ja) 2013-06-19
JP2013101700A (ja) 2013-05-23

Similar Documents

Publication Publication Date Title
JP5123422B2 (ja) 地域特性を利用したプロファイリングシステム
Chen et al. Investigating the causes of delay in grain bin construction projects: the case of China
Schulte et al. A meta-analysis of residential PV adoption: the important role of perceived benefits, intentions and antecedents in solar energy acceptance
Keong Choong Understanding the features of performance measurement system: a literature review
Aksözen et al. Reconstitution of the dynamics of an urban building stock
Evans et al. 3DStock: A new kind of three-dimensional model of the building stock of England and Wales, for use in energy analysis
Dawley et al. Continuity and evolution in an old industrial region: the labour market dynamics of the rise and fall of Northern Rock
JP2004185539A (ja) 商圏分析システム、方法、プログラム、及び記録媒体
Wilhelmsson A method to derive housing sub‐markets and reduce spatial dependency
Simpeh et al. Analysis of the benefits of green building in South Africa
Nikoloudis et al. A novel multicriteria methodology for evaluating urban development proposals
Seifert et al. Estimation of industrial and commercial asset values for hazard risk assessment
Woldeyohanes Dimensions and determinants of growth in micro and small enterprises: empirical evidence from Mekelle City, Ethiopia
Bag Urban female labor force participation and its correlates: A comparative study of slum dwellers and their urban counterparts of three metro cities in India
Katyoka et al. An investigation of the nature of vacant commercial and industrial property
Liang et al. Human capital and the re‐employment of retrenchment labor in urban China
Hincapie-Ossa et al. Assessing county-level vulnerability to the energy transition in the United States using machine learning
Guan How to affect housing values: location, affordability and amenity
Mohamed et al. Data Completeness Analysis of Malaysian Educational Management Information System
Akifieva et al. Factors of social infrastructure development in rural areas
Muggenhuber Geospatial Data Mining and Analytics for Real-Estate Applications
Brouwer Old firms in the Netherlands
KR101107209B1 (ko) 건설기업간 벤치마킹을 위한 웹기반 성과관리시스템
Mansfield How local are US labor markets? Using an assignment model to forecast the geographic incidence of local labor demand shocks
Zhang et al. Estimating suppressed data in regional economic databases: A goal-programming approach

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120710

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20120710

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20120731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120808

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120927

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121017

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121025

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151102

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5123422

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250