WO2014034310A1

WO2014034310A1 - 情報分析システム、及び情報分析方法

Info

Publication number: WO2014034310A1
Application number: PCT/JP2013/069408
Authority: WO
Inventors: 敏子相薗; 鈴木　敬
Original assignee: 株式会社日立製作所
Priority date: 2012-08-30
Filing date: 2013-07-17
Publication date: 2014-03-06
Also published as: JP6027122B2; JPWO2014034310A1

Abstract

　人々の移動データを用いて人々が移動先に滞在した目的別にエリアの勢力範囲を低コストで分析する技術を提供する。本発明に係るエリア分析システムは、移動データから人々が滞在したエリアを個人毎に抽出して当該エリアの滞在目的を推定し、滞在目的別の利用者数に基づきエリア間の関連度を計算しておき、分析対象のエリアと関連度の高いエリアを抽出することである滞在目的における分析対象エリアの勢力範囲とする。

Description

情報分析システム、及び情報分析方法

　本発明は、情報分析システム、及び情報分析方法に関し、例えば、人の移動データから求めたエリア間の関連度を用いてエリアの勢力範囲を抽出するための技術に関する。

（エリア分析のニーズ）
　マーケティングなどにおいて「エリアの特性」を把握することは企業の戦略上重要である。エリアの特性の分析には次のようなニーズがある。

（i）人々がエリアにどのような目的（仕事、帰宅、買い物等）で来ているか知りたい。

（ii）このエリアがどのくらいの範囲から人々を集客しているか知りたい。

　例えば、サービス業においてある鉄道沿線で休日に買い物に来る人をターゲットとした店舗を展開する場合、沿線のどの駅に買い物客が多く来るかは店舗展開の戦略上必ず把握しなければならない。また、既に店舗を展開している駅が沿線にあれば、その駅が現在どのくらいの範囲からターゲットを集客しているかも重要な情報である。新規に店舗を展開しようとしている駅からの集客も多い場合、既存店舗の顧客を分散してしまう可能性があるからである。

（エリア分析のニーズに対する従来技術）
　上記のようなニーズに対して従来次のような技術が提供されている。すなわち（ａ）アンケート調査、（ｂ）人の移動データを利用した分析、および（ｃ）モデルを使った商圏分析である。以下、詳細に説明する。

（エリア分析のニーズに対する従来技術：アンケート調査）
　前述のようなニーズに対応する情報を、例えば駅の乗降客数や地域の人口などの数値から推定・取得することは困難である。

　このため、アンケート調査では、あるエリアに来ている人に対して何のために来たかを直接回答してもらうことでエリアの特性分析に必要な情報を収集する。アンケート調査の一例として、国土交通省が実施した「大都市交通センサス」がある。例えば、大都市交通センサスでは、鉄道利用者に対してアンケート調査を実施している。より具体的には、首都圏、中京圏、および近畿圏の各エリアでアンケート調査票を配布し、鉄道利用者が一日にどこからどこまで何のためにいつ移動したかについて合計５０万人弱の回答を得ている。この結果を利用すれば、人々がどこにどのような目的で来ているかを把握することができる。

（エリア分析のニーズに対する従来技術：人の移動データを利用した分析）
　例えば、特許文献１には、人の移動データとして携帯端末の移動履歴を利用する技術が開示されている。特許文献１では、利用者が所持する携帯端末から利用者の位置情報を取得し、リアルタイムに集計・加工し、情報が利用者に提供される。この技術により、どのエリアにどのくらいの範囲から人々が移動しているかを把握することが可能になる。

　また、特許文献２には、人の移動データとして交通系ＩＣカードの利用履歴を利用する技術が開示されている。特許文献２では、交通系ＩＣカードの利用履歴を用いてある駅を入出場した利用者の移動範囲を当該駅の集客範囲としている。

（エリア分析のニーズに対する従来技術：モデルを使った商圏分析）
　例えば、非特許文献１には、モデルを使った商圏分析の一例として、Ｈｕｆｆモデルを使った商圏分析が開示されている。Ｈｕｆｆモデルとは、あるエリアに居住している人々がある商業施設に買い物に行く確率は、商業施設の売場面積が大きければ大きいほど高くなり、逆に当該商業施設への距離が大きければ大きいほど低くなるというモデルである。このモデルにより、複数の商業施設があるとき、あるエリア（町など）から各商業施設に買い物に行く確率を求めることができる。ある広域エリアに含まれる各町の人口と各町からそれぞれの商業施設に買い物に行く確率を計算することにより、各商業施設にどの町からどのくらいの人が集まるかを予測することができる。

特開２００６－１１３８３７号公報特開２０１１－１６４８１１号公報

David L．HUFF:"Defining and Estimating Trading Area", Journalof Marketing，Vol.28, pp34-38(1964年)

　上記特許文献１および２などに記載されている手段により、人々が移動する目的や移動量の把握あるいはエリアへの集客数の予測がそれぞれ実現することができるが、その一方で次のような課題がある。

（課題その１：アンケート調査の課題）
　アンケートによる調査は、移動を行っている人から直接データを抽出するため実態に近い分析ができるというメリットがある一方で、コストがかかってしまう。また、例えば、国土交通省が５年ごとに実行している大都市交通センサスでは鉄道利用者に対するアンケートの回収率は１３～１４％程度であり、高いとはいえない。さらに、前述の調査は平日のある一日を対象としており、広域で継続的なアンケート調査結果を得ることは難しい。

（課題その２：人の移動データを利用した分析の課題）
　特許文献１及び２の人の移動データを利用した分析は、利用者が持ち運んでいる携帯端末や駅で利用する交通系ＩＣカードから自動的にデータを取得するため、コストがかからないというメリットがある。その一方で、利用者が何のために移動したのか、その目的が不明であるという課題がある。そのため、人々が何のために移動したのか知りたいというエリア分析のニーズに応えることができない。

（課題その３：モデルを使った商圏分析の課題）
　モデルを使った商圏分析は、商業施設の売り場面積やそれらへの距離などモデルのパラメタの値を取得できれば商業施設の勢力範囲を容易に予測することができるというメリットがある一方、モデルに合わないケースも見られる。前述のＨｕｆｆモデルは、例えば食料品のような日常的に購入される最寄品については当てはまることが多いが、ブランド服や家具などデザインや品質などが重視され購入頻度が低い買回り品については一致しないことがある。例えば、都心のファッション性の高い有名デパートや高級ブランドの路面店は距離にかかわらず郊外から買い物客が来店する。従って、商業施設への距離などに基づくモデルのみを用いて、あるエリアに対してどのくらいの範囲から集客しているか実態を把握することは難しい。

　本発明はこのような状況に鑑みてなされたものであり、人々の所定場所や地域の訪問目的、及び人々が特定場所や地域にどのくらいの範囲から訪問しているかについての情報を、適切かつ、できるだけ安価に提供するための技術を提案するものである。

　上記課題を解決するために、本発明では、コンピュータシステムにおいて、人集団の移動履歴を含む履歴データと予め用意された滞在場所のカテゴリデータとを照合することにより、人集団に属する人物の滞在場所を抽出する滞在抽出処理と、滞在抽出処理によって抽出した滞在場所における、人集団に含まれる個人毎の滞在頻度を求め、当該個人毎の滞在頻度に基づいて、予め用意された滞在目的別に各個人の拠点となっている場所を推定する拠点推定処理と、個人毎の滞在目的別の拠点の情報に基づいて、滞在目的別に個人毎の場所間の移動量を集計する頻度カウント処理と、個人毎の滞在目的別の場所間の移動量の情報に基づいて、滞在目的別の場所同士がどの程度密接に関連しているかを示す関連度を算出する関連度計算処理と、算出した関連度の情報を提供する情報提供処理と、を実行する。

　本発明によれば、移動先に滞在する目的別の場所への集客を勢力範囲として低コストで分析できるようになる。

　本発明に関連する更なる特徴は、本明細書の記述、添付図面から明らかになるものである。また、本発明の態様は、要素及び多様な要素の組み合わせ及び以降の詳細な記述と添付される特許請求の範囲の様態により達成され実現される。

　本明細書の記述は典型的な例示に過ぎず、本発明の特許請求の範囲又は適用例を如何なる意味に於いても限定するものではないことを理解する必要がある。

本発明における駅間の関連度について説明するための図である。本発明の第１の実施形態によるエリア分析装置（エリア分析システム）１の概略構成を示す図である。本発明の第１の実施形態によるエリア分析装置１のハードウェア構成を示す図である。ＩＣカード利用履歴１０３のデータ構成を示す図である。滞在テーブル１０４のデータ構成を示す図である。駅頻度テーブル１０５のデータ構成を示す図である。拠点データ１０６のデータ構成を示す図である。頻度テーブル２０３のデータ構成を示す図である。関連度データ２０４のデータ構成を示す図である。分析条件３０４のデータ構成を示す図である。駅グループテーブル３０５のデータ構成を示す図である。ユーザ情報３０６のデータ構成を示す図である。駅情報３０７のデータ構成を示す図である。第１の実施形態によるエリア分析装置１において実行される処理手順の全体を示すフローチャートである。ステップＳ１０の処理内容を示すフローチャートである。ステップＳ２０の処理内容を示すフローチャートである。ステップＳ３０の処理内容を示すフローチャートである。第１の実施形態によるエリア分析装置１で用いられる拠点推定ルールを説明するための図である。滞在抽出部１０１が実行するステップＳ１０１の処理の詳細を説明するためのフローチャートである。拠点推定部１０２が実行するステップＳ１０２の処理の詳細を説明するためのフローチャートである。頻度カウント部２０１が実行するステップＳ２０１の処理の詳細を説明するためのフローチャートである。関連度計算部２０２が実行するステップＳ２０２の処理の詳細を説明するためのフローチャートである。単独生起確率計算部２０２０１が実行するステップＳ２０２０１の処理の詳細を説明するためのフローチャートである。共起確率計算部２０２０３が実行するステップＳ２０２０３の処理の詳細を説明するためのフローチャートである。駅グループ表示部３０３が表示する駅グループ表示画面の一例を示す図である。第１の実施形態の変形例によるエリア分析装置（エリア分析システム）１の概略構成を示す図である。本発明の第２の実施形態に係るエリア分析装置（エリア分析システム）１の概略構成を示す図である。第２の実施形態の変形例によるエリア分析装置（エリア分析システム）１の概略構成を示す図である。

　以下、まず本発明の考え方について概略を説明し、その後に添付図面を参照して本発明の実施形態について説明する。添付図面では、機能的に同じ要素は同じ番号で表示される場合もある。なお、添付図面は本発明の原理に則った具体的な実施形態と実装例を示しているが、これらは本発明の理解のためのものであり、決して本発明を限定的に解釈するために用いられるものではない。

　本実施形態では、当業者が本発明を実施するのに十分詳細にその説明がなされているが、他の実装・形態も可能で、本発明の技術的思想の範囲と精神を逸脱することなく構成・構造の変更や多様な要素の置き換えが可能であることを理解する必要がある。従って、以降の記述をこれに限定して解釈してはならない。

　更に、本発明の実施形態は、後述されるように、汎用コンピュータ上で稼動するソフトウェアで実装しても良いし専用ハードウェア又はソフトウェアとハードウェアの組み合わせで実装しても良い。

　なお、以後の説明では「テーブル」形式によって本発明の各情報について説明するが、これら情報は必ずしもテーブルによるデータ構造で表現されていなくても良く、リスト、ＤＢ、キュー等のデータ構造やそれ以外で表現されていても良い。そのため、データ構造に依存しないことを示すために「テーブル」、「リスト」、「ＤＢ」、「キュー」等について単に「情報」と呼ぶことがある。

　また、各情報の内容を説明する際に、「識別情報」、「識別子」、「名」、「名前」、「ＩＤ」という表現を用いることが可能であり、これらについてはお互いに置換が可能である。

　なお、各処理部（例えば、拠点データ生成部、関連度データ生成部、エリア分析部）を「プログラム」で実現する場合、プロセッサがメモリ及び通信ポート（通信制御装置）を用いながらプログラムを実行することになる。このため、各処理部について説明する場合に、プロセッサを動作主体として説明しても良い。また、プログラムによって実現される処理は、管理サーバ等の計算機、情報処理装置が行う処理としてもよい。プログラムの一部または全ては専用ハードウェアで実現してもよく、また、モジュール化されていても良い。各種プログラムはプログラム配布サーバや記憶メディアによって各計算機にインストールされてもよい。

（Ａ）本発明の概要
　本発明では、交通系ＩＣカードの利用履歴や携帯電話の基地局接続ログ、あるいは自動車に設置されたセンサから取得される移動履歴を移動データとして活用し、以下の３つの手法（１）拠点データ生成処理、（２）関連度データ生成処理、及び（３）エリア分析処理により、人集合の移動の傾向を用いてエリアの分析を行う。（１）拠点データ生成処理では、移動データから利用者ごとに後述する拠点を抽出する。（２）関連度データ生成処理では、場所ごとに当該場所を拠点とする利用者の数に基づき場所間の関連度を計算する。（３）エリア分析処理では、場所間の関連度に基づき関連度の強い場所をまとめたグループを生成する。以下、各手法の概略を説明する。なお、以下ではわかりやすさのため交通系ＩＣカードの利用履歴を移動データとして活用し、駅を分析対象の場所として説明するが、交通系ＩＣカードの利用履歴だけではなく、携帯電話や自動車等の移動履歴データを用いてエリア分析の結果を利用者に提供するようにしても良い。

（１）拠点データ生成処理
　人は何らかの目的を持って移動する。例えば仕事のために勤務先最寄駅のＡ駅に移動する、買い物のために大きな駅ビルのあるＢ駅に移動をする、帰宅のための自宅最寄り駅のＣ駅に移動するなどである。そして移動先で数十分または数時間滞在したあと、また次の滞在先に移動する。この移動の目的のバリエーションは人々の日常的な生活においてそう多くはない。前述の大都市交通センサスでは調査項目のひとつに鉄道利用者の「移動の目的」があるが、その選択肢は「仕事」「業務」「私事」および「帰宅」の４種類である。またひとりの人が普段の生活で利用する駅のバリエーションはそう多くはなく、それぞれある程度移動／滞在の目的に応じて決まっていると思われる。

　本発明では人々が移動先に滞在する目的として「自宅」「仕事」「レジャー」「おでかけ」の４つを想定し、各目的において利用する傾向が高い駅を当該目的の「拠点」となっている駅と捉える。「拠点」駅は個人によって異なる。個人の自宅住所や勤務先の住所が分かれば「自宅」および「仕事」の「拠点」駅の候補を上げることができるが、少し離れていても始発の駅を日常的に利用したり、帰りがけの買い物が便利な駅を優先的に利用したりなど、どの駅を拠点とするかは個人によって異なる。

　本発明では、ＩＣカード利用履歴から人々が普段利用している駅を抽出して、移動した時間帯や滞在した時間の長さ、滞在した頻度などからどのタイプの拠点なのかを推定する。具体的には、平日の朝から夕方／夜まで長時間滞在する傾向がある駅は「仕事」（「学校」含む）タイプの拠点駅、曜日に限らず夕方／夜から次の日の朝まで滞在する傾向がある駅は「自宅」タイプの拠点駅と推定し、休日にある程度長時間滞在する傾向がある駅は「レジャー」タイプ、それ以外の休日や平日に比較的短時間滞在する傾向がある駅は「おでかけ」タイプの拠点駅であると推定する。

（２）関連度データ生成処理
　ある駅に関してどのくらいの範囲から人が来ているか、すなわち駅の勢力範囲を分析するには、分析対象の駅（移動先）に来ている人が、どのような目的（移動目的）でどの駅から（移動元）どのくらいの量（移動量）が来ているかといった情報が必要である。その上で分析対象駅への移動量が多い駅が対象駅の勢力範囲に含まれると考えることができる。

　ここで「移動量」を「移動した人数」とすると、その数は駅から駅への移動量の実態を表すものの、移動元の駅の規模によっては駅間の依存関係が正しく勢力範囲に反映されないという課題がある。このことについて図１を用いて説明する。

　図１は、駅間を移動した人数と駅間の依存関係について説明するための図である。図１において、Ｘは分析対象駅、Ｂ、Ｃ、ＤはＸ駅へ移動した人の移動元の駅であり、矢印の太さは移動した人数の多さを表す。図１に示すようにＸ駅への移動人数はＢ駅、Ｃ駅、Ｄ駅の順に多いが、Ｂ駅はそもそも利用者の多い規模の大きな駅なのでＣ駅や他の駅への移動人数も多く、Ｘ駅との関係はそれらと比較して相対的に弱い。

　一方、Ｄ駅は、Ｘ駅への移動人数はＢ駅、Ｃ駅と比較して少ないものの、Ｄ駅からの移動先の駅としては最も人数が多く、移動先としてＸ駅との関係は強いと言える。このように駅間の関係の強さを移動した人数で比較すると、大規模駅が上位になりやすい一方で、下位の小規模駅が実際にはより関係の強い駅であることがある。このため、例えば、ある駅の駅ビル内の店舗の広告（クーポンの配布など）を他の駅で展開する場合、移動人数が多い移動元の駅で実行したとしてもコストに対して期待以上の効果が得られない一方で、移動人数が少なくとも関係が強い駅に絞って実行した方がより高い効果を得られる可能性がある。

　これに対して、本発明では、駅間の潜在的な関係の強さを分析で扱えるようにするため、駅間の移動量を統計的に処理して駅間の関連度を求める。統計処理の具体例として相互情報量やＡＩＣ、カイ２乗値などを適用して、移動元Ｘから移動先Ｙへの人数に基づき移動元ＸからＹ以外の移動先への人数などを考慮した関連度を求める。

（３）エリア分析処理
　本発明では、ある駅に関してその商圏や通勤圏のような駅の勢力範囲を抽出するため、駅間の関連度を用いる。具体的には分析対象の駅を中心駅として、その駅と関連度の高い駅を抽出して勢力範囲とすることにより、次のような分析手段を分析者に提供する。

（ａ）勢力範囲の抽出手段
　分析者が分析対象の駅と滞在目的を指定すると、当該滞在目的における駅の勢力範囲を抽出して、勢力範囲に含まれる駅名のリスト形式、または路線図上にあるいはネットワーク形式などで表示する。

（ｂ）勢力範囲の比較分析手段
　（i）滞在目的別比較
　分析者が分析対象の駅を指定すると、すべての滞在目的に関して勢力範囲を抽出し、滞在目的別に比較しやすいようリストや路線図またはネットワーク形式で並べて表示、または同一路線図やネットワーク上に色分け表示する。

　（ii）駅間の比較
　分析者が複数の駅と滞在目的を指定すると、当該滞在目的における前記複数駅の勢力範囲をそれぞれ抽出し、駅間の比較がしやすいようリストや路線図またはネットワーク形式で並べて表示、または同一路線図やネットワーク上に色分け表示する。

　（iii）時系列比較
　分析者が分析対対象の駅と滞在目的、および期間を複数指定すると、当該滞在目的における駅の勢力範囲を期間別に抽出し、時系列比較しやすいようリストや路線図またはネットワーク形式で並べて表示、または同一路線図やネットワーク上に色分けして表示する。

（ｃ）広域エリアや沿線の勢力範囲による分割手段
　分析者が広域エリアや沿線と滞在目的を指定すると、その広域エリア／沿線に含まれる駅を抽出して駅間の関連度に基づきいくつかの勢力範囲に分割し、分割された勢力範囲の比較がしやすいようリストや路線図またはネットワーク形式で並べて表示、または同一路線図やネットワーク上に色分け表示する。

　以上、本発明の概要について説明した。以下では具体的な実施形態について、図面を参照して説明する。

（Ｂ）第１の実施形態
　本発明の第１の実施形態では、交通系ＩＣカードの利用履歴を用いて利用者ごとに拠点を抽出し、当該拠点を用いて駅間の関連度を計算して駅の勢力範囲を抽出するエリア分析装置について説明する。

　＜システムの全体構成＞
　図２は、第１の実施形態に係るエリア分析装置（エリア分析システム、情報分析システムともいう）１の概略構成を示す図である。エリア分析装置１は、ＩＣカード利用履歴１０３を入力とし、分析レポート３０８を出力とする。ＩＣカード利用履歴１０３は、交通系ＩＣカード８１の利用者が交通系ＩＣカード８１を駅の改札機８２や精算機８３で利用した履歴を格納したデータである。分析レポート３０８は駅を中心としたエリアの勢力範囲を分析した結果を格納したレポートである。

　エリア分析装置１は、人集合の移動傾向を用いて駅を中心としたエリアを分析する装置であり、大きく次の３つの機能部から構成される。すなわち、拠点データ生成部１０、関連度データ生成部２０、エリア分析部３０である。なお、エリア分析処理装置１をコンピュータで構成した場合、コンピュータに含まれるＣＰＵ（プロセッサ）が、メモリに格納されている拠点データ生成部１０、関連度データ生成部２０、エリア分析部３０の各処理を実現するためのプログラムを読み込み、それぞれ拠点データ生成処理、関連度データ生成処理、およびエリア分析処理を実行する。

（システムの機能構成：拠点データ生成部１０）
　拠点データ生成部１０は、人の移動データから利用者の活動の拠点となっている駅を抽出する。その入力はＩＣカード利用履歴１０３に格納されたデータであり、拠点データ１０６にデータを出力する。また、拠点データ生成部１０は、テンポラリデータとして滞在テーブル１０４および駅頻度テーブル１０５を生成する。これら入出力データおよびテンポラリデータの詳細については、データ構成の説明において図を用いて詳述する。

　拠点データ生成部１０は、さらに滞在抽出部１０１、および拠点推定部１０２の２つの機能部を有する。これら機能部の詳細については、処理手順の説明においてフローチャートを使って詳述する。

（システムの機能構成：関連度データ生成部２０）
　関連度データ生成部２０は、駅間の関連度を計算する。その入力は、拠点データ１０６に格納されたデータであり、関連度データ生成部２０は、関連度データ２０４にデータを出力し、テンポラリデータとして頻度テーブル２０３を生成する。これら入出力データおよびテンポラリデータの詳細については、データ構成の説明において図を用いて詳述する。

　関連度データ生成部２０は、さらに頻度カウント部２０１および関連度計算部２０２の２つの機能部を有する。これら機能部の詳細については、処理手順の説明においてフローチャートを使って詳述する。

（システムの機能構成：エリア分析部３０）
　エリア分析部３０は、エリア分析条件設定部（エリア分析条件設定処理）３０１において、分析者が入力するエリア分析条件設定情報、ユーザ情報３０６、及び駅情報３０７から分析条件３０４を抽出し、この分析条件に従って駅のグループを生成し、駅の勢力範囲として表示する。エリア分析部３０の入力は、関連度データ２０４に格納されたデータであり、分析レポート３０８に分析結果を出力する。

　また、エリア分析部３０は、テンポラリデータとして、分析条件３０４、および駅グループテーブル３０５を生成する。

　さらに、エリア分析部３０は、参照データとして、ユーザ情報３０６および駅情報３０７に格納されたデータを利用することもある。これら入出力データ、テンポラリデータ並びに参照データの詳細については、データ構成の説明において図を用いて詳述する。

　なお、エリア分析部３０は、エリア分析条件設定部３０１、駅グループ生成部３０２、および駅グループ表示部３０３の３つの機能部を有している。これら機能部の詳細については、処理手順の説明においてフローチャートを使って詳述する。

　エリア分析部３０を構成する各機能部は、前述のように、これらの機能を実現する回路デバイスなどのハードウェアを用いて構成することもできるし、ＣＰＵ（Central Processing Unit）などの演算装置とその動作を規定するプログラムによって構成することもできる。以下では上記各機能部をプログラムとして実装したものと想定する。上記各データ、テーブル、リストなどのデータ類は、ハードディスクなどの記憶装置に格納することができる。

　＜ハードウェア構成＞
　図３は、エリア分析装置１のハードウェア構成を示す図である。図３に示すように、エリア分析装置１は、ＣＰＵ２と、ハードディスク（記憶装置）３と、メモリ４と、ディスプレイ制御部５と、ディスプレイ５１と、キーボード制御部６と、キーボード（入力デバイス）６１と、マウス制御部７と、マウス（入力デバイス）７１と、を有している。

　ＣＰＵ２は、データの入出力、読み込み、格納、および図２で説明した各機能部を実装したプログラムを実行する。ハードディスク３は、図２で説明した各データを保存する記憶装置である。メモリ４は、プログラムおよびデータを一時的にロードして記憶する装置である。ディスプレイ５１は、ユーザにデータを表示する装置であり、ディスプレイ制御部５によって制御される。キーボード６１およびマウス７１は、ユーザからの入力を受け付ける装置であり、それぞれキーボード制御部６およびマウス制御部７によって制御される。

　＜データ構成＞
　次に、図２で説明した各データの構成について図４乃至図１３を用いて説明する。

（１）データ構成：ＩＣカード利用履歴１０３
　図４は、ＩＣカード利用履歴１０３のデータ構成を示す図である。ＩＣカード利用履歴１０３は、利用者が交通系ＩＣカードを利用した履歴を格納したデータであり、利用者が駅の改札機や精算機などに設置された端末機においてカードをタッチした記録が格納されている。図４には、一人の利用者（Ｕ００１）のデータのみが示されているが、これは利用者ＩＤでソートしたためであり、本来は複数の利用者の履歴データが格納される。

　ＩＣカード利用履歴１０３は、利用者ＩＤ１０３０１と、時刻１０３０２と、駅ＩＤ１０３０３と、端末機タイプ１０３０４と、金額１０３０５と、を構成項目として有している。利用者ＩＤ１０３０１は、交通系ＩＣカード８１の利用者のＩＤを格納する欄であり、ＩＣカード乗車券８１に格納されている利用者のＩＤを改札機８２または精算機８３のリーダライタ装置が読み込むことにより取得される。時刻１０３０２は、利用者が改札機８２または精算機８３を利用した時刻を格納する欄である。駅ＩＤ１０３０３は、交通系ＩＣカードが利用された駅のＩＤを格納する欄である。端末機タイプ１０３０４は、交通系ＩＣカードが利用された端末機のタイプを格納する欄であり、第１の実施形態では「入場改札機」、「出場改札機」および「精算機」の３種類があるものとする。金額１０３０５は、改札機８２や精算機８３で支払われた金額を格納する欄である。

（２）データ構成：滞在テーブル１０４
　図５は、滞在テーブル１０４のデータ構成を示す図である。滞在テーブル１０４は、利用者が滞在した駅を格納したデータであり、滞在抽出部１０１によって生成される。図５に示すように滞在テーブル１０４は、利用者ＩＤ１０４０１と、駅ＩＤ１０４０２と、滞在タイプ１０４０３と、滞在開始時刻１０４０４と、終了時刻１０４０５と、を構成項目として有している。

　利用者ＩＤ１０４０１は、交通系ＩＣカード８１の利用者のＩＤを格納するための欄である。駅ＩＤ１０４０２は、利用者が滞在した駅のＩＤを格納するための欄である。滞在タイプ１０４０４は、利用者が滞在した開始・終了時刻および滞在時間から推定した滞在のタイプを格納するための欄である。滞在のタイプは前述の拠点のタイプ（「自宅」「仕事」「おでかけ」「レジャー」）と対応しており、それぞれ「Ｈ」「Ｗ」「Ｓ」「Ｌ」のコードで表すものとする。滞在開始時刻１０４０４は滞在が開始した時刻を、終了時刻１０４０５は滞在が終了した時刻を格納するための欄である。第１の実施形態では、改札機の通過を持って滞在が開始・終了すると考える。具体的には、ある駅に入場した時点でそれまでの滞在が終了し、次の滞在が開始したとする。また、一般的に人は、朝は自宅から出発して夜自宅に戻ると考えられる。そこで、本実施形態ではその日最初の滞在場所は「自宅（Ｈ）」であり、最初の改札機の通過（入場）を境に次の滞在へ切り替わる。すなわち、一日の最初の「自宅（Ｈ）」での滞在は一日の最初の改札機の通過時刻で終了し、次の滞在場所が「仕事（Ｗ）」であれば改札機の通過時刻をもって「仕事（Ｗ）」の滞在の開始時刻とする。利用者が勤務先の最寄り駅に到着して出場改札機を通過（出場）し、何時間かその場所に滞在したあと、同じ駅で入場改札機を通過（入場）すると「仕事（Ｗ）」での滞在は終了し、次の滞在が開始する。このように、交通系ＩＣカードの利用履歴から滞在抽出する場合、滞在の開始・終了時刻は改札機の通過（入場）時刻であり、滞在した場所は駅名（出場駅名）となる。

　滞在テーブル１０４は、拠点データ生成部１０が処理を実行するごとに生成するテンポラリなデータであり、拠点データ生成部１０の処理が終了すると削除される。

（３）データ構成：駅頻度テーブル１０５
　図６は、駅頻度テーブル１０５のデータ構成を示す図である。駅頻度テーブル１０５は、利用者が滞在した駅とその出現頻度を格納したデータであり、拠点推定部１０２によって生成される。図６に示すように、駅頻度テーブル１０５は、駅ＩＤ１０５０１と、滞在タイプ１０５０２と、滞在頻度（例えば、滞在日数で示されている）１０５０３と、を構成項目として有している。

　駅ＩＤ１０５０１は、利用者が滞在した駅のＩＤを格納するための欄である。滞在タイプ１０５０２は、滞在のタイプを格納するための欄である。滞在頻度１０５０３は、利用者が当該駅に対応する滞在のタイプで滞在した日数を格納するための欄である。

　駅頻度テーブル１０５は、利用者毎に生成される。また、駅頻度テーブル１０５は、拠点データ生成部１０が処理を実行するごとに生成するテンポラリなデータであり、拠点データ生成部１０の処理が終了すると削除される。

（４）データ構成：拠点データ１０６
　図７は、拠点データ１０６のデータ構成を示す図である。拠点データ１０６は、利用者が拠点として利用した駅を格納したデータであり、拠点推定部１０２によって生成される。図７に示すように拠点データ１０６は、利用者ＩＤ１０６０１、駅ＩＤ１０６０２、拠点タイプ１０６０３、および滞在頻度１０６０４を有する。

　利用者ＩＤ１０６０１は、交通系ＩＣカードの利用者のＩＤを格納するための欄である。駅ＩＤ１０６０２は利用者が利用した駅のＩＤを格納するための欄である。拠点タイプ１０６０３は利用者が利用した駅のタイプを格納するための欄である。本実施形態では、タイプは駅が自宅最寄り駅であることを表す「Ｈ」、勤務先最寄駅であることを表す「Ｗ」、プライベートなお出かけ先であり、買い物や食事などのような短時間の滞在先であることを表す「Ｓ」、同様にプライベートなお出かけ先であるが、レジャー施設や観光地のように長時間の滞在先であることを表す「Ｌ」の４つがあるものとする。滞在頻度１０６０４は、利用者が利用した駅に滞在した頻度を格納するための欄である。

　拠点データ１０６は、拠点データ生成部１０が拠点を抽出するごとに生成される。具体的にはシステム管理者は一か月ごと、あるいは半年ごとなど定期的に拠点データの生成を実行し、拠点データ１０６に追加格納する。

（５）データ構成：頻度テーブル２０３
　図８は、頻度テーブル２０３のデータ構成を示す図である。頻度テーブル２０３は、駅を拠点とする利用者の数と駅間の関連度の計算の前処理として計算されるデータを格納したデータであり、頻度カウント部２０１によって生成される。

　図８に示すように、頻度テーブル２０３は、単独頻度テーブル２０３００（図８（ａ））と、共起頻度テーブル２０３１０（図８（ｂ））から構成される。単独頻度テーブル２０３００は、各駅について所定の拠点タイプ（Ｈ、Ｗ、Ｓ、Ｌ）として利用する利用者の数をカウントして格納したテーブルである。共起頻度テーブル２０３１０は、２つの駅の組み合わせについて所定の拠点タイプの組み合わせ（ＨとＷ、ＨとＳ、ＨとＬ等）として利用する利用者の数をカウントして格納したテーブルである。頻度テーブル２０３は、関連度データ生成部２０におけるテンポラリなデータであり、頻度カウント部２０１の処理が実行されるごとに生成され、関連度計算部２０２の処理が終了すると消去される。

　図８（ａ）に示すように、単独頻度テーブル２０３００は、駅ＩＤ２０３０１と、拠点タイプ２０３０２と、単独頻度２０３０３と、単独生起確率２０３０４と、を構成項目として有している。駅ＩＤ２０３０１は、駅のＩＤを格納するための欄である。拠点タイプ２０３０２は、当該駅の拠点のタイプを格納するための欄である。単独頻度２０３０３は、当該駅を前記拠点タイプとする利用者の数を格納するための欄である。単独生起確率２０３０４は、対応する拠点タイプを持つ全ての駅のうち当該駅が出現する確率を格納するための欄である。なお、図８（ａ）の単独頻度テーブル２０３００においては、駅ＩＤ２０３０１、拠点タイプ２０３０２および単独頻度２０３０３は、頻度カウント部２０１によって値がセットされる。単独生起確率２０３０４は、関連度計算部２０２によって値がセットされる。

　図８（ｂ）に示すように、共起頻度テーブル２０３１０は駅ＩＤｘ２０３１１と、拠点タイプｘ２０３１２と、駅ＩＤｙ２０３１３と、拠点タイプｙ２０３１４と、共起頻度２０３１５と、共起確率２０３１６と、を構成項目として有している。駅ＩＤｘ２０３１１は、駅のＩＤを格納するための欄である。拠点タイプｘ２０３１２は、拠点のタイプを格納するための欄である。駅ＩＤｙ２０３１３は、駅のＩＤを格納するための欄である。拠点タイプｙ２０３０１４は、拠点のタイプを格納するための欄である。共起頻度２０３１５は、駅ＩＤｘ２０３１１に格納された駅を拠点タイプｘ２０３１２に格納された拠点タイプとし、かつ駅ＩＤｙ２０３１３に格納された駅を拠点タイプｙ２０３１４のタイプに格納された拠点タイプとする利用者の数を格納するための欄である。

　本実施形態では、拠点タイプｘ２０３１２を「自宅（Ｈ）」、拠点タイプｘ２０３１３を「自宅（Ｈ）」以外、すなわち「仕事（Ｗ）」、「おでかけ（Ｓ）」、「レジャー（Ｌ）」のいずれかの組み合わせを共起頻度としてカウントする。すなわち、駅ＩＤｘ２０３１１に格納されたＩＤに対応する駅を「自宅（Ｈ）」とする利用者のうち、駅ＩＤｙ２０３１４に格納されたＩＤに対応する駅を「自宅（Ｈ）」以外、例えば「仕事（Ｗ）」とする利用者の数をカウントして共起頻度２０３１５に格納する。この共起頻度はある駅を「自宅」最寄り駅、もう一方の駅を「仕事」先の最寄り駅としている利用者の数に相当する。

　共起確率２０３１６は、拠点タイプｘ２０３１２である駅ＩＤ２０３１１と拠点タイプｙ２０３１４である駅ＩＤ２０３１３の組み合わせが、共起頻度テーブル２０３１０に格納された全組み合わせにおいて生起する確率を格納する。

　なお、図８（ｂ）に示す共起頻度テーブル２０３１０において、駅ＩＤｘ２０３１１、拠点タイプｘ２０３１２、駅ＩＤｙ２０３１３、拠点タイプｙ２０３１４、および共起頻度２０３１５は、頻度カウント部２０１によって値がセットされる。共起生起確率２０３１６は、関連度計算部２０２によって値がセットされる。

（６）データ構成：関連度データ２０４
　図９は、関連度データ２０４のデータ構成を示す図である。関連度データ２０４は、駅間の関連度を格納したデータであり、関連度計算部２０２によって生成される。

　図９に示すように、関連度データ２０４は、駅ＩＤｘ２０４０１と、拠点タイプｘ２０４０２と、単独頻度ｘ２０４０３と、駅ＩＤｙ２０４０４と、拠点タイプｙ２０４０５と、単独頻度ｙ２０４０６と、共起頻度２０４０７と、関連度２０４０８と、を構成項目として有している。

　駅ＩＤｘ２０４０１は、駅のＩＤを格納するための欄である。拠点タイプｘ２０４０２は、駅ＩＤ２０４０１に格納されたＩＤに対応する駅の拠点のタイプを格納するための欄である。単独頻度ｘ２０４０３は、駅ＩＤｘ２０４０１に格納されたＩＤに対応する駅を拠点タイプｘ２０４０２に格納された拠点タイプとする利用者の数を格納するための欄である。この数は頻度テーブル２０３の単独頻度テーブル２０３００の単独頻度２０３０３の値と同じである。駅ＩＤｙ２０４０４は、駅のＩＤを格納するための欄である。拠点タイプｙ２０４０５は、駅ＩＤ２０４０４に格納されたＩＤに対応する駅の拠点のタイプを格納するための欄である。単独頻度ｙ２０４０６は、駅ＩＤｙ２０４０４に格納されたＩＤに対応する駅を拠点タイプｙ２０４０５に格納された拠点タイプとする利用者の数を格納するための欄である。この数は頻度テーブル２０３の単独頻度テーブル２０３００の単独頻度２０３０３の値と同じである。共起頻度２０４０７は、駅ＩＤｘ２０４０１に格納されたＩＤに対応する駅を拠点タイプｘ２０４０２に格納された拠点タイプとし、かつ駅ＩＤｙ２０４０４に格納されたＩＤに対応する駅を拠点タイプｙ２０４０５に格納された拠点タイプとする利用者の数を格納するための欄である。関連度２０４０８は、単独頻度ｘ２０４０３に格納された値と、単独頻度ｙ２０４０６に格納された値と、共起頻度２０４０７に格納された値に基づき計算した駅ＩＤｘ２０４０１に格納されたＩＤに対応する駅と駅ＩＤｙ２０４０４に格納されたＩＤに対応する駅との関連度を格納するための欄である。

　なお、関連度データ２０４は、関連度データ生成部２０によって関連度が計算されるごとに生成される。具体的には、システム管理者は一か月ごと、あるいは半年ごとなど定期的に拠点データを生成した後に関連度データ生成部２０の処理を実行し、関連度データ２０４に追加格納する。

（７）データ構成：分析条件３０４
　図１０は、分析条件３０４のデータ構成を示す図である。分析条件３０４は、勢力範囲を抽出したい駅のＩＤや勢力範囲に属する駅の数など分析者によって設定されたエリア分析の条件を格納したテーブルであり、エリア分析条件設定部３０１によって生成される。

　図１０に示すように、分析条件３０４は、中心駅ＩＤ３０４０１と、拠点タイプ３０４０２と、最大関連駅数３０４０３と、最低関連度３０４０４と、排他設定３０４０５と、を構成項目として有している。

　中心駅ＩＤ３０４０１は、勢力範囲を抽出する駅のＩＤを格納するための欄である。拠点タイプ３０４０２は、対応する駅の拠点タイプを格納するための欄である。最大関連駅数３０４０３は、中心駅に対して関連度の高い駅を抽出する際の最大駅数を格納するための欄である。最低関連度３０４０４は、中心駅に対して関連度の高い駅を抽出する際の関連度の最低値を格納するための欄である。排他設定３０４０５は、中心駅ＩＤが複数指定されたときそれぞれの関連駅に同じ駅が出現しても良いか（各中心駅が同一の駅を関連駅として共有しても良いか）どうかのフラグを格納するための欄である。ここで「ＯＦＦ」は排他設定しないことを表し、各中心駅に対して同じ駅が関連駅となってよいことを表す。一方で「ＯＮ」は排他設定をすることを表し、各中心駅のうち最も関連度が高い中心駅に対してのみ関連駅となることを表す。

　本実施形態においては、分析条件３０４には分析者が指定した値であって、エリア分析条件設定処理３０１によって処理された値が格納される。中心駅ＩＤ３０４０１は必須項目とし、それ以外の項目は任意である。分析者の指定がない場合はデフォルト値がセットされる。具体的には、拠点タイプ３０４０２の拠点タイプのデフォルト値は「Ｓ」すなわち「おでかけ」の拠点タイプ、最大関連駅数３０４０３は「１０」、最低関連度３０４０４は「-」すなわち「指定なし」、排他設定３０４０５は「ＯＦＦ」すなわち各中心駅に対して同じ駅が関連駅として出現してもよいことを表すフラグが格納されている。

（８）データ構成：駅グループテーブル３０５
　図１１は、駅グループテーブル３０５のデータ構成を示す図である。駅グループテーブル３０５は、分析対象の駅および当該駅と関連度の高い駅のリストを格納したテーブルであり、駅グループ生成部３０２によって生成される。

　図１１に示すように、駅グループテーブル３０５は、中心駅ＩＤ３０５０１と、拠点タイプ３０５０２と、関連度駅ＩＤリスト３０５０３と、を構成項目として有している。

　中心駅ＩＤ３０５０１は、分析対象の駅のＩＤを格納するための欄である。拠点タイプ３０５０２は中心駅と関連駅の関係のタイプを格納するための欄である。関連駅ＩＤリスト３０５０２は分析対象の駅と関連度の高い駅のＩＤのリストをその関連度とともに格納するための欄である。

（９）データ構成：ユーザ情報３０６
　図１２は、ユーザ情報３０６のデータ構成を示す図である。ユーザ情報３０６は、利用者の氏名、性別、生年月日などの利用者の属性情報を格納したデータである。本実施形態では、交通系ＩＣカードの利用履歴は、利用者の移動データとして用いられる。そのためユーザ情報３０６には、交通系ＩＣカードの利用者の情報が格納されている。

　ユーザ情報３０６は、利用者ＩＤ３０６０１と、氏名３０６０２と、生年月日３０６０３と、性別３０６０４と、住所３０６０５と、を構成項目として有している。

　利用者ＩＤ３０６０１は、交通系ＩＣカードの利用者のＩＤを格納するための欄である。氏名３０６０２は、利用者の氏名を格納するための欄である。生年月日３０６０３は利用者の生年月日を格納し、性別３０６０４は利用者の性別を格納するための欄である。住所３０６０５は、利用者の住所を格納するための欄である。

（１０）データ構成：駅情報３０７
　図１３は、駅情報３０７のデータ構成を示す図である。駅情報３０７は、交通系ＩＣカードの利用履歴に出現する駅の属性情報を格納したデータである。

　駅情報３０７は、駅ＩＤ３０７０１と、駅名３０７０２と、路線３０７０３と、住所３０７０４と、を構成項目として有している。

　駅ＩＤ３０７０１は、駅のＩＤを格納するための欄である。駅名３０７０２は、駅の名称を格納するための欄である。路線２０７０３は駅が属している路線名を格納するための欄である。住所３０７０４は、駅の住所を格納するための欄である。

　＜エリア分析装置の処理内容＞
　次に図１４～図２５を用いてエリア分析装置１の処理内容について説明する。

（１）全体の処理手内容
　図１４は、第１の実施形態によるエリア分析装置１において実行される全体の処理内容を説明するためのフローチャートである。

　拠点データ生成部１０は、まず利用者の移動データが蓄積されたＩＣカード利用履歴１０３を用いて利用者の拠点となる駅を抽出する（Ｓ１０）。

　次に、関連度データ生成部２０は、ステップＳ１０で生成した利用者の拠点データを用いて駅間の関連度を計算する（Ｓ２０）。

　最後に、エリア分析部３０は、ステップＳ２０で生成した駅間の関連度データを用いて分析者が指定した駅と関連の強い駅を抽出して駅グループを生成し分析者に表示する（Ｓ３０）。

　なお、本実施形態における拠点データ生成部１０および関連度データ生成部２０の処理は、バッチ処理により実行するようにしても良い。初期状態においてはそれまでに蓄積されたすべてのＩＣカード利用履歴１０３に対して、月単位に拠点データ生成部１０および関連度データ生成部２０の処理を実行し、以降は毎月、その月に蓄積された利用履歴に対して拠点データ生成部１０の処理を実行し、拠点データ１０６に追加格納して、さらにその月の拠点データを用いて駅間の関連度を計算し関連度データ２０４に追加格納するものとする。各ステップの詳細については、以下に図面を参照しながら説明する。

（２）拠点データ生成部１０の処理概要
　図１５は、ステップＳ１０の処理概要を示すフローチャートである。

　拠点データ生成部１０の滞在抽出部１０１は、ＩＣカード利用履歴１０３から利用者ごとに利用者が滞在した駅とその時間を抽出して滞在テーブル１０４に格納する（Ｓ１０１）。

　次に、拠点推定部１０２は、生成した滞在テーブル１０４を用いて利用者ごとに拠点となる駅の候補を抽出して駅頻度テーブル１０５に格納し、駅の出現頻度に基づいて拠点のタイプを推定し拠点データ１０６に格納する（Ｓ１０２）。

（３）関連度データ生成部２０の処理概要
　図１６は、ステップＳ２０の処理概要を示すフローチャートである。

　関連度データ生成部２０の頻度カウント部２０１は、駅ごとに、当該駅を拠点としている利用者の数を拠点のタイプごとにカウントする。さらに、頻度カウント部２０１は、ある駅を「自宅（Ｈ）」タイプ、他の駅を「自宅（Ｈ）」以外の拠点としている利用者の数を拠点のタイプの組み合わせごとにカウントする（Ｓ２０１）。

　次に、関連度計算部２０２は、前記カウントした利用者の数に基づき駅間の関連度を計算し関連度データ２０４に格納する（Ｓ２０２）。

（４）エリア分析部３０の処理概要
　図１７は、ステップＳ３０の処理概要を示すフローチャートである。

　エリア分析部３０のエリア分析条件設定部３０１は、まず分析者によって入力設定された勢力圏の抽出対象となる駅と駅グループを生成する条件にしたがって、分析条件３０４を生成する（Ｓ３０１）。より具体的には、分析者が１つ以上の中心駅の駅名を入力すると、エリア分析条件設定部３０１は、図１３に示す駅情報３０７を参照して対象の駅名に対応する駅のＩＤを取得し、分析条件３０４の中心駅ＩＤ３０４０１に格納する。このとき分析者が対象の駅名の拠点のタイプ、最大関連駅数、最低関連度および排他設定も入力設定した場合は、エリア分析条件設定部３０１は、それぞれ分析条件３０４の拠点タイプ３０４０２、最大関連駅数３０４０３、最低関連度３０３０４、および排他設定３０４０５に設定された値を格納する。分析者からの入力がない項目についてはデフォルト値を格納する。

　次に、駅グループ生成部３０２は、設定された条件に従って指定された駅を中心とした駅グループを生成する（Ｓ３０２）。より具体的には、駅グループ生成部３０２は、関連度データ２０４を検索し、分析条件３０４に格納された駅ＩＤと関連度の高い駅を最大関連駅数で指定された数だけ取得する。このとき関連度が最低関連度で指定された値より低い駅は取得の対象外とする。また、中心駅ＩＤが複数指定されており、かつ排他設定が「ＯＮ」であれば、各中心駅の関連駅ＩＤリスト３０５０３を参照し、同じ駅がセットされていれば中心駅との関連度が低いほうは削除する。

　そして、駅グループ表示部３０３は、分析者に駅グループを表示する（Ｓ３０３）。

（５）処理手順：拠点データ生成部１０の処理の詳細
　次に拠点データ生成部１０の詳細な処理手順について説明する。

（ａ）拠点データ生成部１０における滞在抽出部１０１の処理の詳細
　図１８は、滞在抽出処理で用いられる滞在抽出ルールの一例を示す図である。前述したように本実施形態では「自宅」「仕事」「レジャー」「おでかけ」の４つのタイプの滞在項目が抽出される。これら滞在項目を抽出するため、本実施形態では、利用者が駅近辺に滞在したと推定される時間帯、その長さ、および曜日の３つを用いたルールを定義している。すなわち、一日の最初と最後に出現した滞在は「自宅」、一日の最初と最後以外でかつ平日の７時間以上であれば「仕事」、「休日」であれば「レジャー」、それ以外は「おでかけ」である。拠点データ生成部１０は、一例として図１８に示すルールを用いてＩＣカード利用履歴１０３から滞在を抽出して滞在テーブル１０４に格納する。

　図１９は、滞在抽出部１０１が実施するステップＳ１０１の詳細な処理手順を示すフローチャートである。図１９において、ｉはＩＣカード利用履歴１０３に格納された履歴のインデクスを示す変数である。本実施形態では、ＩＣカード利用履歴１０３は、時刻１０３０２の日付のみを第１キー、利用者ＩＤ１０３０１を第２キー、時刻１０３０２の時刻を第３キーキーにソートされているものとする。すなわちＩＣカード利用履歴はまず同じ日付のものが並び、そのうち同じ利用者ＩＤのものが、さらに同じ利用者では時刻の昇順に並んでいる。なお本実施例では後述するように一日の最後が翌２：５９であると想定しているため、時刻１０３０２の日付でソートする場合は翌２：５９までの履歴は前日の履歴として扱う。また格納されているすべての履歴は未処理であると想定する。したがって、ｉの初期値に０をセットするが、すでに過去分の履歴からは滞在を抽出済みで、追加されたＩＣカード利用履歴から滞在を抽出する場合、ｉは追加された履歴のインデクスを指す。他の変数としてＵｉｄは利用者ＩＤをセットする変数、Ｐｉｄは駅ＩＤをセットする変数であり、それぞれｎｕｌｌで初期化しておく。また、ＳｔおよびＥｔはそれぞれ、滞在の開始・終了時刻をセットする変数であり、それぞれｎｕｌｌで初期化しておく。さらに、本実施形態において一日の始まりは午前３時、終わりは翌午前２時５９分とする。これは交通系ＩＣカードの利用履歴を移動データとして用いるため終電の時刻と合わせたことによる。以下図１９の各ステップについて説明する。

（i）ステップＳ１０１００１～Ｓ１０１００３
　滞在抽出部１０１は、ｉに０をセットする（Ｓ１０１００１）。滞在抽出部１０１は、ｉに１を加え（Ｓ１０１００２）、ＩＣカード利用履歴１０３のｉ番目の利用履歴の利用者ＩＤ１０３０１がＵｉｄと同じであればステップＳ１０１００６にスキップし、同じでなければステップＳ１０１００４に進む（Ｓ１０１００３）。

（ii）ステップＳ１０１００４
　滞在抽出部１０１は、Ｕｉｄにセットされた利用者の一日の利用履歴について処理が終了したと判断し、滞在の終了時刻を表す変数Ｅｔに一日の最後の時刻“２６：５９（０２：５９）”をセットし、「自宅」滞在を抽出する。具体的には、滞在抽出部１０１は、滞在テーブル１０４において、対応する利用者ＩＤ１０４０１にＵｉｄをセットし、駅ＩＤ１０４０２にＰｉｄの値（一日の最後に出場した駅のＩＤ）をセットし、滞在タイプ１０４０３に「自宅（Ｈ）」をセットし、開始時刻１０４０４にＳｔの値をセットし、終了時刻１０４０５にＥｔの値をセットする（例えば、図５の第３行目のデータを参照）。

（iii）ステップＳ１０１００５
　滞在抽出部１０１は、ＵｉｄにＩＣカード利用履歴１０３のｉ番目の利用者ＩＤ１０３０１の値（次に処理対象とする利用者のＩＤ）をセットし、滞在の開始時刻を表す変数Ｓｔに一日の最初の時刻“０３：００”をセットしてＳｖを初期化する。

（iv）ステップＳ１０１００６
　滞在抽出部１０１は、ｉがＩＣカード利用履歴１０３に格納された履歴数よりも大きいか否か判断し、大きければ本処理を終了させ、それ以外であれば処理をステップＳ１０１００７に移行させる。

（v）ステップＳ１０１００７
　滞在抽出部１０１は、ＩＣカード利用履歴１０３のｉ番目の端末機タイプ１０３０４が「入場改札機」であるか判断し、「入場改札機」であればステップＳ１０１００８に処理を移行させ、それ以外であればステップＳ１０１０１９に処理を移行させる。

（vi）ステップＳ１０１００８
　滞在抽出部１０１は、ステップＳ１０１００７において利用履歴の端末機が「入場改札機」の場合、「滞在」が遷移したと判断し、滞在の終了時刻を表す変数ＥｔにＩＣカード利用履歴１０３のｉ番目の時刻１０３０２に格納された時刻に１分を減じて格納する。つまり、これは、１分前までは遷移前の「滞在」の状態であったという意味である。なお、このとき滞在開始時刻Ｓｔと終了時刻Ｅｔから滞在時間（滞在の長さ）を計算しその時間が非常に短い（１５分以内など）であれば、滞在ではなく乗換であると判定し、ステップＳ１０１００２に戻るようにしても良い。

（vii）ステップＳ１０１００９～Ｓ１０１０１１
　Ｓｔの値が一日の最初の滞在を示している場合（Ｓｔ＝“０３：００”）、滞在抽出部１０１は、処理をステップＳ１０１０１０に移行させ、それ以外であれば処理をステップＳ１０１０１２に移行させる（Ｓ１０１００９）。

　Ｓ１０１０１０において、滞在抽出部１０１は、ＩＣカード利用履歴１０３のｉ番目の駅名１０３０３を取得してこれに対応する駅情報３０７のレコードを参照し、入場駅の駅ＩＤ３０７０１を取得してＰｉｄにセットする。

　Ｓ１０１０１１において、滞在抽出部１０１は、滞在テーブル１０４の末尾の利用者ＩＤ１０４０１にＵｉｄをセットし、駅ＩＤ１０４０２にＰｉｄの値（一日の最初に入場した駅の場所ＩＤ）をセットし、滞在タイプ１０４０３に「自宅（Ｈ）」をセットし、開始時刻１０４０４にＳｔにセットされた値をセットし、終了時刻１０４０５にＥｔにセットされた値をセットする。なお、１日のうち最初に改札機に入場した場合、その直前までは自宅に滞在していたと考えられる。そこで、ここでは、１つ前の滞在（ｉ－１番目の滞在）は自宅滞在として抽出することとした。

（viii）ステップＳ１０１０１２
　滞在抽出部１０１は、ＩＣカード利用履歴１０３の時刻１０３０２から日付を取得し、さらにカレンダ情報（図示せず）を参照し曜日を取得する。曜日が月曜日から金曜日の平日であれば、滞在抽出部１０１は、処理をステップＳ１０１０１３に移行させ、それ以外（休日）であれば処理をステップＳ１０１０１６に移行させる。

（ix）ステップＳ１０１０１３
　滞在抽出部１０１は、滞在開始時刻Ｓｔと終了時刻Ｅｔから滞在時間（滞在の長さ）を計算する。滞在時間が所定時間以上（たとえば７時間以上）であれば、滞在抽出部１０１は、処理をステップＳ１０１０１４に移行させ、それ以外であれば処理をステップＳ１０１０１５に移行させる。

（x）ステップＳ１０１０１４及びＳ１０１０１５
　改札機に入場したのが１日のうち２回目以降であり、かつ直前の場所に滞在していたのが平日の７時間以上である場合、その入場の直前までは仕事中であったと考えられる。そこで、この場合は、滞在抽出部１０１は、１つ前の滞在（ｉ－１番目の滞在）として「仕事（Ｗ）」滞在を抽出する。滞在抽出部１０１は、ステップＳ１０１０１１と同様に各テーブルの値をセットする。

（xi）ステップＳ１０１０１５
　一方、改札機に入場したのが１日のうち２回目以降であり、かつ直前の場所に滞在していたのが平日の７時間未満または休日の４時間未満である場合、その入場の直前まではその他一般的な外出していたと考えられる。そこで、この場合は、滞在抽出部１０１は、１つ前の滞在（ｉ－１番目の滞在）として「おでかけ（Ｓ）」滞在を抽出する。滞在抽出部１０１は、ステップＳ１０１０１１と同様に各テーブルの値をセットする。

（xii）ステップＳ１０１０１６
　滞在抽出部１０１は、滞在時間が所定時間以上（たとえば４時間以上）であるか否か判断し、所定時間以上であれば処理をステップＳ１０１０１７に移行させ、それ以外であれば処理をステップＳ１０１０１５に移行させる。

（xiii）ステップＳ１０１０１７
　改札機に入場したのが１日のうち２回目以降であり、かつ直前の場所に滞在していたのが休日の４時間以上である場合、その入場の直前までは行楽外出をしていたと考えられる。そこで、この場合は、滞在抽出部１０１は、１つ前の滞在（ｉ－１番目の滞在）として「レジャー（Ｌ）」滞在を抽出する。滞在抽出部１０１は、ステップＳ１０１０１１と同様に各テーブルの値をセットする。

（xiv）ステップＳ１０１０１８
　滞在抽出部１０１は、滞在の開始時刻を表す変数ＳｔにＩＣカード利用履歴１０３のｉ番目の時刻１０３０２をセットし、処理をステップＳ１０１００２に移行させる。

（xv）ステップＳ１０１０１９
　滞在抽出部１０１は、ＩＣカード利用履歴１０３のｉ番目の端末機タイプ１０３０４が「出場改札機」または「精算機」であるか判断し、そうであれば処理をステップＳ１０１０１９に移行させ、それ以外であれば処理をステップＳ１０１００２に移行させる。

（xvi）ステップＳ１０１０２０
　利用者が改札機を出場または精算機で乗り越し精算をした場合、その出場／精算駅が滞在場所となる。そこで、滞在抽出部１０１は、ＩＣカード利用履歴１０３のｉ番目の駅名１０３０３を取得し、駅情報３０７から対応する駅ＩＤ３０７０１を取得してＰｉｄにセットした上で、処理をステップＳ１０１００２に移行させる。

（ｂ）拠点データ生成部１０における拠点推定部１０２の処理の詳細
　図２０は、滞在抽出部１０１が実施するステップＳ１０２の処理の詳細を説明するためのフローチャートである。図２０において、ｉは滞在テーブル１０４に格納された利用者数（異なり数）を示す変数であり、ｊは一人の利用者が滞在した駅の数（異なり数）を示す変数である。以下、図２０の各ステップについて説明する。

（i）ステップＳ１０２００１～Ｓ１０２００２
　拠点推定部１０２は、滞在テーブル１０４に格納された利用者のデータを利用者ごとにソート（ユニークソート）して利用者リストを作成し（Ｓ１０２００１）、まずｉに０をセットする（Ｓ１０２００２）。

（ii）ステップＳ１０２００３～Ｓ１０２００４
　拠点推定部１０２は、ｉに１を加え（Ｓ１０２００３）、ｉが前記利用者リスト（図示せず）に格納された利用者の数より小さければ処理をステップＳ１０２００５に移行させ、それ以外は処理を終了させる（Ｓ１０２００４）。

（iii）ステップＳ１０２００５～Ｓ１０２００７
　拠点推定部１０２は、ｉ番目の利用者が滞在した駅を滞在のタイプごとにカウントして駅頻度テーブル１０５に格納する（Ｓ１０２０５５）。

　次に、拠点推定部１０２は、駅頻度テーブル１０５に格納された駅のうち、滞在タイプがＨでかつＨの頻度が最も高い駅をＨとして抽出し、拠点データ１０６に格納する（Ｓ１０２００６）。

　そして、拠点推定部１０２は、駅頻度テーブル１０５に格納された駅のうち、滞在タイプがＷでかつＷの頻度が最も高い駅をＷとして抽出し、拠点データ１０６に格納する（Ｓ１０２００７）。

（iv）ステップＳ１０２００８
　続いて、拠点推定部１０２は、駅頻度テーブル１０５に格納されている駅のユニークなリストを作成する。

（v）ステップＳ１０２００９～Ｓ２０１０１１
　拠点推定部１０２は、ｊに０をセットし（Ｓ１０２００９）、続いて、ｊに１を加える（Ｓ１０２０１０）。

　そして、拠点推定部１０２は、ｊが駅リスト（図示せず）に格納された駅の数（異なり数）より少ないか否か判断し、少なければ処理をステップＳ１０２０１２に移行させ、それ以外は処理をステップＳ２０１００３に移行させる（Ｓ１０２０１１）。

（vi）ステップＳ１０２０１２
　拠点推定部１０２は、ｊ番目の駅に対応する拠点データ１０６にＨまたはＷとして格納されているか判断し、ＨまたはＷとして格納されていなければ処理をステップＳ１０２０１３に移行させ、それ以外は処理をステップＳ１０２１０に移行させる。

（vii）ステップＳ１０２０１３
　拠点推定部１０２は、ｊ番目の駅についてＳよりもＬの方が出現頻度が高いか否か判断し、Ｌの頻度の方が高ければ、処理をステップＳ１０２０１４に移行させ、それ以外は処理をステップＳ１０２０１５に移行させる。

（viii）ステップＳ１０２０１４
　拠点推定部１０２は、ｊ番目の駅のタイプをＬとして抽出し、拠点データ１０６に格納し、処理をステップＳ１０２０１０に移行させる。

（ix）ステップＳ１０２０１５
　拠点推定部１０２は、ｊ番目の駅のタイプをＳとして抽出し、拠点データ１０６に格納し、処理をステップＳ１０２０１０に移行させる。

（６）関連度データ生成部２０の処理の詳細
　次に、前述の関連度データ生成部２０の処理の詳細について、フローチャートを用いて説明する。

（ａ）関連度データ生成部２０における頻度カウント部２０１の処理の詳細
　図２１は、頻度カウント部２０１が実施するステップＳ２０１の処理の詳細を説明するためのフローチャートである。以下、図２１において、ｉ、ｊ、およびｋは拠点データ１０６に格納された拠点データのインデクスを示す変数である。本実施形態では、拠点データ１０６は、利用者ＩＤをキーにソートされていると想定する。他の変数としてＵｉｄは利用者ＩＤをセットする変数であり、ｎｕｌｌで初期化しておく。図２１の処理によって、図８（ａ）及び（ｂ）の確率部分以外の情報を求めている。以下、図２１の各ステップについて説明する。

（i）ステップＳ２０１００１～Ｓ２０１００２
　頻度カウント部２０１は、ｉに０、ｊを１に、ｋを０にセットする（Ｓ２０１００１）。

　また、頻度カウント部２０１は拠点データ１０６のｊ番目の拠点データの利用者ＩＤ１０６０１をＵｉｄにセットする（Ｓ２０１００２）。

（ii）ステップＳ２０１００３～Ｓ２０１００４
　頻度カウント部２０１は、ｉに１を加え（Ｓ２０１００３）、ｉが拠点データ１０６に格納された拠点データ数よりも小さいか否か判断し、小さければ処理をステップＳ２０1００５に移行させ、それ以外は処理を終了させる（Ｓ２０１００４）。

（iii）ステップＳ２０１００５
　頻度カウント部２０１は、拠点データ１０６のｉ番目の拠点データの利用者ＩＤ１０６０１がＵｉｄと同じであるか否か判断し、同じであれば処理をステップＳ２０１００６に移行させ、同じでなければ処理をステップＳ２０１００９に移行させる。

（iv）ステップＳ２０１００６
　頻度カウント部２０１は、拠点データ１０６のｉ番目の拠点データの駅ＩＤ１０６０２および拠点タイプ１０６０３を取得し、頻度テーブル２０３の単独頻度テーブル２０３００を参照して駅ＩＤ２０３０１および拠点タイプ２０３０２が一致する拠点データが既に格納されているか検索する。既に格納されていれば、頻度カウント部２０１は、その拠点データが格納されているレコードの単独頻度２０３０３の頻度を１加算し、格納されていなければ単独頻度テーブル２０３００の末尾の駅ＩＤ２０３０１に駅ＩＤ１０６０２の値を、拠点タイプ２０３０２に拠点タイプ１０６０３の値をセットし、単独頻度２０３０３に１をセットする。

（v）ステップＳ２０１００７
　頻度カウント部２０１は、拠点データ１０６のｉ番目の拠点タイプ１０６０３が自宅最寄り駅を表す「Ｈ」であるか否か判断し、「Ｈ」であれば処理をステップＳ２０１００８に移行させ、それ以外であれば処理をステップＳ２０１００３に移行させる。

（vi）ステップＳ２０１００８
　頻度カウント部２０１は、ｉをｋにセットし、処理をステップＳ２０１０３に移行させる。従って、ｋ番目の拠点は必ず「Ｈ」に設定されていることになる。このため、Ｓ２０１００９以降の処理では、ｋ番目の拠点（Ｈに設定されている拠点）とその他のカテゴリ（Ｗ、Ｌ、Ｓ）に設定されている拠点との組み合わせの頻度が算出されることになる。

（vii）ステップＳ２０１００９
　頻度カウント部２０１は、ｉがｊと同じか否か判断し、ｉとｊが異なる場合には処理をステップＳ２０１０１０に移行させ、それ以外は処理をステップＳ２０１００２に移行させる。

（viii）ステップＳ２０１０１０
　頻度カウント部２０１は、ｊがｋと同じか否か判断し、ｊとｋが異なる場合には処理をステップＳ２０１０１１に移行させ、それ以外は処理をステップＳ２０１０１２に移行させる。ｊ＝ｋの場合には、「Ｈ」と「Ｈ」の組み合わせの共起頻度を求めることになって
しまうため、この組み合わせが当該ステップで排除されるようになっている。

（ix）ステップＳ２０１０１１
　頻度カウント部２０１は、拠点データ１０６のｋ番目の拠点データの駅ＩＤ１０６０２、拠点タイプ１０６０３、およびｊ番目の拠点データの駅ＩＤ１０６０２、拠点タイプ１０６０３を取得し、頻度テーブル２０３の共起独頻度テーブル２０３１０を参照する。そして、頻度カウント部２０１は、駅ＩＤｘ２０３１１および拠点タイプｘ２０３１２がｋ番目の拠点データの駅ＩＤ１０６０２および拠点タイプ１０６０３とそれぞれ一致し、かつ駅ＩＤｙ２０３１３および拠点タイプｙ２０３１４がｉ番目の拠点データの駅ＩＤ１０６０２および拠点タイプ１０６０３とそれぞれ一致する拠点データの組み合わせが既に格納されているか検索する。既に格納されていれば、頻度カウント部２０１は、その拠点データの組み合わせが格納されているレコードの共起頻度２０３１５の頻度を１加算し、格納されていなければ共起頻度テーブル２０３１０の最後尾行の駅ＩＤｘ２０３１１および拠点タイプｘ２０３１２にｋ番目の拠点データの駅ＩＤ１０６０２および拠点タイプ１０６０３の値を、駅ＩＤｙ２０３１３および拠点タイプｙ２０３１４にｉ番目の拠点データの駅ＩＤ１０６０２および拠点タイプ１０６０３の値をセットし、共起頻度２０３１５に１をセットする。

（ｂ）関連度データ生成部２０における関連度計算部２０２の処理の詳細
　図２２は、関連度計算部２０２が実施するステップＳ２０２の処理の詳細を説明するためのフローチャートである。駅間の関連度は、頻度テーブル２０３の単独頻度テーブル２０３００に格納された駅の単独頻度と、共起頻度テーブル２０３１０に格納された駅の組み合わせの共起頻度を用いて式１に従って計算する。なお、本実施形態では、処理の高速化のためあらかじめ駅の単独生起確率と駅の組み合わせの共起確率を計算してその値を式１に示す式に当てはめて関連度を計算している。

　以下、図２２の各ステップについて説明する。

（i）ステップＳ２０２０１
　関連度計算部２０２は、頻度テーブル２０３の単独頻度テーブル２０３００に格納された駅の拠点タイプごとの単独頻度を用いて各拠点タイプごとに各駅の出現確率を全駅分計算する。当該処理の詳細は図２３を用いて説明する。

（ii）ステップＳ２０２０２
　関連度計算部２０２は、頻度テーブル２０３の共起頻度テーブル２０３１０に格納された駅の組み合わせの共起頻度を用いて各駅の組み合わせの共起確率を全組み合わせ分計算する。当該処理の詳細は図２４を用いて説明する。

（iii）ステップＳ２０２０３
　関連度計算部２０２は頻度テーブル２０３の共起頻度テーブル２０３１０に格納された駅の組み合わせに対して、単独頻度テーブル２０３００の単独生起確率２０３０４、および共起頻度テーブル２０３１０の共起確率２０３１６を上記式１に適用して関連度を計算し、関連度データ２０４に格納する。

（ｃ）関連度計算部２０２の単独生起確率計算部２０２０１の処理の詳細
　図２３は、関連度計算部２０２の単独生起確率計算部２０２０１が実行するステップＳ２０２０１の処理の詳細を説明するためのフローチャートであり、ある拠点タイプＴにおいて駅が出現する確率を計算するフローチャートである。図２３において、Ｔは計算対象としている拠点のタイプをセットする変数である。本実施形態では、拠点タイプは、Ｈ、Ｗ、Ｓ、Ｌの４つを想定する。よって、図２３に示す処理はＴに対象となる拠点タイプをセットして、拠点タイプの数だけ繰り返す。他の変数としてｉは単独頻度テーブル２０３００に格納された頻度データのインデクス、ＴＦは単独頻度テーブル２０３００に格納され頻度データのうち拠点タイプ２０３０２がＴと一致する単独頻度２０３０３を合計した値をセットする変数である。以下、図２３の各ステップについて説明する。

（i）ステップＳ２０２０１０１
　単独生起確率計算部２０２０１は、ｉおよびＴＦに０をセットする。

（ii）ステップＳ２０２０１０２～Ｓ２０２０１０３
　単独生起確率計算部２０２０１は、ｉに１を加え（Ｓ２０２０１０２）、ｉが単独頻度テーブル２０３００に格納された頻度データ数よりも小さいか否か判断する（Ｓ２０２０１０３）。ｉが単独頻度テーブル２０３００に格納された頻度データ数よりも小さい場合には、単独生起確率計算部２０２０１は、処理をステップＳ２０２０１０４に移行させる。一方、それ以外の場合には、全てのレコードについて単独頻度の計算が完了していることを意味するので、単独生起確率計算部２０２０１は、処理をステップＳ２０２０１０６に移行させる。

（iii）ステップＳ２０２０１０４
　単独生起確率計算部２０２０１は、ｉ番目の頻度データの拠点タイプ２０３０２がＴと一致するか判断し、一致すれば処理をステップＳ２０２０１０５に移行させ、それ以外であれば処理をステップＳ２０２０１０２に移行させる。

（iv）ステップＳ２０２０１０５
　単独生起確率計算部２０２０１は、ｉ番目の頻度データの単独頻度２０３０３をＴＦに加算し、処理をステップＳ２０２０１０２に移行させる。そして、処理は次の頻度データに対して実行される。

（v）ステップＳ２０２０１０６～２０２０１０８
　単独生起確率計算部２０２０１は、ｉを０に初期化し（Ｓ２０２０１０６）、ｉに１を加える（Ｓ２０２０１０７）。

　単独生起確率計算部２０２０１は、ｉが単独頻度テーブル２０３００に格納された頻度データ数よりも小さいか否か判断し、小さい場合には処理をステップＳ２０２０１０９に移行させ、それ以外の場合には処理を終了させる（Ｓ２０２０１０８）。

（vi）ステップＳ２０２０１０９
　単独生起確率計算部２０２０１は、ｉ番目の頻度データの拠点タイプ２０３０２がＴと一致するか否か判断し、一致すれば処理をステップＳ２０２０１１０に移行させ、それ以外の場合には処理をステップＳ２０２０１０７に移行させる。

（vii）ステップＳ２０２０１１０
　単独生起確率計算部２０２０１は、ｉ番目の頻度データの単独頻度２０３０３およびＴＦに基づき単独生起確率を計算し、単独頻度テーブル２０３００の単独生起確率２０３０４に格納した後、処理をステップＳ２０２０１０７に移行させる。

（ｄ）関連度計算部２０２の共起確率計算部２０２０２の処理の詳細
　図２４は、関連度計算部２０２の共起確率計算部２０２０２が実行するステップＳ２０２０２の処理の詳細を説明するためのフローチャートである。ｉは共起頻度テーブル２０３１０に格納された共起頻度データのインデクス、ＣＦは共起頻度テーブル２０３１０に格納された共起頻度２０３１５を合計した値をセットする変数である。以下、図２４の各ステップについて説明する。

（i）ステップＳ２０２０２０１～Ｓ２０２０２０３
　共起確率計算部２０２０２は、ｉおよびＣＦに０をセットし（Ｓ２０２０２０１）、ｉに１を加える（Ｓ２０２０２０２）。

　そして、共起確率計算部２０２０２は、ｉが共起頻度テーブル２０３１０に格納された頻度データ数よりも小さいか否か判断し、小さい場合には処理をステップＳ２０２０２０４に移行させ、それ以外の場合には処理をステップＳ２０２０２０５に移行させる（Ｓ２０２０２０３）。

（ii）ステップＳ２０２０２０４
　共起確率計算部２０２０２は、ｉ番目の頻度データの共起頻度２０２１５をＣＦに加算し、処理をステップＳ２０２０２０２に移行させる。

（iii）ステップＳ２０２０２０５～Ｓ２０２２３０７
　共起確率計算部２０２０２はｉを０に初期化し（Ｓ２０２０２０５）、ｉに１を加える（Ｓ２０２０２０６）。

　そして、共起確率計算部２０２０２は、ｉが共起頻度テーブル２０３１０に格納された頻度データ数よりも小さいか否か判断し、小さい場合には処理をステップＳ２０２０２０８に移行させ、それ以外の場合には処理を終了させる（Ｓ２０２０２０７）。

（iv）ステップＳ２０２０２０８
　共起確率計算部２０２０３は、ｉ番目の頻度データの共起頻度２０３１５およびＣＦに基づき共起確率を計算し、共起頻度テーブル２０３１０の共起確率２０３１６に格納した後、処理をステップＳ２０２０２０６に移行させる。

（７）画面例：駅グループ表示画面の一例
　図２５は、エリア分析部３０の駅グループ表示部３０３が表示する駅グループ表示画面の一例を示す図である。本実施形態では、分析者は、図２５に示す３つの表示形式のいずれかを選択できるものとする。すなわち、図２５（ａ）に示される表形式、図２５（ｂ）に示される路線図形式、および図２５（ｃ）に示されるネットワーク形式である。以下、詳細に説明する。

（i）表形式表示
　図２５（ａ）は、駅グループ表示部３０３が表示する駅グループ表示画面の一例として表形式で駅グループを表示した画面３０３１００である。図２５（ａ）に示すように、表形式表示画面３０３１００は、中心駅３０３１０１と、関連タイプ３０３１０２と、関連駅３０３１０３と、を表示領域として有している。

　中心駅３０３１０１は、分析者が指定した中心駅を表示する領域である。具体的には、中心駅３０３１０１は、駅グループテーブル３０５の中心駅ＩＤ３０５０１から駅ＩＤを取得し、駅情報３０７を参照して駅名に変換することにより生成され、表示される情報である。関連タイプ３０３１０２は、駅グループテーブル３０５の拠点タイプ３０５０２から拠点タイプを取得し、図１８に示す表を用いてタイプのコードを拠点名に変換することにより生成され、表示される情報である。関連駅３０３１０３は、駅グループテーブル３０５の関連駅ＩＤリスト３０５０３から関連駅のＩＤを取得し、駅情報３０７を参照して駅名に変換することにより生成され、表示される情報である。

　図２５（ａ）に示すように、表形式表示画面３０３１００は、分析者が駅名を熟知しているケースや関連駅数が多いケースにおいて結果を容易に把握することができる。

（ii）路線図形式
　図２５（ｂ）は、駅グループ表示部３０３が表示する駅グループ表示画面の一例として路線図形式で駅グループを表示した画面３０３２００である。図２５（ｂ）に示すように、路線図形式画面３０３２００は、路線３０３２０１と、中心駅３０３２０２と、関連駅３０３２０３と、を表示項目として有している。

　路線３０３２０１は、中心駅および関連駅が属する路線図である。具体的には、路線３０３２０１は、駅グループテーブル３０５の中心駅ＩＤ３０５０１および関連駅ＩＤリスト３０５０３から中心駅および関連駅のＩＤを取得し、駅情報３０７を参照して属する路線名を取得して、その路線図を取得することにより生成され、表示される。中心駅３０３２０２は、分析者が指定した中心駅を色分けすることにより表示される。具体的には、中心駅３０３２０２は、駅グループテーブル３０５の中心駅ＩＤ３０５０１から駅ＩＤを取得し、駅情報３０７を参照して駅名に変換して中心駅ごとに色を変えることにより表示される。関連駅３０３２０３は、駅グループテーブル３０５の関連駅ＩＤリスト３０５０３から関連駅のＩＤを取得し、駅情報３０７を参照して駅名に変換し、中心駅と同じ色でかつ中心駅との関連度の強さに応じた大きさにすることにより表示される。関連駅が複数の中心駅と関連を持っていれば、各中心駅への関連度の割合を算出し、割合に応じたパイ形式で色分けして表示する。

　図２５（ｂ）に示すように、路線図表示画面３０３２００は、駅間の地理的な関係を容易に把握できるので、中心駅の勢力範囲を視覚的に理解することが可能となる。

（iii）ネットワーク形式
　図２５（ｃ）は、駅グループ表示部３０３が表示する駅グループ表示画面の一例としてネットワーク形式で駅グループを表示した画面３０３３００である。図２５（ｃ）に示すように、ネットワーク形式画面３０３３００は、中心駅３０３３０１と、関連駅３０３３０２と、を表示項目として有している。

　中心駅３０３３０１は、分析者が指定した色によって中心駅を色分けすることにより表示される。具体的には、中心駅３０３３０１は、駅グループテーブル３０５の中心駅ＩＤ３０５０１から駅ＩＤを取得し、駅情報３０７を参照して駅名に変換して中心駅ごとに色を変えてノードとすることにより表示される。関連駅３０３３０２は、駅グループテーブル３０５の関連駅ＩＤリスト３０５０３から関連駅のＩＤを取得し、駅情報３０７を参照して駅名に変換して中心駅と同じ色でかつ中心駅との関連度の強さに応じた大きさのノードとすることにより表示され、また、中心駅へのリンクも併せて表示される。関連駅が複数の中心駅と関連を持っていれば、各中心駅への関連度の割合を算出し、割合に応じたパイ形式で色分けしたノードで表示し、中心駅へのリンクは複数表示する。

　図２５（ｃ）に示すように、ネットワーク表示画面３０３３００は、駅間の距離にかかわらず関連駅を配置し、複数の中心駅と関連を持つ駅がリンクによって明示的に表示されるので、中心駅間の競合関係の把握が容易となる。

　＜分析パラメタ＞
　第１の実施形態によるエリア分析装置１を用いて、分析者は以下のような項目を分析パラメタ（分析条件）として指定することが可能である。

（i）拠点データ生成期間
　上述の説明においては、拠点データを１カ月間のＩＣカード履歴から生成したが、その期間は半年や１年など長期間、あるいは１週間や１日など短期間、あるいは平日のみ、休日のみ、毎週水曜日なども可能である。

（ii）関連度データ生成対象者
　上述の説明においては、関連度データは、ＩＣカード履歴に出現した全利用者の拠点データから生成するようにしたが、その対象者をユーザ属性によって絞り込むことも可能である。具体的には、利用者の性別（女性のみ、男性のみ）、年代（２０代、３０代など）、住所（神奈川県在住のみ）のようなユーザ情報を参照した絞り込み、拠点のタイプ（ある駅を「仕事先」とする利用者など）や滞在回数（ある駅に「おでかけ」を月に４回以上している利用者など）など拠点データや滞在テーブルを参照した絞り込み、あるいはこれらの組み合わせた絞り込み（ある駅を「仕事先」とする３０代女性など）などが可能である。

（iii）関連度データ生成に用いる頻度
　上述の説明においては、駅の単独頻度および駅間の共起頻度は利用者の数でカウントするようにしたが、これに限られるものではなく、利用者が駅に滞在した回数で重みづけるなどが可能である。具体的には、利用者が駅に滞在した日数を単独頻度、一日においてある駅と他の駅の滞在が同時にあった日数を共起頻度としてもよい。

　＜分析例＞
　第１の本実施形態による分析装置１を用いて分析者は前記パラメタを指定することにより以下のような分析を実現することが可能である。

（i）小売業向け店舗展開戦略分析
　例えば、ある小売系企業において、当該企業がターゲットとしている２０～３０代女性に対象を絞り、当該企業が店舗を展開している駅についてどのような範囲から「おでかけ」目的で当該駅に来ているかその勢力範囲を抽出し、当該企業が店舗展開にあたって想定していた店舗のカバー範囲と一致するか検証したいというニーズがあるものとする。

　このニーズに対応するために、分析者は、ユーザ情報を用いてＩＣカード利用者のうち２０代～３０代女性に絞って関連度を計算し、当該企業が店舗を展開している駅を中心駅としてエリア分析条件を設定し駅の勢力範囲を抽出すればよい。当該企業が想定している店舗のカバー範囲と駅の勢力範囲がずれていれば、駅の勢力範囲に合わせて店舗の規模の拡大／縮小を図ることで、効率的な店舗展開を実現することができる。

（ii）飲食系企業向け広告戦略分析
　例えば、ある飲食系企業において、当該企業が店舗を有する駅の近隣駅にて何度でも使えるクーポン券を配布するのでどの範囲まで配布したらいいか顧客店舗がある駅の戦力範囲を知りたいという分析ニーズがあったとする。ただし、顧客リピート率の向上が今回のクーポン券の目的なので、日々鉄道を利用している人に対象を限定して勢力範囲を抽出するという条件があるものとする。

　このニーズに対応するために、分析者は、自宅最寄り駅の単独頻度が高い人を対象に関連度を計算して顧客店舗がある駅の勢力範囲を抽出すればよい。顧客企業は、鉄道移動の可能性が高い利用者に限定した駅の勢力範囲に従いクーポン券を配布することで、効率的な顧客リピート率の向上を図ることができる。

（iii）不動産業向け通勤圏分析
　例えば、ある不動産系企業において、都心のオフィス街に勤める人を対象としたマンションを開発するにあたり、前記都心のオフィス街に勤める人の通勤圏を知りたいという分析ニーズがあったとする。

　このニーズに対応するために、分析者は、１年間など長期間のＩＣカード履歴を用いて拠点データおよび関連度データを生成し、都心のオフィス街に位置する駅を中心駅とし関連タイプを「仕事」として駅の勢力範囲を抽出すればよい。これにより、当該オフィス街の通勤圏を抽出することができる。

（iv）エリアの勢力圏の時系列比較分析
　上記各分析において、駅の勢力範囲を抽出する際に用いたＩＣカード履歴の蓄積期間を変えることで駅の勢力範囲の時系列変化を分析することができる。一例として、ある大型の商業施設がオープンする前と後でその周辺の商業地の「おでかけ」に関する勢力範囲に変化があるか、あるとすればどの範囲の勢力（関連の強い駅）に変化があったか等を分析することができる。

（v）エリアの勢力圏のユーザ属性による比較分析
　上記各分析において、駅の勢力範囲を抽出する際に用いた拠点データの対象者をユーザ属性によって分割して駅間の関連度を計算することで、駅の勢力範囲をユーザ属性によって比較分析することができる。一例として、オフィス街にある駅の「仕事」に関する勢力範囲を利用者の性別によって比較することで、例えば女性の通勤圏が比較的都心寄りであるのに対して男性のほうが郊外まで通勤圏が広がっているなどの分析が可能となる。

（vi）広域エリアの俯瞰分析
　上述の説明においては、分析者が中心駅を指定してその勢力範囲を抽出する分析としたが、それに限られるものではなく、分析者が路線または地域を指定してその路線または地域に含まれる全駅を対象として駅をいくつかのグループに分割することも可能である。

　具体的には、分析者が分析条件の設定において路線または地域を指定すると、エリア分析部は駅情報を参照して指定された路線または住所が一致する駅を取得して駅リストを作成する。次に、頻度テーブルを参照して駅リストに含まれる駅のうち単独出現確率が高い駅を選択して中心駅とし、それ以外の駅を関連度駅の候補として最も関連度の高い中心駅のグループに分割する。このとき、どの中心駅とも関連度を持たない駅は、どの中心駅にも属さない特別なグループに分割する。また、路線／地域の指定では、全路線／全地域を対象とすることも可能である。これにより、ある路線や地域をいくつかのグループに分割することができ、路線や地域を俯瞰的に分析することができる。

　＜変形例＞
　第１の実施形態によるエリア分析装置１は、ＩＣカード利用履歴を用いて拠点データを生成して関連度データを生成、分析ニーズに応じて分析者がエリアを分析して分析レポートを出力する。このときＩＣカード利用履歴を蓄積・提供する主体と、分析を行う主体、および分析レポートを利用する主体はそれぞれ複数でもよい。図２６は、本発明の第１の実施形態の変形例によるシステム構成を示す図である。

　図２６に示すように、複数の鉄道会社がＩＣカード利用履歴１０３を蓄積し、分析サービス会社は蓄積されたＩＣカード利用履歴１０３を用いて比較的ニーズが高い分析条件を用いて定型的なエリア分析を行って分析レポートを生成し、複数の顧客会社は分析レポートを定期購入するといった構成も可能である。また、関連度データを作成するサービスを行う主体と、エリア分析によって分析レポートを作成して各顧客に提供する主体は異なっていてもよい。

（Ｃ）第２の実施形態
　本発明の実施形態２では、分析者がエリアの特性を分析し、広告などのコンテンツに対してその効果が期待される利用者または駅を選択して、コンテンツを配信するコンテンツ配信機能を有する構成例を説明する。なお、エリア分析装置１のハードウェアの構成は第１の実施形態と同じであるので、ここでは説明を省略する。

　＜システムの全体構成＞
　図２７は、第２の実施形態によるエリア分析装置（エリア分析システム）１の全体構成を示す図である。当該エリア分析装置１は、大きく次の４つの機能を有する。すなわち、拠点データル生成部１０、関連度データ生成部２０、エリア分析部３０、およびコンテンツ配信部９１である。拠点データ生成部１０、関連度データ生成部２０、およびエリア分析部３０は、上述の第１の実施形態と同様であるので詳細な説明は省略する。

　コンテンツ配信部９１は、エリア分析３０で絞り込んだ利用者または駅のＩＤに対して分析者が選択したコンテンツを配信する。配信条件９２は、コンテンツを配信する条件を格納したデータである。例えば関連タイプを「おでかけ」とするとき、ある駅の勢力範囲に含まれる駅のうち、いくつかを選択し、当該駅を自宅最寄り駅とし、かつ２０～３０代の利用者に広告コンテンツを配信するなどの条件を格納する。

　コンテンツテーブル９３は、配信するコンテンツを格納したデータである。コンテンツ９４は、コンテンツ配信部９１によってコンテンツテーブル９３から読み出され、利用者の携帯電話９５や駅のデジタルサイネージ９６に対して送信され、これらデバイスが表示するデータである。例えば、コーヒーショップのクーポン券などが考えられる。

　携帯電話９５は、交通系ＩＣカードの利用者の携帯電話であり、そのｅ－ｍａｉｌアドレスはユーザ情報３０６に格納されているものとする。

　デジタルサイネージ９６は、駅のコンコースなどに設置された情報提供装置であり、その設置場所は駅情報３０７に格納された場所と紐づいているものとする。すなわち、駅情報３０７にｅ－ｍａｉｌアドレスが格納されるものとし、そのアドレスにコンテンツ９４を送信すると、当該駅に設置されたデジタルサイネージにコンテンツが表示される。

　以上のように、第２の実施形態によるエリア性分析装置１は、エリアの分析結果に基づき、利用者または場所に適したコンテンツを配信することができる。

　＜変形例＞
　第２の実施形態によるエリア分析装置（エリア分析システム）１は、ＩＣカード利用履歴を用いて拠点データを生成して関連度データを生成し、分析ニーズに応じて分析者がエリアを分析し、設定されたコンテンツの配信条件およびエリア分析結果に基づいて、広告などのコンテツを利用者または駅のデジタルサイネージなどに配信する。このとき、ＩＣカード利用履歴を蓄積・提供する主体と、分析を行う主体、コンテンツを配信する主体、および分析およびコンテンツの配信を依頼する主体は異なってもよい。

　図２８は、第２の実施形態の変形例によるシステム構成を示す図である。図２８に示すように、鉄道会社がＩＣカード利用履歴１０３を蓄積し、分析サービス会社が顧客会社の依頼に従い蓄積されたＩＣカード利用履歴１０３を用いてエリア分析を行ってコンテンツの配信条件を設定し、さらにコンテンツ配信会社は顧客会社の依頼に従いコンテンツを利用者または駅のデジタルサイネージに配信するといった構成も可能である。

（Ｄ）まとめ
（１）以上、本発明者によってなされた発明を実施形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。例えば、ある実施形態における構成を他の実施形態において組み合わせたり、置き換えたりすることができる。

（２）本発明では、エリア分析装置は、人集団の移動履歴を含む履歴データ（実施形態では、ＩＣカードの利用履歴であったが、これに限られず、携帯電話や自動車等における移動履歴であっても良い）と予め用意された滞在場所のカテゴリデータ（自宅、仕事、おでかけ、レジャー等：各カテゴリデータは、図１８で示される抽出ルールによって、履歴データを分類することができるようになっている）とを照合することにより、人集団に属する人物の滞在場所を抽出する。また、エリア分析装置は、抽出した滞在場所における、人集団に含まれる個人毎の滞在頻度を求め、当該個人毎の滞在頻度に基づいて、予め用意された滞在目的別に各個人の拠点となっている場所を推定し、個人毎の滞在目的別の拠点の情報に基づいて、滞在目的別に個人毎の場所間の移動量を集計する。そして、エリア分析装置は、個人毎の滞在目的別の場所間の移動量の情報に基づいて、滞在目的別の場所同士がどの程度密接に関連しているかと示す関連度を算出し、算出した関連度の情報を提供する。このようにすることにより、各個人の拠点としている場所（自宅や職場に最も近い駅やショッピング場所の駅）の相互間の関連性（例えば、ある利用者の自宅がある駅と頻繁にショッピングする場所が存在する駅との関連性が高いという情報）を提供することができ、この情報の被提供者は、様々なマーケット戦略を取ることができるようになる。

　また、関連度の情報だけではなく、それを加工して得られるエリアの勢力範囲の情報も提供するようにしても良い（エリア分析処理）。より具体的には、エリア分析装置は、関連度の情報に基づいて、分析対象とする場所にどの程度の範囲から人が訪れているかを示す勢力範囲の情報を生成し、それを提供する。このようにすることにより、情報の被提供者は、関連度の情報からさらなる加工をすることなく、提供された情報を直ぐにマーケット戦略のために用いることができるようになる。

　具体的には、エリア分析処理において、場所、滞在目的、及び期間の指定を受け取り、指定された期間の指定された滞在目的における指定された場所に対して関連度が高い場所を抽出して勢力範囲とする。或いは、複数の場所の指定を受け取り、当該指定された複数の場所に対して関連度が高い場所をそれぞれ抽出して勢力範囲とし、指定された複数の場所の勢力範囲を地図上に表示またはネットワーク形式で表示することにより、勢力範囲の情報を提供するようにしても良い。或いは、複数の期間の指定を受け取り、当該指定された複数の期間において関連度が高い場所をそれぞれ抽出して勢力範囲とし、指定された複数の期間における勢力範囲を地図上に表示またはネットワーク形式で表示することにより、勢力範囲の情報を提供するようにしても良い。或いは、複数の滞在目的の指定を受け取り、当該指定された複数の滞在目的に関して関連度が高い場所をそれぞれ抽出して勢力範囲とし、指定された複数の滞在目的に関する勢力範囲を地図上に表示またはネットワーク形式で表示することにより、勢力範囲の情報を提供するようにしても良い。このようにすることにより、各場所間の関係をより明確に理解することができるようになる。

　さらに、エリア分析装置は、エリアの指定を受け取り、当該指定されたエリアに含まれる特定の場所を抽出し、抽出した特定の場所のうちで、個人毎の滞在頻度を参照することにより滞在頻度が高い場所を中心となる場所に設定し、残りの場所については中心となる場所のうち最も関連度の高い場所に割り付けることにより、指定されたエリアを勢力範囲で分割して表示する。このようにすることにより、広域エリアを俯瞰的に分析した情報を提供することができるようになる。

（３）本発明は、実施形態の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をシステム或は装置に提供し、そのシステム或は装置のコンピュータ（又はＣＰＵやＭＰＵ）が記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ハードディスク、光ディスク、光磁気ディスク、ＣＤ－Ｒ、磁気テープ、不揮発性のメモリカード、ＲＯＭなどが用いられる。

　また、プログラムコードの指示に基づき、コンピュータ上で稼動しているＯＳ（オペレーティングシステム）などが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。さらに、記憶媒体から読み出されたプログラムコードが、コンピュータ上のメモリに書きこまれた後、そのプログラムコードの指示に基づき、コンピュータのＣＰＵなどが実際の処理の一部又は全部を行い、その処理によって前述した実施の形態の機能が実現されるようにしてもよい。

　さらに、実施の形態の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することにより、それをシステム又は装置のハードディスクやメモリ等の記憶手段又はＣＤ－ＲＷ、ＣＤ－Ｒ等の記憶媒体に格納し、使用時にそのシステム又は装置のコンピュータ（又はＣＰＵやＭＰＵ）が当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしても良い。

　最後に、ここで述べたプロセス及び技術は本質的に如何なる特定の装置に関連することはなく、コンポーネントの如何なる相応しい組み合わせによってでも実装できることを理解する必要がある。更に、汎用目的の多様なタイプのデバイスがここで記述した教授に従って使用可能である。ここで述べた方法のステップを実行するのに、専用の装置を構築するのが有益であることが判るかもしれない。また、実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。本発明は、具体例に関連して記述したが、これらは、すべての観点に於いて限定の為ではなく説明の為である。本分野にスキルのある者には、本発明を実施するのに相応しいハードウェア、ソフトウェア、及びファームウエアの多数の組み合わせがあることが解るであろう。例えば、記述したソフトウェアは、アセンブラ、Ｃ／Ｃ＋＋、ｐｅｒｌ、Ｓｈｅｌｌ、ＰＨＰ、Ｊａｖａ（登録商標）等の広範囲のプログラム又はスクリプト言語で実装できる。

　さらに、上述の実施形態において、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていても良い。

　加えて、本技術分野の通常の知識を有する者には、本発明のその他の実装がここに開示された本発明の明細書及び実施形態の考察から明らかになる。記述された実施形態の多様な態様及び／又はコンポーネントは、データを管理する機能を有するコンピュータ化ストレージシステムに於いて、単独又は如何なる組み合わせでも使用することが出来る。明細書と具体例は典型的なものに過ぎず、本発明の範囲と精神は後続する請求範囲で示される。

１　エリア分析装置（エリア分析システム）
１０　拠点データ生成部
２０　関連度データ生成部
３０　エリア分析部
９１　コンテンツ配信部
９２　コンテンツテーブル
１０１　滞在抽出部
１０２　拠点推定部
１０３　ＩＣカード利用履歴
１０４　滞在テーブル
１０５　駅頻度テーブル
１０６　拠点データ
２０１　頻度カウント部
２０２　関連度計算部
２０３　頻度テーブル
２０４　関連度データ
３０１　エリア分析条件設定部
３０２　駅グループ生成部
３０３　駅グループ表示部
３０４　分析条件
３０５　駅グループテーブル
３０６　ユーザ情報
３０７　駅情報

Claims

　人集団の移動履歴を含む履歴データを格納する記憶装置と、
　前記記憶装置から前記履歴データを読み込み、所定の処理を実行するプロセッサと、を有し、
　前記プロセッサは、
　　前記履歴データと予め用意された滞在場所のカテゴリデータとを照合することにより、前記人集団に属する人物の滞在場所を抽出する滞在抽出処理と、
　　前記滞在抽出処理によって抽出した前記滞在場所における、前記人集団に含まれる個人毎の滞在頻度を求め、当該個人毎の滞在頻度に基づいて、予め用意された滞在目的別に各個人の拠点となっている場所を推定する拠点推定処理と、
　　前記個人毎の滞在目的別の拠点の情報に基づいて、前記滞在目的別に前記個人毎の場所間の移動量を集計する頻度カウント処理と、
　　前記個人毎の滞在目的別の場所間の移動量の情報に基づいて、前記滞在目的別の場所同士がどの程度密接に関連しているかと示す関連度を算出する関連度計算処理と、
　　前記算出した関連度の情報を提供する情報提供処理と、
を実行することを特徴とする情報分析システム。
　請求項１において、
　前記プロセッサは、さらに、前記関連度の情報に基づいて、分析対象とする場所にどの程度の範囲から人が訪れているかを示す勢力範囲の情報を生成するエリア分析処理を実行し、前記勢力範囲の情報を提供することを特徴とする情報分析システム。
　請求項２において、
　前記プロセッサは、前記滞在抽出処理において、前記履歴データが記述している前記移動履歴の発生場所、発生時間帯、および継続時間に基づいて、移動先の滞在目的を推定することにより前記履歴データから前記滞在目的に対応する前記滞在場所を抽出することを特徴とする情報分析システム。
　請求項２において、
　前記プロセッサは、前記エリア分析処理において、場所、滞在目的、及び期間の指定を受け取り、前記指定された期間の前記指定された滞在目的における前記指定された場所に対して前記関連度が高い場所を抽出して勢力範囲とすることを特徴とする情報分析システム。
　請求項２において、
　前記プロセッサは、前記エリア分析処理において、複数の場所の指定を受け取り、当該指定された複数の場所に対して前記関連度が高い場所をそれぞれ抽出して勢力範囲とし、前記指定された複数の場所の勢力範囲を地図上に表示またはネットワーク形式で表示することにより、前記勢力範囲の情報を提供することを特徴とする情報分析システム。
　請求項２において、
　前記プロセッサは、前記エリア分析処理において、複数の期間の指定を受け取り、当該指定された複数の期間において前記関連度が高い場所をそれぞれ抽出して勢力範囲とし、前記指定された複数の期間における勢力範囲を地図上に表示またはネットワーク形式で表示することにより、前記勢力範囲の情報を提供することを特徴とする情報分析システム。
　請求項２において、
　前記プロセッサは、前記エリア分析処理において、複数の滞在目的の指定を受け取り、当該指定された複数の滞在目的に関して前記関連度が高い場所をそれぞれ抽出して勢力範囲とし、前記指定された複数の滞在目的に関する勢力範囲を地図上に表示またはネットワーク形式で表示することにより、前記勢力範囲の情報を提供することを特徴とする情報分析システム。
　請求項２において、
　前記プロセッサは、前記エリア分析処理において、エリアの指定を受け取り、当該指定されたエリアに含まれる特定の場所を抽出し、前記個人毎の滞在頻度を参照して前記抽出した特定の場所のうち、滞在頻度が高い場所を中心となる場所に設定し、残りの場所については前記中心となる場所のうち最も関連度の高い場所に割り付けることにより、前記指定されたエリアを勢力範囲で分割して表示することを特徴とする情報分析システム。
　プロセッサによって人集団の移動履歴を含む履歴データを分析し、当該分析結果を提供する情報分析方法であって、
　前記プロセッサが、前記履歴データと予め用意された滞在場所のカテゴリデータとを照合することにより、前記人集団に属する人物の滞在場所を抽出する滞在抽出処理ステップと、
　前記プロセッサが、前記滞在抽出処理ステップで抽出した前記滞在場所における、前記人集団に含まれる個人毎の滞在頻度を求め、当該個人毎の滞在頻度に基づいて、予め用意された滞在目的別に各個人の拠点となっている場所を推定する拠点推定処理ステップと、
　前記プロセッサが、前記個人毎の滞在目的別の拠点の情報に基づいて、前記滞在目的別に前記個人毎の場所間の移動量を集計する頻度カウント処理ステップと、
　前記プロセッサが、前記個人毎の滞在目的別の場所間の移動量の情報に基づいて、前記滞在目的別の場所同士がどの程度密接に関連しているかと示す関連度を算出する関連度計算処理ステップと、
　前記プロセッサが、前記算出した関連度の情報を提供する情報提供処理ステップと、
を含むことを特徴とする情報分析方法。
　請求項９において、
　さらに、前記プロセッサが、前記関連度の情報に基づいて、分析対象とする場所にどの程度の範囲から人が訪れているかを示す勢力範囲の情報を生成するエリア分析処理を実行し、前記勢力範囲の情報を提供するエリア分析処理ステップを含むことを特徴とする情報分析方法。
　請求項１０において、
　前記プロセッサは、前記滞在抽出処理ステップにおいて、前記履歴データが記述している前記移動履歴の発生場所、発生時間帯、および継続時間に基づいて、移動先の滞在目的を推定することにより前記履歴データから前記滞在目的に対応する前記滞在場所を抽出することを特徴とする情報分析方法。
　請求項１０において、
　前記プロセッサは、前記エリア分析処理ステップにおいて、場所、滞在目的、及び期間の指定を受け取り、前記指定された期間の前記指定された滞在目的における前記指定された場所に対して前記関連度が高い場所を抽出して勢力範囲とすることを特徴とする情報分析方法。
　請求項１０において、
　前記プロセッサは、前記エリア分析処理ステップにおいて、複数の場所又は複数の期間の指定を受け取り、当該指定された複数の場所又は複数の期間に対して前記関連度が高い場所をそれぞれ抽出して勢力範囲とし、前記指定された複数の場所又は複数の期間の勢力範囲を地図上に表示またはネットワーク形式で表示することにより、前記勢力範囲の情報を提供することを特徴とする情報分析システム。
　請求項１０において、
　前記プロセッサは、前記エリア分析処理ステップにおいて、複数の滞在目的の指定を受け取り、当該指定された複数の滞在目的に関して前記関連度が高い場所をそれぞれ抽出して勢力範囲とし、前記指定された複数の滞在目的に関する勢力範囲を地図上に表示またはネットワーク形式で表示することにより、前記勢力範囲の情報を提供することを特徴とする情報分析方法。
　請求項１０において、
　前記プロセッサは、前記エリア分析処理ステップにおいて、エリアの指定を受け取り、当該指定されたエリアに含まれる特定の場所を抽出し、前記個人毎の滞在頻度を参照して前記抽出した特定の場所のうち、滞在頻度が高い場所を中心となる場所に設定し、残りの場所については前記中心となる場所のうち最も関連度の高い場所に割り付けることにより、前記指定されたエリアを勢力範囲で分割して表示することを特徴とする情報分析方法。