JP5929231B2 - 算出装置、プログラム及び算出方法 - Google Patents

算出装置、プログラム及び算出方法 Download PDF

Info

Publication number
JP5929231B2
JP5929231B2 JP2012012448A JP2012012448A JP5929231B2 JP 5929231 B2 JP5929231 B2 JP 5929231B2 JP 2012012448 A JP2012012448 A JP 2012012448A JP 2012012448 A JP2012012448 A JP 2012012448A JP 5929231 B2 JP5929231 B2 JP 5929231B2
Authority
JP
Japan
Prior art keywords
station
log
time
ticket gate
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012012448A
Other languages
English (en)
Other versions
JP2013152567A (ja
Inventor
克久 中里
克久 中里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012012448A priority Critical patent/JP5929231B2/ja
Publication of JP2013152567A publication Critical patent/JP2013152567A/ja
Application granted granted Critical
Publication of JP5929231B2 publication Critical patent/JP5929231B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Navigation (AREA)
  • Devices For Checking Fares Or Tickets At Control Points (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、鉄道利用者数を算出する算出装置、プログラム及び算出方法に関する。
鉄道におけるダイヤ改正、各種設備設置等の事業計画を作成するために、鉄道の利用状況が調査される。そこで、利用者が改札を通過した記録に基づいて、鉄道の利用状況又は利用者数を把握する技術がある(例えば、特許文献1)。
特開平11−165637号公報
しかしながら、利用者が改札を通過した記録からは、入場駅、出場駅、入場駅構内への入場時刻及び出場駅構内からの出場時刻が判明するだけであり、入場から出場までの間における利用者の詳細な行動は不明である。そのため、利用者が改札を通過した記録を単純に利用するだけでは、正確な鉄道の利用状況を把握することはできない。
本発明は斯かる事情に鑑みてなされたものである。その目的は、改札記録に基づいて鉄道利用者数を正確に算出することができる算出装置、プログラム及び算出方法を提供することである。
本願による開示の一観点は、鉄道における改札の通過記録に基づいて、鉄道の利用者数を算出する算出装置において、複数の利用者が入場駅の改札を通過した入場時刻及び出場駅の改札を通過した出場時刻を含む通過記録、列車の運行時刻情報、路線の接続関係の情報、鉄道における設備の情報及び利用者数の統計データが記憶された記憶部と、該記憶部に記憶された通過記録、運行時刻情報及び路線の接続関係の情報に基づいて、前記通過記録に係る利用者の便への乗車又は駅の改札内における所定時間以上の滞在に係る、前記通過記録を充足する行動パターンを一又は複数生成する生成部と、前記記憶部に記憶された設備の情報、通過記録又は利用者数の統計データに基づいて、前記生成部が生成した行動パターンに対応する行動を利用者が実行した確率を計算する計算部と、該計算部が計算した確率に基づいて、前記生成部が生成した行動パターンに応じた鉄道の利用者数を算出する算出部とを備える。
本願による開示の一観点によれば、改札記録に基づいて鉄道利用者数を正確に算出することができる。
鉄道利用者数算出システムの構成例を示すブロック図である。 算出装置のハードウェア構成例を示すブロック図である。 改札ログテーブルのレコードレイアウトの一例を示す説明図である。 最短移動時間テーブルのレコードレイアウトの一例を示す説明図である。 運行記録テーブルのレコードレイアウトの一例を示す説明図である。 路線テーブルのレコードレイアウトの一例を示す説明図である。 駅設備規模係数テーブルのレコードレイアウトの一例を示す説明図である。 駅テーブル及び売上テーブルのレコードレイアウトの一例を示す説明図である。 鉄道利用指標テーブルのレコードレイアウトの一例を示す説明図である。 算出装置の機能構成例を示す機能ブロック図である。 鉄道利用者数算出処理の手順の一例を示すフローチャートである。 確定ログを説明するための説明図である。 確定ログを説明するための説明図である。 確定ログを説明するための説明図である。 確定ログを説明するための説明図である。 路線確定ログを説明するための説明図である。 路線確定ログを説明するための説明図である。 路線確定ログを説明するための説明図である。 路線確定ログを説明するための説明図である。 路線確定ログを説明するための説明図である。 限定ログを説明するための説明図である。 限定ログを説明するための説明図である。 限定ログを説明するための説明図である。 限定ログを説明するための説明図である。 限定ログに基づいて生成された各行動パターンに対する確率計算要素を一覧表示した説明図である。 非限定ログを説明するための説明図である。 非限定ログを説明するための説明図である。 非限定ログを説明するための説明図である。 非限定ログを説明するための説明図である。 場合分け処理の手順の一例を示すフローチャートである。 路線確定ログ処理の手順の一例を示すフローチャートである。 非限定ログ処理の手順の一例を示すフローチャートである。 非限定ログに基づいた集計処理の手順の一例を示すフローチャートである。 限定ログ処理の手順の一例を示すフローチャートである。 類似ログ抽出処理の手順の一例を示すフローチャートである。 重み付与処理の手順の一例を示すフローチャートである。
以下、実施の形態をその図面に基づいて説明する。本実施の形態に係る算出装置(コンピュータ)は、改札ログに基づいて、交通機関の利用者数を算出する。ここでの交通機関は、鉄道、地下鉄、モノレール等を含む。改札ログは、自動改札機からネットワークを介してサーバに送信される改札の通過記録である。算出装置は、サーバから改札ログを取得することができるコンピュータであり、PC(パーソナルコンピュータ)、ノート型PC、ワークステーション、汎用コンピュータ等である。以下では、算出装置の例として、鉄道の利用者数を算出するワークステーションを挙げて説明する。なお、算出装置は、自動改札機から送信された改札ログを記憶するサーバであってもよいことは勿論である。
図1は、鉄道利用者数算出システムの構成例を示すブロック図である。
鉄道利用者数算出システムは、複数の自動改札機1、サーバ2及び算出装置3を含む。自動改札機1、サーバ2及び算出装置3は、夫々通信機能を有し、互いにネットワークNを介して接続されている。ネットワークNは、専用通信回線、WAN(Wide Area Network)、インターネット、衛星通信回線、電話通信回線等である。
自動改札機1は、駅に設置された改札機であり、改札内に入場するための改札機と改札外に出場するための改札機との2種がある。なお、自動改札機1は、入出場両用の改札機を含んでもよい。図1では、1つの自動改札機1が示されているが、自動改札機1は複数の駅に設置されており、その数は複数である。
自動改札機1は、利用者が自動改札機1を通過する際に、乗車券、入場券、乗車回数券、定期券、電子決済カード等に記録された情報を読み取る。自動改札機1は、乗車券等から読み取った情報、改札通過日時、入出場の区別及び自身の識別情報を、ネットワークNを介してサーバ2に送信する。
なお、乗車券等から読み取られる情報は、例えば磁気記録面、半導体メモリ等によって乗車券等に記録されている。また、改札通過日時は、サーバ2が自動改札機1から改札の通過記録を受信した日時でもよい。
サーバ2は、例えばワークステーションであり、その記憶装置にデータベースを有する。サーバ2は、自動改札機1から各種情報を受信し、受信した情報を改札ログとしてデータベースに格納する。ここでの改札ログは、乗車券等の識別情報と、入場駅及び入場時刻並びに出場駅及び出場時刻とを含む。サーバ2は、データベースに保有している改札ログを、ネットワークNを介して算出装置3に送信する。
自動改札機1が定期券又は電子決済カードに記録された情報を読み取った場合、通過記録には夫々当該定期券又は電子決済カードの識別情報も含まれる。サーバ2のデータベースは、定期券及び電子決済カードの属性情報が記憶されたテーブルを含む。そのため、サーバ2は、利用者が定期券又は電子決済カードにより自動改札機1を通過した場合、当該利用者の氏名、性別、生年月日等の属性情報を抽出することができる。
サーバ2のデータベースは、駅の施設に関する情報が記憶されたテーブルを含む。そのため、サーバ2は、利用者が電子決済カードにより駅構内に設置された設備を利用した場合、当該利用者の属性情報に加えて、利用された設備の属性情報も抽出することができる。
サーバ2は、利用者の属性情報又は駅の設備の属性情報を抽出した場合、抽出した当該属性情報も、ネットワークNを介して算出装置3に送信する。また、サーバ2は、利用者が電子決済カードにより駅構内に設置された設備を利用した場合、設備の利用日時もネットワークNを介して算出装置3に送信する。
図2は、算出装置3のハードウェア構成例を示すブロック図である。算出装置3は、CPU(Central Processing Unit、制御部、生成部、計算部、算出部、受付部、第一判定部、第二判定部、抽出部、重み付与部、第二生成部、対応付け部)31を含む。また、算出装置3は、RAM(Random Access Memory)32、ROM(Read Only Memory)33、ハードディスク(記憶部)34、ディスクドライブ35、通信部36、タイマ37、表示部38及び操作部39を含む。算出装置3の各構成部は、バス3bを介して接続されている。
CPU31は、算出装置3の各構成部を制御する。CPU31は、ハードディスク34に記憶されたプログラム1Pを読み込み、当該プログラム1Pを実行する。
RAM32は、CPU31による処理の過程で必要な作業変数、データ等を一時的に記録する。なお、RAM32は、主記憶装置の一例であり、RAM32の代わりにフラッシュメモリ、メモリカード等が用いられてもよい。
ROM33は、例えば不揮発性の半導体メモリ又は半導体メモリ以外の読み出し専用記憶媒体である。ROM33は、算出装置3の起動時にCPU31が実行するBIOS(BasicInput/Output System)、ファームウェア等を記録している。
ハードディスク34は、CPU31が実行するプログラム1Pを記憶している。ハードディスク34は、算出装置3内部に取り付けられるものであっても、算出装置3外部に置かれるものであってもよい。なお、ハードディスク34は補助記憶装置の一例であり、大容量の情報の記録が可能なフラッシュメモリ、CD(Compact Disc)、DVD(Digital Versatile Disk)、BD(Blu-ray Disc、登録商標)等の光ディスク3aにより代替されてもよい。
ハードディスク34は、各種マスタテーブルを記憶している。各種マスタテーブルは、改札ログテーブル1T、最短移動時間テーブル2T、運行記録テーブル3T、路線テーブル4T、駅設備規模係数テーブル5T及び鉄道利用指標テーブル6Tを含む。
また、ハードディスク34は、図示しない作業用のテーブルを記憶している。
ディスクドライブ35は、外部の記録媒体である光ディスク3aから情報を読み込み、光ディスク3aに情報を記録する。
通信部36は、モデム又はLAN(Local Area Network)カード等であり、ネットワークNに接続されている。
タイマ37は、日時を計時し、計時した結果を信号としてCPU31に送信する。
表示部38は、例えば液晶ディスプレイ、有機EL(Electro-Luminescence)ディスプレイ等の画面を有し、CPU31からの指示に従って、プログラム1Pに係る様々な画面を表示する。
操作部39は、ユーザが各種の入力を行うキーボード、マウス、タッチパネル等の入力デバイスを含む。操作部39は、ユーザによる操作に基づいて入力信号を生成する。生成された入力信号は、バス3bを介してCPU31に送信される。
次に、ハードディスク34が記憶している各種マスタテーブルについて詳細に説明する。
図3は、改札ログテーブル1Tのレコードレイアウトの一例を示す説明図である。改札ログテーブル1Tは、自動改札機1が乗車券等から読み取り、サーバ2に送信した改札ログを登録するテーブルである。算出装置3は、サーバ2から改札ログを受信し、受信した改札ログを改札ログテーブル1Tに登録する。
改札ログテーブル1Tは、カードID、改札通過データ及び日時の各列を含む。カードIDは、自動改札機1が読み取った乗車券、入場券、乗車回数券、定期券、電子決済カード等の識別記号である。乗車券、入場券及び乗車回数券の識別記号は、発券機等が各券に付与した識別記号である。定期券の識別記号は、鉄道事業者の発券システムが定期券に付与した識別記号である。電子決済カードの識別記号は、当該電子決済カードを発行した事業者のシステムが当該電子決済カードに付与した識別記号である。
改札通過データは、自動改札機1が設置された駅の駅名及び入出場の区別である。日時は、利用者が自動改札機1を通過した日時である。日時のフォーマット形式は、例えばyyyy/mm/dd hh:mm:ssである。
例えば、図3の改札ログテーブル1Tから、カードID=ID001の券により鉄道を利用した利用者は、次の行動を取ったことがわかる。当該利用者は、20XX年4月1日12時30分14秒にA駅に入場し、20XX年4月1日15時39分52秒にB駅から出場した。また、当該利用者は、20XX年4月2日9時7分39秒にB駅に入場し、20XX年4月2日12時58分3秒にC駅から出場した。
図4は、最短移動時間テーブル2Tのレコードレイアウトの一例を示す説明図である。最短移動時間テーブル2Tは、入場駅から出場駅までの区間を列車で移動する場合、その最短移動時間を路線別に登録するテーブルである。
最短移動時間テーブル2Tは、路線、区間及び最短移動時間の各列を含む。路線は、路線名である。なお、途中駅で路線の乗り換えが可能な場合、路線列にはi線→k線のように、乗り換え前の路線、矢印及び乗り換え後の路線が格納される。矢印は、乗り換え順序を示している。区間は、利用者が列車に乗車した区間である。区間には、入場駅、矢印及び出場駅が登録される。矢印は、列車の移動方向を示している。最短移動時間は、路線及び区間に係る最短移動時間である。例えば、利用者が急行電車を利用した場合、各停電車よりも短時間で出場駅に到達するとき、最短移動時間には利用者が急行電車を利用した場合の所要時間が登録される。また、入場駅から出場駅までの移動の間に、途中下車が可能な途中駅が存在する場合、最短移動時間には利用者が途中下車せずに、移動したときの所要時間が登録される。
図5は、運行記録テーブル3Tのレコードレイアウトの一例を示す説明図である。運行記録テーブル3Tは、日付別、路線別かつ便別の列車が運行した時刻を登録するテーブルである。なお、ハードディスク34は、運行記録テーブル3Tの代わりに時刻表を記憶していてもよい。かかる場合、算出装置3は、時刻表を用いて列車の発着時刻を参照する。
運行記録テーブル3Tは、年月日、路線、便名、始発駅発時刻、途中駅着/発時刻及び終着駅到着時刻の各列を含む。年月日は、列車が運行した年月日である。年月日のフォーマット形式は、例えばyyyy/mm/ddである。路線は、路線名である。便名は、運行した列車の名称である。始発駅発時刻は、始発駅の名称及び発車時刻である。発車時刻のフォーマット形式は、例えばhh:mmである。途中駅着/発時刻は、便が始発駅と到着駅との間に途中停車する駅がある場合、その停車する途中駅名並びに到着時刻及び発車時刻である。到着時刻及び発車時刻のフォーマット形式は、例えばhh:mmである。図5の運行記録テーブル3Tの例では、途中駅着/発時刻は1列のみであるが、途中停車の駅が複数である場合、その数だけ途中駅着/発時刻の列数が用意される。終着駅到着時刻は、終着駅の名称及び到着時刻である。到着時刻のフォーマット形式は、例えばhh:mmである。
なお、途中停車駅における到着時刻及び発車時刻が分レベルで同一である場合、到着時刻及び発車時刻のいずれか一方の時刻が途中駅着/発時刻に登録される。図5の先頭レコードの途中駅着/発時刻は、到着時刻及び発車時刻が分レベルで同一である場合を示している。到着時刻及び発車時刻が分レベルで異なる場合、途中駅着/発時刻には到着時刻及び発車時刻の両方の時刻が登録されてもよいし、いずれか一方の時刻が登録されてもよい。便が途中停車駅を有さない列車である場合、途中駅着/発時刻列は空欄である。図5の2行目及び3行目のレコードは、便が途中停車駅を有さない列車である場合を例示している。
図6は、路線テーブル4Tのレコードレイアウトの一例を示す説明図である。路線テーブル4Tは、路線の接続関係を登録するテーブルである。路線テーブル4Tは、例えば駅毎に接続している路線を登録するテーブルである。
路線テーブル4Tは、駅名、路線1、路線2、路線3、…路線nの各列を含む。駅名は、駅の名称である。路線1、路線2、路線3、…路線nは、駅名の駅で接続している路線の名称である。例えば図6のA駅では、i線、j線及びk線の3路線が接続されている。従って、A駅では、これら3路線間において列車の乗り換えが可能である。例えば図6のD駅で接続している路線は、j線のみである。従って、D駅では、路線間の列車の乗り換えはない。
なお、ここでの列車の乗り換えは、改札内における列車の乗り換えである。算出装置3は、利用者が自動改札機1を通過して改札から出場した場合、鉄道利用者数算出システムが関与しない他の鉄道事業者の列車への乗り換えを考慮しない。
また、路線の接続関係が運行記録テーブル3T又は時刻表から抽出可能である場合、路線テーブル4Tはなくてもよい。
図7は、駅設備規模係数テーブル5Tのレコードレイアウトの一例を示す説明図である。駅設備規模係数テーブル5Tは、駅に設置されている設備の規模又は内容を登録するテーブルである。なお、駅設備規模係数テーブル5Tは、鉄道の設備を登録するテーブルの一例である。他の鉄道の設備として、例えば列車内の無線LANスポット、トイレ、公衆電話、案内表示器等がある。
駅設備規模係数テーブル5Tは、駅ID、駅名及び改札内店舗数の各列を含む。駅IDは、駅を識別する識別記号である。駅名は、駅の名称である。改札内店舗数は、改札内に設置された店舗の数である。
図7は、駅設備の規模を店舗の数で代表している。しかし、駅設備規模係数テーブル5Tが示す駅設備の規模は、改札内に設置された自動販売機の台数、待合施設の総床面積等でもよい。また、駅設備の規模は、トイレの設置数、貼付等された広告枚数、広告売上、自動体外式除細動器(AED)の設置数、無線LANスポットの設置数等でもよい。更には、駅設備の規模は、複数の設備の組み合わせでもよい。
図8は、駅テーブル51T及び売上テーブル52Tのレコードレイアウトの一例を示す説明図である。図8Aは、駅テーブル51Tのレコードレイアウトの一例を示す説明図である。図8Bは、売上テーブル52Tのレコードレイアウトの一例を示す説明図である。図8Aの駅テーブル51T及び図8Bの売上テーブル52Tは、結合されることにより駅設備規模係数テーブル5Tを構成するテーブル例である。図8の駅テーブル51T及び売上テーブル52Tでは、駅設備の規模が改札内の店舗における売上金額で代表されている。
駅テーブル51Tは、駅ID及び駅名の各列を含む。駅ID及び駅名は、夫々図8の駅設備規模係数テーブル5Tの駅ID及び駅名と同じである。売上テーブル52Tは、店舗ID、駅ID、店舗名及び平均売上の各列を含む。店舗IDは、改札内の店舗を識別する識別記号である。駅IDは、図8の駅設備規模係数テーブル5Tの駅IDと同じである。店舗名は店舗の名称である。平均売上は、所定期間における店舗の総売上金額に基づく平均売上金額である。平均売上は、例えば過去1年間の総売上金額を月当たりの平均金額に換算したものである。平均売上の単位は、例えば円である。
駅テーブル51Tの駅IDと売上テーブル52Tの駅IDとは、関連付けられている。従って、駅テーブル51Tと売上テーブル52Tとを結合することにより、改札内の店舗における売上金額で駅設備の規模を代表する駅設備規模係数テーブル5Tが構築される。
図9は、鉄道利用指標テーブル6Tのレコードレイアウトの一例を示す説明図である。鉄道利用指標テーブル6Tは、マクロ的に計測された路線別の列車乗客数を登録するテーブルである。
鉄道利用指標テーブル6Tは、路線ID、路線名及び1日平均乗客数の各列を含む。路線IDは、路線を識別する識別記号である。路線名は、路線の名称及び列車の進行方向である。進行方向は、例えば上り及び下りで区別される。1日平均乗客数は、所定期間における全便の全乗客数に基づく1日当たりの平均乗客数である。1日平均乗客数は、例えば路線の全便について過去1年間の総乗客数を1日当たりの平均乗客数に換算したものである。1日平均乗客数の元となるデータは、限定された観察位置における駅員の目視観察、カメラ映像等から推定された鉄道利用者数である。
なお、鉄道利用指標テーブル6Tには、路線別の平均乗客数より詳しい、便別の平均乗客数も登録されてよい。
また、鉄道利用指標テーブル6Tは、更に駅ID、駅名及び1日平均駅利用者数の各列を含んでもよい。駅ID及び駅名は、夫々駅設備規模係数テーブル5Tの駅ID及び駅名と同じである。1日平均駅利用者数は、所定期間における1日当たりの平均駅利用者数である。1日平均駅利用者数は、例えば自動改札機1を通過した過去1年間の利用者数を1日当たりの平均利用者数に換算したものである。
鉄道利用指標テーブル6Tは、季節別又は1日の時間帯別の各路線平均乗客数又は各駅平均利用者数のデータを含んでもよい。
次に、算出装置3の動作について説明する。算出装置3は、指定された日時に、基本的に1件の改札ログに対応する1人の利用者が各便又は各駅にいた確率を求める。そして、算出装置3は、指定された日時に、処理対象である全ての改札ログに対応する利用者が各便又は各駅にいた確率に基づいて、鉄道利用者数算出システムが対象とする各便に乗車していた利用者及び各駅にいた利用者の数を算出する。
図10は、算出装置3の機能構成例を示す機能ブロック図である。図10の各機能部は、CPU31がハードディスク34に記録されたプログラム1Pに基づいて動作することにより実行される。算出装置3は、ログ取り込み部301、受付部302、抽出部303、生成部304、計算部305及び算出部306を含む。
ログ取り込み部301は、通信部36を介して、サーバ2から改札ログを取得し、取得した改札ログを改札ログテーブル1Tに格納する。受付部302は、日時を受け付ける。当該日時は、例えば秒レベルである。算出装置3は、受付部302が受け付けた日時に各便及び各駅に何人の利用者がいたかを算出する。従って、受付部302が受け付ける日時は、鉄道利用者数を算出する処理対象の日時である。
なお、CPU31は、プログラム1Pに基づいて表示部38にユーザが処理対象日時を入力するための入力画面(図示せず)を表示する。ユーザは、操作部39を介して、当該入力画面に鉄道利用者数を算出する対象の日時を入力する。受付部302は、入力画面に入力された日時を受け付ける。
抽出部303は、受付部302が受け付けた日時に鉄道を利用していた利用者に対応する改札ログを、改札ログテーブル1Tから抽出する。具体的には、抽出部303は、受付部302が受け付けた日時に入場駅に入場し、かつ未出場である利用者に対応する改札ログを改札ログテーブル1Tから抽出する。あるいは、抽出部303は、受付部302が受け付けた日時が入場時刻と出場時刻との間に対応する改札ログを改札ログテーブル1Tから抽出する。
生成部304は、抽出部303が抽出した改札ログと最短移動時間テーブル2T、運行記録テーブル3T及び路線テーブル4Tとを照合し、受付部302が受け付けた日時に鉄道を利用していた利用者の行動パターンを生成する。ここでの行動パターンとは、利用者がどの路線のどの便に乗車し、入場駅から出場駅までどのように移動したかという行動類型のことである。利用者は、1つだけの便を利用し、入場駅から出場駅まで移動したかもしれない。他方、利用者は、途中駅で下車し、途中駅構内の書店で本を立ち読みし、その後他の便に乗車して入場駅から出場駅まで移動したかもしれない。あるいは、利用者は、ある路線の便に乗車し、途中駅で別の路線の便に乗り換え、入場駅から出場駅まで移動したかもしれない。このような鉄道を利用する利用者の行動パターンは、路線数及び列車の便数が限られているために、ある程度限られている。そこで、生成部304は、実際に列車が運行した運行記録及び路線の接続関係と、利用者がいつどの駅に入場し、いつどの駅で列車から降りて改札を出たかということを記録した改札ログとを照合し、利用者が利用したと考えられる路線、便及び途中下車のパターンを生成する。
なお、生成部304は、レアケースと考えられる行動パターンについては、考慮してもよいし、考慮しなくてもよい。ここでのレアケースとは、例えば入場駅と出場駅との間に途中下車可能な駅が3駅ある場合、利用者が3駅の全てにおいて途中下車した場合の行動パターンである。あるいは、レアケースは、利用者が途中駅3駅のうち、2駅で途中下車した場合の行動パターンである。
また、ここでのレアケースとは、例えば東京の山手線、ロンドンの地下鉄サークル線、北京の地下鉄2号線、シカゴのLオレンジライン等における環状運転に係る。環状運転の運転系は円形に1周する形で運行するので、入場駅から出場駅へ移動する行動パターンは外回りと内回りとの2通りが考えられる。かかる場合、より遠回りの経路を移動する行動パターンは、レアケースに該当する。
更に、ここでのレアケースとは、入場駅と出場駅とが一致し、列車の利用が確認できないケースである。かかる場合、生成部304は、利用者が入場駅に滞在した後、そのまま出場したものとみなし、駅のみを利用した行動パターンを生成する。
なお、以下での駅における滞在とは、改札内における滞在である。
生成部304が生成した利用者の行動パターンが1通りである場合、受付部302が受け付けた日時に利用者がどの路線のどの便に乗車していたか、又はどの駅の構内にいたかということは一意に確定する。しかし、生成部304が生成した利用者の行動パターンが複数通りである場合、受付部302が受け付けた日時に利用者がどの路線のどの便に乗車していたか、又はどの駅の構内にいたかということは一意ではない。
そこで、計算部305は、生成部304が生成した利用者の行動パターンが複数通りである場合、各行動パターンに対して利用者が当該行動パターンに対応する行動を実行した確率を計算する。その際、計算部305は、駅設備規模係数テーブル5T又は分析対象の改札ログに類似した改札ログを用いる。なお、分析対象の改札ログに類似した改札ログは、改札ログテーブル1Tから抽出される。
ただし、計算部305は、生成部304が生成した利用者の行動パターンの数が所定数より多い場合、鉄道利用指標テーブル6Tを用いて、利用者が各路線の列車に乗車した確率及び各駅構内に利用者がいた確率を計算する。
算出部306は、計算部305が利用者の行動パターンに対して計算した確率に基づいて、受付部302が受け付けた日時に鉄道を利用していた利用者の数を集計する。すなわち、算出部306は、受付部302が受け付けた日時に、どの便及びどの駅に何人の利用者がいたかを集計する。
上述では、抽出部303及び計算部305は、改札ログテーブル1Tから改札ログを抽出する。しかし、抽出部303及び計算部305は、ネットワークNを介してサーバ2が有するデータベースから改札ログを逐次取得してもよい。かかる場合、改札ログテーブル1T及びログ取り込み部301はなくてもよい。
図11は、鉄道利用者数算出処理の手順の一例を示すフローチャートである。なお、図11では、サーバ2から改札ログを取得し、取得した改札ログを改札ログテーブル1Tに登録する処理は終了しているものとする。
CPU31は、処理対象日時を受け付ける(ステップS101)。CPU31は、受け付けた処理対象日時が入場時刻と出場時刻との間に該当する改札ログを改札ログテーブル1Tから抽出する(ステップS102)。すなわち、CPU31は、受け付けた処理対象日時に鉄道を利用していた利用者に対応する改札ログを改札ログテーブル1Tから抽出する。CPU31は、抽出した改札ログから未処理の改札ログを一つ選択する(ステップS103)。
CPU31は、場合分け処理を実行する(ステップS104)。場合分け処理とは、改札ログを利用者の行動パターンによって場合分けし、場合分けした改札ログに対応する行動パターンに対応する確率を計算する処理である。CPU31は、未処理の改札ログがあるか否かを判定する(ステップS105)。CPU31は、未処理の改札ログがあると判定した場合(ステップS105:YES)、ステップS103に処理を戻す。CPU31は、未処理の改札ログがないと判定した場合(ステップS105:NO)、確率が計算された全行動パターンに基づいて、受け付けた日時における鉄道の利用者数を集計し(ステップS106)、処理を終了する。
ステップS104の場合分け処理により、CPU31は、改札ログを4種類に分類する。これら4種類の改札ログを夫々確定ログ、路線確定ログ、限定ログ及び非限定ログと呼ぶ。
確定ログとは、一意にユーザの行動パターンを確定することができる改札ログである。確定ログは、例えば利用者が乗車した列車の路線と便とが一意に確定する情報を有した改札ログである。
路線確定ログとは、利用者が乗車した列車の路線が一意に確定する情報を有した改札ログである。路線確定ログから利用者が乗車した列車の便は一意に確定しない。
限定ログとは、利用者が乗車した列車の路線と便とが共に一意に確定しないものの、利用者の行動パターンの数を所定数以下に限定することができる情報を有する改札ログである。
非限定ログとは、利用者が乗車した列車の路線と便とが共に一意に確定せず、利用者の行動パターンの数を所定数以下に限定することができない情報を有する改札ログである。
以下、確定ログ、路線確定ログ、限定ログ及び非限定ログについて、具体的な事例を挙げて説明する。確定ログ、路線確定ログ、限定ログ及び非限定ログの事例紹介の後に、算出装置3が行動パターンを生成する処理及び確率を計算する処理の流れを、フローチャートを用いて説明する。
図12、図13、図14及び図15は、確定ログを説明するための説明図である。図12は、確定ログに対応する改札ログテーブル1Tのレコード例を示す説明図である。図13は、最短移動時間テーブル2Tのレコード例を示す説明図である。図14は、運行記録テーブル3Tのレコード例を示す説明図である。なお、図14では、途中駅着/発時刻列を省略している。図15は、路線図の一例を示す説明図である。図15は、路線テーブル4Tの情報を視覚化した路線図である。
図12より、利用者はA駅に入場し、B駅から出場したことがわかる。その間の経過時間は10分48秒である。図15より、A駅とB駅とを結ぶ路線はi線とj線との2路線があることがわかる。しかし、経過時間と図13の最短移動時間との比較から、j線の最短移動時間12分は経過時間より長いため、利用者はi線を利用したことが確定する。また、図12の日時と図14の始発駅発時刻及び終着駅到着時刻との比較から、利用者はi線のY便に乗り、C駅で途中下車することなく、B駅に到達したことがわかる。図12の改札ログの日時は、i線のX便及びZ便の運行記録と整合しないからである。従って、図12の改札ログに対応する利用者の行動パターンは、次の1つのみに確定する。
A駅入場・滞在(12:31:14〜12:32)→Y便乗車(12:32〜12:41)→B駅滞在・出場(12:41〜12:42:02)
図12の改札ログは、一意にユーザの行動パターンを確定することができるため、確定ログとなる。改札ログが確定ログである場合、算出装置3は確定ログに対応する行動パターンに計算結果の確率として1を設定する。
図16、図17、図18、図19及び図20は、路線確定ログを説明するための説明図である。図16は、路線確定ログに対応する改札ログテーブル1Tのレコード例を示す説明図である。図17は、最短移動時間テーブル2Tのレコード例を示す説明図である。図18は、運行記録テーブル3Tのレコード例を示す説明図である。図19は、駅設備規模係数テーブル5Tのレコード例を示す説明図である。図20は、路線図の一例を示す説明図である。図20は、路線テーブル4Tの情報を視覚化した路線図である。
図16より、利用者はA駅に入場し、B駅から出場していることがわかる。図20の路線図より、A駅とB駅とを結ぶ路線はi線のみである。従って、図16の改札ログに対応する利用者の行動パターンはi線を利用してA駅からB駅へ移動したパターンであることがわかる。図16の改札ログは、利用者の行動パターンにおける利用路線が一意に確定するため、路線確定ログである。
図16より、利用者がA駅に入場し、B駅から出場するまでの経過時間は32分4秒である。他方、図17の最短移動時間は9分である。経過時間32分4秒と最短移動時間9分との差は23分4秒であり、利用者が駅構内の店舗で20分以上を過ごした可能性、利用者が複数の便を乗り継いで移動した可能性等が考えられる。
そこで、算出装置3は、経過時間と最短移動時間との差が所定時間より長い場合、駅の設備を利用した駅の滞在を含む行動パターンを生成する。ここでは仮に、算出装置3は、経過時間と最短移動時間との差を閾値20分と比較するものとする。算出装置3は、23分4秒と閾値20分とを比較し、経過時間と最短移動時間との差が閾値より長いと判定する。そして、算出装置3は、図20の路線図から利用者がA、C、B駅のいずれかで所定時間以上滞在した行動パターンを生成する。例えば、駅に滞在する所定時間を20分以上に設定した場合、算出装置3は、図20の路線図からA駅での20分以上の滞在、C駅での20分以上の滞在、B駅での20分以上の滞在の3通りの行動パターンの生成を試みる。
次に、算出装置3は、駅滞在が20分を超える場合の列車乗車パターンをリストアップする。図16の改札ログと図18の運行記録を照合した場合、A駅での滞在が20分を超えるのは、利用者がXZ便を利用したときのみである。C駅での滞在が20分を超えるのは、利用者がY便に乗りC駅で途中下車し、C駅からXZ便に乗ったときのみである。B駅での滞在が20分を超えるのは、利用者がY便を利用したときのみである。算出装置3は、推定した3つの行動パターンに対して、図19の改札内店舗数に応じた確率を計算する。具体的には、算出装置3は、A駅、B駅及びC駅の改札内店舗数の比率である3:6:4に基づいて、各駅に滞在した場合の行動パターンに対して確率を計算する。
上述の3つの行動パターン及び確率を以下に示す。
(1)A駅入場・滞在(12:31:14〜12:53)→XZ便乗車(12:53〜13:02)→B駅滞在・出場(13:02〜13:03:18)
A駅滞在の場合の確率は、(100×3)/(3+6+4)=23.08%である。
(2)A駅入場・滞在(12:31:14〜12:32)→Y便乗車(12:32〜12:36)→C駅滞在(12:36〜12:57)→XZ便乗車(12:57〜13:02)→B駅滞在・出場(13:02〜13:03:18)
C駅滞在の場合の確率は、(100×6)/(3+6+4)=46.15%である。
(3)A駅入場・滞在(12:31:14〜12:32)→Y便乗車(12:32〜12:41)→B駅滞在・出場(12:41〜13:03:18)
B駅滞在の場合の確率は、(100×4)/(3+6+4)=30.77%である。
上述の事例では、A駅、C駅及びB駅の夫々について、駅での滞在時間が20分を超える行動パターンが複数生成された。他方、滞在時間が20分を超える駅が1つもない場合、算出装置3は駅での所定時間以上の滞在なしの行動パターンとみなし、処理対象の改札ログに類似する改札ログを利用して、各行動パターンに対応する確率を計算する。この類似する改札ログを用いた処理については、限定ログの事例説明において後述する。
上述の路線確定ログの事例では、改札内店舗数を確率算出の基準としたが、改札内店舗数及び店舗の売上金額を確率算出の基準にしてもよい。あるいは、店舗の売上金額のみを確率算出の基準にしてもよい。確率算出の基準にする駅設備規模係数は、改札内で利用可能な設備の数又は内容に応じた数値であればよく、改札内店舗以外の他の設備に係る数値でもよい。
また、自動改札機1を通過するのに電子決済カードが使用され、かつ当該電子決済カードがある駅の改札内店舗で使用された場合、利用者の滞在駅を当該電子決済カードが使用された改札内店舗が位置する駅に確定してもよい。
上述の路線確定ログの事例では、行動パターンが複数生成された。しかし、行動パターンが1通りしか生成されない場合もある。かかる場合、改札ログは、確定ログに分類され、1通りの行動パターンに対して設定される確率は1となる。
上述の路線確定ログの事例では、経過時間と最短移動時間との差は20分という閾値と比較された。当該閾値は、定数としてプログラム1に記述してもよいし、算出装置3がユーザから受け付けてもよい。算出装置3が経過時間及び最短移動時間の差と比較される閾値をユーザから受け付ける場合、CPU31はそのための入力画面(図示せず)を表示部38に表示し、ユーザは操作部39を介して当該入力画面から閾値を入力する。
また、利用者が駅に所定時間以上滞在する行動パターンを生成する場合、当該所定時間は、前記閾値と同じ時間でもよいし、異なる時間でもよい。当該所定時間を前記閾値と異なる時間に設定する場合、当該所定時間はプログラム1に記述してもよいし、算出装置3がユーザから受け付けてもよい。
上述の路線確定ログの事例では、駅滞在が20分を超える場合の列車乗車パターンは、A、C及びB駅に滞在する場合の夫々について1通りであった。しかし、例えばC駅で20分以上滞在する場合、乗車可能な便が複数あるとき、算出装置3は便の設備の規模又は内容に応じて複数の列車乗車パターンに確率を割り振ってもよい。
図21、図22、図23及び図24は、限定ログを説明するための説明図である。図21は、限定ログに対応する改札ログテーブル1Tのレコード例を示す説明図である。図22は、最短移動時間テーブル2Tのレコード例を示す説明図である。図23は、運行記録テーブル3Tのレコード例を示す説明図である。図24は、路線図の一例を示す説明図である。図24は、路線テーブル4Tの情報を視覚化した路線図である。
図21より、利用者はA駅に入場し、B駅から出場していることがわかる。図24の路線図より、A駅とB駅とを結ぶ路線はi線、j線並びにC駅での乗り換えによるi線及びk線の3路線である。図21の改札ログに基づく経過時間は、21分47秒であり、図22による各路線の最短移動時間と大きな差はない。生成可能な行動パターンは1通りではないので、図21の改札ログは確定ログではない。また、行動パターンに対応する路線は1通りではないので、図21の改札ログは路線確定ログでもない。算出装置3は、図21の改札ログと図23の運行記録とを照合し、運行記録と整合する行動パターンとして次の5パターンを生成する。
(1)A駅入場・滞在(12:31:14〜12:32)→X便乗車(12:32〜12:41)→B駅滞在・出場(12:41〜12:53:01)
この行動パターンは、i線を利用している。
(2)A駅入場・滞在(12:31:14〜12:40)→Y便乗車(12:40〜12:49)→B駅滞在・出場(12:49〜12:53:01)
この行動パターンは、i線を利用している。
(3)A駅入場・滞在(12:31:14〜12:32)→X便乗車(12:32〜12:37)→C駅滞在(12:37〜12:38)→BB便乗車(12:38〜12:46)→B駅滞在・出場(12:46〜12:53:01)
この行動パターンは、i線及びk線を利用している。
(4)A駅入場・滞在(12:31:14〜12:33)→α便乗車(12:33〜12:45)→B駅滞在・出場(12:45〜12:53:01)
この行動パターンは、j線を利用している。
(5)A駅入場・滞在(12:31:14〜12:40)→β便乗車(12:40〜12:52)→B駅滞在・出場(12:52〜12:53:01)
この行動パターンは、j線を利用している。
利用された路線が一意に確定せず、算出された利用者の行動パターンの数が所定数より多い場合、個々の行動パターンの確実度は低い。かかる場合は、従来のマクロ的な鉄道利用に関する統計情報すなわち鉄道利用指標テーブル6Tに基づいて、利用者が各路線の列車に乗車していた確率及び利用者が各駅の改札内にいた確率を求めることが妥当である。
なお、利用者の行動パターンの数と比較される所定数は、閾値としてプログラム1に記述してもよいし、算出装置3がユーザから受け付けてもよい。算出装置3が行動パターンの数と比較する閾値をユーザから受け付ける場合、CPU31はそのための入力画面(図示せず)を表示部38に表示し、ユーザは操作部39を介して当該入力画面から閾値を入力する。
他方、利用された路線が一意に確定せず、算出された利用者の行動パターンの数が所定数より少ない場合、行動パターンの数に応じて均等に割り振った確率を当該行動パターンに設定することが考えられる。例えば、上述の5パターンの場合、各行動パターンに20%ずつの確率を割り振るのである。しかし、改札ログテーブル1Tに登録されている改札ログの数は一般に膨大であり、改札ログテーブル1Tには処理対象の改札ログに類似する改札ログが含まれている。以下、処理対象の改札ログに類似する改札ログを類似ログと呼ぶ。算出装置3は、類似ログを利用して、後述する確率計算を実行する。
処理対象の改札ログだけではなく、類似ログを複数集めて処理対象の改札ログに対応付けることにより、処理対象の改札ログの母集団は増大し、生成される行動パターンの確実度を向上させることができる。
改札ログは、概念として、乗客の行動を極めて粗くサンプリングした測定結果であるとみなすことができる。サンプリングが粗いため、対象である利用者の行動はよくわからないが、利用者の行動と改札ログとが矛盾することはない。一般に、サンプリングが粗くても、同一対象に対して少しずつサンプリングのタイミングをずらし、何回も測定した場合、測定対象は正確に観測されるようになる。この考え方に基づく場合、同じ行動パターン(便・路線)を測定(改札)し、少しずつサンプリングのタイミング(改札通過時刻)が異なるデータ(改札ログ)を多数集めることにより、利用者の行動の推定結果はより正確になると考えられる。
第一に考えられる類似ログは、利用者、入場駅及び出場駅が処理対象の改札ログと同じである他の改札ログである。例えば、通勤者、通学者等の行動パターンは、毎日同一であることが普通である。このような通勤者、通学者等の行動パターンに対応して毎日蓄積される改札ログは、第一の類似ログとなる。
通勤・通学・日常的な移動等を考えた場合、同一の利用者は、同一便を利用する可能性が高い。また、同一の利用者が同一便を利用しない場合であっても、同じ路線を利用する可能性が高い。
第二に考えられる類似ログは、利用者及び出場駅が処理対象の改札ログと同じである他の改札ログである。処理対象の改札ログと第二の類似ログとに夫々対応する入場駅は異なる。この第二の類似ログに対応する路線は、処理対象の改札ログに対応する路線と異なる可能性がある。しかし、出場駅付近における利用経路は共通している可能性が高いと考えられる。例えば、勤務先又は通学先から利用者が何らかの都合により寄り道して帰宅する場合、入場駅は毎日の行動パターンと異なる駅であっても、出場駅は毎日の行動パターンと同一の駅である可能性が高い。
第三に考えられる類似ログは、出場駅が処理対象の改札ログと同じであり、出場時刻が処理対象の改札ログの出場時刻と近接する他の改札ログである。ここで近接する出場時刻とは、例えば前後1分以内の差を有する時刻のことである。第三の類似ログは、第一及び第二の類似ログのように利用者個人の鉄道利用における規則性に基づく類似データではない。しかし、第三の類似ログに基づく行動パターンは、出場時刻の近接から処理対象の改札ログに基づく行動パターンと出場駅付近における利用者の行動に類似性が考えられる。
利用者が異なる場合であっても、出場時間の近接という条件を付けることにより、第三の類似ログに係る降車時の便は、処理対象の改札ログに基づく行動パターンの便と同一であった可能性が高くなる。
なお、処理対象の改札ログと他の改札ログとの類似判定の方法には、他の方法も考えられる。例えば、鉄道を利用する利用者の行動パターンに係る季節、月、曜日、時間帯、利用者の属性等の要素を類似判定に組み込んでもよい。
算出装置3は、類似判定基準に従って、改札ログテーブル1Tから処理対象の改札ログに類似する改札ログを抽出する。
以下、具体的に類似ログを抽出する処理の一例を説明する。
算出装置3は、処理対象の改札ログに対し、利用者が同一かつ入場駅及び出場駅が共に共通し、日時の相違が3か月以内である改札ログを改札ログテーブル1Tから抽出する。
算出装置3は、処理対象の改札ログに対し、利用者が同一かつ出場駅が共通し、日時の相違が3か月以内である改札ログを改札ログテーブル1Tから抽出する。
算出装置3は、処理対象の改札ログに対し、利用者が異なり、かつ出場駅が共通し、出場時刻が前後1分以内である改札ログを改札ログテーブル1Tから抽出する。
算出装置3は、処理対象の改札ログ及び抽出した類似ログに重み付与を施す。
処理対象の改札ログと類似ログとの類似性は、第一、第二及び第三の類似ログの順に低くなる。類似性の高い類似ログほど、その行動パターンは処理対象の改札ログに基づいて生成された行動パターンに近接すると考えられる。そこで、算出装置3は、類似性がより高い類似ログにより大きな重みを付与する。そして、算出装置3は、処理対象の改札ログに最大の重みを付与する。
以下、処理対象の改札ログ及び類似ログに対する具体的な重み付与の一例を説明する。
処理対象の改札ログに100の重みを付与する。
類似ログに付与する重みは、類似ログに基づく行動パターンと処理対象の改札ログに基づく行動パターンとの類似性に応じて、決定する。
利用者が同一かつ曜日が同一の行動パターンに対応する類似ログについては、処理対象の改札ログの利用日に対して、利用日が前後1週間以内の場合は80、前後2週間以内の場合は78、前後3週間以内の場合は76の重みを付与する。以降、利用日が更に1週間隔たる毎に2ずつ付与する重みを減ずる。
利用者が同一かつ曜日が異なる行動パターンに対応する類似ログについては、処理対象の改札ログの利用日に対して、利用日が前後2週間以内の場合は60、前後4週間以内の場合は55、前後6週間以内の場合は50の重みを付与する。以降、利用日が更に2週間隔たる毎に5ずつ付与する重みを減ずる。
利用者が同一かつ時刻のAM/PMが異なる行動パターンに対応する類似ログについては、上記重みに0.5を掛けたものを重みとする。
利用者が同一かつ入場駅が異なる行動パターンに対応する類似ログについては、上記重みに0.5を掛けたものを重みとする。
利用者が異なる行動パターンに対応する類似ログについては、一律に60の重みを付与する。
算出装置3は、抽出した類似ログと運行記録テーブル3T等とを照合し、類似ログに基づく行動パターンを生成する。そして、算出装置3は、処理対象の改札ログに基づく行動パターン及び類似ログに基づく行動パターンに対して、確率を計算する。
まず、生成した行動パターンの数で100%の確率を均等割りする。例えば、処理対象の改札ログに基づく行動パターンが2つである場合、夫々50%ずつの確率を割り振りする。また、抽出した類似ログに基づく行動パターンが3つである場合、夫々33.3%ずつの確率を割り振る。以下、行動パターンの数で100%の確率を均等割りした確率をベース確率と呼ぶ。別の言葉で表現した場合、ベース確率は、生成した行動パターンの数の逆数である。
次に、算出装置3は、処理対象の改札ログに基づく行動パターンと、類似ログに基づく行動パターンとの対応付けを実行する。ここでの対応付けとは、類似ログに基づく行動パターンにおける重み及びベース確率を処理対象の改札ログの確率に組み込むことである。
算出装置3は、処理対象の改札ログに基づく行動パターンと、類似ログに基づく行動パターンとが完全に一致する場合、そのまま対応付けを行う。算出装置3は、処理対象の改札ログに基づく行動パターンと、類似ログに基づく行動パターンとが完全に一致しない場合、行動パターンの類似性に基づいて、対応付けを場合分けする。ここで、行動パターンの類似性の判断基準は様々なものが設定されてよい。
以下に、処理対象の改札ログに基づく行動パターンと、類似ログに基づく行動パターンとが完全に一致しない場合における行動パターンの対応付けの一例を示す。
算出装置3は、類似ログに基づく行動パターンにおいて、最終利用便が処理対象の改札ログに基づくいずれの行動パターンの最終利用便とも一致しない場合、対応付けをしない。それは、かかる場合、行動パターンにおける類似度が極めて低いと考えられるからである。なお、対応付けをしない処理は、確率計算上における補正処理でもあるともいえる。
他方、算出装置3は、類似ログに基づく行動パターンの最終利用便が処理対象の改札ログに基づくいずれかの行動パターンの最終利用便と一致する場合、対応付けを実行する。また、算出装置3は、類似ログに基づく行動パターンにおいて、最終利用便が処理対象の改札ログに基づくいずれかの行動パターンの最終利用便と一致しない場合でも、最終利用便の路線が一致する場合には、対応付けを実行する。ただし、算出装置3は、対応付ける場合であっても、類似ログに基づく行動パターンにおける最終利用便又は最終利用便の路線が処理対象の改札ログに基づく複数の行動パターンと一致するときは、次の処理を実行する。すなわち、算出装置3は、類似ログに基づく行動パターンのベース確率を一致する処理対象の改札ログに基づく行動パターンの数で除算し、除算したベース確率を当該対応付け可能な行動パターンに夫々対応付ける。
算出装置3は、対応付けが終了した場合、処理対象の改札ログに基づく各行動パターンに対する確率を、次の(1)式により計算する。
限定ログに係る確率=Σ(重み×ベース確率)/Σ(重み) ・・・(1)
ただし、算出装置3は、(1)式の分母の重みから、対応付けをしない類似ログに基づく行動パターンの重みは除外する。
図25は、限定ログに基づいて生成された各行動パターンに対する確率計算要素を一覧表示した説明図である。
識別子は、各行動パターンを識別する番号である。改札ログの属性は、改札ログのカードID、日時及び重みである。ベース確率は、処理対象の改札ログ及び類似ログに対して均等割りされたベース確率である。行動パターンは、処理対象の改札ログ及び類似ログに基づいて、生成された利用者の行動パターンである。
識別子[1]〜[5]に対応する改札ログは、処理対象の改札ログである。
識別子[6]〜[11]に対応する改札ログは、類似ログの例を示している。図25の例では、ID001、3月25日の類似ログ、ID001、3月23日の類似ログ及びID003、4月1日の合計3件の類似ログが抽出されている。カードIDが同一である場合、利用者は同一とみなされるため、1件目の3月25日及び2件目の3月23日の類似ログに対応する利用者は、処理対象の改札ログに対応する利用者と同一である。他方、3件目の4月1日の類似ログに対応する利用者は、処理対象の改札ログに対応する利用者と異なる。
図25の類似ログを、上述の類似ログを抽出する条件例に照らして説明する。
識別子[6]〜[8]に対応する1件目の類似ログは、利用者が同一かつ入場駅及び出場駅が共に共通し、日時の相違が3か月以内である場合に対応する。
識別子[9]に対応する2件目の類似ログは、利用者が同一かつ出場駅が共通し、日時の相違が3か月以内である場合に対応する。
識別子[10]〜[11]に対応する3件目の類似ログは、利用者が異なり、かつ出場駅が共通し、出場時刻が前後1分以内である場合に対応する。
図25の処理対象の改札ログ及び類似ログに付与する重みを、上述の重み付与条件例に照らして説明する。
処理対象の改札ログには、100の重みが付与されている。
識別子[6]〜[8]に対応する1件目の類似ログには、利用者が同一かつ曜日が同一の行動パターンに対応し、利用日が前後1週間以内である場合の類似ログであるとして、80の重みが付与されている。
識別子[10]に対応する2件目の類似ログには、利用者が同一かつ曜日が異なる行動パターンに対応し、利用日が前後2週間以内である場合の重み60に、入場駅が異なる場合の0.5を掛けた30の重みが付与されている。
識別子[10]〜[11]に対応する3件目の類似ログには、利用者が異なる行動パターンに対応し、一律に60の重みが付与されている。
識別子[1]〜[5]の行動パターンは、図21の改札ログと、図22の最短移動時間、図23の運行記録及び図24の路線図を照合し、生成された5つの行動パターンである。ここでは、処理対象の改札ログを図21の限定ログであるものとする。図21の限定ログに基づいて生成された5つの行動パターンを以下では、元データと呼ぶ。
元データに対するベース確率は、元データの数が5つであるため、100%の確率を均等に割り振り、各20%である。
識別子[6]〜[11]の行動パターンは、抽出した類似ログと運行記録等とを照合し、夫々生成されたものとする。
識別子[6]〜[8]に対応する行動パターンの数は3つであるため、これらの行動パターンに対するベース確率は、100%の確率を均等に割り振り、各33.3%である。
識別子[9]に対応する行動パターンの数は1つであるため、この行動パターンに対するベース確率は100%である。
識別子[10]〜[11]に対応する行動パターンの数は2つであるため、これらの行動パターンに対するベース確率は、100%の確率を均等に割り振り、各50%である。
元データに対する図25の類似ログに基づいた行動パターンの対応付けについて説明する。
識別子[6]、[7]、[8]の行動パターンは、夫々識別子[1]、[2]、[4]の元データにおける行動パターンと完全一致する。従って、算出装置3は、識別子[6]、[7][8]の行動パターンを、そのまま識別子[1]、[2]、[4]の元データに対応付ける。
識別子[9]の行動パターンは、元データにおける全ての行動パターンと完全一致しない。しかし、識別子[9]の行動パターンにおける最終利用便の路線はi線であり、識別子[1]及び[2]の元データにおける最終利用便のi線と一致する。かかる場合、対応付け可能な元データの数は[1]及び[2]の2つであるため、算出装置3は、識別子[9]の行動パターンに対応するベース確率100%を2で除した50%を、識別子[1]及び[2]の元データに夫々割り振って対応付ける。
識別子[10]の行動パターンは、その最終利用便であるi線のY便が識別子[2]の元データの最終利用便であるi線のY便と一致する。従って、算出装置3は、識別子[10]の行動パターンを識別子[2]の元データに対応付ける。
識別子[11]の行動パターンは、元データにおける全ての行動パターンと完全一致しない。また、識別子[11]の行動パターンにおける最終利用便のzz便は全ての元データに含まれない。更には、識別子[11]の行動パターンにおける最終利用便のl線も全ての元データに含まれない。従って、算出装置3は、識別子[11]の行動パターンをいずれの元データにも対応付けない。
識別子[10]及び[11]の行動パターンに対応する類似ログの重みは60である。しかし、(1)式の分母の計算時に、識別子[11]に対応する重みは除外される。算出装置3は、識別子[11]の行動パターンを元データに対応付けず、識別子[10]の行動パターンのみを考慮した分母とするため、分母におけるその重みを60の半分の30に設定する。
以上に基づき、(1)式を実行した場合、元データ[1]〜[5]に係る確率は、以下のようになる。
[1](100×20+80×33.3+30×50+60×0)/(100+80+30+30)≒25.68%
[2](100×20+80×33.3+30×50+60×50)/(100+80+30+30)≒38.18%
[3](100×20+80×0+30×0+60×0)/(100+80+30+30)≒8.33%
[4](100×20+80×33.3+30×0+60×0)/(100+80+30+30)≒19.43%
[5](100×20+80×0+30×0+60×0)/(100+80+30+30)≒8.33%
図25の例では、識別子[2]の行動パターンが最も鉄道利用の確率が高いことが示される。
図26、図27、図28及び図29は、非限定ログを説明するための説明図である。図26は、限定ログに対応する改札ログテーブル1Tのレコード例を示す説明図である。図27は、最短移動時間テーブル2Tのレコード例を示す説明図である。図28は、運行記録テーブル3Tのレコード例を示す説明図である。なお、図28では、途中駅着/発時刻列を省略している。図29は、路線図の一例を示す説明図である。図29は、路線テーブル4Tの情報を視覚化した路線図である。
図26より、利用者はA駅に入場し、B駅から出場したことがわかる。図29より、A駅とB駅とを結ぶ路線は、i線、j線、k線、i線→k線及びk線→i線の5路線が存在し、図26の改札ログは路線確定ログにはならない。図27より、A駅及びB駅間の最短移動時間は、9〜12分である。他方、図26より、A駅及びB駅間の経過時間は71分12秒であり、最短移動時間よりもかなり長い。図28の運行記録より、列車の運行間隔は数分程度であるため、図26の改札ログから生成可能な利用者の行動パターンの数は非常に多くなる。図26の改札ログに基づいて行動パターンの生成を開始した場合、例えば行動パターンの数の閾値を20にしたとき、図26の改札ログに基づく行動パターンの数は、当該閾値を超える。そこで、算出装置3は、図26の改札ログを非限定ログに分類する。
算出装置3は、多くの改札ログをループ処理する過程で、非限定ログをRAM32に蓄積する。算出装置3は、蓄積した非限定ログを入場駅及び出場駅の区間別に分類し、集計する。算出装置3は、分類かつ集計した限定ログの数、すなわち利用者数を、鉄道利用指標テーブル6Tに基づく各路線及び駅の利用者数の比、すなわち確率で分配する。
鉄道利用指標テーブル6Tは、駅員等による目視及びカメラ観察等からマクロ的に求められた鉄道利用者数が登録されているので、非限定ログに基づく算出装置3の処理はマクロ的なアプローチに従った鉄道利用者数を算出することになる。
なお、鉄道利用指標テーブル6Tが時間帯別の鉄道利用者数を記憶している場合、算出装置3は、分類かつ集計した限定ログの数を、受付部302が受け付けた処理対象日時に対応する時間帯の鉄道利用者数の比で分配してもよい。
また、算出装置3は、鉄道利用者数算出システムが扱う路線が複数の路線エリアに分割されている場合、当該路線エリア毎に非限定ログを振り分けてもよい。算出装置3は、非限定ログの数を路線エリア別に集計し、集計した非限定ログの数すなわち利用者数を、鉄道利用指標テーブル6Tに基づく各路線及び駅の利用者数の比で分配する。
以上が場合分け処理における確定ログ、路線確定ログ、限定ログ及び非限定ログについての行動パターン生成処理及び確率計算処理である。
図30は、場合分け処理の手順の一例を示すフローチャートである。図30は、図11のステップS104に対応する。
CPU31は、処理対象の改札ログが路線確定ログか否か判定する(ステップS201)。ステップS201において、CPU31は、改札ログに対応する入場駅及び出場駅並びに路線テーブル4Tから、利用者が利用した路線が1通りか否かを判定する。CPU31は、改札ログが路線確定ログであると判定した場合(ステップS201:YES)、路線確定ログ処理を実行し(ステップS202)、リターンする。
CPU31は、改札ログが路線確定ログでないと判定した場合(ステップS201:NO)、改札ログと最短移動時間テーブル2T、運行記録テーブル3T及び路線テーブル4Tとを照合し、改札ログに対応する未生成の行動パターンを1つ生成する(ステップS203)。CPU31は、カウンタ変数nをインクリメントする(ステップS204)。カウンタ変数nは、生成された行動パターンの数に該当する。CPU31は、nが閾値より大きいか否かを判定する(ステップS205)。CPU31は、nが閾値より大きいと判定した場合(ステップS205:YES)、非限定ログ処理を実行し(ステップS206)、リターンする。
CPU31は、nが閾値より大きくないと判定した場合(ステップS205:NO)、他の行動パターンが生成可能か否かを判定する(ステップS207)。CPU31は、他の行動パターンが生成可能であると判定した場合(ステップS207:YES)、ステップS203に処理を戻す。CPU31は、他の行動パターンが生成可能でないと判定した場合(ステップS207:NO)、nが1か否か判定する(ステップS208)。
CPU31は、nが1であると判定した場合(ステップS208:YES)、確定ログ処理を実行し(ステップS209)、リターンする。CPU31は、nが1でないと判定した場合(ステップS208:NO)、限定ログ処理を実行し(ステップS210)、リターンする。
なお、確定ログ処理は、生成した1つの行動パターンに計算結果の確率として1を設定する処理である。また、確定ログ処理では、CPU31は、入場した駅から列車に乗らず、そのまま出場する行動パターンの場合についても、計算結果の確率として1を設定する。
ステップS205における閾値は、処理対象の改札ログを非限定ログに振り分けるための境界値である。当該閾値を小さな値に設定した場合、非限定ログの数は増大し、確定ログ及び限定ログの数は減少する。他方、当該閾値を大きな値に設定した場合、非限定ログの数は減少し、確定ログ及び限定ログの数は増大する。非限定ログに基づいた鉄道利用者数の算出は、従来のマクロ的な統計データに依存する。確定ログ及び限定ログに基づいた鉄道利用者数の算出は、ミクロ的な個人の行動を追跡するアプローチに依存する。算出装置3は、マクロ的及びミクロ的処理を併用したハイブリッド処理により鉄道利用者数を算出するが、マクロとミクロとの依存度の割合は、ステップS205における閾値によって調整することができる。算出装置3は、例えば閾値=0と設定した場合、全ての改札ログについて、従来のマクロ的処理から鉄道利用者数を算出することも可能である。
図31は、路線確定ログ処理の手順の一例を示すフローチャートである。
CPU31は、処理対象の改札ログの入場時刻と出場時刻とから経過時間を算出する(ステップS301)。CPU31は、改札ログにおける入場駅及び出場駅の間の最短移動時間を、最短移動時間テーブル2Tから検索する(ステップS302)。CPU31は、経過時間と最短移動時間との差が閾値より長いか否かを判定する(ステップS303)。
なお、CPU31は、ステップS303において、作業用フラグに判定結果を格納する。CPU31は、後のステップS307及びステップS310において、当該作業用フラグを参照することにより、行動パターンが所定時間以上駅に滞在するパターンと駅に滞在しないパターンとのどちらのパターンであるかを判別する。
また、ここでの駅滞在とは、駅の改札内に利用者が滞在することである。
CPU31は、経過時間と最短移動時間との差が閾値より長いと判定した場合(ステップS303:YES)、1つの駅に所定時間以上滞在する未生成の行動パターンを1つ生成する(ステップS304)。ステップS304において、CPU31は、利用者が複数の各駅に所定時間以上滞在するケースはレアケースとして無視する。CPU31は、経過時間と最短移動時間との差が閾値より長くないと判定した場合(ステップS303:NO)、駅に所定時間以上滞在しない未生成の行動パターンを1つ生成する(ステップS305)。
CPU31は、カウンタ変数lをインクリメントする(ステップS306)。カウンタ変数lは、生成された行動パターンの数に該当する。CPU31は、ステップS303で設定した作業用フラグを参照し、駅滞在あるいは駅未滞在のいずれかのパターンについて、他の行動パターンが生成可能か否かを判定する(ステップS307)。CPU31は、他の行動パターンが生成可能であると判定した場合(ステップS307:YES)、ステップS303で設定した作業用フラグに応じて、ステップS304又はステップS305に処理を戻す。すなわち、CPU31は、作業用フラグが駅滞在のパターンである場合、ステップS304に処理を戻す。CPU31は、作業用フラグが駅滞在でないパターンである場合、ステップS305に処理を戻す。
CPU31は、他の行動パターンが生成可能でないと判定した場合(ステップS307:NO)、lが1か否か判定する(ステップS308)。CPU31は、lが1であると判定した場合(ステップS308:YES)、確定ログ処理を実行し(ステップS309)、リターンする。CPU31は、lが1でないと判定した場合(ステップS308:NO)、ステップS303で設定した作業用フラグを参照し、駅滞在のパターンか否かを判定する(ステップS310)。CPU31は、駅滞在のパターンであると判定した場合(ステップS310:YES)、駅設備規模係数テーブル5Tを参照し、生成した各行動パターンに駅の設備を考慮した確率を計算し(ステップS311)、リターンする。CPU31は、駅滞在のパターンでないと判定した場合(ステップS310:NO)、類似ログ処理を実行し(ステップS312)、リターンする。
類似ログ処理は、処理対象の改札ログに対応する類似ログを利用した確率計算処理である。類似ログ処理は、限定ログ処理と同じである。限定ログ処理については後述する。
図32は、非限定ログ処理の手順の一例を示すフローチャートである。非限定ログ処理は、広義には図30のステップS206において行われる処理と、図11のステップS106において行われる利用者数集計の一部の処理とを含む。
非限定ログ処理では、非限定ログの数が集計される。しかし、非限定ログの集計数は、図11におけるステップS103からステップS105のループ処理が終了した後でなければ確定しない。図32は、非限定ログの数を集計するための準備処理の手順の一例である。
CPU31は、カウンタ変数mをインクリメントし(ステップS401)、リターンする。カウンタ変数mは非限定ログの数に該当する。
図11におけるステップS103からステップS105のループ処理が終了した時点で、カウンタ変数mには、集計後の非限定ログの数が格納されている。
図33は、非限定ログに基づいた集計処理の手順の一例を示すフローチャートである。図33の手順は、図11におけるステップS106の集計処理の手順の一部である。
CPU31は、カウンタ変数mの値を非限定ログの集計数として確定する(ステップS402)。CPU31は、鉄道利用指標テーブル6Tを参照し、非限定ログの集計数を各路線及び各駅の利用者数に割り振り(ステップS403)、集計処理の一部を終える。
なお、抽出した改札ログを1つずつ処理するループに含まれる図32のステップS401において、鉄道利用指標テーブル6Tを参照し、処理対象の非限定ログ各々に各路線及び各駅にいた利用者数の比、すなわち確率を設定してもよい。かかる場合、算出装置3は、図11のステップS106において、図32のステップS401で非限定ログ各々に設定した確率に基づいて利用者数を集計する。
ただし、非限定ログに基づく利用者人数は、マクロ的な統計データに基づいて、各路線及び各駅に分配されるため、図32及び図33のように、集計後の人数を一括して各路線及び各駅に分配した方が処理効率は高い。
図34は、限定ログ処理の手順の一例を示すフローチャートである。図34は、図30のステップS210に対応する。また、図34は、図31のステップS312にも対応する。図34を図31のステップS312に対応させる場合、限定ログを路線確定ログに置き換えればよい。
CPU31は、類似ログ抽出処理を実行する(ステップS501)。類似ログ抽出処理は、処理対象の改札ログに類似する改札ログを改札ログテーブル1Tから抽出する処理である。CPU31は、重み付与処理を実行する(ステップS502)。重み付与処理は、限定ログ及び類似ログに対して、限定ログとの一致度又は類似度に応じた重みを付与する処理である。類似ログ抽出処理及び重み付与処理の詳細については、後述する。
CPU31は、類似ログと最短移動時間テーブル2T、運行記録テーブル3T及び路線テーブル4Tとを照合し、類似ログに基づく行動パターンを生成する(ステップS503)。
なお、元データに対応する行動パターンの生成は、図30におけるステップS203からステップS207のループ処理で終了している。元データは、処理対象の改札ログに基づいて生成された行動パターンのことである。
図34を図31のステップS312に対応させる場合、元データに対応する行動パターンの生成は、図31のステップS304からステップS307のループ処理で終了している。
CPU31は、ベース確率を算出する(ステップS504)。ステップS504において、CPU31は、元データの数で均等に割り振った確率を算出する。またステップS504において、CPU31は、類似ログに基づき生成した行動パターンの数で均等に割り振った確率も算出する。
CPU31は、元データの行動パターンと類似ログの行動パターンとを比較し、対応付けを実行する(ステップS505)。ステップS505において、CPU31は、元データの行動パターンと類似ログの行動パターンとが完全一致する場合、完全一致する行動パターン同士を対応付ける。
他方、ステップS505において、CPU31は、類似ログに基づく行動パターンの最終利用便又は最終利用便の路線が夫々元データの最終利用便又は最終利用便の路線に含まれない場合、当該類似ログに基づく行動パターンを利用者が実行した可能性はないと判定する。そして、CPU31は、当該類似ログに基づく行動パターンを元データに対応付けない。
またステップS505において、CPU31は、類似ログに基づく行動パターンの最終利用便又は最終利用便の路線が夫々元データの最終利用便又は最終利用便の路線に含まれる場合、当該類似ログに基づく行動パターンを元データに対応付ける。ただし、対応付け可能な元データが複数存在する場合、CPU31は当該複数の元データに対して処理中の類似ログに基づく行動パターンに対応するベース確率を均等に割り振る。
CPU31は、(1)式に基づいて、限定ログに係る確率計算を実行する(ステップS506)。CPU31は、計算した確率を元データの行動パターンに設定し(ステップS507)、リターンする。
図35は、類似ログ抽出処理の手順の一例を示すフローチャートである。
CPU31は、処理対象の改札ログに対して、カードID、入場駅及び出場駅が夫々一致し、かつ利用日時の相違が3か月以内であるレコードを改札ログテーブル1Tから抽出する(ステップS601)。ここで、カードIDの一致は、利用者の一致を意味する。CPU31は、処理対象の改札ログに対して、カードID及び出場駅が一致し、かつ利用日時の相違が3か月以内であるレコードを改札ログテーブル1Tから抽出する(ステップS602)。ただし、ステップS602において、CPU31は、ステップS601で抽出したレコードは除外する。CPU31は、処理対象の改札ログに対して、カードIDが異なり、出場駅が一致し、かつ出場時刻の相違が1分以内であるレコードを抽出する(ステップS603)。CPU31は、ステップS603の処理が終了した場合、リターンする。
なお、図35の類似ログ抽出処理における類似ログの判定方法は、他にもあり得る。例えば、ステップS602では、出場駅の一致を判定条件の1つにしているが、出場駅の一致を入場駅の一致に置換してもよい。ステップS603では、出場時刻の相違が1分以内であることを判定条件の1つにしているが、出場時刻の相違が1分以内であることを出場時刻の相違が例えば5分以内であることに置換してもよい。また、図35では、処理対象の改札ログとの類似度に応じて3種類の類似ログのレコードを改札ログテーブル1Tから抽出しているが、1種類、2種類又は4種類以上の類似ログのレコードを改札ログテーブル1Tから抽出してもよい。
図36は、重み付与処理の手順の一例を示すフローチャートである。
CPU31は、処理対象の改札ログに100の重みを付与する(ステップS701)。ステップS702以降の重み付与処理は、類似ログに重みを付与する処理である。
CPU31は、図35の類似ログ抽出処理が抽出した類似ログから未処理の類似ログを1件選択する(ステップS702)。CPU31は、選択した類似ログのカードIDが処理対象の改札ログのカードIDと同一か否かを判定する(ステップS703)。ここで、カードIDの一致は、利用者の一致を意味する。
CPU31は、選択した類似ログのカードIDが処理対象の改札ログのカードIDと同一でないと判定した場合(ステップS703:NO)、処理対象の類似ログに60の重みを付与し(ステップS704)、ステップS712に処理を進める。すなわち、CPU31は、処理対象の改札ログに対して、利用者が異なり、利用日が同日の類似ログには、一律に60の重みを付与する。なお、図35の類似ログ抽出処理では、利用者が異なる場合、出場時刻の相違が1分以内の類似ログが抽出されるので、利用者が異なる類似ログは全て利用日も同日である。
CPU31は、選択した類似ログのカードIDが処理対象の改札ログのカードIDと同一であると判定した場合(ステップS703:YES)、類似ログの利用日の曜日が処理対象の改札ログの利用日の曜日と同一か否かを判定する(ステップS705)。CPU31は、類似ログの利用日の曜日が処理対象の改札ログの利用日の曜日と同一であると判定した場合(ステップS705:YES)、処理対象の類似ログに最大80の重みを付与する(ステップS706)。ステップS706において、CPU31は、処理対象の改札ログの利用日に対して、利用日が前後1週間以内の類似ログには80、利用日が前後2週間以内の類似ログには78、利用日が前後3週間以内の類似ログには76の重みを付与する。このように、ステップS706において、CPU31は、処理対象の類似ログに最大80の重みを線形に付与する。
CPU31は、類似ログの利用日の曜日が処理対象の改札ログの利用日の曜日と同一でないと判定した場合(ステップS705:NO)、処理対象の類似ログに最大60の重みを付与する(ステップS707)。ステップS707において、CPU31は、処理対象の改札ログに対して、処理対象の改札ログの利用日に対して、利用日が前後2週間以内の類似ログには60、利用日が前後4週間以内の類似ログには55、利用日が前後6週間以内の類似ログには50の重みを付与する。このように、ステップS707において、CPU31は、処理対象の類似ログに最大60の重みを線形に付与する。
CPU31は、類似ログの利用日時のAM/PMが処理対象の改札ログの利用日時のAM/PMと同一か否かを判定する(ステップS708)。CPU31は、類似ログの利用日時のAM/PMが処理対象の改札ログの利用日時のAM/PMと同一であると判定した場合(ステップS708:YES)、ステップS710に処理を進める。CPU31は、類似ログの利用日時のAM/PMが処理対象の改札ログの利用日時のAM/PMと同一でないと判定した場合(ステップS708:NO)、処理対象の類似ログに付与した重みに0.5を掛け(ステップS709)、ステップS710に処理を進める。
CPU31は、類似ログの入場駅が処理対象の改札ログの入場駅と同一か否かを判定する(ステップS710)。CPU31は、類似ログの入場駅が処理対象の改札ログの入場駅と同一であると判定した場合(ステップS710:YES)、ステップS712に処理を進める。CPU31は、類似ログの入場駅が処理対象の改札ログの入場駅と同一でないと判定した場合(ステップS710:NO)、処理対象の類似ログに付与した重みに0.5を掛け(ステップS711)、ステップS712に処理を進める。
CPU31は、類似ログ抽出処理が抽出した類似ログについて、未処理の類似ログがあるか否かを判定する(ステップS712)。CPU31は、類似ログ抽出処理が抽出した類似ログについて、未処理の類似ログがあると判定した場合(ステップS712:YES)、ステップS702に処理を戻す。CPU31は、類似ログ抽出処理が抽出した類似ログについて、未処理の類似ログはないと判定した場合(ステップS712:NO)、リターンする。
なお、図36の重み付与処理における重み付与の方法は、他にもあり得る。例えば、重み付与処理は、処理対象の改札ログに係る最終利用便の路線と、類似ログに係る最終利用便の路線とが同一か否かを判定する判定処理を含んでもよい。最終利用便の路線が同一である場合は、最終利用便の路線が異なる場合よりも、類似ログに付与する重みを重くする。
また、利用者が異なる場合のステップS704において、改札ログの類似性又は改札ログに基づく行動パターンの類似性に応じて、60以外の重みを付与する分岐処理が追加されてもよい。
処理対象日時で改札ログテーブル1Tから抽出した改札ログに基づいて生成した各行動パターンに対応する確率の計算が終了した場合、処理対象日時の時点での便又は駅における利用者の所在が確率的に表されたことになる。1件の改札ログは1人の利用者に対応するので、1件の改札ログに基づく行動パターンに対して計算された確率は、そのまま利用者1人の期待値となる。算出装置3は、各利用者の各行動パターンに対して計算された確率を集計することにより、各便及び各駅に何人の利用者がいたか算出する。すなわち、算出装置3は、鉄道の利用状況を解析する。
ここで、集計の方法に関しては、大きく2通りの方法が考えられる。1つの集計方法は、1人の利用者について生成した複数の行動パターンとその確率とをそのまま利用する方法である。例えば、1件の改札ログに対して、A行動パターンが70%、B行動パターンが30%という2つの行動パターン及び確率が夫々求められた場合、A行動パターンに0.7人、B行動パターンに0.3人を設定する。行動パターンと確率とが確定した場合、処理対象日時における利用者の所在位置が一意に確率的に確定するため、1件の改札ログからA行動パターンでの位置に0.7人、B行動パターンでの位置に0.3人を夫々加算する。同様の計算を抽出した全改札ログについて繰り返すことにより、処理対象日時における鉄道利用者数がスナップショットとして算出される。
もう1つの集計方法は、計算された確率が最も高い行動パターンを唯一の行動パターンに代表させる方法である。この集計方法を上述の例に適用した場合、1件の改札ログについて、確率が最も高いA行動パターンに1人を割り振る。同様の処理を全改札ログについて繰り返す。そして、割り振った利用者数を行動パターン毎に集計することにより、処理対象日時における鉄道利用者数がスナップショットとして算出される。
算出装置3は、上述の2通りの集計方法を組み合わせて、鉄道利用者数を集計してもよい。例えば、算出装置3は、行動パターンの確率に対応する閾値を定め、当該閾値を境に2通りの集計方法を使い分ける。より具体的には、算出装置3は、生成した複数の行動パターンのうち、ある行動パターンの確率が例えば80%以上である場合は、その行動パターンを唯一の行動パターンとする。他方、算出装置3は、生成した複数の行動パターンの全てが80%未満である場合は、行動パターン毎に確率を集計する。
なお、非限定ログに基づく鉄道利用者数は、マクロ的な統計データを適用することにより、図33の手順により各便及び各駅に割り振られる。そこで、算出装置3は、上述のミクロ的に生成した行動パターンの確率から集計した鉄道利用者数に、非限定ログに基づいてマクロ的に算出した鉄道利用者数を加算する。
算出装置3によれば、改札ログに基づいて鉄道利用者数を正確に算出することができる。
算出装置3は、改札ログを確定ログ、路線確定ログ、限定ログ及び非限定ログの4種類に分類する。改札ログに基づいて生成される利用者の行動パターンの確実度は、確定ログ、路線確定ログ、限定ログ及び非限定ログの順に低くなる。確実度が高い確定ログからは1通りの行動パターンが確定する。路線確定ログからは一般に複数の行動パターンが生成され、駅の設備に基づいて各行動パターンに対応する確率が計算される。確実度がやや低い限定ログから生成される行動パターンには、類似ログを利用して確率が計算される。確実度が低い非限定ログから、マクロ的な統計データに応じた利用者数又は確率が求められる。このように、算出装置3は、行動パターンの確実度の違いに応じて改札ログを分類し、分類した改札ログを使い分けることにより、ミクロからマクロまで幅広い算出方法で鉄道利用者数を算出する。
コンピュータである算出装置3を動作させるためのプログラム1Pは、ディスクドライブ34を介して光ディスク3aから読み込まれてもよい。あるいは、プログラム1Pは、通信部36を介して外部の情報処理装置又は記録装置から読み込まれてもよい。更に、プログラム1Pを記録したフラッシュメモリ等の半導体メモリ3cが、算出装置3内に実装されていてもよい。
以上の実施の形態に関し、さらに以下の付記を開示する。
(付記1)
鉄道における改札の通過記録に基づいて、鉄道の利用者数を算出する算出装置において、
複数の利用者が改札を通過した入場時刻及び出場時刻を含む通過記録、列車の運行時刻情報、路線の接続関係の情報、鉄道における設備の情報及び利用者数の統計データが記憶された記憶部と、
該記憶部に記憶された通過記録、運行時刻情報及び路線の接続関係の情報に基づいて、該記憶部に記憶された通過記録に係る利用者の便への乗車又は駅の改札内における所定時間以上の滞在に係る行動パターンを一又は複数生成する生成部と、
前記記憶部に記憶された設備の情報、通過記録又は利用者数の統計データに基づいて、前記生成部が生成した行動パターンに対応する行動を利用者が実行した確率を計算する計算部と、
該計算部が計算した確率に基づいて、前記生成部が生成した行動パターンに応じた鉄道の利用者数を算出する算出部と
を備える算出装置。
(付記2)
日時を受け付ける受付部を更に備え、
前記記憶部に記憶された運行時刻情報は路線別の列車個々の運行時刻を含み、
前記生成部は、入場時刻が前記受付部により受け付けられた日時より前であり、かつ出場時刻が該日時より後である通過記録を用いて、利用者の行動パターンを生成し、
前記計算部は、前記受付部が受け付けた日時に、利用者が前記生成部により生成された行動パターンに係る便に乗車していた確率又は駅の改札内に所定時間以上滞在していた確率を計算し、
前記算出部は、前記受付部が受け付けた日時に、前記生成部が生成した行動パターンに係る便に乗車していた利用者数又は駅の改札内に滞在していた利用者数を算出する
付記1に記載の算出装置。
(付記3)
前記生成部は、駅の改札内における滞在時間、路線間での列車の乗り換え、路線又は便に基づいて、利用者の行動パターンを生成する
付記2に記載の算出装置。
(付記4)
前記記憶部に記憶された列車の運行時刻情報は所定区間における最短移動時間を含み、
前記記憶部に記憶された通過記録及び路線の接続関係の情報に基づいて、利用者の行動パターンにおける利用可能な路線が一通りか否かを判定する第一判定部と、
前記記憶部に記憶された通過記録及び運行時刻情報に基づいて、入場駅から出場駅までの最短移動時間及び入場時刻から出場時刻までの経過時間の時間差が閾値以上であるか否かを判定する第二判定部と
を備え、
前記生成部は、前記第一判定部が一通りと判定し、かつ前記第二判定部が閾値以上であると判定した場合、駅の改札内に所定時間以上滞在する行動パターンを生成する
付記1から付記3までのいずれか一つに記載の算出装置。
(付記5)
前記記憶部に記憶された鉄道における設備の情報は駅の設備の規模又は内容に応じた情報を含み、
前記計算部は前記情報に基づいて確率を計算する
付記1から付記4までのいずれか一つに記載の算出装置。
(付記6)
前記生成部が生成した行動パターンの数が所定数以下である場合、入場時刻が前記受付部により受け付けられた日時より前であり、かつ出場時刻が該日時より後である通過記録と類似する第二通過記録を前記記憶部から抽出する抽出部と、
前記抽出部が抽出した第二通過記録に、前記通過記録との類似度に応じた重みを付与する重み付与部と、
前記抽出部が抽出した第二通過記録及び前記記憶部の内容に基づいて、該抽出部が抽出した第二通過記録に係る利用者の行動パターンを生成する第二生成部と、
前記生成部及び前記第二生成部が夫々生成した行動パターンの一致度又は類似度に基づいて、該行動パターン同士を対応付ける対応付け部と
を備え、
前記計算部は、前記重み付与部が付与した重み、前記対応付け部が対応付けた行動パターン同士並びに前記生成部及び前記第二生成部が夫々生成した行動パターンの数に基づいて、確率を計算する
付記2又は付記3に記載の算出装置。
(付記7)
前記対応付け部は、前記生成部及び前記第二生成部が夫々生成した行動パターンに係る出場駅及び該出場駅に到着した列車の便が同一である場合、該行動パターン同士を対応付ける
付記6に記載の算出装置。
(付記8)
前記計算部は、前記生成部及び前記第二生成部が夫々生成した行動パターンの数に応じた数値各々に基づいて、確率を計算する
付記6又は付記7に記載の算出装置。
(付記9)
前記計算部は、前記生成部が生成した行動パターンが一つである場合、計算結果の確率として1を設定する
付記1から付記8までのいずれか一つに記載の算出装置。
(付記10)
前記記憶部に記憶された利用者数の統計データは各路線の列車に乗車していた平均利用者数又は各駅の改札内に滞在していた平均利用者数を含み、
前記算出部は、前記生成部が生成した行動パターンの数が所定数を超える場合、前記記憶部に記憶された利用者数の統計データに基づいて、各路線の列車に乗車していた利用者数又は各駅の改札内に滞在していた利用者数を算出する
付記1から付記9までのいずれか一つに記載の算出装置。
(付記11)
前記記憶部に記憶された列車の運行時刻情報は運行記録又は時刻表を含む
付記1から付記9までのいずれか一つに記載の算出装置。
(付記12)
鉄道における改札の通過記録が記憶された記憶部を有するコンピュータに鉄道の利用者数を算出する処理を実行させるプログラムにおいて、
複数の利用者が改札を通過した入場時刻及び出場時刻を含む通過記録、列車の運行時刻情報、路線の接続関係の情報、鉄道における設備の情報及び利用者数の統計データが記憶された前記記憶部に係る通過記録、運行時刻情報及び路線の接続関係の情報に基づいて、該記憶部に記憶された通過記録に係る利用者の便への乗車又は駅の改札内における所定時間以上の滞在に係る行動パターンを一又は複数生成し、
前記記憶部に記憶された設備の情報、通過記録又は利用者数の統計データに基づいて、生成した行動パターンに対応する行動を利用者が実行した確率を計算し、
計算した確率に基づいて、生成した行動パターンに応じた鉄道の利用者数を算出する
処理をコンピュータに実行させるプログラム。
(付記13)
鉄道における改札の通過記録が記憶された記憶部及び制御部を有するコンピュータにより鉄道の利用者数を算出する算出方法において、
複数の利用者が改札を通過した入場時刻及び出場時刻を含む通過記録、列車の運行時刻情報、路線の接続関係の情報、鉄道における設備の情報及び利用者数の統計データが記憶された前記記憶部に係る通過記録、運行時刻情報及び路線の接続関係の情報に基づいて、該記憶部に記憶された通過記録に係る利用者の便への乗車又は駅の改札内における所定時間以上の滞在に係る行動パターンを前記制御部により一又は複数生成し、
前記記憶部に記憶された設備の情報、通過記録又は利用者数の統計データに基づいて、生成した行動パターンに対応する行動を利用者が実行した確率を前記制御部により計算し、
計算した確率に基づいて、生成した行動パターンに応じた鉄道の利用者数を前記制御部により算出する
算出方法。
(付記14)
生成した行動パターンに基づいて、前記通過記録を前記制御部により分類し、
分類した前記通過記録に応じて、確率を前記制御部により計算する
付記13に記載の算出方法。
3 算出装置(コンピュータ)
31 CPU(制御部、生成部、計算部、算出部、受付部、第一判定部、第二判定部、抽出部、重み付与部、第二生成部、対応付け部)
34 ハードディスク(記憶部)
1P プログラム
1T 改札ログテーブル
2T 最短移動時間テーブル
3T 運行記録テーブル
4T 路線テーブル
5T 駅設備規模係数テーブル
6T 鉄道利用指標テーブル

Claims (10)

  1. 鉄道における改札の通過記録に基づいて、鉄道の利用者数を算出する算出装置において、
    複数の利用者が入場駅の改札を通過した入場時刻及び出場駅の改札を通過した出場時刻を含む通過記録、列車の運行時刻情報、路線の接続関係の情報、鉄道における設備の情報及び利用者数の統計データが記憶された記憶部と、
    該記憶部に記憶された通過記録、運行時刻情報及び路線の接続関係の情報に基づいて、前記通過記録に係る利用者の便への乗車又は駅の改札内における所定時間以上の滞在に係る、前記通過記録を充足する行動パターンを一又は複数生成する生成部と、
    前記記憶部に記憶された設備の情報、通過記録又は利用者数の統計データに基づいて、前記生成部が生成した行動パターンに対応する行動を利用者が実行した確率を計算する計算部と、
    該計算部が計算した確率に基づいて、前記生成部が生成した行動パターンに応じた鉄道の利用者数を算出する算出部と
    を備える算出装置。
  2. 日時を受け付ける受付部を更に備え、
    前記記憶部に記憶された運行時刻情報は路線別の列車個々の運行時刻を含み、
    前記生成部は、入場時刻が前記受付部により受け付けられた日時より前であり、かつ出場時刻が該日時より後である通過記録を用いて、利用者の行動パターンを生成し、
    前記計算部は、前記受付部が受け付けた日時に、利用者が前記生成部により生成された行動パターンに係る便に乗車していた確率又は駅の改札内に所定時間以上滞在していた確率を計算し、
    前記算出部は、前記受付部が受け付けた日時に、前記生成部が生成した行動パターンに係る便に乗車していた利用者数又は駅の改札内に滞在していた利用者数を算出する
    請求項1に記載の算出装置。
  3. 前記生成部は、駅の改札内における滞在時間、路線間での列車の乗り換え、路線又は便に基づいて、利用者の行動パターンを生成する
    請求項2に記載の算出装置。
  4. 前記記憶部に記憶された列車の運行時刻情報は所定区間における最短移動時間を含み、
    前記記憶部に記憶された通過記録及び路線の接続関係の情報に基づいて、利用者の行動パターンにおける利用可能な路線が一通りか否かを判定する第一判定部と、
    前記記憶部に記憶された通過記録及び運行時刻情報に基づいて、入場駅から出場駅までの最短移動時間及び入場時刻から出場時刻までの経過時間の時間差が閾値以上であるか否かを判定する第二判定部と
    を備え、
    前記生成部は、前記第一判定部が一通りと判定し、かつ前記第二判定部が閾値以上であると判定した場合、駅の改札内に所定時間以上滞在する行動パターンを生成する
    請求項1から請求項3までのいずれか一項に記載の算出装置。
  5. 前記記憶部に記憶された鉄道における設備の情報は駅の設備の規模又は内容に応じた情報を含み、
    前記計算部は前記情報に基づいて確率を計算する
    請求項1から請求項4までのいずれか一項に記載の算出装置。
  6. 前記生成部が生成した行動パターンの数が所定数以下である場合、入場時刻が前記受付部により受け付けられた日時より前であり、かつ出場時刻が該日時より後である通過記録と類似する第二通過記録を前記記憶部から抽出する抽出部と、
    前記抽出部が抽出した第二通過記録に、前記通過記録との類似度に応じた重みを付与する重み付与部と、
    前記抽出部が抽出した第二通過記録及び前記記憶部の内容に基づいて、該抽出部が抽出した第二通過記録に係る利用者の行動パターンを生成する第二生成部と、
    前記生成部及び前記第二生成部が夫々生成した行動パターンの一致度又は類似度に基づいて、該行動パターン同士を対応付ける対応付け部と
    を備え、
    前記計算部は、前記重み付与部が付与した重み、前記対応付け部が対応付けた行動パターン同士並びに前記生成部及び前記第二生成部が夫々生成した行動パターンの数に基づいて、確率を計算する
    請求項2又は請求項3に記載の算出装置。
  7. 前記対応付け部は、前記生成部及び前記第二生成部が夫々生成した行動パターンに係る出場駅及び該出場駅に到着した列車の便が同一である場合、該行動パターン同士を対応付ける
    請求項6に記載の算出装置。
  8. 前記計算部は、前記生成部及び前記第二生成部が夫々生成した行動パターンの数に応じた数値各々に基づいて、確率を計算する
    請求項6又は請求項7に記載の算出装置。
  9. 鉄道における改札の通過記録が記憶された記憶部を有するコンピュータに鉄道の利用者数を算出する処理を実行させるプログラムにおいて、
    複数の利用者が入場駅の改札を通過した入場時刻及び出場駅の改札を通過した出場時刻を含む通過記録、列車の運行時刻情報、路線の接続関係の情報、鉄道における設備の情報及び利用者数の統計データが記憶された前記記憶部に係る通過記録、運行時刻情報及び路線の接続関係の情報に基づいて、前記通過記録に係る利用者の便への乗車又は駅の改札内における所定時間以上の滞在に係る、前記通過記録を充足する行動パターンを一又は複数生成し、
    前記記憶部に記憶された設備の情報、通過記録又は利用者数の統計データに基づいて、生成した行動パターンに対応する行動を利用者が実行した確率を計算し、
    計算した確率に基づいて、生成した行動パターンに応じた鉄道の利用者数を算出する
    処理をコンピュータに実行させるプログラム。
  10. 鉄道における改札の通過記録が記憶された記憶部及び制御部を有するコンピュータにより鉄道の利用者数を算出する算出方法において、
    複数の利用者が入場駅の改札を通過した入場時刻及び出場駅の改札を通過した出場時刻を含む通過記録、列車の運行時刻情報、路線の接続関係の情報、鉄道における設備の情報及び利用者数の統計データが記憶された前記記憶部に係る通過記録、運行時刻情報及び路線の接続関係の情報に基づいて、前記通過記録に係る利用者の便への乗車又は駅の改札内における所定時間以上の滞在に係る、前記通過記録を充足する行動パターンを前記制御部により一又は複数生成し、
    前記記憶部に記憶された設備の情報、通過記録又は利用者数の統計データに基づいて、生成した行動パターンに対応する行動を利用者が実行した確率を前記制御部により計算し、
    計算した確率に基づいて、生成した行動パターンに応じた鉄道の利用者数を前記制御部により算出する
    算出方法。
JP2012012448A 2012-01-24 2012-01-24 算出装置、プログラム及び算出方法 Expired - Fee Related JP5929231B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012012448A JP5929231B2 (ja) 2012-01-24 2012-01-24 算出装置、プログラム及び算出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012012448A JP5929231B2 (ja) 2012-01-24 2012-01-24 算出装置、プログラム及び算出方法

Publications (2)

Publication Number Publication Date
JP2013152567A JP2013152567A (ja) 2013-08-08
JP5929231B2 true JP5929231B2 (ja) 2016-06-01

Family

ID=49048867

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012012448A Expired - Fee Related JP5929231B2 (ja) 2012-01-24 2012-01-24 算出装置、プログラム及び算出方法

Country Status (1)

Country Link
JP (1) JP5929231B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6454222B2 (ja) * 2015-05-29 2019-01-16 株式会社日立製作所 データ処理システム、及び、データ処理方法
JP6763053B2 (ja) * 2019-03-29 2020-09-30 株式会社東芝 改札監視システム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002187551A (ja) * 2000-12-19 2002-07-02 Omron Corp シミュレーション装置
JP4399283B2 (ja) * 2004-01-30 2010-01-13 三菱電機株式会社 駅混雑度推定システム
JP2005284378A (ja) * 2004-03-26 2005-10-13 Central Japan Railway Co 列車別区間別乗車人員推定装置、およびそのためのプログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP4773306B2 (ja) * 2006-09-06 2011-09-14 公益財団法人鉄道総合技術研究所 プログラム及びシミュレーション装置

Also Published As

Publication number Publication date
JP2013152567A (ja) 2013-08-08

Similar Documents

Publication Publication Date Title
JP6872331B2 (ja) 評価システム及び評価方法
Hörcher et al. Crowding cost estimation with large scale smart card and vehicle location data
Nassir et al. Activity detection and transfer identification for public transit fare card data
US10430736B2 (en) System and method for estimating a dynamic origin-destination matrix
JP6178226B2 (ja) 人流誘導システム及び人流誘導方法
JP5986641B2 (ja) 交通分析システム
Ali et al. Travel behavior analysis using smart card data
Guo et al. Efficiency assessment of transit-oriented development by data envelopment analysis: Case study on the Den-en Toshi line in Japan
JP5543849B2 (ja) サーバ及びコンピュータプログラム
JP6301864B2 (ja) 評価システム及び運行情報の評価方法
JP6675860B2 (ja) データ処理方法およびデータ処理システム
JP2015219673A (ja) 混雑予測装置及び混雑予測方法
JP5947596B2 (ja) 旅客流動情報生成システムおよび旅客流動情報生成方法
Xue et al. Identifying tourists from public transport commuters
Klier et al. Urban public transit network optimization with flexible demand
Liu et al. Smart card data-centric replication of the multi-modal public transport system in Singapore
JP2012242997A (ja) 乗換時間計算システム及び乗換時間計算方法
JP6307376B2 (ja) 交通分析システム、交通分析プログラムおよび交通分析方法
JP5929231B2 (ja) 算出装置、プログラム及び算出方法
Kim et al. Predicting express train choice of metro passengers from smart card data
Saintika et al. Readiness of Operating Bus Rapid Transit (BRT) Purwokerto-Purbalingga towards Smart City Concept
JP2018088069A (ja) 輸送サービス情報提供装置、及び輸送サービス情報提供方法
Nasiboglu et al. Origin-destination matrix generation using smart card data: Case study for Izmir
Wibowo et al. Queuing analysis using Viswalk for check-in counter: Case study of Lombok Praya International Airport
JP5953922B2 (ja) 利用状況算出プログラム、利用状況算出方法、及び利用状況算出装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151023

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160418

R150 Certificate of patent or registration of utility model

Ref document number: 5929231

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees