JP2013152567A - Computing device, program and computing method - Google Patents
Computing device, program and computing method Download PDFInfo
- Publication number
- JP2013152567A JP2013152567A JP2012012448A JP2012012448A JP2013152567A JP 2013152567 A JP2013152567 A JP 2013152567A JP 2012012448 A JP2012012448 A JP 2012012448A JP 2012012448 A JP2012012448 A JP 2012012448A JP 2013152567 A JP2013152567 A JP 2013152567A
- Authority
- JP
- Japan
- Prior art keywords
- log
- station
- ticket gate
- unit
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 188
- 230000006399 behavior Effects 0.000 claims abstract description 169
- 238000000034 method Methods 0.000 claims description 103
- 238000000605 extraction Methods 0.000 claims description 26
- 238000012546 transfer Methods 0.000 claims description 12
- 230000000875 corresponding effect Effects 0.000 description 64
- 238000010586 diagram Methods 0.000 description 37
- 238000012545 processing Methods 0.000 description 37
- 238000012790 confirmation Methods 0.000 description 30
- 239000000284 extract Substances 0.000 description 16
- 230000033001 locomotion Effects 0.000 description 15
- 230000002354 daily effect Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000010006 flight Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000005401 electroluminescence Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Abstract
Description
本発明は、鉄道利用者数を算出する算出装置、プログラム及び算出方法に関する。 The present invention relates to a calculation device, a program, and a calculation method for calculating the number of railway users.
鉄道におけるダイヤ改正、各種設備設置等の事業計画を作成するために、鉄道の利用状況が調査される。そこで、利用者が改札を通過した記録に基づいて、鉄道の利用状況又は利用者数を把握する技術がある(例えば、特許文献1)。 In order to create a business plan for schedule revisions and installation of various facilities in the railway, the status of railway use is investigated. Therefore, there is a technique for grasping the use status of the railway or the number of users based on the record that the user passes the ticket gate (for example, Patent Document 1).
しかしながら、利用者が改札を通過した記録からは、入場駅、出場駅、入場駅構内への入場時刻及び出場駅構内からの出場時刻が判明するだけであり、入場から出場までの間における利用者の詳細な行動は不明である。そのため、利用者が改札を通過した記録を単純に利用するだけでは、正確な鉄道の利用状況を把握することはできない。 However, the record that the user has passed through the ticket gates only reveals the entry time to the entry station, entry station, entry station premises, and entry time from the entry station premises. The detailed behavior of is unknown. For this reason, it is not possible to grasp the exact state of use of the railway simply by using the record that the user has passed through the ticket gate.
本発明は斯かる事情に鑑みてなされたものである。その目的は、改札記録に基づいて鉄道利用者数を正確に算出することができる算出装置、プログラム及び算出方法を提供することである。 The present invention has been made in view of such circumstances. The purpose is to provide a calculation device, a program, and a calculation method capable of accurately calculating the number of railway users based on the ticket gate record.
本願による開示の一観点は、鉄道における改札の通過記録に基づいて、鉄道の利用者数を算出する算出装置において、複数の利用者が改札を通過した入場時刻及び出場時刻を含む通過記録、列車の運行時刻情報、路線の接続関係の情報、鉄道における設備の情報及び利用者数の統計データが記憶された記憶部と、該記憶部に記憶された通過記録、運行時刻情報及び路線の接続関係の情報に基づいて、該記憶部に記憶された通過記録に係る利用者の便への乗車又は駅の改札内における所定時間以上の滞在に係る行動パターンを一又は複数生成する生成部と、前記記憶部に記憶された設備の情報、通過記録又は利用者数の統計データに基づいて、前記生成部が生成した行動パターンに対応する行動を利用者が実行した確率を計算する計算部と、該計算部が計算した確率に基づいて、前記生成部が生成した行動パターンに応じた鉄道の利用者数を算出する算出部とを備える。 One aspect of the disclosure according to the present application is a calculation device that calculates the number of railway users based on a passage record of ticket gates in a railway, a passage record including entrance times and entry times when a plurality of users pass the ticket gates, a train Operation time information, route connection information, railway equipment information and number of users statistical data storage, passage record, operation time information and route connection relationship stored in the storage unit A generating unit that generates one or a plurality of behavior patterns related to staying for a predetermined time or more in a ticket gate of a user's flight or a station ticket relating to a passage record stored in the storage unit based on the information of A calculation unit that calculates a probability that a user has executed an action corresponding to the action pattern generated by the generation unit based on the facility information stored in the storage unit, the passage record or the statistical data of the number of users; Based on the probability that the calculation unit has calculated, and a calculation unit for calculating a number of users train the generation unit corresponding to the generated behavior pattern.
本願による開示の一観点によれば、改札記録に基づいて鉄道利用者数を正確に算出することができる。 According to one aspect of the disclosure of the present application, it is possible to accurately calculate the number of railway users based on ticket gate records.
以下、実施の形態をその図面に基づいて説明する。本実施の形態に係る算出装置(コンピュータ)は、改札ログに基づいて、交通機関の利用者数を算出する。ここでの交通機関は、鉄道、地下鉄、モノレール等を含む。改札ログは、自動改札機からネットワークを介してサーバに送信される改札の通過記録である。算出装置は、サーバから改札ログを取得することができるコンピュータであり、PC(パーソナルコンピュータ)、ノート型PC、ワークステーション、汎用コンピュータ等である。以下では、算出装置の例として、鉄道の利用者数を算出するワークステーションを挙げて説明する。なお、算出装置は、自動改札機から送信された改札ログを記憶するサーバであってもよいことは勿論である。 Hereinafter, embodiments will be described with reference to the drawings. The calculation device (computer) according to the present embodiment calculates the number of users of the transportation facility based on the ticket gate log. Transportation here includes railroads, subways, monorails, and the like. The ticket gate log is a pass record of ticket gates transmitted from the automatic ticket gate to the server via the network. The calculation device is a computer that can acquire a ticket gate log from a server, and is a PC (personal computer), a notebook PC, a workstation, a general-purpose computer, or the like. Hereinafter, a workstation that calculates the number of railway users will be described as an example of the calculation device. Of course, the calculation device may be a server that stores the ticket gate log transmitted from the automatic ticket gate.
図1は、鉄道利用者数算出システムの構成例を示すブロック図である。
鉄道利用者数算出システムは、複数の自動改札機1、サーバ2及び算出装置3を含む。自動改札機1、サーバ2及び算出装置3は、夫々通信機能を有し、互いにネットワークNを介して接続されている。ネットワークNは、専用通信回線、WAN(Wide Area Network)、インターネット、衛星通信回線、電話通信回線等である。
FIG. 1 is a block diagram illustrating a configuration example of a railway user number calculation system.
The railway user number calculation system includes a plurality of
自動改札機1は、駅に設置された改札機であり、改札内に入場するための改札機と改札外に出場するための改札機との2種がある。なお、自動改札機1は、入出場両用の改札機を含んでもよい。図1では、1つの自動改札機1が示されているが、自動改札機1は複数の駅に設置されており、その数は複数である。
自動改札機1は、利用者が自動改札機1を通過する際に、乗車券、入場券、乗車回数券、定期券、電子決済カード等に記録された情報を読み取る。自動改札機1は、乗車券等から読み取った情報、改札通過日時、入出場の区別及び自身の識別情報を、ネットワークNを介してサーバ2に送信する。
なお、乗車券等から読み取られる情報は、例えば磁気記録面、半導体メモリ等によって乗車券等に記録されている。また、改札通過日時は、サーバ2が自動改札機1から改札の通過記録を受信した日時でもよい。
The
The
Information read from a boarding ticket etc. is recorded on a boarding ticket etc. by a magnetic recording surface, a semiconductor memory, etc., for example. The ticket gate passage date and time may be the date and time when the
サーバ2は、例えばワークステーションであり、その記憶装置にデータベースを有する。サーバ2は、自動改札機1から各種情報を受信し、受信した情報を改札ログとしてデータベースに格納する。ここでの改札ログは、乗車券等の識別情報と、入場駅及び入場時刻並びに出場駅及び出場時刻とを含む。サーバ2は、データベースに保有している改札ログを、ネットワークNを介して算出装置3に送信する。
The
自動改札機1が定期券又は電子決済カードに記録された情報を読み取った場合、通過記録には夫々当該定期券又は電子決済カードの識別情報も含まれる。サーバ2のデータベースは、定期券及び電子決済カードの属性情報が記憶されたテーブルを含む。そのため、サーバ2は、利用者が定期券又は電子決済カードにより自動改札機1を通過した場合、当該利用者の氏名、性別、生年月日等の属性情報を抽出することができる。
サーバ2のデータベースは、駅の施設に関する情報が記憶されたテーブルを含む。そのため、サーバ2は、利用者が電子決済カードにより駅構内に設置された設備を利用した場合、当該利用者の属性情報に加えて、利用された設備の属性情報も抽出することができる。
サーバ2は、利用者の属性情報又は駅の設備の属性情報を抽出した場合、抽出した当該属性情報も、ネットワークNを介して算出装置3に送信する。また、サーバ2は、利用者が電子決済カードにより駅構内に設置された設備を利用した場合、設備の利用日時もネットワークNを介して算出装置3に送信する。
When the
The database of the
When the
図2は、算出装置3のハードウェア構成例を示すブロック図である。算出装置3は、CPU(Central Processing Unit、制御部、生成部、計算部、算出部、受付部、第一判定部、第二判定部、抽出部、重み付与部、第二生成部、対応付け部)31を含む。また、算出装置3は、RAM(Random Access Memory)32、ROM(Read Only Memory)33、ハードディスク(記憶部)34、ディスクドライブ35、通信部36、タイマ37、表示部38及び操作部39を含む。算出装置3の各構成部は、バス3bを介して接続されている。
FIG. 2 is a block diagram illustrating a hardware configuration example of the
CPU31は、算出装置3の各構成部を制御する。CPU31は、ハードディスク34に記憶されたプログラム1Pを読み込み、当該プログラム1Pを実行する。
RAM32は、CPU31による処理の過程で必要な作業変数、データ等を一時的に記録する。なお、RAM32は、主記憶装置の一例であり、RAM32の代わりにフラッシュメモリ、メモリカード等が用いられてもよい。
The
The
ROM33は、例えば不揮発性の半導体メモリ又は半導体メモリ以外の読み出し専用記憶媒体である。ROM33は、算出装置3の起動時にCPU31が実行するBIOS(BasicInput/Output System)、ファームウェア等を記録している。
The
ハードディスク34は、CPU31が実行するプログラム1Pを記憶している。ハードディスク34は、算出装置3内部に取り付けられるものであっても、算出装置3外部に置かれるものであってもよい。なお、ハードディスク34は補助記憶装置の一例であり、大容量の情報の記録が可能なフラッシュメモリ、CD(Compact Disc)、DVD(Digital Versatile Disk)、BD(Blu-ray Disc、登録商標)等の光ディスク3aにより代替されてもよい。
The
ハードディスク34は、各種マスタテーブルを記憶している。各種マスタテーブルは、改札ログテーブル1T、最短移動時間テーブル2T、運行記録テーブル3T、路線テーブル4T、駅設備規模係数テーブル5T及び鉄道利用指標テーブル6Tを含む。
また、ハードディスク34は、図示しない作業用のテーブルを記憶している。
The
The
ディスクドライブ35は、外部の記録媒体である光ディスク3aから情報を読み込み、光ディスク3aに情報を記録する。
通信部36は、モデム又はLAN(Local Area Network)カード等であり、ネットワークNに接続されている。
The
The
タイマ37は、日時を計時し、計時した結果を信号としてCPU31に送信する。
表示部38は、例えば液晶ディスプレイ、有機EL(Electro-Luminescence)ディスプレイ等の画面を有し、CPU31からの指示に従って、プログラム1Pに係る様々な画面を表示する。
The
The
操作部39は、ユーザが各種の入力を行うキーボード、マウス、タッチパネル等の入力デバイスを含む。操作部39は、ユーザによる操作に基づいて入力信号を生成する。生成された入力信号は、バス3bを介してCPU31に送信される。
The
次に、ハードディスク34が記憶している各種マスタテーブルについて詳細に説明する。
図3は、改札ログテーブル1Tのレコードレイアウトの一例を示す説明図である。改札ログテーブル1Tは、自動改札機1が乗車券等から読み取り、サーバ2に送信した改札ログを登録するテーブルである。算出装置3は、サーバ2から改札ログを受信し、受信した改札ログを改札ログテーブル1Tに登録する。
Next, various master tables stored in the
FIG. 3 is an explanatory diagram showing an example of a record layout of the ticket gate log table 1T. The ticket gate log table 1T is a table for registering the ticket gate log that the
改札ログテーブル1Tは、カードID、改札通過データ及び日時の各列を含む。カードIDは、自動改札機1が読み取った乗車券、入場券、乗車回数券、定期券、電子決済カード等の識別記号である。乗車券、入場券及び乗車回数券の識別記号は、発券機等が各券に付与した識別記号である。定期券の識別記号は、鉄道事業者の発券システムが定期券に付与した識別記号である。電子決済カードの識別記号は、当該電子決済カードを発行した事業者のシステムが当該電子決済カードに付与した識別記号である。
The ticket gate log table 1T includes columns of card ID, ticket gate passage data, and date / time. The card ID is an identification symbol such as a boarding ticket, an admission ticket, a boarding ticket, a commuter pass, or an electronic payment card read by the
改札通過データは、自動改札機1が設置された駅の駅名及び入出場の区別である。日時は、利用者が自動改札機1を通過した日時である。日時のフォーマット形式は、例えばyyyy/mm/dd hh:mm:ssである。
例えば、図3の改札ログテーブル1Tから、カードID=ID001の券により鉄道を利用した利用者は、次の行動を取ったことがわかる。当該利用者は、20XX年4月1日12時30分14秒にA駅に入場し、20XX年4月1日15時39分52秒にB駅から出場した。また、当該利用者は、20XX年4月2日9時7分39秒にB駅に入場し、20XX年4月2日12時58分3秒にC駅から出場した。
The ticket gate passage data is the station name of the station where the
For example, it can be seen from the ticket gate log table 1T of FIG. 3 that the user who uses the railway with the card ID = ID001 took the following action. The user entered Station A at 12:30:14 on April 1, 20XX and entered from Station B at 15:39:52 on April 1, 20XX. The user entered the B station at 9:07:39 on April 2, 20XX, and entered the C station at 12: 58: 3 on April 2, 20XX.
図4は、最短移動時間テーブル2Tのレコードレイアウトの一例を示す説明図である。最短移動時間テーブル2Tは、入場駅から出場駅までの区間を列車で移動する場合、その最短移動時間を路線別に登録するテーブルである。 FIG. 4 is an explanatory diagram showing an example of the record layout of the shortest movement time table 2T. The shortest travel time table 2T is a table for registering the shortest travel time for each route when the section from the entrance station to the exit station is moved by train.
最短移動時間テーブル2Tは、路線、区間及び最短移動時間の各列を含む。路線は、路線名である。なお、途中駅で路線の乗り換えが可能な場合、路線列にはi線→k線のように、乗り換え前の路線、矢印及び乗り換え後の路線が格納される。矢印は、乗り換え順序を示している。区間は、利用者が列車に乗車した区間である。区間には、入場駅、矢印及び出場駅が登録される。矢印は、列車の移動方向を示している。最短移動時間は、路線及び区間に係る最短移動時間である。例えば、利用者が急行電車を利用した場合、各停電車よりも短時間で出場駅に到達するとき、最短移動時間には利用者が急行電車を利用した場合の所要時間が登録される。また、入場駅から出場駅までの移動の間に、途中下車が可能な途中駅が存在する場合、最短移動時間には利用者が途中下車せずに、移動したときの所要時間が登録される。 The shortest travel time table 2T includes lines for routes, sections, and shortest travel times. The route is a route name. In addition, when the transfer of a route is possible in the middle station, the route before a transfer, the arrow, and the route after a transfer are stored in a route line like i line-> k line. Arrows indicate the transfer order. The section is a section where the user gets on the train. In the section, the entry station, the arrow, and the entry station are registered. Arrows indicate the direction of train movement. The shortest travel time is the shortest travel time for a route and a section. For example, when a user uses an express train, when the user arrives at a participating station in a shorter time than each blackout car, the required time when the user uses the express train is registered as the shortest travel time. In addition, if there is a halfway station where you can get off during the transfer from the entry station to the departure station, the time required for the user to move without registering for the shortest travel time is registered. .
図5は、運行記録テーブル3Tのレコードレイアウトの一例を示す説明図である。運行記録テーブル3Tは、日付別、路線別かつ便別の列車が運行した時刻を登録するテーブルである。なお、ハードディスク34は、運行記録テーブル3Tの代わりに時刻表を記憶していてもよい。かかる場合、算出装置3は、時刻表を用いて列車の発着時刻を参照する。
FIG. 5 is an explanatory diagram showing an example of a record layout of the operation record table 3T. The operation record table 3T is a table for registering the time when trains operated by date, route, and flight are operated. The
運行記録テーブル3Tは、年月日、路線、便名、始発駅発時刻、途中駅着/発時刻及び終着駅到着時刻の各列を含む。年月日は、列車が運行した年月日である。年月日のフォーマット形式は、例えばyyyy/mm/ddである。路線は、路線名である。便名は、運行した列車の名称である。始発駅発時刻は、始発駅の名称及び発車時刻である。発車時刻のフォーマット形式は、例えばhh:mmである。途中駅着/発時刻は、便が始発駅と到着駅との間に途中停車する駅がある場合、その停車する途中駅名並びに到着時刻及び発車時刻である。到着時刻及び発車時刻のフォーマット形式は、例えばhh:mmである。図5の運行記録テーブル3Tの例では、途中駅着/発時刻は1列のみであるが、途中停車の駅が複数である場合、その数だけ途中駅着/発時刻の列数が用意される。終着駅到着時刻は、終着駅の名称及び到着時刻である。到着時刻のフォーマット形式は、例えばhh:mmである。 The operation record table 3T includes columns of date, route, flight number, departure time from the first station, arrival / departure time on the way, and arrival time at the last station. The date is the date when the train operated. The date format is, for example, yyyy / mm / dd. The route is a route name. The flight name is the name of the train that operated. The first departure station departure time is the name of the first departure station and the departure time. The format format of the departure time is, for example, hh: mm. The station arrival / departure time is the name, arrival time, and departure time of the station where the service stops when there is a station that stops between the first station and the arrival station. The format format of arrival time and departure time is, for example, hh: mm. In the example of the operation record table 3T in FIG. 5, the arrival / departure time on the way is only one column. However, if there are a plurality of stations that are stopped on the way, the number of rows of arrival / departure times on the way is provided. The The terminal station arrival time is the name of the terminal station and the arrival time. The format format of the arrival time is, for example, hh: mm.
なお、途中停車駅における到着時刻及び発車時刻が分レベルで同一である場合、到着時刻及び発車時刻のいずれか一方の時刻が途中駅着/発時刻に登録される。図5の先頭レコードの途中駅着/発時刻は、到着時刻及び発車時刻が分レベルで同一である場合を示している。到着時刻及び発車時刻が分レベルで異なる場合、途中駅着/発時刻には到着時刻及び発車時刻の両方の時刻が登録されてもよいし、いずれか一方の時刻が登録されてもよい。便が途中停車駅を有さない列車である場合、途中駅着/発時刻列は空欄である。図5の2行目及び3行目のレコードは、便が途中停車駅を有さない列車である場合を例示している。 If the arrival time and departure time at the halfway stop station are the same at the minute level, one of the arrival time and departure time is registered as the arrival / departure time on the way. The station arrival / departure time in the middle of the top record in FIG. 5 indicates a case where the arrival time and departure time are the same at the minute level. When the arrival time and the departure time are different at the minute level, both the arrival time and the departure time may be registered as the arrival / departure time on the way, or one of the times may be registered. If the flight is a train that does not have a stop station, the arrival / departure time train on the way is blank. The records on the second and third lines in FIG. 5 illustrate the case where the flight is a train that does not have a stop station on the way.
図6は、路線テーブル4Tのレコードレイアウトの一例を示す説明図である。路線テーブル4Tは、路線の接続関係を登録するテーブルである。路線テーブル4Tは、例えば駅毎に接続している路線を登録するテーブルである。
路線テーブル4Tは、駅名、路線1、路線2、路線3、…路線nの各列を含む。駅名は、駅の名称である。路線1、路線2、路線3、…路線nは、駅名の駅で接続している路線の名称である。例えば図6のA駅では、i線、j線及びk線の3路線が接続されている。従って、A駅では、これら3路線間において列車の乗り換えが可能である。例えば図6のD駅で接続している路線は、j線のみである。従って、D駅では、路線間の列車の乗り換えはない。
FIG. 6 is an explanatory diagram showing an example of a record layout of the route table 4T. The route table 4T is a table for registering connection relationships of routes. The route table 4T is a table that registers routes connected to each station, for example.
The route table 4T includes columns of station name,
なお、ここでの列車の乗り換えは、改札内における列車の乗り換えである。算出装置3は、利用者が自動改札機1を通過して改札から出場した場合、鉄道利用者数算出システムが関与しない他の鉄道事業者の列車への乗り換えを考慮しない。
また、路線の接続関係が運行記録テーブル3T又は時刻表から抽出可能である場合、路線テーブル4Tはなくてもよい。
The train transfer here is a train transfer in the ticket gate. When the user passes through the
Moreover, when the connection relation of a route can be extracted from the operation record table 3T or the timetable, the route table 4T may not be provided.
図7は、駅設備規模係数テーブル5Tのレコードレイアウトの一例を示す説明図である。駅設備規模係数テーブル5Tは、駅に設置されている設備の規模又は内容を登録するテーブルである。なお、駅設備規模係数テーブル5Tは、鉄道の設備を登録するテーブルの一例である。他の鉄道の設備として、例えば列車内の無線LANスポット、トイレ、公衆電話、案内表示器等がある。
駅設備規模係数テーブル5Tは、駅ID、駅名及び改札内店舗数の各列を含む。駅IDは、駅を識別する識別記号である。駅名は、駅の名称である。改札内店舗数は、改札内に設置された店舗の数である。
FIG. 7 is an explanatory diagram showing an example of a record layout of the station facility scale coefficient table 5T. The station equipment scale factor table 5T is a table for registering the scale or contents of equipment installed in the station. The station equipment scale factor table 5T is an example of a table for registering railway equipment. As other railway facilities, there are, for example, a wireless LAN spot in a train, a toilet, a public telephone, and a guidance display.
The station facility scale factor table 5T includes columns of station ID, station name, and number of stores in the ticket gate. The station ID is an identification symbol that identifies a station. The station name is the name of the station. The number of stores in the ticket gate is the number of stores installed in the ticket gate.
図7は、駅設備の規模を店舗の数で代表している。しかし、駅設備規模係数テーブル5Tが示す駅設備の規模は、改札内に設置された自動販売機の台数、待合施設の総床面積等でもよい。また、駅設備の規模は、トイレの設置数、貼付等された広告枚数、広告売上、自動体外式除細動器(AED)の設置数、無線LANスポットの設置数等でもよい。更には、駅設備の規模は、複数の設備の組み合わせでもよい。 FIG. 7 represents the scale of station facilities by the number of stores. However, the scale of the station equipment indicated by the station equipment scale factor table 5T may be the number of vending machines installed in the ticket gate, the total floor area of the waiting facility, and the like. Further, the scale of the station facilities may be the number of toilets installed, the number of advertisements attached, advertisement sales, the number of automatic external defibrillators (AEDs) installed, the number of wireless LAN spots installed, and the like. Furthermore, the scale of the station facility may be a combination of a plurality of facilities.
図8は、駅テーブル51T及び売上テーブル52Tのレコードレイアウトの一例を示す説明図である。図8Aは、駅テーブル51Tのレコードレイアウトの一例を示す説明図である。図8Bは、売上テーブル52Tのレコードレイアウトの一例を示す説明図である。図8Aの駅テーブル51T及び図8Bの売上テーブル52Tは、結合されることにより駅設備規模係数テーブル5Tを構成するテーブル例である。図8の駅テーブル51T及び売上テーブル52Tでは、駅設備の規模が改札内の店舗における売上金額で代表されている。 FIG. 8 is an explanatory diagram showing an example of a record layout of the station table 51T and the sales table 52T. FIG. 8A is an explanatory diagram illustrating an example of a record layout of the station table 51T. FIG. 8B is an explanatory diagram illustrating an example of a record layout of the sales table 52T. The station table 51T in FIG. 8A and the sales table 52T in FIG. 8B are examples of tables that are combined to form the station facility scale factor table 5T. In the station table 51T and the sales table 52T in FIG. 8, the scale of the station facility is represented by the sales amount at the store in the ticket gate.
駅テーブル51Tは、駅ID及び駅名の各列を含む。駅ID及び駅名は、夫々図8の駅設備規模係数テーブル5Tの駅ID及び駅名と同じである。売上テーブル52Tは、店舗ID、駅ID、店舗名及び平均売上の各列を含む。店舗IDは、改札内の店舗を識別する識別記号である。駅IDは、図8の駅設備規模係数テーブル5Tの駅IDと同じである。店舗名は店舗の名称である。平均売上は、所定期間における店舗の総売上金額に基づく平均売上金額である。平均売上は、例えば過去1年間の総売上金額を月当たりの平均金額に換算したものである。平均売上の単位は、例えば円である。
駅テーブル51Tの駅IDと売上テーブル52Tの駅IDとは、関連付けられている。従って、駅テーブル51Tと売上テーブル52Tとを結合することにより、改札内の店舗における売上金額で駅設備の規模を代表する駅設備規模係数テーブル5Tが構築される。
The station table 51T includes columns of station ID and station name. The station ID and the station name are the same as the station ID and the station name in the station facility scale factor table 5T of FIG. The sales table 52T includes columns of store ID, station ID, store name, and average sales. The store ID is an identification symbol that identifies the store in the ticket gate. The station ID is the same as the station ID in the station facility scale factor table 5T in FIG. The store name is the name of the store. The average sales is an average sales amount based on the total sales amount of the store in a predetermined period. The average sales are, for example, the total sales amount for the past year converted into an average amount per month. The unit of average sales is, for example, a yen.
The station ID of the station table 51T and the station ID of the sales table 52T are associated with each other. Therefore, by combining the station table 51T and the sales table 52T, a station equipment scale factor table 5T that represents the scale of the station equipment by the sales amount at the store in the ticket gate is constructed.
図9は、鉄道利用指標テーブル6Tのレコードレイアウトの一例を示す説明図である。鉄道利用指標テーブル6Tは、マクロ的に計測された路線別の列車乗客数を登録するテーブルである。
鉄道利用指標テーブル6Tは、路線ID、路線名及び1日平均乗客数の各列を含む。路線IDは、路線を識別する識別記号である。路線名は、路線の名称及び列車の進行方向である。進行方向は、例えば上り及び下りで区別される。1日平均乗客数は、所定期間における全便の全乗客数に基づく1日当たりの平均乗客数である。1日平均乗客数は、例えば路線の全便について過去1年間の総乗客数を1日当たりの平均乗客数に換算したものである。1日平均乗客数の元となるデータは、限定された観察位置における駅員の目視観察、カメラ映像等から推定された鉄道利用者数である。
FIG. 9 is an explanatory diagram showing an example of a record layout of the railway use index table 6T. The railway use index table 6T is a table for registering the number of train passengers for each route measured in a macro manner.
The railway use index table 6T includes each column of route ID, route name, and daily average number of passengers. The route ID is an identification symbol that identifies the route. The route name is the name of the route and the traveling direction of the train. The traveling direction is distinguished by, for example, upstream and downstream. The daily average number of passengers is the average number of passengers per day based on the total number of passengers of all flights in a predetermined period. The daily average number of passengers is, for example, the total number of passengers in the past year converted to the average number of passengers per day for all flights on the route. The data that is the basis for the daily average number of passengers is the number of railway users estimated from the visual observation of the station staff at the limited observation positions, camera images, and the like.
なお、鉄道利用指標テーブル6Tには、路線別の平均乗客数より詳しい、便別の平均乗客数も登録されてよい。
また、鉄道利用指標テーブル6Tは、更に駅ID、駅名及び1日平均駅利用者数の各列を含んでもよい。駅ID及び駅名は、夫々駅設備規模係数テーブル5Tの駅ID及び駅名と同じである。1日平均駅利用者数は、所定期間における1日当たりの平均駅利用者数である。1日平均駅利用者数は、例えば自動改札機1を通過した過去1年間の利用者数を1日当たりの平均利用者数に換算したものである。
鉄道利用指標テーブル6Tは、季節別又は1日の時間帯別の各路線平均乗客数又は各駅平均利用者数のデータを含んでもよい。
In the railway usage index table 6T, the average number of passengers by flight, which is more detailed than the average number of passengers by route, may be registered.
Moreover, the railway use index table 6T may further include columns of station ID, station name, and daily average number of station users. The station ID and the station name are the same as the station ID and the station name in the station facility scale factor table 5T, respectively. The average number of station users per day is the average number of station users per day in a predetermined period. The daily average number of station users is, for example, the number of users for the past year passing through the
The railway use index table 6T may include data on the average number of passengers on each route or the average number of users on each station by season or by time of day.
次に、算出装置3の動作について説明する。算出装置3は、指定された日時に、基本的に1件の改札ログに対応する1人の利用者が各便又は各駅にいた確率を求める。そして、算出装置3は、指定された日時に、処理対象である全ての改札ログに対応する利用者が各便又は各駅にいた確率に基づいて、鉄道利用者数算出システムが対象とする各便に乗車していた利用者及び各駅にいた利用者の数を算出する。
Next, the operation of the
図10は、算出装置3の機能構成例を示す機能ブロック図である。図10の各機能部は、CPU31がハードディスク34に記録されたプログラム1Pに基づいて動作することにより実行される。算出装置3は、ログ取り込み部301、受付部302、抽出部303、生成部304、計算部305及び算出部306を含む。
FIG. 10 is a functional block diagram illustrating a functional configuration example of the
ログ取り込み部301は、通信部36を介して、サーバ2から改札ログを取得し、取得した改札ログを改札ログテーブル1Tに格納する。受付部302は、日時を受け付ける。当該日時は、例えば秒レベルである。算出装置3は、受付部302が受け付けた日時に各便及び各駅に何人の利用者がいたかを算出する。従って、受付部302が受け付ける日時は、鉄道利用者数を算出する処理対象の日時である。
なお、CPU31は、プログラム1Pに基づいて表示部38にユーザが処理対象日時を入力するための入力画面(図示せず)を表示する。ユーザは、操作部39を介して、当該入力画面に鉄道利用者数を算出する対象の日時を入力する。受付部302は、入力画面に入力された日時を受け付ける。
The
The
抽出部303は、受付部302が受け付けた日時に鉄道を利用していた利用者に対応する改札ログを、改札ログテーブル1Tから抽出する。具体的には、抽出部303は、受付部302が受け付けた日時に入場駅に入場し、かつ未出場である利用者に対応する改札ログを改札ログテーブル1Tから抽出する。あるいは、抽出部303は、受付部302が受け付けた日時が入場時刻と出場時刻との間に対応する改札ログを改札ログテーブル1Tから抽出する。
The
生成部304は、抽出部303が抽出した改札ログと最短移動時間テーブル2T、運行記録テーブル3T及び路線テーブル4Tとを照合し、受付部302が受け付けた日時に鉄道を利用していた利用者の行動パターンを生成する。ここでの行動パターンとは、利用者がどの路線のどの便に乗車し、入場駅から出場駅までどのように移動したかという行動類型のことである。利用者は、1つだけの便を利用し、入場駅から出場駅まで移動したかもしれない。他方、利用者は、途中駅で下車し、途中駅構内の書店で本を立ち読みし、その後他の便に乗車して入場駅から出場駅まで移動したかもしれない。あるいは、利用者は、ある路線の便に乗車し、途中駅で別の路線の便に乗り換え、入場駅から出場駅まで移動したかもしれない。このような鉄道を利用する利用者の行動パターンは、路線数及び列車の便数が限られているために、ある程度限られている。そこで、生成部304は、実際に列車が運行した運行記録及び路線の接続関係と、利用者がいつどの駅に入場し、いつどの駅で列車から降りて改札を出たかということを記録した改札ログとを照合し、利用者が利用したと考えられる路線、便及び途中下車のパターンを生成する。
The
なお、生成部304は、レアケースと考えられる行動パターンについては、考慮してもよいし、考慮しなくてもよい。ここでのレアケースとは、例えば入場駅と出場駅との間に途中下車可能な駅が3駅ある場合、利用者が3駅の全てにおいて途中下車した場合の行動パターンである。あるいは、レアケースは、利用者が途中駅3駅のうち、2駅で途中下車した場合の行動パターンである。
また、ここでのレアケースとは、例えば東京の山手線、ロンドンの地下鉄サークル線、北京の地下鉄2号線、シカゴのLオレンジライン等における環状運転に係る。環状運転の運転系は円形に1周する形で運行するので、入場駅から出場駅へ移動する行動パターンは外回りと内回りとの2通りが考えられる。かかる場合、より遠回りの経路を移動する行動パターンは、レアケースに該当する。
更に、ここでのレアケースとは、入場駅と出場駅とが一致し、列車の利用が確認できないケースである。かかる場合、生成部304は、利用者が入場駅に滞在した後、そのまま出場したものとみなし、駅のみを利用した行動パターンを生成する。
なお、以下での駅における滞在とは、改札内における滞在である。
Note that the
The rare case here refers to, for example, circular operation on the Yamanote Line in Tokyo, the Circle Line in London, the
Furthermore, the rare case here is a case where the entry station and the entry station coincide and the use of the train cannot be confirmed. In such a case, the
In addition, the stay in the station below is a stay in the ticket gate.
生成部304が生成した利用者の行動パターンが1通りである場合、受付部302が受け付けた日時に利用者がどの路線のどの便に乗車していたか、又はどの駅の構内にいたかということは一意に確定する。しかし、生成部304が生成した利用者の行動パターンが複数通りである場合、受付部302が受け付けた日時に利用者がどの路線のどの便に乗車していたか、又はどの駅の構内にいたかということは一意ではない。
そこで、計算部305は、生成部304が生成した利用者の行動パターンが複数通りである場合、各行動パターンに対して利用者が当該行動パターンに対応する行動を実行した確率を計算する。その際、計算部305は、駅設備規模係数テーブル5T又は分析対象の改札ログに類似した改札ログを用いる。なお、分析対象の改札ログに類似した改札ログは、改札ログテーブル1Tから抽出される。
ただし、計算部305は、生成部304が生成した利用者の行動パターンの数が所定数より多い場合、鉄道利用指標テーブル6Tを用いて、利用者が各路線の列車に乗車した確率及び各駅構内に利用者がいた確率を計算する。
When there are only one user behavior pattern generated by the
Therefore, when there are a plurality of user behavior patterns generated by the
However, when the number of user behavior patterns generated by the
算出部306は、計算部305が利用者の行動パターンに対して計算した確率に基づいて、受付部302が受け付けた日時に鉄道を利用していた利用者の数を集計する。すなわち、算出部306は、受付部302が受け付けた日時に、どの便及びどの駅に何人の利用者がいたかを集計する。
Based on the probability calculated by the
上述では、抽出部303及び計算部305は、改札ログテーブル1Tから改札ログを抽出する。しかし、抽出部303及び計算部305は、ネットワークNを介してサーバ2が有するデータベースから改札ログを逐次取得してもよい。かかる場合、改札ログテーブル1T及びログ取り込み部301はなくてもよい。
In the above description, the
図11は、鉄道利用者数算出処理の手順の一例を示すフローチャートである。なお、図11では、サーバ2から改札ログを取得し、取得した改札ログを改札ログテーブル1Tに登録する処理は終了しているものとする。
CPU31は、処理対象日時を受け付ける(ステップS101)。CPU31は、受け付けた処理対象日時が入場時刻と出場時刻との間に該当する改札ログを改札ログテーブル1Tから抽出する(ステップS102)。すなわち、CPU31は、受け付けた処理対象日時に鉄道を利用していた利用者に対応する改札ログを改札ログテーブル1Tから抽出する。CPU31は、抽出した改札ログから未処理の改札ログを一つ選択する(ステップS103)。
FIG. 11 is a flowchart illustrating an example of a procedure of a railway user number calculation process. In FIG. 11, it is assumed that the process of acquiring the ticket gate log from the
The
CPU31は、場合分け処理を実行する(ステップS104)。場合分け処理とは、改札ログを利用者の行動パターンによって場合分けし、場合分けした改札ログに対応する行動パターンに対応する確率を計算する処理である。CPU31は、未処理の改札ログがあるか否かを判定する(ステップS105)。CPU31は、未処理の改札ログがあると判定した場合(ステップS105:YES)、ステップS103に処理を戻す。CPU31は、未処理の改札ログがないと判定した場合(ステップS105:NO)、確率が計算された全行動パターンに基づいて、受け付けた日時における鉄道の利用者数を集計し(ステップS106)、処理を終了する。
CPU31 performs a case classification process (step S104). The case classification process is a process of dividing the ticket gate log according to the user's action pattern and calculating the probability corresponding to the action pattern corresponding to the case-by-case ticket log. The
ステップS104の場合分け処理により、CPU31は、改札ログを4種類に分類する。これら4種類の改札ログを夫々確定ログ、路線確定ログ、限定ログ及び非限定ログと呼ぶ。
確定ログとは、一意にユーザの行動パターンを確定することができる改札ログである。確定ログは、例えば利用者が乗車した列車の路線と便とが一意に確定する情報を有した改札ログである。
路線確定ログとは、利用者が乗車した列車の路線が一意に確定する情報を有した改札ログである。路線確定ログから利用者が乗車した列車の便は一意に確定しない。
限定ログとは、利用者が乗車した列車の路線と便とが共に一意に確定しないものの、利用者の行動パターンの数を所定数以下に限定することができる情報を有する改札ログである。
非限定ログとは、利用者が乗車した列車の路線と便とが共に一意に確定せず、利用者の行動パターンの数を所定数以下に限定することができない情報を有する改札ログである。
By the case classification process in step S104, the
The confirmation log is a ticket gate log that can uniquely determine a user's action pattern. The confirmation log is, for example, a ticket gate log having information for uniquely determining the route and flight of the train on which the user has boarded.
The route confirmation log is a ticket gate log having information for uniquely determining the route of the train on which the user has boarded. The flight of the train on which the user boarded is not uniquely determined from the route confirmation log.
The limited log is a ticket gate log having information that can limit the number of user behavior patterns to a predetermined number or less, although the route and flight of the train on which the user has boarded are not uniquely determined.
The unrestricted log is a ticket gate log having information in which both the route of the train on which the user has boarded and the flight are not uniquely determined and the number of user behavior patterns cannot be limited to a predetermined number or less.
以下、確定ログ、路線確定ログ、限定ログ及び非限定ログについて、具体的な事例を挙げて説明する。確定ログ、路線確定ログ、限定ログ及び非限定ログの事例紹介の後に、算出装置3が行動パターンを生成する処理及び確率を計算する処理の流れを、フローチャートを用いて説明する。 Hereinafter, specific logs will be described with respect to the fixed log, route fixed log, limited log, and non-limited log. A flow of a process for generating a behavior pattern and a process for calculating a probability after the case introduction of the confirmed log, the route confirmed log, the limited log, and the non-limited log will be described with reference to a flowchart.
図12、図13、図14及び図15は、確定ログを説明するための説明図である。図12は、確定ログに対応する改札ログテーブル1Tのレコード例を示す説明図である。図13は、最短移動時間テーブル2Tのレコード例を示す説明図である。図14は、運行記録テーブル3Tのレコード例を示す説明図である。なお、図14では、途中駅着/発時刻列を省略している。図15は、路線図の一例を示す説明図である。図15は、路線テーブル4Tの情報を視覚化した路線図である。 12, FIG. 13, FIG. 14 and FIG. 15 are explanatory diagrams for explaining the confirmation log. FIG. 12 is an explanatory diagram showing a record example of the ticket gate log table 1T corresponding to the confirmation log. FIG. 13 is an explanatory diagram showing a record example of the shortest movement time table 2T. FIG. 14 is an explanatory diagram showing a record example of the operation record table 3T. In FIG. 14, the train arrival / departure time train is omitted. FIG. 15 is an explanatory diagram showing an example of a route map. FIG. 15 is a route map visualizing the information in the route table 4T.
図12より、利用者はA駅に入場し、B駅から出場したことがわかる。その間の経過時間は10分48秒である。図15より、A駅とB駅とを結ぶ路線はi線とj線との2路線があることがわかる。しかし、経過時間と図13の最短移動時間との比較から、j線の最短移動時間12分は経過時間より長いため、利用者はi線を利用したことが確定する。また、図12の日時と図14の始発駅発時刻及び終着駅到着時刻との比較から、利用者はi線のY便に乗り、C駅で途中下車することなく、B駅に到達したことがわかる。図12の改札ログの日時は、i線のX便及びZ便の運行記録と整合しないからである。従って、図12の改札ログに対応する利用者の行動パターンは、次の1つのみに確定する。
A駅入場・滞在(12:31:14〜12:32)→Y便乗車(12:32〜12:41)→B駅滞在・出場(12:41〜12:42:02)
From FIG. 12, it can be seen that the user has entered A station and has exited from B station. The elapsed time in the meantime is 10 minutes 48 seconds. FIG. 15 shows that there are two routes connecting the A station and the B station, i line and j line. However, from the comparison between the elapsed time and the shortest movement time in FIG. 13, the minimum movement time 12 minutes for the j-line is longer than the elapsed time, so that it is determined that the user has used the i-line. In addition, from the comparison of the date and time in FIG. 12 with the departure time and arrival time at the first station in FIG. 14, the user took Y flight on i line and arrived at B station without getting off at C station. I understand. This is because the date and time of the ticket gate log in FIG. 12 does not match the operation records of the X and Z flights on the i line. Therefore, the user's behavior pattern corresponding to the ticket gate log in FIG.
Station A entrance / stay (12: 31: 14-12: 32) → Y boarding (12: 32-12: 41) → Station B stay / exit (12: 41-12: 42: 02)
図12の改札ログは、一意にユーザの行動パターンを確定することができるため、確定ログとなる。改札ログが確定ログである場合、算出装置3は確定ログに対応する行動パターンに計算結果の確率として1を設定する。
The ticket gate log in FIG. 12 is a confirmation log because a user's behavior pattern can be uniquely determined. When the ticket gate log is a confirmation log, the
図16、図17、図18、図19及び図20は、路線確定ログを説明するための説明図である。図16は、路線確定ログに対応する改札ログテーブル1Tのレコード例を示す説明図である。図17は、最短移動時間テーブル2Tのレコード例を示す説明図である。図18は、運行記録テーブル3Tのレコード例を示す説明図である。図19は、駅設備規模係数テーブル5Tのレコード例を示す説明図である。図20は、路線図の一例を示す説明図である。図20は、路線テーブル4Tの情報を視覚化した路線図である。 16, FIG. 17, FIG. 18, FIG. 19 and FIG. 20 are explanatory diagrams for explaining the route determination log. FIG. 16 is an explanatory diagram showing a record example of the ticket gate log table 1T corresponding to the route confirmation log. FIG. 17 is an explanatory diagram of a record example of the shortest movement time table 2T. FIG. 18 is an explanatory diagram of a record example of the operation record table 3T. FIG. 19 is an explanatory diagram of a record example of the station facility scale coefficient table 5T. FIG. 20 is an explanatory diagram showing an example of a route map. FIG. 20 is a route map visualizing the information in the route table 4T.
図16より、利用者はA駅に入場し、B駅から出場していることがわかる。図20の路線図より、A駅とB駅とを結ぶ路線はi線のみである。従って、図16の改札ログに対応する利用者の行動パターンはi線を利用してA駅からB駅へ移動したパターンであることがわかる。図16の改札ログは、利用者の行動パターンにおける利用路線が一意に確定するため、路線確定ログである。 It can be seen from FIG. 16 that the user has entered A station and has exited from B station. From the route map of FIG. 20, the route connecting the A station and the B station is only the i line. Therefore, it can be seen that the user's behavior pattern corresponding to the ticket gate log in FIG. 16 is a pattern of moving from the A station to the B station using the i line. The ticket gate log in FIG. 16 is a route confirmation log because the use route in the user's behavior pattern is uniquely determined.
図16より、利用者がA駅に入場し、B駅から出場するまでの経過時間は32分4秒である。他方、図17の最短移動時間は9分である。経過時間32分4秒と最短移動時間9分との差は23分4秒であり、利用者が駅構内の店舗で20分以上を過ごした可能性、利用者が複数の便を乗り継いで移動した可能性等が考えられる。
From FIG. 16, the elapsed time from when the user enters the A station to the exit from the B station is 32
そこで、算出装置3は、経過時間と最短移動時間との差が所定時間より長い場合、駅の設備を利用した駅の滞在を含む行動パターンを生成する。ここでは仮に、算出装置3は、経過時間と最短移動時間との差を閾値20分と比較するものとする。算出装置3は、23分4秒と閾値20分とを比較し、経過時間と最短移動時間との差が閾値より長いと判定する。そして、算出装置3は、図20の路線図から利用者がA、C、B駅のいずれかで所定時間以上滞在した行動パターンを生成する。例えば、駅に滞在する所定時間を20分以上に設定した場合、算出装置3は、図20の路線図からA駅での20分以上の滞在、C駅での20分以上の滞在、B駅での20分以上の滞在の3通りの行動パターンの生成を試みる。
Accordingly, when the difference between the elapsed time and the shortest travel time is longer than the predetermined time, the
次に、算出装置3は、駅滞在が20分を超える場合の列車乗車パターンをリストアップする。図16の改札ログと図18の運行記録を照合した場合、A駅での滞在が20分を超えるのは、利用者がXZ便を利用したときのみである。C駅での滞在が20分を超えるのは、利用者がY便に乗りC駅で途中下車し、C駅からXZ便に乗ったときのみである。B駅での滞在が20分を超えるのは、利用者がY便を利用したときのみである。算出装置3は、推定した3つの行動パターンに対して、図19の改札内店舗数に応じた確率を計算する。具体的には、算出装置3は、A駅、B駅及びC駅の改札内店舗数の比率である3:6:4に基づいて、各駅に滞在した場合の行動パターンに対して確率を計算する。
Next, the
上述の3つの行動パターン及び確率を以下に示す。
(1)A駅入場・滞在(12:31:14〜12:53)→XZ便乗車(12:53〜13:02)→B駅滞在・出場(13:02〜13:03:18)
A駅滞在の場合の確率は、(100×3)/(3+6+4)=23.08%である。
(2)A駅入場・滞在(12:31:14〜12:32)→Y便乗車(12:32〜12:36)→C駅滞在(12:36〜12:57)→XZ便乗車(12:57〜13:02)→B駅滞在・出場(13:02〜13:03:18)
C駅滞在の場合の確率は、(100×6)/(3+6+4)=46.15%である。
(3)A駅入場・滞在(12:31:14〜12:32)→Y便乗車(12:32〜12:41)→B駅滞在・出場(12:41〜13:03:18)
B駅滞在の場合の確率は、(100×4)/(3+6+4)=30.77%である。
The above three behavior patterns and probabilities are shown below.
(1) Station A entrance / stay (12: 31: 14-12: 53) → XZ boarding (12: 53-13: 02) → Station B stay / exit (13: 02-13: 03: 18)
The probability of staying at station A is (100 × 3) / (3 + 6 + 4) = 23.08%.
(2) Station A entrance and stay (12: 31: 14-12: 32) → Y flight (12: 32-12: 36) → C station stay (12: 36-12: 57) → XZ boarding ( 12: 57-13: 02) → Station B stay and participation (13: 02-13: 03: 18)
The probability of staying at station C is (100 × 6) / (3 + 6 + 4) = 46.15%.
(3) Station A entrance / stay (12: 31: 14-12: 32) → Y boarding (12: 32-12: 41) → B station stay / exit (12: 41-13: 03: 18)
The probability of staying at station B is (100 × 4) / (3 + 6 + 4) = 30.77%.
上述の事例では、A駅、C駅及びB駅の夫々について、駅での滞在時間が20分を超える行動パターンが複数生成された。他方、滞在時間が20分を超える駅が1つもない場合、算出装置3は駅での所定時間以上の滞在なしの行動パターンとみなし、処理対象の改札ログに類似する改札ログを利用して、各行動パターンに対応する確率を計算する。この類似する改札ログを用いた処理については、限定ログの事例説明において後述する。
In the case described above, a plurality of behavior patterns in which the stay time at the station exceeds 20 minutes are generated for each of the A station, the C station, and the B station. On the other hand, when there is no station where the stay time exceeds 20 minutes, the
上述の路線確定ログの事例では、改札内店舗数を確率算出の基準としたが、改札内店舗数及び店舗の売上金額を確率算出の基準にしてもよい。あるいは、店舗の売上金額のみを確率算出の基準にしてもよい。確率算出の基準にする駅設備規模係数は、改札内で利用可能な設備の数又は内容に応じた数値であればよく、改札内店舗以外の他の設備に係る数値でもよい。
また、自動改札機1を通過するのに電子決済カードが使用され、かつ当該電子決済カードがある駅の改札内店舗で使用された場合、利用者の滞在駅を当該電子決済カードが使用された改札内店舗が位置する駅に確定してもよい。
In the case of the route determination log described above, the number of stores in the ticket gate is used as a criterion for probability calculation, but the number of stores in the ticket gate and the sales amount of the store may be used as a criterion for probability calculation. Alternatively, only the sales amount of the store may be used as a criterion for probability calculation. The station equipment scale factor used as a reference for calculating the probability may be a numerical value corresponding to the number or contents of the equipment that can be used in the ticket gate, and may be a numerical value related to other equipment other than the store in the ticket gate.
In addition, when an electronic payment card is used to pass through the
上述の路線確定ログの事例では、行動パターンが複数生成された。しかし、行動パターンが1通りしか生成されない場合もある。かかる場合、改札ログは、確定ログに分類され、1通りの行動パターンに対して設定される確率は1となる。 In the case of the route determination log described above, a plurality of behavior patterns are generated. However, there are cases where only one behavior pattern is generated. In such a case, the ticket gate log is classified as a fixed log, and the probability set for one action pattern is 1.
上述の路線確定ログの事例では、経過時間と最短移動時間との差は20分という閾値と比較された。当該閾値は、定数としてプログラム1に記述してもよいし、算出装置3がユーザから受け付けてもよい。算出装置3が経過時間及び最短移動時間の差と比較される閾値をユーザから受け付ける場合、CPU31はそのための入力画面(図示せず)を表示部38に表示し、ユーザは操作部39を介して当該入力画面から閾値を入力する。
また、利用者が駅に所定時間以上滞在する行動パターンを生成する場合、当該所定時間は、前記閾値と同じ時間でもよいし、異なる時間でもよい。当該所定時間を前記閾値と異なる時間に設定する場合、当該所定時間はプログラム1に記述してもよいし、算出装置3がユーザから受け付けてもよい。
In the case of the route determination log described above, the difference between the elapsed time and the shortest travel time was compared with a threshold of 20 minutes. The threshold value may be described as a constant in the
Further, when generating an action pattern in which a user stays at a station for a predetermined time or longer, the predetermined time may be the same time as the threshold value or a different time. When the predetermined time is set to a time different from the threshold, the predetermined time may be described in the
上述の路線確定ログの事例では、駅滞在が20分を超える場合の列車乗車パターンは、A、C及びB駅に滞在する場合の夫々について1通りであった。しかし、例えばC駅で20分以上滞在する場合、乗車可能な便が複数あるとき、算出装置3は便の設備の規模又は内容に応じて複数の列車乗車パターンに確率を割り振ってもよい。
In the case of the route determination log described above, the train boarding pattern when the station stay exceeds 20 minutes is one for each of the cases when staying at the A, C, and B stations. However, when staying at station C for 20 minutes or more, for example, when there are a plurality of flights that can be boarded, the
図21、図22、図23及び図24は、限定ログを説明するための説明図である。図21は、限定ログに対応する改札ログテーブル1Tのレコード例を示す説明図である。図22は、最短移動時間テーブル2Tのレコード例を示す説明図である。図23は、運行記録テーブル3Tのレコード例を示す説明図である。図24は、路線図の一例を示す説明図である。図24は、路線テーブル4Tの情報を視覚化した路線図である。 21, FIG. 22, FIG. 23, and FIG. 24 are explanatory diagrams for explaining the limited log. FIG. 21 is an explanatory diagram showing a record example of the ticket gate log table 1T corresponding to the limited log. FIG. 22 is an explanatory diagram showing a record example of the shortest movement time table 2T. FIG. 23 is an explanatory diagram of a record example of the operation record table 3T. FIG. 24 is an explanatory diagram showing an example of a route map. FIG. 24 is a route map visualizing the information in the route table 4T.
図21より、利用者はA駅に入場し、B駅から出場していることがわかる。図24の路線図より、A駅とB駅とを結ぶ路線はi線、j線並びにC駅での乗り換えによるi線及びk線の3路線である。図21の改札ログに基づく経過時間は、21分47秒であり、図22による各路線の最短移動時間と大きな差はない。生成可能な行動パターンは1通りではないので、図21の改札ログは確定ログではない。また、行動パターンに対応する路線は1通りではないので、図21の改札ログは路線確定ログでもない。算出装置3は、図21の改札ログと図23の運行記録とを照合し、運行記録と整合する行動パターンとして次の5パターンを生成する。
From FIG. 21, it can be seen that the user has entered A station and has entered B station. From the route map of FIG. 24, the route connecting the A station and the B station is the i-line, the j-line, and the i-line and the k-line by transfer at the C-station. The elapsed time based on the ticket gate log in FIG. 21 is 21 minutes 47 seconds, which is not significantly different from the shortest travel time of each route according to FIG. Since there is not one action pattern that can be generated, the ticket gate log in FIG. 21 is not a fixed log. Further, since there is not one route corresponding to the behavior pattern, the ticket gate log in FIG. 21 is not a route confirmation log. The
(1)A駅入場・滞在(12:31:14〜12:32)→X便乗車(12:32〜12:41)→B駅滞在・出場(12:41〜12:53:01)
この行動パターンは、i線を利用している。
(2)A駅入場・滞在(12:31:14〜12:40)→Y便乗車(12:40〜12:49)→B駅滞在・出場(12:49〜12:53:01)
この行動パターンは、i線を利用している。
(3)A駅入場・滞在(12:31:14〜12:32)→X便乗車(12:32〜12:37)→C駅滞在(12:37〜12:38)→BB便乗車(12:38〜12:46)→B駅滞在・出場(12:46〜12:53:01)
この行動パターンは、i線及びk線を利用している。
(4)A駅入場・滞在(12:31:14〜12:33)→α便乗車(12:33〜12:45)→B駅滞在・出場(12:45〜12:53:01)
この行動パターンは、j線を利用している。
(5)A駅入場・滞在(12:31:14〜12:40)→β便乗車(12:40〜12:52)→B駅滞在・出場(12:52〜12:53:01)
この行動パターンは、j線を利用している。
(1) Station A entrance / stay (12: 31: 14-12: 32) → boarding X flight (12: 32-12: 41) → station B stay / exit (12: 41-12: 53: 01)
This behavior pattern uses i-line.
(2) Station A entrance / stay (12: 31: 14-12: 40) → boarding Y flight (12: 40-12: 49) → station B stay / exit (12: 49-12: 53: 01)
This behavior pattern uses i-line.
(3) Station A entrance / stay (12: 31: 14-12: 32) → boarding X (12: 32-12: 37) → staying at station C (12: 37-12: 38) → boarding BB ( 12: 38-12: 46) → Stay at B station and participate (12: 46-12: 53: 01)
This behavior pattern uses i-line and k-line.
(4) Station A entrance / stay (12: 31: 14-12: 33) → α boarding (12: 33-12: 45) → B station stay / exit (12: 45-12: 53: 01)
This behavior pattern uses the j-line.
(5) Station A entrance / stay (12: 31: 14-12: 40) → β boarding (12: 40-12: 52) → B station stay / exit (12: 52-12: 53: 01)
This behavior pattern uses the j-line.
利用された路線が一意に確定せず、算出された利用者の行動パターンの数が所定数より多い場合、個々の行動パターンの確実度は低い。かかる場合は、従来のマクロ的な鉄道利用に関する統計情報すなわち鉄道利用指標テーブル6Tに基づいて、利用者が各路線の列車に乗車していた確率及び利用者が各駅の改札内にいた確率を求めることが妥当である。
なお、利用者の行動パターンの数と比較される所定数は、閾値としてプログラム1に記述してもよいし、算出装置3がユーザから受け付けてもよい。算出装置3が行動パターンの数と比較する閾値をユーザから受け付ける場合、CPU31はそのための入力画面(図示せず)を表示部38に表示し、ユーザは操作部39を介して当該入力画面から閾値を入力する。
When the used route is not uniquely determined and the calculated number of behavior patterns of the user is greater than a predetermined number, the certainty of each behavior pattern is low. In such a case, the probability of the user getting on the train of each route and the probability of the user being in the ticket gate of each station are obtained based on the conventional statistical information on the macro railway use, that is, the railway use index table 6T. It is reasonable.
In addition, the predetermined number compared with the number of user's action patterns may be described in the
他方、利用された路線が一意に確定せず、算出された利用者の行動パターンの数が所定数より少ない場合、行動パターンの数に応じて均等に割り振った確率を当該行動パターンに設定することが考えられる。例えば、上述の5パターンの場合、各行動パターンに20%ずつの確率を割り振るのである。しかし、改札ログテーブル1Tに登録されている改札ログの数は一般に膨大であり、改札ログテーブル1Tには処理対象の改札ログに類似する改札ログが含まれている。以下、処理対象の改札ログに類似する改札ログを類似ログと呼ぶ。算出装置3は、類似ログを利用して、後述する確率計算を実行する。
On the other hand, if the route used is not uniquely determined and the number of calculated user behavior patterns is less than the predetermined number, the probability of evenly allocated according to the number of behavior patterns is set in the behavior pattern. Can be considered. For example, in the case of the above five patterns, a probability of 20% is assigned to each action pattern. However, the number of ticket gate logs registered in the ticket gate log table 1T is generally enormous, and the ticket gate log table 1T includes ticket gate logs similar to the ticket gate logs to be processed. Hereinafter, a ticket gate log similar to the ticket gate log to be processed is referred to as a similar log. The
処理対象の改札ログだけではなく、類似ログを複数集めて処理対象の改札ログに対応付けることにより、処理対象の改札ログの母集団は増大し、生成される行動パターンの確実度を向上させることができる。
改札ログは、概念として、乗客の行動を極めて粗くサンプリングした測定結果であるとみなすことができる。サンプリングが粗いため、対象である利用者の行動はよくわからないが、利用者の行動と改札ログとが矛盾することはない。一般に、サンプリングが粗くても、同一対象に対して少しずつサンプリングのタイミングをずらし、何回も測定した場合、測定対象は正確に観測されるようになる。この考え方に基づく場合、同じ行動パターン(便・路線)を測定(改札)し、少しずつサンプリングのタイミング(改札通過時刻)が異なるデータ(改札ログ)を多数集めることにより、利用者の行動の推定結果はより正確になると考えられる。
By collecting not only the ticket gate logs to be processed but also collecting similar logs and associating them with the ticket gate logs to be processed, the population of the ticket gates to be processed will increase and the certainty of the generated action pattern can be improved. it can.
As a concept, the ticket gate log can be regarded as a measurement result of a very rough sampling of passenger behavior. Since the sampling is rough, the behavior of the target user is not well understood, but there is no contradiction between the user behavior and the ticket gate log. In general, even if the sampling is rough, if the sampling timing is gradually shifted with respect to the same object and measurement is performed many times, the measurement object is accurately observed. Based on this concept, the same behavior pattern (flight / route) is measured (ticket gates), and a large number of data (ticket gate logs) with different sampling timings (ticket gate passage times) are collected little by little to estimate user behavior. The result will be more accurate.
第一に考えられる類似ログは、利用者、入場駅及び出場駅が処理対象の改札ログと同じである他の改札ログである。例えば、通勤者、通学者等の行動パターンは、毎日同一であることが普通である。このような通勤者、通学者等の行動パターンに対応して毎日蓄積される改札ログは、第一の類似ログとなる。
通勤・通学・日常的な移動等を考えた場合、同一の利用者は、同一便を利用する可能性が高い。また、同一の利用者が同一便を利用しない場合であっても、同じ路線を利用する可能性が高い。
The similar log considered first is another ticket gate log in which the user, the entry station, and the entry station are the same as the ticket gate log to be processed. For example, the behavior patterns of commuters, commuters, etc. are usually the same every day. The ticket gate log accumulated every day corresponding to such behavior patterns of commuters, commuters, etc. is the first similar log.
When considering commuting, attending school, and daily travel, the same user is likely to use the same flight. In addition, even if the same user does not use the same flight, there is a high possibility of using the same route.
第二に考えられる類似ログは、利用者及び出場駅が処理対象の改札ログと同じである他の改札ログである。処理対象の改札ログと第二の類似ログとに夫々対応する入場駅は異なる。この第二の類似ログに対応する路線は、処理対象の改札ログに対応する路線と異なる可能性がある。しかし、出場駅付近における利用経路は共通している可能性が高いと考えられる。例えば、勤務先又は通学先から利用者が何らかの都合により寄り道して帰宅する場合、入場駅は毎日の行動パターンと異なる駅であっても、出場駅は毎日の行動パターンと同一の駅である可能性が高い。 A second possible similar log is another ticket gate log in which the user and the participating station are the same as the ticket gate log to be processed. The entrance stations corresponding to the ticket gate log to be processed and the second similar log are different. The route corresponding to the second similar log may be different from the route corresponding to the ticket gate log to be processed. However, there is a high possibility that the route used in the vicinity of the participating station is common. For example, when a user departs for some reason from work or school, the entry station may be the same station as the daily action pattern even if the entrance station is a different station from the daily action pattern. High nature.
第三に考えられる類似ログは、出場駅が処理対象の改札ログと同じであり、出場時刻が処理対象の改札ログの出場時刻と近接する他の改札ログである。ここで近接する出場時刻とは、例えば前後1分以内の差を有する時刻のことである。第三の類似ログは、第一及び第二の類似ログのように利用者個人の鉄道利用における規則性に基づく類似データではない。しかし、第三の類似ログに基づく行動パターンは、出場時刻の近接から処理対象の改札ログに基づく行動パターンと出場駅付近における利用者の行動に類似性が考えられる。
利用者が異なる場合であっても、出場時間の近接という条件を付けることにより、第三の類似ログに係る降車時の便は、処理対象の改札ログに基づく行動パターンの便と同一であった可能性が高くなる。
A third possible similar log is another ticket gate log whose entry station is the same as the ticket gate log to be processed and whose entry time is close to the entry time of the ticket gate log to be processed. The adjoining entry time here is a time having a difference within 1 minute before and after, for example. The third similar log is not similar data based on regularity in the user's railway use like the first and second similar logs. However, the behavior pattern based on the third similarity log is considered to be similar to the behavior pattern based on the ticket gate log to be processed from the proximity of the participation time and the user's behavior near the participation station.
Even if the users are different, the flight at the time of disembarkation related to the third similar log was the same as the flight of the action pattern based on the ticket gate log to be processed by attaching the condition that the participation time is close The possibility increases.
なお、処理対象の改札ログと他の改札ログとの類似判定の方法には、他の方法も考えられる。例えば、鉄道を利用する利用者の行動パターンに係る季節、月、曜日、時間帯、利用者の属性等の要素を類似判定に組み込んでもよい。 It should be noted that other methods can be considered as a method for determining the similarity between the ticket gate log to be processed and another ticket gate log. For example, elements such as the season, month, day of the week, time zone, user attribute, etc. related to the behavior pattern of the user using the railway may be incorporated into the similarity determination.
算出装置3は、類似判定基準に従って、改札ログテーブル1Tから処理対象の改札ログに類似する改札ログを抽出する。
以下、具体的に類似ログを抽出する処理の一例を説明する。
算出装置3は、処理対象の改札ログに対し、利用者が同一かつ入場駅及び出場駅が共に共通し、日時の相違が3か月以内である改札ログを改札ログテーブル1Tから抽出する。
算出装置3は、処理対象の改札ログに対し、利用者が同一かつ出場駅が共通し、日時の相違が3か月以内である改札ログを改札ログテーブル1Tから抽出する。
算出装置3は、処理対象の改札ログに対し、利用者が異なり、かつ出場駅が共通し、出場時刻が前後1分以内である改札ログを改札ログテーブル1Tから抽出する。
The
Hereinafter, an example of processing for extracting a similar log will be specifically described.
The
The
The
算出装置3は、処理対象の改札ログ及び抽出した類似ログに重み付与を施す。
処理対象の改札ログと類似ログとの類似性は、第一、第二及び第三の類似ログの順に低くなる。類似性の高い類似ログほど、その行動パターンは処理対象の改札ログに基づいて生成された行動パターンに近接すると考えられる。そこで、算出装置3は、類似性がより高い類似ログにより大きな重みを付与する。そして、算出装置3は、処理対象の改札ログに最大の重みを付与する。
The
The similarity between the ticket gate log to be processed and the similar log decreases in the order of the first, second, and third similar logs. A similar log with higher similarity is considered to be closer to an action pattern generated based on a ticket gate log to be processed. Therefore, the
以下、処理対象の改札ログ及び類似ログに対する具体的な重み付与の一例を説明する。
処理対象の改札ログに100の重みを付与する。
類似ログに付与する重みは、類似ログに基づく行動パターンと処理対象の改札ログに基づく行動パターンとの類似性に応じて、決定する。
利用者が同一かつ曜日が同一の行動パターンに対応する類似ログについては、処理対象の改札ログの利用日に対して、利用日が前後1週間以内の場合は80、前後2週間以内の場合は78、前後3週間以内の場合は76の重みを付与する。以降、利用日が更に1週間隔たる毎に2ずつ付与する重みを減ずる。
利用者が同一かつ曜日が異なる行動パターンに対応する類似ログについては、処理対象の改札ログの利用日に対して、利用日が前後2週間以内の場合は60、前後4週間以内の場合は55、前後6週間以内の場合は50の重みを付与する。以降、利用日が更に2週間隔たる毎に5ずつ付与する重みを減ずる。
利用者が同一かつ時刻のAM/PMが異なる行動パターンに対応する類似ログについては、上記重みに0.5を掛けたものを重みとする。
利用者が同一かつ入場駅が異なる行動パターンに対応する類似ログについては、上記重みに0.5を掛けたものを重みとする。
利用者が異なる行動パターンに対応する類似ログについては、一律に60の重みを付与する。
Hereinafter, an example of giving specific weights to the ticket gate log and the similar log to be processed will be described.
A weight of 100 is assigned to the ticket gate log to be processed.
The weight given to the similar log is determined according to the similarity between the action pattern based on the similar log and the action pattern based on the ticket gate log to be processed.
For similar logs that correspond to behavior patterns with the same user and the same day of the week, if the usage date is within one week before and after the usage date of the ticket gate log to be processed, it is 80, within two weeks before and after 78, if it is within 3 weeks before and after, give a weight of 76. Thereafter, the weight given by 2 is reduced every time the usage date is further separated by one week.
For similar logs that correspond to behavior patterns with the same user and different days of the week, the usage date of the ticket gate log to be processed is 60 if the usage date is within 2 weeks, and 55 if the usage date is within 4 weeks. In the case of within 6 weeks before and after, a weight of 50 is given. Thereafter, the weight to be given by 5 is reduced every use week every two weeks.
For similar logs corresponding to behavior patterns with the same user and different AM / PM at the time, the weight obtained by multiplying the weight by 0.5 is used as the weight.
For similar logs corresponding to behavior patterns with the same user and different entrance stations, the weight obtained by multiplying the weight by 0.5 is used as the weight.
60 weights are uniformly assigned to similar logs corresponding to behavior patterns with different users.
算出装置3は、抽出した類似ログと運行記録テーブル3T等とを照合し、類似ログに基づく行動パターンを生成する。そして、算出装置3は、処理対象の改札ログに基づく行動パターン及び類似ログに基づく行動パターンに対して、確率を計算する。
まず、生成した行動パターンの数で100%の確率を均等割りする。例えば、処理対象の改札ログに基づく行動パターンが2つである場合、夫々50%ずつの確率を割り振りする。また、抽出した類似ログに基づく行動パターンが3つである場合、夫々33.3%ずつの確率を割り振る。以下、行動パターンの数で100%の確率を均等割りした確率をベース確率と呼ぶ。別の言葉で表現した場合、ベース確率は、生成した行動パターンの数の逆数である。
The
First, 100% probability is equally divided by the number of generated behavior patterns. For example, when there are two action patterns based on the ticket gate log to be processed, a probability of 50% is assigned to each. Further, when there are three action patterns based on the extracted similar logs, a probability of 33.3% is assigned to each. Hereinafter, a probability obtained by equally dividing the probability of 100% by the number of behavior patterns is referred to as a base probability. In other words, the base probability is the reciprocal of the number of generated behavior patterns.
次に、算出装置3は、処理対象の改札ログに基づく行動パターンと、類似ログに基づく行動パターンとの対応付けを実行する。ここでの対応付けとは、類似ログに基づく行動パターンにおける重み及びベース確率を処理対象の改札ログの確率に組み込むことである。
算出装置3は、処理対象の改札ログに基づく行動パターンと、類似ログに基づく行動パターンとが完全に一致する場合、そのまま対応付けを行う。算出装置3は、処理対象の改札ログに基づく行動パターンと、類似ログに基づく行動パターンとが完全に一致しない場合、行動パターンの類似性に基づいて、対応付けを場合分けする。ここで、行動パターンの類似性の判断基準は様々なものが設定されてよい。
Next, the
When the behavior pattern based on the ticket gate log to be processed and the behavior pattern based on the similar log completely match, the
以下に、処理対象の改札ログに基づく行動パターンと、類似ログに基づく行動パターンとが完全に一致しない場合における行動パターンの対応付けの一例を示す。
算出装置3は、類似ログに基づく行動パターンにおいて、最終利用便が処理対象の改札ログに基づくいずれの行動パターンの最終利用便とも一致しない場合、対応付けをしない。それは、かかる場合、行動パターンにおける類似度が極めて低いと考えられるからである。なお、対応付けをしない処理は、確率計算上における補正処理でもあるともいえる。
The following shows an example of association of action patterns when an action pattern based on a ticket gate log to be processed and an action pattern based on a similar log do not completely match.
In the behavior pattern based on the similarity log, the
他方、算出装置3は、類似ログに基づく行動パターンの最終利用便が処理対象の改札ログに基づくいずれかの行動パターンの最終利用便と一致する場合、対応付けを実行する。また、算出装置3は、類似ログに基づく行動パターンにおいて、最終利用便が処理対象の改札ログに基づくいずれかの行動パターンの最終利用便と一致しない場合でも、最終利用便の路線が一致する場合には、対応付けを実行する。ただし、算出装置3は、対応付ける場合であっても、類似ログに基づく行動パターンにおける最終利用便又は最終利用便の路線が処理対象の改札ログに基づく複数の行動パターンと一致するときは、次の処理を実行する。すなわち、算出装置3は、類似ログに基づく行動パターンのベース確率を一致する処理対象の改札ログに基づく行動パターンの数で除算し、除算したベース確率を当該対応付け可能な行動パターンに夫々対応付ける。
On the other hand, when the last usage flight of the behavior pattern based on the similarity log matches the last usage flight of any behavior pattern based on the ticket gate log to be processed, the
算出装置3は、対応付けが終了した場合、処理対象の改札ログに基づく各行動パターンに対する確率を、次の(1)式により計算する。
限定ログに係る確率=Σ(重み×ベース確率)/Σ(重み) ・・・(1)
ただし、算出装置3は、(1)式の分母の重みから、対応付けをしない類似ログに基づく行動パターンの重みは除外する。
When the association is completed, the
Probability related to limited log = Σ (weight × base probability) / Σ (weight) (1)
However, the
図25は、限定ログに基づいて生成された各行動パターンに対する確率計算要素を一覧表示した説明図である。
識別子は、各行動パターンを識別する番号である。改札ログの属性は、改札ログのカードID、日時及び重みである。ベース確率は、処理対象の改札ログ及び類似ログに対して均等割りされたベース確率である。行動パターンは、処理対象の改札ログ及び類似ログに基づいて、生成された利用者の行動パターンである。
FIG. 25 is an explanatory diagram showing a list of probability calculation elements for each behavior pattern generated based on the limited log.
The identifier is a number that identifies each behavior pattern. The attributes of the ticket gate log are the card ID, date / time, and weight of the ticket gate log. The base probability is a base probability equally divided for the ticket gate log and the similar log to be processed. The behavior pattern is a behavior pattern of the user generated based on the ticket gate log and the similar log to be processed.
識別子[1]〜[5]に対応する改札ログは、処理対象の改札ログである。
識別子[6]〜[11]に対応する改札ログは、類似ログの例を示している。図25の例では、ID001、3月25日の類似ログ、ID001、3月23日の類似ログ及びID003、4月1日の合計3件の類似ログが抽出されている。カードIDが同一である場合、利用者は同一とみなされるため、1件目の3月25日及び2件目の3月23日の類似ログに対応する利用者は、処理対象の改札ログに対応する利用者と同一である。他方、3件目の4月1日の類似ログに対応する利用者は、処理対象の改札ログに対応する利用者と異なる。
The ticket gate logs corresponding to the identifiers [1] to [5] are the ticket gate logs to be processed.
The ticket gate logs corresponding to the identifiers [6] to [11] are examples of similar logs. In the example of FIG. 25, ID001, a log similar to March 25, ID001, a log similar to March 23, and ID003, a total of three logs similar to April 1, are extracted. If the card IDs are the same, the users are considered to be the same, so the user corresponding to the similar log on March 25 of the first case and March 23 of the second case will be included in the ticket gate log to be processed. It is the same as the corresponding user. On the other hand, the user corresponding to the third similar log on April 1 is different from the user corresponding to the ticket gate log to be processed.
図25の類似ログを、上述の類似ログを抽出する条件例に照らして説明する。
識別子[6]〜[8]に対応する1件目の類似ログは、利用者が同一かつ入場駅及び出場駅が共に共通し、日時の相違が3か月以内である場合に対応する。
識別子[9]に対応する2件目の類似ログは、利用者が同一かつ出場駅が共通し、日時の相違が3か月以内である場合に対応する。
識別子[10]〜[11]に対応する3件目の類似ログは、利用者が異なり、かつ出場駅が共通し、出場時刻が前後1分以内である場合に対応する。
The similar log in FIG. 25 will be described in the light of the condition example for extracting the above-mentioned similar log.
The first similar log corresponding to the identifiers [6] to [8] corresponds to the case where the users are the same, the entrance station and the exit station are common, and the date and time difference is within 3 months.
The second similar log corresponding to the identifier [9] corresponds to the case where the users are the same and the participating stations are common, and the date and time difference is within three months.
The third similar log corresponding to the identifiers [10] to [11] corresponds to a case where the users are different, the participating stations are common, and the participating time is within one minute before and after.
図25の処理対象の改札ログ及び類似ログに付与する重みを、上述の重み付与条件例に照らして説明する。
処理対象の改札ログには、100の重みが付与されている。
識別子[6]〜[8]に対応する1件目の類似ログには、利用者が同一かつ曜日が同一の行動パターンに対応し、利用日が前後1週間以内である場合の類似ログであるとして、80の重みが付与されている。
識別子[10]に対応する2件目の類似ログには、利用者が同一かつ曜日が異なる行動パターンに対応し、利用日が前後2週間以内である場合の重み60に、入場駅が異なる場合の0.5を掛けた30の重みが付与されている。
識別子[10]〜[11]に対応する3件目の類似ログには、利用者が異なる行動パターンに対応し、一律に60の重みが付与されている。
The weights to be given to the ticket gate log and the similar log to be processed in FIG.
A weight of 100 is given to the ticket gate log to be processed.
The first similar log corresponding to the identifiers [6] to [8] is a similar log when the user corresponds to the same action pattern on the day of the week and the use date is within one week before and after. As shown in FIG.
The second similar log corresponding to the identifier [10] corresponds to a behavior pattern in which the user is the same and the day of the week is different, and the entry station is different from the weight 60 when the usage date is within two weeks before and after. A weight of 30 multiplied by 0.5 is given.
The third similar log corresponding to the identifiers [10] to [11] is uniformly assigned a weight of 60 corresponding to different behavior patterns of users.
識別子[1]〜[5]の行動パターンは、図21の改札ログと、図22の最短移動時間、図23の運行記録及び図24の路線図を照合し、生成された5つの行動パターンである。ここでは、処理対象の改札ログを図21の限定ログであるものとする。図21の限定ログに基づいて生成された5つの行動パターンを以下では、元データと呼ぶ。
元データに対するベース確率は、元データの数が5つであるため、100%の確率を均等に割り振り、各20%である。
The action patterns of the identifiers [1] to [5] are five action patterns generated by comparing the ticket gate log in FIG. 21 with the shortest travel time in FIG. 22, the operation record in FIG. 23, and the route map in FIG. is there. Here, it is assumed that the ticket gate log to be processed is the limited log in FIG. The five behavior patterns generated based on the limited log in FIG. 21 are hereinafter referred to as original data.
Since the number of the original data is five, the base probability for the original data is 20%, with 100% probability being equally allocated.
識別子[6]〜[11]の行動パターンは、抽出した類似ログと運行記録等とを照合し、夫々生成されたものとする。
識別子[6]〜[8]に対応する行動パターンの数は3つであるため、これらの行動パターンに対するベース確率は、100%の確率を均等に割り振り、各33.3%である。
識別子[9]に対応する行動パターンの数は1つであるため、この行動パターンに対するベース確率は100%である。
識別子[10]〜[11]に対応する行動パターンの数は2つであるため、これらの行動パターンに対するベース確率は、100%の確率を均等に割り振り、各50%である。
It is assumed that the behavior patterns of the identifiers [6] to [11] are generated by comparing the extracted similar logs with operation records and the like.
Since the number of action patterns corresponding to the identifiers [6] to [8] is three, the base probability for these action patterns is equally allocated 100%, and each is 33.3%.
Since the number of action patterns corresponding to the identifier [9] is one, the base probability for this action pattern is 100%.
Since the number of action patterns corresponding to the identifiers [10] to [11] is two, the base probability for these action patterns is equally allocated 100%, and each is 50%.
元データに対する図25の類似ログに基づいた行動パターンの対応付けについて説明する。
識別子[6]、[7]、[8]の行動パターンは、夫々識別子[1]、[2]、[4]の元データにおける行動パターンと完全一致する。従って、算出装置3は、識別子[6]、[7][8]の行動パターンを、そのまま識別子[1]、[2]、[4]の元データに対応付ける。
識別子[9]の行動パターンは、元データにおける全ての行動パターンと完全一致しない。しかし、識別子[9]の行動パターンにおける最終利用便の路線はi線であり、識別子[1]及び[2]の元データにおける最終利用便のi線と一致する。かかる場合、対応付け可能な元データの数は[1]及び[2]の2つであるため、算出装置3は、識別子[9]の行動パターンに対応するベース確率100%を2で除した50%を、識別子[1]及び[2]の元データに夫々割り振って対応付ける。
The association of action patterns based on the similar log in FIG. 25 to the original data will be described.
The behavior patterns of the identifiers [6], [7], and [8] completely match the behavior patterns in the original data of the identifiers [1], [2], and [4], respectively. Accordingly, the
The behavior pattern of the identifier [9] does not completely match all the behavior patterns in the original data. However, the route of the last used flight in the action pattern of the identifier [9] is the i line, which matches the i line of the last used flight in the original data of the identifiers [1] and [2]. In this case, since the number of original data that can be associated is two [1] and [2], the
識別子[10]の行動パターンは、その最終利用便であるi線のY便が識別子[2]の元データの最終利用便であるi線のY便と一致する。従って、算出装置3は、識別子[10]の行動パターンを識別子[2]の元データに対応付ける。
識別子[11]の行動パターンは、元データにおける全ての行動パターンと完全一致しない。また、識別子[11]の行動パターンにおける最終利用便のzz便は全ての元データに含まれない。更には、識別子[11]の行動パターンにおける最終利用便のl線も全ての元データに含まれない。従って、算出装置3は、識別子[11]の行動パターンをいずれの元データにも対応付けない。
識別子[10]及び[11]の行動パターンに対応する類似ログの重みは60である。しかし、(1)式の分母の計算時に、識別子[11]に対応する重みは除外される。算出装置3は、識別子[11]の行動パターンを元データに対応付けず、識別子[10]の行動パターンのみを考慮した分母とするため、分母におけるその重みを60の半分の30に設定する。
The behavior pattern of the identifier [10] matches the Y flight on the i line that is the last used flight with the Y flight on the i line that is the last used flight of the original data of the identifier [2]. Accordingly, the
The behavior pattern of the identifier [11] does not completely match all the behavior patterns in the original data. Further, the zz flight of the last use flight in the behavior pattern of the identifier [11] is not included in all the original data. Furthermore, the l line of the last used flight in the behavior pattern of the identifier [11] is not included in all the original data. Therefore, the
The weight of the similar log corresponding to the behavior patterns of the identifiers [10] and [11] is 60. However, the weight corresponding to the identifier [11] is excluded when calculating the denominator of the equation (1). The
以上に基づき、(1)式を実行した場合、元データ[1]〜[5]に係る確率は、以下のようになる。
[1](100×20+80×33.3+30×50+60×0)/(100+80+30+30)≒25.68%
[2](100×20+80×33.3+30×50+60×50)/(100+80+30+30)≒38.18%
[3](100×20+80×0+30×0+60×0)/(100+80+30+30)≒8.33%
[4](100×20+80×33.3+30×0+60×0)/(100+80+30+30)≒19.43%
[5](100×20+80×0+30×0+60×0)/(100+80+30+30)≒8.33%
図25の例では、識別子[2]の行動パターンが最も鉄道利用の確率が高いことが示される。
Based on the above, when the expression (1) is executed, the probabilities related to the original data [1] to [5] are as follows.
[1] (100 × 20 + 80 × 33.3 + 30 × 50 + 60 × 0) / (100 + 80 + 30 + 30) ≈25.68%
[2] (100 × 20 + 80 × 33.3 + 30 × 50 + 60 × 50) / (100 + 80 + 30 + 30) ≈38.18%
[3] (100 × 20 + 80 × 0 + 30 × 0 + 60 × 0) / (100 + 80 + 30 + 30) ≈8.33%
[4] (100 × 20 + 80 × 33.3 + 30 × 0 + 60 × 0) / (100 + 80 + 30 + 30) ≈19.43%
[5] (100 × 20 + 80 × 0 + 30 × 0 + 60 × 0) / (100 + 80 + 30 + 30) ≈8.33%
In the example of FIG. 25, it is indicated that the behavior pattern of the identifier [2] has the highest probability of using the railway.
図26、図27、図28及び図29は、非限定ログを説明するための説明図である。図26は、限定ログに対応する改札ログテーブル1Tのレコード例を示す説明図である。図27は、最短移動時間テーブル2Tのレコード例を示す説明図である。図28は、運行記録テーブル3Tのレコード例を示す説明図である。なお、図28では、途中駅着/発時刻列を省略している。図29は、路線図の一例を示す説明図である。図29は、路線テーブル4Tの情報を視覚化した路線図である。 26, 27, 28, and 29 are explanatory diagrams for explaining the non-limited log. FIG. 26 is an explanatory diagram showing a record example of the ticket gate log table 1T corresponding to the limited log. FIG. 27 is an explanatory diagram of a record example of the shortest movement time table 2T. FIG. 28 is an explanatory diagram of a record example of the operation record table 3T. In FIG. 28, the station arrival / departure time train on the way is omitted. FIG. 29 is an explanatory diagram showing an example of a route map. FIG. 29 is a route map visualizing the information in the route table 4T.
図26より、利用者はA駅に入場し、B駅から出場したことがわかる。図29より、A駅とB駅とを結ぶ路線は、i線、j線、k線、i線→k線及びk線→i線の5路線が存在し、図26の改札ログは路線確定ログにはならない。図27より、A駅及びB駅間の最短移動時間は、9〜12分である。他方、図26より、A駅及びB駅間の経過時間は71分12秒であり、最短移動時間よりもかなり長い。図28の運行記録より、列車の運行間隔は数分程度であるため、図26の改札ログから生成可能な利用者の行動パターンの数は非常に多くなる。図26の改札ログに基づいて行動パターンの生成を開始した場合、例えば行動パターンの数の閾値を20にしたとき、図26の改札ログに基づく行動パターンの数は、当該閾値を超える。そこで、算出装置3は、図26の改札ログを非限定ログに分類する。
From FIG. 26, it can be seen that the user entered the A station and entered the B station. From FIG. 29, there are five routes connecting the A station and the B station: i-line, j-line, k-line, i-line → k-line, and k-line → i-line. Does not log. From FIG. 27, the shortest movement time between A station and B station is 9-12 minutes. On the other hand, from FIG. 26, the elapsed time between station A and station B is 71 minutes and 12 seconds, which is considerably longer than the shortest travel time. From the operation record of FIG. 28, since the train operation interval is about several minutes, the number of user action patterns that can be generated from the ticket gate log of FIG. 26 is very large. When generation of an action pattern is started based on the ticket gate log of FIG. 26, for example, when the threshold value of the number of action patterns is 20, the number of action patterns based on the ticket gate log of FIG. 26 exceeds the threshold value. Therefore, the
算出装置3は、多くの改札ログをループ処理する過程で、非限定ログをRAM32に蓄積する。算出装置3は、蓄積した非限定ログを入場駅及び出場駅の区間別に分類し、集計する。算出装置3は、分類かつ集計した限定ログの数、すなわち利用者数を、鉄道利用指標テーブル6Tに基づく各路線及び駅の利用者数の比、すなわち確率で分配する。
鉄道利用指標テーブル6Tは、駅員等による目視及びカメラ観察等からマクロ的に求められた鉄道利用者数が登録されているので、非限定ログに基づく算出装置3の処理はマクロ的なアプローチに従った鉄道利用者数を算出することになる。
The
In the railway usage index table 6T, since the number of railway users obtained macroscopically from visual observation by a station employee or the like, camera observation, etc. is registered, the processing of the
なお、鉄道利用指標テーブル6Tが時間帯別の鉄道利用者数を記憶している場合、算出装置3は、分類かつ集計した限定ログの数を、受付部302が受け付けた処理対象日時に対応する時間帯の鉄道利用者数の比で分配してもよい。
また、算出装置3は、鉄道利用者数算出システムが扱う路線が複数の路線エリアに分割されている場合、当該路線エリア毎に非限定ログを振り分けてもよい。算出装置3は、非限定ログの数を路線エリア別に集計し、集計した非限定ログの数すなわち利用者数を、鉄道利用指標テーブル6Tに基づく各路線及び駅の利用者数の比で分配する。
以上が場合分け処理における確定ログ、路線確定ログ、限定ログ及び非限定ログについての行動パターン生成処理及び確率計算処理である。
When the railway usage index table 6T stores the number of railway users for each time zone, the
Moreover, when the route handled by the railway user number calculation system is divided into a plurality of route areas, the
The above is the action pattern generation process and the probability calculation process for the confirmation log, the route confirmation log, the limited log, and the non-limited log in the case classification process.
図30は、場合分け処理の手順の一例を示すフローチャートである。図30は、図11のステップS104に対応する。
CPU31は、処理対象の改札ログが路線確定ログか否か判定する(ステップS201)。ステップS201において、CPU31は、改札ログに対応する入場駅及び出場駅並びに路線テーブル4Tから、利用者が利用した路線が1通りか否かを判定する。CPU31は、改札ログが路線確定ログであると判定した場合(ステップS201:YES)、路線確定ログ処理を実行し(ステップS202)、リターンする。
FIG. 30 is a flowchart illustrating an example of the procedure of the case classification process. FIG. 30 corresponds to step S104 in FIG.
The
CPU31は、改札ログが路線確定ログでないと判定した場合(ステップS201:NO)、改札ログと最短移動時間テーブル2T、運行記録テーブル3T及び路線テーブル4Tとを照合し、改札ログに対応する未生成の行動パターンを1つ生成する(ステップS203)。CPU31は、カウンタ変数nをインクリメントする(ステップS204)。カウンタ変数nは、生成された行動パターンの数に該当する。CPU31は、nが閾値より大きいか否かを判定する(ステップS205)。CPU31は、nが閾値より大きいと判定した場合(ステップS205:YES)、非限定ログ処理を実行し(ステップS206)、リターンする。
When the
CPU31は、nが閾値より大きくないと判定した場合(ステップS205:NO)、他の行動パターンが生成可能か否かを判定する(ステップS207)。CPU31は、他の行動パターンが生成可能であると判定した場合(ステップS207:YES)、ステップS203に処理を戻す。CPU31は、他の行動パターンが生成可能でないと判定した場合(ステップS207:NO)、nが1か否か判定する(ステップS208)。
When determining that n is not larger than the threshold (step S205: NO), the
CPU31は、nが1であると判定した場合(ステップS208:YES)、確定ログ処理を実行し(ステップS209)、リターンする。CPU31は、nが1でないと判定した場合(ステップS208:NO)、限定ログ処理を実行し(ステップS210)、リターンする。
If the
なお、確定ログ処理は、生成した1つの行動パターンに計算結果の確率として1を設定する処理である。また、確定ログ処理では、CPU31は、入場した駅から列車に乗らず、そのまま出場する行動パターンの場合についても、計算結果の確率として1を設定する。
The confirmation log process is a process of setting 1 as a probability of a calculation result for one generated action pattern. Further, in the confirmation log process, the
ステップS205における閾値は、処理対象の改札ログを非限定ログに振り分けるための境界値である。当該閾値を小さな値に設定した場合、非限定ログの数は増大し、確定ログ及び限定ログの数は減少する。他方、当該閾値を大きな値に設定した場合、非限定ログの数は減少し、確定ログ及び限定ログの数は増大する。非限定ログに基づいた鉄道利用者数の算出は、従来のマクロ的な統計データに依存する。確定ログ及び限定ログに基づいた鉄道利用者数の算出は、ミクロ的な個人の行動を追跡するアプローチに依存する。算出装置3は、マクロ的及びミクロ的処理を併用したハイブリッド処理により鉄道利用者数を算出するが、マクロとミクロとの依存度の割合は、ステップS205における閾値によって調整することができる。算出装置3は、例えば閾値=0と設定した場合、全ての改札ログについて、従来のマクロ的処理から鉄道利用者数を算出することも可能である。
The threshold value in step S205 is a boundary value for distributing the ticket gate log to be processed to an unrestricted log. When the threshold value is set to a small value, the number of non-limited logs increases and the number of confirmed logs and limited logs decreases. On the other hand, when the threshold value is set to a large value, the number of non-limited logs decreases, and the number of confirmed logs and limited logs increases. Calculation of the number of railway users based on unrestricted logs depends on conventional macro statistical data. The calculation of the number of railway users based on the fixed log and the limited log depends on an approach for tracking micro individual behavior. The
図31は、路線確定ログ処理の手順の一例を示すフローチャートである。
CPU31は、処理対象の改札ログの入場時刻と出場時刻とから経過時間を算出する(ステップS301)。CPU31は、改札ログにおける入場駅及び出場駅の間の最短移動時間を、最短移動時間テーブル2Tから検索する(ステップS302)。CPU31は、経過時間と最短移動時間との差が閾値より長いか否かを判定する(ステップS303)。
FIG. 31 is a flowchart illustrating an exemplary procedure of route determination log processing.
The
なお、CPU31は、ステップS303において、作業用フラグに判定結果を格納する。CPU31は、後のステップS307及びステップS310において、当該作業用フラグを参照することにより、行動パターンが所定時間以上駅に滞在するパターンと駅に滞在しないパターンとのどちらのパターンであるかを判別する。
また、ここでの駅滞在とは、駅の改札内に利用者が滞在することである。
In step S303, the
Also, staying at the station here means that the user stays in the ticket gate of the station.
CPU31は、経過時間と最短移動時間との差が閾値より長いと判定した場合(ステップS303:YES)、1つの駅に所定時間以上滞在する未生成の行動パターンを1つ生成する(ステップS304)。ステップS304において、CPU31は、利用者が複数の各駅に所定時間以上滞在するケースはレアケースとして無視する。CPU31は、経過時間と最短移動時間との差が閾値より長くないと判定した場合(ステップS303:NO)、駅に所定時間以上滞在しない未生成の行動パターンを1つ生成する(ステップS305)。
When determining that the difference between the elapsed time and the shortest movement time is longer than the threshold (step S303: YES), the
CPU31は、カウンタ変数lをインクリメントする(ステップS306)。カウンタ変数lは、生成された行動パターンの数に該当する。CPU31は、ステップS303で設定した作業用フラグを参照し、駅滞在あるいは駅未滞在のいずれかのパターンについて、他の行動パターンが生成可能か否かを判定する(ステップS307)。CPU31は、他の行動パターンが生成可能であると判定した場合(ステップS307:YES)、ステップS303で設定した作業用フラグに応じて、ステップS304又はステップS305に処理を戻す。すなわち、CPU31は、作業用フラグが駅滞在のパターンである場合、ステップS304に処理を戻す。CPU31は、作業用フラグが駅滞在でないパターンである場合、ステップS305に処理を戻す。
The
CPU31は、他の行動パターンが生成可能でないと判定した場合(ステップS307:NO)、lが1か否か判定する(ステップS308)。CPU31は、lが1であると判定した場合(ステップS308:YES)、確定ログ処理を実行し(ステップS309)、リターンする。CPU31は、lが1でないと判定した場合(ステップS308:NO)、ステップS303で設定した作業用フラグを参照し、駅滞在のパターンか否かを判定する(ステップS310)。CPU31は、駅滞在のパターンであると判定した場合(ステップS310:YES)、駅設備規模係数テーブル5Tを参照し、生成した各行動パターンに駅の設備を考慮した確率を計算し(ステップS311)、リターンする。CPU31は、駅滞在のパターンでないと判定した場合(ステップS310:NO)、類似ログ処理を実行し(ステップS312)、リターンする。
類似ログ処理は、処理対象の改札ログに対応する類似ログを利用した確率計算処理である。類似ログ処理は、限定ログ処理と同じである。限定ログ処理については後述する。
If the
The similar log process is a probability calculation process using a similar log corresponding to a ticket gate log to be processed. Similar log processing is the same as limited log processing. The limited log process will be described later.
図32は、非限定ログ処理の手順の一例を示すフローチャートである。非限定ログ処理は、広義には図30のステップS206において行われる処理と、図11のステップS106において行われる利用者数集計の一部の処理とを含む。
非限定ログ処理では、非限定ログの数が集計される。しかし、非限定ログの集計数は、図11におけるステップS103からステップS105のループ処理が終了した後でなければ確定しない。図32は、非限定ログの数を集計するための準備処理の手順の一例である。
CPU31は、カウンタ変数mをインクリメントし(ステップS401)、リターンする。カウンタ変数mは非限定ログの数に該当する。
図11におけるステップS103からステップS105のループ処理が終了した時点で、カウンタ変数mには、集計後の非限定ログの数が格納されている。
FIG. 32 is a flowchart illustrating an example of the procedure of non-limiting log processing. The non-limiting log process broadly includes a process performed in step S206 in FIG. 30 and a part of the process for counting the number of users performed in step S106 in FIG.
In the non-limited log process, the number of non-limited logs is totaled. However, the total number of unrestricted logs is not determined until after the loop processing from step S103 to step S105 in FIG. FIG. 32 is an example of a preparation process procedure for counting the number of non-limited logs.
The
When the loop processing from step S103 to step S105 in FIG. 11 is completed, the counter variable m stores the number of unrestricted logs after aggregation.
図33は、非限定ログに基づいた集計処理の手順の一例を示すフローチャートである。図33の手順は、図11におけるステップS106の集計処理の手順の一部である。
CPU31は、カウンタ変数mの値を非限定ログの集計数として確定する(ステップS402)。CPU31は、鉄道利用指標テーブル6Tを参照し、非限定ログの集計数を各路線及び各駅の利用者数に割り振り(ステップS403)、集計処理の一部を終える。
FIG. 33 is a flowchart illustrating an example of a totaling process procedure based on a non-limited log. The procedure of FIG. 33 is a part of the procedure of the aggregation process in step S106 in FIG.
The
なお、抽出した改札ログを1つずつ処理するループに含まれる図32のステップS401において、鉄道利用指標テーブル6Tを参照し、処理対象の非限定ログ各々に各路線及び各駅にいた利用者数の比、すなわち確率を設定してもよい。かかる場合、算出装置3は、図11のステップS106において、図32のステップS401で非限定ログ各々に設定した確率に基づいて利用者数を集計する。
ただし、非限定ログに基づく利用者人数は、マクロ的な統計データに基づいて、各路線及び各駅に分配されるため、図32及び図33のように、集計後の人数を一括して各路線及び各駅に分配した方が処理効率は高い。
In step S401 of FIG. 32 included in the loop for processing the extracted ticket gate logs one by one, the railway usage index table 6T is referred to, and the number of users on each route and each station in each non-limited log to be processed. A ratio, ie probability, may be set. In such a case, the
However, the number of users based on the non-restricted log is distributed to each route and each station on the basis of macroscopic statistical data. Therefore, as shown in FIGS. And the processing efficiency is higher if it is distributed to each station.
図34は、限定ログ処理の手順の一例を示すフローチャートである。図34は、図30のステップS210に対応する。また、図34は、図31のステップS312にも対応する。図34を図31のステップS312に対応させる場合、限定ログを路線確定ログに置き換えればよい。
CPU31は、類似ログ抽出処理を実行する(ステップS501)。類似ログ抽出処理は、処理対象の改札ログに類似する改札ログを改札ログテーブル1Tから抽出する処理である。CPU31は、重み付与処理を実行する(ステップS502)。重み付与処理は、限定ログ及び類似ログに対して、限定ログとの一致度又は類似度に応じた重みを付与する処理である。類似ログ抽出処理及び重み付与処理の詳細については、後述する。
FIG. 34 is a flowchart illustrating an example of the procedure of limited log processing. FIG. 34 corresponds to step S210 in FIG. FIG. 34 also corresponds to step S312 of FIG. When FIG. 34 corresponds to step S312 of FIG. 31, the limited log may be replaced with a route determination log.
The
CPU31は、類似ログと最短移動時間テーブル2T、運行記録テーブル3T及び路線テーブル4Tとを照合し、類似ログに基づく行動パターンを生成する(ステップS503)。
なお、元データに対応する行動パターンの生成は、図30におけるステップS203からステップS207のループ処理で終了している。元データは、処理対象の改札ログに基づいて生成された行動パターンのことである。
図34を図31のステップS312に対応させる場合、元データに対応する行動パターンの生成は、図31のステップS304からステップS307のループ処理で終了している。
The
Note that the generation of the behavior pattern corresponding to the original data is completed in the loop processing from step S203 to step S207 in FIG. The original data is an action pattern generated based on the ticket gate log to be processed.
When FIG. 34 is made to correspond to step S312 of FIG. 31, the generation of the action pattern corresponding to the original data is completed by the loop processing from step S304 to step S307 of FIG.
CPU31は、ベース確率を算出する(ステップS504)。ステップS504において、CPU31は、元データの数で均等に割り振った確率を算出する。またステップS504において、CPU31は、類似ログに基づき生成した行動パターンの数で均等に割り振った確率も算出する。
The
CPU31は、元データの行動パターンと類似ログの行動パターンとを比較し、対応付けを実行する(ステップS505)。ステップS505において、CPU31は、元データの行動パターンと類似ログの行動パターンとが完全一致する場合、完全一致する行動パターン同士を対応付ける。
他方、ステップS505において、CPU31は、類似ログに基づく行動パターンの最終利用便又は最終利用便の路線が夫々元データの最終利用便又は最終利用便の路線に含まれない場合、当該類似ログに基づく行動パターンを利用者が実行した可能性はないと判定する。そして、CPU31は、当該類似ログに基づく行動パターンを元データに対応付けない。
またステップS505において、CPU31は、類似ログに基づく行動パターンの最終利用便又は最終利用便の路線が夫々元データの最終利用便又は最終利用便の路線に含まれる場合、当該類似ログに基づく行動パターンを元データに対応付ける。ただし、対応付け可能な元データが複数存在する場合、CPU31は当該複数の元データに対して処理中の類似ログに基づく行動パターンに対応するベース確率を均等に割り振る。
The
On the other hand, in step S505, when the route of the last use flight or the last use flight of the action pattern based on the similar log is not included in the last use flight or the last use flight route of the original data, the
In step S505, when the last used flight or the route of the last used flight based on the action pattern based on the similar log is included in the last used flight or the last used flight route of the original data, the
CPU31は、(1)式に基づいて、限定ログに係る確率計算を実行する(ステップS506)。CPU31は、計算した確率を元データの行動パターンに設定し(ステップS507)、リターンする。
CPU31 performs the probability calculation which concerns on a limitation log based on (1) Formula (step S506). The
図35は、類似ログ抽出処理の手順の一例を示すフローチャートである。
CPU31は、処理対象の改札ログに対して、カードID、入場駅及び出場駅が夫々一致し、かつ利用日時の相違が3か月以内であるレコードを改札ログテーブル1Tから抽出する(ステップS601)。ここで、カードIDの一致は、利用者の一致を意味する。CPU31は、処理対象の改札ログに対して、カードID及び出場駅が一致し、かつ利用日時の相違が3か月以内であるレコードを改札ログテーブル1Tから抽出する(ステップS602)。ただし、ステップS602において、CPU31は、ステップS601で抽出したレコードは除外する。CPU31は、処理対象の改札ログに対して、カードIDが異なり、出場駅が一致し、かつ出場時刻の相違が1分以内であるレコードを抽出する(ステップS603)。CPU31は、ステップS603の処理が終了した場合、リターンする。
FIG. 35 is a flowchart illustrating an example of a procedure of similar log extraction processing.
The
なお、図35の類似ログ抽出処理における類似ログの判定方法は、他にもあり得る。例えば、ステップS602では、出場駅の一致を判定条件の1つにしているが、出場駅の一致を入場駅の一致に置換してもよい。ステップS603では、出場時刻の相違が1分以内であることを判定条件の1つにしているが、出場時刻の相違が1分以内であることを出場時刻の相違が例えば5分以内であることに置換してもよい。また、図35では、処理対象の改札ログとの類似度に応じて3種類の類似ログのレコードを改札ログテーブル1Tから抽出しているが、1種類、2種類又は4種類以上の類似ログのレコードを改札ログテーブル1Tから抽出してもよい。 Note that there are other similar log determination methods in the similar log extraction process of FIG. For example, in step S602, the match of the entry station is set as one of the determination conditions, but the match of the entry station may be replaced with the match of the entry station. In step S603, one of the determination conditions is that the difference in the entry time is within 1 minute, but the difference in the entry time is within 1 minute, for example, that the difference in the entry time is within 5 minutes. May be substituted. In FIG. 35, three types of similar log records are extracted from the ticket gate log table 1T according to the degree of similarity with the ticket gate log to be processed, but one type, two types, or four or more types of similar log records are extracted. Records may be extracted from the ticket gate log table 1T.
図36は、重み付与処理の手順の一例を示すフローチャートである。
CPU31は、処理対象の改札ログに100の重みを付与する(ステップS701)。ステップS702以降の重み付与処理は、類似ログに重みを付与する処理である。
CPU31は、図35の類似ログ抽出処理が抽出した類似ログから未処理の類似ログを1件選択する(ステップS702)。CPU31は、選択した類似ログのカードIDが処理対象の改札ログのカードIDと同一か否かを判定する(ステップS703)。ここで、カードIDの一致は、利用者の一致を意味する。
FIG. 36 is a flowchart illustrating an example of a weighting process.
The
The
CPU31は、選択した類似ログのカードIDが処理対象の改札ログのカードIDと同一でないと判定した場合(ステップS703:NO)、処理対象の類似ログに60の重みを付与し(ステップS704)、ステップS712に処理を進める。すなわち、CPU31は、処理対象の改札ログに対して、利用者が異なり、利用日が同日の類似ログには、一律に60の重みを付与する。なお、図35の類似ログ抽出処理では、利用者が異なる場合、出場時刻の相違が1分以内の類似ログが抽出されるので、利用者が異なる類似ログは全て利用日も同日である。
If the
CPU31は、選択した類似ログのカードIDが処理対象の改札ログのカードIDと同一であると判定した場合(ステップS703:YES)、類似ログの利用日の曜日が処理対象の改札ログの利用日の曜日と同一か否かを判定する(ステップS705)。CPU31は、類似ログの利用日の曜日が処理対象の改札ログの利用日の曜日と同一であると判定した場合(ステップS705:YES)、処理対象の類似ログに最大80の重みを付与する(ステップS706)。ステップS706において、CPU31は、処理対象の改札ログの利用日に対して、利用日が前後1週間以内の類似ログには80、利用日が前後2週間以内の類似ログには78、利用日が前後3週間以内の類似ログには76の重みを付与する。このように、ステップS706において、CPU31は、処理対象の類似ログに最大80の重みを線形に付与する。
If the
CPU31は、類似ログの利用日の曜日が処理対象の改札ログの利用日の曜日と同一でないと判定した場合(ステップS705:NO)、処理対象の類似ログに最大60の重みを付与する(ステップS707)。ステップS707において、CPU31は、処理対象の改札ログに対して、処理対象の改札ログの利用日に対して、利用日が前後2週間以内の類似ログには60、利用日が前後4週間以内の類似ログには55、利用日が前後6週間以内の類似ログには50の重みを付与する。このように、ステップS707において、CPU31は、処理対象の類似ログに最大60の重みを線形に付与する。
If the
CPU31は、類似ログの利用日時のAM/PMが処理対象の改札ログの利用日時のAM/PMと同一か否かを判定する(ステップS708)。CPU31は、類似ログの利用日時のAM/PMが処理対象の改札ログの利用日時のAM/PMと同一であると判定した場合(ステップS708:YES)、ステップS710に処理を進める。CPU31は、類似ログの利用日時のAM/PMが処理対象の改札ログの利用日時のAM/PMと同一でないと判定した場合(ステップS708:NO)、処理対象の類似ログに付与した重みに0.5を掛け(ステップS709)、ステップS710に処理を進める。
The
CPU31は、類似ログの入場駅が処理対象の改札ログの入場駅と同一か否かを判定する(ステップS710)。CPU31は、類似ログの入場駅が処理対象の改札ログの入場駅と同一であると判定した場合(ステップS710:YES)、ステップS712に処理を進める。CPU31は、類似ログの入場駅が処理対象の改札ログの入場駅と同一でないと判定した場合(ステップS710:NO)、処理対象の類似ログに付与した重みに0.5を掛け(ステップS711)、ステップS712に処理を進める。
The
CPU31は、類似ログ抽出処理が抽出した類似ログについて、未処理の類似ログがあるか否かを判定する(ステップS712)。CPU31は、類似ログ抽出処理が抽出した類似ログについて、未処理の類似ログがあると判定した場合(ステップS712:YES)、ステップS702に処理を戻す。CPU31は、類似ログ抽出処理が抽出した類似ログについて、未処理の類似ログはないと判定した場合(ステップS712:NO)、リターンする。
The
なお、図36の重み付与処理における重み付与の方法は、他にもあり得る。例えば、重み付与処理は、処理対象の改札ログに係る最終利用便の路線と、類似ログに係る最終利用便の路線とが同一か否かを判定する判定処理を含んでもよい。最終利用便の路線が同一である場合は、最終利用便の路線が異なる場合よりも、類似ログに付与する重みを重くする。
また、利用者が異なる場合のステップS704において、改札ログの類似性又は改札ログに基づく行動パターンの類似性に応じて、60以外の重みを付与する分岐処理が追加されてもよい。
Note that there may be other weighting methods in the weighting process of FIG. For example, the weighting process may include a determination process for determining whether the route of the last used flight related to the ticket gate log to be processed is the same as the route of the last used flight related to the similar log. When the route of the last use flight is the same, the weight given to the similar log is made heavier than when the route of the last use flight is different.
Further, in step S704 when the users are different, a branching process for assigning a weight other than 60 may be added according to the similarity of the ticket gate log or the similarity of the action pattern based on the ticket gate log.
処理対象日時で改札ログテーブル1Tから抽出した改札ログに基づいて生成した各行動パターンに対応する確率の計算が終了した場合、処理対象日時の時点での便又は駅における利用者の所在が確率的に表されたことになる。1件の改札ログは1人の利用者に対応するので、1件の改札ログに基づく行動パターンに対して計算された確率は、そのまま利用者1人の期待値となる。算出装置3は、各利用者の各行動パターンに対して計算された確率を集計することにより、各便及び各駅に何人の利用者がいたか算出する。すなわち、算出装置3は、鉄道の利用状況を解析する。
When calculation of the probability corresponding to each action pattern generated based on the ticket gate log extracted from the ticket gate log table 1T at the processing target date and time is completed, the location of the user at the flight or station at the time of the processing target date and time is probabilistic. It will be expressed in. Since one ticket gate log corresponds to one user, the probability calculated for the action pattern based on one ticket gate is the expected value of one user as it is. The
ここで、集計の方法に関しては、大きく2通りの方法が考えられる。1つの集計方法は、1人の利用者について生成した複数の行動パターンとその確率とをそのまま利用する方法である。例えば、1件の改札ログに対して、A行動パターンが70%、B行動パターンが30%という2つの行動パターン及び確率が夫々求められた場合、A行動パターンに0.7人、B行動パターンに0.3人を設定する。行動パターンと確率とが確定した場合、処理対象日時における利用者の所在位置が一意に確率的に確定するため、1件の改札ログからA行動パターンでの位置に0.7人、B行動パターンでの位置に0.3人を夫々加算する。同様の計算を抽出した全改札ログについて繰り返すことにより、処理対象日時における鉄道利用者数がスナップショットとして算出される。 Here, regarding the totaling method, two methods can be considered. One counting method is a method of using a plurality of behavior patterns generated for one user and their probabilities as they are. For example, when two action patterns and probabilities of 70% for the A action pattern and 30% for the B action pattern are respectively obtained for one ticket gate log, 0.7 persons are assigned to the A action pattern, and the B action pattern Set 0.3. When the action pattern and the probability are determined, the location of the user at the processing date and time is determined uniquely and probabilistically. Therefore, 0.7 person at the position of the A action pattern from one ticket gate log, the B action pattern Add 0.3 to each position. By repeating the same calculation for all the extracted ticket gate logs, the number of railway users at the processing date and time is calculated as a snapshot.
もう1つの集計方法は、計算された確率が最も高い行動パターンを唯一の行動パターンに代表させる方法である。この集計方法を上述の例に適用した場合、1件の改札ログについて、確率が最も高いA行動パターンに1人を割り振る。同様の処理を全改札ログについて繰り返す。そして、割り振った利用者数を行動パターン毎に集計することにより、処理対象日時における鉄道利用者数がスナップショットとして算出される。 Another tabulation method is a method in which the behavior pattern having the highest calculated probability is represented as a unique behavior pattern. When this counting method is applied to the above example, one person is assigned to the A action pattern having the highest probability for one ticket gate log. The same process is repeated for all ticket gate logs. Then, by counting the allocated number of users for each behavior pattern, the number of railway users at the processing target date and time is calculated as a snapshot.
算出装置3は、上述の2通りの集計方法を組み合わせて、鉄道利用者数を集計してもよい。例えば、算出装置3は、行動パターンの確率に対応する閾値を定め、当該閾値を境に2通りの集計方法を使い分ける。より具体的には、算出装置3は、生成した複数の行動パターンのうち、ある行動パターンの確率が例えば80%以上である場合は、その行動パターンを唯一の行動パターンとする。他方、算出装置3は、生成した複数の行動パターンの全てが80%未満である場合は、行動パターン毎に確率を集計する。
The
なお、非限定ログに基づく鉄道利用者数は、マクロ的な統計データを適用することにより、図33の手順により各便及び各駅に割り振られる。そこで、算出装置3は、上述のミクロ的に生成した行動パターンの確率から集計した鉄道利用者数に、非限定ログに基づいてマクロ的に算出した鉄道利用者数を加算する。
Note that the number of railway users based on the unrestricted log is allocated to each flight and each station according to the procedure of FIG. 33 by applying macro statistical data. Therefore, the
算出装置3によれば、改札ログに基づいて鉄道利用者数を正確に算出することができる。
算出装置3は、改札ログを確定ログ、路線確定ログ、限定ログ及び非限定ログの4種類に分類する。改札ログに基づいて生成される利用者の行動パターンの確実度は、確定ログ、路線確定ログ、限定ログ及び非限定ログの順に低くなる。確実度が高い確定ログからは1通りの行動パターンが確定する。路線確定ログからは一般に複数の行動パターンが生成され、駅の設備に基づいて各行動パターンに対応する確率が計算される。確実度がやや低い限定ログから生成される行動パターンには、類似ログを利用して確率が計算される。確実度が低い非限定ログから、マクロ的な統計データに応じた利用者数又は確率が求められる。このように、算出装置3は、行動パターンの確実度の違いに応じて改札ログを分類し、分類した改札ログを使い分けることにより、ミクロからマクロまで幅広い算出方法で鉄道利用者数を算出する。
According to the
The
コンピュータである算出装置3を動作させるためのプログラム1Pは、ディスクドライブ34を介して光ディスク3aから読み込まれてもよい。あるいは、プログラム1Pは、通信部36を介して外部の情報処理装置又は記録装置から読み込まれてもよい。更に、プログラム1Pを記録したフラッシュメモリ等の半導体メモリ3cが、算出装置3内に実装されていてもよい。
The
以上の実施の形態に関し、さらに以下の付記を開示する。 Regarding the above embodiment, the following additional notes are disclosed.
(付記1)
鉄道における改札の通過記録に基づいて、鉄道の利用者数を算出する算出装置において、
複数の利用者が改札を通過した入場時刻及び出場時刻を含む通過記録、列車の運行時刻情報、路線の接続関係の情報、鉄道における設備の情報及び利用者数の統計データが記憶された記憶部と、
該記憶部に記憶された通過記録、運行時刻情報及び路線の接続関係の情報に基づいて、該記憶部に記憶された通過記録に係る利用者の便への乗車又は駅の改札内における所定時間以上の滞在に係る行動パターンを一又は複数生成する生成部と、
前記記憶部に記憶された設備の情報、通過記録又は利用者数の統計データに基づいて、前記生成部が生成した行動パターンに対応する行動を利用者が実行した確率を計算する計算部と、
該計算部が計算した確率に基づいて、前記生成部が生成した行動パターンに応じた鉄道の利用者数を算出する算出部と
を備える算出装置。
(Appendix 1)
In the calculation device that calculates the number of users of the railway based on the passage record of the ticket gates in the railway,
A storage unit that stores passage records including entry and departure times when multiple users pass through the ticket gates, train operation time information, route connection information, railway facility information, and statistical data on the number of users When,
Based on the passing record, operation time information, and route connection information stored in the storage unit, a predetermined time in the user's flight or the station ticket gate related to the passing record stored in the storage unit A generation unit that generates one or a plurality of behavior patterns related to the above stay;
Based on the facility information stored in the storage unit, the passage record or the statistical data of the number of users, a calculation unit that calculates the probability that the user has performed the action corresponding to the action pattern generated by the generation unit;
A calculation device comprising: a calculation unit that calculates the number of railway users according to the behavior pattern generated by the generation unit based on the probability calculated by the calculation unit.
(付記2)
日時を受け付ける受付部を更に備え、
前記記憶部に記憶された運行時刻情報は路線別の列車個々の運行時刻を含み、
前記生成部は、入場時刻が前記受付部により受け付けられた日時より前であり、かつ出場時刻が該日時より後である通過記録を用いて、利用者の行動パターンを生成し、
前記計算部は、前記受付部が受け付けた日時に、利用者が前記生成部により生成された行動パターンに係る便に乗車していた確率又は駅の改札内に所定時間以上滞在していた確率を計算し、
前記算出部は、前記受付部が受け付けた日時に、前記生成部が生成した行動パターンに係る便に乗車していた利用者数又は駅の改札内に滞在していた利用者数を算出する
付記1に記載の算出装置。
(Appendix 2)
A reception unit for receiving the date and time;
The operation time information stored in the storage unit includes the operation time of each train by route,
The generation unit generates an action pattern of a user using a passage record in which an entry time is before the date and time accepted by the reception unit and an entry time is after the date and time,
The calculation unit is configured to determine a probability that a user has boarded a flight related to the behavior pattern generated by the generation unit or a probability of staying in a ticket gate of a station for a predetermined time or more at the date and time received by the reception unit. Calculate
The calculation unit calculates the number of users who have boarded a flight related to the behavior pattern generated by the generation unit or the number of users who stayed in the ticket gate at the date and time received by the generation unit. 1. The calculation device according to 1.
(付記3)
前記生成部は、駅の改札内における滞在時間、路線間での列車の乗り換え、路線又は便に基づいて、利用者の行動パターンを生成する
付記2に記載の算出装置。
(Appendix 3)
The calculation device according to
(付記4)
前記記憶部に記憶された列車の運行時刻情報は所定区間における最短移動時間を含み、
前記記憶部に記憶された通過記録及び路線の接続関係の情報に基づいて、利用者の行動パターンにおける利用可能な路線が一通りか否かを判定する第一判定部と、
前記記憶部に記憶された通過記録及び運行時刻情報に基づいて、入場駅から出場駅までの最短移動時間及び入場時刻から出場時刻までの経過時間の時間差が閾値以上であるか否かを判定する第二判定部と
を備え、
前記生成部は、前記第一判定部が一通りと判定し、かつ前記第二判定部が閾値以上であると判定した場合、駅の改札内に所定時間以上滞在する行動パターンを生成する
付記1から付記3までのいずれか一つに記載の算出装置。
(Appendix 4)
The train operation time information stored in the storage unit includes the shortest travel time in a predetermined section,
A first determination unit that determines whether or not there is one route that can be used in the user's behavior pattern, based on the passage record stored in the storage unit and the information on the connection relationship of the route;
Based on the passage record and operation time information stored in the storage unit, it is determined whether or not the time difference between the shortest travel time from the entry station to the entry station and the elapsed time from the entry time to the entry time is greater than or equal to a threshold value. A second determination unit, and
The generating unit generates an action pattern for staying in a ticket gate of a station for a predetermined time or more when the first determining unit determines that the pattern is one and the second determining unit determines that the threshold is equal to or greater than a threshold value. The calculation device according to any one of
(付記5)
前記記憶部に記憶された鉄道における設備の情報は駅の設備の規模又は内容に応じた情報を含み、
前記計算部は前記情報に基づいて確率を計算する
付記1から付記4までのいずれか一つに記載の算出装置。
(Appendix 5)
The information on the facilities in the railway stored in the storage unit includes information corresponding to the scale or contents of the facilities of the station,
The calculation unit according to any one of
(付記6)
前記生成部が生成した行動パターンの数が所定数以下である場合、入場時刻が前記受付部により受け付けられた日時より前であり、かつ出場時刻が該日時より後である通過記録と類似する第二通過記録を前記記憶部から抽出する抽出部と、
前記抽出部が抽出した第二通過記録に、前記通過記録との類似度に応じた重みを付与する重み付与部と、
前記抽出部が抽出した第二通過記録及び前記記憶部の内容に基づいて、該抽出部が抽出した第二通過記録に係る利用者の行動パターンを生成する第二生成部と、
前記生成部及び前記第二生成部が夫々生成した行動パターンの一致度又は類似度に基づいて、該行動パターン同士を対応付ける対応付け部と
を備え、
前記計算部は、前記重み付与部が付与した重み、前記対応付け部が対応付けた行動パターン同士並びに前記生成部及び前記第二生成部が夫々生成した行動パターンの数に基づいて、確率を計算する
付記2又は付記3に記載の算出装置。
(Appendix 6)
If the number of action patterns generated by the generation unit is less than or equal to a predetermined number, the admission time is earlier than the date and time received by the reception unit, and the passing time is similar to the passing record in which the entry time is later than the date and time. An extraction unit for extracting a two-pass record from the storage unit;
A weight assigning unit that assigns a weight according to the degree of similarity to the passing record to the second passing record extracted by the extracting unit;
Based on the second passage record extracted by the extraction unit and the contents of the storage unit, a second generation unit that generates a user's behavior pattern related to the second passage record extracted by the extraction unit;
An association unit that associates the behavior patterns with each other based on the degree of coincidence or similarity between the behavior patterns generated by the generation unit and the second generation unit, respectively.
The calculation unit calculates a probability based on the weight given by the weight assigning unit, the behavior patterns associated by the association unit, and the number of behavior patterns generated by the generation unit and the second generation unit, respectively. The calculation device according to
(付記7)
前記対応付け部は、前記生成部及び前記第二生成部が夫々生成した行動パターンに係る出場駅及び該出場駅に到着した列車の便が同一である場合、該行動パターン同士を対応付ける
付記6に記載の算出装置。
(Appendix 7)
The association unit associates the behavior patterns with each other when the departure station associated with the behavior pattern generated by the generation unit and the second generation unit and the flight of the train that has arrived at the departure station are the same. The calculation device described.
(付記8)
前記計算部は、前記生成部及び前記第二生成部が夫々生成した行動パターンの数に応じた数値各々に基づいて、確率を計算する
付記6又は付記7に記載の算出装置。
(Appendix 8)
The calculation device according to
(付記9)
前記計算部は、前記生成部が生成した行動パターンが一つである場合、計算結果の確率として1を設定する
付記1から付記8までのいずれか一つに記載の算出装置。
(Appendix 9)
The calculation device according to any one of
(付記10)
前記記憶部に記憶された利用者数の統計データは各路線の列車に乗車していた平均利用者数又は各駅の改札内に滞在していた平均利用者数を含み、
前記算出部は、前記生成部が生成した行動パターンの数が所定数を超える場合、前記記憶部に記憶された利用者数の統計データに基づいて、各路線の列車に乗車していた利用者数又は各駅の改札内に滞在していた利用者数を算出する
付記1から付記9までのいずれか一つに記載の算出装置。
(Appendix 10)
The statistical data of the number of users stored in the storage unit includes the average number of users who have been on the train of each route or the average number of users who have stayed in the ticket gates of each station,
When the number of behavior patterns generated by the generation unit exceeds a predetermined number, the calculation unit is based on statistical data on the number of users stored in the storage unit, and the user who has been on the train on each route The calculation device according to any one of
(付記11)
前記記憶部に記憶された列車の運行時刻情報は運行記録又は時刻表を含む
付記1から付記9までのいずれか一つに記載の算出装置。
(Appendix 11)
The train operation time information stored in the storage unit includes an operation record or a timetable. The calculation device according to any one of
(付記12)
鉄道における改札の通過記録が記憶された記憶部を有するコンピュータに鉄道の利用者数を算出する処理を実行させるプログラムにおいて、
複数の利用者が改札を通過した入場時刻及び出場時刻を含む通過記録、列車の運行時刻情報、路線の接続関係の情報、鉄道における設備の情報及び利用者数の統計データが記憶された前記記憶部に係る通過記録、運行時刻情報及び路線の接続関係の情報に基づいて、該記憶部に記憶された通過記録に係る利用者の便への乗車又は駅の改札内における所定時間以上の滞在に係る行動パターンを一又は複数生成し、
前記記憶部に記憶された設備の情報、通過記録又は利用者数の統計データに基づいて、生成した行動パターンに対応する行動を利用者が実行した確率を計算し、
計算した確率に基づいて、生成した行動パターンに応じた鉄道の利用者数を算出する
処理をコンピュータに実行させるプログラム。
(Appendix 12)
In a program for causing a computer having a storage unit that stores a passage record of a ticket gate in a railway to execute a process of calculating the number of users of the railway,
The memory in which a passage record including entrance times and entry times when a plurality of users pass through the ticket gate, train operation time information, route connection information, railway facility information, and statistical data on the number of users is stored. Based on the passage record, operation time information related to the section, and information on the connection relation of the route, boarding the user's flight related to the passage record stored in the storage section or staying for a predetermined time or more in the ticket gate of the station Generate one or more such behavior patterns,
Based on the equipment information stored in the storage unit, the passage record or the statistical data of the number of users, calculate the probability that the user has performed the action corresponding to the generated action pattern,
A program that causes a computer to execute a process of calculating the number of railway users according to the generated behavior pattern based on the calculated probability.
(付記13)
鉄道における改札の通過記録が記憶された記憶部及び制御部を有するコンピュータにより鉄道の利用者数を算出する算出方法において、
複数の利用者が改札を通過した入場時刻及び出場時刻を含む通過記録、列車の運行時刻情報、路線の接続関係の情報、鉄道における設備の情報及び利用者数の統計データが記憶された前記記憶部に係る通過記録、運行時刻情報及び路線の接続関係の情報に基づいて、該記憶部に記憶された通過記録に係る利用者の便への乗車又は駅の改札内における所定時間以上の滞在に係る行動パターンを前記制御部により一又は複数生成し、
前記記憶部に記憶された設備の情報、通過記録又は利用者数の統計データに基づいて、生成した行動パターンに対応する行動を利用者が実行した確率を前記制御部により計算し、
計算した確率に基づいて、生成した行動パターンに応じた鉄道の利用者数を前記制御部により算出する
算出方法。
(Appendix 13)
In a calculation method for calculating the number of railway users by a computer having a storage unit and a control unit in which passage records of ticket gates in a railway are stored,
The memory in which a passage record including entrance times and entry times when a plurality of users pass through the ticket gate, train operation time information, route connection information, railway facility information, and statistical data on the number of users is stored. Based on the passage record, operation time information related to the section, and information on the connection relation of the route, boarding the user's flight related to the passage record stored in the storage section or staying for a predetermined time or more in the ticket gate of the station One or more action patterns are generated by the control unit,
Based on the facility information stored in the storage unit, the passage record or the statistical data of the number of users, the probability that the user has performed the action corresponding to the generated action pattern is calculated by the control unit,
A calculation method for calculating the number of railway users according to the generated behavior pattern by the control unit based on the calculated probability.
(付記14)
生成した行動パターンに基づいて、前記通過記録を前記制御部により分類し、
分類した前記通過記録に応じて、確率を前記制御部により計算する
付記13に記載の算出方法。
(Appendix 14)
Based on the generated behavior pattern, the passing record is classified by the control unit,
The calculation method according to claim 13, wherein a probability is calculated by the control unit in accordance with the classified passage record.
3 算出装置(コンピュータ)
31 CPU(制御部、生成部、計算部、算出部、受付部、第一判定部、第二判定部、抽出部、重み付与部、第二生成部、対応付け部)
34 ハードディスク(記憶部)
1P プログラム
1T 改札ログテーブル
2T 最短移動時間テーブル
3T 運行記録テーブル
4T 路線テーブル
5T 駅設備規模係数テーブル
6T 鉄道利用指標テーブル
3. Calculation device (computer)
31 CPU (control unit, generation unit, calculation unit, calculation unit, reception unit, first determination unit, second determination unit, extraction unit, weight assignment unit, second generation unit, association unit)
34 Hard disk (storage unit)
Claims (10)
複数の利用者が改札を通過した入場時刻及び出場時刻を含む通過記録、列車の運行時刻情報、路線の接続関係の情報、鉄道における設備の情報及び利用者数の統計データが記憶された記憶部と、
該記憶部に記憶された通過記録、運行時刻情報及び路線の接続関係の情報に基づいて、該記憶部に記憶された通過記録に係る利用者の便への乗車又は駅の改札内における所定時間以上の滞在に係る行動パターンを一又は複数生成する生成部と、
前記記憶部に記憶された設備の情報、通過記録又は利用者数の統計データに基づいて、前記生成部が生成した行動パターンに対応する行動を利用者が実行した確率を計算する計算部と、
該計算部が計算した確率に基づいて、前記生成部が生成した行動パターンに応じた鉄道の利用者数を算出する算出部と
を備える算出装置。 In the calculation device that calculates the number of users of the railway based on the passage record of the ticket gates in the railway,
A storage unit that stores passage records including entry and departure times when multiple users pass through the ticket gates, train operation time information, route connection information, railway facility information, and statistical data on the number of users When,
Based on the passing record, operation time information, and route connection information stored in the storage unit, a predetermined time in the user's flight or the station ticket gate related to the passing record stored in the storage unit A generation unit that generates one or a plurality of behavior patterns related to the above stay;
Based on the facility information stored in the storage unit, the passage record or the statistical data of the number of users, a calculation unit that calculates the probability that the user has performed the action corresponding to the action pattern generated by the generation unit;
A calculation device comprising: a calculation unit that calculates the number of railway users according to the behavior pattern generated by the generation unit based on the probability calculated by the calculation unit.
前記記憶部に記憶された運行時刻情報は路線別の列車個々の運行時刻を含み、
前記生成部は、入場時刻が前記受付部により受け付けられた日時より前であり、かつ出場時刻が該日時より後である通過記録を用いて、利用者の行動パターンを生成し、
前記計算部は、前記受付部が受け付けた日時に、利用者が前記生成部により生成された行動パターンに係る便に乗車していた確率又は駅の改札内に所定時間以上滞在していた確率を計算し、
前記算出部は、前記受付部が受け付けた日時に、前記生成部が生成した行動パターンに係る便に乗車していた利用者数又は駅の改札内に滞在していた利用者数を算出する
請求項1に記載の算出装置。 A reception unit for receiving the date and time;
The operation time information stored in the storage unit includes the operation time of each train by route,
The generation unit generates an action pattern of a user using a passage record in which an entry time is before the date and time accepted by the reception unit and an entry time is after the date and time,
The calculation unit is configured to determine a probability that a user has boarded a flight related to the behavior pattern generated by the generation unit or a probability of staying in a ticket gate of a station for a predetermined time or more at the date and time received by the reception unit. Calculate
The calculation unit calculates the number of users who have boarded a flight related to the behavior pattern generated by the generation unit or the number of users who stayed in a ticket gate at the date and time received by the reception unit. Item 2. The calculation device according to Item 1.
請求項2に記載の算出装置。 The calculation device according to claim 2, wherein the generation unit generates a behavior pattern of a user based on a stay time in a ticket gate of a station, a train transfer between routes, a route or a flight.
前記記憶部に記憶された通過記録及び路線の接続関係の情報に基づいて、利用者の行動パターンにおける利用可能な路線が一通りか否かを判定する第一判定部と、
前記記憶部に記憶された通過記録及び運行時刻情報に基づいて、入場駅から出場駅までの最短移動時間及び入場時刻から出場時刻までの経過時間の時間差が閾値以上であるか否かを判定する第二判定部と
を備え、
前記生成部は、前記第一判定部が一通りと判定し、かつ前記第二判定部が閾値以上であると判定した場合、駅の改札内に所定時間以上滞在する行動パターンを生成する
請求項1から請求項3までのいずれか一項に記載の算出装置。 The train operation time information stored in the storage unit includes the shortest travel time in a predetermined section,
A first determination unit that determines whether or not there is one route that can be used in the user's behavior pattern, based on the passage record stored in the storage unit and the information on the connection relationship of the route;
Based on the passage record and operation time information stored in the storage unit, it is determined whether or not the time difference between the shortest travel time from the entry station to the entry station and the elapsed time from the entry time to the entry time is greater than or equal to a threshold value. A second determination unit, and
The generation unit generates an action pattern for staying in a ticket gate of a station for a predetermined time or more when the first determination unit determines that the pattern is one and the second determination unit determines that the threshold is equal to or greater than a threshold value. The calculation device according to any one of claims 1 to 3.
前記計算部は前記情報に基づいて確率を計算する
請求項1から請求項4までのいずれか一項に記載の算出装置。 The information on the facilities in the railway stored in the storage unit includes information corresponding to the scale or contents of the facilities of the station,
The calculation device according to any one of claims 1 to 4, wherein the calculation unit calculates a probability based on the information.
前記抽出部が抽出した第二通過記録に、前記通過記録との類似度に応じた重みを付与する重み付与部と、
前記抽出部が抽出した第二通過記録及び前記記憶部の内容に基づいて、該抽出部が抽出した第二通過記録に係る利用者の行動パターンを生成する第二生成部と、
前記生成部及び前記第二生成部が夫々生成した行動パターンの一致度又は類似度に基づいて、該行動パターン同士を対応付ける対応付け部と
を備え、
前記計算部は、前記重み付与部が付与した重み、前記対応付け部が対応付けた行動パターン同士並びに前記生成部及び前記第二生成部が夫々生成した行動パターンの数に基づいて、確率を計算する
請求項2又は請求項3に記載の算出装置。 If the number of action patterns generated by the generation unit is less than or equal to a predetermined number, the admission time is earlier than the date and time received by the reception unit, and the passing time is similar to the passing record in which the entry time is later than the date and time. An extraction unit for extracting a two-pass record from the storage unit;
A weight assigning unit that assigns a weight according to the degree of similarity to the passing record to the second passing record extracted by the extracting unit;
Based on the second passage record extracted by the extraction unit and the contents of the storage unit, a second generation unit that generates a user's behavior pattern related to the second passage record extracted by the extraction unit;
An association unit that associates the behavior patterns with each other based on the degree of coincidence or similarity between the behavior patterns generated by the generation unit and the second generation unit, respectively.
The calculation unit calculates a probability based on the weight given by the weight assigning unit, the behavior patterns associated by the association unit, and the number of behavior patterns generated by the generation unit and the second generation unit, respectively. The calculation device according to claim 2 or 3.
請求項6に記載の算出装置。 The association unit associates the behavior patterns with each other when the departure station related to the behavior pattern generated by the generation unit and the second generation unit is the same as the flight of the train that has arrived at the departure station. The calculation device described in 1.
請求項6又は請求項7に記載の算出装置。 The calculation device according to claim 6, wherein the calculation unit calculates a probability based on each of numerical values corresponding to the number of action patterns generated by the generation unit and the second generation unit, respectively.
複数の利用者が改札を通過した入場時刻及び出場時刻を含む通過記録、列車の運行時刻情報、路線の接続関係の情報、鉄道における設備の情報及び利用者数の統計データが記憶された前記記憶部に係る通過記録、運行時刻情報及び路線の接続関係の情報に基づいて、該記憶部に記憶された通過記録に係る利用者の便への乗車又は駅の改札内における所定時間以上の滞在に係る行動パターンを一又は複数生成し、
前記記憶部に記憶された設備の情報、通過記録又は利用者数の統計データに基づいて、生成した行動パターンに対応する行動を利用者が実行した確率を計算し、
計算した確率に基づいて、生成した行動パターンに応じた鉄道の利用者数を算出する
処理をコンピュータに実行させるプログラム。 In a program for causing a computer having a storage unit that stores a passage record of a ticket gate in a railway to execute a process of calculating the number of users of the railway,
The memory in which a passage record including entrance times and entry times when a plurality of users pass through the ticket gate, train operation time information, route connection information, railway facility information, and statistical data on the number of users is stored. Based on the passage record, operation time information related to the section, and information on the connection relation of the route, boarding the user's flight related to the passage record stored in the storage section or staying for a predetermined time or more in the ticket gate of the station Generate one or more such behavior patterns,
Based on the equipment information stored in the storage unit, the passage record or the statistical data of the number of users, calculate the probability that the user has performed the action corresponding to the generated action pattern,
A program that causes a computer to execute a process of calculating the number of railway users according to the generated behavior pattern based on the calculated probability.
複数の利用者が改札を通過した入場時刻及び出場時刻を含む通過記録、列車の運行時刻情報、路線の接続関係の情報、鉄道における設備の情報及び利用者数の統計データが記憶された前記記憶部に係る通過記録、運行時刻情報及び路線の接続関係の情報に基づいて、該記憶部に記憶された通過記録に係る利用者の便への乗車又は駅の改札内における所定時間以上の滞在に係る行動パターンを前記制御部により一又は複数生成し、
前記記憶部に記憶された設備の情報、通過記録又は利用者数の統計データに基づいて、生成した行動パターンに対応する行動を利用者が実行した確率を前記制御部により計算し、
計算した確率に基づいて、生成した行動パターンに応じた鉄道の利用者数を前記制御部により算出する
算出方法。 In a calculation method for calculating the number of railway users by a computer having a storage unit and a control unit in which passage records of ticket gates in a railway are stored,
The memory in which a passage record including entrance times and entry times when a plurality of users pass through the ticket gate, train operation time information, route connection information, railway facility information, and statistical data on the number of users is stored. Based on the passage record, operation time information related to the section, and information on the connection relation of the route, boarding the user's flight related to the passage record stored in the storage section or staying for a predetermined time or more in the ticket gate of the station One or more action patterns are generated by the control unit,
Based on the facility information stored in the storage unit, the passage record or the statistical data of the number of users, the probability that the user has performed the action corresponding to the generated action pattern is calculated by the control unit,
A calculation method for calculating the number of railway users according to the generated behavior pattern by the control unit based on the calculated probability.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012012448A JP5929231B2 (en) | 2012-01-24 | 2012-01-24 | Calculation device, program, and calculation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012012448A JP5929231B2 (en) | 2012-01-24 | 2012-01-24 | Calculation device, program, and calculation method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013152567A true JP2013152567A (en) | 2013-08-08 |
JP5929231B2 JP5929231B2 (en) | 2016-06-01 |
Family
ID=49048867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012012448A Expired - Fee Related JP5929231B2 (en) | 2012-01-24 | 2012-01-24 | Calculation device, program, and calculation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5929231B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016222114A (en) * | 2015-05-29 | 2016-12-28 | 株式会社日立製作所 | Data processing system and data processing method |
JP2019114294A (en) * | 2019-03-29 | 2019-07-11 | 株式会社東芝 | Ticket examination monitoring system |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002187551A (en) * | 2000-12-19 | 2002-07-02 | Omron Corp | Simulation device |
JP2005212641A (en) * | 2004-01-30 | 2005-08-11 | Mitsubishi Electric Corp | Station congestion degree estimation system |
JP2005284378A (en) * | 2004-03-26 | 2005-10-13 | Central Japan Railway Co | Device for estimating number of passengers by train and by between stations, and computer readable storage medium storing program for the same |
JP2008062729A (en) * | 2006-09-06 | 2008-03-21 | Railway Technical Res Inst | Program and simulation device |
-
2012
- 2012-01-24 JP JP2012012448A patent/JP5929231B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002187551A (en) * | 2000-12-19 | 2002-07-02 | Omron Corp | Simulation device |
JP2005212641A (en) * | 2004-01-30 | 2005-08-11 | Mitsubishi Electric Corp | Station congestion degree estimation system |
JP2005284378A (en) * | 2004-03-26 | 2005-10-13 | Central Japan Railway Co | Device for estimating number of passengers by train and by between stations, and computer readable storage medium storing program for the same |
JP2008062729A (en) * | 2006-09-06 | 2008-03-21 | Railway Technical Res Inst | Program and simulation device |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016222114A (en) * | 2015-05-29 | 2016-12-28 | 株式会社日立製作所 | Data processing system and data processing method |
JP2019114294A (en) * | 2019-03-29 | 2019-07-11 | 株式会社東芝 | Ticket examination monitoring system |
Also Published As
Publication number | Publication date |
---|---|
JP5929231B2 (en) | 2016-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6872331B2 (en) | Evaluation system and evaluation method | |
JP5986641B2 (en) | Traffic analysis system | |
US10430736B2 (en) | System and method for estimating a dynamic origin-destination matrix | |
JP6178226B2 (en) | Human flow guidance system and human flow guidance method | |
Ali et al. | Travel behavior analysis using smart card data | |
Guo et al. | Efficiency assessment of transit-oriented development by data envelopment analysis: Case study on the Den-en Toshi line in Japan | |
JP5543849B2 (en) | Server and computer program | |
JP6675860B2 (en) | Data processing method and data processing system | |
JP6301864B2 (en) | Evaluation system and operation information evaluation method | |
Wan et al. | Rider perception of a “light” bus rapid transit system-The New York City select bus service | |
Liu et al. | Smart card data-centric replication of the multi-modal public transport system in Singapore | |
JP5947596B2 (en) | Passenger flow information generation system and passenger flow information generation method | |
Xue et al. | Identifying tourists from public transport commuters | |
Klier et al. | Urban public transit network optimization with flexible demand | |
JP2012242997A (en) | Transfer time calculation system and transfer time calculation method | |
JP6307376B2 (en) | Traffic analysis system, traffic analysis program, and traffic analysis method | |
JP2012073976A (en) | Information service device, information service method, and information service system | |
Eom et al. | Analysis of public transit service performance using transit smart card data in Seoul | |
JP5929231B2 (en) | Calculation device, program, and calculation method | |
Kim et al. | Predicting express train choice of metro passengers from smart card data | |
Nasiboglu et al. | Origin-destination matrix generation using smart card data: Case study for Izmir | |
Mosallanejad et al. | Origin-destination estimation of bus users by smart card data | |
JP2018010454A (en) | Congestion degree prediction device, congestion degree prediction information delivery system, and congestion degree prediction method | |
JP5953922B2 (en) | Usage status calculation program, usage status calculation method, and usage status calculation device | |
JP2023163494A (en) | Information processing method, program, and information processor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141007 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150901 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151023 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160418 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5929231 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |