JP2021043641A - Information processing device, system, method and program - Google Patents
Information processing device, system, method and program Download PDFInfo
- Publication number
- JP2021043641A JP2021043641A JP2019164543A JP2019164543A JP2021043641A JP 2021043641 A JP2021043641 A JP 2021043641A JP 2019164543 A JP2019164543 A JP 2019164543A JP 2019164543 A JP2019164543 A JP 2019164543A JP 2021043641 A JP2021043641 A JP 2021043641A
- Authority
- JP
- Japan
- Prior art keywords
- information
- target location
- wireless terminal
- information processing
- people
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 75
- 238000000034 method Methods 0.000 title claims description 33
- 238000004891 communication Methods 0.000 claims abstract description 57
- 238000001514 detection method Methods 0.000 claims description 62
- 230000007812 deficiency Effects 0.000 claims description 59
- 238000004458 analytical method Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 15
- 238000010801 machine learning Methods 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 10
- 238000012886 linear function Methods 0.000 claims description 7
- 230000007547 defect Effects 0.000 claims description 4
- 230000002776 aggregation Effects 0.000 abstract description 19
- 238000004220 aggregation Methods 0.000 abstract description 19
- 238000012545 processing Methods 0.000 abstract description 9
- 230000008569 process Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 230000007704 transition Effects 0.000 description 7
- 238000010295 mobile communication Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000010219 correlation analysis Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000005314 correlation function Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、施設における利用者が通過する対象箇所の通過人数を推定する情報処理装置、システム、方法及びプログラムに関するものである。 The present invention relates to an information processing device, a system, a method and a program for estimating the number of people passing through a target location where a user in a facility passes.
従来、駅の自動改札機を通過する通過人員データを集計するシステムが知られている。例えば、特許文献1には、駅ごとに設けられた入場制限装置と、ゲート開閉によって利用者の駅内への入場を制御する自動改札機とが、駅内ネットワークで接続され、各駅の自動改札機におけるゲート通過人員数を入場制限装置において集計して通過人員データとして入場制限データ生成装置に送信するシステムが開示されている。 Conventionally, there is known a system that aggregates data on the number of people passing through an automatic ticket gate at a station. For example, in Patent Document 1, an admission restriction device provided for each station and an automatic ticket gate that controls the user's entry into the station by opening and closing the gate are connected by an in-station network, and the automatic ticket gate of each station is connected. A system is disclosed in which the number of people passing through a gate in an aircraft is aggregated by an admission restriction device and transmitted as passing personnel data to an admission restriction data generator.
従来の自動改札機は、駅で乗降する利用者の通過時に磁気乗車券やIC乗車券(ICカード)などの券種、普通乗車券や定期券などの種類などを自動的に判別し、利用者から正しく運賃を収受する。自動改札機で読み書きしたデータは、乗車券の種類ごとに異なる複数のデータ集計用PC装置に集計されて保存される。そのため、自動改札機を実際に通過した通過人数を把握するには、複数のデータ集計用PC装置に保存されているデータをそれぞれ読み出して集計する煩雑なデータ処理が必要になる、という課題がある。 Conventional automatic ticket gates automatically determine the type of ticket such as a magnetic ticket or IC ticket (IC card), the type of ordinary ticket or commuter pass, etc. when a user getting on and off at a station passes by, and use it. Correctly collect the fare from the person. The data read and written by the automatic ticket gate is aggregated and stored in a plurality of data aggregation PC devices different for each type of ticket. Therefore, in order to grasp the number of people who have actually passed through the automatic ticket gate, there is a problem that complicated data processing is required to read and aggregate the data stored in each of the plurality of data aggregation PC devices. ..
本発明の一態様に係る情報処理装置は、施設における利用者が通過する対象箇所の通過人数を推定する情報処理装置である。この情報処理装置は、前記対象箇所又はその近傍に設けられた近距離無線通信のアクセスポイント装置から、前記アクセスポイント装置が推定対象時間内に検知した無線端末装置の検知数の情報を取得する情報取得部と、前記無線端末装置の検知数から前記対象箇所の通過人数を推定する推定モデルのパラメータの値を記憶する記憶部と、前記パラメータの値を含む推定モデルと、前記推定対象時間内の前記無線端末装置の検知数の情報とに基づいて、前記推定対象時間内に前記対象箇所を通過した通過人数を推定する推定部と、を備える。 The information processing device according to one aspect of the present invention is an information processing device that estimates the number of people passing through a target location where a user in a facility passes. This information processing device acquires information on the number of detections of the wireless terminal device detected by the access point device within the estimated target time from the access point device for short-range wireless communication provided at or near the target location. An acquisition unit, a storage unit that stores parameter values of an estimation model that estimates the number of people passing through the target location from the number of detections of the wireless terminal device, an estimation model that includes the parameter values, and an estimation target time within the estimation target time. It is provided with an estimation unit that estimates the number of people passing through the target location within the estimation target time based on the information on the number of detections of the wireless terminal device.
前記情報処理装置において、前記アクセスポイント装置が所定時間内に検知した無線端末装置の検知数の情報と、前記対象箇所を前記所定時間内に実際に通過した人数を集計した通過人数の情報とに基づいて、前記推定モデルのパラメータの値を決定する決定部を、更に備えてもよい。ここで、前記対象箇所を前記所定時間内に実際に通過した人数を集計した実数の情報を取得する実数情報取得部を更に備えてもよい。 In the information processing device, the information on the number of detected wireless terminal devices detected by the access point device within a predetermined time and the information on the number of passing persons obtained by totaling the number of people who actually passed the target location within the predetermined time. Based on this, a determination unit for determining the values of the parameters of the estimation model may be further provided. Here, a real number information acquisition unit may be further provided to acquire real number information obtained by totaling the number of people who have actually passed through the target location within the predetermined time.
前記情報処理装置において、前記推定モデルは、前記通過人数を前記無線端末装置の検知数の一次関数で表すモデルであってもよい。
ここで、前記一次関数の傾きを表すパラメータは、前記無線端末装置に対応する通信キャリアの市場占有率であるキャリアシェア率と、前記無線端末装置の近距離無線機能ON率と、前記キャリアシェア率及び前記近距離無線機能ON率以外の理由で前記アクセスポイント装置が前記無線端末装置を検知できない程度を示す欠損度と、を含み、前記決定部は、前記アクセスポイント装置が所定時間内に検知した無線端末装置の検知数の情報と前記実数の情報とに基づいて次の(1)式を用いて前記欠損度を計算して決定し、前記推定部は、次の(2)式を用いて前記通過人数を推定してもよい。
Here, the parameters representing the inclination of the linear function are the carrier share rate, which is the market occupancy rate of the communication carrier corresponding to the wireless terminal device, the short-range wireless function ON rate of the wireless terminal device, and the carrier share rate. The determination unit includes the degree of defect indicating the degree to which the access point device cannot detect the wireless terminal device for reasons other than the short-range wireless function ON rate, and the determination unit detects the access point device within a predetermined time. Based on the information on the number of detections of the wireless terminal device and the information on the real number, the degree of deficiency is calculated and determined using the following equation (1), and the estimation unit uses the following equation (2). The number of people passing by may be estimated.
前記情報処理装置において、前記推定モデルのパラメータの値は、前記対象箇所の通過人数の推定に影響する互いに異なる複数の条件のそれぞれについて決定され、前記推定部は、前記複数の条件から前記推定対象時間に対応する条件を選択し、前記選択した条件に対応する前記パラメータの値を含む推定モデルを、前記通過人数の推定に用いてもよい。
前記条件の項目は、時間帯及び曜日の少なくとも一方を含んでもよい。また、前記条件の項目は、前記対象箇所付近の混雑度及び前記対象箇所を通過する人の歩行速度の統計値の少なくとも一方を含んでもよい。
In the information processing apparatus, the value of the parameter of the estimation model is determined for each of a plurality of different conditions that affect the estimation of the number of people passing through the target location, and the estimation unit determines the estimation target from the plurality of conditions. A time-corresponding condition may be selected and an estimation model containing the value of the parameter corresponding to the selected condition may be used to estimate the number of passersby.
The item of the condition may include at least one of a time zone and a day of the week. In addition, the item of the condition may include at least one of the statistical value of the degree of congestion in the vicinity of the target location and the walking speed of a person passing through the target location.
前記情報処理装置において、前記推定モデルは、前記無線端末装置の検知数の情報と前記対象箇所の通過人数の推定に影響する複数種類の条件の情報とを環境変数とし、前記対象箇所の通過人数を目的変数とする機械学習モデルであり、前記アクセスポイント装置が所定時間内に検知した無線端末装置の検知数の情報と、前記対象箇所の通過人数の推定に影響する複数種類の条件の情報と、前記対象箇所の実際の通過人数の情報とを含む複数の学習用データを用いて、前記機械学習モデルのパラメータの値を決定してもよい。 In the information processing device, the estimation model uses information on the number of detections of the wireless terminal device and information on a plurality of types of conditions that affect the estimation of the number of people passing through the target location as environmental variables, and the number of people passing through the target location. This is a machine learning model in which the target variable is information on the number of detected wireless terminal devices detected by the access point device within a predetermined time, and information on a plurality of types of conditions that affect the estimation of the number of people passing through the target location. , The value of the parameter of the machine learning model may be determined by using a plurality of learning data including information on the actual number of people passing through the target location.
前記情報処理装置において、前記推定対象時間内に検知された前記無線端末装置の利用者の属性情報に基づいて、前記対象箇所を通過した人の集団について属性分析を行う分析部を、更に備えてもよい。 The information processing device is further provided with an analysis unit that performs attribute analysis on a group of people who have passed the target location based on the attribute information of the user of the wireless terminal device detected within the estimated target time. May be good.
本発明の他の態様に係る情報処理装置は、施設における利用者が通過する対象箇所を通過した人を分析する情報処理装置であって、前記対象箇所の近傍に設けられた近距離無線通信のアクセスポイント装置が検知した複数の無線端末装置について、前記無線端末装置の利用者の属性情報を記憶する記憶部と、前記複数の無線端末装置の利用者の属性情報に基づいて、前記対象箇所を通過した人の集団について属性分析を行う分析部と、を備える。 The information processing device according to another aspect of the present invention is an information processing device that analyzes a person who has passed a target location where a user in a facility passes, and is provided in the vicinity of the target location for short-range wireless communication. With respect to the plurality of wireless terminal devices detected by the access point device, the target location is determined based on the storage unit that stores the attribute information of the user of the wireless terminal device and the attribute information of the user of the plurality of wireless terminal devices. It is equipped with an analysis unit that performs attribute analysis on a group of people who have passed.
前記属性情報は、前記利用者の性別、年齢及び居住地の少なくとも一つの情報を含んでもよい。 The attribute information may include at least one piece of information on the gender, age and place of residence of the user.
本発明の更に他の態様に係るシステムは、前記いずれかの情報処理装置と前記アクセスポイント装置とを備える。 The system according to still another aspect of the present invention includes any of the information processing devices and the access point device.
本発明の更に他の態様に係る方法は、施設における利用者が通過する対象箇所の通過人数を推定する方法である。この方法は、前記対象箇所又はその近傍に設けられた近距離無線通信のアクセスポイント装置から、前記アクセスポイント装置が推定対象時間内に検知した無線端末装置の検知数の情報を取得することと、前記無線端末装置の検知数から前記対象箇所の通過人数を推定する推定モデルのパラメータの値を記憶することと、前記パラメータの値を含む推定モデルと、前記推定対象時間内の前記無線端末装置の検知数の情報とに基づいて、前記推定対象時間内に前記対象箇所を通過した通過人数を推定することと、を含む。
前記方法において、前記アクセスポイント装置が所定時間内に検知した無線端末装置の検知数の情報と、前記対象箇所を前記所定時間内に実際に通過した人数を集計した通過人数の情報とに基づいて、前記推定モデルのパラメータの値を決定することを更に含んでもよい。
A method according to still another aspect of the present invention is a method of estimating the number of people passing through a target location where a user in a facility passes. In this method, information on the number of detected wireless terminal devices detected by the access point device within the estimated target time is acquired from the access point device for short-range wireless communication provided at or near the target location. The value of the parameter of the estimation model that estimates the number of people passing through the target location from the number of detections of the wireless terminal device is stored, the estimation model including the value of the parameter, and the wireless terminal device within the estimation target time. It includes estimating the number of people passing through the target location within the estimated target time based on the information on the number of detections.
In the method, based on the information on the number of detected wireless terminal devices detected by the access point device within a predetermined time and the information on the number of passing persons obtained by totaling the number of people who actually passed the target location within the predetermined time. , The determination of the values of the parameters of the estimation model may be further included.
本発明の更に他の態様に係る方法は、施設における利用者が通過する対象箇所を通過した人を分析する方法である。この方法は、前記対象箇所又はその近傍に設けられた近距離無線通信のアクセスポイント装置が検知した複数の無線端末装置について、前記無線端末装置の利用者の属性情報を記憶することと、前記複数の無線端末装置の利用者の属性情報に基づいて、前記対象箇所を通過した人の集団について属性分析を行うことと、を含む。 A method according to still another aspect of the present invention is a method of analyzing a person who has passed a target portion through which a user in a facility passes. This method is to store the attribute information of the user of the wireless terminal device for a plurality of wireless terminal devices detected by the access point device for short-range wireless communication provided at or near the target location, and the plurality of wireless terminal devices. Includes performing attribute analysis on a group of people who have passed the target location based on the attribute information of the user of the wireless terminal device of the above.
本発明の更に他の態様に係るプログラムは、施設における利用者が通過する対象箇所の通過人数を推定する情報処理装置に備えるコンピュータ又はプロセッサにおいて実行されるプログラムである。このプログラムは、前記対象箇所又はその近傍に設けられた近距離無線通信のアクセスポイント装置から、前記アクセスポイント装置が推定対象時間内に検知した無線端末装置の検知数の情報を取得するためのプログラムコードと、前記無線端末装置の検知数から前記対象箇所の通過人数を推定する推定モデルのパラメータの値を記憶するためのプログラムコードと、前記パラメータの値を含む推定モデルと、前記推定対象時間内の前記無線端末装置の検知数の情報とに基づいて、前記推定対象時間内に前記対象箇所を通過した通過人数を推定するためのプログラムコードと、を含む。
前記プログラムにおいて、前記アクセスポイント装置が所定時間内に検知した無線端末装置の検知数の情報と、前記対象箇所を前記所定時間内に実際に通過した人数を集計した通過人数の情報とに基づいて、前記推定モデルのパラメータの値を決定するためのプログラムコードを更に含んでもよい。
The program according to still another aspect of the present invention is a program executed by a computer or a processor provided in an information processing device for estimating the number of people passing through a target location passed by a user in a facility. This program is a program for acquiring information on the number of detected wireless terminal devices detected by the access point device within the estimated target time from the access point device for short-range wireless communication provided at or near the target location. The code, the program code for storing the parameter values of the estimation model that estimates the number of people passing through the target location from the number of detections of the wireless terminal device, the estimation model including the parameter values, and the estimation target time. Includes a program code for estimating the number of people passing through the target location within the estimated target time based on the information on the number of detections of the wireless terminal device.
In the program, based on the information on the number of detected wireless terminal devices detected by the access point device within a predetermined time and the information on the number of passing persons obtained by totaling the number of people who actually passed the target location within the predetermined time. , The program code for determining the value of the parameter of the estimation model may be further included.
本発明の更に他の態様に係るプログラムは、施設における利用者が通過する対象箇所を通過した人を分析する情報処理装置に備えるコンピュータ又はプロセッサにおいて実行されるプログラムであって、前記対象箇所又はその近傍に設けられた近距離無線通信のアクセスポイント装置が検知した複数の無線端末装置について、前記無線端末装置の利用者の属性情報を記憶するためのプログラムコードと、前記複数の無線端末装置の利用者の属性情報に基づいて、前記対象箇所を通過した人の集団について属性分析を行うためのプログラムコードと、を含む。 The program according to still another aspect of the present invention is a program executed by a computer or a processor provided in an information processing apparatus for analyzing a person who has passed a target location passed by a user in the facility, and is the target location or the program thereof. For a plurality of wireless terminal devices detected by an access point device for short-range wireless communication provided in the vicinity, a program code for storing attribute information of a user of the wireless terminal device and use of the plurality of wireless terminal devices. Includes a program code for performing attribute analysis on a group of people who have passed the target location based on the attribute information of the person.
本発明によれば、煩雑なデータ集計処理を行うことなく、施設における利用者が通過する対象箇所を通過した人数を簡易に推定することができる。 According to the present invention, it is possible to easily estimate the number of people who have passed the target location where the user in the facility passes without performing complicated data aggregation processing.
以下、図面を参照して本発明の実施形態について説明する。
図1は、本発明の一実施形態に係る情報処理装置10を備えるシステムの全体の概略構成の一例を示す説明図である。情報処理装置10は、施設としての駅における利用者80が通過する対象箇所にある自動改札機90の通過人数を推定する。情報処理装置10は、自動改札機90又はその近傍に設けられた近距離無線通信のアクセスポイント装置20から、アクセスポイント装置20が推定対象時間内に検知した無線端末装置85の検知数の情報を取得する。情報処理装置10は、無線端末装置85の検知数から自動改札機90の通過人数を推定する推定モデルのパラメータの値を記憶部(DB)101に記憶する。また、情報処理装置10は、前記パラメータの値を含む推定モデルと、推定対象時間内の無線端末装置85の検知数の情報とに基づいて、前記推定対象時間内に自動改札機90を通過した通過人数(改札利用者数)を推定する。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is an explanatory diagram showing an example of an overall schematic configuration of a system including an
本実施形態のシステムは、情報処理装置10のほか、近距離無線通信のアクセスポイント装置20を含んでもよい。情報処理装置10とアクセスポイント装置20は、移動通信網30などの所定のインターフェースにより互いに通信してデータを送受信することができる。
The system of this embodiment may include an
更に、本実施形態のシステムは、無線端末装置85による広域の移動通信、アクセスポイント装置20を介した近距離無線通信などの通信サービスの加入者情報(例えば、性別、年齢、住所など)を記憶する記憶部(データベース)151を有する顧客管理サーバ15を含んでもよい。
Further, the system of the present embodiment stores subscriber information (for example, gender, age, address, etc.) of communication services such as wide area mobile communication by the
対象箇所の自動改札機90で読み書きされるデータは、乗車券の種類ごとに異なる複数のデータ集計用PC装置91、92に集計されて保存される。データ集計用PC装置91、92のデータは、インターネットなどの通信網35を介して顧客管理サーバ95に収集されて記憶部(DB)951に保存され、乗車人員、売上などの統計的データとして管理される。
The data read and written by the
異業種の事業者がそれぞれ保有する個々のデータだけでは有効性や信頼性が不十分で上手く活用できていなかったことを背景とし、本実施形態では、鉄道事業者が保有する自動改札機90のデータと、通信事業者が保有する近距離無線通信(例えば、Wi−Fi(登録商標)などの無線LANの通信)のアクセスポイント装置(以下「AP装置」という。)20の通信ログデータ(アクセスログ)を統合して分析する。
In this embodiment, the
本実施形態では、上記分析の結果に基づき、AP装置20の通信ログデータから自動改札機90の通過人数を推定する推定モデルを構築している。この推定モデルを用いることにより、従来の複数のデータ集計用PC装置91、92からの煩雑なデータ集計処理を行うことなく、AP装置20を設置するだけで、そのAP装置20の通信ログデータのみから自動改札機90を通過した利用者80の人数を簡易に推定することができ、自動改札機90における人の滞留状況の把握や人流の検知精度の向上を図ることができる。
In the present embodiment, based on the result of the above analysis, an estimation model for estimating the number of people passing through the
更に、本実施形態では、AP装置20の通信ログデータと通信事業者が保有する加入者の各種の属性情報とを突合し、自動改札機90を通過する利用者80に各種の属性情報に付与して組み合わせることにより、今まで分からなかった正確な利用者80の利用状況を把握し、防災、減災、街づくり、観光地や商業施設の活性化などに利用できる。
Further, in the present embodiment, the communication log data of the
なお、本実施形態では、人が通過する対象箇所が鉄道事業者の施設である駅の自動改札機90が設置された改札の場合について説明するが、本発明は、駅以外の施設(例えば、テーマパークなどのレジャー施設や百貨店などの商業施設など)における利用者が通過する箇所の通過人数を推定したり通過する利用者について分析したりする場合にも適用できる。また、本実施形態におけるAP装置20は、利用者の無線端末装置85との間でWi−Fi(登録商標)以外の無線LANの通信を行うAP装置、又は、無線LAN以外の近距離無線を行うAP装置であってもよい。また、AP装置20は、移動通信システムの基地局であってもよい。
In the present embodiment, the case where the target location through which a person passes is the ticket gate where the
本実施形態の利用者80の無線端末装置85は、利用者80が携帯して近距離無線通信が可能な装置であり、スマートフォン、ユーザ通信端末、ユーザ装置(UE)、ユーザ端末、端末、端末装置、移動局、移動機等と呼ばれる無線通信装置であってもよい。
The
まず、本実施形態における鉄道の駅の自動改札機90で計数(カウント)された改札機カウントデータと、改札周辺に設置されたAP装置20が通信して検知した無線LANの通信端末装置(以下「端末」ともいう。)85の検知数の情報を含む無線アクセスデータとの関係を調べた結果について説明する。
First, the wireless LAN communication terminal device (hereinafter referred to as the wireless LAN communication terminal device) detected by communicating between the ticket gate count data counted by the
[改札機カウントデータ]
改札機カウントデータは例えば鉄道事業者が保有する。自動改札機90は、駅での乗降時に磁気乗車券やICカードの乗車券(「IC乗車券」ともいう。)などの券種、普通乗車券や定期券などの種類などを自動的に判別し、利用者80から正しく運賃を収受するための機器である。本実施形態では、自動改札機90から取得できる様々なデータを、改札口単位で乗降別の通過人数を1時間単位に集約した「改札機カウントデータ」を用いている。
[Ticket gate count data]
The ticket gate count data is owned by, for example, a railway company. The
自動改札機90は、有効期限の判別やどこで乗車し、どこで降車するかなど運賃計算に必要な情報を読み書きするが、その内容は乗車券の種類により異なるためデータフォーマットは統一されていない。また、改札機カウントデータは、磁気券については通勤定期、通学定期、定期券外毎に人数を集計しているが、ICカードについては定期、定期券外の区別なく合計人数しか集計していない。また、磁気乗車券やIC乗車券の保有者情報は、それらの乗車券に保持されていないため、保有者の性別や年齢などの属性を把握することはできない。
The
本実施形態で用いる改札機カウントデータは、統計データと考えられるが、2017年5月30日に施行された通称「改正個人情報保護法」及びそれに基づいて作成された鉄道事業者の個人情報保護方針に則って取り扱われる。例えば、改札機カウントデータを活用するにあたって特定の個人を識別できない態様にするため、統計値の粒度が10以上(例えば、改札機カウント数が9以下であれば切り下げて0と加工)になるように十分な匿名化を施したデータを分析に用いた。さらに、個人情報への考慮として、利用者が少ない時間帯のデータ(例えば、5時台のデータ、24時台のデータ)も省いている。 The ticket gate count data used in this embodiment is considered to be statistical data, but the so-called "Revised Personal Information Protection Law" that came into effect on May 30, 2017 and the personal information protection of railway operators created based on it. It will be treated according to the policy. For example, in order to make it impossible to identify a specific individual when utilizing the ticket gate count data, the particle size of the statistical value should be 10 or more (for example, if the ticket gate count is 9 or less, it is rounded down to 0). Data with sufficient anonymization was used for the analysis. Furthermore, as consideration for personal information, data in a time zone when there are few users (for example, data in the 5 o'clock range and data in the 24:00 range) are also omitted.
[無線アクセスデータ]
Wi−Fi等の近距離無線(無線LAN)のAP装置20を介した通信サービスを提供する通信事業者は、サービス状態の把握、品質の計測、改善等を目的とし、様々な通信ログをAP装置20から取得している。この通信ログの情報のうち、Wi−Fi等の近距離無線通信の端末85がAP装置20と接続する際に交換されるプローブリクエスト/レスポンスやアソシエーションリクエスト/レスポンス等の通信ログが位置情報として利活用される機会が、スマートフォンの普及と共に拡大している。
[Wireless access data]
A telecommunications carrier that provides communication services via a short-range wireless (wireless LAN)
通信ログを位置情報として利用する方法には、端末85側で位置情報化する場合と、通信事業者側で位置情報化する場合の2通りの方法がある。前者の方法は、端末85側で取得したプローブやビーコン情報からAP装置20の情報を抽出し、AP装置20と位置情報との関係を示したマッチングテーブルをルックアップすることで位置情報にする方法である。この方法を用いた機能は、ほとんどのスマートフォンに搭載され、地下や建物内といったGPS等のGNSSでは把握困難な位置情報の取得に使われている。一方、後者の方法は、通信事業者が、自ら設置したAP装置20の場所と関連付けることで位置情報化する方法である。この方法は、上記前者の方法に比べて一般的に位置情報の精度が高いとされている。
There are two methods of using the communication log as location information, one is to convert the location information on the terminal 85 side and the other is to convert the location information on the communication carrier side. The former method is a method of extracting the information of the
本実施形態で用いる通信ログなどの無線アクセスデータについても、前述の「改正個人情報保護法」及びそれに基づいて作成された通信事業者の個人情報保護方針に則って取り扱われる。 Wireless access data such as communication logs used in this embodiment is also handled in accordance with the above-mentioned "Revised Personal Information Protection Law" and the personal information protection policy of the telecommunications carrier created based on the above-mentioned "Revised Personal Information Protection Law".
また、通信ログなどの無線アクセスデータにおける端末85の位置情報を利活用する場合、端末85やAP装置20のMAC(Media Access Control)アドレスを識別子として用いることがほとんどである。このMACアドレスは、ネットワークに接続された機器を(原則として)一意に識別するための48ビットの符号であり、当然、通信事業者等において契約者の氏名等個人情報と容易に結びつく場合には、符号単体で個人識別性を有することになる。一方、単体では個人識別性がないとしても、ネットワークに接続されるほぼ全ての端末85に付与され、ほとんどの個人がいくつかの端末85を常に持ち歩くことを考えると、プライバシー保護の観点から個人情報保護法に抵触しない場合においても保護することがふさわしい。このため、本実施形態では、MACアドレス自体をランダム化したり、接続する度に異なるMACアドレスを利用したりすることにより、MACアドレスが付与された端末85を利用するユーザのプライバシーの保護を高めてもよい。
Further, when utilizing the position information of the terminal 85 in wireless access data such as a communication log, in most cases, the MAC (Media Access Control) address of the terminal 85 or the
本実施形態において統計分析に利用した通信ログなどの無線アクセスデータにおける個人情報に該当する端末85の位置情報は、通信事業者が提供する公衆無線LANサービスの利用に際し、個人情報の取り扱いに関し同意を得られたユーザのうち、事後的にその利活用を拒否したユーザを除いたものの端末85から得られたプローブとアソシエーションログに基づいたものである。また、その利用に際しては、通信事業者のプライバシーポリシーに従った取り扱いとし、通信事業者内において、統計値の粒度が10以上(例えば、端末85の検知数が、9以下であれば切り下げて0と加工)になるように十分な匿名化を施した情報のみを、無線アクセスデータ(Wi−Fiデータ)として分析に利用した。 The location information of the terminal 85, which corresponds to personal information in the wireless access data such as the communication log used for statistical analysis in the present embodiment, consents to the handling of personal information when using the public wireless LAN service provided by the telecommunications carrier. It is based on the probe and the association log obtained from the terminal 85, excluding the users who refused to utilize the users after the fact. In addition, when using it, it will be handled in accordance with the privacy policy of the telecommunications carrier, and if the particle size of the statistical value is 10 or more (for example, if the number of detections of the terminal 85 is 9 or less, it will be rounded down to 0) within the telecommunications carrier. Only the information that was sufficiently anonymized so as to be processed) was used for analysis as wireless access data (Wi-Fi data).
[改札機カウントデータと無線アクセスデータの突合の検討]
実際の駅での実証実験により、改札機カウントデータと無線アクセスデータとの突合を検討した。実証実験は近鉄奈良駅で行った。近鉄奈良駅は、(a)春日大社、東大寺、興福寺等世界遺産を抱える観光駅、(b)奈良県庁など行政中心であり同時に奈良女子大学等の学校も多数ある到着駅、(c)付近には多数の住宅地があり大阪方面への通勤・通学の出発駅、など異なる利用側面を持つ駅で、様々な利用者の動向分析が可能であると考えられる。
[Examination of matching between ticket gate count data and wireless access data]
Through a demonstration experiment at an actual station, we examined the matching between ticket gate count data and wireless access data. The demonstration experiment was conducted at Kintetsu Nara Station. Kintetsu Nara Station is (a) a tourist station with world heritage sites such as Kasuga Taisha, Todaiji Temple, and Kofukuji Temple, (b) an arrival station that is central to the administration such as Nara Prefectural Office and has many schools such as Nara Women's University, (c) There are many residential areas in Nara, and it is thought that it is possible to analyze the trends of various users at stations with different usage aspects such as departure stations for commuting to work and school in the direction of Osaka.
実証実験は、2017年11月〜2018年3月の間、近鉄奈良駅の構内の東西改札口のそれぞれにAP装置20を設置して行った。なお、近鉄奈良駅は地下駅であり、実際に駅を利用する利用者の端末85以外の端末のほとんどがAP装置20に検出されない環境である。
The demonstration experiment was conducted from November 2017 to March 2018 by installing
表1は、鉄道事業者が保有する近鉄奈良駅の改札機カウントデータの一例を示している。また、図2及び図3はそれぞれ、近鉄奈良駅の平日及び休日における改札利用人数の時間変化の一例を示すグラフである。図2及び図3は、改札機カウントデータから、券種(IC乗車券や磁気乗車券など)に関係なく東西改札口の改札利用者の合計数について入場と出場を別々に示している。1日の乗降人員の平均は、平日が55,000人、休日が50,000人とあまり差はないが、時間別の利用状況は明らかに異なる。
図4は、平日における磁気乗車券の券種別(定期券、定期券以外)の利用状況(入出場件数)の時間変化の一例を示すグラフである。図5は、平日における磁気乗車券の定期券以外の利用状況(入出場件数)の時間変化の一例を示すグラフである。本実証実験において、改札機カウントデータがICカード利用者の定期券、定期券以外の区別ができないため、図4及び図5では、磁気乗車券のみでの分析の結果を示している(後述の図6及び図7でも同様)。なお、近鉄の磁気乗車券とIC乗車券の比率は4:6程度である。 FIG. 4 is a graph showing an example of a time change in the usage status (number of entries / exits) of the magnetic ticket type (commuter pass, other than the commuter pass) on weekdays. FIG. 5 is a graph showing an example of time changes in the usage status (number of entries and exits) of magnetic tickets other than commuter passes on weekdays. In this demonstration experiment, since the ticket gate count data cannot distinguish between commuter passes and commuter passes for IC card users, FIGS. 4 and 5 show the results of analysis using only magnetic tickets (described later). The same applies to FIGS. 6 and 7). The ratio of Kintetsu's magnetic ticket to IC ticket is about 4: 6.
図4において、定期利用のピークは、6時から8時と17時から19時であり、通勤通学の利用者が多いと推測される。一方、定期外利用のピークは9時から18時ごろであるが、図5に示すように、出場のピークは9時から11時、入場のピークは14時から18時であり、午前中に奈良に訪れた利用者が昼過ぎから奈良を離れることが推測され、定期外は観光の利用者が多く含まれると考えられる。 In FIG. 4, the peaks of regular use are from 6:00 to 8:00 and from 17:00 to 19:00, and it is estimated that there are many users who commute to work or school. On the other hand, the peak of non-regular use is from 9:00 to 18:00, but as shown in Fig. 5, the peak of participation is from 9:00 to 11:00, the peak of admission is from 14:00 to 18:00, and in the morning. It is presumed that users who visit Nara will leave Nara after noon, and it is thought that many tourist users will be included outside the commuter pass.
図6は、休日における磁気乗車券の券種別(定期券、定期券以外)の利用状況(入出場件数)の時間変化の一例を示すグラフである。図7は、休日における磁気乗車券の定期券以外の利用状況(入出場件数)の時間変化の一例を示すグラフである。
利用者数の合計は平日と休日で大きな差はないものの、図6に示すように、休日は定期券外の利用がほとんどで、ピークは9時から18時ごろで平日と同じである。また、図7の休日の定期券外の入場、出場件者数では、平日と同様、午前中に奈良に訪れた利用者が昼過ぎから奈良を離れる傾向が見られるが、その件数は平日よりも多く、休日の近鉄奈良駅は、観光中心であることが推定できる。
FIG. 6 is a graph showing an example of a time change in the usage status (number of entry / exit) of the magnetic ticket type (commuter pass, other than the commuter pass) on holidays. FIG. 7 is a graph showing an example of time changes in the usage status (number of entrances and exits) of magnetic tickets other than commuter passes on holidays.
Although there is no big difference in the total number of users between weekdays and holidays, as shown in Fig. 6, most of the users use the commuter pass outside the commuter pass, and the peak is from 9:00 to 18:00, which is the same as weekdays. In addition, regarding the number of visitors and participants outside the commuter pass on holidays in Fig. 7, there is a tendency for users who visited Nara in the morning to leave Nara after noon, as on weekdays, but the number is higher than on weekdays. In many cases, it can be estimated that Kintetsu Nara Station on holidays is a tourist center.
以上の図2〜図7に示すように、鉄道事業者の改札機カウントデータでは改札を通過する利用者数(実数)は把握することができるが、その利用者の属性は判らないが、以下に示すように通信事業者のAP装置20から取得した無線アクセスデータと組み合わせて分析することにより、利用者の属性が判る。
As shown in FIGS. 2 to 7 above, the number of users (real numbers) passing through the ticket gate can be grasped from the ticket gate count data of the railway operator, but the attributes of the users are not known, but the following As shown in the above, the attributes of the user can be known by analyzing the data in combination with the wireless access data acquired from the
図8は、近鉄奈良駅における1日あたりの改札利用者数(右目盛)とAP装置(Wi−Fiアクセスポイント)20により検知された端末数(左目盛)との関係の変化の一例を示すグラフである。図8の改札利用者数は、磁気乗車券やIC乗車券等すべての券種の入出場を合計したものであり、自動改札機を利用した「実数」と考えられる。実際、2017年12月9、10日の奈良マラソン開催日や2018年の年始及び1月27日の若草山焼きの日などには、改札利用者数の増加が見られ、利用者の動きを反映していると思われる。 FIG. 8 shows an example of a change in the relationship between the number of ticket gate users (right scale) per day at Kintetsu Nara Station and the number of terminals (left scale) detected by the AP device (Wi-Fi access point) 20. It is a graph. The number of ticket gate users in FIG. 8 is the total of entry and exit of all ticket types such as magnetic tickets and IC tickets, and is considered to be a "real number" using an automatic ticket gate. In fact, the number of ticket gate users increased on December 9th and 10th, 2017, the Nara Marathon, the beginning of 2018, and the day of Wakakusayama-yaki on January 27th, reflecting the movement of users. It seems to be doing.
なお、スマートフォンなどの端末85は、同一AP装置と適時通信を行うため、無線アクセスデータである端末検知数のデータ(Wi−Fiデータ)には同一端末が複数回検出される可能性がある。そのため、端末検知数(Wi−Fi検知数)は、一定期間内のユニークな端末数としたため、朝、近鉄奈良駅から入場し、夕方出場した場合でも1日あたりの端末検知数は1端末とカウントされる。一方、改札機カウントデータには出場と入場がそれぞれカウントされているため、図8では、実際の端末検知数の2倍の値を採用している。 Since the terminal 85 such as a smartphone communicates with the same AP device in a timely manner, the same terminal may be detected a plurality of times in the terminal detection number data (Wi-Fi data) which is the wireless access data. Therefore, the number of terminals detected (Wi-Fi detection number) is set to the number of unique terminals within a certain period, so even if you enter from Kintetsu Nara Station in the morning and participate in the evening, the number of terminals detected per day is one terminal. It is counted. On the other hand, since entry and entry are counted in the ticket gate count data, respectively, in FIG. 8, a value twice the actual number of detected terminals is adopted.
図8を見ると、改札利用者数と端末検知数の増減は近似しているため、両者の相関分析を行った。 Looking at FIG. 8, since the increase / decrease in the number of ticket gate users and the number of terminal detections are similar, a correlation analysis between the two was performed.
図9は、近鉄奈良駅における改札利用者数と端末検知数(日別)との相関の一例を示す散布図である。図9の相関分析の結果から、改札利用者数と端末検知数との間にR2(決定係数)=0.7179という高い相関が見られた。この相関の結果から、本発明者らは、端末検知数はすべての人員を把握しているとは限らないが、端末検知数から改札利用者の実数を推測(推定)することが可能であり、自動改札機を利用する利用者に、無線アクセスデータが保有している利用者若しくは端末85の属性、又は、無線アクセスデータに関連付けられている(紐付けられている)利用者若しくは端末85の属性を適用することが可能と考えた。 FIG. 9 is a scatter diagram showing an example of the correlation between the number of ticket gate users and the number of terminal detections (daily) at Kintetsu Nara Station. From the results of the correlation analysis in FIG. 9, a high correlation of R2 (coefficient of determination) = 0.7179 was observed between the number of ticket gate users and the number of terminal detections. From the result of this correlation, the present inventors do not always grasp all the personnel for the number of terminal detections, but it is possible to estimate (estimate) the actual number of ticket gate users from the number of terminal detections. , The attribute of the user or terminal 85 possessed by the wireless access data, or the user or terminal 85 associated (linked) with the wireless access data to the user who uses the automatic ticket gate. I thought it was possible to apply the attributes.
[端末利用者の属性情報の適用]
自動改札機を利用する利用者に適用する無線アクセスデータの属性情報としては、端末85のMACアドレスに紐付けられた近距離無線通信である無線LAN通信(Wi−Fi)の契約者情報(性別、年齢、居住地)が挙げられる。
[Application of terminal user attribute information]
As the attribute information of the wireless access data applied to the user who uses the automatic ticket gate, the contractor information (gender) of the wireless LAN communication (Wi-Fi) which is a short-range wireless communication linked to the MAC address of the terminal 85. , Age, place of residence).
前述の実証実験の近鉄奈良駅の特徴として、朝の通勤時間帯は男性が多く、昼の観光時間帯は女性が多いということは、鉄道事業者(交通事業者)は感覚的に把握しているものの、その実態を定量的に把握することは難しく、アンケートなどで実態把握を試みているのが実状である。そこで、無線アクセスデータ(Wi−Fiデータ)が保有する属性情報を用いて、近鉄奈良駅を利用する利用者の属性の可視化を試みた。 As a feature of Kintetsu Nara Station in the above-mentioned demonstration experiment, the railway operator (transportation operator) intuitively understands that there are many men during the morning commuting time and many women during the daytime sightseeing time. However, it is difficult to quantitatively grasp the actual situation, and the actual situation is that we are trying to grasp the actual situation by questionnaires. Therefore, we tried to visualize the attributes of the users who use Kintetsu Nara Station by using the attribute information possessed by the wireless access data (Wi-Fi data).
図10及び図11はそれぞれ、近鉄奈良駅の平日及び休日における無線アクセスデータ(Wi−Fiデータ)が保有する端末利用者の時間別男女比率の一例を示すグラフである。図12及び図13はそれぞれ、近鉄奈良駅の平日及び休日における無線アクセスデータ(Wi−Fiデータ)が保有する時間別男女比率を改札利用者数に適用して得られた時間帯別の男性及び女性の利用状況の推定結果の一例を示すグラフである。図12及び図13は、改札機カウントデータの「実数」に無線アクセスデータ(Wi−Fiデータ)の「属性」(契約者の性別)を付与して得られた。 10 and 11 are graphs showing an example of the hourly gender ratio of terminal users held by wireless access data (Wi-Fi data) on weekdays and holidays at Kintetsu Nara Station, respectively. 12 and 13 show men and men by time zone obtained by applying the hourly gender ratio held by wireless access data (Wi-Fi data) on weekdays and holidays at Kintetsu Nara Station to the number of ticket gate users, respectively. It is a graph which shows an example of the estimation result of the usage situation of a woman. 12 and 13 were obtained by adding the "attribute" (gender of the contractor) of the wireless access data (Wi-Fi data) to the "real number" of the ticket gate count data.
図10及び図12の平日の結果は、通勤時間帯の6時及び7時台には男性が多く、周辺の観光施設などが開館する10時頃から女性の割合が増加し、昼間は女性のほうが多くなる、という鉄道事業者(交通事業者)の感覚と一致する。一方、図11及び図13の休日の結果では、1日あたりの休日の改札利用者の男女比は、男性44%に対して女性56%となる。時間帯別に見ても終日女性が上回るなど、奈良は女性の観光客の割合が多いことがわかる。 The weekday results shown in FIGS. 10 and 12 show that there are many men during commuting hours at 6 and 7 o'clock, and the proportion of women increases from around 10 o'clock when the surrounding tourist facilities open, and women's during the daytime. This is consistent with the feeling of railway operators (transportation operators) that there will be more. On the other hand, according to the results of the holidays shown in FIGS. 11 and 13, the male-female ratio of the holiday ticket gate users per day is 44% for males and 56% for females. It can be seen that the percentage of female tourists is high in Nara, with the number of female tourists surpassing all day long.
図14(a)及び(b)はそれぞれ、近鉄奈良駅の平日及び休日における無線アクセスデータ(Wi−Fiデータ)が保有する端末利用者の年齢層別比率の一例を示すグラフである。図14に示すように、年齢層別に平日・休日ごとで利用実態を比較してみると、若年層(10代、20代)、プレシニア層(50代)の割合に変化は見られなかったが、ファミリー層(30代、40代)は休日に多く、シニア層(60代、70代)は平日に多いなどの傾向が見られた。 14 (a) and 14 (b) are graphs showing an example of the ratio of terminal users by age group held by wireless access data (Wi-Fi data) on weekdays and holidays at Kintetsu Nara Station, respectively. As shown in Fig. 14, when comparing the actual usage on weekdays and holidays by age group, there was no change in the ratio of young people (teens, 20s) and pre-seniors (50s). , Family members (30's and 40's) tended to be on holidays, and seniors (60's and 70's) tended to be on weekdays.
図15(a)及び(b)はそれぞれ、近鉄奈良駅の平日及び休日における無線アクセスデータ(Wi−Fiデータ)が保有する端末利用者の住所属性(契約上の住所)の上位5県の一例を示すグラフである。図15により、平日、休日とも奈良県が最も多いが、平日は予想外に東京都や神奈川県など遠方の利用者が多いことがわかる。また、休日には京都府、大阪府、兵庫県などの利用者が増えることから、近隣他府県からの流入が増えることがわかる。いずれにしろ、平日休日ともに、近鉄奈良駅は地元の利用者とともに観光の利用者が相当数いることが推測できる。 15 (a) and 15 (b) are examples of the top five prefectures of terminal user address attributes (contractual addresses) held by wireless access data (Wi-Fi data) on weekdays and holidays at Kintetsu Nara Station, respectively. It is a graph which shows. From FIG. 15, it can be seen that Nara Prefecture has the largest number of users on weekdays and holidays, but unexpectedly there are many users in distant places such as Tokyo and Kanagawa Prefecture on weekdays. In addition, since the number of users in Kyoto, Osaka, Hyogo, etc. increases on holidays, it can be seen that the inflow from other neighboring prefectures will increase. In any case, it can be inferred that Kintetsu Nara Station has a considerable number of tourists as well as local users on weekdays and holidays.
[無線アクセスデータから改札利用者の実数を推測するモデル]
前述の図9に示すように改札利用者数と端末検知数との間に高い相関が見られため、無線アクセスデータの端末検知数から改札利用者の実数を推定する推定モデルを構築することができる。
[Model for estimating the actual number of ticket gate users from wireless access data]
As shown in Fig. 9 above, there is a high correlation between the number of ticket gate users and the number of terminal detections, so it is possible to build an estimation model that estimates the actual number of ticket gate users from the number of terminal detections in wireless access data. it can.
[線型モデル]
推定モデルとしては、例えば、改札利用者の実数を端末検知数の一次関数で表す線形モデル(「線形回帰モデル」ともいう。)がある。この推定モデルの推定精度を検討する上で、AP装置(例えば、Wi−Fiアクセスポイント)20の周辺に位置するスマートフォンなどの端末85のうちAP装置20でどの程度の端末85が検知されるかを示す、AP装置20による端末検知の「検知率」及びその逆数である「欠損度」が重要である。この欠損度及び検知率は推定モデル(線形モデル)のパラメータである。
[Linear model]
As an estimation model, for example, there is a linear model (also referred to as a "linear regression model") in which the real number of ticket gate users is represented by a linear function of the number of terminal detections. In examining the estimation accuracy of this estimation model, how
AP装置20による端末検知の欠損度及び検知率は、改札機カウントデータから得られる「改札利用者数」をその対象箇所(地点)を通過してカウントされた実際の通過人数のカウント人数、すなわち「実数」とし、AP装置20で検知された端末検知数(Wi−Fi検知数)との比較を行うことで評価することができる。一般に、改札利用者数(通過人数)の実数は、端末85に対応する通信キャリアの市場占有率であるキャリアシェア率と、端末85の近距離無線機能ON率とを考慮して、端末検知数から計算により求めることができる。ここで、キャリアシェア率及び近距離無線機能ON率では説明できないなんらかの理由でAP装置20が端末85を捕捉できない度合いである「欠損度」を考慮すると、端末検知数と実数(実際のカウント人数)との関係は次の(5)式のようになる。AP装置20が周辺の端末85をすべて捕捉できる場合、欠損度=1である。
従って、欠損度は次の(6)式で計算できる。
図16は、近鉄奈良駅における1日あたりの改札利用者数とAP装置(Wi−Fiアクセスポイント)20により検知された端末数と欠損度との関係の変化の一例を示すグラフである。また、表2は、実数が1000人の場合の欠損度、検知率及び端末検知数の計算例である。図16及び表2の欠損度は、前述の実証実験における通信事業者のキャリアシェア率を22.3%とし、近距離無線機能ON率を20%とし、上記(6)式を用いて計算した。図16に示すように、AP装置20による端末検知にはキャリアシェア率や近距離無線機能ON率では説明できない検知ロスがあり、その検知ロスを示す欠損率が1.5〜2.25程度ある。また、表2に示すように実数1000人に対し、AP装置20で検知される端末検知数(人)は最大でも156人である。
[日別の欠損度]
上記(6)式に基づき、キャリアシェア率を22.3%とし、近距離無線機能ON率を70%として、前述の近鉄奈良駅での実証実験期間中の端末検知数と改札利用者数(=実数)から欠損度を日別に計算すると、その日別欠損度は平均で1.94(最大値:2.34,最小値:1.54)となる。欠損度が1.94であることは、AP装置20による端末検知の検知率が51.5%であり、約半数程度の端末85しか検知できていないことになる。
[Daily deficiency]
Based on the above formula (6), the carrier share rate is 22.3%, the short-range wireless function ON rate is 70%, and the number of terminal detections and ticket gate users during the above-mentioned demonstration experiment at Kintetsu Nara Station ( When the degree of deficiency is calculated on a daily basis from (= real number), the degree of deficiency on a daily basis is 1.94 on average (maximum value: 2.34, minimum value: 1.54). When the degree of defect is 1.94, the detection rate of terminal detection by the
日別の欠損度を見るとある程度の周期性がみられたので、暦日の平日、休日に分けて欠損度を算出した。その結果、平日の欠損度の平均は2.05(最大値:2.34,最小値:1.74)、休日の欠損度の平均は1.85(最大値:2.04,最小値:1.54)となり、休日のほうが平日より端末85が検出されやすいことがわかる。 Looking at the degree of deficiency by day, a certain degree of periodicity was observed, so the degree of deficiency was calculated by dividing it into weekdays and holidays on calendar days. As a result, the average deficiency on weekdays is 2.05 (maximum value: 2.34, minimum value: 1.74), and the average deficiency on holidays is 1.85 (maximum value: 2.04, minimum value: 1.74). It becomes 1.54), and it can be seen that the terminal 85 is more easily detected on holidays than on weekdays.
[時間帯別の欠損度]
図17及び図18はそれぞれ、近鉄奈良駅の平日及び休日における改札利用者数と欠損度の時間推移の一例を示すグラフである。図17の平日の欠損度の平均は2.99(最大が6時台で4.03、最小が23時台で2.01)となり、図18の休日の欠損度の平均は2.69(最大が6時台で3.09、最小が23時台で1.99)となり、日平均と同様、休日の欠損度のほうが小さく、休日のほうが平日より端末85が検出されやすい。
[Deficiency by time zone]
17 and 18 are graphs showing an example of the time transition of the number of ticket gate users and the degree of deficiency on weekdays and holidays of Kintetsu Nara Station, respectively. The average degree of deficiency on weekdays in FIG. 17 is 2.99 (maximum is 4.03 at 6 o'clock, minimum is 2.01 at 23:00), and the average degree of deficiency on holidays in FIG. 18 is 2.69 (. The maximum is 3.09 at 6 o'clock and the minimum is 1.99 at 23:00), and like the daily average, the degree of deficiency on holidays is smaller, and the terminal 85 is more likely to be detected on holidays than on weekdays.
[線形モデル]
図17及び図18に示すように改札利用者が最も多い平日朝の通勤時は欠損度が最も高く、18時以降は欠損度が徐々に低くなる等の結果が得られたことから、駅の混雑率が欠損度に影響を与えていると考えられる。そこで、平日、休日別に改札利用者数と欠損度との間の相関分析を行った。
[Linear model]
As shown in FIGS. 17 and 18, the degree of deficiency was highest during commuting on weekday mornings when the number of ticket gate users was the highest, and the degree of deficiency gradually decreased after 18:00. It is considered that the congestion rate affects the degree of deficiency. Therefore, we conducted a correlation analysis between the number of ticket gate users and the degree of deficiency on weekdays and holidays.
図19及び図20はそれぞれ、近鉄奈良駅の平日及び休日における改札利用者数と欠損度との相関の一例を示す散布図である。図19及び図20の相関分析の結果から、平日でR2(決定係数)=0.46、休日でR2=0.57の相関が見られ、改札利用者数が増加すると欠損度も増加する傾向が見られた。なお、本分析では平日、休日とも、改札利用者数が少ないにもかかわらず欠損度が大きい6時台は除いている。 19 and 20 are scatter plots showing an example of the correlation between the number of ticket gate users and the degree of deficiency on weekdays and holidays at Kintetsu Nara Station, respectively. From the results of the correlation analysis of FIGS. 19 and 20, a correlation of R2 (coefficient of determination) = 0.46 on weekdays and R2 = 0.57 on holidays is seen, and the degree of deficiency tends to increase as the number of ticket gate users increases. It was observed. In this analysis, both weekdays and holidays, the 6 o'clock level, which has a large degree of deficiency despite the small number of ticket gate users, is excluded.
図19及び図20の結果から、実数(改札利用者数)と欠損度との間には、次の一次式からなる(7)式及び(8)式の関係がある。
仮に、欠損度と改札利用者の通過人数の実数との関係を次の一次式からなる(9)式で定義し、前述の(1)式の欠損度に(9)式を代入して整理することで、端末検知数から通過人数の実数の推計値を計算する線形モデルの(10)式が導き出せる。(9)式及び(19)式の中のa及びbは、一次式で定義した欠損度の係数である。
図21及び図22はそれぞれ、近鉄奈良駅の平日及び休日における線形モデルのパラメータの値を用いて端末検知数から改札利用者(実数)の推計値を求めた結果の一例を示すグラフである。図21の平日の(10)式の計算には、前述の(7)式のパラメータである欠損度(a=0.0002,b=2.2274)の値を用いた。一方、図22の休日の(10)式の計算には、前述の(8)式のパラメータである欠損度(a=0.0002,b=2.0540)の値を用いた。 21 and 22 are graphs showing an example of the result of obtaining the estimated value of the ticket gate user (real number) from the number of detected terminals using the parameter values of the linear model on weekdays and holidays of Kintetsu Nara Station, respectively. For the calculation of equation (10) on weekdays in FIG. 21, the value of the degree of deficiency (a = 0.0002, b = 2.2274), which is the parameter of equation (7) described above, was used. On the other hand, in the calculation of the holiday equation (10) in FIG. 22, the value of the degree of deficiency (a = 0.0002, b = 2.0540), which is the parameter of the above equation (8), was used.
図21及び図22に示すように、改札利用者数の実数と、推計モデル(線型モデル)に基づいて端末検知数から推計した推計値は、平日及び休日とも非常に一致している。例えば、図21の平日の場合の改札利用者数の実数と推計値との相関関数rは0.97であり、図22の休日の場合の改札利用者数の実数と推計値との相関関数rは0.98である。従って、上記(10)式は、平日と休日別ではあるが、「近鉄奈良駅における端末検知数(Wi−Fi検知数)から実数を予測するモデル」と考えられる。 As shown in FIGS. 21 and 22, the actual number of ticket gate users and the estimated value estimated from the number of terminal detections based on the estimation model (linear model) are very consistent with weekdays and holidays. For example, the correlation function r between the actual number of ticket gate users and the estimated value in the case of weekdays in FIG. 21 is 0.97, and the correlation function between the actual number of ticket gate users and the estimated value in the case of holidays in FIG. 22. r is 0.98. Therefore, the above equation (10) is considered to be a "model that predicts a real number from the number of terminal detections (Wi-Fi detection number) at Kintetsu Nara Station", although it is divided into weekdays and holidays.
[欠損度に影響を与える他の要素]
上記モデルは、欠損度が人数(密度)の影響を受けること、すなわち、改札利用者が増加すると欠損率が増加することを前提として構築したが、欠損率は改札利用者だけでなく他の要素の影響を受ける場合がある。
[Other factors that affect the degree of deficiency]
The above model was built on the premise that the degree of deficiency is affected by the number of people (density), that is, the deficiency rate increases as the number of ticket gate users increases, but the deficiency rate is not limited to ticket gate users but other factors. May be affected by.
図23は、前述の図17と図18を重ね合わせて作成した平日及び休日における改札利用者数と欠損度の時間推移の一例を示すグラフである。図23から、全体に欠損度は平日のほうが高く、特に10時から16時では、改札利用者数の多い休日のほうが平日よりも欠損度が低くなっている。このことから、欠損度は単に改札利用者数だけでなく、別の要素(例えば、駅の定常的な利用又は一時的な利用、歩行速度、移動ルートなどの行動特性)が影響を与えていると考えられる。 FIG. 23 is a graph showing an example of the time transition of the number of ticket gate users and the degree of deficiency on weekdays and holidays created by superimposing FIGS. 17 and 18 described above. From FIG. 23, the degree of deficiency is higher on weekdays as a whole, and especially from 10:00 to 16:00, the degree of deficiency is lower on holidays with a large number of ticket gate users than on weekdays. From this, the degree of deficiency is influenced not only by the number of ticket gate users but also by other factors (for example, behavioral characteristics such as regular or temporary use of stations, walking speed, movement route, etc.). it is conceivable that.
図24は、近鉄奈良駅の平日及び休日における定期利用者の割合の時間推移の一例を示すグラフである。平日と休日の違いとして、駅を定常的に利用している利用者と観光のように一時的に利用している利用者の違いの可能性を考え、平日と休日で定期券利用者の割合を比較した。なお、定期券利用者の割合は、磁気定期券のデータを用いている。図24を見ると、平日のほうが全体的に定期券の利用割合が多く、定期券の利用者の行動特性(例えば、歩行速度やルートなど)が欠損度に影響を与えている可能性が考えられる。すなわち、観光駅か通勤通学駅かといった駅の特性により欠損度が変化する可能性が考えられる。この結果から、特徴が異なる駅の種類に応じて上記推定モデル(推定モデル)を構築してもよい。例えば、乗降者が少ない駅、乗降者が非常に多い駅、通信の利用者が多い駅、観光の利用者が多い駅など、互いに異なる特徴を有する複数種類の駅について上記分析を行い、複数種類の駅について互いに異なる上記推定モデル(線形モデル)である実数予想モデルを構築して改札利用者数の推定を行ってもよい。また、端末85の種類(例えば、スマートフォンかそれ以外のレガシー端末か否かの区別)、利用者の年齢、近距離無線機能ON率の差異などに応じて、互いに異なる実数予想モデルを構築して改札利用者数の推定を行ってもよい。 FIG. 24 is a graph showing an example of the time transition of the ratio of regular users on weekdays and holidays at Kintetsu Nara Station. As for the difference between weekdays and holidays, considering the possibility of a difference between users who regularly use the station and users who temporarily use the station such as sightseeing, the ratio of commuter pass users on weekdays and holidays Was compared. The percentage of commuter pass users uses the data of magnetic commuter passes. Looking at FIG. 24, it is considered that the usage rate of the commuter pass is higher on weekdays as a whole, and the behavioral characteristics of the commuter pass users (for example, walking speed and route) may affect the degree of deficiency. Be done. That is, it is possible that the degree of deficiency changes depending on the characteristics of the station, such as a tourist station or a commuting station. From this result, the above estimation model (estimation model) may be constructed according to the types of stations having different characteristics. For example, the above analysis is performed on a plurality of types of stations having different characteristics, such as a station with few passengers, a station with a large number of passengers, a station with many communication users, and a station with many tourist users. The number of ticket gate users may be estimated by constructing a real number prediction model, which is the above estimation model (linear model) different from each other for the stations. In addition, different real number prediction models are constructed according to the type of terminal 85 (for example, whether it is a smartphone or another legacy terminal), the age of the user, the difference in the short-range wireless function ON rate, and the like. The number of ticket gate users may be estimated.
[機械学習モデル]
上記改札利用者数の推定に用いる推定モデルは、AP装置20による端末検知数の情報と自動改札機90の通過人数の推定に影響する複数種類の条件の情報とを環境変数とし、自動改札機90の通過人数を目的変数とする機械学習モデルであってもよい。
[Machine learning model]
The estimation model used for estimating the number of ticket gate users uses information on the number of terminals detected by the
本実施形態の機械学習済みモデルに用いるアルゴリズムは特定のアルゴリズムに限定されない。例えば、教師あり学習データを用いて学習する機械学習済みモデルのアルゴリズムとしては、数値データを学習して数値を予測する「回帰(Regression)」に分類されるSVR(サポートベクター回帰)を用いることができる。このSVRの代わりに、線形回帰(Linear (Ordinary) Regression)、ベイズ線形回帰(Bayesian Linear Regression)、ランダムフォレスト(Randam (Decision) Forest)、ブースト決定木(Boosed decision tree)、高速フォレスト分布(Fast forest quantile)、ニューラルネットワーク(Neural network)、ポアソン回帰(Poisson Regression)、サポートベクトル序数回帰(Ordinal Regression)、リッジ回帰(Ridge Regression)、ラッソ回帰(Lasso Regression)などを用いてもよい。 The algorithm used for the machine-learned model of this embodiment is not limited to a specific algorithm. For example, as an algorithm of a machine-learned model that learns using supervised learning data, it is possible to use SVR (support vector regression) classified as "Regression" that learns numerical data and predicts numerical values. it can. Instead of this SVR, Linear (Ordinary) Regression, Bayesian Linear Regression, Randam (Decision) Forest, Boosed decision tree, Fast forest quantile, Neural network, Poisson Regression, Support Vector Ordinal Regression, Ridge Regression, Lasso Regression, etc. may be used.
上記機械学習モデルは、例えば、AP装置20が所定時間内に検知した端末85の検知数の情報と、自動改札機90の通過人数の推定に影響する複数種類の条件の情報と、自動改札機90の実際の通過人数(改札利用者数の実数)の情報とを含む複数の学習用データを用いて機械学習する。この機械学習により、機械学習モデルのパラメータの値を決定することにより、機械学習済みモデルを構築することができる。この機械学習済みモデルに、推定対象時間内におけるAP装置20による端末検知数の情報と、自動改札機90の通過人数の推定に影響する複数種類の条件の情報とを入力することにより、推定対象時間内における自動改札機90の通過人数(改札利用者の実数)を推定することができる。
The machine learning model includes, for example, information on the number of detected
図25は、本実施形態に係る情報処理装置10の主要部の構成の一例を示すブロック図である。図25において、情報処理装置10は、情報取得部102と記憶部(DB)101と推定部103とを備える。情報取得部102は、自動改札機90又はその近傍に設けられた近距離無線通信のアクセスポイント装置(AP装置)20から、AP装置20が推定対象時間内に検知した端末85の検知数の情報を取得する。
FIG. 25 is a block diagram showing an example of the configuration of the main part of the
また、情報取得部102は、自動改札機90に接続されている複数のデータ集計用PC装置91、92から、上記所定期間における自動改札機90で読み書きされた乗車券のデータ等を含む改札機カウントデータなどの自動改札機90の通過人数(実数)の情報を取得してもよい。改札機カウントデータを自動かつリアルタイムに集計することにより、前述の推定モデルにおけるパラメータの値を常にアップデートできる。情報取得部102は、データ集計用PC装置91、92からのデータを、メモリ(例えば,USBメモリ)などの記録媒体を介して読み込んでもよいし、データ集計用PC装置91、92から通信網35等を介して受信して読み込んでもよい。データ集計用PC装置91、92のデータの取得は、情報取得部102とは別に設けた実数情報取得部で行うようにしてもよい。また、データ集計用PC装置91、92のデータは、オペレータが情報処理装置10を操作して手動で入力してもよい。
Further, the
記憶部(DB)101は、端末85の検知数から自動改札機90の通過人数を推定する推定モデルのパラメータ(欠損度、又は、その計算式中の係数a,b)の値を記憶する。推定部103は、前記パラメータの値を含む推定モデルと、推定対象時間内の端末85の検知数の情報とに基づいて、推定対象時間内に自動改札機90を通過した通過人数を推定する。
The storage unit (DB) 101 stores the values of the parameters (deficiency degree or the coefficients a and b in the calculation formula) of the estimation model that estimates the number of people passing through the
図25の情報処理装置10において、AP装置20が所定時間内に検知した端末85の検知数の情報と、自動改札機90を前記所定時間内に実際に通過した人数を集計した通過人数の情報とに基づいて、前記推定モデルのパラメータの値を決定する決定部104を更に備えてもよい。
In the
前記推定モデルは、前述の通過人数を前記無線端末装置の検知数の一次関数で表す線形モデルであってもよい。ここで、前記一次関数の傾きを表すパラメータは、端末85の検知数と実際の通過人数(カウント人数)との比であり、端末85に対応する通信キャリアの市場占有率であるキャリアシェア率と、端末85の近距離無線機能ON率と、前述の欠損度とを含んでもよい。
The estimated model may be a linear model in which the number of people passing through is represented by a linear function of the number of detections of the wireless terminal device. Here, the parameter representing the slope of the linear function is the ratio of the number of detected
また、線形モデルのパラメータの値は、自動改札機90の通過人数の推定に影響する互いに異なる複数の条件のそれぞれについて決定され、推定部103は、その複数の条件から推定対象時間に対応する条件を選択し、選択した条件に対応するパラメータの値を含む推定モデルを、自動改札機90の通過人数の推定に用いてもよい。ここで、前記条件の項目は、時間帯及び曜日の少なくとも一方を含んでもよいし、自動改札機90付近の混雑度及び自動改札機90を通過する人の歩行速度の統計値の少なくとも一方を含んでもよい。
Further, the value of the parameter of the linear model is determined for each of a plurality of different conditions that affect the estimation of the number of people passing through the
前記推定モデルは、前述の端末85の検知数の情報と自動改札機90の通過人数の推定に影響する複数種類の条件(例えば、時間帯、曜日、自動改札機90付近の混雑度、自動改札機90を通過する人の歩行速度の統計値)の情報とを環境変数とし、前記対象箇所の通過人数を目的変数とする機械学習モデルであってもよい。この場合、AP装置20が所定時間内に検知した端末85の検知数の情報と、自動改札機90の通過人数の推定に影響する前記複数種類の条件の情報と、自動改札機90の実際の通過人数の情報とを含む複数の学習用データを用いて、前記機械学習モデルのパラメータの値を決定する。
The estimation model has a plurality of types of conditions (for example, time zone, day of the week, congestion degree near the
また、図25の情報処理装置10において、前記推定対象時間内に検知された端末85の利用者の属性情報(例えば、性別、年齢、居住地)に基づいて、自動改札機90を通過した人の集団について前述の属性分析を行う分析部105を更に備えてもよい。また、図25の情報処理装置10において、推定部103の代わりに分析部105を備えてもよい。
Further, in the
図26は、本実施形態に係る情報処理装置10における推定モデルの決定処理(学習フェーズ:S100)及び自動改札機90の通過人数の推定処理(推定フェーズ:S200)の一例を示すフローチャートである。なお、図中の学習フェーズ及び推定フェーズは互いに任意のタイミングで別々に実行してもよいし、連続的に実行してもよい。
FIG. 26 is a flowchart showing an example of an estimation model determination process (learning phase: S100) in the
図26の学習フェーズ(S100)において、情報処理装置10は、移動通信網30などの所定のインターフェースを介してAP装置20から通信ログを受信し、AP装置20が検知した所定期間の端末検知数の情報を取得する(S101)。
In the learning phase (S100) of FIG. 26, the
更に、情報処理装置10は、自動改札機90に接続されている複数のデータ集計用PC装置91、92から、自動改札機90で読み書きされた乗車券のデータに基づいて、上記所定期間における自動改札機90の通過人数(実数)の情報を取得する(S102)。情報処理装置10は、データ集計用PC装置91、92からのデータを、メモリなどの記録媒体を介して読み込んでもよいし、データ集計用PC装置91、92から通信網35等を介して受信して読み込んでもよい。また、データ集計用PC装置91、92のデータは、オペレータが情報処理装置10を操作して手動で入力してもよい。
Further, the
なお、AP装置20の端末検知数の情報の取得処理は、自動改札機90の通過人数(実数)の情報の取得処理の後に行ってもよいし、又は、両方の情報の取得処理を並列処理で行ってもよい。
The information acquisition process of the terminal detection number of the
次に、情報処理装置10は、AP装置20の端末検知数の情報と、自動改札機90の通過人数(実数)の情報とに基づいて、AP装置20の端末検知数の情報から自動改札機90の通過人数を推定する前述の線形モデル又は機械学習モデルなどの推定モデルのパラメータの値を決定して記憶することにより、推定モデルを構築する(S103)。
Next, the
上記推定モデルのパラメータの値は、自動改札機90の通過人数の推定に影響する互いに異なる複数の条件のそれぞれについて決定することにより、条件ごとに異なる複数の推定モデルを構築してもよい。前記条件の項目は、時間帯及び曜日の少なくとも一方を含んでもよいし、自動改札機90付近の混雑度及び自動改札機90の改札ゲートを通過する人の歩行速度の統計値の少なくとも一方を含んでもよい。
By determining the values of the parameters of the estimation model for each of a plurality of different conditions that affect the estimation of the number of people passing through the
図26の推定フェーズ(S200)おいて、情報処理装置10は、上記学習フェーズにて条件ごとに予め構築した互いに異なる複数の推定モデルから、自動改札機90の通過人数の推定を行う推定対象期間における条件(例えば、時間帯、曜日、自動改札機90付近の混雑度、自動改札機90の改札ゲートを通過する人の歩行速度の統計値など)に応じて、一つの推定モデルを選択する(S201)。なお、上記学習フェーズ(S100)で一つの推定モデルのみ構築した場合は、推定モデルの選択処理(S201)は省略してもよい。
In the estimation phase (S200) of FIG. 26, the
次に、情報処理装置10は、移動通信網30などの所定のインターフェースを介してAP装置20から通信ログを受信し、AP装置20が検知した推定対象期間の端末検知数の情報を取得する(S202)。
Next, the
次に、情報処理装置10は、前記選択した推定モデルと、AP装置20から取得した推定対象期間の端末検知数の情報とに基づいて、推定対象時間内に自動改札機90の改札ゲートを通過した通過人数を推定し(S203)、その通過人数の推定結果を記憶部(DB)101に保存する(S204)。
Next, the
情報処理装置10は、必要に応じて通過人数の推定結果を出力してもよい。例えば、情報処理装置10は、通過人数の推定結果を表示装置に表示したり、通信網を介して外部の送信先に送信したりしてもよい。
The
以上、本実施形態によれば、駅の自動改札機90又はその周辺に設置したAP装置20の通信ログに基づいて端末85の検知数を取得することにより、自動改札機90からの煩雑なデータ集計処理を行うことなく、自動改札機90を通過した人数を簡易に推定することができる。
特に、本実施形態によれば、条件ごとに異なる複数の推定モデルを構築し、推定対象期間における条件に適した推定モデルを用いることにより、推定対象期間の端末検知数の情報から自動改札機90の改札ゲートを通過した通過人数を推定するときの推定精度をより高めることができる。
As described above, according to the present embodiment, complicated data from the
In particular, according to the present embodiment, by constructing a plurality of estimation models different for each condition and using an estimation model suitable for the conditions in the estimation target period, the
なお、本明細書で説明された処理工程並びにサーバ(情報処理装置)、システムなどの構成要素は、様々な手段によって実装することができる。例えば、これらの工程及び構成要素は、ハードウェア、ファームウェア、ソフトウェア、又は、それらの組み合わせで実装されてもよい。 The processing process described in the present specification and components such as a server (information processing device) and a system can be implemented by various means. For example, these steps and components may be implemented in hardware, firmware, software, or a combination thereof.
ハードウェア実装については、実体(例えば、コンピュータ装置、種無線通信装置、Node B、端末、ハードディスクドライブ装置、又は、光ディスクドライブ装置)において上記工程及び構成要素を実現するために用いられる処理ユニット等の手段は、1つ又は複数の、特定用途向けIC(ASIC)、デジタルシグナルプロセッサ(DSP)、デジタル信号処理装置(DSPD)、プログラマブル・ロジック・デバイス(PLD)、フィールド・プログラマブル・ゲート・アレイ(FPGA)、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサ、電子デバイス、本明細書で説明された機能を実行するようにデザインされた他の電子ユニット、コンピュータ、又は、それらの組み合わせの中に実装されてもよい。 Regarding hardware implementation, a processing unit or the like used to realize the above steps and components in an entity (for example, a computer device, a seed wireless communication device, a Node B, a terminal, a hard disk drive device, or an optical disk drive device) Means include one or more application-specific ICs (ASICs), digital signal processors (DSPs), digital signal processing devices (DSPDs), programmable logic devices (PLDs), field programmable gate arrays (FPGAs). ), Processors, controllers, microcontrollers, microprocessors, electronic devices, other electronic units designed to perform the functions described herein, computers, or combinations thereof. Good.
また、ファームウェア及び/又はソフトウェア実装については、上記構成要素を実現するために用いられる処理ユニット等の手段は、本明細書で説明された機能を実行するプログラム(例えば、プロシージャ、関数、モジュール、インストラクション、などのコード)で実装されてもよい。一般に、ファームウェア及び/又はソフトウェアのコードを明確に具体化する任意のコンピュータ/プロセッサ読み取り可能な媒体が、本明細書で説明された上記工程及び構成要素を実現するために用いられる処理ユニット等の手段の実装に利用されてもよい。例えば、ファームウェア及び/又はソフトウェアコードは、例えば制御装置において、メモリに記憶され、コンピュータやプロセッサにより実行されてもよい。そのメモリは、コンピュータやプロセッサの内部に実装されてもよいし、又は、プロセッサの外部に実装されてもよい。また、ファームウェア及び/又はソフトウェアコードは、例えば、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、不揮発性ランダムアクセスメモリ(NVRAM)、プログラマブルリードオンリーメモリ(PROM)、電気的消去可能PROM(EEPROM)、FLASHメモリ、フロッピー(登録商標)ディスク、コンパクトディスク(CD)、デジタルバーサタイルディスク(DVD)、磁気又は光データ記憶装置、などのような、コンピュータやプロセッサで読み取り可能な媒体に記憶されてもよい。そのコードは、1又は複数のコンピュータやプロセッサにより実行されてもよく、また、コンピュータやプロセッサに、本明細書で説明された機能性のある態様を実行させてもよい。 For firmware and / or software implementation, means such as processing units used to implement the above components are programs (eg, procedures, functions, modules, instructions) that perform the functions described herein. , Etc.) may be implemented. Generally, any computer / processor readable medium that clearly embodies the firmware and / or software code is a means such as a processing unit used to implement the steps and components described herein. May be used to implement. For example, the firmware and / or software code may be stored in memory and executed by a computer or processor, for example, in a control device. The memory may be implemented inside the computer or processor, or may be implemented outside the processor. Further, the firmware and / or software code includes, for example, a random access memory (RAM), a read-only memory (ROM), a non-volatile random access memory (NVRAM), a programmable read-only memory (PROM), and an electrically erasable PROM (EEPROM). ), FLASH memory, floppy (registered trademark) discs, compact discs (CDs), digital versatile discs (DVDs), magnetic or optical data storage devices, etc. Good. The code may be executed by one or more computers or processors, or the computers or processors may be made to perform functional embodiments described herein.
また、前記媒体は非一時的な記録媒体であってもよい。また、前記プログラムのコードは、コンピュータ、プロセッサ、又は他のデバイス若しくは装置機械で読み込んで実行可能であれよく、その形式は特定の形式に限定されない。例えば、前記プログラムのコードは、ソースコード、オブジェクトコード及びバイナリコードのいずれでもよく、また、それらのコードの2以上が混在したものであってもよい。 Further, the medium may be a non-temporary recording medium. Further, the code of the program may be read and executed by a computer, a processor, or another device or device machine, and the format thereof is not limited to a specific format. For example, the code of the program may be any of source code, object code, and binary code, or may be a mixture of two or more of these codes.
また、本明細書で開示された実施形態の説明は、当業者が本開示を製造又は使用するのを可能にするために提供される。本開示に対するさまざまな修正は当業者には容易に明白になり、本明細書で定義される一般的原理は、本開示の趣旨又は範囲から逸脱することなく、他のバリエーションに適用可能である。それゆえ、本開示は、本明細書で説明される例及びデザインに限定されるものではなく、本明細書で開示された原理及び新規な特徴に合致する最も広い範囲に認められるべきである。 Also, the description of the embodiments disclosed herein is provided to allow one of ordinary skill in the art to manufacture or use the disclosure. Various amendments to this disclosure will be readily apparent to those of skill in the art and the general principles defined herein are applicable to other variations without departing from the spirit or scope of this disclosure. Therefore, this disclosure is not limited to the examples and designs described herein, but should be accepted in the broadest range consistent with the principles and novel features disclosed herein.
10 :情報処理装置
15 :顧客管理サーバ
20 :AP装置(アクセスポイント装置)
30 :移動通信網
35 :通信網
80 :利用者
85 :端末
85 :無線端末装置
90 :自動改札機
91,92 :データ集計用PC装置
95 :顧客管理サーバ
102 :情報取得部
103 :推定部
104 :決定部
105 :分析部
10: Information processing device 15: Customer management server 20: AP device (access point device)
30: Mobile communication network 35: Communication network 80: User 85: Terminal 85: Wireless terminal device 90:
Claims (20)
前記対象箇所又はその近傍に設けられた近距離無線通信のアクセスポイント装置から、前記アクセスポイント装置が推定対象時間内に検知した無線端末装置の検知数の情報を取得する検知情報取得部と、
前記無線端末装置の検知数から前記対象箇所の通過人数を推定する推定モデルのパラメータの値を記憶する記憶部と、
前記パラメータの値を含む推定モデルと、前記推定対象時間内の前記無線端末装置の検知数の情報とに基づいて、前記推定対象時間内に前記対象箇所を通過した通過人数を推定する推定部と、を備えることを特徴とする情報処理装置。 An information processing device that estimates the number of people passing through a target location in a facility.
A detection information acquisition unit that acquires information on the number of detections of the wireless terminal device detected by the access point device within the estimated target time from the access point device for short-range wireless communication provided at or near the target location.
A storage unit that stores the parameter values of the estimation model that estimates the number of people passing through the target location from the number of detections of the wireless terminal device.
An estimation unit that estimates the number of people passing through the target location within the estimation target time based on an estimation model including the value of the parameter and information on the number of detections of the wireless terminal device within the estimation target time. An information processing device characterized by being provided with.
前記アクセスポイント装置が所定時間内に検知した無線端末装置の検知数の情報と、前記対象箇所を前記所定時間内に実際に通過した人数を集計した通過人数の情報とに基づいて、前記推定モデルのパラメータの値を決定する決定部を、更に備えることを特徴とする情報処理装置。 In the information processing device of claim 1,
The estimation model is based on information on the number of detected wireless terminal devices detected by the access point device within a predetermined time and information on the number of people who have actually passed through the target location within the predetermined time. An information processing apparatus further comprising a determination unit for determining a value of a parameter of.
前記対象箇所を前記所定時間内に実際に通過した人数を集計した実数の情報を取得する実数情報取得部を更に備えることを特徴とする情報処理装置。 In the information processing device of claim 2,
An information processing apparatus further comprising a real number information acquisition unit that acquires real number information obtained by totaling the number of people who have actually passed through the target location within the predetermined time.
前記推定モデルは、前記通過人数を前記無線端末装置の検知数の一次関数で表すモデルであることを特徴とする情報処理装置。 In the information processing device according to any one of claims 1 to 3,
The information processing device is characterized in that the estimated model is a model in which the number of passing persons is represented by a linear function of the number of detections of the wireless terminal device.
前記一次関数の傾きを表すパラメータは、前記無線端末装置に対応する通信キャリアの市場占有率であるキャリアシェア率と、前記無線端末装置の近距離無線機能ON率と、前記キャリアシェア率及び前記近距離無線機能ON率以外の理由で前記アクセスポイント装置が前記無線端末装置を検知できない程度を示す欠損度と、を含み、
前記アクセスポイント装置が所定時間内に検知した無線端末装置の検知数の情報と前記実数の情報とに基づいて次の(1)式を用いて前記欠損度を計算して決定し、
前記推定部は、次の(2)式を用いて前記通過人数を推定する、ことを特徴とする情報処理装置。
The parameters representing the inclination of the linear function are the carrier share rate, which is the market share of the communication carrier corresponding to the wireless terminal device, the short-range wireless function ON rate of the wireless terminal device, the carrier share rate, and the near field. Includes a degree of defect indicating the degree to which the access point device cannot detect the wireless terminal device for reasons other than the distance radio function ON rate.
Based on the information on the number of detected wireless terminal devices detected by the access point device within a predetermined time and the information on the real number, the degree of deficiency is calculated and determined using the following equation (1).
The information processing device is characterized in that the estimation unit estimates the number of people passing by using the following equation (2).
前記欠損度は、係数a,bを有する次の(3)式で定義され、
前記アクセスポイント装置が所定時間内に検知した無線端末装置の検知数の情報と前記実数の情報とに基づいて、前記(3)式の欠損度の中の係数a,bを決定し、
前記推定部は、次の(4)式を用いて前記通過人数を推定することを特徴とする情報処理装置。
The degree of deficiency is defined by the following equation (3) having coefficients a and b, and is defined by the following equation (3).
Based on the information on the number of detected wireless terminal devices detected by the access point device within a predetermined time and the information on the real number, the coefficients a and b in the degree of deficiency in the equation (3) are determined.
The estimation unit is an information processing device characterized in that the number of passing persons is estimated using the following equation (4).
前記推定モデルのパラメータの値は、前記対象箇所の通過人数の推定に影響する互いに異なる複数の条件のそれぞれについて決定され、
前記推定部は、前記複数の条件から前記推定対象時間に対応する条件を選択し、前記選択した条件に対応する前記パラメータの値を含む推定モデルを、前記通過人数の推定に用いることを特徴とする情報処理装置。 In the information processing device according to any one of claims 1 to 6,
The values of the parameters of the estimation model are determined for each of a plurality of different conditions that affect the estimation of the number of people passing through the target location.
The estimation unit is characterized in that a condition corresponding to the estimation target time is selected from the plurality of conditions, and an estimation model including the value of the parameter corresponding to the selected condition is used for estimating the number of passing persons. Information processing device.
前記条件の項目は、時間帯及び曜日の少なくとも一方を含むことを特徴とする情報処理装置。 In the information processing device of claim 7,
An information processing apparatus characterized in that the item of the above condition includes at least one of a time zone and a day of the week.
前記条件の項目は、前記対象箇所付近の混雑度及び前記対象箇所を通過する人の歩行速度の統計値の少なくとも一方を含むことを特徴とする情報処理装置。 In the information processing device of claim 7 or 8,
The item of the condition is an information processing apparatus including at least one of a statistical value of a degree of congestion in the vicinity of the target location and a walking speed of a person passing through the target location.
前記推定モデルは、前記無線端末装置の検知数の情報と前記対象箇所の通過人数の推定に影響する複数種類の条件の情報とを環境変数とし、前記対象箇所の通過人数を目的変数とする機械学習モデルであり、
前記アクセスポイント装置が所定時間内に検知した無線端末装置の検知数の情報と、前記対象箇所の通過人数の推定に影響する複数種類の条件の情報と、前記対象箇所の実際の通過人数の情報とを含む複数の学習用データを用いて、前記機械学習モデルのパラメータの値を決定することを特徴とする情報処理装置。 In the information processing device according to any one of claims 1 to 3,
The estimation model is a machine in which information on the number of detections of the wireless terminal device and information on a plurality of types of conditions affecting the estimation of the number of people passing through the target location are used as environment variables, and the number of people passing through the target location is used as an objective variable. It ’s a learning model,
Information on the number of detected wireless terminal devices detected by the access point device within a predetermined time, information on a plurality of types of conditions that affect the estimation of the number of people passing through the target location, and information on the actual number of people passing through the target location. An information processing apparatus characterized in that the value of a parameter of the machine learning model is determined using a plurality of learning data including the above.
前記推定対象時間内に検知された前記無線端末装置の利用者の属性情報に基づいて、前記対象箇所を通過した人の集団について属性分析を行う分析部を、更に備えることを特徴とする情報処理装置。 In the information processing device according to any one of claims 1 to 10.
Information processing characterized by further including an analysis unit that performs attribute analysis on a group of people who have passed the target location based on the attribute information of the user of the wireless terminal device detected within the estimated target time. apparatus.
前記対象箇所の近傍に設けられた近距離無線通信のアクセスポイント装置が検知した複数の無線端末装置について、前記無線端末装置の利用者の属性情報を記憶する記憶部と、
前記複数の無線端末装置の利用者の属性情報に基づいて、前記対象箇所を通過した人の集団について属性分析を行う分析部と、
を備えることを特徴とする情報処理装置。 It is an information processing device that analyzes people who have passed the target location where the user in the facility passes.
A storage unit that stores attribute information of a user of the wireless terminal device for a plurality of wireless terminal devices detected by an access point device for short-range wireless communication provided in the vicinity of the target location.
An analysis unit that performs attribute analysis on a group of people who have passed the target location based on the attribute information of the users of the plurality of wireless terminal devices.
An information processing device characterized by being equipped with.
前記属性情報は、前記利用者の性別、年齢及び居住地の少なくとも一つの情報を含むことを特徴とする情報処理装置。 In the information processing device of claim 11 or 12,
The information processing device is characterized in that the attribute information includes at least one information of the user's gender, age, and place of residence.
前記対象箇所又はその近傍に設けられた近距離無線通信のアクセスポイント装置から、前記アクセスポイント装置が推定対象時間内に検知した無線端末装置の検知数の情報を取得することと、
前記無線端末装置の検知数から前記対象箇所の通過人数を推定する推定モデルのパラメータの値を記憶することと、
前記パラメータの値を含む推定モデルと、前記推定対象時間内の前記無線端末装置の検知数の情報とに基づいて、前記推定対象時間内に前記対象箇所を通過した通過人数を推定することと、
を含むことを特徴とする方法。 It is a method of estimating the number of people passing through the target location where the user in the facility passes.
Obtaining information on the number of detected wireless terminal devices detected by the access point device within the estimated target time from the access point device for short-range wireless communication provided at or near the target location.
To store the parameter values of the estimation model that estimates the number of people passing through the target location from the number of detections of the wireless terminal device.
Based on the estimation model including the value of the parameter and the information on the number of detections of the wireless terminal device within the estimation target time, the number of people passing through the target location within the estimation target time is estimated.
A method characterized by including.
前記アクセスポイント装置が所定時間内に検知した無線端末装置の検知数の情報と、前記対象箇所を前記所定時間内に実際に通過した人数を集計した通過人数の情報とに基づいて、前記推定モデルのパラメータの値を決定することを更に含むことを特徴とする方法。 In the method of claim 15,
The estimation model is based on information on the number of detected wireless terminal devices detected by the access point device within a predetermined time and information on the number of people who have actually passed through the target location within the predetermined time. A method further comprising determining the value of a parameter of.
前記対象箇所又はその近傍に設けられた近距離無線通信のアクセスポイント装置が検知した複数の無線端末装置について、前記無線端末装置の利用者の属性情報を記憶することと、
前記複数の無線端末装置の利用者の属性情報に基づいて、前記対象箇所を通過した人の集団について属性分析を行うことと、
を含むことを特徴とする方法。 It is a method of analyzing people who have passed the target place where the user in the facility passes.
To store the attribute information of the user of the wireless terminal device for a plurality of wireless terminal devices detected by the access point device for short-range wireless communication provided at or near the target location.
Based on the attribute information of the users of the plurality of wireless terminal devices, attribute analysis is performed on a group of people who have passed the target location, and
A method characterized by including.
前記対象箇所又はその近傍に設けられた近距離無線通信のアクセスポイント装置から、前記アクセスポイント装置が推定対象時間内に検知した無線端末装置の検知数の情報を取得するためのプログラムコードと、
前記無線端末装置の検知数から前記対象箇所の通過人数を推定する推定モデルのパラメータの値を記憶するためのプログラムコードと、
前記パラメータの値を含む推定モデルと、前記推定対象時間内の前記無線端末装置の検知数の情報とに基づいて、前記推定対象時間内に前記対象箇所を通過した通過人数を推定するためのプログラムコードと、
を含むことを特徴とするプログラム。 A program executed by a computer or processor provided in an information processing device that estimates the number of people passing through a target location in a facility.
A program code for acquiring information on the number of detected wireless terminal devices detected by the access point device within the estimated target time from the access point device for short-range wireless communication provided at or near the target location.
A program code for storing the parameter values of the estimation model that estimates the number of people passing through the target location from the number of detections of the wireless terminal device, and
A program for estimating the number of people passing through the target location within the estimated target time based on the estimation model including the value of the parameter and the information on the number of detections of the wireless terminal device within the estimated target time. Code and
A program characterized by including.
前記アクセスポイント装置が所定時間内に検知した無線端末装置の検知数の情報と、前記対象箇所を前記所定時間内に実際に通過した人数を集計した通過人数の情報とに基づいて、前記推定モデルのパラメータの値を決定するためのプログラムコードを更に含むことを特徴とするプログラム。 In the program of claim 18.
The estimation model is based on information on the number of detected wireless terminal devices detected by the access point device within a predetermined time and information on the number of people who have actually passed through the target location within the predetermined time. A program comprising further program code for determining the value of a parameter of.
前記対象箇所又はその近傍に設けられた近距離無線通信のアクセスポイント装置が検知した複数の無線端末装置について、前記無線端末装置の利用者の属性情報を記憶するためのプログラムコードと、
前記複数の無線端末装置の利用者の属性情報に基づいて、前記対象箇所を通過した人の集団について属性分析を行うためのプログラムコードと、
を含むことを特徴とするプログラム。 A program executed by a computer or processor provided in an information processing device that analyzes a person who has passed a target location where a user in a facility passes.
A program code for storing attribute information of a user of the wireless terminal device for a plurality of wireless terminal devices detected by an access point device for short-range wireless communication provided at or near the target location.
Based on the attribute information of the users of the plurality of wireless terminal devices, a program code for performing attribute analysis on a group of people who have passed the target location, and
A program characterized by including.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019164543A JP6801064B1 (en) | 2019-09-10 | 2019-09-10 | Information processing equipment, systems, methods and programs |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019164543A JP6801064B1 (en) | 2019-09-10 | 2019-09-10 | Information processing equipment, systems, methods and programs |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6801064B1 JP6801064B1 (en) | 2020-12-16 |
JP2021043641A true JP2021043641A (en) | 2021-03-18 |
Family
ID=73740958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019164543A Active JP6801064B1 (en) | 2019-09-10 | 2019-09-10 | Information processing equipment, systems, methods and programs |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6801064B1 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008310721A (en) * | 2007-06-18 | 2008-12-25 | Dainippon Printing Co Ltd | Passing/staying information management system, sensor terminal, access point terminal, and program |
-
2019
- 2019-09-10 JP JP2019164543A patent/JP6801064B1/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008310721A (en) * | 2007-06-18 | 2008-12-25 | Dainippon Printing Co Ltd | Passing/staying information management system, sensor terminal, access point terminal, and program |
Also Published As
Publication number | Publication date |
---|---|
JP6801064B1 (en) | 2020-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pouw et al. | Monitoring physical distancing for crowd management: Real-time trajectory and group analysis | |
Hussain et al. | Transit OD matrix estimation using smartcard data: Recent developments and future research challenges | |
Traunmueller et al. | Digital footprints: Using WiFi probe and locational data to analyze human mobility trajectories in cities | |
Munizaga et al. | Validating travel behavior estimated from smartcard data | |
US8977496B2 (en) | System and method for estimating origins and destinations from identified end-point time-location stamps | |
Dai et al. | Bus travel time modelling using GPS probe and smart card data: A probabilistic approach considering link travel time and station dwell time | |
Ortega-Tong | Classification of London's public transport users using smart card data | |
Smith et al. | Finger on the pulse: identifying deprivation using transit flow analysis | |
Herrera-Restrepo et al. | A multi-perspective dynamic network performance efficiency measurement of an evacuation: A dynamic network-DEA approach | |
Sari Aslam et al. | A high-precision heuristic model to detect home and work locations from smart card data | |
Zhang et al. | Revealing group travel behavior patterns with public transit smart card data | |
CN109891190B (en) | Geo-locating individuals based on derived social networks | |
Tavassoli et al. | Modelling passenger waiting time using large-scale automatic fare collection data: An Australian case study | |
Guo et al. | A simple but quantifiable approach to dynamic price prediction in ride-on-demand services leveraging multi-source urban data | |
Esmalian et al. | Characterizing equitable access to grocery stores during disasters using location-based data | |
Yun et al. | Minimum sampling size of floating cars for urban link travel time distribution estimation | |
Lima Santos et al. | How do urban mobility (geo) graph’s topological properties fill a map? | |
Leng et al. | Leveraging individual and collective regularity to profile and segment user locations from mobile phone data | |
Li et al. | Comparison of door-to-door transit travel time estimation using schedules, real-time vehicle arrivals, and smartcard inference methods | |
JP6801064B1 (en) | Information processing equipment, systems, methods and programs | |
Jin et al. | Spatio-temporally constrained origin–destination inferring using public transit fare card data | |
Goulet-Langlois | Exploring regularity and structure in travel behavior using smart card data | |
Lee et al. | Quantifying incident impacts and identifying influential features in urban traffic networks | |
JP2021096793A (en) | Area analysis system and method thereof | |
Li et al. | Equality of public transit connectivity: the influence of mass rapid transit services on individual buildings for Singapore |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190913 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20191007 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201125 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6801064 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |