JP2017204168A - Taxi demand estimation system - Google Patents
Taxi demand estimation system Download PDFInfo
- Publication number
- JP2017204168A JP2017204168A JP2016095937A JP2016095937A JP2017204168A JP 2017204168 A JP2017204168 A JP 2017204168A JP 2016095937 A JP2016095937 A JP 2016095937A JP 2016095937 A JP2016095937 A JP 2016095937A JP 2017204168 A JP2017204168 A JP 2017204168A
- Authority
- JP
- Japan
- Prior art keywords
- facility
- area
- taxi
- information
- demand
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000029305 taxis Effects 0.000 claims description 23
- 230000014509 gene expression Effects 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 11
- 230000003466 anti-cipated effect Effects 0.000 claims 1
- 238000013500 data storage Methods 0.000 description 7
- 230000005484 gravity Effects 0.000 description 5
- 238000000034 method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000000611 regression analysis Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000015220 hamburgers Nutrition 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
Images
Landscapes
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、タクシーの需要を推定するタクシー需要推定システムに関する。 The present invention relates to a taxi demand estimation system that estimates the demand for taxis.
従来、タクシーの営業実績を示す営業実績データからタクシーの需要を推定するシステムがある。例えば、特許文献1には、タクシーの乗車が見込まれるロケーションを予測するシステムが開示されている。このシステムは、営業実績データからエリアごとにタクシーの乗車確率を算出し、気象条件、他の交通機関の状況、時間など乗車との因果関係にある項目で解析を行う。
Conventionally, there is a system that estimates taxi demand from business performance data indicating the business performance of a taxi. For example,
特許文献1には記載のシステムでは、タクシーの営業がされているエリアにおけるタクシーの需要を推定することはできるものの、タクシーの営業が十分にされていないエリアにおけるタクシーの需要を推定することは難しい。このため、タクシーの営業が十分にされていないエリアについても、タクシーの需要、即ち、タクシーの乗車が見込まれるロケーションを推定することが望まれている。
With the system described in
本発明は、タクシーの営業が十分にされていないエリアについても、タクシーの需要を推定可能なタクシー需要推定システムを提供することを目的とする。 An object of this invention is to provide the taxi demand estimation system which can estimate the demand of a taxi also about the area where the business of a taxi is not enough.
上記の目的を達成するために、本発明に係るタクシー需要推定システムは、エリアごとのタクシーの乗車数を示す乗車情報を取得する乗車情報取得手段と、施設の位置を示す情報を含む施設に関する施設情報を取得する施設情報取得手段と、乗車情報取得手段によって取得された各エリアでの乗車情報、及び施設情報取得手段によって取得された当該各エリア内外の施設に係る施設情報に基づいて、タクシーの需要が見込まれるエリアを推定する推定手段と、推定手段によって推定されたエリアを示す情報を出力する出力手段と、を備える。 In order to achieve the above object, a taxi demand estimation system according to the present invention is a facility related to a facility including boarding information acquisition means for acquiring boarding information indicating the number of taxis boarding for each area, and information indicating the position of the facility. Based on the facility information acquisition means for acquiring information, the boarding information in each area acquired by the boarding information acquisition means, and the facility information related to the facilities inside and outside each area acquired by the facility information acquisition means, An estimation unit that estimates an area in which demand is expected, and an output unit that outputs information indicating the area estimated by the estimation unit.
本発明に係るタクシー需要推定システムは、施設に着目して、タクシーの需要が見込まれるエリアを推定するので、タクシーの営業が十分にされておらず、タクシーの乗車情報がないエリアについても、タクシーの需要が推定可能である。 The taxi demand estimation system according to the present invention estimates an area where taxi demand is expected by paying attention to facilities, so taxis are not sufficiently operated and taxi information is also available for areas where there is no taxi information. Demand can be estimated.
施設情報取得手段は、施設の種類を示す情報を含む施設情報を取得し、推定手段は、施設の種類に基づいて、タクシーの需要が見込まれるエリアを推定してもよい。この場合、例えば、タクシーの需要の要因となる施設と同じ種類の施設を有するエリアをタクシーの需要が見込まれるエリアとして推定することができる。 The facility information acquisition unit may acquire facility information including information indicating the type of facility, and the estimation unit may estimate an area where taxi demand is expected based on the type of facility. In this case, for example, an area having the same type of facility as the factor causing the demand for taxis can be estimated as an area where the demand for taxis is expected.
施設情報取得手段は、施設の特徴を示す特徴量を示す情報を含む施設情報を取得し、推定手段は、エリア内の施設の特徴量と、当該エリアでのタクシーの乗車数との関係式を推定し、推定した関係式を用いて、当該エリア外の施設の特徴量から当該エリア外の施設に係るタクシーの乗車数を推定し、推定したタクシーの乗車数から、タクシーの需要が見込まれるエリアを推定してもよい。この場合、例えば、推定したタクシーの乗車数が多い施設が含まれるエリアをタクシーの需要が見込まれるエリアとして推定することができる。 The facility information acquisition means acquires facility information including information indicating the feature quantity indicating the feature of the facility, and the estimation means obtains a relational expression between the feature quantity of the facility in the area and the number of taxi rides in the area. Estimate the estimated number of taxis related to the facilities outside the area from the feature quantities of the facilities outside the area using the estimated relational expression, and estimate the taxi demand from the estimated number of taxis May be estimated. In this case, for example, an area including a facility with a large estimated number of taxi rides can be estimated as an area where demand for taxis is expected.
施設情報取得手段は、施設に係る人の数を示す情報を含む施設情報を取得し、推定手段は、エリア外の施設に係る人の数に基づいて、タクシーの需要が見込まれるエリアを推定してもよい。この場合、例えば、施設に係る人の数が多い施設が含まれるエリアをタクシーの需要が見込まれるエリアとして推定することができる。 The facility information acquisition means acquires facility information including information indicating the number of persons related to the facility, and the estimation means estimates an area where taxi demand is expected based on the number of persons related to the facility outside the area. May be. In this case, for example, an area including a facility with a large number of people involved in the facility can be estimated as an area where demand for taxis is expected.
施設情報取得手段は、施設に係る人の数を示す情報を含む施設情報を取得し、推定手段は、エリア内の施設に係る人の数に基づいて、当該施設から、タクシーの需要が見込まれるエリアの推定に用いるエリア内の施設を抽出してもよい。この場合、例えば、施設に係る人の数が多い施設を推定に用いるエリア内の施設として抽出することができる。この結果、タクシーの需要が見込まれるエリアを精度よく推定することができる。 The facility information acquisition means acquires facility information including information indicating the number of persons related to the facility, and the estimation means is expected to demand taxi from the facility based on the number of persons related to the facilities in the area. You may extract the facility in the area used for area estimation. In this case, for example, a facility with a large number of persons involved in the facility can be extracted as a facility in the area used for estimation. As a result, an area where taxi demand is expected can be accurately estimated.
乗車情報取得手段は、タクシーの乗車位置を示す情報を取得し、乗車位置をクラスタリングして乗車情報を取得してもよい。この場合、タクシーの需要の要因となる施設が同じである乗車情報を一まとまりにして扱うことができる。この結果、タクシーの需要が見込まれるエリアを精度よく推定することができる。 A boarding information acquisition means may acquire the information which shows the boarding position of a taxi, cluster a boarding position, and may acquire boarding information. In this case, it is possible to handle the boarding information having the same facilities that cause taxi demand as a group. As a result, an area where taxi demand is expected can be accurately estimated.
本発明では、タクシーの営業が十分にされていないエリアについても、タクシーの需要を推定可能である。 In the present invention, it is possible to estimate the demand for taxis even in areas where taxis are not sufficiently operated.
以下、図面と共に本発明に係るタクシー需要推定システムの実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。 Hereinafter, embodiments of a taxi demand estimation system according to the present invention will be described in detail with reference to the drawings. In the description of the drawings, the same elements are denoted by the same reference numerals, and redundant description is omitted.
図1は、実施形態に係るタクシー需要推定システムのブロック図である。タクシー需要推定システム(以下、単に「システム」とも言う。)1は、タクシーの需要を推定するためのものであって、具体的には、タクシーの需要が見込まれるエリアを推定するためのコンピュータシステムである。 FIG. 1 is a block diagram of a taxi demand estimation system according to the embodiment. A taxi demand estimation system (hereinafter also simply referred to as “system”) 1 is for estimating the demand for taxis, and specifically, a computer system for estimating an area where the demand for taxis is expected. It is.
図2は、タクシー需要推定システムのハードウェア構成を示す図である。図2に示されるように、システム1は、1つ以上のCPU(Central Processing Unit)101、主記憶装置であるRAM(Random Access Memory)102及びROM(Read Only Memory)103、通信を行うための通信モジュール104、並びにハードディスク等の補助記憶装置等のハードウェア105を備えるコンピュータを含むものとして構成される。これらの構成要素がプログラム等により動作することにより、図1のシステム1の各機能要素による機能が発揮される。なお、システム1は複数台のコンピュータによるコンピュータシステムによって構成されていてもよい。以下、図1に示される各機能要素及び各データベースについて説明する。
FIG. 2 is a diagram illustrating a hardware configuration of the taxi demand estimation system. As shown in FIG. 2, the
図1に示されるように、システム1は、乗車情報取得部2と、施設情報取得部3と、推定部4と、出力部5と、営業データ記憶部11と、施設情報記憶部12と、を備えている。
As shown in FIG. 1, the
営業データ記憶部11は、タクシーの営業データ(営業実績データ)を記憶する装置である。営業データには、乗客がタクシーに乗車した位置である乗車位置を示す、例えば緯度経度からなる乗車位置情報と、乗客がタクシーに乗車した時刻である乗車時刻を示す乗車時刻情報とが含まれる。営業データ記憶部11は、具体的には、図3に示されるような事象発生ポイントテーブルに営業データを記憶している。営業データ記憶部11に営業データを記憶させる方法は限定されない。例えば、乗客がタクシーに乗車する度に、各タクシーに備えられた端末が営業データを生成して、生成した営業データを営業データ記憶部11に通信網を介して送信する構成としてもよい。
The business
乗車情報取得部2は、エリアごとのタクシーの乗車数を示す乗車情報を取得する乗車情報取得手段である。乗車情報取得部2は、タクシーの乗車位置を示す情報を取得し、乗車位置をクラスタリングして乗車情報を取得する。具体的には、まず、乗車情報取得部2は、営業データ記憶部11から営業データを取得する。乗車情報取得部2は、例えば、1週間ごとに、その前の1週間分の営業データを取得する。乗車情報取得部2は、このように予め定められた所定のタイミングで営業データを取得してもよいし、それ以外のタイミングで営業データを取得してもよい。また、乗車情報取得部2は、営業データ記憶部11に記憶された営業データのうち、このように予め定められた所定期間の営業データを取得してもよいし、全期間の営業データを取得してもよい。
The boarding
続いて、乗車情報取得部2は、取得した営業データを曜日及び時間帯ごとに分類(層別)し、分類した営業データを空間クラスタリングする。図4を参照して、営業データの空間クラスタリングについて説明する。図4では、乗車時刻がある曜日及び時間帯である複数の営業データそれぞれの乗車位置が地図上の対応する位置であるポイント(事象発生ポイント)で示されている。乗車情報取得部2は、これらの複数のポイントから、空間的に互いに近い範囲に位置するポイントの集合としてクラスタC1〜C5を生成する。空間クラスタリングは、例えば公知技術のミーンシフト法を用いて行われる。
Subsequently, the boarding
乗車情報取得部2は、曜日及び時間帯ごとに営業データの空間クラスタリングを行ってクラスタを生成し、生成したクラスタごとに、クラスタの重心位置と、クラスタの大きさと、クラスタ内の事象発生ポイント数、即ちタクシーの乗車数と、を求める。クラスタの重心位置とは、クラスタに含まれる事象発生ポイントの平均位置である。クラスタの大きさとは、クラスタに含まれる事象発生ポイントのうち、重心位置から最も離れた事象発生ポイントと重心位置とがなす距離である。乗車情報取得部2は、図5の事象発生ポイントクラスタテーブルに示すクラスタ情報を生成する。クラスタ情報は、クラスタの重心位置を示す、例えば緯度経度からなる重心位置情報と、曜日と、時間帯と、クラスタを示すクラスタIDと、クラスタの大きさと、クラスタ内の事象発生ポイント数と、からなる。
The boarding
図5は、事象発生ポイントクラスタテーブルの例を示す図である。ここでは、時間帯は1時間ごとに設定されており、例えば、「1」は午前1時台の時間帯(午前1時以降午前2時より前の時間帯)を示している。なお、時間帯は、営業データ数が意味のある数となるように、営業データ数の分布に応じて設定されてもよい。例えば、営業データ数が少ない深夜の時間帯を1つの時間帯としてもよい。また、各時間帯の営業データ数の分布が均等となるように、1日をn分割(nは自然数)して時間帯を設定してもよい。乗車情報取得部2は、営業データ及びクラスタ情報を推定部4に送出する。
FIG. 5 is a diagram illustrating an example of an event occurrence point cluster table. Here, the time zone is set every hour. For example, “1” indicates a time zone in the range of 1 am (a time zone after 1 am and before 2 am). The time period may be set according to the distribution of the number of sales data so that the number of sales data becomes a meaningful number. For example, a midnight time zone with a small number of business data may be set as one time zone. Further, the time zone may be set by dividing the day into n (n is a natural number) so that the distribution of the number of business data in each time zone is uniform. The boarding
施設情報記憶部12は、施設(例えばPOI:point of interest)に関する施設情報を記憶する装置である。施設情報には、施設の位置を示す、例えば緯度経度からなる位置情報、施設の種類を示すカテゴリ、施設の特徴を示す特徴量、施設に係る人の数を示す情報などが含まれる。カテゴリは、例えば、駅、ホテル、モール、病院、大使館、寺、博物館等である。特徴量については後述する。施設情報記憶部12は、施設ごとにこれらの施設情報を対応付けて記憶している。施設情報記憶部12に施設情報を記憶させる方法は限定されない。例えば、システム10の管理者が予め施設情報記憶部12に施設情報を記憶させる構成とすることができる。
The facility
具体的には、施設情報記憶部12は、施設に係る人の数を示す情報として、施設へのチェックイン数を記憶している。チェックインとは、SNS(Social Networking Service)の利用ユーザが特定施設を訪問したことを知らせるために行う投稿である。チェックイン数が多い施設は、このような投稿が多く行われた施設であるため、チェックイン数は、施設の人気度を示すパラメータと考えることができる。チェックイン数が多い施設は、多くの人が訪れる施設であるため、タクシー需要の要因となり得る。チェックイン数は、曜日及び時間帯等によらず、施設より一意に特定される値である。なお、チェックイン数は、当該SNSにより一般に公開されているので、例えば、システム10の管理者がチェックイン数を入手して、他の施設情報と共に、予め施設情報記憶部12に記憶させる構成とすることができる。あるいは、施設情報記憶部12は、施設のチェックイン数の情報を保持しているSNSのサーバから、当該情報を取得してもよい。
Specifically, the facility
施設情報取得部3は、施設の位置を示す情報、施設の種類を示す情報、施設の特徴を示す情報、及び施設に係る人の数を示す情報を含む施設に関する施設情報を取得する施設情報取得手段である。具体的には、施設情報取得部3は、施設情報記憶部12から施設情報を取得する。施設情報取得部3は、乗車情報取得部2が乗車情報を取得するのと同期して、予め定められた所定のタイミングで施設情報を取得してもよいし、それ以外のタイミングで施設情報を取得してもよい。施設情報取得部3は、取得した施設情報を推定部4に送出する。
The facility
推定部4は、乗車情報取得手段によって取得された各エリア(クラスタ)での乗車情報、及び施設情報取得手段によって取得された当該各エリア内外の施設に係る施設情報に基づいて、タクシーの需要が見込まれるエリアを推定する推定手段である。施設情報には、施設の種類を示すカテゴリの情報が含まれる。まず、推定部4は、乗車情報取得部2からクラスタ情報を入力すると共に、施設情報取得部3から施設情報を入力する。続いて、推定部4は、入力した施設情報及びクラスタ情報に基づき、施設情報により示される施設の中から、クラスタ情報により示されるクラスタごとに、クラスタ内の施設を検出する。クラスタ内の施設とは、クラスタの重心位置からクラスタの大きさである距離dの範囲(クラスタの重心位置を中心、距離dを半径とする円)内に位置する施設である。ここで、推定部4は、クラスタのうち、上記の推定に用いるクラスタを抽出してもよい。例えば、クラスタに含まれる営業データの数が上位の予め設定した数のクラスタ(即ち、よくタクシーが乗車されているクラスタ)を上記の推定に用いるクラスタとしてもよい。
Based on the boarding information in each area (cluster) acquired by the boarding information acquisition unit and the facility information regarding the facilities inside and outside each area acquired by the facility information acquisition unit, the estimation unit 4 determines the demand for taxis. It is an estimation means for estimating the expected area. The facility information includes category information indicating the type of facility. First, the estimation unit 4 inputs cluster information from the boarding
続いて、推定部4は、クラスタ内の施設の特徴量と、当該クラスタでのタクシーの乗車数との関係式(需要推定関数)を推定する。ここで、タクシー乗車に寄与する可能性が低い施設に基づき推定した関係式によれば、タクシーの営業が十分にされていないエリアの施設についてのタクシー乗車数の推定精度が低下する可能性がある。そこで、推定部4は、エリア内の施設に係る人の数に基づいて、当該施設から、タクシーの需要が見込まれるエリアの推定に用いる施設を抽出する。具体的には、推定部4は、クラスタ内の施設の中から、特に、施設のチェックイン数及びカテゴリに着目して、タクシー乗車に寄与する可能性が高い施設である高寄与施設を抽出する高精度化フィルタ処理を行う。高精度化フィルタ処理によれば、タクシー乗車に寄与する可能性が低い施設を排除することができる。 Subsequently, the estimation unit 4 estimates a relational expression (demand estimation function) between the feature amount of the facility in the cluster and the number of taxi rides in the cluster. Here, according to the relational expression estimated based on facilities that are unlikely to contribute to taxi rides, there is a possibility that the estimation accuracy of the number of taxi rides for facilities in areas where taxi sales are not sufficiently performed may be reduced. . Therefore, the estimation unit 4 extracts, from the facility, a facility used for estimating an area where taxi demand is expected, based on the number of persons related to the facility in the area. Specifically, the estimation unit 4 extracts, from among the facilities in the cluster, high-contribution facilities that are highly likely to contribute to taxi rides, particularly focusing on the number of check-ins and categories of the facilities. Perform high-precision filter processing. According to the high-precision filter processing, it is possible to eliminate facilities that are unlikely to contribute to taxi rides.
高精度化フィルタ処理について説明する。推定部4は、乗車情報取得部2から営業データを入力する。推定部4は、営業データに基づき、クラスタ情報により示される全クラスタ内の全施設のそれぞれから予め定められた所定距離(例えば100m以下)の範囲(施設を中心、所定距離を半径とする円)内で発生したタクシー乗車数の平均値である平均期待値をカテゴリ、曜日及び時間帯ごとに求める。推定部4は、求めた平均期待値をカテゴリ、曜日及び時間帯と対応づけて、図6に示されるようなカテゴリ別平均期待値テーブルに記憶する。続いて、推定部4は、クラスタ内の施設ごとに、対応するカテゴリ、曜日及び時間帯におけるタクシーの乗車への寄与度を下式(1)から求める。ただし、クラスタ内の施設の数をn(nは自然数)、チェックイン数をxp、平均期待値をxe、寄与度をxcとする。なお、チェックイン数が0の施設は寄与度の計算から除外される。すなわち、xp=0の場合は下記式(1)によらず、xc=0とされる。また、クラスタ内の全施設の寄与度の総和が1となるように、寄与度をクラスタ内の全施設の寄与度の総和で割って正規化してもよい。
xc=log(xp)*xe (1)
The high accuracy filtering process will be described. The estimation unit 4 inputs business data from the boarding
x c = log (x p ) * x e (1)
推定部4は、クラスタごとに、寄与度が上位N(Nは予め設定された自然数)件の施設を高寄与施設として抽出する。このような高精度化フィルタ処理によれば、人気度だけでなく、カテゴリ、曜日及び時間帯が考慮されるので、高寄与施設を高い精度で抽出することができる。例えば、金曜、深夜の時間帯において、駅、ハンバーガーショップ、及びバーが同じクラスタ内の施設として検出された場合、高精度化フィルタ処理を行うことにより、駅及びバーを高寄与施設として抽出することができる。なお、推定部4が施設の営業時間を予め記憶しておき、営業時間外の場合は高精度化フィルタ処理によりその施設を除外するように構成してもよい。推定部4がこのようにして抽出した高寄与施設を示す高寄与施設情報は、図7に示されるような高寄与施設リストテーブル(POIリストテーブル)の情報である。高寄与施設情報には、高寄与施設の名称、高寄与施設の位置情報、チェックイン数、及びカテゴリ、曜日、時間帯、及びクラスタIDが含まれる。 The estimation unit 4 extracts, for each cluster, a facility having a top N contribution (N is a preset natural number) as a high contribution facility. According to such high-accuracy filter processing, not only the popularity but also the category, day of the week, and time zone are taken into account, so that highly contributing facilities can be extracted with high accuracy. For example, if a station, a hamburger shop, and a bar are detected as facilities in the same cluster on Friday and midnight, the station and bar are extracted as highly contributing facilities by performing high-precision filter processing. Can do. Note that the estimation unit 4 may store the business hours of the facility in advance, and exclude the facility by high-accuracy filter processing when it is outside the business hours. The high contribution facility information indicating the high contribution facility extracted by the estimation unit 4 in this way is information of a high contribution facility list table (POI list table) as shown in FIG. The highly contributing facility information includes the name of the highly contributing facility, the location information of the highly contributing facility, the number of check-ins, the category, the day of the week, the time zone, and the cluster ID.
続いて、推定部4は、各高寄与施設の特徴量を説明変数(x)に設定すると共に、各高寄与施設に対応するクラスタでのタクシーの乗車数を目的変数(y)に設定して、高寄与施設の特徴量とタクシーの乗車数との関係式を曜日、時間帯及び施設のカテゴリごとに推定する。説明変数とする高寄与施設の特徴量は、例えば、最も近い学校までの距離(x0)、最も近い商業施設までの距離(x1)、最も近い駅までの距離(x2)、最も近い駅の一日の電車本数(x3)、最も近いバス停までの距離(x4)、最も近いバス停の一日のバスの本数(x5)、平日の時間帯(朝、昼、夕、夜、深夜)ごとの人口(x6_1,x6_2,・・・)、平日休日の差分人口(x7)、及び世代別(0代、10代、20代、30代・・・90代以上)人口(x8_0,x8_1,・・・,x8_9)である。人口に関するデータ(x6,x7及びx8)は、例えば、政府公表値であってもよいし、携帯電話の運用データから日本全国の属性別人口を時間帯別に推計したモバイル空間統計のデータからメッシュごとに計算したものであってもよい。x6について、推定部4は、例えば、推定する対象となる時間帯以外の時間帯の特徴量の重みを減らして関係式を推定してもよいし、推定する対象となる時間帯が予め決まっていれば、x6として、対応する特徴量のみを説明変数に設定してもよい。また、推定する対象が平日であれば、推定部4は、例えば、x7の重みを減らして関係式を推定してもよいし、x7を説明変数に設定しなくてもよい。関係式の推定は、具体的には、これらの説明変数(x0〜x8)を線形結合形式で表現し、回帰分析により各説明変数に係るパラメータを学習することにより行われる。回帰分析には、一般的に重回帰分析、Random Forest、Support Vector Regressionなどが用いられる。高寄与施設を含む各施設の特徴量は、上述のように、施設情報記憶部12が予め記憶している。施設情報記憶部12は、例えば、図8に示される施設特徴量テーブルに各施設の名称と特徴量とを対応付けて記憶している。
Subsequently, the estimation unit 4 sets the feature amount of each high-contributing facility as an explanatory variable (x), and sets the number of taxi rides in the cluster corresponding to each high-contributing facility as a target variable (y). The relational expression between the feature amount of the highly contributing facility and the number of taxi rides is estimated for each day of the week, time zone, and facility category. The feature amount of the high-contribution facility as an explanatory variable is, for example, the distance to the nearest school (x0), the distance to the nearest commercial facility (x1), the distance to the nearest station (x2), or the closest station. Number of trains per day (x3), distance to nearest bus stop (x4), number of buses per day at nearest bus stop (x5), population by weekday time zone (morning, noon, evening, night, midnight) (X6_1, x6_2, ...), weekday holiday differential population (x7), and generation (0's, 10's, 20's, 30's ... 90's and above) population (x8_0, x8_1, ...) , X8_9). The population data (x6, x7, and x8) may be, for example, government-published values, or for each mesh based on mobile spatial statistics data that estimates the demographic population of Japan nationwide from mobile phone operation data by time zone. It may be calculated in the following manner. For x6, for example, the estimation unit 4 may estimate the relational expression by reducing the weight of the feature amount in a time zone other than the time zone to be estimated, or the time zone to be estimated is determined in advance. Then, as x6, only the corresponding feature amount may be set as the explanatory variable. Further, if the target to be estimated is a weekday, the estimation unit 4 may estimate the relational expression by reducing the weight of x7, for example, or may not set x7 as an explanatory variable. Specifically, the relational expression is estimated by expressing these explanatory variables (x0 to x8) in a linear combination form and learning parameters related to each explanatory variable by regression analysis. For regression analysis, multiple regression analysis, Random Forest, Support Vector Regression, etc. are generally used. As described above, the facility
続いて、推定部4は、推定した関係式を用いて、エリア外の施設の特徴量からエリア外の施設に係るタクシーの乗車数を推定し、推定したタクシーの乗車数に基づいて、タクシーの需要が見込まれるエリアを推定する。具体的には、推定部4は、施設情報により示される施設の中から、クラスタ情報により示されるクラスタに含まれない施設をエリア外の施設として検出する。推定部4は、曜日、時間帯及びカテゴリごとに推定した関係式を用いて、曜日、時間帯及びカテゴリごとにエリア外の施設それぞれについてタクシーの乗車数を推定乗車数として算出する。 Subsequently, the estimation unit 4 uses the estimated relational expression to estimate the number of taxi occupying the facility outside the area from the feature amount of the facility outside the area, and based on the estimated number of taxi occupancy, Estimate areas where demand is expected. Specifically, the estimation unit 4 detects a facility that is not included in the cluster indicated by the cluster information as a facility outside the area from the facilities indicated by the facility information. The estimation unit 4 uses the relational expressions estimated for each day of the week, time zone, and category to calculate the number of taxi rides as the estimated number of rides for each facility outside the area for each day of the week, time zone, and category.
推定部4は、エリア外の施設のうち、算出された乗車数(スコア)が予め設定された閾値以上の施設をタクシー需要の要因となり得る潜在的な施設として抽出する。推定部4は、当該施設を含むエリア、例えば、当該施設の近傍のエリアを、タクシーの需要が見込まれるエリアと推定する。推定部4が抽出した潜在的な施設を示す情報である潜在施設情報は、図9に示されるような潜在施設リストテーブルの情報である。潜在施設情報には、施設の名称、曜日、時間帯、位置情報、カテゴリ、及び推定乗車数が含まれる。推定部4は、生成した潜在施設情報を出力部5に送出する。
The estimation unit 4 extracts a facility whose calculated number of rides (score) is equal to or greater than a preset threshold among the facilities outside the area as a potential facility that may cause a taxi demand. The estimation unit 4 estimates an area including the facility, for example, an area in the vicinity of the facility as an area where demand for taxis is expected. The latent facility information, which is information indicating the potential facilities extracted by the estimation unit 4, is information of a potential facility list table as shown in FIG. The latent facility information includes the name of the facility, day of the week, time zone, location information, category, and estimated number of rides. The estimation unit 4 sends the generated latent facility information to the
出力部5は、推定手段によって推定された施設を示す情報を、タクシーの需要が見込まれるエリアを示す情報として出力する出力手段である。具体的には、出力部5は、推定部4から潜在施設情報を入力し、例えば、通信網を介して各タクシーに備えられた端末に潜在施設情報を配信してもよい。なお、出力部5は、これ以外の手段で潜在施設情報を出力してもよい。
The
図10は、タクシー需要推定システムの動作を示すフローチャートである。図10に示されるように、まず、システム1は、予め定められた所定のタイミングで、乗車情報取得部2により営業データを営業データ記憶部11から取得して、クラスタを生成すると共に(S11)、施設情報取得部3により施設情報を施設情報記憶部12から取得する(S12)。次に、システム1は、施設情報及びクラスタ情報に基づき、推定部4によりクラスタ内の施設を検出し、検出した施設の中から高寄与施設を抽出する(S13)。続いて、システム1は、推定部4により、高寄与施設の特徴量とタクシーの乗車数との関係式を推定し(S14)、推定した関係式を用い、エリア外の施設についてタクシーの推定乗車数を算出する(S15)。更に、システム1は、推定部4により、タクシーの推定乗車数に基づいて、潜在的な施設を抽出する(S16)。システム1は、出力部5により、潜在施設情報を出力する(S17)。
FIG. 10 is a flowchart showing the operation of the taxi demand estimation system. As shown in FIG. 10, first, the
以上説明したように、システム1により出力される潜在施設情報は、タクシー需要の要因となり得る潜在的な施設を示す情報である。システム1が潜在施設情報を出力することは、システム1が潜在的な施設の周辺をタクシーの需要が見込まれるエリアとして推定することに相当する。このように、システム1は、施設に着目してタクシーの需要が見込まれるエリアを推定するので、タクシーの営業が十分にされておらず、営業データがないエリアについても、タクシーの需要が推定可能である。システム1は、高精度フィルタ化処理を行うので、人気度だけでなく、カテゴリ、曜日及び時間帯を考慮して、タクシーの需要が見込まれるエリアの推定に用いる高寄与施設を抽出することができる。この結果、タクシーの需要が見込まれるエリアを精度よく推定することができる。また、システム1は、営業データに含まれる事象発生ポイントをクラスタリングしてクラスタを生成する。このため、タクシーの需要の要因となる施設が同じであるタクシーの乗車情報を一まとまりにして扱うことができる。この結果、タクシーの需要が見込まれるエリアの推定を更に精度よく推定することができる。
As described above, the latent facility information output by the
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、各請求項に記載した要旨を変更しない範囲で変形し、または他のものに適用したものであってもよい。 As mentioned above, although embodiment of this invention was described, this invention is not limited to the said embodiment, It deform | transforms in the range which does not change the summary described in each claim, or applied to another thing. There may be.
例えば、システム1は、管理者がリクエストしたタイミングで、その時点のタクシーの需要を推定してもよい。具体的には、システム1は、その時点からの予め定められた所定時間を推定対象の時間帯として潜在施設情報を出力する。例えば、その時点が水曜日の午後1時であった場合、システム1は、水曜日の午後1時台を推定対象の時間帯とする。このように推定対象の曜日及び時間帯が1つであるため、システム1の処理負荷が低減される。ここで、推定部4は、エリア外の施設の中から、タクシー需要の要因となり得る潜在的な施設を抽出する際に、単に、算出された乗車数(スコア)が予め設定された閾値以上の施設を抽出するのではなく、算出された乗車数(スコア)が予め設定された閾値以上、かつ、人流データ数が予め設定された閾値以上の施設を抽出してもよい。人流データ数とは、その時点から直近t分間に施設周辺に滞在した人の数である。人流データ数によれば、直近の施設の状況をシステム1の推定結果に反映させることができる。
For example, the
例えば、ユーザが所持しているスマートフォンが、定期的(例えば、数分ごと)に測位を行って、測位によって得られたスマートフォンログをシステム1に送信するようにしておく。推定部4は、スマートフォンのGPSやWiFi等の測位点抽出機能により取得される位置情報を含むスマートフォンログを受信して、当該スマートフォンログから、施設から予め定められた所定距離(例えば100m以下)の範囲内における直近30分間の人流データ数を取得する。なお、移動判定をすることで、既に車及び電車等の乗り物で移動を行っている人の数を人流データ数から取り除いてもよい。具体的には、例えば、直近t分以内のスマートフォンログによって求められる速度が閾値以下の人の人流データ数を施設周辺の人流データ数として抽出する。また、滞留判定を行って、人流データ数を算出することとしてもよい。例えば、一定時間以上、上記の範囲に位置している人の人流データ数を施設周辺の人流データ数として抽出する。また、人流データ数をスコアとして、施設からの距離が遠くなるほどスコアへの影響がなくなるように重み付けしてもよい。なお、スマートフォンログを用いて、例えば、1カ月間、1年間の人流データ数の平均値を求め、上述の施設の特徴量における人口に関するデータとすることも可能である。
For example, a smartphone possessed by the user performs positioning periodically (for example, every few minutes) and transmits a smartphone log obtained by positioning to the
例えば、システム1は、必ずしも曜日及び時間の両方を考慮しなくてもよい。システム1は、曜日及び時間のいずれか一方のみを考慮してもよいし、曜日及び時間の両方ともを考慮せず、タクシーの需要が見込まれるエリアを推定してもよい。また、システム1は、少なくとも施設情報のいずれか1つを考慮すればよく、必ずしも施設のカテゴリを考慮しなくてもよい。また、乗車情報取得部2は、営業データの空間クラスタリングを行わず、予め定められた矩形のメッシュ領域ごとに営業データを分類してもよい。また、推定部4は、高精度化フィルタ処理を行わず、クラスタ内の施設のうち、例えば、チェックイン数が上位N件の施設を高寄与施設として抽出してもよい。
For example, the
また、上述した実施形態では、施設に係る人の数を、算出に用いる処理ごとにチェックイン数及び人流データ数としたが、それらを入れ替えることとしてもよい。即ち、チェックイン数を用いていたところに人流データ数を、人流データ数を用いていたところにチェックイン数を用いてもよい。また、施設に係る人の数は、チェックイン数及び人流データ数以外であってもよい。 Further, in the above-described embodiment, the number of persons related to the facility is set to the number of check-ins and the number of human flow data for each process used for calculation, but may be replaced. That is, the number of people flow data may be used where the number of check-ins is used, and the number of check-ins may be used where the number of people flow data is used. Further, the number of persons involved in the facility may be other than the number of check-ins and the number of human flow data.
1…タクシー需要推定システム、2…乗車情報取得部、3…施設情報取得部、4…推定部、5…出力部。
DESCRIPTION OF
Claims (6)
施設の位置を示す情報を含む施設に関する施設情報を取得する施設情報取得手段と、
前記乗車情報取得手段によって取得された各エリアでの乗車情報、及び前記施設情報取得手段によって取得された当該各エリア内外の施設に係る施設情報に基づいて、タクシーの需要が見込まれるエリアを推定する推定手段と、
前記推定手段によって推定されたエリアを示す情報を出力する出力手段と、
を備えるタクシー需要推定システム。 Boarding information acquisition means for acquiring boarding information indicating the number of taxis in each area;
Facility information acquisition means for acquiring facility information about the facility including information indicating the location of the facility;
Based on the boarding information in each area acquired by the boarding information acquisition means and the facility information related to the facilities inside and outside each area acquired by the facility information acquisition means, an area where a taxi demand is expected is estimated. An estimation means;
Output means for outputting information indicating the area estimated by the estimation means;
Taxi demand estimation system equipped with.
前記推定手段は、前記施設の種類に基づいて、タクシーの需要が見込まれるエリアを推定する、請求項1に記載のタクシー需要推定システム。 The facility information acquisition means acquires the facility information including information indicating a type of the facility,
The taxi demand estimation system according to claim 1, wherein the estimation means estimates an area where taxi demand is expected based on the type of facility.
前記推定手段は、エリア内の施設の特徴量と、当該エリアでのタクシーの乗車数との関係式を推定し、推定した関係式を用いて、当該エリア外の施設の特徴量から当該エリア外の施設に係るタクシーの乗車数を推定し、推定したタクシーの乗車数から、タクシーの需要が見込まれるエリアを推定する、請求項1又は2に記載のタクシー需要推定システム。 The facility information acquisition means acquires the facility information including information indicating a feature amount indicating the feature of the facility,
The estimation means estimates a relational expression between the feature amount of the facility in the area and the number of taxi rides in the area, and uses the estimated relational expression to calculate the feature amount of the facility outside the area from the feature area. The taxi demand estimation system according to claim 1 or 2, wherein the number of taxi rides related to the facility is estimated, and an area where taxi demand is expected is estimated from the estimated taxi ride number.
前記推定手段は、エリア外の施設に係る人の数に基づいて、タクシーの需要が見込まれるエリアを推定する、請求項1〜3の何れか一項に記載のタクシー需要推定システム。 The facility information acquisition means acquires the facility information including information indicating the number of persons related to the facility,
The taxi demand estimation system according to any one of claims 1 to 3, wherein the estimation means estimates an area in which taxi demand is expected based on the number of persons related to facilities outside the area.
前記推定手段は、エリア内の施設に係る人の数に基づいて、当該施設から、タクシーの需要が見込まれるエリアの推定に用いる前記エリア内の施設を抽出する、請求項1〜4の何れか一項に記載のタクシー需要推定システム。 The facility information acquisition means acquires the facility information including information indicating the number of persons related to the facility,
The said estimation means extracts the facility in the said area used for the estimation of the area where the demand of a taxi is anticipated from the said facility based on the number of persons who concern on the facility in an area. Taxi demand estimation system according to one item.
The taxi demand estimation system according to any one of claims 1 to 5, wherein the boarding information acquisition unit acquires information indicating a taxi boarding position, and acquires boarding information by clustering the boarding positions.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016095937A JP6688149B2 (en) | 2016-05-12 | 2016-05-12 | Taxi demand estimation system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016095937A JP6688149B2 (en) | 2016-05-12 | 2016-05-12 | Taxi demand estimation system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017204168A true JP2017204168A (en) | 2017-11-16 |
JP6688149B2 JP6688149B2 (en) | 2020-04-28 |
Family
ID=60323257
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016095937A Active JP6688149B2 (en) | 2016-05-12 | 2016-05-12 | Taxi demand estimation system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6688149B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020004209A (en) * | 2018-06-29 | 2020-01-09 | 株式会社ナビタイムジャパン | Information processing system, information processing program, and information processing method |
JPWO2020008749A1 (en) * | 2018-07-04 | 2021-07-08 | ソニーグループ株式会社 | Information processing equipment, information processing methods and programs |
KR20210085136A (en) * | 2019-12-30 | 2021-07-08 | 연세대학교 산학협력단 | Taxi Demand Estimation Method Using Space Partitioning Technique |
JP2021149462A (en) * | 2020-03-18 | 2021-09-27 | ヤフー株式会社 | Information processing device, information processing method, and program |
KR20220021245A (en) * | 2020-08-13 | 2022-02-22 | 현대오토에버 주식회사 | Demand forecasting method for mobility-on-demand services |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008052455A (en) * | 2006-08-23 | 2008-03-06 | Fujitsu Ten Ltd | Demand prediction device and program |
JP2011113141A (en) * | 2009-11-24 | 2011-06-09 | Ntt Docomo Inc | Device and method for predicting demand |
JP2012050241A (en) * | 2010-08-26 | 2012-03-08 | Ntt Docomo Inc | Demand predicting system and demand predicting method |
JP2014006890A (en) * | 2012-05-30 | 2014-01-16 | Osamu Masuda | Optimum arrangement system for taxis |
JP2014130552A (en) * | 2012-12-29 | 2014-07-10 | Zmp Co Ltd | Taxi service support system |
-
2016
- 2016-05-12 JP JP2016095937A patent/JP6688149B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008052455A (en) * | 2006-08-23 | 2008-03-06 | Fujitsu Ten Ltd | Demand prediction device and program |
JP2011113141A (en) * | 2009-11-24 | 2011-06-09 | Ntt Docomo Inc | Device and method for predicting demand |
JP2012050241A (en) * | 2010-08-26 | 2012-03-08 | Ntt Docomo Inc | Demand predicting system and demand predicting method |
JP2014006890A (en) * | 2012-05-30 | 2014-01-16 | Osamu Masuda | Optimum arrangement system for taxis |
JP2014130552A (en) * | 2012-12-29 | 2014-07-10 | Zmp Co Ltd | Taxi service support system |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020004209A (en) * | 2018-06-29 | 2020-01-09 | 株式会社ナビタイムジャパン | Information processing system, information processing program, and information processing method |
JP7056925B2 (en) | 2018-06-29 | 2022-04-19 | 株式会社ナビタイムジャパン | Information processing system, information processing program and information processing method |
JP2022093346A (en) * | 2018-06-29 | 2022-06-23 | 株式会社ナビタイムジャパン | Information processing system, information processing program, and information processing method |
JP7390746B2 (en) | 2018-06-29 | 2023-12-04 | 株式会社ナビタイムジャパン | Information processing system, information processing program, and information processing method |
JPWO2020008749A1 (en) * | 2018-07-04 | 2021-07-08 | ソニーグループ株式会社 | Information processing equipment, information processing methods and programs |
JP7188444B2 (en) | 2018-07-04 | 2022-12-13 | ソニーグループ株式会社 | Information processing device, information processing method and program |
KR20210085136A (en) * | 2019-12-30 | 2021-07-08 | 연세대학교 산학협력단 | Taxi Demand Estimation Method Using Space Partitioning Technique |
KR102338099B1 (en) * | 2019-12-30 | 2021-12-09 | 연세대학교 산학협력단 | Taxi Demand Estimation Method Using Space Partitioning Technique |
JP2021149462A (en) * | 2020-03-18 | 2021-09-27 | ヤフー株式会社 | Information processing device, information processing method, and program |
JP7297706B2 (en) | 2020-03-18 | 2023-06-26 | ヤフー株式会社 | Information processing device, information processing method and program |
KR20220021245A (en) * | 2020-08-13 | 2022-02-22 | 현대오토에버 주식회사 | Demand forecasting method for mobility-on-demand services |
KR102441523B1 (en) * | 2020-08-13 | 2022-09-07 | 현대오토에버 주식회사 | Demand forecasting method for mobility-on-demand services |
Also Published As
Publication number | Publication date |
---|---|
JP6688149B2 (en) | 2020-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6688149B2 (en) | Taxi demand estimation system | |
KR101699918B1 (en) | Ranking nearby destinations based on visit likelihoods and predicting future visits to places from location history | |
US9183497B2 (en) | Performance-efficient system for predicting user activities based on time-related features | |
EP3451275B1 (en) | Information processing device and method | |
CN108885723A (en) | For the system and method based on position data prediction user behavior | |
WO2016191515A1 (en) | Personalized information from venues of interest | |
Jiang et al. | Deep ROI-based modeling for urban human mobility prediction | |
JP6545158B2 (en) | Task allocation method, computer program product and task allocation system | |
US20180181973A1 (en) | Method of determining crowd dynamics | |
JP7175783B2 (en) | Program, device and method for estimating stay area population in predetermined area | |
Sariyer et al. | An analysis of Emergency Medical Services demand: Time of day, day of the week, and location in the city | |
CN109891190B (en) | Geo-locating individuals based on derived social networks | |
JP2015534162A (en) | Public transport navigator | |
JP6469465B2 (en) | POSITION INFORMATION MANAGEMENT DEVICE AND POSITION INFORMATION MANAGEMENT METHOD | |
WO2014186247A1 (en) | Selecting a subset of transit trips based on time and duration | |
Manout et al. | On the bumpy road to recovery: resilience of public transport ridership during COVID-19 in 15 European cities | |
CN113256004A (en) | Vehicle scheduling method and device, computer equipment and storage medium | |
JP6560486B2 (en) | Weekday / non-weekday estimation device and weekday / non-weekday estimation method | |
Ching et al. | A user-flocksourced bus experiment in Dhaka: New data collection technique with smartphones | |
JP6864982B2 (en) | Estimator | |
JP6443967B2 (en) | Area attribute estimation apparatus and area attribute estimation method | |
JP2020030531A (en) | Information processor, method for processing information, and information processing program | |
CN113132909A (en) | Missing person collaborative checking method and device based on network slice and edge data center | |
JP6262271B2 (en) | Information processing system, information processing method, and program | |
JP2019109921A (en) | Information setting apparatus and computer program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200311 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200324 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200403 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6688149 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |