JP2015125775A - システムでの需要の予測のためのマルチタスク学習システムおよび方法 - Google Patents
システムでの需要の予測のためのマルチタスク学習システムおよび方法 Download PDFInfo
- Publication number
- JP2015125775A JP2015125775A JP2014251562A JP2014251562A JP2015125775A JP 2015125775 A JP2015125775 A JP 2015125775A JP 2014251562 A JP2014251562 A JP 2014251562A JP 2014251562 A JP2014251562 A JP 2014251562A JP 2015125775 A JP2015125775 A JP 2015125775A
- Authority
- JP
- Japan
- Prior art keywords
- time series
- data
- network
- demand
- transportation network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000006870 function Effects 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 9
- 238000004891 communication Methods 0.000 description 16
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000012706 support-vector machine Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000013500 data storage Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 7
- 238000012937 correction Methods 0.000 description 6
- 238000013480 data collection Methods 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000003064 k means clustering Methods 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000036962 time dependent Effects 0.000 description 2
- 238000000714 time series forecasting Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009118 appropriate response Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005183 dynamical system Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Primary Health Care (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】輸送ネットワークにわたる移動需要を予測するための効率的なマルチタスクシステム及び方法を提供する。【解決手段】関連づけられた輸送ネットワークに対応する観測報告が収集され、移動需要に対応する時系列のセットが生成される。時系列のクラスタが続いて形成され、各々のクラスタについて、予測モデルを生成するためにマルチ学習が適用される。時系列のセットの少なくとも1つに対応する関連づけられた輸送ネットワークの選択されたセグメントでの移動需要が続いて、生成された予測モデルに応じて予測される。【選択図】なし
Description
本開示は、輸送技術、データ処理技術、データ分析技術、追跡技術、予測技術、等に関する。
インテリジェントな輸送システムは一般的に、多数のユーザによって利用される複数の車両、経路、およびサービスを含む。輸送ネットワークの効率的な計画および管理、特に、たとえば、変化する交通条件に対する適切な応答は、これらの時間依存エンティティの精確なモデル化およびリアルタイム予測を必要とする。車両位置、道路負荷、移動の時間および需要、交通密度、等といったさまざまな時間依存イベントを追跡し、分析する能力が、輸送の計画および管理中に考慮に入れられなくてはならないファクターのいくつかを表現する。したがって、輸送サービスの効率的な計画は、一般に公共輸送ネットワークでの移動需要として言及される、任意の時間期間にネットワークに入る移動者の数の精確な推定を必要とする。
現在、移動需要の予測は、輸送ネットワークのさまざまなセグメントに関する情報の収集を必要とし、各々のセグメントは、特定の経路、車両、停留所、一連の停留所、等のことを言う。各々がそのセグメントでの需要を正確に予測するために個々にモデル化されなければならず、集約がシステムでの全需要のために続いて実行される。すなわち、各々の個々のセグメントは、有効で効率的な管理のために膨大な計算および分析を必要とする。加えて、異なるセグメントのために利用可能なデータの量は異なり得る。
経時的に変化する任意のエンティティは、時系列として表現されることができ、輸送システムでの移動需要は、経時的に変動する。輸送ネットワークの計画および管理においてしばしば生じる1つの問題は、一連の時間的なイベントのモデル化および予測である。たとえば、特定の車両の乗客数は一日の経過にわたり変動し得、ネットワークの移動者数は一週間の経過にわたり変動し得、特定の停留所の移動者数は一時間の経過にわたり変動し得る、といった具合である。この問題は一般的に、不定量のデータがネットワークの異なる部分について受け取られる場合、すなわち、ある車両が別の車両よりも良好な記録センサまたはデバイスを有し得る場合、車両は記録デバイスを有し得ないが、停留所は有する場合、等に複雑になる。
現在の輸送ネットワークの計画および管理は、この一連の時間的なイベントに影響を及ぼすさまざまなファクターを説明することができない。たとえば、天候は、公共輸送システムのユーザ数に影響する。雨が降っている場合、車を有する者は雨の中の歩行または待機を回避するために彼ら個人の車両を選ぶであろうから、公共輸送システムでの移動者の数は減少し得る。同様に、一日のうちの時間または曜日もまた、輸送ネットワークのセグメントでの需要に影響し得る。たとえば、一日のうちの時間は、需要に影響し得(すなわち、ラッシュアワー)、曜日(すなわち、より少ない週末の移動)は、任意の予測またはモデル化に影響する。激しい自動車交通量は公共輸送ネットワークでの需要、工事、等を増加させ得るので、輸送ネットワーク上の交通量もまた、モデル化および予測におけるファクターであり得る。そのような一連の時間的なイベントは互いに関連し得るが、現在の方法は、需要をモデル化および予測する際にこれをファクターとしない。
たとえば、図1A〜図1Bは、特定の都市における異なる経路での乗客負荷を表現する3つの時系列を示す。各々の系列において、ある特定の時間期間中に公共車両に乗る乗客の数が、一日の経過にわたり、そして一週間の経過にわたり、示される。図1Aに示すように、各々の経路は、一日の経過にわたり変動し、図1Bに示すように、各々の経路は、一週間の経過にわたり変動する。従来の計画および管理では、これらのエンティティの各々が各様にモデル化され、すなわち、異なるタスクが実行されなくてはならない。
マルチタスク学習は、帰納転移の形態であり、1つの問題を解決する間に得られた知識を記憶し、それを、異なるが関連する問題に適用することにフォーカスした機械学習である。すなわち、マルチタスク学習は、複数の相互に関連する学習タスクの情報を活用して個々のタスクについてより精確な予測を行うことを目的とする。タスクに包含される関連する情報は、予測の品質を相互に向上させるために活かされ得る。たとえば、マルチタスク学習は、いくつかの異なるドメイン、たとえば、計算生物学、自然言語処理、コンピュータビジョン、等に適用されており、生物学、文字、および視覚の複数のオブジェクトクラスが、関連する特徴のいくつかを共有し得る。マルチタスク学習において、各々のタスクにおける予測精度は、他のタスクからのデータを使用すること、たとえば、正則化、相互化、等によって活用される。
かくして、マルチタスク学習を利用して輸送ネットワークにわたる移動需要を予測するための効率的なシステムおよび方法を提供することが好適であろう。
例示的な実施形態の一態様において、関連づけられた輸送ネットワークでの移動需要を予測するためのマルチタスク学習方法が提供される。この方法は、関連づけられた輸送ネットワークの複数の観測報告に対応する観測データを収集することと、関連づけられた輸送ネットワークのセグメントの輸送ネットワークデータに対応する時系列のセットを生成することとを含む。この方法はまた、時系列のセットにおける各々の時系列が1つのクラスタの中にある時系列の複数のクラスタを形成することと、各々のクラスタについて、予測モデルを生成するためにマルチタスク学習を適用することとを含む。方法はさらに、生成された予測モデルに応じて、時系列のセットの少なくとも1つに対応する関連づけられた輸送ネットワークの選択されたセグメントでの移動需要を予測することを含む。方法はまた、収集すること、生成すること、形成すること、および予測することの少なくとも1つがコンピュータのプロセッサによって実行されることを含む。
別の態様では、関連づけられた輸送ネットワークでの移動需要を予測するためのシステムが提供される。このシステムは、関連づけられた輸送ネットワークのセグメントに対応する時系列のセットを生成するように構成された時系列ジェネレータコンポーネントを含む。このシステムはまた、時系列の複数のクラスタの各々についての予測モデルを生成するように構成されたマルチタスク学習モジュールを含む。加えて、このシステムは、複数の収集コンポーネントから関連づけられた輸送ネットワークのセグメントに対応する輸送ネットワークデータを収集し、輸送ネットワークに関連づけられた複数の観測報告に対応する観測データを受け取るための命令を記憶したメモリを含む。このメモリはさらに、関連づけられた輸送ネットワークの選択されたセグメントでの移動需要を、受け取られた観測データと選択されたセグメントに対応する時系列が関連づけられたクラスタの予測モデルとに応じて予測するための命令を記憶する。システムはさらに、命令を実行する、メモリと通信するプロセッサを含む。
別の態様では、関連づけられた輸送ネットワークでの移動需要を予測するための、コンピュータで実現されるマルチタスク学習方法が提供される。この方法は、関連づけられた輸送ネットワークに対応するデータを収集することを含み、このデータは、観測データと輸送ネットワークデータとの少なくとも1つを含む。方法はまた、観測データまたは輸送ネットワークデータの少なくとも1つに応じて、関連づけられた輸送ネットワークのセグメントに対応する時系列のセットを生成することを含む。加えて、方法は、動的時間伸縮によって時系列のセットの各々のペア間の類似を測定することと、時系列の各々のペアの測定された類似に基づいて、時系列の複数のクラスタを形成することとを含む。方法はさらに、各々のクラスタについて、予測モデルを生成するためにマルチタスク学習サポートベクトル回帰を適用することを含む。方法はまた、生成された予測モデルに応じて、時系列のセットの少なくとも1つに対応する関連づけられた輸送ネットワークの選択されたセグメントでの移動需要を予測することを含む。
1つ以上の実施形態が、添付図面に関連してここで説明され、同一の参照番号は、全体を通して同一の要素を指すために使用される。関連するまたは関連しない時系列のマルチタスク学習のためのシステムおよび方法に関する例示的な実施形態の態様が、本明細書において説明される。加えて、例示的な実施形態は以下において輸送ネットワークでの移動需要予測に触れながら提示されるが、説明されるシステムおよび方法の応用は、他の分野の時系列分析および予測動作に対し行われ得る。
ここで図2A〜図2Bを参照すると、本開示の一態様に係る関連づけられた輸送システムでの移動需要を予測するためのマルチタスク学習システム100の機能ブロック図が示されている。図2A〜図2Bに示すさまざまなコンポーネントは、例示的な実施形態の態様を説明する目的のためのものであること、ハードウェア、ソフトウェア、またはその組み合わせによって実現される他の同様のコンポーネントが、その中で代用可能であることが理解されるだろう。
本明細書において使用される場合、輸送システムは、予め定義された経路のセットを含む輸送ネットワークを含む。経路の各々を、予め定義されたスケジュールに従って公共輸送車両のような輸送システムの1つ以上の輸送車両が移動する。輸送車両は、同一のタイプまたは異なるタイプのもの(バス、電車、路面電車、等)であることができる。一実施形態において、輸送車両は、バスまたは路面電車である。輸送ネットワークには、5個、10個、またはそれ以上の経路が存在し得る。各々の経路は、複数の予め定義された停留所を有し、複数の予め定義された停留所は、それらの場所に間隔をおいて配置され、ほとんどのまたはすべてのケースにおいて、経路は、少なくとも3つ、4つ、5つ、またはそれ以上の停留所を有する。移動者、すなわち乗客は、乗車するための経路上で利用可能な停留所のセットからの予め定義された経路の1つにおける第1の停留所と、降車するための経路沿いの第2の停留所とを選択し得る。
図2A〜図2Bに示すように、探索システム100は、以下に説明される例示的な方法を実現できる、一般的に102で表現されたコンピュータシステムを含む。コンピュータシステム102に関し示されているが、任意の適切なコンピューティングプラットフォームが本明細書において説明されるシステムおよび方法によって利用され得ることが理解されるだろう。例示的なコンピュータシステム102は、プロセッサ104に接続されたメモリ106に記憶された処理命令108の実行によって例示的な方法を実行するだけでなく、コンピュータシステム102の全動作を制御する、プロセッサ104を含む。
命令108は、輸送システム134に設けられたさまざまなデータ収集コンポーネント154によって収集された輸送ネットワークデータ156からS1,...,Smとして表された時系列160のセットを生成するように動作可能な時系列ジェネレータ110を含む。上述したように、時系列160は、たとえば、経路138、停留所142、車両144、等での移動需要といった、経時的に変化する何らかのエンティティを表現する。一実施形態によると、時系列160は、Si=(yi1,...,yin)として表現されることができ、時系列予測の目標は、時間i−1,i−2,...での過去の値に基づいて時間iでの値yを推定することである。一実施形態において、深度は、図3〜図4Bに関し以下においてより詳細に説明されるように、最後のk個の値に限定され、yi=f(yi−k,yi−k+1,...,yi−1),i=k,...,nであり、ここで、k≧1はモデル化の深度である。以下においては移動需要に関し議論される一方で、時系列ジェネレータ110は、他の予測需要に適合可能であり、移動需要は、本明細書において説明されるシステムおよび方法の例示的な応用例として本明細書において使用される、ということが理解される。
命令108はさらに、時系列160のセットのうちの時系列160のペアの各々の間の類似を決定するように構成された類似モジュール112を含む。一実施形態において、時系列160のセットは、輸送ネットワーク134(以下において議論される)から収集されたデータに応答して、時系列ジェネレータ110によって生成される。類似モジュール112は、時系列160のセットにおけるペア間の類似を計算するように構成される。類似モジュール112は、時系列160のペア間の類似値を決定するのに、動的時間伸縮(DTW)、すなわち、時間または速度が異なる2つの系列間の類似を測定するのに適したアルゴリズムを利用し得る。すなわち、類似モジュール112は、時系列160のペア(Si,Sj),1≦i<j≦kが関連するかどうか、すなわち、時系列160の選択されたペアが、類似して挙動し、同一の傾向を示すことによって、相互に関連するかどうかを決定する。DTWが、時間的および動的な態様を考慮し、2つの系列の標準的な要素面でのアラインメントよりもペア間の類似を良好に解釈することが理解されるだろう。たとえば、2つのバスの停留所は、バスが一方の停留所からもう一方の停留所へと進むのに要する時間に起因して、一方が時間的にシフトされている状態で、移動需要の同一の挙動を示し得る。したがって、DTWの包含は、時間シフトを考慮する。
図2A〜図2Bに示すように、命令108はさらに、k−平均法クラスタリングアルゴリズム162を使用して時系列160間のDTW距離Srtを有する時系列160のクラスタG1,G2,...,GL164を形成するために類似モジュール112の出力を利用するように構成されたクラスタリングモジュール114を含む。一実施形態において、各々の時系列160は、単一のクラスタ164に属する。別の実施形態によると、予め選択されたしきい値Th(図示せず)のクラスタリングが、クラスタG1,G2,...,GL164を形成するのに使用利用され得る。そのような実施形態において、適切なしきい値(Th)は、ドメインエキスパートによって定義されるか、または、一連の実験によって検出されるか、のいずれかであり得る。理解されるように、適切なk−平均法クラスタリングアルゴリズム162は、各々の系列が、最も近い平均値を有するクラスタに属する、k個のクラスタ(たとえば、クラスタG1,G2,...,GL164)に、時系列160のセットを分割することを目的とする、クラスタ分析の方法を表す。2つのクラスタ間の距離は、DTW値によって適切に定義される。
命令108はまた、1つ以上の予測モデル166を生み出すように時系列160の各々のクラスタ164にマルチタスク学習(以下においてより詳細に議論される)を実行するように構成されたマルチタスク学習モジュール116を含む。すなわち、マルチタスク学習モジュール116は、クラスタ164に1つ以上のマルチタスク学習方法を適用し、そのクラスタ164の移動需要予測に関連づけられた適切な共通モデル166を出力することができる。一実施形態において、マルチタスク学習モジュール116は、特定のクラスタ164において分析されている時系列160に関連づけられたさまざまな観測報告136を利用する。たとえば、タスクが、(各々の経路138のための対応する時系列160によって示されるように)いくつかの経路138での移動需要168を予測することに対応する場合、および、いくつかの経路138が、(クラスタリングモジュール114によって共にクラスタリングされるように類似モジュール112によるDTWによって)十分に類似している場合、マルチタスク学習モジュール116は、以下において議論されるように、クラスタ164におけるいくつかの時系列160に共通の予測モデル166を学習し得る。この予測モデル166は続いて、いくつかの経路138の各々に沿って移動需要168を予測するために需要予測モジュール118に通信され得る。
かくして、命令108はまた、マルチタスク学習モジュール116から1つ以上の予測モデル166を受け取るように構成された需要予測モジュール118を含む。需要予測モジュール118は続いて、予測モデル(単数または複数)166に関連づけられた時系列160に対応する輸送ネットワーク134のセグメント(経路138、停留所142、車両144、等)についての移動需要168を計算し得る。一実施形態において、需要予測モジュール118は、時系列160に関連づけられたさまざまな外部のファクター、すなわち、観測報告136(履歴データ146、交通データ148、天候150、カレンダーデータ152、等)を、それらに対応する移動需要168を予測する際に組み込む。
コンピュータシステム102は、外部デバイスと通信するための1つ以上の入力/出力(I/O)インターフェースデバイス119および120を含み得る。I/Oインターフェース119は、戻された画像、探索結果、クエリ、等といった情報を表示するための表示デバイス124、テキストを入力するためのキーボード、またはタッチスクリーンまたは書き込み可能なスクリーン、といったユーザ入力デバイス126、および/または、プロセッサ104にユーザ入力情報およびコマンド選択を通信するためのマウス、トラックボール、等といったカーソル制御デバイス、のうちの1つ以上と、通信リンク132を介して通信し得る。
システム100に関連づけられたコンピュータシステム102のさまざまなコンポーネントはすべて、データ/制御バス122によって接続され得る。コンピュータシステム102のプロセッサ104は、I/Oインターフェース119に結合された通信リンク130を介して、関連づけられたデータストレージデバイス128と通信する。適切な通信リンク130は、たとえば、公衆交換電話網、専用通信ネットワーク、赤外線、光、または他の適切な有線または無線データ通信チャネルを含み得る。データストレージデバイス128は、たとえばローカルメモリ106に記憶されたコンピュータシステム102のコンポーネントに、すなわち、ハードドライブ、仮想ドライブ、等に、または、コンピュータシステム102にアクセス可能なリモートメモリに、実装可能である。
関連づけられたデータストレージデバイス128は、1つ以上の目的のために使用されるデータ(たとえば、検証情報、車両、輸送システムセグメント、輸送システムゾーン、経路、スケジュール、場所、使用情報、移動需要)の任意の編成されたコレクションに対応する。関連づけられたデータストレージデバイス128の実装は、任意の大容量ストレージデバイス(単数または複数)、たとえば、磁気ストレージドライブ、ハードディスクドライブ、光学ストレージデバイス、フラッシュメモリデバイス、またはそれらの適切な組み合わせで行われることができる。関連づけられたデータストレージ128は、コンピュータシステム102のコンポーネントとして実装され得、たとえば、メモリ106に存在し得る、といった具合である。
一実施形態において、関連づけられたデータストレージデバイス128は、輸送システム134と、経路138のコレクション(輸送システム134上で利用可能な移動のコース沿いの個々の車両144による停留所142のシーケンス)と、輸送システム134のバス、路面電車、地下鉄、または他の車両144、等の到着/出発時間に関するスケジュール140と、乗客が乗車または降車し得る経路138沿いの停留所142とに対応する情報、輸送システム134を移動するさまざまな車両144に関連する情報、等を含み得る。
データストレージデバイス128はさらに、履歴データ146、交通データ148、天候データ150、カレンダーデータ152、等といった輸送システム134に関連づけられた観測報告136を記憶し得る。履歴データ146は一般的に、選択された時間期間をカバーし、輸送システム134上のすべての停留所および経路で乗車する全乗客を説明する、輸送システム134での移動需要168に関連する情報を含む。交通データ148は、任意の所与のタスク、たとえば、セグメントでの時系列、等に関連するネットワークセグメントでの交通状態を説明し得る。交通データ148は、工事迂回路、経路変更、事故の情報、等を含み得る。天候データ150は、サードパーティソース(気象サービス)から、または、経路138沿いの、停留所142での、車両144上の、等のセンサ(図示せず)から直接、収集され得る。そのような天候データ150は、最低および最高空気温度、空気湿度、降雨量、風速、風向、等を含み得る。そのような天候データ150は、たとえば、15分毎、1時間毎、数時間毎、等の定期的な報告間隔で、コンピュータシステム102上で記録され、データストレージ128に記憶され得る。いくつかの実施形態では、予想された天候パターンが、記憶された天候データ150に含まれ得る。カレンダーデータ152は、登校日、学校休暇、スポーツイベント、祝祭日、スケジューリングされた閉鎖に関連する情報、工事情報、等を含み得る。
図2A〜図2Bに示す移動需要を予測するためのマルチタスク学習システム100は、2つ以上の電子デバイス間でのデータの交換を可能にすることができる任意の分散通信システムを表すコンピュータネットワークのような分散コンピューティング環境を使用した実現が可能である、ということが理解されるだろう。そのようなコンピュータネットワークが、限定ではなく例として、仮想ローカルエリアネットワーク、広域ネットワーク、パーソナルエリアネットワーク、ローカルエリアネットワーク、インターネット、イントラネット、またはそれらの任意の適切な組み合わせを含むことが、さらに理解されるだろう。したがって、そのようなコンピュータネットワークは、物理レイヤと、たとえば、トークン−リング、イーサネット(登録商標)、または他の無線または有線ベースのデータ通信メカニズムのような、さまざまな従来のデータトランスポートメカニズムによって例示されるトランスポートレイヤとを備える。さらに、図2A〜図2Bではネットワーク化されたコンポーネントのセットとして示されているが、本明細書において議論されるシステムおよび方法は、本明細書に説明される方法を実行するように適合したスタンドアロンデバイスでの実現が可能である。
コンピュータシステム102はさらに、I/Oインターフェース120によって通信リンク158を介して、停留所142、車両144、駅または発券機、等に分散した1つ以上のデータ収集コンポーネント154と通信し得る。いくつかの実施形態において、データ収集コンポーネント154は、スマートカードリーダ、磁気カードリーダ、入力端末、券売機、チケットリーダ、等といった自動発券デバイスに対応することができ、乗車、降車、目的地、出発地、日付/時間、値段、等に関連する移動者についての情報を収集し得る。一実施形態において、コンピュータシステム102は、適切な通信リンク158を介してそのようなデータ収集コンポーネント154とデータ通信する。そのような通信リンク158は、直接的な有線または無線接続、ネットワーク化された(すなわち、インターネット、イントラネット、等を介した)接続を含み得、公衆交換電話網、専用通信ネットワーク、赤外線、光、または任意の他の適切な有線または無線データ伝送通信媒体といった、さまざまな接続媒体を利用し得る。
一実施形態において、輸送ネットワークデータ156は、輸送システム134上の移動者に対応するデータ収集デバイス154によって収集される。そのような情報は、移動者数についての現在の使用情報、時間/日付情報、検証情報(販売された切符、回収された切符、駅で降りた乗客、駅で乗った乗客、車両144に乗っている乗客、等)といった観測報告136を含み得る。さまざまな他の情報もまた、データ収集デバイス154から通信リンク158を介してコンピュータシステム102に通信され得る。たとえば、情報は、位置(たとえば、GPS、方向、車道の場所、停留所の場所、等)、速度、加速度、車両のメンテナンス情報、温度、時間/日付、等といった、収集デバイス154が搭載された車両144の状態および環境に関連する。情報の別のソースは、道路条件および交通条件を測定する道路際のセンサ、モバイルフォンセンサである。
コンピュータシステム102は、コンピュータサーバ、ワークステーション、パーソナルコンピュータ、携帯電話、タブレットコンピュータ、携帯無線呼出し器、それらの組み合わせ、または、例示的な方法を実行するための命令を実行することができる他のコンピューティングデバイスを含み得る。
1つの例示的な実施形態によると、コンピュータシステム102は、関連づけられたユーザ、ネットワーク化されたデバイス、ネットワーク化されたストレージ、リモートデバイス、等と対話するように構成されたハードウェア、ソフトウェア、および/またはそれらの任意の適切な組み合わせを含む。
メモリ106は、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、磁気ディスクまたはテープ、光学ディスク、フラッシュメモリ、またはホログラフィックメモリといった任意のタイプの非一時的なコンピュータ可読媒体を表現し得る。一実施形態において、メモリ106は、ランダムアクセスメモリと読み取り専用メモリとの組み合わせを備える。いくつかの実施形態において、プロセッサ104およびメモリ106は、単一チップにおいて組み合わされ得る。ネットワークインターフェース119および/または120は、コンピュータシステム102にコンピュータネットワークを介して他のデバイスと通信することを可能にさせることができ、変調器/復調器(MODEM)を備え得る。メモリ106は、方法において処理されるデータ、ならびに例示的な方法を実行するための命令を記憶し得る。
デジタルプロセッサ104は、シングルコアプロセッサ、デュアルコアプロセッサ(またはより一般的にはマルチコアプロセッサ)、デジタルプロセッサ、および協働する数値演算および/またはグラフィックスコプロセッサ、デジタルコントローラ、等によってさまざまに具体化され得る。デジタルプロセッサ104は、コンピュータシステム102の動作を制御することに加えて、図3〜図4Bにおいて概説される方法を実行するためにメモリ106に記憶された命令108を実行する。
「ソフトウェア」という用語は、本明細書において使用される場合、ソフトウェアの意思であるタスクを実行するようにコンピュータまたは他のデジタルシステムを構成するようにコンピュータまたは他のデジタルシステムによって実行可能な命令の任意のコレクションまたはセットを含むように意図される。「ソフトウェア」という用語はさらに、本明細書において使用される場合、RAM、ハードディスク、光学ディスク、等といった記憶媒体に記憶された命令を含むようにも意図され、ROM、等に記憶されたソフトウェアであるいわゆる「ファームウェア」を含むように意図される。そのようなソフトウェアは、さまざまな手法で編成されることができ、ライブラリ、リモートサーバ等に記憶されたインターネットベースのプログラム、ソースコード、解釈実行コード、オブジェクトコード、直接的に実行可能なコード、等として編成されたソフトウェアコンポーネントを含み得る。ソフトウェアが、ある特定の機能を実行するためにサーバまたは他の場所に存在する他のソフトウェアへのシステムレベルコードまたはコールを呼び出し得ることが意図される。
ここで図3を参照すると、関連づけられた輸送ネットワークでの移動需要を予測するための例示的なマルチタスク学習方法の概要が提供される。方法300が302で始まると、コンピュータシステム102が、関連づけられた輸送ネットワーク134から観測報告136を収集する。いくつかの実施形態において、観測報告136は、輸送ネットワーク134に関連づけられた停留所142、車両144、駅、等に配置されたさまざまな収集デバイス154によって収集され得る。たとえば、自動発券デバイスが、輸送システム134に関連づけられた観測報告136を収集するために使用され得る。観測報告136は、限定ではなく例として、特定の経路138、車両144、停留所142、等の履歴的な移動者の使用に対応する履歴データ146、サードパーティソースからのまたはさまざまな時間/日付について観測された天候データ150、観測報告、センサ、サードパーティの報告、等によって収集された交通データ148、休日、休暇、曜日、スポーツまたは市民イベント、等といったカレンダーデータ152、または輸送ネットワーク134の機能に影響し得るまたは輸送ネットワーク134での移動需要168に関連し得る他の観測報告136を含み得る。
304で、時系列(S1,...,Sm)160のセットが続いて、輸送ネットワーク134から収集されたデータに応じて生成される。たとえば、時系列160は、経路138上の停留所142で乗車または降車する乗客の数、異なる時点での経路138上の移動者数、等を表現し得る。一実施形態において、時系列160は、Si=(yi1,...,yin)として表現されることができ、時系列予測の目標は、時間i−1,i−2,...での過去の値に基づいて時間iでの値yを推定することである。一実施形態において、深度は、最後のk個の値に限定され、yi=f(yi−k,yi−k+1,...,yi−1),i=k,...,nであり、ここで、k≧1はモデル化の深度である。さらに、それはまた、系列の値に影響を有し得る時間iでの多数の外部の特性viを考慮し得、
yi=f(vi,yi−k,yi−k+1,...,yi−1),i=k,...,n (1)
である。
yi=f(vi,yi−k,yi−k+1,...,yi−1),i=k,...,n (1)
である。
したがって、時系列予測の目的は、未来の時点での時系列の予測値、
306で、類似するタスクまたは系列160が、システム102のクラスタリングモジュール114の動作によって共にグループ化またはクラスタリングされる。理解されるように、時系列160の関連しないセットへのマルチタスク学習の適用は、予測品質に悪影響を有し得る。したがって、類似モジュール112が、時系列160のペア(Si,Sj),1≦i<j≦kが関連するかどうかを決定する。すなわち、本明細書において説明されるシステムおよび方法は、時系列160のペアが相互に関連するかどうか、それらが類似して挙動し、同一の傾向を示すかどうか、を決定する。2つの系列160間の類似は、DTW、または、時間または速度が異なる2つの系列160間の類似を測定するための他の適切なアルゴリズムによって決定され得る。
上述したように、DTWは、時間的および動的な態様を考慮し、2つの系列160の標準的な要素面でのアラインメントよりも時系列160のペア間の類似をより良好に解釈する。たとえば、2つのバスの停留所142は、バスが一方の停留所142からもう一方の停留所142へと進むのに要する時間に起因して、一方が時間的にシフトされている状態で、移動需要168の同一の挙動を示し得る。したがって、DTWの包含は、時間シフトを考慮する。したがって、クラスタリングモジュール114は、時系列160間のDTW距離の類似(Srt)を使用して時系列160のL個のクラスタG1,G2,...,GL164を形成するためにk−平均法クラスタリングアルゴリズム162を適用し、Srtは、以下においてアルゴリズム1で説明されるように、動的時間伸縮距離による系列160(たとえば、yr,yt)間の類似である。あるいは、クラスタリングモジュール114は、予め選択されたしきい値Th未満のDTW値を有する時系列160のクラスタG1,G2,...,GL164を形成し得、各々の時系列160は、単一のクラスタ164に属する。たとえば、図1A〜図1Bに示すように、時系列1および3と時系列2とは、明らかに異なって見えるので、異なるクラスタ164に属するべきである。
308で、関連するタスクまたは系列160の各々のクラスタGL164について、時系列160の対応するクラスタ164に関連づけられた予測モデル166を生成するために、マルチタスク学習動作がマルチタスクモジュール116によって、関連するタスクまたは系列160の各々のクラスタGL164に対し実行される。一実施形態において、システム100は、所与のクラスタ164における各々のタスクまたは系列160に共通のモデル166を突きとめるためにマルチタスクサポートベクトル回帰を用いる。(類似モジュール112によって実行されたDTWに基づいて)時系列160またはタスクが任意の他の系列160と類似しない場合、その特定の系列160に対応する予測モデル166を生成するために、サポートベクトル回帰(SVR)が時系列160に対し使用され得ることが理解されるだろう。一般的に、サポートベクトルマシン(SVM)が、パターン認識、オブジェクト分類、および、時系列のケースでは予測回帰分析、といった異なるタスクのために使用される。すなわち、サポートベクトル回帰(SVR)が使用され得、それは、観測されたデータを使用して推定される時系列についての関数である。データ駆動型の方法であるので、SVMは、ARIMAまたはカルマンフィルタのようなより伝統的な時系列予測方法とは異なる。時系列データのセット(xi,yi),i=1,...,nを考慮すると、時系列予測アルゴリズムは、ある予測ホライズンのための予測値と等しい出力を有するであろう関数f(x)を定義する。回帰分析を使用することにより、線形回帰のための予測関数は、f(x)=wTx+bとして定義される。データがその入力空間において線形でない場合、データxは、より高次元の未来の空間における線形回帰の実行を可能にするために、核関数φ(x)によって、より高次元の空間にマッピングされ、
f(x)=wTφ(x)+b
である。
f(x)=wTφ(x)+b
である。
したがって、目的は、最適な重みwおよびしきい値bを見つけること、ならびに、重みの最適なセットを見つけるための基準を定義することである。
トレーニングデータ(xi,yi),i=1,...,n,xi∈Rd,yi∈Rを考慮すると、SVMはまず、入力ベクトルxを未来の空間Φ,φ(x)∈Φにマッピングし、続いて回帰を線形関数f(x)=wTφ(x)+bで近似する。これは、ε−非感受性チューブにおける以下の最適化問題を解決することによって得られる。
一実施形態によると、マルチタスク学習モジュール116によって用いられる308でのマルチタスク学習は、以下のマルチタスクSVM回帰を利用し得る。各々のクラスタGL164、すなわち、関連する時系列160のセットは、m>1であるm個の関連する時系列のセットとして表され得る。トレーニングサンプルは、{(xri,yri),r=1,...,m,i=1,...,n}のセットとして表現され、添え字は、Tr={ir1,...,irn},r=1,...,mによる系列rからである。そのような実現において、セットにおける各々の系列は同一の長さnを有するものと想定され得る。
m個の系列のセットにおける各々の系列が類似することが(すなわち、類似モジュール112およびクラスタリングモジュール114の出力に基づいて)決定されると、タスク、たとえば時系列160、が関連するものと想定され得るので、真のモデル166のすべてがある共通のモデルwに近接し、あらゆるタスクモデルwrがw+wr,r=1,...,mとして書かれることができ、タスクが互いに類似する場合、個々のベクトルwrは小さい。
規則化アプローチが続いて適合させられることができ、それに応じて、各々のタスクのベクトルxi,i∈Trが、2つの異なる空間にマッピングされる。1つは、すべてのタスクに共通の空間Φであり、φ(xi)∈Φであり、もう1つは、あらゆるタスクrに固有の補正空間Φrであり、φr(xi)∈Φrである。
個々のタスク情報は、以下のように定義されるスラック変数において説明される。
一実施形態によると、すべてのスラック変数は、非負であり、ξr(xi),ξ* r(xi)≧0,r=1,...,mである。かくして、補正空間にマッピングされたサンプルは、対応する補正関数の片側になければならない。補正関数はまた、スラック変数がゼロであるいくつかの点を通過しなければならない。
SVRのMTLバージョンの目的は、タスクあたり、たとえば、系列160、クラスタ164、等あたり1モデルの、m個の回帰モデル166を推定することである。MTL SVRは、個々のタスク情報をスラック変数によって、推定された回帰関数に組み込む。m個の回帰モデル166のための以下のパラメータ化された関数が指定され得る。
ここで、μは、個々の補正関数のための規則化パラメータである。(以下において議論される標準SVMに類似する)双対最適化技法を使用すると、上記最適化問題の双対形式は以下のとおりである。
続いて、ベクトルw,wrが、トレーニングサンプルの観点で表され得る。
個々のSVRのいつものパラメータCおよびεに加えて、マルチタスク学習を拡張させたものは、パラメータμの調整をも必要とする、ということに注意すべきである。
その後、310で、需要予測モジュール118が、マルチタスク学習モジュール116によって生成された予測モデル(単数または複数)166に応じて、入力時系列160に関連づけられた輸送ネットワーク134の車両144、停留所142、および/または経路138に対応する予測された移動需要168を出力する。すなわち、需要予測モジュール118は、上述した予測モデル166を利用して輸送ネットワーク134の選択されたセグメントでの移動需要168を予測し得る。
ここで図4A〜図4Bを参照すると、関連づけられた輸送システムでの移動需要を予測するためのマルチタスク学習方法400を詳説した図が示されている。方法400が402で始まると、データ156が、コンピュータシステム102によって輸送システム134上の収集コンポーネント154から受け取られる。観測報告136、たとえば、履歴データ146、交通データ148、天候データ150、カレンダーデータ152、等が、404でコンピュータシステム102により収集される。そのような観測報告は、理解されるように、輸送に対する需要に影響する無数の異なるファクターまたは要素のいずれかに対応し得る。たとえば、天候データ150が、雨が降っていることまたは雨が予想されることを示し得る。雨が降っている場合、雨の中で待機すること、停留所まで歩くこと、等を回避するために移動者個人の乗り物を使用する代わりに公共輸送を利用する移動者はより少ないことが一般的に理解される。
406で、時系列160のセットが、時系列ジェネレータ110、またはシステム100に関連づけられた他の適切なコンポーネントによって、輸送ネットワークデータ156から生成される。時系列160はさらに、輸送システム134、たとえば、経路138、スケジュール140、停留所142、車両144、等の記憶された情報に応じて生成され得るので、特定の時系列160は、上述したように、経路138、停留所142、または車両144に対応し得る。いくつかの実施形態において、観測報告136が、時系列160の分析に組み込まれ得る。すなわち、経時的に変化し、「時系列」、すなわち、(上では時系列として明示的に言及された)yiで表された、予測するためのファクター(=移動需要)の形成に利用され得る、2つのタイプのエンティティが区別され得る。加えて、別のタイプのエンティティは、観測報告(viで表され、天候、等を含む)であり、後者は、それら自身ではなく前者を予測するために使用され得る。408で、収集された観測報告136、たとえば、時系列160に関連づけられた特定の経路138、停留所142、または車両144での移動需要168に対応する履歴データ146を使用して、セットにおける各々の系列160のためのトレーニングデータが選択される。
各々の時系列160に固有の予測モデル166が続いて、サポートベクトルマシンに関し上で詳細に議論したように、410で、収集された観測報告136およびトレーニングデータを使用して生成される。時系列のペアが、412で選択され、414で分析されて、時系列160が過剰な数の要素、すなわち、長すぎる(10,000個よりも多い要素)を包含するかどうかが決定される。414での肯定的な決定により、動作が416に進むと、時系列160が一様にサンプリングされる。416で時系列160のペアを一様にサンプリングした後、または、時系列160のペアが長すぎないことが決定されると、動作は418に進む。
418で、時系列160のペア間の類似値が、類似モジュール112によって測定される。420で、時系列160の生成されたセットにおける時系列160の別のペアが分析のために残っているかどうかの決定が行われる。すなわち、セットからの少なくとも2つの時系列160が、処理されるために残っているかどうか、および、それらの間の類似を決定するために比較されていないかどうか、である。420での肯定的な決定により、動作が414に戻ると、時系列160のそのようなペアが416でのサンプリングを命ずる長さを超えるかどうかの決定が行われる。動作は、上述したように416〜418を経て進む。420で時系列160の追加のペアが分析されるために残っていないことが決定されると、動作は422に進む。
422で、k−平均法クラスタリングアルゴリズム162が、各々のペア間のDTW距離Srtを使用して時系列160のL個のクラスタG1,...,GLを形成するために適用される。一実施形態において、各々の時系列160は、1つのクラスタ164の中にしか存在することができず、すなわち、時系列160は、異なるクラスタ164に追加されることができない。424で、マルチタスク学習SVMが、308で上述したごとくクラスタ164における各々の系列160に共通の予測モデル166を決定するように、各々のクラスタ164に適用される。一実施形態によると、424で実行されるマルチタスク学習動作は、特定のクラスタ164における系列160のための共通の予測モデルおよび固有の予測モデルに関連づけられた重みの学習を可能にする。すなわち、クラスタ164に適用されるマルチタスク学習SVMは、SVMが適用されるクラスタ164における各々の時系列160のための予測モデル166に適用されるさまざまな重みの学習を可能にする。308で詳細に上述したように、クラスタ164におけるあらゆる時系列160(すなわち、タスク)について、移動需要168が共通のモデル166と固有のモデル166との和として予測され得るという結果となる。
426で、マルチタスク予測モデル166が、424のマルチタスク学習動作に応じて、各々のクラスタ164およびタスク、すなわち、系列160のために出力される。ペアでないタスク、すなわち、任意の他の時系列160と類似しない時系列160が、適切な予測モデル166を生成するために個々に処理され得ること(上記SVRを参照)が理解されるだろう。428で、ユーザが移動需要の予測を所望するセグメントの選択(輸送ネットワーク134の1つの部分または複数の部分、たとえば、経路138、停留所142、車両144、都市ゾーン、一連の経路、車両のセット、および停留所のシーケンス、等)が受け取られる。428で示されているが、選択されたセグメント(単数または複数)に関するタスク(すなわち、時系列160)のみが生成されるように、輸送システム134の所望のセグメントの選択は、モデル166の生成前に行われ得る、ということが理解されるだろう。選択されたセグメント(単数または複数)に対応する適切な予測モデル166が続いて、需要予測モジュールまたはシステム100に関連づけられた他の適切なコンポーネントによって430で識別される。収集された観測報告136およびネットワークデータ156が続いて、432で、識別された予測モデル166に入力され得る。その後、需要予測モジュール118が434で、関連づけられた輸送ネットワーク134の選択されたセグメント(単数または複数)について予測された移動需要168を出力する。
図4A〜図4Bに示した方法400は、以下のアルゴリズムの表現によって実現され得る。
アルゴリズム1
関連するおよび関連しない時系列のためのアルゴリズム1のマルチタスク学習:
入力:m個の時系列のセットy1;...;ym,yr=(yr1;:::;yrn),r=1,...,m
入力:クラスタの数L
入力:あらゆる系列yrのための、天候、カレンダー、および交通データを含む観測報告(vr...,vrn)
出力:
1:forあらゆるペア(yr;yt);1<=_r<t<=m do
2:動的時間伸縮(DTW)距離Srt=DTW(yr,yt)による時系列yrとytとの間の類似Sを測定
3:If系列yrおよびytが長すぎる(10,000個を超える要素である)、DTWアルゴリズムを適用する前に系列を一様にサンプリングする
4:end for
5:時系列間のDTW距離Srtを使用して時系列のL個のクラスタG1,...,GLを形成するためにk−平均法クラスタリングアルゴリズムを適用する
6:for関連するタスクyi1,...,yim(i),i=1,...,LのクラスタGi do
7:時系列yi1,...,yim(i)および関連する観測報告vi1,...,vim(i)のためにマルチタスク学習を適用する
8:end for
9:return関連するタスクのL個のクラスタのためのマルチタスクモデル
アルゴリズム1
関連するおよび関連しない時系列のためのアルゴリズム1のマルチタスク学習:
入力:m個の時系列のセットy1;...;ym,yr=(yr1;:::;yrn),r=1,...,m
入力:クラスタの数L
入力:あらゆる系列yrのための、天候、カレンダー、および交通データを含む観測報告(vr...,vrn)
出力:
1:forあらゆるペア(yr;yt);1<=_r<t<=m do
2:動的時間伸縮(DTW)距離Srt=DTW(yr,yt)による時系列yrとytとの間の類似Sを測定
3:If系列yrおよびytが長すぎる(10,000個を超える要素である)、DTWアルゴリズムを適用する前に系列を一様にサンプリングする
4:end for
5:時系列間のDTW距離Srtを使用して時系列のL個のクラスタG1,...,GLを形成するためにk−平均法クラスタリングアルゴリズムを適用する
6:for関連するタスクyi1,...,yim(i),i=1,...,LのクラスタGi do
7:時系列yi1,...,yim(i)および関連する観測報告vi1,...,vim(i)のためにマルチタスク学習を適用する
8:end for
9:return関連するタスクのL個のクラスタのためのマルチタスクモデル
以下の例は、フランスのナンシーの輸送ネットワークにおける移動需要168を予測するのにアルゴリズム1を利用する。2つの二者択一の学習アプローチが複数の時系列160でのモデル166をトレーニングするためにテストされ、すなわち、1つ目は、別個のSVM回帰モデル166が各々のタスクのために独立して推定される個々のタスクのSVRであり、2つ目は、マルチタスク学習を使用して、関連する回帰モデル166を共同で推定するマルチタスク学習SVRであった。
例示的な実現では、移動需要168のための予測モデル166をトレーニングするために、以下のコンポーネント(すなわち、観測報告136)が共同または個々のいずれでも処理された。1)ナンシーのネットワークにおけるすべての停留所142および経路138で乗車した全乗客を説明する移動需要168の履歴データ146であって、13回の週末と、2週間の学校休暇と、3日間の祝祭日と、を含む90日の期間をカバーしたデータである。加えて、k=16個の上位要素を抽出するために、位相空間だけでなくフーリエ変換が、各々の時系列160に適用された。2)1時間毎に記録された空気温度(最低および最高)、空気湿度、降雨量、風速、等を含む気象データ(すなわち、天候データ150)。3)上述した学校休暇、祝祭日、および週末を含むカレンダーデータ152。4)所与のタスクに関連するネットワークセグメント(すなわち、需要が所望される特定の時系列160に関連づけられた経路138、停留所142、車両144、等)での交通情報148。タイムスタンプi−1とi3との間で蓄積されたバスに関係する平均遅延が使用された。図5は、テストセットとして使用されたデータの最後の20%による需要予測を示し、予測値は、緑500と赤502であり、真の値は、青504である。
すべての系列160は、同一の手法でトレーニングセットとテストセットとに分けられた。トレーニングセットは、最初のp%の項目であり、テストセットは、残りの100−p%(図5を参照)であり、pは、40%〜90%で変動する。
テストされた方法のパフォーマンスを測定するために、二乗絶対誤差(MAE)が使用された。2つの実験が、輸送ネットワーク134の異なるレベルでの移動需要168の予測を扱い、1つは、経路138のためのものであり、もう1つは、個々の停留所142のためのものである。ナンシーにおける36個のバスの経路の中から、4つの関連するタスクのグループが(たとえば、上述したDTW分析によって)識別された。停留所の実験のために、(停留所142に対応する)2つおよび3つの関連する系列160の2つのクラスタが、同都市における2つの主要な経路138沿いに識別された。
実験のこの予備的なセットでは、線形核関数φ(x)=xのみが使用される。過去の値のための深度k=2が、クロスバリデーションによって決定された。パラメータCおよびεは、標準SVM回帰の場合、自動で調整され、パラメータμの最適な値は、リサンプリング方法によって決定された。図6〜図7におけるウィスカプロットは、停留所および経路の実験についての平均、分散、アウトライアーを示す。図6において、プロット600は、選択された経路138のための個々の学習のための需要予測を示し、プロット602は、選択された経路138のためのマルチタスク学習のための需要予測を示す。プロット604は、選択された停留所142のための個々の学習のための需要予測を示し、プロット606は、選択された停留所142のためのマルチタスク学習のための需要予測を示す。すべての系列160および観測報告136において、1つの基本のイベントは、1時間の値/カウントについて言及する。
加えて、予測シナリオは、遅延を伴ってテストされ、最新の値、yi−1は、利用不可能であり、yiの予測は、yi―2,yi―3,...の値のみを使用する。図7は、経路のケースのための個々の学習700およびマルチタスク学習702の結果を示す。
図3〜図4Bに示した方法は、コンピュータで実行され得るコンピュータプログラム製品において実現され得る。コンピュータプログラム製品は、ディスク、ハードドライブ、等といった、制御プログラムが記録(記憶)される非一時的なコンピュータ可読記録媒体を備え得る。一般的な形態の非一時的なコンピュータ可読媒体は、たとえば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、または任意の他の磁気記憶媒体、CD−ROM、DVD、または任意の他の光学媒体、RAM、PROM、EPROM、FLASH−EPROM、または他のメモリチップまたはカートリッジ、またはコンピュータが読み取り、使用することができる任意の他の有形媒体を含む。
あるいは、方法は、制御プログラムが、電波および赤外線によるデータ通信中などに生成されるデータ信号のような、音波または光波といった伝送媒体を使用するデータ信号として組み込まれる、伝送可能な搬送波のような一時的な媒体において実現され得る。
例示的な方法は、1つ以上の汎用コンピュータ、専用コンピュータ(単数または複数)、プログラムされたマイクロプロセッサまたはマイクロコントローラおよび周辺用集積回路素子、ASICまたは他の集積回路、デジタルシグナルプロセッサ、離散素子回路のような配線電子回路または配線論理回路、PLD、PLA、FPGA、グラフィカルカードCPU(GPU)、またはPAL、等といったプログラマブル論理デバイス上で実現され得る。一般的に、図3〜図4Bに示すフローチャートをその下で実現できる有限ステートマシンを実現できる任意のデバイスが、輸送システムのユーザの出発地および目的地を推定する方法を実現するために使用され得る。
Claims (6)
- 関連づけられた輸送ネットワークでの移動需要を予測するためのマルチタスク学習システムであって、
前記関連づけられた輸送ネットワークのセグメントに対応する時系列のセットを生成するように構成された時系列ジェネレータコンポーネントと、
時系列の複数のクラスタの各々についての予測モデルを生成するように構成されたマルチタスク学習モジュールと、
メモリであって、
複数の収集コンポーネントから、前記関連づけられた輸送ネットワークの前記セグメントに対応する輸送ネットワークデータを収集し、
前記輸送ネットワークに関連づけられた複数の観測報告に対応する観測データを受け取り、
前記関連づけられた輸送ネットワークの選択されたセグメントでの移動需要を、前記受け取られた観測データと前記選択されたセグメントに対応する前記時系列が関連づけられた前記クラスタの前記予測モデルとに応じて予測する
ための命令を記憶したメモリと、
前記命令を実行する、前記メモリと通信するプロセッサと
を備えるシステム。 - 前記関連づけられたネットワークの前記セグメントは、経路、停留所、または車両の少なくとも1つに対応する、請求項1に記載のシステム。
- 動的時間伸縮によって時系列のペアの各々の間の類似度を測定するように構成された類似モジュールをさらに備える、請求項2に記載のシステム。
- 前記観測データは、履歴データ、交通データ、天候データ、またはカレンダーデータの少なくとも1つを備える、請求項1に記載のシステム。
- 前記予測モデルは、マルチタスク学習サポートベクトル回帰によって生成される、請求項4に記載のシステム。
- 関連づけられた輸送ネットワークでの移動需要を予測するための、コンピュータで実現されるマルチタスク学習方法であって、
前記関連づけられた輸送ネットワークに対応するデータを収集することであって、前記データは観測データと輸送ネットワークデータとの少なくとも1つを含む、収集することと、
前記観測データまたは前記輸送ネットワークデータの少なくとも1つに応じて、前記関連づけられた輸送ネットワークのセグメントに対応する時系列のセットを生成することと、
動的時間伸縮によって前記時系列のセットの各々のペア間の類似を測定することと、
時系列の各々のペアの前記測定された類似に基づいて、時系列の複数のクラスタを形成することと、
各々のクラスタについて、予測モデルを生成するためにマルチタスク学習サポートベクトル回帰を適用することと、
前記生成された予測モデルに応じて、前記時系列のセットの少なくとも1つに対応する前記関連づけられた輸送ネットワークの選択されたセグメントでの移動需要を予測することと
を備える方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/140,640 | 2013-12-26 | ||
US14/140,640 US9349150B2 (en) | 2013-12-26 | 2013-12-26 | System and method for multi-task learning for prediction of demand on a system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015125775A true JP2015125775A (ja) | 2015-07-06 |
Family
ID=53482186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014251562A Pending JP2015125775A (ja) | 2013-12-26 | 2014-12-12 | システムでの需要の予測のためのマルチタスク学習システムおよび方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9349150B2 (ja) |
JP (1) | JP2015125775A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2020049737A1 (ja) * | 2018-09-07 | 2020-09-10 | 株式会社オファサポート | 運転技能評価システム、方法及びプログラム |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9519912B2 (en) * | 2013-09-20 | 2016-12-13 | Xerox Corporation | Hybrid system for demand prediction |
EP3272068B1 (en) * | 2015-03-20 | 2021-11-10 | Nokia Solutions and Networks Oy | Building and applying operational experiences for cm operations |
DE112015006398B4 (de) * | 2015-03-31 | 2023-07-20 | Nec Corporation | Verfahren und System zur Beobachtung eines vorgegebenen Überwachungsbereichs |
US10296846B2 (en) * | 2015-11-24 | 2019-05-21 | Xerox Corporation | Adapted domain specific class means classifier |
US10671931B2 (en) * | 2016-01-29 | 2020-06-02 | Microsoft Technology Licensing, Llc | Predictive modeling across multiple horizons combining time series and external data |
US11537847B2 (en) * | 2016-06-17 | 2022-12-27 | International Business Machines Corporation | Time series forecasting to determine relative causal impact |
US10789546B2 (en) | 2016-06-23 | 2020-09-29 | International Business Machines Corporation | Cognitive machine learning classifier generation |
US10789538B2 (en) | 2016-06-23 | 2020-09-29 | International Business Machines Corporation | Cognitive machine learning classifier generation |
CN106651025B (zh) * | 2016-12-20 | 2020-09-08 | 中国人民解放军空军装备研究院雷达与电子对抗研究所 | 交通情况预测方法及装置 |
US10817775B2 (en) | 2017-01-12 | 2020-10-27 | International Business Machines Corporation | Neural network computing systems for predicting vehicle requests |
US10636293B2 (en) | 2017-06-07 | 2020-04-28 | International Business Machines Corporation | Uncertainty modeling in traffic demand prediction |
US10565537B1 (en) | 2017-06-14 | 2020-02-18 | William Spencer Askew | Systems, methods, and apparatuses for optimizing outcomes in a multi-factor system |
US10769193B2 (en) * | 2017-06-20 | 2020-09-08 | International Business Machines Corporation | Predictive model clustering |
CN110945557B (zh) * | 2017-07-28 | 2023-08-01 | 北京嘀嘀无限科技发展有限公司 | 用于确定到达的预估时间的系统和方法 |
US20190095836A1 (en) | 2017-09-22 | 2019-03-28 | Conduent Business Services, Llc | Prediction of actual loads from fare collection data |
US10949751B2 (en) | 2017-11-21 | 2021-03-16 | Conduent Business Services Llc | Optimization of multiple criteria in journey planning |
DE102018201787A1 (de) * | 2018-02-06 | 2019-08-08 | Siemens Aktiengesellschaft | Verfahren und System zum Optimieren und Vorhersagen einer Verkehrssituation |
CN108566255A (zh) * | 2018-03-20 | 2018-09-21 | 西安电子科技大学 | 基于多任务学习的时间相关mimo系统信道预测方法 |
US11429987B2 (en) | 2018-05-09 | 2022-08-30 | Volvo Car Corporation | Data-driven method and system to forecast demand for mobility units in a predetermined area based on user group preferences |
US11816179B2 (en) | 2018-05-09 | 2023-11-14 | Volvo Car Corporation | Mobility and transportation need generator using neural networks |
CN108897396A (zh) * | 2018-07-09 | 2018-11-27 | 合肥利元杰信息科技有限公司 | 一种便于拆卸的计算机机箱 |
CN109544920B (zh) * | 2018-11-22 | 2021-10-22 | 广东岭南通股份有限公司 | 基于交易数据的公交出行成本获取、分析方法和系统 |
US11727420B2 (en) | 2019-03-15 | 2023-08-15 | Target Brands, Inc. | Time series clustering analysis for forecasting demand |
CN109961105B (zh) * | 2019-04-08 | 2020-03-27 | 上海市测绘院 | 一种基于多任务深度学习的高分辨率遥感影像分类方法 |
JP7464240B2 (ja) * | 2019-04-26 | 2024-04-09 | Necソリューションイノベータ株式会社 | 予測モデル生成装置、旅行適合度予測装置、予測モデル生産方法、旅行適合度予測方法、プログラム及び記録媒体 |
CN110309923B (zh) * | 2019-07-03 | 2024-04-26 | 深圳前海微众银行股份有限公司 | 横向联邦学习方法、装置、设备及计算机存储介质 |
US11231703B2 (en) * | 2019-08-14 | 2022-01-25 | Hitachi, Ltd. | Multi task learning with incomplete labels for predictive maintenance |
CN111489064B (zh) * | 2020-03-27 | 2023-05-12 | 湖南大学 | 一种面向Df-PBS系统的公共自行车站点动态规划方法和系统 |
CN113470352B (zh) * | 2021-06-17 | 2022-10-21 | 之江实验室 | 一种基于多任务学习的交通大数据分析与预测系统及方法 |
CN113592169A (zh) * | 2021-07-26 | 2021-11-02 | 清华大学 | 基于区域影响关系的节假日供需预测方法与装置 |
CN115871684B (zh) * | 2023-01-05 | 2023-06-06 | 中汽研汽车检验中心(天津)有限公司 | 基于网联运行数据和机器学习的重型车辆质量估算方法 |
CN117422182A (zh) * | 2023-12-18 | 2024-01-19 | 保大坊科技有限公司 | 数据预测方法、装置及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7756341B2 (en) | 2005-06-30 | 2010-07-13 | Xerox Corporation | Generic visual categorization method and system |
EP2481036B1 (en) * | 2009-09-24 | 2015-07-15 | Alcatel Lucent | Methods and system for predicting travel time |
US8762048B2 (en) * | 2011-10-28 | 2014-06-24 | At&T Mobility Ii Llc | Automatic travel time and routing determinations in a wireless network |
-
2013
- 2013-12-26 US US14/140,640 patent/US9349150B2/en not_active Expired - Fee Related
-
2014
- 2014-12-12 JP JP2014251562A patent/JP2015125775A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2020049737A1 (ja) * | 2018-09-07 | 2020-09-10 | 株式会社オファサポート | 運転技能評価システム、方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US9349150B2 (en) | 2016-05-24 |
US20150186792A1 (en) | 2015-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2015125775A (ja) | システムでの需要の予測のためのマルチタスク学習システムおよび方法 | |
Nagy et al. | Survey on traffic prediction in smart cities | |
Gal et al. | Traveling time prediction in scheduled transportation with journey segments | |
Yao et al. | Short‐term traffic speed prediction for an urban corridor | |
US10019671B2 (en) | Learning mobility user choice and demand models from public transport fare collection data | |
Liu et al. | Bus arrival time prediction based on LSTM and spatial-temporal feature vector | |
Ehmke et al. | Floating car based travel times for city logistics | |
EP3035314B1 (en) | A traffic data fusion system and the related method for providing a traffic state for a network of roads | |
Alsolami et al. | Hybrid statistical and machine learning methods for road traffic prediction: A review and tutorial | |
Maiti et al. | Historical data based real time prediction of vehicle arrival time | |
JP2017162450A (ja) | 公共交通機関システムにおけるユーザ旅行嗜好の平滑化動的モデリング | |
Ram et al. | SMARTBUS: A web application for smart urban mobility and transportation | |
Liyanage et al. | AI-based neural network models for bus passenger demand forecasting using smart card data | |
Shoman et al. | Deep learning framework for predicting bus delays on multiple routes using heterogenous datasets | |
JP2016222114A (ja) | データ処理システム、及び、データ処理方法 | |
Kee et al. | Multi-label classification of estimated time of arrival with ensemble neural networks in bus transportation network | |
Schmaranzer et al. | Population-based simulation optimization for urban mass rapid transit networks | |
Sandim et al. | Using GPS-based AVL data to calculate and predict traffic network performance metrics: A systematic review | |
Pramanik et al. | Modeling traffic congestion in developing countries using google maps data | |
Rodríguez-Rueda et al. | Origin–Destination matrix estimation and prediction from socioeconomic variables using automatic feature selection procedure-based machine learning model | |
Basak et al. | Data-driven optimization of public transit schedule | |
JP7281436B2 (ja) | 車両事故予測システム、車両事故予測プログラム、及び、学習済みモデル生成システム | |
Roy et al. | Predicting Taxi Travel Time Using Machine Learning Techniques Considering Weekend and Holidays | |
Buijse et al. | A Deep Learning-Based Approach for Train Arrival Time Prediction | |
Rasaizadi et al. | The ensemble learning process for short-term prediction of traffic state on rural roads |