JP2015125775A

JP2015125775A - システムでの需要の予測のためのマルチタスク学習システムおよび方法

Info

Publication number: JP2015125775A
Application number: JP2014251562A
Authority: JP
Inventors: ボリス・チドロフスキー; Chidlovski Boris
Original assignee: Xerox Corp
Current assignee: Xerox Corp
Priority date: 2013-12-26
Filing date: 2014-12-12
Publication date: 2015-07-06
Also published as: US9349150B2; US20150186792A1

Abstract

【課題】輸送ネットワークにわたる移動需要を予測するための効率的なマルチタスクシステム及び方法を提供する。【解決手段】関連づけられた輸送ネットワークに対応する観測報告が収集され、移動需要に対応する時系列のセットが生成される。時系列のクラスタが続いて形成され、各々のクラスタについて、予測モデルを生成するためにマルチ学習が適用される。時系列のセットの少なくとも１つに対応する関連づけられた輸送ネットワークの選択されたセグメントでの移動需要が続いて、生成された予測モデルに応じて予測される。【選択図】なし

Description

本開示は、輸送技術、データ処理技術、データ分析技術、追跡技術、予測技術、等に関する。

インテリジェントな輸送システムは一般的に、多数のユーザによって利用される複数の車両、経路、およびサービスを含む。輸送ネットワークの効率的な計画および管理、特に、たとえば、変化する交通条件に対する適切な応答は、これらの時間依存エンティティの精確なモデル化およびリアルタイム予測を必要とする。車両位置、道路負荷、移動の時間および需要、交通密度、等といったさまざまな時間依存イベントを追跡し、分析する能力が、輸送の計画および管理中に考慮に入れられなくてはならないファクターのいくつかを表現する。したがって、輸送サービスの効率的な計画は、一般に公共輸送ネットワークでの移動需要として言及される、任意の時間期間にネットワークに入る移動者の数の精確な推定を必要とする。

現在、移動需要の予測は、輸送ネットワークのさまざまなセグメントに関する情報の収集を必要とし、各々のセグメントは、特定の経路、車両、停留所、一連の停留所、等のことを言う。各々がそのセグメントでの需要を正確に予測するために個々にモデル化されなければならず、集約がシステムでの全需要のために続いて実行される。すなわち、各々の個々のセグメントは、有効で効率的な管理のために膨大な計算および分析を必要とする。加えて、異なるセグメントのために利用可能なデータの量は異なり得る。

経時的に変化する任意のエンティティは、時系列として表現されることができ、輸送システムでの移動需要は、経時的に変動する。輸送ネットワークの計画および管理においてしばしば生じる１つの問題は、一連の時間的なイベントのモデル化および予測である。たとえば、特定の車両の乗客数は一日の経過にわたり変動し得、ネットワークの移動者数は一週間の経過にわたり変動し得、特定の停留所の移動者数は一時間の経過にわたり変動し得る、といった具合である。この問題は一般的に、不定量のデータがネットワークの異なる部分について受け取られる場合、すなわち、ある車両が別の車両よりも良好な記録センサまたはデバイスを有し得る場合、車両は記録デバイスを有し得ないが、停留所は有する場合、等に複雑になる。

現在の輸送ネットワークの計画および管理は、この一連の時間的なイベントに影響を及ぼすさまざまなファクターを説明することができない。たとえば、天候は、公共輸送システムのユーザ数に影響する。雨が降っている場合、車を有する者は雨の中の歩行または待機を回避するために彼ら個人の車両を選ぶであろうから、公共輸送システムでの移動者の数は減少し得る。同様に、一日のうちの時間または曜日もまた、輸送ネットワークのセグメントでの需要に影響し得る。たとえば、一日のうちの時間は、需要に影響し得（すなわち、ラッシュアワー）、曜日（すなわち、より少ない週末の移動）は、任意の予測またはモデル化に影響する。激しい自動車交通量は公共輸送ネットワークでの需要、工事、等を増加させ得るので、輸送ネットワーク上の交通量もまた、モデル化および予測におけるファクターであり得る。そのような一連の時間的なイベントは互いに関連し得るが、現在の方法は、需要をモデル化および予測する際にこれをファクターとしない。

たとえば、図１Ａ〜図１Ｂは、特定の都市における異なる経路での乗客負荷を表現する３つの時系列を示す。各々の系列において、ある特定の時間期間中に公共車両に乗る乗客の数が、一日の経過にわたり、そして一週間の経過にわたり、示される。図１Ａに示すように、各々の経路は、一日の経過にわたり変動し、図１Ｂに示すように、各々の経路は、一週間の経過にわたり変動する。従来の計画および管理では、これらのエンティティの各々が各様にモデル化され、すなわち、異なるタスクが実行されなくてはならない。

マルチタスク学習は、帰納転移の形態であり、１つの問題を解決する間に得られた知識を記憶し、それを、異なるが関連する問題に適用することにフォーカスした機械学習である。すなわち、マルチタスク学習は、複数の相互に関連する学習タスクの情報を活用して個々のタスクについてより精確な予測を行うことを目的とする。タスクに包含される関連する情報は、予測の品質を相互に向上させるために活かされ得る。たとえば、マルチタスク学習は、いくつかの異なるドメイン、たとえば、計算生物学、自然言語処理、コンピュータビジョン、等に適用されており、生物学、文字、および視覚の複数のオブジェクトクラスが、関連する特徴のいくつかを共有し得る。マルチタスク学習において、各々のタスクにおける予測精度は、他のタスクからのデータを使用すること、たとえば、正則化、相互化、等によって活用される。

かくして、マルチタスク学習を利用して輸送ネットワークにわたる移動需要を予測するための効率的なシステムおよび方法を提供することが好適であろう。

例示的な実施形態の一態様において、関連づけられた輸送ネットワークでの移動需要を予測するためのマルチタスク学習方法が提供される。この方法は、関連づけられた輸送ネットワークの複数の観測報告に対応する観測データを収集することと、関連づけられた輸送ネットワークのセグメントの輸送ネットワークデータに対応する時系列のセットを生成することとを含む。この方法はまた、時系列のセットにおける各々の時系列が１つのクラスタの中にある時系列の複数のクラスタを形成することと、各々のクラスタについて、予測モデルを生成するためにマルチタスク学習を適用することとを含む。方法はさらに、生成された予測モデルに応じて、時系列のセットの少なくとも１つに対応する関連づけられた輸送ネットワークの選択されたセグメントでの移動需要を予測することを含む。方法はまた、収集すること、生成すること、形成すること、および予測することの少なくとも１つがコンピュータのプロセッサによって実行されることを含む。

別の態様では、関連づけられた輸送ネットワークでの移動需要を予測するためのシステムが提供される。このシステムは、関連づけられた輸送ネットワークのセグメントに対応する時系列のセットを生成するように構成された時系列ジェネレータコンポーネントを含む。このシステムはまた、時系列の複数のクラスタの各々についての予測モデルを生成するように構成されたマルチタスク学習モジュールを含む。加えて、このシステムは、複数の収集コンポーネントから関連づけられた輸送ネットワークのセグメントに対応する輸送ネットワークデータを収集し、輸送ネットワークに関連づけられた複数の観測報告に対応する観測データを受け取るための命令を記憶したメモリを含む。このメモリはさらに、関連づけられた輸送ネットワークの選択されたセグメントでの移動需要を、受け取られた観測データと選択されたセグメントに対応する時系列が関連づけられたクラスタの予測モデルとに応じて予測するための命令を記憶する。システムはさらに、命令を実行する、メモリと通信するプロセッサを含む。

別の態様では、関連づけられた輸送ネットワークでの移動需要を予測するための、コンピュータで実現されるマルチタスク学習方法が提供される。この方法は、関連づけられた輸送ネットワークに対応するデータを収集することを含み、このデータは、観測データと輸送ネットワークデータとの少なくとも１つを含む。方法はまた、観測データまたは輸送ネットワークデータの少なくとも１つに応じて、関連づけられた輸送ネットワークのセグメントに対応する時系列のセットを生成することを含む。加えて、方法は、動的時間伸縮によって時系列のセットの各々のペア間の類似を測定することと、時系列の各々のペアの測定された類似に基づいて、時系列の複数のクラスタを形成することとを含む。方法はさらに、各々のクラスタについて、予測モデルを生成するためにマルチタスク学習サポートベクトル回帰を適用することを含む。方法はまた、生成された予測モデルに応じて、時系列のセットの少なくとも１つに対応する関連づけられた輸送ネットワークの選択されたセグメントでの移動需要を予測することを含む。

図１Ａは、一日の間の３つの経路の移動需要を示す図である。図１Ｂは、一週間の間の図１Ａの３つの経路の移動需要を示す図である。図２Ａは、例示的な実施形態の一態様に係る関連づけられた輸送ネットワークでの移動需要を予測するためのマルチタスク学習システムの機能ブロック図である。図２Ｂは、例示的な実施形態の一態様に係る関連づけられた輸送ネットワークでの移動需要を予測するためのマルチタスク学習システムの機能ブロック図である。図３は、例示的な実施形態に係る関連づけられた輸送ネットワークでの移動需要を予測するためのマルチタスク学習方法の一態様を示すフローチャートである。図４Ａは、例示的な実施形態に係る関連づけられた輸送ネットワークでの移動需要を予測するためのマルチタスク学習方法の別の態様を示すフローチャートである。図４Ｂは、例示的な実施形態に係る関連づけられた輸送ネットワークでの移動需要を予測するためのマルチタスク学習方法の別の態様を示すフローチャートである。図５は、例示的な実施形態に係る例の需要予測を示す図である。図６は、例示的な実施形態に係る経路および停留所での需要予測のウィスカプロットを示す図である。図７は、例示的な実施形態に係る遅延を伴う経路および停留所での需要予測のウィスカプロットを示す図である。

１つ以上の実施形態が、添付図面に関連してここで説明され、同一の参照番号は、全体を通して同一の要素を指すために使用される。関連するまたは関連しない時系列のマルチタスク学習のためのシステムおよび方法に関する例示的な実施形態の態様が、本明細書において説明される。加えて、例示的な実施形態は以下において輸送ネットワークでの移動需要予測に触れながら提示されるが、説明されるシステムおよび方法の応用は、他の分野の時系列分析および予測動作に対し行われ得る。

ここで図２Ａ〜図２Ｂを参照すると、本開示の一態様に係る関連づけられた輸送システムでの移動需要を予測するためのマルチタスク学習システム１００の機能ブロック図が示されている。図２Ａ〜図２Ｂに示すさまざまなコンポーネントは、例示的な実施形態の態様を説明する目的のためのものであること、ハードウェア、ソフトウェア、またはその組み合わせによって実現される他の同様のコンポーネントが、その中で代用可能であることが理解されるだろう。

本明細書において使用される場合、輸送システムは、予め定義された経路のセットを含む輸送ネットワークを含む。経路の各々を、予め定義されたスケジュールに従って公共輸送車両のような輸送システムの１つ以上の輸送車両が移動する。輸送車両は、同一のタイプまたは異なるタイプのもの（バス、電車、路面電車、等）であることができる。一実施形態において、輸送車両は、バスまたは路面電車である。輸送ネットワークには、５個、１０個、またはそれ以上の経路が存在し得る。各々の経路は、複数の予め定義された停留所を有し、複数の予め定義された停留所は、それらの場所に間隔をおいて配置され、ほとんどのまたはすべてのケースにおいて、経路は、少なくとも３つ、４つ、５つ、またはそれ以上の停留所を有する。移動者、すなわち乗客は、乗車するための経路上で利用可能な停留所のセットからの予め定義された経路の１つにおける第１の停留所と、降車するための経路沿いの第２の停留所とを選択し得る。

図２Ａ〜図２Ｂに示すように、探索システム１００は、以下に説明される例示的な方法を実現できる、一般的に１０２で表現されたコンピュータシステムを含む。コンピュータシステム１０２に関し示されているが、任意の適切なコンピューティングプラットフォームが本明細書において説明されるシステムおよび方法によって利用され得ることが理解されるだろう。例示的なコンピュータシステム１０２は、プロセッサ１０４に接続されたメモリ１０６に記憶された処理命令１０８の実行によって例示的な方法を実行するだけでなく、コンピュータシステム１０２の全動作を制御する、プロセッサ１０４を含む。

命令１０８は、輸送システム１３４に設けられたさまざまなデータ収集コンポーネント１５４によって収集された輸送ネットワークデータ１５６からＳ_１，．．．，Ｓ_ｍとして表された時系列１６０のセットを生成するように動作可能な時系列ジェネレータ１１０を含む。上述したように、時系列１６０は、たとえば、経路１３８、停留所１４２、車両１４４、等での移動需要といった、経時的に変化する何らかのエンティティを表現する。一実施形態によると、時系列１６０は、Ｓ_ｉ＝（ｙ_ｉ１，．．．，ｙ_ｉｎ）として表現されることができ、時系列予測の目標は、時間ｉ−１，ｉ−２，．．．での過去の値に基づいて時間ｉでの値ｙを推定することである。一実施形態において、深度は、図３〜図４Ｂに関し以下においてより詳細に説明されるように、最後のｋ個の値に限定され、ｙ_ｉ＝ｆ（ｙ_ｉ−ｋ，ｙ_{ｉ−ｋ＋１}，．．．，ｙ_ｉ−１），ｉ＝ｋ，．．．，ｎであり、ここで、ｋ≧１はモデル化の深度である。以下においては移動需要に関し議論される一方で、時系列ジェネレータ１１０は、他の予測需要に適合可能であり、移動需要は、本明細書において説明されるシステムおよび方法の例示的な応用例として本明細書において使用される、ということが理解される。

命令１０８はさらに、時系列１６０のセットのうちの時系列１６０のペアの各々の間の類似を決定するように構成された類似モジュール１１２を含む。一実施形態において、時系列１６０のセットは、輸送ネットワーク１３４（以下において議論される）から収集されたデータに応答して、時系列ジェネレータ１１０によって生成される。類似モジュール１１２は、時系列１６０のセットにおけるペア間の類似を計算するように構成される。類似モジュール１１２は、時系列１６０のペア間の類似値を決定するのに、動的時間伸縮（ＤＴＷ）、すなわち、時間または速度が異なる２つの系列間の類似を測定するのに適したアルゴリズムを利用し得る。すなわち、類似モジュール１１２は、時系列１６０のペア（Ｓ_ｉ，Ｓ_ｊ），１≦ｉ＜ｊ≦ｋが関連するかどうか、すなわち、時系列１６０の選択されたペアが、類似して挙動し、同一の傾向を示すことによって、相互に関連するかどうかを決定する。ＤＴＷが、時間的および動的な態様を考慮し、２つの系列の標準的な要素面でのアラインメントよりもペア間の類似を良好に解釈することが理解されるだろう。たとえば、２つのバスの停留所は、バスが一方の停留所からもう一方の停留所へと進むのに要する時間に起因して、一方が時間的にシフトされている状態で、移動需要の同一の挙動を示し得る。したがって、ＤＴＷの包含は、時間シフトを考慮する。

図２Ａ〜図２Ｂに示すように、命令１０８はさらに、ｋ−平均法クラスタリングアルゴリズム１６２を使用して時系列１６０間のＤＴＷ距離Ｓ_ｒｔを有する時系列１６０のクラスタＧ_１，Ｇ_２，．．．，Ｇ_Ｌ１６４を形成するために類似モジュール１１２の出力を利用するように構成されたクラスタリングモジュール１１４を含む。一実施形態において、各々の時系列１６０は、単一のクラスタ１６４に属する。別の実施形態によると、予め選択されたしきい値Ｔｈ（図示せず）のクラスタリングが、クラスタＧ_１，Ｇ_２，．．．，Ｇ_Ｌ１６４を形成するのに使用利用され得る。そのような実施形態において、適切なしきい値（Ｔｈ）は、ドメインエキスパートによって定義されるか、または、一連の実験によって検出されるか、のいずれかであり得る。理解されるように、適切なｋ−平均法クラスタリングアルゴリズム１６２は、各々の系列が、最も近い平均値を有するクラスタに属する、ｋ個のクラスタ（たとえば、クラスタＧ_１，Ｇ_２，．．．，Ｇ_Ｌ１６４）に、時系列１６０のセットを分割することを目的とする、クラスタ分析の方法を表す。２つのクラスタ間の距離は、ＤＴＷ値によって適切に定義される。

命令１０８はまた、１つ以上の予測モデル１６６を生み出すように時系列１６０の各々のクラスタ１６４にマルチタスク学習（以下においてより詳細に議論される）を実行するように構成されたマルチタスク学習モジュール１１６を含む。すなわち、マルチタスク学習モジュール１１６は、クラスタ１６４に１つ以上のマルチタスク学習方法を適用し、そのクラスタ１６４の移動需要予測に関連づけられた適切な共通モデル１６６を出力することができる。一実施形態において、マルチタスク学習モジュール１１６は、特定のクラスタ１６４において分析されている時系列１６０に関連づけられたさまざまな観測報告１３６を利用する。たとえば、タスクが、（各々の経路１３８のための対応する時系列１６０によって示されるように）いくつかの経路１３８での移動需要１６８を予測することに対応する場合、および、いくつかの経路１３８が、（クラスタリングモジュール１１４によって共にクラスタリングされるように類似モジュール１１２によるＤＴＷによって）十分に類似している場合、マルチタスク学習モジュール１１６は、以下において議論されるように、クラスタ１６４におけるいくつかの時系列１６０に共通の予測モデル１６６を学習し得る。この予測モデル１６６は続いて、いくつかの経路１３８の各々に沿って移動需要１６８を予測するために需要予測モジュール１１８に通信され得る。

かくして、命令１０８はまた、マルチタスク学習モジュール１１６から１つ以上の予測モデル１６６を受け取るように構成された需要予測モジュール１１８を含む。需要予測モジュール１１８は続いて、予測モデル（単数または複数）１６６に関連づけられた時系列１６０に対応する輸送ネットワーク１３４のセグメント（経路１３８、停留所１４２、車両１４４、等）についての移動需要１６８を計算し得る。一実施形態において、需要予測モジュール１１８は、時系列１６０に関連づけられたさまざまな外部のファクター、すなわち、観測報告１３６（履歴データ１４６、交通データ１４８、天候１５０、カレンダーデータ１５２、等）を、それらに対応する移動需要１６８を予測する際に組み込む。

コンピュータシステム１０２は、外部デバイスと通信するための１つ以上の入力／出力（Ｉ／Ｏ）インターフェースデバイス１１９および１２０を含み得る。Ｉ／Ｏインターフェース１１９は、戻された画像、探索結果、クエリ、等といった情報を表示するための表示デバイス１２４、テキストを入力するためのキーボード、またはタッチスクリーンまたは書き込み可能なスクリーン、といったユーザ入力デバイス１２６、および／または、プロセッサ１０４にユーザ入力情報およびコマンド選択を通信するためのマウス、トラックボール、等といったカーソル制御デバイス、のうちの１つ以上と、通信リンク１３２を介して通信し得る。

システム１００に関連づけられたコンピュータシステム１０２のさまざまなコンポーネントはすべて、データ／制御バス１２２によって接続され得る。コンピュータシステム１０２のプロセッサ１０４は、Ｉ／Ｏインターフェース１１９に結合された通信リンク１３０を介して、関連づけられたデータストレージデバイス１２８と通信する。適切な通信リンク１３０は、たとえば、公衆交換電話網、専用通信ネットワーク、赤外線、光、または他の適切な有線または無線データ通信チャネルを含み得る。データストレージデバイス１２８は、たとえばローカルメモリ１０６に記憶されたコンピュータシステム１０２のコンポーネントに、すなわち、ハードドライブ、仮想ドライブ、等に、または、コンピュータシステム１０２にアクセス可能なリモートメモリに、実装可能である。

関連づけられたデータストレージデバイス１２８は、１つ以上の目的のために使用されるデータ（たとえば、検証情報、車両、輸送システムセグメント、輸送システムゾーン、経路、スケジュール、場所、使用情報、移動需要）の任意の編成されたコレクションに対応する。関連づけられたデータストレージデバイス１２８の実装は、任意の大容量ストレージデバイス（単数または複数）、たとえば、磁気ストレージドライブ、ハードディスクドライブ、光学ストレージデバイス、フラッシュメモリデバイス、またはそれらの適切な組み合わせで行われることができる。関連づけられたデータストレージ１２８は、コンピュータシステム１０２のコンポーネントとして実装され得、たとえば、メモリ１０６に存在し得る、といった具合である。

一実施形態において、関連づけられたデータストレージデバイス１２８は、輸送システム１３４と、経路１３８のコレクション（輸送システム１３４上で利用可能な移動のコース沿いの個々の車両１４４による停留所１４２のシーケンス）と、輸送システム１３４のバス、路面電車、地下鉄、または他の車両１４４、等の到着／出発時間に関するスケジュール１４０と、乗客が乗車または降車し得る経路１３８沿いの停留所１４２とに対応する情報、輸送システム１３４を移動するさまざまな車両１４４に関連する情報、等を含み得る。

データストレージデバイス１２８はさらに、履歴データ１４６、交通データ１４８、天候データ１５０、カレンダーデータ１５２、等といった輸送システム１３４に関連づけられた観測報告１３６を記憶し得る。履歴データ１４６は一般的に、選択された時間期間をカバーし、輸送システム１３４上のすべての停留所および経路で乗車する全乗客を説明する、輸送システム１３４での移動需要１６８に関連する情報を含む。交通データ１４８は、任意の所与のタスク、たとえば、セグメントでの時系列、等に関連するネットワークセグメントでの交通状態を説明し得る。交通データ１４８は、工事迂回路、経路変更、事故の情報、等を含み得る。天候データ１５０は、サードパーティソース（気象サービス）から、または、経路１３８沿いの、停留所１４２での、車両１４４上の、等のセンサ（図示せず）から直接、収集され得る。そのような天候データ１５０は、最低および最高空気温度、空気湿度、降雨量、風速、風向、等を含み得る。そのような天候データ１５０は、たとえば、１５分毎、１時間毎、数時間毎、等の定期的な報告間隔で、コンピュータシステム１０２上で記録され、データストレージ１２８に記憶され得る。いくつかの実施形態では、予想された天候パターンが、記憶された天候データ１５０に含まれ得る。カレンダーデータ１５２は、登校日、学校休暇、スポーツイベント、祝祭日、スケジューリングされた閉鎖に関連する情報、工事情報、等を含み得る。

図２Ａ〜図２Ｂに示す移動需要を予測するためのマルチタスク学習システム１００は、２つ以上の電子デバイス間でのデータの交換を可能にすることができる任意の分散通信システムを表すコンピュータネットワークのような分散コンピューティング環境を使用した実現が可能である、ということが理解されるだろう。そのようなコンピュータネットワークが、限定ではなく例として、仮想ローカルエリアネットワーク、広域ネットワーク、パーソナルエリアネットワーク、ローカルエリアネットワーク、インターネット、イントラネット、またはそれらの任意の適切な組み合わせを含むことが、さらに理解されるだろう。したがって、そのようなコンピュータネットワークは、物理レイヤと、たとえば、トークン−リング、イーサネット（登録商標）、または他の無線または有線ベースのデータ通信メカニズムのような、さまざまな従来のデータトランスポートメカニズムによって例示されるトランスポートレイヤとを備える。さらに、図２Ａ〜図２Ｂではネットワーク化されたコンポーネントのセットとして示されているが、本明細書において議論されるシステムおよび方法は、本明細書に説明される方法を実行するように適合したスタンドアロンデバイスでの実現が可能である。

コンピュータシステム１０２はさらに、Ｉ／Ｏインターフェース１２０によって通信リンク１５８を介して、停留所１４２、車両１４４、駅または発券機、等に分散した１つ以上のデータ収集コンポーネント１５４と通信し得る。いくつかの実施形態において、データ収集コンポーネント１５４は、スマートカードリーダ、磁気カードリーダ、入力端末、券売機、チケットリーダ、等といった自動発券デバイスに対応することができ、乗車、降車、目的地、出発地、日付／時間、値段、等に関連する移動者についての情報を収集し得る。一実施形態において、コンピュータシステム１０２は、適切な通信リンク１５８を介してそのようなデータ収集コンポーネント１５４とデータ通信する。そのような通信リンク１５８は、直接的な有線または無線接続、ネットワーク化された（すなわち、インターネット、イントラネット、等を介した）接続を含み得、公衆交換電話網、専用通信ネットワーク、赤外線、光、または任意の他の適切な有線または無線データ伝送通信媒体といった、さまざまな接続媒体を利用し得る。

一実施形態において、輸送ネットワークデータ１５６は、輸送システム１３４上の移動者に対応するデータ収集デバイス１５４によって収集される。そのような情報は、移動者数についての現在の使用情報、時間／日付情報、検証情報（販売された切符、回収された切符、駅で降りた乗客、駅で乗った乗客、車両１４４に乗っている乗客、等）といった観測報告１３６を含み得る。さまざまな他の情報もまた、データ収集デバイス１５４から通信リンク１５８を介してコンピュータシステム１０２に通信され得る。たとえば、情報は、位置（たとえば、ＧＰＳ、方向、車道の場所、停留所の場所、等）、速度、加速度、車両のメンテナンス情報、温度、時間／日付、等といった、収集デバイス１５４が搭載された車両１４４の状態および環境に関連する。情報の別のソースは、道路条件および交通条件を測定する道路際のセンサ、モバイルフォンセンサである。

コンピュータシステム１０２は、コンピュータサーバ、ワークステーション、パーソナルコンピュータ、携帯電話、タブレットコンピュータ、携帯無線呼出し器、それらの組み合わせ、または、例示的な方法を実行するための命令を実行することができる他のコンピューティングデバイスを含み得る。

１つの例示的な実施形態によると、コンピュータシステム１０２は、関連づけられたユーザ、ネットワーク化されたデバイス、ネットワーク化されたストレージ、リモートデバイス、等と対話するように構成されたハードウェア、ソフトウェア、および／またはそれらの任意の適切な組み合わせを含む。

メモリ１０６は、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、磁気ディスクまたはテープ、光学ディスク、フラッシュメモリ、またはホログラフィックメモリといった任意のタイプの非一時的なコンピュータ可読媒体を表現し得る。一実施形態において、メモリ１０６は、ランダムアクセスメモリと読み取り専用メモリとの組み合わせを備える。いくつかの実施形態において、プロセッサ１０４およびメモリ１０６は、単一チップにおいて組み合わされ得る。ネットワークインターフェース１１９および／または１２０は、コンピュータシステム１０２にコンピュータネットワークを介して他のデバイスと通信することを可能にさせることができ、変調器／復調器（ＭＯＤＥＭ）を備え得る。メモリ１０６は、方法において処理されるデータ、ならびに例示的な方法を実行するための命令を記憶し得る。

デジタルプロセッサ１０４は、シングルコアプロセッサ、デュアルコアプロセッサ（またはより一般的にはマルチコアプロセッサ）、デジタルプロセッサ、および協働する数値演算および／またはグラフィックスコプロセッサ、デジタルコントローラ、等によってさまざまに具体化され得る。デジタルプロセッサ１０４は、コンピュータシステム１０２の動作を制御することに加えて、図３〜図４Ｂにおいて概説される方法を実行するためにメモリ１０６に記憶された命令１０８を実行する。

「ソフトウェア」という用語は、本明細書において使用される場合、ソフトウェアの意思であるタスクを実行するようにコンピュータまたは他のデジタルシステムを構成するようにコンピュータまたは他のデジタルシステムによって実行可能な命令の任意のコレクションまたはセットを含むように意図される。「ソフトウェア」という用語はさらに、本明細書において使用される場合、ＲＡＭ、ハードディスク、光学ディスク、等といった記憶媒体に記憶された命令を含むようにも意図され、ＲＯＭ、等に記憶されたソフトウェアであるいわゆる「ファームウェア」を含むように意図される。そのようなソフトウェアは、さまざまな手法で編成されることができ、ライブラリ、リモートサーバ等に記憶されたインターネットベースのプログラム、ソースコード、解釈実行コード、オブジェクトコード、直接的に実行可能なコード、等として編成されたソフトウェアコンポーネントを含み得る。ソフトウェアが、ある特定の機能を実行するためにサーバまたは他の場所に存在する他のソフトウェアへのシステムレベルコードまたはコールを呼び出し得ることが意図される。

ここで図３を参照すると、関連づけられた輸送ネットワークでの移動需要を予測するための例示的なマルチタスク学習方法の概要が提供される。方法３００が３０２で始まると、コンピュータシステム１０２が、関連づけられた輸送ネットワーク１３４から観測報告１３６を収集する。いくつかの実施形態において、観測報告１３６は、輸送ネットワーク１３４に関連づけられた停留所１４２、車両１４４、駅、等に配置されたさまざまな収集デバイス１５４によって収集され得る。たとえば、自動発券デバイスが、輸送システム１３４に関連づけられた観測報告１３６を収集するために使用され得る。観測報告１３６は、限定ではなく例として、特定の経路１３８、車両１４４、停留所１４２、等の履歴的な移動者の使用に対応する履歴データ１４６、サードパーティソースからのまたはさまざまな時間／日付について観測された天候データ１５０、観測報告、センサ、サードパーティの報告、等によって収集された交通データ１４８、休日、休暇、曜日、スポーツまたは市民イベント、等といったカレンダーデータ１５２、または輸送ネットワーク１３４の機能に影響し得るまたは輸送ネットワーク１３４での移動需要１６８に関連し得る他の観測報告１３６を含み得る。

３０４で、時系列（Ｓ_１，．．．，Ｓ_ｍ）１６０のセットが続いて、輸送ネットワーク１３４から収集されたデータに応じて生成される。たとえば、時系列１６０は、経路１３８上の停留所１４２で乗車または降車する乗客の数、異なる時点での経路１３８上の移動者数、等を表現し得る。一実施形態において、時系列１６０は、Ｓ_ｉ＝（ｙ_ｉ１，．．．，ｙ_ｉｎ）として表現されることができ、時系列予測の目標は、時間ｉ−１，ｉ−２，．．．での過去の値に基づいて時間ｉでの値ｙを推定することである。一実施形態において、深度は、最後のｋ個の値に限定され、ｙ_ｉ＝ｆ（ｙ_ｉ−ｋ，ｙ_{ｉ−ｋ＋１}，．．．，ｙ_ｉ−１），ｉ＝ｋ，．．．，ｎであり、ここで、ｋ≧１はモデル化の深度である。さらに、それはまた、系列の値に影響を有し得る時間ｉでの多数の外部の特性ｖ_ｉを考慮し得、
ｙ_ｉ＝ｆ（ｖ_ｉ，ｙ_ｉ−ｋ，ｙ_{ｉ−ｋ＋１}，．．．，ｙ_ｉ−１），ｉ＝ｋ，．．．，ｎ（１）
である。

したがって、時系列予測の目的は、未来の時点での時系列の予測値、

が無矛盾であるようなｘ_ｉ＝（ｖ_ｉ，ｙ_ｉ−ｋ，ｙ_{ｉ−ｋ＋１}，．．．，ｙ_ｉ−１）である関数ｆ（ｘ_ｉ）を見つけ、規則化されたフィット関数を最小化することである。時系列１６０が、確率的力学系の結果であり、標準方法、たとえば、フーリエ変換および位相空間、等を使用することによって分析され得ることが理解されるだろう。すなわち、フーリエ変換は、時系列を周波数に結び付けて考える。フーリエ変換の動機づけは、複雑な周期関数がサインおよびコサイン関数によって数学的に表現される単純な波の和として近似されるフーリエ級数の研究に由来する。次に、位相空間の概念は、システム力学をモデル化する際に、可能な状態のコレクションをモデル化することを可能にする。時間ｔでのシステム状態は、未来のシステム状態を決定するために必要とされるすべての情報からなる。

３０６で、類似するタスクまたは系列１６０が、システム１０２のクラスタリングモジュール１１４の動作によって共にグループ化またはクラスタリングされる。理解されるように、時系列１６０の関連しないセットへのマルチタスク学習の適用は、予測品質に悪影響を有し得る。したがって、類似モジュール１１２が、時系列１６０のペア（Ｓ_ｉ，Ｓ_ｊ），１≦ｉ＜ｊ≦ｋが関連するかどうかを決定する。すなわち、本明細書において説明されるシステムおよび方法は、時系列１６０のペアが相互に関連するかどうか、それらが類似して挙動し、同一の傾向を示すかどうか、を決定する。２つの系列１６０間の類似は、ＤＴＷ、または、時間または速度が異なる２つの系列１６０間の類似を測定するための他の適切なアルゴリズムによって決定され得る。

上述したように、ＤＴＷは、時間的および動的な態様を考慮し、２つの系列１６０の標準的な要素面でのアラインメントよりも時系列１６０のペア間の類似をより良好に解釈する。たとえば、２つのバスの停留所１４２は、バスが一方の停留所１４２からもう一方の停留所１４２へと進むのに要する時間に起因して、一方が時間的にシフトされている状態で、移動需要１６８の同一の挙動を示し得る。したがって、ＤＴＷの包含は、時間シフトを考慮する。したがって、クラスタリングモジュール１１４は、時系列１６０間のＤＴＷ距離の類似（Ｓ_ｒｔ）を使用して時系列１６０のＬ個のクラスタＧ_１，Ｇ_２，．．．，Ｇ_Ｌ１６４を形成するためにｋ−平均法クラスタリングアルゴリズム１６２を適用し、Ｓ_ｒｔは、以下においてアルゴリズム１で説明されるように、動的時間伸縮距離による系列１６０（たとえば、ｙ_ｒ，ｙ_ｔ）間の類似である。あるいは、クラスタリングモジュール１１４は、予め選択されたしきい値Ｔｈ未満のＤＴＷ値を有する時系列１６０のクラスタＧ_１，Ｇ_２，．．．，Ｇ_Ｌ１６４を形成し得、各々の時系列１６０は、単一のクラスタ１６４に属する。たとえば、図１Ａ〜図１Ｂに示すように、時系列１および３と時系列２とは、明らかに異なって見えるので、異なるクラスタ１６４に属するべきである。

３０８で、関連するタスクまたは系列１６０の各々のクラスタＧ_Ｌ１６４について、時系列１６０の対応するクラスタ１６４に関連づけられた予測モデル１６６を生成するために、マルチタスク学習動作がマルチタスクモジュール１１６によって、関連するタスクまたは系列１６０の各々のクラスタＧ_Ｌ１６４に対し実行される。一実施形態において、システム１００は、所与のクラスタ１６４における各々のタスクまたは系列１６０に共通のモデル１６６を突きとめるためにマルチタスクサポートベクトル回帰を用いる。（類似モジュール１１２によって実行されたＤＴＷに基づいて）時系列１６０またはタスクが任意の他の系列１６０と類似しない場合、その特定の系列１６０に対応する予測モデル１６６を生成するために、サポートベクトル回帰（ＳＶＲ）が時系列１６０に対し使用され得ることが理解されるだろう。一般的に、サポートベクトルマシン（ＳＶＭ）が、パターン認識、オブジェクト分類、および、時系列のケースでは予測回帰分析、といった異なるタスクのために使用される。すなわち、サポートベクトル回帰（ＳＶＲ）が使用され得、それは、観測されたデータを使用して推定される時系列についての関数である。データ駆動型の方法であるので、ＳＶＭは、ＡＲＩＭＡまたはカルマンフィルタのようなより伝統的な時系列予測方法とは異なる。時系列データのセット（ｘ_ｉ，ｙ_ｉ），ｉ＝１，．．．，ｎを考慮すると、時系列予測アルゴリズムは、ある予測ホライズンのための予測値と等しい出力を有するであろう関数ｆ（ｘ）を定義する。回帰分析を使用することにより、線形回帰のための予測関数は、ｆ（ｘ）＝ｗ^Ｔｘ＋ｂとして定義される。データがその入力空間において線形でない場合、データｘは、より高次元の未来の空間における線形回帰の実行を可能にするために、核関数φ（ｘ）によって、より高次元の空間にマッピングされ、
ｆ（ｘ）＝ｗ^Ｔφ（ｘ）＋ｂ
である。

したがって、目的は、最適な重みｗおよびしきい値ｂを見つけること、ならびに、重みの最適なセットを見つけるための基準を定義することである。

トレーニングデータ（ｘ_ｉ，ｙ_ｉ），ｉ＝１，．．．，ｎ，ｘ_ｉ∈Ｒ^ｄ，ｙ_ｉ∈Ｒを考慮すると、ＳＶＭはまず、入力ベクトルｘを未来の空間Φ，φ（ｘ）∈Φにマッピングし、続いて回帰を線形関数ｆ（ｘ）＝ｗ^Ｔφ（ｘ）＋ｂで近似する。これは、ε−非感受性チューブにおける以下の最適化問題を解決することによって得られる。

ここで、ξ_ｉ，ξ^＊ _ｉ，ｉ＝１，．．．，ｎは、ε−非感受性チューブからのずれを測定するスラック変数であり、Ｃは、規則化パラメータである。

一実施形態によると、マルチタスク学習モジュール１１６によって用いられる３０８でのマルチタスク学習は、以下のマルチタスクＳＶＭ回帰を利用し得る。各々のクラスタＧ_Ｌ１６４、すなわち、関連する時系列１６０のセットは、ｍ＞１であるｍ個の関連する時系列のセットとして表され得る。トレーニングサンプルは、｛（ｘ_ｒｉ，ｙ_ｒｉ），ｒ＝１，．．．，ｍ，ｉ＝１，．．．，ｎ｝のセットとして表現され、添え字は、Ｔ_ｒ＝｛ｉ_ｒ１，．．．，ｉ_ｒｎ｝，ｒ＝１，．．．，ｍによる系列ｒからである。そのような実現において、セットにおける各々の系列は同一の長さｎを有するものと想定され得る。

ｍ個の系列のセットにおける各々の系列が類似することが（すなわち、類似モジュール１１２およびクラスタリングモジュール１１４の出力に基づいて）決定されると、タスク、たとえば時系列１６０、が関連するものと想定され得るので、真のモデル１６６のすべてがある共通のモデルｗに近接し、あらゆるタスクモデルｗ_ｒがｗ＋ｗ_ｒ，ｒ＝１，．．．，ｍとして書かれることができ、タスクが互いに類似する場合、個々のベクトルｗ_ｒは小さい。

規則化アプローチが続いて適合させられることができ、それに応じて、各々のタスクのベクトルｘ_ｉ，ｉ∈Ｔ_ｒが、２つの異なる空間にマッピングされる。１つは、すべてのタスクに共通の空間Φであり、φ（ｘ_ｉ）∈Φであり、もう１つは、あらゆるタスクｒに固有の補正空間Φ_ｒであり、φ_ｒ（ｘ_ｉ）∈Φ_ｒである。

個々のタスク情報は、以下のように定義されるスラック変数において説明される。

一実施形態によると、すべてのスラック変数は、非負であり、ξ_ｒ（ｘ_ｉ），ξ^＊ _ｒ（ｘ_ｉ）≧０，ｒ＝１，．．．，ｍである。かくして、補正空間にマッピングされたサンプルは、対応する補正関数の片側になければならない。補正関数はまた、スラック変数がゼロであるいくつかの点を通過しなければならない。

ＳＶＲのＭＴＬバージョンの目的は、タスクあたり、たとえば、系列１６０、クラスタ１６４、等あたり１モデルの、ｍ個の回帰モデル１６６を推定することである。ＭＴＬＳＶＲは、個々のタスク情報をスラック変数によって、推定された回帰関数に組み込む。ｍ個の回帰モデル１６６のための以下のパラメータ化された関数が指定され得る。

ここで、ｆ（ｘ）＝ｗ^Ｔφ（ｘ）＋ｂは、共通の推定関数であり、

は、系列ｒ，ｒ＝１，．．．，ｍのための補正関数である。したがって、マルチタスク学習ＳＶＲの公式化は、以下の最適化問題を解決する。

ここで、μは、個々の補正関数のための規則化パラメータである。（以下において議論される標準ＳＶＭに類似する）双対最適化技法を使用すると、上記最適化問題の双対形式は以下のとおりである。

続いて、ベクトルｗ，ｗ_ｒが、トレーニングサンプルの観点で表され得る。

個々のＳＶＲのいつものパラメータＣおよびεに加えて、マルチタスク学習を拡張させたものは、パラメータμの調整をも必要とする、ということに注意すべきである。

その後、３１０で、需要予測モジュール１１８が、マルチタスク学習モジュール１１６によって生成された予測モデル（単数または複数）１６６に応じて、入力時系列１６０に関連づけられた輸送ネットワーク１３４の車両１４４、停留所１４２、および／または経路１３８に対応する予測された移動需要１６８を出力する。すなわち、需要予測モジュール１１８は、上述した予測モデル１６６を利用して輸送ネットワーク１３４の選択されたセグメントでの移動需要１６８を予測し得る。

ここで図４Ａ〜図４Ｂを参照すると、関連づけられた輸送システムでの移動需要を予測するためのマルチタスク学習方法４００を詳説した図が示されている。方法４００が４０２で始まると、データ１５６が、コンピュータシステム１０２によって輸送システム１３４上の収集コンポーネント１５４から受け取られる。観測報告１３６、たとえば、履歴データ１４６、交通データ１４８、天候データ１５０、カレンダーデータ１５２、等が、４０４でコンピュータシステム１０２により収集される。そのような観測報告は、理解されるように、輸送に対する需要に影響する無数の異なるファクターまたは要素のいずれかに対応し得る。たとえば、天候データ１５０が、雨が降っていることまたは雨が予想されることを示し得る。雨が降っている場合、雨の中で待機すること、停留所まで歩くこと、等を回避するために移動者個人の乗り物を使用する代わりに公共輸送を利用する移動者はより少ないことが一般的に理解される。

４０６で、時系列１６０のセットが、時系列ジェネレータ１１０、またはシステム１００に関連づけられた他の適切なコンポーネントによって、輸送ネットワークデータ１５６から生成される。時系列１６０はさらに、輸送システム１３４、たとえば、経路１３８、スケジュール１４０、停留所１４２、車両１４４、等の記憶された情報に応じて生成され得るので、特定の時系列１６０は、上述したように、経路１３８、停留所１４２、または車両１４４に対応し得る。いくつかの実施形態において、観測報告１３６が、時系列１６０の分析に組み込まれ得る。すなわち、経時的に変化し、「時系列」、すなわち、（上では時系列として明示的に言及された）ｙ_ｉで表された、予測するためのファクター（＝移動需要）の形成に利用され得る、２つのタイプのエンティティが区別され得る。加えて、別のタイプのエンティティは、観測報告（ｖ_ｉで表され、天候、等を含む）であり、後者は、それら自身ではなく前者を予測するために使用され得る。４０８で、収集された観測報告１３６、たとえば、時系列１６０に関連づけられた特定の経路１３８、停留所１４２、または車両１４４での移動需要１６８に対応する履歴データ１４６を使用して、セットにおける各々の系列１６０のためのトレーニングデータが選択される。

各々の時系列１６０に固有の予測モデル１６６が続いて、サポートベクトルマシンに関し上で詳細に議論したように、４１０で、収集された観測報告１３６およびトレーニングデータを使用して生成される。時系列のペアが、４１２で選択され、４１４で分析されて、時系列１６０が過剰な数の要素、すなわち、長すぎる（１０，０００個よりも多い要素）を包含するかどうかが決定される。４１４での肯定的な決定により、動作が４１６に進むと、時系列１６０が一様にサンプリングされる。４１６で時系列１６０のペアを一様にサンプリングした後、または、時系列１６０のペアが長すぎないことが決定されると、動作は４１８に進む。

４１８で、時系列１６０のペア間の類似値が、類似モジュール１１２によって測定される。４２０で、時系列１６０の生成されたセットにおける時系列１６０の別のペアが分析のために残っているかどうかの決定が行われる。すなわち、セットからの少なくとも２つの時系列１６０が、処理されるために残っているかどうか、および、それらの間の類似を決定するために比較されていないかどうか、である。４２０での肯定的な決定により、動作が４１４に戻ると、時系列１６０のそのようなペアが４１６でのサンプリングを命ずる長さを超えるかどうかの決定が行われる。動作は、上述したように４１６〜４１８を経て進む。４２０で時系列１６０の追加のペアが分析されるために残っていないことが決定されると、動作は４２２に進む。

４２２で、ｋ−平均法クラスタリングアルゴリズム１６２が、各々のペア間のＤＴＷ距離Ｓ_ｒｔを使用して時系列１６０のＬ個のクラスタＧ_１，．．．，Ｇ_Ｌを形成するために適用される。一実施形態において、各々の時系列１６０は、１つのクラスタ１６４の中にしか存在することができず、すなわち、時系列１６０は、異なるクラスタ１６４に追加されることができない。４２４で、マルチタスク学習ＳＶＭが、３０８で上述したごとくクラスタ１６４における各々の系列１６０に共通の予測モデル１６６を決定するように、各々のクラスタ１６４に適用される。一実施形態によると、４２４で実行されるマルチタスク学習動作は、特定のクラスタ１６４における系列１６０のための共通の予測モデルおよび固有の予測モデルに関連づけられた重みの学習を可能にする。すなわち、クラスタ１６４に適用されるマルチタスク学習ＳＶＭは、ＳＶＭが適用されるクラスタ１６４における各々の時系列１６０のための予測モデル１６６に適用されるさまざまな重みの学習を可能にする。３０８で詳細に上述したように、クラスタ１６４におけるあらゆる時系列１６０（すなわち、タスク）について、移動需要１６８が共通のモデル１６６と固有のモデル１６６との和として予測され得るという結果となる。

４２６で、マルチタスク予測モデル１６６が、４２４のマルチタスク学習動作に応じて、各々のクラスタ１６４およびタスク、すなわち、系列１６０のために出力される。ペアでないタスク、すなわち、任意の他の時系列１６０と類似しない時系列１６０が、適切な予測モデル１６６を生成するために個々に処理され得ること（上記ＳＶＲを参照）が理解されるだろう。４２８で、ユーザが移動需要の予測を所望するセグメントの選択（輸送ネットワーク１３４の１つの部分または複数の部分、たとえば、経路１３８、停留所１４２、車両１４４、都市ゾーン、一連の経路、車両のセット、および停留所のシーケンス、等）が受け取られる。４２８で示されているが、選択されたセグメント（単数または複数）に関するタスク（すなわち、時系列１６０）のみが生成されるように、輸送システム１３４の所望のセグメントの選択は、モデル１６６の生成前に行われ得る、ということが理解されるだろう。選択されたセグメント（単数または複数）に対応する適切な予測モデル１６６が続いて、需要予測モジュールまたはシステム１００に関連づけられた他の適切なコンポーネントによって４３０で識別される。収集された観測報告１３６およびネットワークデータ１５６が続いて、４３２で、識別された予測モデル１６６に入力され得る。その後、需要予測モジュール１１８が４３４で、関連づけられた輸送ネットワーク１３４の選択されたセグメント（単数または複数）について予測された移動需要１６８を出力する。

図４Ａ〜図４Ｂに示した方法４００は、以下のアルゴリズムの表現によって実現され得る。
アルゴリズム１
関連するおよび関連しない時系列のためのアルゴリズム１のマルチタスク学習：
入力：ｍ個の時系列のセットｙ_１；．．．；ｙ_ｍ，ｙ_ｒ＝（ｙ_ｒ１；：：：；ｙ_ｒｎ），ｒ＝１，．．．，ｍ
入力：クラスタの数Ｌ
入力：あらゆる系列ｙ_ｒのための、天候、カレンダー、および交通データを含む観測報告（ｖ_ｒ．．．，ｖ_ｒｎ）
出力：
１：ｆｏｒあらゆるペア（ｙ_ｒ；ｙ_ｔ）；１＜＝＿ｒ＜ｔ＜＝ｍｄｏ
２：動的時間伸縮（ＤＴＷ）距離Ｓ_ｒｔ＝ＤＴＷ（ｙ_ｒ，ｙ_ｔ）による時系列ｙ_ｒとｙ_ｔとの間の類似Ｓを測定
３：Ｉｆ系列ｙ_ｒおよびｙ_ｔが長すぎる（１０，０００個を超える要素である）、ＤＴＷアルゴリズムを適用する前に系列を一様にサンプリングする
４：ｅｎｄｆｏｒ
５：時系列間のＤＴＷ距離Ｓ_ｒｔを使用して時系列のＬ個のクラスタＧ_１，．．．，Ｇ_Ｌを形成するためにｋ−平均法クラスタリングアルゴリズムを適用する
６：ｆｏｒ関連するタスクｙ_ｉ１，．．．，ｙ_{ｉｍ（ｉ）}，ｉ＝１，．．．，ＬのクラスタＧ_ｉｄｏ
７：時系列ｙ_ｉ１，．．．，ｙ_{ｉｍ（ｉ）}および関連する観測報告ｖ_ｉ１，．．．，ｖ_{ｉｍ（ｉ）}のためにマルチタスク学習を適用する
８：ｅｎｄｆｏｒ
９：ｒｅｔｕｒｎ関連するタスクのＬ個のクラスタのためのマルチタスクモデル

以下の例は、フランスのナンシーの輸送ネットワークにおける移動需要１６８を予測するのにアルゴリズム１を利用する。２つの二者択一の学習アプローチが複数の時系列１６０でのモデル１６６をトレーニングするためにテストされ、すなわち、１つ目は、別個のＳＶＭ回帰モデル１６６が各々のタスクのために独立して推定される個々のタスクのＳＶＲであり、２つ目は、マルチタスク学習を使用して、関連する回帰モデル１６６を共同で推定するマルチタスク学習ＳＶＲであった。

例示的な実現では、移動需要１６８のための予測モデル１６６をトレーニングするために、以下のコンポーネント（すなわち、観測報告１３６）が共同または個々のいずれでも処理された。１）ナンシーのネットワークにおけるすべての停留所１４２および経路１３８で乗車した全乗客を説明する移動需要１６８の履歴データ１４６であって、１３回の週末と、２週間の学校休暇と、３日間の祝祭日と、を含む９０日の期間をカバーしたデータである。加えて、ｋ＝１６個の上位要素を抽出するために、位相空間だけでなくフーリエ変換が、各々の時系列１６０に適用された。２）１時間毎に記録された空気温度（最低および最高）、空気湿度、降雨量、風速、等を含む気象データ（すなわち、天候データ１５０）。３）上述した学校休暇、祝祭日、および週末を含むカレンダーデータ１５２。４）所与のタスクに関連するネットワークセグメント（すなわち、需要が所望される特定の時系列１６０に関連づけられた経路１３８、停留所１４２、車両１４４、等）での交通情報１４８。タイムスタンプｉ−１とｉ^３との間で蓄積されたバスに関係する平均遅延が使用された。図５は、テストセットとして使用されたデータの最後の２０％による需要予測を示し、予測値は、緑５００と赤５０２であり、真の値は、青５０４である。

すべての系列１６０は、同一の手法でトレーニングセットとテストセットとに分けられた。トレーニングセットは、最初のｐ％の項目であり、テストセットは、残りの１００−ｐ％（図５を参照）であり、ｐは、４０％〜９０％で変動する。

テストされた方法のパフォーマンスを測定するために、二乗絶対誤差（ＭＡＥ）が使用された。２つの実験が、輸送ネットワーク１３４の異なるレベルでの移動需要１６８の予測を扱い、１つは、経路１３８のためのものであり、もう１つは、個々の停留所１４２のためのものである。ナンシーにおける３６個のバスの経路の中から、４つの関連するタスクのグループが（たとえば、上述したＤＴＷ分析によって）識別された。停留所の実験のために、（停留所１４２に対応する）２つおよび３つの関連する系列１６０の２つのクラスタが、同都市における２つの主要な経路１３８沿いに識別された。

実験のこの予備的なセットでは、線形核関数φ（ｘ）＝ｘのみが使用される。過去の値のための深度ｋ＝２が、クロスバリデーションによって決定された。パラメータＣおよびεは、標準ＳＶＭ回帰の場合、自動で調整され、パラメータμの最適な値は、リサンプリング方法によって決定された。図６〜図７におけるウィスカプロットは、停留所および経路の実験についての平均、分散、アウトライアーを示す。図６において、プロット６００は、選択された経路１３８のための個々の学習のための需要予測を示し、プロット６０２は、選択された経路１３８のためのマルチタスク学習のための需要予測を示す。プロット６０４は、選択された停留所１４２のための個々の学習のための需要予測を示し、プロット６０６は、選択された停留所１４２のためのマルチタスク学習のための需要予測を示す。すべての系列１６０および観測報告１３６において、１つの基本のイベントは、１時間の値／カウントについて言及する。

加えて、予測シナリオは、遅延を伴ってテストされ、最新の値、ｙ_ｉ−１は、利用不可能であり、ｙ_ｉの予測は、ｙ_ｉ―２，ｙ_ｉ―３，．．．の値のみを使用する。図７は、経路のケースのための個々の学習７００およびマルチタスク学習７０２の結果を示す。

図３〜図４Ｂに示した方法は、コンピュータで実行され得るコンピュータプログラム製品において実現され得る。コンピュータプログラム製品は、ディスク、ハードドライブ、等といった、制御プログラムが記録（記憶）される非一時的なコンピュータ可読記録媒体を備え得る。一般的な形態の非一時的なコンピュータ可読媒体は、たとえば、フロッピー（登録商標）ディスク、フレキシブルディスク、ハードディスク、磁気テープ、または任意の他の磁気記憶媒体、ＣＤ−ＲＯＭ、ＤＶＤ、または任意の他の光学媒体、ＲＡＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＦＬＡＳＨ−ＥＰＲＯＭ、または他のメモリチップまたはカートリッジ、またはコンピュータが読み取り、使用することができる任意の他の有形媒体を含む。

あるいは、方法は、制御プログラムが、電波および赤外線によるデータ通信中などに生成されるデータ信号のような、音波または光波といった伝送媒体を使用するデータ信号として組み込まれる、伝送可能な搬送波のような一時的な媒体において実現され得る。

例示的な方法は、１つ以上の汎用コンピュータ、専用コンピュータ（単数または複数）、プログラムされたマイクロプロセッサまたはマイクロコントローラおよび周辺用集積回路素子、ＡＳＩＣまたは他の集積回路、デジタルシグナルプロセッサ、離散素子回路のような配線電子回路または配線論理回路、ＰＬＤ、ＰＬＡ、ＦＰＧＡ、グラフィカルカードＣＰＵ（ＧＰＵ）、またはＰＡＬ、等といったプログラマブル論理デバイス上で実現され得る。一般的に、図３〜図４Ｂに示すフローチャートをその下で実現できる有限ステートマシンを実現できる任意のデバイスが、輸送システムのユーザの出発地および目的地を推定する方法を実現するために使用され得る。

Claims

関連づけられた輸送ネットワークでの移動需要を予測するためのマルチタスク学習システムであって、
前記関連づけられた輸送ネットワークのセグメントに対応する時系列のセットを生成するように構成された時系列ジェネレータコンポーネントと、
時系列の複数のクラスタの各々についての予測モデルを生成するように構成されたマルチタスク学習モジュールと、
メモリであって、
複数の収集コンポーネントから、前記関連づけられた輸送ネットワークの前記セグメントに対応する輸送ネットワークデータを収集し、
前記輸送ネットワークに関連づけられた複数の観測報告に対応する観測データを受け取り、
前記関連づけられた輸送ネットワークの選択されたセグメントでの移動需要を、前記受け取られた観測データと前記選択されたセグメントに対応する前記時系列が関連づけられた前記クラスタの前記予測モデルとに応じて予測する
ための命令を記憶したメモリと、
前記命令を実行する、前記メモリと通信するプロセッサと
を備えるシステム。
前記関連づけられたネットワークの前記セグメントは、経路、停留所、または車両の少なくとも１つに対応する、請求項１に記載のシステム。
動的時間伸縮によって時系列のペアの各々の間の類似度を測定するように構成された類似モジュールをさらに備える、請求項２に記載のシステム。
前記観測データは、履歴データ、交通データ、天候データ、またはカレンダーデータの少なくとも１つを備える、請求項１に記載のシステム。
前記予測モデルは、マルチタスク学習サポートベクトル回帰によって生成される、請求項４に記載のシステム。
関連づけられた輸送ネットワークでの移動需要を予測するための、コンピュータで実現されるマルチタスク学習方法であって、
前記関連づけられた輸送ネットワークに対応するデータを収集することであって、前記データは観測データと輸送ネットワークデータとの少なくとも１つを含む、収集することと、
前記観測データまたは前記輸送ネットワークデータの少なくとも１つに応じて、前記関連づけられた輸送ネットワークのセグメントに対応する時系列のセットを生成することと、
動的時間伸縮によって前記時系列のセットの各々のペア間の類似を測定することと、
時系列の各々のペアの前記測定された類似に基づいて、時系列の複数のクラスタを形成することと、
各々のクラスタについて、予測モデルを生成するためにマルチタスク学習サポートベクトル回帰を適用することと、
前記生成された予測モデルに応じて、前記時系列のセットの少なくとも１つに対応する前記関連づけられた輸送ネットワークの選択されたセグメントでの移動需要を予測することと
を備える方法。