JP6946542B2 - 学習システム、推定システム及び学習済モデル - Google Patents

学習システム、推定システム及び学習済モデル Download PDF

Info

Publication number
JP6946542B2
JP6946542B2 JP2020500333A JP2020500333A JP6946542B2 JP 6946542 B2 JP6946542 B2 JP 6946542B2 JP 2020500333 A JP2020500333 A JP 2020500333A JP 2020500333 A JP2020500333 A JP 2020500333A JP 6946542 B2 JP6946542 B2 JP 6946542B2
Authority
JP
Japan
Prior art keywords
learning
demand
feature amount
mesh
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020500333A
Other languages
English (en)
Other versions
JPWO2019159585A1 (ja
Inventor
慎 石黒
慎 石黒
佑介 深澤
佑介 深澤
仁嗣 川崎
仁嗣 川崎
悠 菊地
悠 菊地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Publication of JPWO2019159585A1 publication Critical patent/JPWO2019159585A1/ja
Application granted granted Critical
Publication of JP6946542B2 publication Critical patent/JP6946542B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Primary Health Care (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、学習システム、推定システム及び学習済モデルに関する。
サービスの需要の予測を行うシステムが知られている。例えば、タクシーの需要を予測するシステムでは、所定範囲に区切られた場所及び時間ごと(例えば500m四方のメッシュごと、30分ごと)の需要数が予測される。特許文献1には、複数の区域に分割された地図における複数の区域各々に、当該区域各々における旅客数に関する予測値に基づく情報各々を対応付けて表示させる技術が記載されている。旅客数に関する予測値に基づく情報は、区域毎の乗用旅客車両の需要数と、空車状態の乗用旅客車両の数とに基づき、需要数はニューラルネットワークによるモデルに基づいて出力される。
特開2016−75972号公報
所定範囲に区切られた地理的範囲であるエリア(メッシュ)ごとのサービスの需要数を予測する問題においては、メッシュごとの予測モデルを作成する方法と、メッシュによらず単一のモデルを作成する方法とがある。特異な特徴を有するメッシュが予測の対象に含まれる場合には、メッシュごとの予測モデルを作成することは有効であるが、この手法には、モデルに入力する特徴量にノイズが含まれる場合に誤差が大きくなりやすい等の欠点がある。
一方、単一のモデルにより予測を行う方法は、ノイズに対してロバストであり、全てのメッシュに対して汎用的に適用できるといった長所がある。また、単一のモデルにより予測する方法では、多くのエリアの大量のデータを入力することにより、あるエリアの需要の予測に、当該エリアに類似するエリアのデータが活用されるといった深層学習の特性を利用できる。しかしながら、単一のモデルにより予測を行う方法では、入力されるデータにおいて、需要数の値の出現数の分布のメッシュ間の偏りがある場合に、予測モデルにおける誤差が大きくなりやすかった。
そこで、本発明は、上記問題点に鑑みてなされたものであり、単一のモデルによるエリアごとのサービスの需要数の予測に際して、需要数の出現数の分布に偏りがある場合であっても、誤差を低減し、精度が高い予測が可能な学習システム、推定システム及び学習済モデルを提供することを目的とする。
上記課題を解決するために、本発明の一形態に係る学習システムは、機械学習により生成されるニューラルネットワークを含む単一の予測モデルにより、所定の地理的範囲を表すメッシュごとの所定のサービスの需要予測を行うための需要予測システムにおける、ニューラルネットワークを機械学習により生成する学習システムであって、過去の期間に関連づけられたメッシュごとの学習用特徴量であって、少なくとも各期間の各メッシュにおけるサービスの需要数を特徴量として含む学習用特徴量を学習データとして取得する学習データ取得部と、学習データに含まれる学習用特徴量を、メッシュごとに正規化する学習データ正規化部であって、学習用特徴量のうちの少なくとも需要数を正規化する、学習データ正規化部と、学習データ正規化部により正規化された需要数を含む学習用特徴量をニューラルネットワークに入力して得られる、サービスの需要の予測数である需要予測値に基づいて機械学習を行い、ニューラルネットワークを生成する生成部と、を備える。
上記の形態によれば、学習用特徴量に含まれる需要数がメッシュごとに正規化された後にニューラルネットワークに入力される。これにより、メッシュごとの需要数の規模(スケール)の差異による特徴量の振る舞いの性質の違いが考慮されたニューラルネットワークが生成される。従って、誤差が低減された精度が高い予測が可能な単一の予測モデルが得られる。
上記課題を解決するために、本発明の一形態に係る推定システムは、上記学習システムにより生成されたニューラルネットワークを含む予測モデルを用いて、サービスの需要の推定を行う推定システムであって、需要の推定の対象期間に関連付けられたメッシュごとの特徴量であって、少なくとも対象期間に関連付けられた期間のメッシュにおけるサービスの需要数を含む、特徴量を取得する特徴量取得部と、特徴量取得部により取得された特徴量を、メッシュごとに正規化する正規化部であって、特徴量のうちの少なくとも需要数を正規化する、正規化部と、正規化部により正規化された需要数を含む特徴量を予測モデルのニューラルネットワークに入力して、対象期間におけるサービスの需要数を推定する推定部と、推定部により推定された需要数を需要推定値として出力する出力部と、を備える。推定システムにおいて用いられる予測モデルのニューラルネットワークは、過去の期間に関連づけられたメッシュごとの特徴量であって、少なくともメッシュごとに正規化された各期間の各メッシュにおけるサービスの需要数を含む特徴量を入力値として、期間に関連付けられた所定の対象期間における前記サービスの前記需要数を出力する。
上記の形態によれば、需要の推定の対象期間に関連付けられた特徴量に含まれる需要数が、メッシュごとに正規化された後にニューラルネットワークに入力される。これにより、メッシュごとの需要数の規模(スケール)の差異による特徴量の振る舞いの性質の違いが考慮された需要数が推定される。
上記課題を解決するために、本発明の一形態に係る学習済モデルは、所定の地理的範囲を表すメッシュごとの所定のサービスの需要予測を行うための、機械学習により生成されるニューラルネットワークを含む学習済モデルであって、ニューラルネットワークは、過去の期間に関連づけられたメッシュごとの特徴量であって、少なくともメッシュごとに正規化された各期間の各メッシュにおけるサービスの需要数を含む特徴量を入力値として、期間に関連付けられた所定の対象期間におけるサービスの需要の予測数である需要予測値を出力する。
上記の形態によれば、メッシュごとに正規化された需要数を含む特徴量がニューラルネットワークに入力される。これにより、メッシュごとの需要数の規模(スケール)の差異による特徴量の振る舞いの性質の違いが考慮された需要の予測値が出力される。
単一のモデルによるエリアごとのサービスの需要数の予測に際して、需要数の出現数の分布に偏りがある場合であっても、誤差を低減し、精度が高い予測が可能な学習システム、推定システム及び学習済モデルを提供することが可能となる。
本実施形態に係る学習システム及び推定システムを含む需要予測システム1の機能的構成を示す図である。 需要予測システムのハードブロック図である。 本実施形態の需要予測システムにより出力されるタクシーの需要数のイメージを模式的に示す図である。 本実施形態の需要予測システムが解決する課題を説明するための図である。 本実施形態の予測モデルに含まれるニューラルネットワークの生成を模式的に示す図である。 学習用特徴量の例を示す図である。 学習システムにおける処理を模式的に示す図である。 本実施形態の学習方法の処理内容を示すフローチャートである。 本実施形態の推定方法の処理内容を示すフローチャートである。 需要予測プログラムの構成を示す図である。
本発明に係る学習システム、推定システム及び学習済モデルの実施形態について図面を参照して説明する。なお、可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。
図1は、本実施形態に係る学習システム10及び推定システム20を含む需要予測システム1の機能的構成を示す図である。需要予測システム1は、機械学習により生成されるニューラルネットワークを含む単一の予測モデルにより、所定の地理的範囲を表すメッシュごとの所定のサービスの需要予測を行うためのシステムである。本実施形態の需要予測システム1は、ある期間(例えば30分ごと)のメッシュごとのタクシーの需要数を予測する。
図1に示す例では、需要予測システム1は、学習システム10及び推定システム20並びに特徴量記憶部30及び予測モデル記憶部40を含んで構成されるが、学習システム10及び推定システム20並びに特徴量記憶部30及び予測モデル記憶部40がそれぞれ別の装置に構成されてもよい。
学習システム10は、予測モデルに含まれるニューラルネットワークを機械学習により生成するシステムである。学習システム10は、学習データ取得部11、学習データ正規化部12、サンプリング部13、ミニバッチ正規化部14及び生成部15を含む。学習システム10における各機能部は、1つの装置に構成されてもよいし、複数の装置に分散されて構成されてもよい。
推定システム20は、学習システム10により生成されたニューラルネットワークを含む予測モデルを用いて、サービスの需要の推定を行うシステムである。推定システム20は、特徴量取得部21、正規化部22、推定部23及び出力部24を含む。推定システム20における各機能部は、1つの装置に構成されてもよいし、複数の装置に分散されて構成されてもよい。
特徴量記憶部30は、学習システム10において機械学習に用いられる学習用特徴量及び需要の推定の対象期間に関連付けられた特徴量を記憶している記憶手段である。特徴量記憶部30は、学習システム10及び推定システムからアクセス可能に構成されていればいかなる態様の装置で構成されてもよい。
予測モデル記憶部40は、ニューラルネットワークを含む予測モデルを記憶している記憶手段である。具体的には、予測モデル記憶部40は、機械学習によりニューラルネットワークが生成及び更新される過程の予測モデル、及び、機械学習が完了した学習済みの予測モデル(学習済モデル)を適宜記憶する。予測モデル記憶部40は、学習システム10及び推定システムからアクセス可能に構成されていればいかなる態様の装置で構成されてもよい。
なお、図1に示したブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置により実現されてもよいし、物理的及び/又は論理的に分離した2つ以上の装置を直接的及び/又は間接的に(例えば、有線及び/又は無線)で接続し、これら複数の装置により実現されてもよい。
例えば、本発明の一実施の形態における需要予測システム1は、コンピュータとして機能してもよい。図2は、本実施形態に係る需要予測システム1のハードウェア構成の一例を示す図である。需要予測システム1は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。なお、学習システム10及び推定システム20のそれぞれは、図2に示すハードウェア構成を有していてもよい。
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。需要予測システム1のハードウェア構成は、図2に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
需要予測システム1における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることで、プロセッサ1001が演算を行い、通信装置1004による通信や、メモリ1002及びストレージ1003におけるデータの読み出し及び/又は書き込みを制御することで実現される。
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)で構成されてもよい。また、プロセッサ1001は、GPU(Graphics Processing Unit)を含んで構成されてもよい。例えば、図1に示した各機能部11〜15、21〜24などは、プロセッサ1001で実現されてもよい。
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュールやデータを、ストレージ1003及び/又は通信装置1004からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、需要予測システム1の各機能部11〜15、21〜24は、メモリ1002に格納され、プロセッサ1001で動作する制御プログラムによって実現されてもよい。上述の各種処理は、1つのプロセッサ1001で実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つで構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本発明の一実施の形態に係る学習方法及び推定方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD−ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu−ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つで構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及び/又はストレージ1003を含むデータベース、サーバその他の適切な媒体であってもよい。
通信装置1004は、有線及び/又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
また、プロセッサ1001やメモリ1002などの各装置は、情報を通信するためのバス1007で接続される。バス1007は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。
また、需要予測システム1、学習システム10または推定システム20は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つで実装されてもよい。
図3は、本実施形態の需要予測システム1により出力されるタクシーの需要数のイメージを模式的に示す図である。需要予測システム1は、例えば、現在(10:00)を基準時として、所定時間(例えば、現在〜30分、即ち10:00〜10:30)のメッシュ群Mのメッシュごとのタクシーの需要数を予測する。予測された需要数は、図3において、各メッシュに重畳されて表示されている数である。一のメッシュmは、例えば500m四方の区切られた地理的範囲である。
需要数は、予測の対象となる基準時(対象期間)に関連付けられた複数の過去の期間における複数のメッシュごとの需要数、人口、天気等の特徴量を、メッシュによらず単一の予測モデルに入力することにより得られる。
予測モデルは、ニューラルネットワークを含む。ニューラルネットワークは、ある基準期間に関連付けられた複数の過去の期間における複数のメッシュごとの需要数、人口、天気等の特徴量を学習用特徴量としてニューラルネットワークに入力して、その結果として得られる需要予測値と、基準期間における需要実績値とに基づいて、誤差計算(誤差逆伝搬)を含む機械学習を行うことにより生成される。誤差計算には、種々の損失関数を適用できる。
図4は、本実施形態の需要予測システム1が解決する課題を説明するための図である。具体的には、図4は、ある期間(例えば30分ごと)及びあるメッシュにおけるタクシーの需要数である需要実績数の出現数を示すグラフである。図4に示すように、需要実績数の出現の傾向には大きな偏りがある。例えば、ある期間におけるメッシュmaにおける需要実績数は「38」である。このような、比較的大きい需要実績数を有する期間及びメッシュの出現数は、取得されたデータの全体に占める割合が極めて少ない。一方、ある期間におけるメッシュmbにおける需要実績数は「4」である。このような、比較的小さい需要実績数を有する期間及びメッシュの出現数は、取得されたデータの全体に占める割合が多い。
本実施形態では、上述のとおり、単一の予測モデルを用いて需要予測が行われる。単一の予測モデルにより予測を行う場合には、入力されるデータにおいて、需要数の出現数の分布にメッシュ間の偏りがある場合に、予測モデルにおける誤差が大きくなりやすかった。具体的には、図4に示すように、大きい需要実績数の出現数が少ないことに起因して、このようなデータを学習用のデータとする機械学習により生成されたニューラルネットワークを含む予測モデルでは、誤差が大きくなりやすかった。
また、機械学習によるニューラルネットワークの生成では、大量の学習用データを1エポック(epoch)として、1エポックの学習データ群から所定数のデータをミニバッチとしてランダムにサンプリングして、ミニバッチごとに、学習データに含まれる特徴量に対して正規化を行うことが知られている。しかしながら、ミニバッチに対する正規化は、需要実績数の出現の傾向の偏りに起因する誤差の低減には効果がなかった。
かかる課題を解決すべく、本実施形態の需要予測システム1は、単一の予測モデルによるメッシュごとのサービスの需要数の予測に際して、需要数の出現数の分布に偏りがある場合であっても、誤差を低減し、精度が高い予測を可能とするものである。
図5は、本実施形態の予測モデルに含まれるニューラルネットワークの生成を模式的に示す図である。ニューラルネットワークNNは、過去の期間に関連づけられたメッシュごとの特徴量FVであって、少なくともメッシュごとに正規化された各期間の各メッシュにおけるサービスの需要数を含む特徴量FVを入力値として、期間に関連付けられた所定の対象期間におけるサービスの需要の予測数である需要予測値pvを出力する。
具体的には、ニューラルネットワークNNには、学習の局面においては、ある基準時(対象期間)に関連付けられた複数の過去の期間における複数のメッシュごとの需要数、人口、天気等の特徴量FVが、学習用特徴量として入力される。また、需要の予測の局面においては、予測の対象期間に関連付けられた複数の過去の期間における複数のメッシュごとの需要数、人口、天気等の特徴量FVがニューラルネットワークNNに入力される。
ニューラルネットワークNNは、入力層ie、隠れ層se及び出力層pdを含む。入力層ieには、特徴量のデータの数に応じた次元数の入力ベクトルとして学習用特徴量が入力される。そして、入力層ie、隠れ層se及び出力層pdの各層の関数による変換を経て需要予測値PVが出力される。需要予測値PVは、対象期間におけるサービスの需要の予測数である。
本実施形態の学習システム10は、需要予測値PV及び対象期間における需要実績値に基づいて機械学習を行い、ニューラルネットワークNNを生成(更新)する。具体的には、学習システム10は、需要予測値PV及び需要実績値に基づき、誤差計算(誤差逆伝搬)を行い、各層の関数係数の最適化を行う。なお、隠れ層seの数は図示された例に限定されない。また、ニューラルネットワークNNの生成及び機械学習には、周知の種々の手法を適用できる。
なお、学習済みのニューラルネットワークNNを含む予測モデルである学習済みモデルは、コンピュータにより読み込まれ又は参照され、コンピュータに所定の処理を実行させ及びコンピュータに所定の機能を実現させるプログラムとして捉えることができる。
即ち、本実施形態の学習済みモデルは、CPU及びメモリを備えるコンピュータにおいて用いられる。具体的には、コンピュータのCPUが、メモリに記憶された学習済みモデルからの指令に従って、ニューラルネットワークの入力層に入力された入力データ(例えば、需要数等を含む特徴量)に対し、各層に対応する学習済みの重み付け係数と応答関数等に基づく演算を行い、出力層から結果(需要予測数)を出力するよう動作する。
再び図1を参照して、需要予測システム1の各機能部について説明する。まず、学習システム10に各機能部を説明する。
学習データ取得部11は、予測モデルに含まれるニューラルネットワークを生成するために機械学習に供する学習データを取得する。学習データは、学習用特徴量及び当該学習用特徴量に関連付けられた需要実績値を含むことができる。
学習用特徴量は、ある基準時(期間)に関連付けられた過去の期間のメッシュごとの種々の特徴量を含み、少なくとも各期間の各メッシュにおけるサービスの需要数を含む。図6は、学習用特徴量の例を示す図である。図6に示す例では、学習用特徴量は、基準期間に関連付けられたメッシュ(メッシュID:A1,A2,A3,・・・)ごとの種々の特徴量を含む。本実施形態では、各メッシュにおける複数の過去の期間(30分前〜現在、1時間前から30分前、1.5時間前〜1時間前)のタクシーの需要数、人口、天気が特徴量として用いられる。
タクシーの需要数は、個々のタクシーに設置されたGPSデバイスにより定期的に収集された位置情報及び客車状態(乗客の有無)に基づき取得可能である。各メッシュにおける人口は、携帯端末のネットワークを利用して取得可能である。具体的には、モバイル端末と基地局の位置関係から取得されたメッシュごとの端末の在圏数及び人口データに基づいて、メッシュごとの人口の推定が可能である。各メッシュの天気は、天気に関する情報を提供する種々の情報サービスより取得可能である。なお、本実施形態では、学習用特徴量として、需要数、人口及び天気を取得することとしているが、取得される学習用特徴量はこれらの特徴量には限定されない。
需要実績値は、サービスの需要の実績数である。本実施形態では、学習データ取得部11は、基準期間におけるタクシーの需要数の実績数を需要実績値として学習用特徴量とともに取得する。図6に示す例では、学習データ取得部11は、例えば、「2017/12/15 12:00」から30分の間におけるタクシーの需要実績数を、当該基準期間の学習用特徴量に関連付けて取得する。
図7は、学習システム10における処理を模式的に示す図である。以下の説明では、図1及び図7を併せて参照しながら、学習システム10の各機能部を説明する。図7の処理p11に示されるように、学習データ取得部11は、機械学習の対象となる一定期間の各メッシュの特徴量fv1を取得する。なお。図7に示される符号fv1〜fv7に含まれる値は、説明のための模式的なものであって、厳密に算出されたものではない。
学習データ正規化部12は、学習データに含まれる学習用特徴量を、メッシュごとに正規化する(Mesh Normalization)。特に、学習データ正規化部12は、学習用特徴量に含まれる特徴量のうちの少なくとも需要数を正規化する。正規化は、種々の手法により行われることが可能であるが、例えば、データの分布が平均0及び分散1となるように各データを変換することである。
本実施形態では、学習データ正規化部12は、少なくとも、タクシーの需要数をメッシュごとに正規化する。具体的には、学習データ正規化部12は、一のメッシュにおける機械学習の対象となる一定期間の需要数のデータのうち最大値で当該メッシュの需要数を除して、正規化された需要数を得る。こうして、図7の処理p12に示されるように、学習データ正規化部12は、学習データ取得部11により取得された学習用特徴量fv2をメッシュごとに正規化して、正規化された学習用特徴量fv3を算出する。
なお、学習データ正規化部12は、同じメッシュに属し且つ所定の同じ時期的属性に関連付けられた学習用特徴量ごとに正規化を行ってもよい。具体的には、学習データ正規化部12は、同一のメッシュに属し、且つ、同じ曜日及び時刻等の属性に関連付けられた特徴量を抽出し、抽出された特徴量のうちの最大値で、抽出された特徴量を除して正規化された特徴量を得てもよい。
また、学習データ正規化部12は、学習用特徴量における、特徴量の値の出現数の分布のメッシュ間の偏りに基づいて、当該特徴量に対する正規化の実施の要否を判定してもよい。
図4を参照して説明したように、本実施形態の需要予測システム1は、需要実績数の出現数の傾向においてメッシュ間で大きな偏りがある場合において生じうる、予測モデルの誤差を低減できるものである。このような課題に鑑みて、学習データ正規化部12は、学習データ取得部11により取得された学習用特徴量におけるタクシーの需要数(需要実績数)を周知の統計的手法により解析し、需要実績数の出現数のメッシュ間の偏りが所定の程度以上であった場合に、取得された学習用特徴量の需要数に対するメッシュごとの正規化を実施することとしてもよい。
サンプリング部13は、複数の学習用特徴量のうち所定数の学習用特徴量をミニバッチとしてサンプリングする。本実施形態では、サンプリング部13は、学習データ正規化部12により正規化された学習用特徴量のうちの所定数の学習用特徴量をサンプリングする。例えば、サンプリング部13は、学習データ取得部11により1エポックの学習用データ(例えば、5000メッシュ×50の期間×500日分=7500万レコードのデータ)が取得された場合に、所定数(例えば、100レコード)の学習用データをランダムにサンプリングして、1つのミニバッチとして取得する。こうして、図7の処理p13に示されるように、サンプリング部13は、学習データ正規化部12により正規化された学習用特徴量fv3のうちの所定数をサンプリングし、ミニバッチとしての学習用特徴量fv4を取得する。
また、サンプリング部13は、学習用特徴量をランダムにサンプリングすることに代えて、所定値以上の需要実績値に関連付けられた学習用特徴量をサンプリングすることとしてもよい。これにより、需要数のスケールが大きいメッシュに関連付けられた学習用特徴量が機械学習に用いられることになるので、出現数が少ない、大きなスケールの需要数のメッシュに対する需要予測の精度を向上させることができる。
ミニバッチ正規化部14は、サンプリング部13によりサンプリングされた学習用特徴量をミニバッチごとに正規化する。具体的には、ミニバッチ正規化部14は、学習用特徴量に含まれる各特徴量のうちの少なくとも一部の特徴量に対して、ミニバッチごとの正規化を実施する。従って、ミニバッチ正規化部14は、学習用特徴量のうちの需要数のみに対してミニバッチごとの正規化を実施してもよいし、人口及び天気等の特徴量に対して更に正規化を実施してもよい。こうして、図7の処理p14に示されるように、ミニバッチ正規化部14は、サンプリングされた学習用特徴量fv4をミニバッチごとに正規化し、正規化された学習用特徴量fv5を取得する。
生成部15は、少なくとも学習データ正規化部12により正規化された需要数を含む学習用特徴量をニューラルネットワークに入力して得られる、サービスの需要の予測数である需要予測値を取得し、取得した需要予測値及び需要実績値に基づいて機械学習を行い、ニューラルネットワークを生成する。
本実施形態では、生成部15は、ミニバッチ正規化部14により正規化された学習用特徴量をニューラルネットワークNNに入力して、当該学習用特徴量に対応する対象期間の需要予測値を取得する。即ち、図7の処理p15に示されるように、生成部15は、正規化された学習用特徴量fv5をニューラルネットワークNNに入力して、タクシーの需要の推定を実施し、需要予測値fv6を取得する。
生成部15は、取得した需要予測値及び当該学習用特徴量に対応する需要実績値に基づいて誤差計算を含む機械学習を行い、ニューラルネットワークNNの最適化及び更新を行う。即ち、図7の処理p16に示されるように、生成部15は、需要予測値fv6を用いた機械学習を実施して、ニューラルネットワークNNを生成する。
なお、生成部15は、学習データ正規化部12において用いられた正規化係数により変換された需要実績値を用いて、機械学習のための誤差計算を行う。具体的には、ニューラルネットワークNNにより出力される需要予測値は、メッシュごとに正規化された需要数に基づくので、生成部15は、出力された需要予測値に対応するように、学習データ正規化部12において用いられた正規化係数により正規化された需要実績値を用いて誤差計算を行う。
なお、生成部15は、機械学習によるニューラルネットワークNNの生成に際して、学習データ正規化部12において学習用特徴量のメッシュごとの正規化に用いられた値(正規化係数)を、ニューラルネットワークNNに入力する特徴量として用いてもよい。これにより、生成されるニューラルネットワークNNに、正規化された特徴量の、値の規模(スケール)のメッシュ間の差異による振る舞いの性質の違いが反映される。
次に、推定システム20の各機能部について説明する。推定システム20は、学習システム10により生成されたニューラルネットワークNNを含む単一の予測モデル(メッシュによらない予測モデル)を用いて、タクシーの需要数の推定を行う。
特徴量取得部21は、需要の推定の対象期間に関連付けられたメッシュごとの特徴量であって、少なくとも対象期間に関連付けられた期間の前記メッシュにおけるサービスの需要数を含む、特徴量を取得する。具体的には、例えば、現在(現在〜30分後)を需要予測の対象期間とする場合には、特徴量取得部21は、現在以前の過去の複数の期間のメッシュごとの特徴量を取得する。取得される特徴量は、少なくとも、各期間及び各メッシュのタクシーの需要数を含む。特徴量における項目等の内容は、学習データ取得部11により取得される学習用特徴量と同様である。
正規化部22は、特徴量取得部21により取得された特徴量をメッシュごとに正規化する。本実施形態では、正規化部22は、特徴量のうちの少なくとも前記需要数を正規化する。具体的には、正規化部22は、学習データ正規化部12による学習用特徴量のメッシュごとの正規化と同様に、特徴量取得部21により取得された特徴量のうちの少なくとも需要数をメッシュごとに正規化する。
推定部23は、正規化部22により正規化された需要数を含む特徴量を予測モデルのニューラルネットワークNNに入力して、予測の対象期間におけるサービスの需要数を推定する。具体的には、推定部23は、生成部15による需要予測値の取得と同様に、正規化部22により正規化された特徴量をニューラルネットワークNNに入力して、当該特徴量に対応するタクシーの需要数を推定する。
出力部24は、推定部23により推定された需要数を需要推定値として出力する。なお、出力部24は、正規化部22において用いられた正規化係数により変換された需要推定値を出力する。即ち、推定部23により推定された需要数は、正規化部22により正規化された需要数をニューラルネットワークNNに入力して得られたものであるので、出力部24は、正規化に用いられた正規化係数で逆変換された需要数を需要推定値として出力する。
次に、図8を参照して、需要予測システム1における、ニューラルネットワークを生成する学習方法について説明する。図8は、本実施形態の学習方法の処理内容を示すフローチャートである。
ステップS1において、学習データ取得部11は、予測モデルに含まれるニューラルネットワークNNを生成するために機械学習に供する学習データを取得する。学習データは、学習用特徴量及び需要実績値を含む。
ステップS2において、学習データ正規化部12は、学習データに含まれる学習用特徴量を、メッシュごとに正規化する。
ステップS3において、サンプリング部13は、複数の学習用特徴量のうち所定数の学習用特徴量をミニバッチとしてサンプリングする。続くステップS4において、ミニバッチ正規化部14は、サンプリング部13によりサンプリングされた学習用特徴量をミニバッチごとに正規化する。
ステップS5において、生成部15は、学習用特徴量をニューラルネットワークNNに入力する。続いて、ステップS6において、生成部15は、入力した学習用特徴量に対応する対象期間の需要予測値を取得する。
ステップS7において、生成部15は、生成部15は、取得した需要予測値及び当該学習用特徴量に対応する需要実績値に基づいて誤差計算を含む機械学習を行う。そして、ステップS8において、生成部15は、ステップS7における機械学習に基づきニューラルネットワークNNを更新(生成)する。
次に、図9を参照して、需要予測システム1における、ニューラルネットワークNNを含む単一の予測モデルを用いてサービスの需要の推定を行う推定方法について説明する。図9は、本実施形態の推定方法の処理内容を示すフローチャートである。
ステップS11において、特徴量取得部21は、需要の推定の対象期間に関連付けられたメッシュごとの特徴量を取得する。取得される特徴量は、少なくとも対象期間に関連付けられた過去の期間の各メッシュにおけるタクシーの需要数を含む。
ステップS12において、正規化部22は、ステップS11において特徴量取得部21により取得された特徴量をメッシュごとに正規化する。
ステップS13において、推定部23は、ステップS11において正規化部22により正規化された需要数を含む特徴量を、予測モデルのニューラルネットワークNNに入力する。続くステップS14において、推定部23は、タクシーの需要数を推定する。具体的には、推定部23は、ニューラルネットワークNNにより出力される需要数を取得する。
そして、ステップS15において、ステップS14において推定部23により推定された需要数を需要推定値として出力する。
次に、コンピュータを、本実施形態の需要予測システム1として機能させるための需要予測プログラムについて説明する。図10は、需要予測プログラムP1の構成を示す図である。
需要予測プログラムP1は、コンピュータに学習システム10を実現させるモジュールm11〜m15及びコンピュータに推定システム20を実現させるモジュールm21〜m24を含む。具体的には、需要予測プログラムP1は、需要予測システム1における需要予測処理を統括的に制御するメインモジュールm10、学習データ取得モジュールm11、学習データ正規化モジュールm12、サンプリングモジュールm13、ミニバッチ正規化モジュールm14及び生成モジュールm15、並びに特徴量取得モジュールm21、正規化モジュールm22、推定モジュールm23及び出力モジュールm24を備えて構成される。そして、各モジュールm11〜m15,m21〜m24により、需要予測システム1における学習データ取得部11、学習データ正規化部12、サンプリング部13、ミニバッチ正規化部14及び生成部15、並びに特徴量取得部21、正規化部22、推定部23及び出力部24のための各機能が実現される。なお、需要予測プログラムP1は、通信回線等の伝送媒体を介して伝送される態様であってもよいし、図10に示されるように、記録媒体D1に記憶される態様であってもよい。
以上説明した本実施形態の需要予測システム1における学習システム10では、学習用特徴量に含まれる需要数がメッシュごとに正規化された後にニューラルネットワークに入力される。これにより、メッシュごとの需要数の規模(スケール)の差異による特徴量の振る舞いの性質の違いが考慮されたニューラルネットワークが生成される。従って、誤差が低減された精度が高い予測が可能な単一の予測モデルが得られる。
また、本実施形態の需要予測システム1における推定システム20では、需要の推定の対象期間に関連付けられた特徴量に含まれる需要数が、メッシュごとに正規化された後にニューラルネットワークに入力される。これにより、メッシュごとの需要数の規模(スケール)の差異による特徴量の振る舞いの性質の違いが考慮された需要数が推定される。
また、本実施形態の予測モデル(学習済モデル)では、メッシュごとに正規化された需要数を含む特徴量がニューラルネットワークに入力される。これにより、メッシュごとの需要数の規模(スケール)の差異による特徴量の振る舞いの性質の違いが考慮された需要の予測値が出力される。
また、別の形態に係る学習システムでは、学習データ取得部は、各メッシュの学習用特徴量に関連付けられたサービスの需要の実績数である需要実績値を学習データとして取得し、生成部は、需要予測値及び学習データ正規化部において用いられた正規化係数により正規化された需要実績値を用いて、機械学習のための誤差計算を行うこととしてもよい。
ニューラルネットワークの生成のための機械学習において、正規化された需要予測値を用いて誤差計算(例えば、誤差逆伝搬による)を行うと、需要数が多いメッシュの出現数が少ないことに起因して、誤差が大きくなる。上記形態によれば、学習データの正規化に用いた正規化係数で変換された需要予測値が機械学習のための誤差計算に用いられるので、より高精度な予測が可能なニューラルネットワークが得られる。
また、別の形態に係る学習システムは、複数の学習用特徴量のうち所定数の学習用特徴量をミニバッチとしてサンプリングするサンプリング部と、サンプリング部によりサンプリングされた学習用特徴量をミニバッチごとに正規化するミニバッチ正規化部と、を更に備え、生成部は、ミニバッチ正規化部により正規化された学習用特徴量をニューラルネットワークに入力し、サンプリング部は、所定値以上の需要実績値に関連付けられた学習用特徴量をサンプリングすることとしてもよい。
上記形態によれば、機械学習によるニューラルネットワークの生成に際して、スケールが大きい需要実績値に関連付けられた学習用特徴量がニューラルネットワークに入力されるので、需要数のスケールが大きいメッシュに対する需要予測を高精度の行うことが可能な予測モデルを得ることができる。
また、別の形態に係る学習システムでは、生成部は、学習データ正規化部において学習用特徴量のメッシュごとの正規化に用いられた正規化係数を、ニューラルネットワークに入力して機械学習を行うこととしてもよい。
上記形態によれば、学習用特徴量のメッシュごとの正規化に用いられた正規化係数が機械学習のためにニューラルネットワークに入力されるので、正規化された特徴量の値の規模(スケール)のメッシュ間の差異による振る舞いの性質の違いが反映されたニューラルネットワークが生成される。
また、別の形態に係る学習システムでは、学習データ正規化部は、所定の同じ時期的属性に関連付けられた学習用特徴量ごとに正規化を行うこととしてもよい。
上記形態によれば、正規化された特徴量の値のスケールのメッシュ間及び時期的属性間の差異による当該特徴量の振る舞いの性質の違いが反映されたニューラルネットワークが生成される。
また、別の形態に係る学習システムでは、学習データ正規化部は、学習用特徴量における、特徴量の値の出現数の分布のメッシュ間の偏りに基づいて、当該特徴量に対する正規化の実施の要否を判定することとしてもよい。
上記形態によれば、特徴量の値の出現数の分布のメッシュ間の偏りが大きい場合に、当該特徴量に対するメッシュごとの正規化が誤差低減等に有効であるので、上記形態によれば、例えば、特徴量の値の出現数の分布のメッシュ間の偏りが大きい場合に正規化が実施されるように構成することにより、高精度な予測が可能なニューラルネットワークの生成に適切に寄与する正規化の処理を実施することが可能となる。
また、別の形態に係る学習システムでは、サービスの需要予測は、タクシーの需要予測であり、学習用特徴量は、各期間の各メッシュにおける人口に関する情報及び天気に関する情報のうちの少なくともいずれかを含むこととしてもよい。
上記形態によれば、タクシーの需要予測において、メッシュごとの人口に関する情報及び天気に関する情報の少なくともいずれかを含む学習用特徴量により機械学習が行われるので、人口または天気が考慮された、より高精度な予測が可能な予測モデルを得ることが可能となる。
また、別の形態に係る推定システムでは、出力部は、正規化部において用いられた正規化係数により逆変換された需要推定値を出力することとしてもよい。
上記形態によれば、正規化された値の入力に応じた需要数の値がニューラルネットワークにより出力されるので、正規化に用いられた正規化係数により出力された値を逆変換することにより、適切な需要推定値が出力される。
以上、本実施形態について詳細に説明したが、当業者にとっては、本実施形態が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本実施形態は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本実施形態に対して何ら制限的な意味を有するものではない。
本明細書で説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。
情報等は、上位レイヤ(または下位レイヤ)から下位レイヤ(または上位レイヤ)へ出力され得る。複数のネットワークノードを介して入出力されてもよい。
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報等は、上書き、更新、または追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:trueまたはfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
本明細書で説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
また、ソフトウェア、命令などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線(DSL)などの有線技術及び/又は赤外線、無線及びマイクロ波などの無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれる。
本明細書で説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
なお、本明細書で説明した用語及び/又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。
本明細書で使用する「システム」および「ネットワーク」という用語は、互換的に使用される。
また、本明細書で説明した情報、パラメータなどは、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。
本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
本明細書で「第1の」、「第2の」などの呼称を使用した場合においては、その要素へのいかなる参照も、それらの要素の量または順序を全般的に限定するものではない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本明細書で使用され得る。したがって、第1および第2の要素への参照は、2つの要素のみがそこで採用され得ること、または何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。
「含む(include)」、「含んでいる(including)」、およびそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「または(or)」は、排他的論理和ではないことが意図される。
本明細書において、文脈または技術的に明らかに1つのみしか存在しない装置である場合以外は、複数の装置をも含むものとする。
本開示の全体において、文脈から明らかに単数を示したものではなければ、複数のものを含むものとする。
1…需要予測システム、10…学習システム、11…学習データ取得部、12…学習データ正規化部、13…サンプリング部、14…ミニバッチ正規化部、15…生成部、20…推定システム、21…特徴量取得部、22…正規化部、23…推定部、24…出力部、30…特徴量記憶部、40…予測モデル記憶部、m10…メインモジュール、m11…学習データ取得モジュール、m12…学習データ正規化モジュール、m13…サンプリングモジュール、m14…ミニバッチ正規化モジュール、m15…生成モジュール、m21…特徴量取得モジュール、m22…正規化モジュール、m23…推定モジュール、m24…出力モジュール、NN…ニューラルネットワーク、P1…需要予測プログラム。

Claims (10)

  1. 機械学習により生成されるニューラルネットワークを含む単一の予測モデルにより、所定の地理的範囲を表すメッシュごとの所定のサービスの需要予測を行うための需要予測システムにおける、前記ニューラルネットワークを機械学習により生成する学習システムであって、
    過去の期間に関連づけられた前記メッシュごとの学習用特徴量であって、少なくとも各期間の各メッシュにおける前記サービスの需要数を特徴量として含む学習用特徴量を学習データとして取得する学習データ取得部と、
    前記学習データに含まれる前記学習用特徴量を、前記メッシュごとに正規化する学習データ正規化部であって、前記学習用特徴量のうちの少なくとも前記需要数を正規化する、学習データ正規化部と、
    前記学習データ正規化部により正規化された前記需要数を含む前記学習用特徴量を前記ニューラルネットワークに入力して得られる、前記サービスの需要の予測数である需要予測値に基づいて機械学習を行い、前記ニューラルネットワークを生成する生成部と、
    を備える学習システム。
  2. 前記学習データ取得部は、各メッシュの前記学習用特徴量に関連付けられた前記サービスの需要の実績数である需要実績値を前記学習データとして取得し、
    前記生成部は、前記需要予測値及び前記学習データ正規化部において用いられた正規化係数により正規化された前記需要実績値を用いて、前記機械学習のための誤差計算を行う、請求項1に記載の学習システム。
  3. 複数の前記学習用特徴量のうち所定数の前記学習用特徴量をミニバッチとしてサンプリングするサンプリング部と、
    前記サンプリング部によりサンプリングされた前記学習用特徴量を前記ミニバッチごとに正規化するミニバッチ正規化部と、を更に備え、
    前記生成部は、前記ミニバッチ正規化部により正規化された前記学習用特徴量を前記ニューラルネットワークに入力し、
    前記サンプリング部は、所定値以上の前記需要実績値に関連付けられた前記学習用特徴量をサンプリングする、
    請求項2に記載の学習システム。
  4. 前記生成部は、前記学習データ正規化部において前記学習用特徴量のメッシュごとの正規化に用いられた正規化係数を、前記ニューラルネットワークに入力して前記機械学習を行う、
    請求項1〜3のいずれか一項に記載の学習システム。
  5. 前記学習データ正規化部は、所定の同じ時期的属性に関連付けられた学習用特徴量ごとに正規化を行う、
    請求項1〜4のいずれか一項に記載の学習システム。
  6. 前記学習データ正規化部は、前記学習用特徴量における、特徴量の値の出現数の分布のメッシュ間の偏りに基づいて、当該特徴量に対する正規化の実施の要否を判定する、
    請求項1〜5のいずれか一項に記載の学習システム。
  7. 前記サービスの需要予測は、タクシーの需要予測であり、
    前記学習用特徴量は、各期間の各メッシュにおける人口に関する情報及び天気に関する情報のうちの少なくともいずれかを含む、
    請求項1〜6のいずれか一項に記載の学習システム。
  8. 機械学習により生成されるニューラルネットワークを含む単一の予測モデルにより、所定の地理的範囲を表すメッシュごとの所定のサービスの需要予測を行うための需要予測システムにおける、前記サービスの需要の推定を行う推定システムであって、
    需要の推定の対象期間に関連付けられた前記メッシュごとの特徴量であって、少なくとも前記対象期間に関連付けられた期間の前記メッシュにおける前記サービスの需要数を含む、特徴量を取得する特徴量取得部と、
    前記特徴量取得部により取得された前記特徴量を、前記メッシュごとに正規化する正規化部であって、前記特徴量のうちの少なくとも前記需要数を正規化する、正規化部と、
    前記正規化部により正規化された前記需要数を含む前記特徴量を前記予測モデルの前記ニューラルネットワークに入力して、前記対象期間における前記サービスの需要数を推定する推定部と、
    前記推定部により推定された需要数を需要推定値として出力する出力部と、
    を備え、
    前記予測モデルの前記ニューラルネットワークは、過去の期間に関連づけられた前記メッシュごとの特徴量であって、少なくとも前記メッシュごとに正規化された各期間の各メッシュにおける前記サービスの需要数を含む特徴量を入力値として、前記期間に関連付けられた所定の対象期間における前記サービスの前記需要数を出力する、
    推定システム。
  9. 前記出力部は、前記正規化部において用いられた正規化係数により逆変換された需要推定値を出力する、
    請求項8に記載の推定システム。
  10. 所定の地理的範囲を表すメッシュごとの所定のサービスの需要予測を行うための、機械学習により生成されるニューラルネットワークを含む学習済モデルであって、
    前記ニューラルネットワークは、過去の期間に関連づけられた前記メッシュごとの特徴量であって、少なくとも前記メッシュごとに正規化された各期間の各メッシュにおける前記サービスの需要数を含む特徴量を入力値として、前記期間に関連付けられた所定の対象期間における前記サービスの需要の予測数である需要予測値を出力する、学習済モデル。
JP2020500333A 2018-02-14 2019-01-16 学習システム、推定システム及び学習済モデル Active JP6946542B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018024331 2018-02-14
JP2018024331 2018-02-14
PCT/JP2019/001119 WO2019159585A1 (ja) 2018-02-14 2019-01-16 学習システム、推定システム及び学習済モデル

Publications (2)

Publication Number Publication Date
JPWO2019159585A1 JPWO2019159585A1 (ja) 2020-12-03
JP6946542B2 true JP6946542B2 (ja) 2021-10-06

Family

ID=67618676

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020500333A Active JP6946542B2 (ja) 2018-02-14 2019-01-16 学習システム、推定システム及び学習済モデル

Country Status (3)

Country Link
US (1) US11989654B2 (ja)
JP (1) JP6946542B2 (ja)
WO (1) WO2019159585A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019232693A1 (en) * 2018-06-05 2019-12-12 Beijing Didi Infinity Technology And Development Co., Ltd. System and method for ride order dispatching
WO2024070126A1 (ja) * 2022-09-27 2024-04-04 株式会社Nttドコモ 需要予測モデル生成装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0736854A (ja) * 1993-07-21 1995-02-07 Tokyu Constr Co Ltd 需要予測装置及び方法
JP5037927B2 (ja) * 2006-09-08 2012-10-03 キヤノンItソリューションズ株式会社 情報処理装置、情報処理方法、プログラム、及び記録媒体
JP5129799B2 (ja) * 2009-11-24 2013-01-30 株式会社エヌ・ティ・ティ・ドコモ 需要予測装置及び需要予測方法
JP2016075972A (ja) * 2014-10-02 2016-05-12 シャープ株式会社 端末装置及びプログラム
US10936947B1 (en) * 2017-01-26 2021-03-02 Amazon Technologies, Inc. Recurrent neural network-based artificial intelligence system for time series predictions
CN107103758B (zh) * 2017-06-08 2019-06-21 厦门大学 一种基于深度学习的城市区域交通流量预测方法
US10719899B1 (en) * 2017-08-31 2020-07-21 Steve Dabell Method and apparatus for utilizing estimated patrol properties and historic patrol records
US11526798B2 (en) * 2017-11-14 2022-12-13 International Business Machines Corporation Parking availability predictor

Also Published As

Publication number Publication date
WO2019159585A1 (ja) 2019-08-22
US11989654B2 (en) 2024-05-21
JPWO2019159585A1 (ja) 2020-12-03
US20210049472A1 (en) 2021-02-18

Similar Documents

Publication Publication Date Title
JP6802916B2 (ja) 需要予測装置
CN109543909B (zh) 车辆案件数量的预测方法、装置和计算机设备
US7664671B2 (en) Methods and systems for profile-based forecasting with dynamic profile selection
CN114285728B (zh) 一种预测模型训练方法、流量预测方法、装置及存储介质
CN112269930B (zh) 建立区域热度预测模型、区域热度预测的方法及装置
US20190163826A1 (en) Parking search time estimation using cognitive analytics
JP6946542B2 (ja) 学習システム、推定システム及び学習済モデル
US11556447B2 (en) Usage prediction method and storage medium
US20220156295A1 (en) Profile generation device
WO2023134188A1 (zh) 指标确定方法、装置、电子设备和计算机可读介质
CN110889725A (zh) 在线广告ctr预估方法、装置、设备及存储介质
CN112785111A (zh) 生产效率预测方法、装置、存储介质与电子设备
US20230214716A1 (en) Learning device
WO2020230735A1 (ja) 需要予測装置
CN113329128B (zh) 话务数据预测方法及装置、电子设备、存储介质
JP7500504B2 (ja) 情報処理装置、情報処理方法およびプログラム
CN111767290B (zh) 用于更新用户画像的方法和装置
CN113407102A (zh) 一种虚拟按键的展示方法、装置、系统和存储介质
CN113723436A (zh) 数据的处理方法、装置、计算机设备和存储介质
WO2023037766A1 (ja) サービス需要ポテンシャル予測装置
CN114091625B (zh) 一种基于故障代码序列的车辆零件失效预测方法及系统
WO2022044811A1 (ja) レコメンド装置
WO2024047949A1 (ja) 滞在poi推定装置
EP4401013A1 (en) Training device, prediction device, training prediction device, program, training method, prediction method, and training prediction method
Sadeghian et al. Testing feasibility of using a hidden Markov model on predicting human mobility based on GPS tracking data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200512

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210525

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210824

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210915

R150 Certificate of patent or registration of utility model

Ref document number: 6946542

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250