CN114072835B - 费用预测方法及费用预测数据系统 - Google Patents

费用预测方法及费用预测数据系统 Download PDF

Info

Publication number
CN114072835B
CN114072835B CN202080047858.7A CN202080047858A CN114072835B CN 114072835 B CN114072835 B CN 114072835B CN 202080047858 A CN202080047858 A CN 202080047858A CN 114072835 B CN114072835 B CN 114072835B
Authority
CN
China
Prior art keywords
prediction
term
data
long
cost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080047858.7A
Other languages
English (en)
Other versions
CN114072835A (zh
Inventor
仇学恒
李文橦
王晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Grabtaxi Holdings Pte Ltd
Original Assignee
Grabtaxi Holdings Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Grabtaxi Holdings Pte Ltd filed Critical Grabtaxi Holdings Pte Ltd
Publication of CN114072835A publication Critical patent/CN114072835A/zh
Application granted granted Critical
Publication of CN114072835B publication Critical patent/CN114072835B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本披露内容的一个方面涉及一种费用预测数据系统以及一种预测运输服务的费用的方法,该方法包括:在服务器处从数字设备接收包括服务时间的请求;在该服务器处计算预测费用;以及将该预测费用从该服务器发送到该数字设备。计算该预测费用使用该服务时间、长期波动预测和短期波动预测作为费用估计器中的输入。该长期波动预测可以使用长期波动预测器(LTSP)来计算,并且该短期波动预测可以使用短期波动预测器(STSP)来计算。该LTSP使用历史数据,并且该STSP使用该历史数据以及可能比该历史数据更新的近期数据。其他方面涉及波动预测系统、方法以及包括用于执行这些方法中的任何方法的指令的计算机产品。

Description

费用预测方法及费用预测数据系统
技术领域
本披露内容的各方面涉及预测例如运输服务的波动和/或费用的方法。本披露内容的其他方面涉及计算机产品。本披露内容的其他方面涉及波动和/或费用预测数据系统。
背景技术
在打车业务中,准确估计乘客前往特定位置的费用对于服务乘客并增强他们对服务的信心至关重要。一种简单的方法是假设未来的费用和波动分布与其历史分布相同或非常接近,并且在地理哈希到地理哈希对级别复制旧数据以直接提供服务。然而,一个主要的缺点是这种简单的方法容易出错且不准确。另一个困难是以很小的时间间隔存储地理哈希对键值(Key-Value)特征需要大量的存储空间。因此,需要提供一种解决上述问题的改进的费用和/或波动估计方法。
发明内容
本披露内容的一个方面涉及一种预测运输服务的费用的方法。该方法可以包括在服务器处例如从数字设备接收包括服务时间的请求。该服务器可以是分布式服务器,其例如包括多于一个物理服务器。该方法可以进一步包括在该服务器处计算预测费用。该方法可以进一步将该预测费用从该服务器发送到该数字设备。计算该预测费用可以使用该服务时间、长期波动预测和短期波动预测作为费用估计器中的输入。
该长期波动预测可以使用长期波动预测器(LTSP)来计算,并且该短期波动预测可以使用短期波动预测器(STSP)来计算。该LTSP使用历史数据。该短期波动预测器可以使用近期数据,并且可以进一步使用以下各项中的一项:该历史数据和该长期波动预测。该近期数据可能比该历史数据更新。
本披露内容的另一个方面涉及一种预测运输服务的波动的方法。该方法可以包括在服务器处接收包括服务时间的请求。该方法可以进一步包括基于使用长期波动预测器计算的长期波动预测、使用短期波动预测器计算的短期波动预测、或它们的组合来在该服务器处提供预测波动。该方法可以进一步包括计算该长期波动预测。该方法可以进一步包括计算该短期波动预测。该LTSP可以是用历史数据训练的经训练长短期记忆(LSTM)神经网络。该STSP可以是用包括比该历史数据更新的近期数据的训练数据训练的经训练LSTM神经网络,其中,该训练数据可选地进一步包括该历史数据和/或该长期波动预测。
本披露内容的另一个方面涉及一种包括服务器的费用预测数据系统。该服务器可以被配置为例如从数字设备接收包括服务时间的请求。该服务器可以包括用于(例如,被配置为)基于历史数据计算长期波动预测的LTSP。该服务器可以包括用于(例如,被配置为)基于可能比该历史数据更新的近期数据计算短期波动预测的STSP。该服务器可以包括费用估计器,该费用估计器被配置为基于该服务时间以及以下各项中的至少一项来计算预测费用:该长期波动预测、该短期波动预测、该预测波动或它们的组合。该服务器可以被配置为将该预测费用发送到该数字设备。该服务器可以是分布式服务器,其例如包括多于一个物理服务器、或者一个或多个计算机系统。
本披露内容的另一个方面涉及一种用于运输服务的波动预测数据系统。该波动预测数据系统可以包括被配置为接收包括服务时间的请求的服务器。服务器可以进一步被配置为提供预测波动。该预测波动可能是基于使用LTSP计算的长期波动预测;使用STSP计算的短期波动预测;或它们的组合。该LTSP可以包括用历史数据训练的第一经训练LSTM神经网络。该STSP可以包括用包括比该历史数据更新的近期数据的训练数据训练的第二经训练LSTM神经网络,其中,该训练数据可选地进一步包括该历史数据和/或该长期波动预测。
根据各种实施例,该近期数据可以具有比该历史数据更高的时间分辨率。
根据各种实施例,该近期数据可以包括来自从当前时间起经过的预定时间段内完成的交易的数据。
根据各种实施例,来自交易的数据可以是从实时交易数据流中获得的。
根据各种实施例,该预定时间段具有从2小时到24小时、优选地从5小时到8小时中选择的持续时间。
根据各种实施例,该长期波动预测可以存储在可能以规律的间隔更新的长期波动数据库中。
根据各种实施例,该规律的间隔可以等于或大于一天。
根据各种实施例,该更新可以包括计算多个规律的间隔(例如,7天)内的长期波动预测。
根据各种实施例,该多个规律的间隔可以按重复周期分组,例如一周或一个月。
根据各种实施例,近期数据可以以时间序列的形式被处理,并且可以被添加到该历史数据中。
根据各种实施例,该时间序列的数据点的时间间隔可以为至少一分钟,例如至少10分钟。
根据各种实施例,计算该预测费用可以进一步使用以下各项中的至少一项作为该费用估计器中的输入:服务时间、行驶速度、估计行驶持续时间、路线距离、上车位置、下车位置、交通工具类型、天气、事件。
根据各种实施例,该费用估计器可以包括分位数回归神经网络。
根据各种实施例,该预测费用、该长期波动预测和该短期波动预测中的每一者都可以是针对相同的地理哈希(例如,上车位置的地理哈希(geohash))提供(例如,计算)的。
根据各种实施例,该STSP可以包括经训练长短期记忆神经网络。
根据各种实施例,该LTSP可以包括经训练长短期记忆神经网络。
根据各种实施例,该历史数据可以存储在第一存储器中,并且该近期数据可以存储在第二存储器中,可选地,其中,该第一存储器和该第二存储器具有不同的类型。
本披露内容的另一个方面涉及一种计算机产品,该计算机产品包括用于执行根据各种实施例的预测费用的方法和/或预测费用的波动的方法的指令。
本披露内容的另一个方面涉及一种用于按照根据各种实施例的预测费用的方法来预测费用的费用预测数据系统。
本披露内容的另一个方面涉及一种用于按照根据各种实施例的预测费用的方法来预测波动的波动预测数据系统。
附图说明
当结合非限制性示例和附图考虑时,参考具体实施方式将更好地理解本发明,在附图中:
-图1A示出了根据一些实施例的费用预测数据系统100A的简图;
-图1B示出了根据一些实施例的费用预测数据系统100B的简图;
-图2示出了根据各种实施例的方法1000的流程图;
-图3A示出了用于说明可以如何更新长期波动数据库的方法2000的流程图;
-图3B示出了长期波动数据库中的长期波动数据的示意图。
-图4示出了用于说明可以如何更新短期波动数据库的方法3000的流程图;
-图5示出了作为图4的方法3000的变体的方法4000的流程图;以及
-图6示出了作为图5的方法4000的变体的方法5000的流程图;
-图7A示出了具有原始服务请求数据的示例的表格。
-图7B示出了具有作为近期数据的示例的波动数据的表格。
-图8示出了示例性计算机系统6000的架构,其可以用于实施根据各种实施例的任何系统或根据各种实施例的任何方法。
具体实施方式
以下具体实施方式参考了附图,附图通过展示的方式示出了可以实践本披露内容的具体细节和实施例。足够详细地描述了这些实施例,以使本领域技术人员能够实践本披露内容。可以利用其他实施例并且可以在不脱离本披露内容的范围的情况下进行结构改变和逻辑改变。各种实施例不一定是相互排斥的,因为一些实施例可以与一个或多个其他实施例组合以形成新的实施例。
在系统或方法中的一者的上下文中描述的实施例对于其他系统或方法是类似有效的。类似地,在系统的上下文中描述的实施例对于方法是类似有效的,反之亦然。
在预测费用的方法的上下文中描述的实施例对于预测波动的方法是类似有效的,反之亦然。类似地,在费用预测数据系统的上下文中描述的实施例对于波动预测数据系统是类似有效的,反之亦然。
在实施例的上下文中描述的特征即使未在其他实施例中明确地描述也可以相应地适用于这些其他实施例。此外,如针对实施例的上下文中的特征所描述的添加和/或组合和/或替代可以相应地适用于其他实施例中的相同或类似的特征。
如在本文和在各种实施例的上下文中所使用的,针对特征或元素所使用的冠词“一(a)”、“一个(an)”和“该(the)”包括对一个或多个特征或元素的提及。
如在本文和在各种实施例的上下文中所使用的,术语“和/或(and/or)”包括一个或多个相关联所列项中的任何和所有组合。
如在本文和在各种实施例的上下文中所使用的,表述“服务时间”可以意指上车时间或下车时间,例如,其可以意指乘客希望在上车位置上车的服务时间、或者乘客希望在下车位置下车的服务时间。
如在本文和在各种实施例的上下文中所使用的,“运输服务”可以包括打车服务、交通工具租赁服务、食品配送服务、包裹配送服务以及需要运输的其他服务。
根据各种实施例,可以针对地理哈希预测费用和/或波动,因此对费用或波动的请求可以包括地理哈希。地理哈希可以指示服务的上车位置。
如在本文和在各种实施例的上下文中所使用的,表述“预测波动”可以意指基于使用长期波动预测器计算的长期波动预测、使用短期波动预测器计算的短期波动预测、或它们的组合而计算的波动。例如,预测波动可以选自长期波动预测或短期波动预测之一。
如在本文和在各种实施例的上下文中所使用的,与LSTM结合使用的“第二”和“第一”用于区分LSTM,而非限制。例如,可以在不需要“第一LSTM”的情况下提供“第二LSTM”。
已发现,长期和短期波动和/或费用分布两者均可以用于获得更准确的费用估计。
图1A示出了包括后端系统(比如服务器200、第一存储器300和第二存储器400)的费用预测数据系统100A的简图。
根据各种实施例,第一存储器400可以存储近期数据410。第一存储器和第二存储器可以具有不同的类型。例如,第一存储器300可以包括或者是例如非易失性存储器,第二存储器400可以包括或者是例如易失性存储器。比如历史数据310或近期数据410等数据可以经由通信接口从相应的存储器传输到服务器200。例如,可以通过通信接口经由JavaScript对象表示法(JSON)请求来获取数据。
根据各种实施例,近期数据比历史数据310更新。根据各种实施例,近期数据410可以包括来自从当前时间起经过的预定时间段Δt1内完成的交易的数据。来自交易的数据可以是从实时交易数据流中获得的。预定时间段Δt1可以具有从2小时到24小时、优选地从5小时到8小时中选择的持续时间。因此,近期数据410可以是或者可以包括实时数据。例如,当预定时间段Δt1选择为5小时时,近期数据包括来自在最近5小时内完成的交易的数据。
在一些实施例中,实时数据可以由存储器中的在线管道产生,然后可以被输出并存储在消息队列系统中,例如,该消息队列系统具有其自己的持久存储机制。
根据各种实施例,近期数据可以以时间序列的形式被处理,并且可以被添加到该历史数据中。该时间序列的数据点的时间间隔可以为至少一分钟,例如至少10分钟。在一些实施例中,历史数据可以由离线管道产生并且可以存储在持久性非易失性存储装置中。
根据各种实施例,该近期数据可以具有比该历史数据更高的时间分辨率。由于近期数据的较高时间分辨率,短期波动预测可能更准确,并且由于较低的时间分辨率,LTSP210的训练和长期波动预测的计算可能更快且更节能。例如,可以从1分钟到5分钟中选择较高的时间分辨率。例如,可以从5分钟到60分钟中选择较低的时间分辨率。
根据各种实施例,服务器200可以被配置为从数字设备50接收包括服务时间的请求10。服务器200可以包括LTSP 210并且可以进一步包括STSP 220。LTSP 210可以被配置为基于历史数据310计算长期波动预测。STSP 220可以被配置为基于近期数据410计算短期波动预测。请求10可以包括地理哈希。
根据一些实施例,当LTSP 210从费用估计器240接收到请求时,LTSP 210将计算出的长期波动预测发送到费用估计器240。当STSP 220从费用估计器240接收到请求时,STSP220将计算出的长期波动预测发送到费用估计器240。根据一些实施例,LTSP 210可以经由调度器230从费用估计器240接收请求。根据一些实施例,STSP 220可以经由调度器230从费用估计器240接收请求。计算出的长期波动预测和计算出的长期波动预测中的每一者可以针对例如与请求10一起接收的地理哈希。
根据各种实施例,服务器200可以进一步包括费用估计器240,该费用估计器被配置为基于服务时间以及以下各项之一或两者来计算预测费用20:如由LTSP 210确定的长期波动预测以及如由STSP 220确定的短期波动预测。费用估计器还可以基于其他数据来计算预测费用20,该其他数据比如是以下各项中的一项或多项:服务时间、行驶速度、估计行驶持续时间、路线距离、上车位置、下车位置、交通工具类型、天气、事件。当接收到请求10时,费用估计器240可以向以下中的一者或两者发送基于服务时间的波动预测请求:LTSP 210、STSP 220。在一些实施例中,费用估计器240可以向调度器230发送波动预测请求。该请求可以包括服务时间。调度器230可以基于服务时间决定是否向以下中的一者或两者请求波动预测:LTSP 210、STSP 220。在一些实施例中,调度器230可以在请求后接收如由LTSP 210确定的长期波动预测和/或如由STSP 220确定的短期波动预测,并将其发送到费用估计器240。
根据一些实施例,波动预测数据系统可以与图1A或图1B所示的系统相同,但没有费用估计器240。如果需要,例如对于运输服务费用估算,费用估计器240可以在服务器200和波动预测数据系统的外部(即,不包括在其内)。
在示例中,当请求10具有在时间tS1(未来)的服务时间(其在当前时间t现在加上预定时间段Δt1之前(例如,ts1<t现在+Δt1))时,费用估计器240可以从STSP 220请求短期波动预测,并且可以进一步从LTSP 210请求长期波动预测。在接收到计算出的短期波动预测和长期波动预测之后,费用估计器240可以基于短期波动预测和长期波动预测来计算预测费用。使用短期波动预测和长期波动预测两者可以提高费用估计的准确性。可替代地,在另一示例中,当请求10具有在时间tS2(未来)的服务时间(其在当前时间t现在加上预定时间段Δt1之后(例如,ts2>t现在+Δt1))时,费用估计器240可以从LTSP 210请求长期波动预测。在接收到所确定的长期波动预测之后,费用估计器240可以基于长期波动预测来计算预测费用。使用长期波动预测而不使用短期波动预测可以提高效率,例如通过提高速度和降低功耗。
在另一示例中,当请求10具有在时间tS3的服务时间(其在当前时间t现在加上预定时间段Δt2之前(例如,ts3<t现在+Δt2))时,费用估计器240可以从STSP 220请求短期波动预测,并且可以进一步从LTSP 210请求长期波动预测。在接收所确定的短期波动预测和长期波动预测之后,费用估计器240可以基于短期波动预测和长期波动预测来计算预测费用。使用短期波动预测和长期波动预测两者可以提高费用估计的准确性。可替代地,在另一示例中,当请求10具有在时间tS4的服务时间(其在当前时间t现在加上预定时间段Δt2之后(例如,ts4>t现在+Δt2))时,费用估计器240可以从STSP 220请求短期波动预测,并且可以基于短期波动预测而不基于长期波动预测来计算预测费用。使用短期波动预测而不使用长期波动预测可以提高效率,例如通过提高速度以及减少cpu和内存的利用率。
图1B示出了费用预测数据系统100B的简图,其可以与费用预测数据系统100A相同,除了STSP 220被配置为基于近期数据410和基于如由LTSP 210计算的长期波动预测来计算短期波动预测以外。STSP 220可以被配置为从LTSP 210接收长期波动预测,如图1B中由从LTSP 210指向STSP 220的箭头所指示。在一些实施例中,当请求10具有在时间tS3的服务时间(其在当前时间t现在加上预定时间段Δt2之前(例如,ts3<t现在+Δt2))时,费用估计器240可以从STSP 220请求短期波动预测。在STSP 220不仅基于近期数据410而且还基于长期波动预测来计算短期波动预测的实施例中,已经考虑了长期波动预测,并且费用估计器240无需从LTSP 210请求长期波动预测来计算费用。在接收到所确定的短期波动预测之后,费用估计器240可以基于短期波动预测来计算预测费用20。
根据各种实施例,预定时间段Δt1和预定时间段Δt2中的每一者可以独立地从2小时到24小时、优选地从5小时到8小时中选择。
根据各种实施例,LTSP 210可以包括用于基于历史数据310进行长期波动预测的第一长短期记忆(LSTM)神经网络,例如,可以用训练数据训练第一LSTM神经网络以基于历史数据提供长期波动预测。可以例如在第一预定义更新间隔向第一经训练LSTM神经网络连续地馈送历史数据。第一预定义更新间隔中的更新间隔可以从1分钟到200分钟中选择,例如更新间隔可以为15分钟。第一预定义更新间隔可以是有规律的(即,每个具有相同的时间间隔)。预测可以针对未来的一段时间进行,例如从1周到12个月中选择,比如1周。因此,对于每个更新间隔,可以针对未来的时间进行预测(例如,针对相同的地理哈希),从而提供滚动预测。未来的时间可以分割为多个时段,例如,这些时段中的每个时段从2小时分钟到12小时、或者从5分钟到20分钟中选择,例如15分钟。这些时段中的每个时段可以具有相同的间隔。可替代地或除了针对未来的一段时间执行预测之外,可以根据需要提供预测。例如,LSTM可以接收服务时间作为输入,并且针对服务时间计算长时间波动预测。根据需要预测可以节省存储空间。另一方面,针对未来的一段时间进行的预测可能相对更快,尤其是在需求较高的时候。
根据各种实施例,可以周期性地训练LTSP 210。训练可以是再训练,例如当LTSP210已经被训练至少一次时,并且使用额外的历史数据进行进一步的训练(本文中称为再训练),从而更新LTSP 210。再训练可以在每个更新间隔之后发生,包括历史数据,例如包括能获得历史数据的先前时期的历史数据。在每个更新间隔之后再训练可以提高预测的准确性,但可能对计算资源的要求更高。可替代地或另外地,再训练可以在更长的训练间隔之后发生,该间隔可以长于更新间隔,比如为12小时或24小时。这种更长的训练间隔对于LTSP210来说可能是足够的并且可能对计算资源的要求较低。在一些实施例中,例如,当利用再训练没有达到确定的较低损失阈值时,训练可以从LTSP 210的随机初始化的LSTM开始。本领域技术人员将理解,本文对“训练LTSP”及其变体的提及也指对LTSP的组件的训练,包括LTSP的LSTM。
根据各种实施例,STSP 220可以包括用于基于历史数据310进行短期波动预测预报的第二LSTM神经网络,例如,可以用训练数据训练第二LSTM神经网络以基于近期数据410提供短期波动预测预报。可以例如在第二预定义更新间隔中的每个更新间隔向第二经训练LSTM神经网络连续地馈送近期数据。第二预定义更新间隔中的更新间隔可以从1分钟到200分钟中选择,例如更新间隔可以为60分钟。第二预定义更新间隔可以是有规律的。预测可以针对未来的一段时间进行,例如从2小时到24小时、例如从5小时到8小时中选择,比如6小时。未来的一段时间也可以选择为预定时间段Δt1或预定时间段Δt2。因此,对于每个更新间隔,可以针对未来的时间进行预测(例如,针对相同的地理哈希),从而提供滚动预测。未来的时间可以分割为多个时段,例如,这些时段中的每个时段从2分钟到12小时、或者从5分钟到20分钟中选择,例如15分钟。这些时段中的每个时段可以具有相同的间隔。可替代地或除了针对未来的一段时间执行预测之外,可以根据需要提供预测。例如,LSTM可以接收服务时间作为输入,并且针对服务时间计算长时间波动预测。根据需要预测可以节省存储空间。另一方面,针对未来的一段时间进行的预测可能相对更快,尤其是在需求较高的时候。
根据各种实施例,可以周期性地训练STSP 220。训练可以是再训练,例如当STSP220已经被训练至少一次时,并且使用训练数据进行进一步的训练(本文中称为再训练),从而更新STSP 220。再训练可以在预报的每个更新间隔之后发生,包括训练数据,例如包括能获得训练数据的先前时期的训练数据。训练数据可以包括近期数据410。可选地,训练数据可以进一步包括长期波动预测。在每个更新间隔之后再训练可以提高预测的准确性,但可能对计算资源的要求更高。可替代地或另外地,再训练可以在更长的训练间隔之后发生,该间隔可以长于更新间隔,比如为12小时或24小时。这种更长的训练间隔对于STSP 220来说可能是足够的并且可能对计算资源的要求较低。在一些实施例中,例如,当利用再训练没有达到确定的较低损失阈值时,训练可以从STSP 220的随机初始化的LSTM开始。本领域技术人员将理解,本文对“训练STSP”及其变体的提及也指对STSP的组件的训练,包括STSP的LSTM。
图2示出了根据各种实施例的方法1000的流程图。在步骤1100中,例如由服务器200接收包括服务时间的请求。这种请求可能已由用户(例如,乘客)的数字设备50发送。该方法可以进一步包括在服务器处计算1200预测费用20。费用20可以基于服务时间以及以下各项中的一项或两项来计算:长期波动预测和短期波动预测。在一些实施例中,计算预测费用20使用服务时间、长期波动预测和短期波动预测作为费用估计器240中的输入。可以使用LTSP 210来计算长期波动预测,并且可以使用STSP 220来计算短期波动预测。该方法可以进一步包括将预测费用20从服务器200发送到数字设备50的步骤1300。在一个示例中,当在用户的app(例如,在数字设备上)发出请求以取得针对特定上车位置(例如,具有对应的地理哈希)在服务时间到达特定目的地的行程费用时,该请求被发送到费用估计器,该费用估计器计算预测费用并将预测费用发送到用户的app。
根据各种实施例,可以根据需要针对相同的地理哈希计算预测费用20、长期波动预测和短期波动预测中的每一者。
根据各种实施例,计算预测费用可以进一步使用以下各项中的一项或多项作为费用估计器中的输入:服务时间、行驶速度(例如,估计平均行驶速度)、估计行驶持续时间、路线距离、上车位置、下车位置、交通工具类型、天气、事件。因此,除了长期波动预测和/或短期波动预测之外,还可以基于以下各项中的一项或多项进一步计算预测费用:服务时间、行驶速度(例如,估计平均行驶速度)、估计行驶持续时间、路线距离、上车位置、下车位置、交通工具类型、天气、事件。
根据各种实施例,费用估计器240可以包括分位数回归神经网络。可以训练分位数回归神经网络。分位数回归神经网络可以是具有分位数回归损失的前馈神经网络。分位数是一组中的一部分观察值所低于的值。例如,针对分位数0.9的预测应该有90%的时间是过度预测的。即使对于具有非恒定方差或非正态分布的变量,基于分位数损失的回归也提供了合理的预测间隔,这非常适合于预测波动/费用范围。
根据各种实施例,STSP 220和/或LTSP 210中的每一者可以提供波动作为包括多个分位数水平的预测,这些分位数水平例如为40%、50%、60%、70%、80%、90%和95%,然后该预测可以用于费用预测。因此,当提供确定费用所需的其他信息(例如,行程长度)时,费用估计器可以计算包括多个分位数水平的费用预测。可以向用户提供包括多个分位数水平的这种费用预测(例如,作为数字设备50上显示的数字),以供用户决定接受/不接受提前预订。可替代地或另外地,可以将例如基于预定义的分位数(例如,在80%)、分布的众数、分布的中值或前述各项的组合而计算的确切费用提供给用户。
根据各种实施例,LTSP 210可以使用历史数据310。STSP 220可以使用长期波动预测和/或可能比历史数据310更新的近期数据410。在一些实施例中,STSP 220可以使用长期波动预测以及可能比历史数据310更新的近期数据410。
图3A示出了根据各种实施例的用于说明可以如何更新长期波动数据库的方法2000的流程图。图3B示出了长期波动数据库中的长期波动数据的示意图。图3B以长期波动为例,但也以短期波动数据库中的短期波动数据为例,其中分别修改了短期波动预测的时段、更新间隔和重复周期。在步骤2100中,使用当前时间t1的第一次迭代(IT1),可以例如由服务器200从第一存储器300取得历史数据310。在步骤2200中,LTSP可以针对未来的一段时间计算长期波动预测,例如针对未来的2周,如由“第1周”和“第2周”所示。在步骤2300中,可以用长期波动预测来更新长期波动数据库。可以例如在第一预定义更新间隔中的更新间隔(“更新间隔”)不断重复(2400)这些步骤。在图3B的示例中,第二次迭代IT2开始于当前时间t2,更新间隔为t2-t1。更新间隔可以与时段持续时间不同,或者出于说明目的,也可以与如图3B所示的相等。未来的一段时间可以是重复的周期,例如一周或多周、一个或多个月,或两者都是。重复的周期可以包括或被分割为多个时段,其中,这些时段可以是有规律的(即,每个时段具有相同的时间间隔,例如,“时段(slot)”)。
图4示出了根据各种实施例的用于说明可以如何更新短期波动数据库的方法3000的流程图。在步骤3100中,可以例如由服务器200从第二存储器400取得近期数据410。在步骤3200中,STSP可以针对未来的一段时间计算短期波动预测。在步骤3300中,可以用短期波动预测来更新短期波动数据库。可以例如在第二预定义更新间隔中的更新间隔之后不断重复(3400)这些步骤。更新间隔可以不同于或等于时段持续时间。
图5示出了根据各种实施例的图4的方法3000的变体。在方法4000中,作为使用近期数据而不使用历史数据的替代方案,使用近期数据和历史数据两者。更详细地,图5示出了用于说明可以如何更新短期波动数据库的方法4000的流程图。在步骤4100中,可以例如由服务器200从第二存储器400取得近期数据410。此外,可以例如由服务器200从第一存储器300取得历史数据310。在步骤4200中,可以基于近期数据410和历史数据310来针对未来的一段时间计算短期波动预测。在步骤4300中,可以用短期波动预测来更新短期波动数据库。可以例如在更新间隔之后不断重复(4400)这些步骤。
图6示出了根据各种实施例的图5的方法4000的变体。在方法5000中,作为使用近期数据和历史数据的替代方案,使用近期数据和长期波动数据两者。长期波动数据包括由LTSP计算出的长期波动数据。更详细地,图6示出了用于说明可以如何更新短期波动数据库的方法5000的流程图。在步骤5100中,可以例如由服务器200从第二存储器500取得近期数据510。此外,可以例如由服务器200取得长期波动数据。在步骤5200中,可以基于近期数据510和长期波动数据来针对未来的一段时间计算短期波动预测。在步骤5300中,可以用短期波动预测来更新短期波动数据库。可以例如在更新间隔之后不断重复(5400)这些步骤。
图7A和图7B示出了可以如何准备服务请求数据以用作近期数据和/或历史数据。图7A示出了具有原始服务请求数据的示例的表格。可选的“服务请求UID”列为每个服务请求提供唯一标识符(UID)。出于说明目的,图7A示出了服务请求1到5。可以例如以时间哈希(参见“时间哈希(TimeHash)”列)或时间戳的形式提供服务时间信息。从图7A中可以看到,出于说明目的,服务请求1到5具有范围从10:02到10:09的服务时间。此外,出于说明目的,图7A中的表格示出了将地理哈希指示为#1或#2的“地理哈希(GeoHash)”列,地理哈希可以是坐标、向量或另一种表示。地理哈希可以指示服务的上车位置。
图7B示出了具有作为针对单个地理哈希(例如,#1)的近期数据的示例的波动数据的表格,该波动数据表示为例如10分钟的时间箱(time bins),比如从10:01到10:10、从10:11到10:20等等,然而本披露内容不限于此。针对每个时间箱计算波动,例如作为具有在该时间箱内的时间的服务请求的总和。使用来自图7A的服务数据,可以看出在10:01到10:10的时间箱内,波动为4(如箭头所示)。波动数据可以用作近期数据和/或历史数据。
图8示出了根据各个实施例的可以在服务器200中使用的示例性计算机系统6000的架构。计算机系统6000包括总线610,通过该总线,一个或多个设备可以彼此进通信。在图8的示例中,以下设备被示出为连接到总线600:CPU 601;主存储器602,例如RAM;存储设备603,例如硬盘驱动器、固态驱动器、闪存驱动器;通信设备604,例如用于有线通信或无线通信,例如WiFi、USB、蓝牙;显示接口605和其他用户接口606,例如用于用户输入;然而,本披露内容不限于此,并且可以在计算机中包括更多或更少的设备,并且计算机和/或总线可以具有与所展示的架构不同的其他架构。根据各种实施例的计算机产品可以是被配置为执行根据各种实施例的方法的计算机系统6000。
本披露内容描述了用于费用和/或波动预测的方法和系统,这些方法和系统能够捕获通常具有季节性和长期趋势两者的大量时间序列因素。所披露的方法能够捕获短期趋势和长期趋势两者,以小的存储成本提供在线服务,同时产生相当准确的费用和/或波动估计。根据各种实施例的系统通过利用深度学习技术来使用混合费用和/或波动费用估计(例如,乘车费用)。
虽然已经参考特定实施例具体示出和描述了本披露内容,但是本领域技术人员应当理解,在不脱离如所附权利要求所限定的本发明的精神和范围的情况下,可以在其中进行形式和细节的各种变化。因此,本发明的范围由所附权利要求指示,并且因此旨在涵盖属于权利要求的等同物的含义和范围内的所有改变。

Claims (18)

1.一种预测运输服务的费用(20)的方法(1000),该方法包括:
在服务器(200)处接收(1100)包括服务时间的请求(10);以及
在该服务器处计算(1200)预测费用(20);
其中,计算该预测费用(20)使用该服务时间和短期波动预测作为费用估计器(240)中的输入,其中,计算该预测费用(20)进一步使用以下各项中的至少一项作为该费用估计器中的输入:行驶速度、估计行驶持续时间、路线距离、上车位置、下车位置、交通工具类型、天气、事件,
其中,长期波动预测是使用长期波动预测器LTSP(210)计算的,而该短期波动预测是使用短期波动预测器STSP(220)计算的,
其中,该LTSP(210)使用历史数据(310)来计算该长期波动预测,并且
该STSP(220)使用比该历史数据(310)更新的近期数据(410)以及该长期波动预测来计算该短期波动预测,
其中,该LTSP(210)是第一经训练LSTM神经网络,并且
该STSP(220)是第二经训练LSTM神经网络。
2.如权利要求1所述的方法(1000),进一步包括从该服务器(200)向数字设备(50)发送(1300)该预测费用(20)。
3.如权利要求1所述的方法(1000),其中,该近期数据(410)具有比该历史数据(310)更高的时间分辨率。
4.如权利要求1所述的方法(1000),其中,该近期数据(410)包括来自从当前时间起经过的预定时间段内完成的交易的数据,其中,来自交易的数据是从实时交易数据流中获得的。
5.如权利要求4所述的方法(1000),其中,该预定时间段具有从2小时到24小时中选择的持续时间。
6.如权利要求1所述的方法(1000),其中,该长期波动预测存储在以规律的间隔更新的长期波动数据库中。
7.如权利要求6所述的方法(1000),其中,该规律的间隔等于或大于一天。
8.如权利要求6所述的方法(1000),其中,该更新包括计算多个规律的间隔内的长期波动预测。
9.如权利要求8所述的方法(1000),其中,该多个规律的间隔按重复周期分组。
10.如权利要求1所述的方法(1000),其中,该近期数据(410)以时间序列的形式被处理,并且被添加到该历史数据(310)中。
11.如权利要求10所述的方法(1000),其中,该时间序列的数据点的时间间隔为至少一分钟。
12.如权利要求1所述的方法(1000),其中,该费用估计器(240)包括分位数回归神经网络。
13.如权利要求1所述的方法(1000),其中,该预测费用(20)、该长期波动预测和该短期波动预测中的每一者都是针对相同的地理哈希计算的。
14.如权利要求5所述的方法(1000),其中,该持续时间为从5小时到8小时中选择的。
15.如权利要求9所述的方法(1000),其中,所述重复周期包括一周或一个月。
16.如权利要求11所述的方法(1000),其中,所述数据点的时间间隔为至少10分钟。
17.一种费用预测数据系统(100A),包括服务器(200),
其中,该服务器(200)被配置为从数字设备(50)接收包括服务时间的请求(10),
其中,该服务器(200)包括:
长期波动预测器LTSP(210),用于基于历史数据(310)计算长期波动预测;
短期波动预测器STSP(220),用于根据比该历史数据(310)更新的近期数据(410)和长期波动预测计算短期波动预测;以及
费用估计器(240),该费用估计器被配置为基于该服务时间以及该短期波动预测来计算预测费用(20),其中,计算该预测费用(20)进一步使用以下各项中的至少一项作为该费用估计器中的输入:行驶速度、估计行驶持续时间、路线距离、上车位置、下车位置、交通工具类型、天气、事件,
其中,该服务器(200)被配置为将该预测费用(20)发送到该数字设备(50),以及
其中,该LTSP(210)是第一经训练LSTM神经网络,并且
该STSP(220)是第二经训练LSTM神经网络。
18.如权利要求17所述的费用预测数据系统(100A),其中,该历史数据(310)存储在第一存储器(300)中,并且该近期数据(410)存储在第二存储器(400)中,其中,该第一存储器(300)和该第二存储器(400)具有不同的类型。
CN202080047858.7A 2020-03-11 2020-03-11 费用预测方法及费用预测数据系统 Active CN114072835B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/SG2020/050124 WO2021183039A1 (en) 2020-03-11 2020-03-11 Method of predicting fare and fare prediction data system

Publications (2)

Publication Number Publication Date
CN114072835A CN114072835A (zh) 2022-02-18
CN114072835B true CN114072835B (zh) 2024-03-08

Family

ID=77670757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080047858.7A Active CN114072835B (zh) 2020-03-11 2020-03-11 费用预测方法及费用预测数据系统

Country Status (5)

Country Link
US (1) US20220414721A1 (zh)
CN (1) CN114072835B (zh)
SG (1) SG11202113325VA (zh)
TW (1) TW202143161A (zh)
WO (1) WO2021183039A1 (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778837A (zh) * 2015-04-14 2015-07-15 吉林大学 一种道路交通运行态势多时间尺度预测方法
CN108805348A (zh) * 2018-06-05 2018-11-13 北京京东金融科技控股有限公司 一种交叉口信号配时控制优化的方法和装置
CN109360097A (zh) * 2018-09-28 2019-02-19 中山大学 基于深度学习的股票预测方法、装置、设备及存储介质
CN109840633A (zh) * 2019-01-29 2019-06-04 合肥工业大学 光伏输出功率预测方法、系统和存储介质
CN109991685A (zh) * 2019-04-03 2019-07-09 北京市天元网络技术股份有限公司 一种基于多lstm模型融合的降水量预测方法以及装置
CN110543543A (zh) * 2019-09-10 2019-12-06 苏州大学 一种基于多粒度神经网络的用户移动行为预测方法及装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000038094A2 (en) * 1998-12-22 2000-06-29 Bios Group Lp A system and method for the analysis and prediction of economic markets
US7039559B2 (en) * 2003-03-10 2006-05-02 International Business Machines Corporation Methods and apparatus for performing adaptive and robust prediction
US8269774B2 (en) * 2004-03-31 2012-09-18 Trading Technologies International, Inc. Graphical display with integrated recent period zoom and historical period context data
GB0613192D0 (en) * 2006-07-01 2006-08-09 Ibm Methods, apparatus and computer programs for managing persistence
US7953544B2 (en) * 2007-01-24 2011-05-31 International Business Machines Corporation Method and structure for vehicular traffic prediction with link interactions
US20120303412A1 (en) * 2010-11-24 2012-11-29 Oren Etzioni Price and model prediction system and method
US20150134379A1 (en) * 2013-11-14 2015-05-14 International Business Machines Corporation Singularity of Presence
WO2016122659A1 (en) * 2015-01-30 2016-08-04 Hitachi, Ltd. Performance monitoring at edge of communication networks
WO2016168379A1 (en) * 2015-04-13 2016-10-20 Uber Technologies, Inc. Fare determination system for on-demand transport arrangement service
CN108288096B (zh) * 2017-01-10 2020-08-21 北京嘀嘀无限科技发展有限公司 用于估算行程时间、模型训练的方法及装置
WO2019236851A1 (en) * 2018-06-06 2019-12-12 The Joan and Irwin Jacobs Technion-Cornell Institute Telecommunications network traffic metrics evaluation and prediction
US11341435B2 (en) * 2018-06-29 2022-05-24 Lyft, Inc. Systems and methods for queueing in dynamic transportation networks
JP7253041B2 (ja) * 2018-08-31 2023-04-05 グラブタクシー ホールディングス プライベート リミテッド 輸送サービスプロバイダを管理する方法、当該方法を実施するための命令を含むコンピュータプログラム、当該方法を実行させる命令を記憶する非一時記憶媒体、及び輸送サービスプロバイダを管理するための装置
CN109637196A (zh) * 2019-01-10 2019-04-16 南京航空航天大学 航路扇区交通概率密度预测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778837A (zh) * 2015-04-14 2015-07-15 吉林大学 一种道路交通运行态势多时间尺度预测方法
CN108805348A (zh) * 2018-06-05 2018-11-13 北京京东金融科技控股有限公司 一种交叉口信号配时控制优化的方法和装置
CN109360097A (zh) * 2018-09-28 2019-02-19 中山大学 基于深度学习的股票预测方法、装置、设备及存储介质
CN109840633A (zh) * 2019-01-29 2019-06-04 合肥工业大学 光伏输出功率预测方法、系统和存储介质
CN109991685A (zh) * 2019-04-03 2019-07-09 北京市天元网络技术股份有限公司 一种基于多lstm模型融合的降水量预测方法以及装置
CN110543543A (zh) * 2019-09-10 2019-12-06 苏州大学 一种基于多粒度神经网络的用户移动行为预测方法及装置

Also Published As

Publication number Publication date
SG11202113325VA (en) 2021-12-30
US20220414721A1 (en) 2022-12-29
CN114072835A (zh) 2022-02-18
WO2021183039A1 (en) 2021-09-16
TW202143161A (zh) 2021-11-16

Similar Documents

Publication Publication Date Title
US11514543B2 (en) System and method for ride order dispatching
US20230385978A1 (en) Driver supply control
CN107766994B (zh) 一种共享自行车调度方法与调度系统
US10192448B2 (en) Method to control vehicle fleets to deliver on-demand transportation services
US11507894B2 (en) System and method for ride order dispatching
US20180314998A1 (en) Resource Allocation in a Network System
WO2020122966A1 (en) System and method for ride order dispatching
US20200286106A1 (en) Optimization of on-demand transportation systems
WO2020248223A1 (en) Reinforcement learning method for driver incentives: generative adversarial network for driver-system interactions
CN111179506A (zh) 共享充电桩自助充电系统及共享充电桩的推荐方法
US11626021B2 (en) Systems and methods for dispatching shared rides through ride-hailing platform
AU2018217973A1 (en) Dynamic selection of geo-based service options in a network system
CN117561517A (zh) 用于在路线规划应用中预测交通状况的计算机实现的设备和方法
CN112579910A (zh) 信息处理方法、信息处理装置、存储介质和电子设备
US20220188711A1 (en) Systems and methods for managing dynamic transportation networks using simulated future scenarios
WO2022127517A1 (en) Hierarchical adaptive contextual bandits for resource-constrained recommendation
US20220327650A1 (en) Transportation bubbling at a ride-hailing platform and machine learning
CN114072835B (zh) 费用预测方法及费用预测数据系统
Han et al. Real-time rideshare driver supply values using online reinforcement learning
CN112819215A (zh) 推荐策略训练方法、装置、电子设备及可读存储介质
CN109034494B (zh) 公交调度方法
US20230138588A1 (en) Server and method of determining an advanced booking fee for an advance booking
Hsieh et al. Recommending taxi routes with an advance reservation–a multi-criteria route planner
WO2022006873A1 (en) Vehicle repositioning on mobility-on-demand platforms
WO2020248220A1 (en) Reinforcement learning method for incentive policy based on historic data trajectory construction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant