CN114386880A - 模型训练方法、需求确定方法及装置 - Google Patents
模型训练方法、需求确定方法及装置 Download PDFInfo
- Publication number
- CN114386880A CN114386880A CN202210282448.1A CN202210282448A CN114386880A CN 114386880 A CN114386880 A CN 114386880A CN 202210282448 A CN202210282448 A CN 202210282448A CN 114386880 A CN114386880 A CN 114386880A
- Authority
- CN
- China
- Prior art keywords
- time period
- historical time
- order quantity
- grid area
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 118
- 238000000034 method Methods 0.000 title claims abstract description 93
- 230000006835 compression Effects 0.000 claims abstract description 83
- 238000007906 compression Methods 0.000 claims abstract description 83
- 230000015654 memory Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 abstract description 15
- 238000013140 knowledge distillation Methods 0.000 abstract description 3
- 239000011159 matrix material Substances 0.000 description 18
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开提供了一种模型训练方法、需求确定方法及装置,其中,该模型训练方法包括:针对多个第一历史时间段中的每个第一历史时间段,获取在该第一历史时间段内各网格区域对的订单数量;将前预设数量个第一历史时间段内各网格区域对的订单数量输入至原始模型中,得到第一参考订单数量;将前预设数量个第一历史时间段内各网格区域对的订单数量输入至压缩模型,得到第二参考订单数量;基于第一参考订单数量、第二参考订单数量和最后一个第一历史时间段内各网格区域对的真实订单数量,对压缩模型进行训练。本公开实施例通过知识蒸馏对原始模型进行压缩,得到的压缩模型使用的参数量更少,能够减少订单数量确定过程中的计算资源消耗量。
Description
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种模型训练方法、需求确定方法及装置。
背景技术
随着互联网技术的发展,网络预约出行服务逐渐成为人们出行的重要选择。乘客可以按照出行计划,在网上下达从出发地到目的地的出行订单。为了更好地满足乘客的出行需求,可以依据以往的订单数量,确定各个起终点之间在未来一段时间内的订单数量,进而利用确定出来的订单数量,帮助调度人员为各个地点更合理地调度车辆。
但是通常情况下,对订单数量的确定过程需要消耗大量的计算资源,给计算设备带来较大的工作负担。
发明内容
本公开实施例至少提供一种模型训练方法、需求确定方法及装置。
第一方面,本公开实施例提供了一种模型训练方法,包括:
针对多个第一历史时间段中的每个第一历史时间段,获取在该第一历史时间段内,各网格区域对的订单数量;其中,所述网格区域对中包括作为订单起点的第一网格区域和作为订单终点的第二网格区域;
将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量输入至训练好的原始模型中,得到所述多个第一历史时间段的最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量;
将所述前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至待训练的压缩模型,得到所述多个第一历史时间段中最后一个第一历史时间段内,所述各网格区域对的第二参考订单数量;
基于所述第一参考订单数量、所述第二参考订单数量、和所述最后一个第一历史时间段内所述各网格区域对的真实订单数量,对所述待训练的压缩模型进行训练,得到训练好的压缩模型。
一种可选的实施方式中,所述基于所述第一参考订单数量、所述第二参考订单数量、和所述最后一个第一历史时间段内所述各网格区域对的真实订单数量,对所述待训练的压缩模型进行训练,得到训练好的压缩模型,包括:
基于所述第一参考订单数量和所述第二参考订单数量,确定第一损失信息;以及基于所述真实订单数量和所述第二参考订单数量,确定第二损失信息;
基于所述第一损失信息和所述第二损失信息,对所述待训练的压缩模型进行训练,得到训练好的压缩模型。
一种可选的实施方式中,将所述前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至训练好的原始模型中之前,所述方法还包括:
基于各个所述网格区域分别对应的位置信息,确定不同网格区域之间的位置信息相似度;
所述将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量输入至训练好的原始模型中,得到所述多个第一历史时间段的最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量,包括:
将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量,以及所述不同网格区域之间的位置信息相似度输入至训练好的原始模型中,得到最后一个第一历史时间段内所述各网格区域对的第一参考订单数量。
一种可选的实施方式中,将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量输入至训练好的原始模型中之前,所述方法还包括:
将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量作为原始模型输入数据,将所述最后一个第一历史时间段内,所述各网格区域对的真实订单数量作为标注数据,训练得到所述原始模型。
一种可选的实施方式中,所述多个第一历史时间段为多个连续的第一历史时间段;
所述将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量输入至预先训练好的原始模型中,得到所述多个第一历史时间段的最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量,包括:
将所述多个连续的第一历史时间段中,连续的前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至训练好的原始模型中,得到最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量。
一种可选的实施方式中,所述多个第一历史时间段为多个连续的第二历史时间段中的目标子时间段,其中不同的目标子时间段在所属第二历史时间段内的相对时间位置相同;
所述将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量输入至预先训练好的原始模型中,得到所述多个第一历史时间段的最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量,包括:
将多个所述目标子时间段中的前预设数量个目标子时间段内,所述各网格区域对的订单数量输入至预先训练好的原始模型中,得到多个所述目标子时间段的最后一个目标子时间段内,所述各网格区域对的第一参考订单数量。
一种可选的实施方式中,得到训练好的压缩模型之后,所述方法还包括:
针对在目标时间段之前的多个第二历史时间段中的每个第二历史时间段,获取在该第二历史时间段内,各网格区域对的订单数量;所述目标时间段为在所述多个第一历史时间段的最后一个第一历史时间段之后的时间段;
将在所述目标时间段之前的至少一个第二历史时间段内的所述各网格区域对的订单数量输入至训练得到的所述压缩模型中,得到所述目标时间段内所述各网格区域对的第三参考订单数量;
将所述第三参考订单数量与所述目标时间段内所述各网格区域对的真实订单数量进行对比,确定模型测试结果;
在所述模型测试结果不合格的情况下,更新训练样本,并基于更新的训练样本对所述压缩模型进行重新训练,或者,基于更新的训练样本对所述原始模型和所述压缩模型进行重新训练;
其中,更新后的所述训练样本包括在所述目标时间段内,以及在目标时间段之前的至少一个历史时间段内,所述各网格区域对的订单数量。
第二方面,本公开实施例还提供一种需求确定方法,包括:
获取在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量;
将所述在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量输入至基于第一方面,或第一方面中任一种可能的实施方式中所述的模型训练方法训练得到的所述压缩模型中,得到所述未来预设时间段内所述各网格区域对的参考订单数量。
一种可选的实施方式中,所述订单为出行服务订单;在得到所述未来预设时间段内所述各网格区域对的参考订单数量之后,所述方法还包括:
获取当前各个网格区域内出行服务对象的数量;
在获取的所述网格区域内出行服务对象的数量,与所述未来预设时间段内,以该网格区域作为订单起点的所述网格区域对的参考订单数量不匹配的情况下,对至少一个所述网格区域内的出行服务对象进行调度,以使得各网格区域内的出行服务对象的数量与所述未来预设时间段内所述各网格区域对的参考订单数量相匹配。
第三方面,本公开实施例还提供一种模型训练装置,包括:
第一获取模块,用于针对多个第一历史时间段中的每个第一历史时间段,获取在该第一历史时间段内,各网格区域对的订单数量;其中,所述网格区域对中包括作为订单起点的第一网格区域和作为订单终点的第二网格区域;
第一输入模块,用于将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量输入至训练好的原始模型中,得到所述多个第一历史时间段的最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量;
第二输入模块,用于将所述前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至待训练的压缩模型,得到所述多个第一历史时间段中最后一个第一历史时间段内,所述各网格区域对的第二参考订单数量;
第一训练模块,用于基于所述第一参考订单数量、所述第二参考订单数量、和所述最后一个第一历史时间段内所述各网格区域对的真实订单数量,对所述待训练的压缩模型进行训练,得到训练好的压缩模型。
第四方面,本公开实施例还提供一种需求确定装置,包括:
第一获取模块,用于获取在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量;
输入模块,用于将所述在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量输入至基于第一方面,或第一方面中任一种可能的实施方式中任一所述的模型训练方法训练得到的所述压缩模型中,得到所述未来预设时间段内所述各网格区域对的参考订单数量。
第五方面,本公开实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤,或执行上述第二方面,或第二方面中可能的实施方式中的步骤。
第六方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤,或执行上述第二方面,或第二方面中可能的实施方式中的步骤。
第七方面,本公开实施例还提供一种计算机程序产品,该计算机产品承载有程序代码,所述程序代码包括的指令可用于执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤,或执行上述第二方面,或第二方面中可能的实施方式中的步骤。
本公开实施例提供的模型训练方法,可以通过知识蒸馏的方法对训练好的原始模型进行压缩,得到训练好的压缩模型,即:利用训练好的原始模型得到的多个第一历史时间段的最后一个第一历史时间段内,各网格区域对的第一参考订单数量、待训练的压缩模型得到的多个第一历史时间段中最后一个第一历史时间段内,各网格区域对的第二参考订单数量、以及后一个第一历史时间段内各网格区域对的真实订单数量,得到训练好的压缩模型;通过这种方式训练好的压缩模型可以在一定程度上继承原始模型的学习效果,同时相比于原始模型,使用的模型参数量更少,因此在确定订单数量的过程中,能够减少计算资源的消耗量。
进一步,本公开实施例在确定第一参考订单数量的时候,在训练好的原始模型中还输入了不同网格区域之间的位置信息相似度,如此,可以将位置信息相似的网格区域对之间的订单数量形成参考,从而使得得到的第一参考订单数量更加准确。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种模型训练方法的流程图;
图2示出了本公开实施例所提供的另一种模型训练方法的流程图;
图3示出了本公开实施例所提供的一种需求确定方法的流程图;
图4示出了本公开实施例所提供的一种模型训练装置的示意图;
图5示出了本公开实施例所提供的一种需求确定装置的示意图;
图6示出了本公开实施例所提供的一种计算机设备的示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
在确定订单数量过程中,通常情况下,订单数量较为庞大,一般会增加服务器的个数,搭建稳定的分布式计算集群,但是仍然需要消耗大量的计算资源,给服务器等计算设备带来较大的工作负担。
基于此,本公开提供了一种模型训练方法,可以通过知识蒸馏的方法对训练好的原始模型进行压缩,得到训练好的压缩模型,即:利用训练好的原始模型得到的多个第一历史时间段的最后一个第一历史时间段内,各网格区域对的第一参考订单数量、待训练的压缩模型得到的多个第一历史时间段中最后一个第一历史时间段内,各网格区域对的第二参考订单数量、以及后一个第一历史时间段内各网格区域对的真实订单数量,得到训练好的压缩模型;通过这种方式训练好的压缩模型可以在一定程度上继承原始模型的学习效果,同时相比于原始模型,使用的模型参数量更少,因此在确定订单数量的过程中,能够减少计算资源的消耗量。
针对以上方案所存在的缺陷以及所提出的解决方案,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人在本公开过程中对本公开做出的贡献。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种模型训练方法进行详细介绍,本公开实施例所提供的模型训练方法的执行主体一般为具有一定计算能力的计算机设备。
本公开实施例提供的模型训练方法可以适用于使用出行服务对象(例如共享单车、共享电动车、代驾、货运、网约车等)下单的场景中。需要说明的是,本公开实施例中所涉及到的所有用户相关数据,比如订单信息(例如订单起点、订单终点)等,都是经用户授权之后使用的。
下面以执行主体为服务器为例对本公开实施例提供的模型训练方法加以说明。
参见图1所示,为本公开实施例提供的模型训练方法的流程图,所述方法包括S101~S104,其中:
S101:针对多个第一历史时间段中的每个第一历史时间段,获取在该第一历史时间段内,各网格区域对的订单数量;其中,所述网格区域对中包括作为订单起点的第一网格区域和作为订单终点的第二网格区域。
在本公开实施例中,网格区域可以是对目标区域进行划分后的子区域,在实际划分中,可以按照预设范围进行划分,例如,将某市区划分成多个3km x 3km的子区域。这里,可以将任一网格区域作为订单起点,并将多个网格区域中出订单起点以外的任一网格区域作为订单终点,因此,第一网格区域可以是多个网格区域中的任一网格区域,第二网格区域可以是多个网格区域中除第一网格区域以外的任一网格区域。示例性地,针对5个网格区域,组合后可以得到20个网格区域对。针对每个网格区域对,可以分别获取在第一历史时间段内,该各网格区域对的订单数量。其中,订单数量可以指下达的订单的数量,也可以指已完成的订单的数量。优选地,订单数量可以指下达的订单的数量。
多个第一历史时间段可以为多个连续的第一历史时间段。例如在过去的24小时,可以将每个小时作为一个第一历史时间段,即在过去的24小时,可以包括24个第一历史时间段。多个第一历史时间段也可以为多个连续的第二历史时间段中的目标子时间段,每个第二历史时间段中的目标子时间段可以为第二历史时间段中的任意一段时间段,其中,不同的目标子时间段在所属第二历史时间段内的相对时间位置相同。例如,在过去的一个月,可以将每天作为一个第二历史时间段,每个目标子时间段可以为每天中的15点至18点。
在本公开实施例中,可以预先获取起终点(Origin-Destination,OD)发单量需求时序数据。OD发单量需求时序数据中包括由多个第一历史时间段组成的目标历史时间段内,各网格区域对的订单数量。OD发单量需求时序数据可以用三维向量的形式表示。按照时间段对三维向量在时间维度进行切分,可以得到多个时间切片,每个时间切片可以对应一个二维矩阵,每个二维矩阵可以对应一个第一历史时间段内各网格区域对的订单数量。
例如,以目标历史时间段为过去的24小时为例,按照每个小时对过去24小时的OD发单量需求时序数据在时间维度进行划分,可以得到24个时间切片,第k(k为大于等于1,且小于等于24的正整数)个二维矩阵可以对应第k小时内各网格区域对的订单数量。在第k个二维矩阵中,第i(i为大于等于1,且小于等于网格区域的总数量的正整数)行第j(j为大于等于1,且小于等于网格区域的总数量的正整数)列的矩阵元素可以表示为:从第i个网络区域(订单起点)到第j个网络区域(订单终点)之间的订单数量。
在本公开实施例中,获取的多个第一历史时间段中的每个第一历史时间段内,各网格区域对的订单数量可以为真实的订单数量。
接下来,可以将获取的多个第一历史时间段中的每个第一历史时间段内,各网格区域对的订单数量可以作为输入,输入到训练好的原始模型中,得到多个第一历史时间段的最后一个第一历史时间段内,各网格区域对的第一参考订单数量,也即,根据训练好的原始模型得到多个第一历史时间段的最后一个第一历史时间段内,各网格区域对的预测订单数量,然后利用得到的第一参考订单数量,和获取的多个第一历史时间段中的每个第一历史时间段内,各网格区域对的订单数量对待训练的压缩模型进行训练,该过程将在下文进行详述。
获取的多个第一历史时间段中的每个第一历史时间段内,各网格区域对的订单数量还可以作为训练样本对待训练的原始模型进行训练,得到前述的训练好的原始模型。
其中,相对于后续的压缩模型而言,原始模型是一种复杂的神经网络模型,也就是原始模型的神经网络层数多于压缩模型的神经网络层数。具体地,原始模型可以为多层的长短期记忆(Long Short Term,LSTM)模型,或者LSTM结合图神经网络(Graph NeuralNetwork,GNN)的模型,或者其他深度学习模型。压缩模型可以为浅层的神经网络模型,具体地,压缩模型可以为1~2层的LSTM模型。
具体地,可以将多个第一历史时间段中的前预设数量个第一历史时间段内,各网格区域对的订单数量作为原始模型输入数据,以及,将多个第一历史时间段中的最后一个第一历史时间段内,各网格区域对的真实订单数量作为标注数据,对待训练的原始模型进行训练,得到训练好的原始模型。其中,对原始模型进行训练的过程可以是在将多个第一历史时间段中的前预设数量个第一历史时间段内,各网格区域对的订单数量输入至训练好的原始模型中之前完成的。
在对原始模型进行的训练过程中,可以按照多个第一历史时间段中各个第一历史时间段的时间顺序,选取前预设数量个第一历史时间段内,各网格区域对的订单数量作为原始模型输入数据。例如,第一历史时间段的总数量为10时,可以选取前9个第一历史时间段内,各网格区域对的订单数量作为原始模型输入数据。然后,可以将第10个第一历史时间段内,各网格区域对的真实订单数量作为标注数据。
这里,可以将多个第一历史时间段中的前预设数量个第一历史时间段内,各网格区域对的订单数量,和多个第一历史时间段中的最后一个第一历史时间段内,各网格区域对的真实订单数量作为一个训练样本,在实际中可以获取多个这样的训练样本,然后利用多个训练样本对原始模型进行训练,直至达到训练截止条件。训练截止条件例如可以为预设训练次数,也可以为多个第一历史时间段中的最后一个第一历史时间段内,各网格区域对的参考订单数量与标注数据的差值小于设定阈值。
通过训练得到的原始模型,能够基于在未来预设时间段之前的至少一个时间段内,各网格区域对的订单数量,确定未来预设时间段内各网格区域对的订单数量。在对原始模型进行训练的时候,原始模型输入数据和标注数据可以是以二维矩阵的形式输入至原始模型中的。也就是,通过训练得到的原始模型,能够基于二维矩阵的形式、未来预设时间段之前的至少一个时间段内,各网格区域对的订单数量,得到二维矩阵的形式、未来预设时间段内各网格区域对的订单数量。
在一种方式中,考虑到某些场景(例如货物运输场景)下的网格区域对的订单数量较少,在订单数量较少的情况下,将多个第一历史时间段中的前预设数量个第一历史时间段内,各网格区域对的订单数量,训练得到的原始模型,得到的第一参考订单数量准确度较低,因此,可以基于各个网格区域分别对应的位置信息,确定不同网格区域之间的位置信息相似度。接下来,可以将原始模型输入数据、不同网格区域之间的位置信息相似度,和标注数据共同输入至待训练的原始模型中,得到训练好的原始模型。
这里,各个网格区域分别对应的位置信息可以包括第一网格区域的位置信息和第二网格区域的位置信息。位置信息可以包括网格区域内包含的各个地点的位置信息,即兴趣点(Point of Interest,POI)信息,例如网格区域内包含的商场的位置信息、学校的位置信息等。其中,POI信息可以用二维矩阵的形式表示,在二维矩阵形式的POI信息中,第i行第j列表示为:第i个网格区域与第j个网格区域的位置信息相似度。这里可以使用向量点积、夹角余弦等方式进行位置信息相似度的计算,这里可以利用GNN对POI信息进行处理,具体过程不再详述。
通常,在不同网格区域之间的位置信息相似度较大的情况下,不同网格区域之间的订单数量也是比较接近的,因此,将不同网格区域之间的位置信息相似度作为输入对原始模型进行训练,可以提高第一参考订单数量的准确性。在上述方式中,示例性地,原始模型可以为LSTM结合GNN的模型。
S102:将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量输入至训练好的原始模型中,得到所述多个第一历史时间段的最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量。
如前所述,训练好的原始模型能够根据未来预设时间段之前的至少一个时间段内,各网格区域对的订单数量,确定出未来预设时间段内各网格区域对的订单数量,这里,在将多个第一历史时间段中的前预设数量个第一历史时间段内,各网格区域对的订单数量作为输入的时候,可以利用训练好的原始模型,得到多个第一历史时间段的最后一个第一历史时间段内,各网格区域对的第一参考订单数量。
在多个第一历史时间段为多个连续的第一历史时间段的情况下,可以将多个连续的第一历史时间段中,连续的前预设数量个第一历史时间段内各网格区域对的订单数量输入至训练好的原始模型中,得到最后一个第一历史时间段内,各网格区域对的第一参考订单数量。
例如,在多个第一历史时间段为过去连续的24小时,一个小时为一个第一历史时间段的情况下,可以将前23小时中每个小时内各网格区域对的订单数量输入至训练好的原始模型中,得到最后一个小时内各网格区域对的第一参考订单数量。
在多个第一历史时间段为多个连续的第二历史时间段中的目标子时间段的情况下,可以将多个目标子时间段中的前预设数量个目标子时间段中的前预设数量个目标子时间段内,各网格区域对的订单数量输入至预先训练好的原始模型中,得到多个目标子时间段的最后一个目标子时间段内,个网格区域对的第一参考订单数量。
例如,在多个连续的第二历史时间段为过去的一个月(以30天为例),一天中的15点至18点为一个目标子时间段,也就是一天中的15点至18点为一个第一历史时间段的情况下,可以将前29天中每天的15点至18点内各网格区域对的订单数量输入至训练好的原始模型中,得到第30天的15点至18点内各网格区域对的第一参考订单数量。
如前所述,考虑到某些场景(例如货物运输场景)下的网格区域对的订单数量较少,在订单数量较少的情况下,将多个第一历史时间段中的前预设数量个第一历史时间段内,各网格区域对的订单数量输入至训练好的原始模型中,得到的第一参考订单数量准确度较低,因此,在一种实施方式中,在将前预设数量个第一历史时间段内各网格区域对的订单数量输入至训练好的原始模型中之前,可以基于各个网格区域分别对应的位置信息,确定不同网格区域之间的位置信息相似度。接下来,可以将多个第一历史时间段中的前预设数量个第一历史时间段内,各网格区域对的订单数量,以及不同网格区域之间的位置信息相似度共同输入至训练好的原始模型中,得到最后一个第一历史时间段内各网格区域对的第一参考订单数量。
在上述实施方式中,确定不同网格区域之间的位置信息相似度的具体过程可以参照前述在对原始模型的训练过程中的描述,这里不再赘述。通常,在不同网格区域之间的位置信息相似度较大的情况下,不同网格区域之间的订单数量也是比较接近的,因此,在训练好的原始模型中输入不同网格区域之间的位置信息相似度,可以提高第一参考订单数量的准确性。
S103:将所述前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至待训练的压缩模型,得到所述多个第一历史时间段中最后一个第一历史时间段内,所述各网格区域对的第二参考订单数量。
同样使用到前预设数量个第一历史时间段内各网格区域对的订单数量,这里,将前预设数量个第一历史时间段内各网格区域对的订单数量作为输入数据,输入到待训练的压缩模型。待训练的压缩模型可以基于输入数据,得到多个第一历史时间段中最后一个第一历史时间段内,各网格区域对的第二参考订单数量,也即基于待训练的压缩模型得到多个第一历史时间段中最后一个第一历史时间段内,各网格区域对的预测订单数量。
S104:基于所述第一参考订单数量、所述第二参考订单数量、和所述最后一个第一历史时间段内所述各网格区域对的真实订单数量,对所述待训练的压缩模型进行训练,得到训练好的压缩模型。
在具体实施中,可以基于第一参考订单数量和第二参考订单数量,确定第一损失信息,这里可以记为L1,以及基于真实订单数量和第二参考订单数量,确定第二损失信息,这里可以记为L2。其中,第一损失信息对应的损失函数和第二损失信息对应的损失函数可以相同,也可以不同,这里可以不作具体限定。
然后,基于第一损失信息和第二损失信息,对待训练的压缩模型进行训练,得到训练好的压缩模型。
具体地,可以基于第一损失信息和第二损失信息,计算总的损失信息L=λ1L1+λ2L2,其中,λ1和λ2为超参数,可以根据实际情况设定。在实际中可以对压缩模型进行多轮训练,直至达到训练截止条件。训练截止条件例如可以为总的损失信息小于设定阈值。
训练好的压缩模型能够根据输入的未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量,得到未来预设时间段内各网格区域对的参考订单数量。
在得到训练好的压缩模型之后,还可以通过对压缩模型进行测试的方式,检验压缩模型的准确性。在一种实施方式中,还可以针对在目标时间段之前的多个第二历史时间段中的每个第二历史时间段,获取在该第二历史时间段内,各网格区域对的订单数量;目标时间段为在多个第一历史时间段的最后一个第一历史时间段之后的时间段。
这里,目标时间段也可以是历史时间段,并且目标时间段是在多个第一历史时间段的最后一个第一历史时间段之前的时间段。
接下来,将在目标时间段之前的至少一个第二历史时间段内的各网格区域对的订单数量输入至训练得到的压缩模型中,得到目标时间段内各网格区域对的第三参考订单数量。
然后,将第三参考订单数量与目标时间段内各网格区域对的真实订单数量进行对比,确定模型测试结果。
然后,在模型测试结果不合格的情况下,更新训练样本,并基于更新的训练样本对压缩模型进行重新训练,或者,基于更新的训练样本对原始模型和压缩模型进行重新训练;其中,更新后的训练样本包括在目标时间段内,以及在目标时间段之前的至少一个历史时间段内,各网格区域对的订单数量。
其中,模型测试结果不合格可以指第三参考订单数量与目标时间段内各网格区域对的真实订单数量的差值超出预设数值范围。在模型测试结果不合格的情况下,说明得到的第三参考订单数量准确度较低,也就是先之前得到的压缩模型的准确度较低,因此可以更新训练样本,对压缩模型进行重新训练,或者,基于更新的训练样本对原始模型和压缩模型进行重新训练。
这里,可以将目标时间段内,以及在目标时间段之前的至少一个历史时间段内,各网格区域对的订单数量加入到之前的训练样本中,从而更新训练样本。
为了使得训练好的压缩模型得到的参考订单数量更加准确,对压缩模型进行重新训练或者对原始模型和压缩模型进行重新训练之后,可以继续重复上述测试过程,直至在多轮测试的模型测试结果一直保持合格。
参见图2,本公开实施例还提供另一种模型训练方法的示意图。下面以过去10个小时中每个小时内,各网格区域对的订单数量作为训练数据,对压缩模型进行训练为例,对本公开实施例还提供另一种模型训练方法进行描述。其中,原始模型以多层LSTM模型、压缩模型以1~2层的浅层LSTM模型为例。
步骤1,获取训练数据。
获取过去10个小时中每个小时内,各网格区域对的订单数量,用三维向量形式表示。在获取到过去10个小时中每个小时内,各网格区域对的订单数量之后,进一步地,还可以以每个小时为一个时间切片,得到10个二维矩阵,每个二维矩阵对应一个小时内各网格区域对的订单数量。
具体地,第N(N为大于等于1,且小于等于10的正整数)个矩阵中第i(i为大于等于1,且小于等于网格区域的总数量的正整数)行第j(j为大于等于1,且小于等于网格区域的总数量的正整数)列的矩阵元素可以表示为:从第i个网络区域(订单起点)到第j个网络区域(订单终点)之间的订单数量。
步骤2,利用训练数据,训练原始模型,得到训练好的原始模型。
将过去10个小时中前9个小时对应的二维矩阵作为原始模型输入数据,将第10个小时对应的二维矩阵作为标注数据,也就是原标签,对待训练的原始模型进行训练,得到训练好的原始模型。
步骤3,利用训练数据和训练好的原始模型,得到第一参考结果。
将过去10个小时中前9个小时对应的二维矩阵输入至训练好的原始模型中,得到第一参考结果,也就是伪标签。
步骤4,利用训练数据和第一参考结果,训练压缩模型,得到训练好的压缩模型。
将训练数据中包含的过去10个小时中前9个小时对应的二维矩阵输入至待训练的压缩模型中,得到第二参考结果。
基于第一参考结果(伪标签)和第二参考结果,计算第一训练损失信息,以及基于第10个小时对应的二维矩阵(原标签)和第二参考结果,计算第二训练损失信息。
对第一训练损失信息和第二训练损失信息进行加权求和,对待训练的压缩模型进行训练,得到训练好的压缩模型。
参见图3所示,为本公开实施例提供的一种需求确定方法的流程图,其中:
S301:获取在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量。
S302:将在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量输入至本公开实施例提供的模型训练方法训练得到的压缩模型中,得到未来预设时间段内各网格区域对的参考订单数量。
在一种实施方式中,订单为出行服务订单的情况下,可以获取当前各个网格区域内出行服务对象的数量,然后在获取的网格区域内出行服务对象的数量,与未来预设时间段内,以该网格区域作为订单起点的网格区域对的参考订单数量不匹配的情况下,对至少一个网格区域内的出行服务对象进行调度。根据得到的参考订单数量,可以实现对出行服务对象的调度,从而使得各网格区域内的出行服务对象的数量与未来预设时间段内各网格区域对的参考订单数量相匹配。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与模型训练方法对应的模型训练装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述模型训练方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参照图4所示,为本公开实施例提供的一种模型训练装置的架构示意图,所述装置包括:第一获取模块401、第一输入模块402、第二输入模块403、第一训练模块404;其中,
第一获取模块401,用于针对多个第一历史时间段中的每个第一历史时间段,获取在该第一历史时间段内,各网格区域对的订单数量;其中,所述网格区域对中包括作为订单起点的第一网格区域和作为订单终点的第二网格区域;
第一输入模块402,用于将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量输入至训练好的原始模型中,得到所述多个第一历史时间段的最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量;
第二输入模块403,用于将所述前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至待训练的压缩模型,得到所述多个第一历史时间段中最后一个第一历史时间段内,所述各网格区域对的第二参考订单数量;
第一训练模块404,用于基于所述第一参考订单数量、所述第二参考订单数量、和所述最后一个第一历史时间段内所述各网格区域对的真实订单数量,对所述待训练的压缩模型进行训练,得到训练好的压缩模型。
一种可选的实施方式中,第一训练模块404,具体用于:
基于所述第一参考订单数量和所述第二参考订单数量,确定第一损失信息;以及基于所述真实订单数量和所述第二参考订单数量,确定第二损失信息;
基于所述第一损失信息和所述第二损失信息,对所述待训练的压缩模型进行训练,得到训练好的压缩模型。
一种可选的实施方式中,所述装置还包括:
确定模块,用于基于各个所述网格区域分别对应的位置信息,确定不同网格区域之间的位置信息相似度;
第一输入模块402,具体用于:
将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量,以及所述不同网格区域之间的位置信息相似度输入至训练好的原始模型中,得到最后一个第一历史时间段内所述各网格区域对的第一参考订单数量。
一种可选的实施方式中,所述装置还包括:
第二训练模块,用于将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量作为原始模型输入数据,将所述最后一个第一历史时间段内,所述各网格区域对的真实订单数量作为标注数据,训练得到所述原始模型。
一种可选的实施方式中,所述多个第一历史时间段为多个连续的第一历史时间段;
第一训练模块402,具体用于:
将所述多个连续的第一历史时间段中,连续的前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至训练好的原始模型中,得到最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量。
一种可选的实施方式中,所述多个第一历史时间段为多个连续的第二历史时间段中的目标子时间段,其中不同的目标子时间段在所属第二历史时间段内的相对时间位置相同;
第一训练模块402,具体用于:
将多个所述目标子时间段中的前预设数量个目标子时间段内,所述各网格区域对的订单数量输入至预先训练好的原始模型中,得到多个所述目标子时间段的最后一个目标子时间段内,所述各网格区域对的第一参考订单数量。
一种可选的实施方式中,所述装置还包括:
第二获取模块,用于针对在目标时间段之前的多个第二历史时间段中的每个第二历史时间段,获取在该第二历史时间段内,各网格区域对的订单数量;所述目标时间段为在所述多个第一历史时间段的最后一个第一历史时间段之后的时间段;
第三输入模块,用于将在所述目标时间段之前的至少一个第二历史时间段内的所述各网格区域对的订单数量输入至训练得到的所述压缩模型中,得到所述目标时间段内所述各网格区域对的第三参考订单数量;
对比模块,用于将所述第三参考订单数量与所述目标时间段内所述各网格区域对的真实订单数量进行对比,确定模型测试结果;
更新模块,用于在所述模型测试结果不合格的情况下,更新训练样本,并基于更新的训练样本对所述压缩模型进行重新训练,或者,基于更新的训练样本对所述原始模型和所述压缩模型进行重新训练;
其中,更新后的所述训练样本包括在所述目标时间段内,以及在目标时间段之前的至少一个历史时间段内,所述各网格区域对的订单数量。
本公开实施例中还提供了与需求确定方法对应的需求确定装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述需求确定方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参照图5所示,为本公开实施例提供的另一种模型训练装置的架构示意图,所述装置包括:
第一获取模块501,用于获取在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量;
输入模块502,用于将所述在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量输入至基于本公开实施例提供的模型训练方法训练得到的所述压缩模型中,得到所述未来预设时间段内所述各网格区域对的参考订单数量。
在一种可选的实施方式中,所述订单为出行服务订单;所述装置还包括:
第二获取模块,用于获取当前各个网格区域内出行服务对象的数量;
调度模块,用于在获取的所述网格区域内出行服务对象的数量,与所述未来预设时间段内,以该网格区域作为订单起点的所述网格区域对的参考订单数量不匹配的情况下,对至少一个所述网格区域内的出行服务对象进行调度,以使得各网格区域内的出行服务对象的数量与所述未来预设时间段内所述各网格区域对的参考订单数量相匹配。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
基于同一技术构思,本公开实施例还提供了一种计算机设备。参照图6所示,为本公开实施例提供的计算机设备600的结构示意图,包括处理器601、存储器602、和总线603。其中,存储器602用于存储执行指令,包括内存6021和外部存储器6022;这里的内存6021也称内存储器,用于暂时存放处理器601中的运算数据,以及与硬盘等外部存储器6022交换的数据,处理器601通过内存6021与外部存储器6022进行数据交换,当计算机设备600运行时,处理器601与存储器602之间通过总线603通信,使得处理器601在执行以下指令:
针对多个第一历史时间段中的每个第一历史时间段,获取在该第一历史时间段内,各网格区域对的订单数量;其中,所述网格区域对中包括作为订单起点的第一网格区域和作为订单终点的第二网格区域;
将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量输入至训练好的原始模型中,得到所述多个第一历史时间段的最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量;
将所述前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至待训练的压缩模型,得到所述多个第一历史时间段中最后一个第一历史时间段内,所述各网格区域对的第二参考订单数量;
基于所述第一参考订单数量、所述第二参考订单数量、和所述最后一个第一历史时间段内所述各网格区域对的真实订单数量,对所述待训练的压缩模型进行训练,得到训练好的压缩模型。
或者,当计算机设备600运行时,处理器601与存储器602之间通过总线603通信,使得处理器601在执行以下指令:
获取在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量;
将所述在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量输入至基于本公开实施例提供的模型训练方法训练得到的所述压缩模型中,得到所述未来预设时间段内所述各网格区域对的参考订单数量。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的模型训练方法或所述的需求确定方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,该计算机产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的模型训练方法或所述的需求确定方法的步骤,具体可参见上述方法实施例,在此不再赘述。
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以所述权利要求的保护范围为准。
Claims (14)
1.一种模型训练方法,其特征在于,包括:
针对多个第一历史时间段中的每个第一历史时间段,获取在该第一历史时间段内,各网格区域对的订单数量;其中,所述网格区域对中包括作为订单起点的第一网格区域和作为订单终点的第二网格区域;
将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量输入至训练好的原始模型中,得到所述多个第一历史时间段的最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量;
将所述前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至待训练的压缩模型,得到所述多个第一历史时间段中最后一个第一历史时间段内,所述各网格区域对的第二参考订单数量;
基于所述第一参考订单数量、所述第二参考订单数量、和所述最后一个第一历史时间段内所述各网格区域对的真实订单数量,对所述待训练的压缩模型进行训练,得到训练好的压缩模型。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一参考订单数量、所述第二参考订单数量、和所述最后一个第一历史时间段内所述各网格区域对的真实订单数量,对所述待训练的压缩模型进行训练,得到训练好的压缩模型,包括:
基于所述第一参考订单数量和所述第二参考订单数量,确定第一损失信息;以及基于所述真实订单数量和所述第二参考订单数量,确定第二损失信息;
基于所述第一损失信息和所述第二损失信息,对所述待训练的压缩模型进行训练,得到训练好的压缩模型。
3.根据权利要求1所述的方法,其特征在于,将所述前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至训练好的原始模型中之前,所述方法还包括:
基于各个所述网格区域分别对应的位置信息,确定不同网格区域之间的位置信息相似度;
所述将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量输入至训练好的原始模型中,得到所述多个第一历史时间段的最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量,包括:
将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量,以及所述不同网格区域之间的位置信息相似度输入至训练好的原始模型中,得到最后一个第一历史时间段内所述各网格区域对的第一参考订单数量。
4.根据权利要求1所述的方法,其特征在于,将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量输入至训练好的原始模型中之前,所述方法还包括:
将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量作为原始模型输入数据,将所述最后一个第一历史时间段内,所述各网格区域对的真实订单数量作为标注数据,训练得到所述原始模型。
5.根据权利要求1所述的方法,其特征在于,所述多个第一历史时间段为多个连续的第一历史时间段;
所述将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量输入至预先训练好的原始模型中,得到所述多个第一历史时间段的最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量,包括:
将所述多个连续的第一历史时间段中,连续的前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至训练好的原始模型中,得到最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量。
6.根据权利要求1所述的方法,其特征在于,所述多个第一历史时间段为多个连续的第二历史时间段中的目标子时间段,其中不同的目标子时间段在所属第二历史时间段内的相对时间位置相同;
所述将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量输入至预先训练好的原始模型中,得到所述多个第一历史时间段的最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量,包括:
将多个所述目标子时间段中的前预设数量个目标子时间段内,所述各网格区域对的订单数量输入至预先训练好的原始模型中,得到多个所述目标子时间段的最后一个目标子时间段内,所述各网格区域对的第一参考订单数量。
7.根据权利要求1所述的方法,其特征在于,得到训练好的压缩模型之后,所述方法还包括:
针对在目标时间段之前的多个第二历史时间段中的每个第二历史时间段,获取在该第二历史时间段内,各网格区域对的订单数量;所述目标时间段为在所述多个第一历史时间段的最后一个第一历史时间段之后的时间段;
将在所述目标时间段之前的至少一个第二历史时间段内的所述各网格区域对的订单数量输入至训练得到的所述压缩模型中,得到所述目标时间段内所述各网格区域对的第三参考订单数量;
将所述第三参考订单数量与所述目标时间段内所述各网格区域对的真实订单数量进行对比,确定模型测试结果;
在所述模型测试结果不合格的情况下,更新训练样本,并基于更新的训练样本对所述压缩模型进行重新训练,或者,基于更新的训练样本对所述原始模型和所述压缩模型进行重新训练;
其中,更新后的所述训练样本包括在所述目标时间段内,以及在目标时间段之前的至少一个历史时间段内,所述各网格区域对的订单数量。
8.一种需求确定方法,其特征在于,包括:
获取在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量;
将所述在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量输入至基于权利要求1~7任一所述的模型训练方法训练得到的所述压缩模型中,得到所述未来预设时间段内所述各网格区域对的参考订单数量。
9.根据权利要求8所述的方法,其特征在于,所述订单为出行服务订单;在得到所述未来预设时间段内所述各网格区域对的参考订单数量之后,所述方法还包括:
获取当前各个网格区域内出行服务对象的数量;
在获取的所述网格区域内出行服务对象的数量,与所述未来预设时间段内,以该网格区域作为订单起点的所述网格区域对的参考订单数量不匹配的情况下,对至少一个所述网格区域内的出行服务对象进行调度,以使得各网格区域内的出行服务对象的数量与所述未来预设时间段内所述各网格区域对的参考订单数量相匹配。
10.一种模型训练装置,其特征在于,包括:
第一获取模块,用于针对多个第一历史时间段中的每个第一历史时间段,获取在该第一历史时间段内,各网格区域对的订单数量;其中,所述网格区域对中包括作为订单起点的第一网格区域和作为订单终点的第二网格区域;
第一输入模块,用于将所述多个第一历史时间段中的前预设数量个第一历史时间段内,所述各网格区域对的订单数量输入至训练好的原始模型中,得到所述多个第一历史时间段的最后一个第一历史时间段内,所述各网格区域对的第一参考订单数量;
第二输入模块,用于将所述前预设数量个第一历史时间段内所述各网格区域对的订单数量输入至待训练的压缩模型,得到所述多个第一历史时间段中最后一个第一历史时间段内,所述各网格区域对的第二参考订单数量;
第一训练模块,用于基于所述第一参考订单数量、所述第二参考订单数量、和所述最后一个第一历史时间段内所述各网格区域对的真实订单数量,对所述待训练的压缩模型进行训练,得到训练好的压缩模型。
11.一种需求确定装置,其特征在于,包括:
第一获取模块,用于获取在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量;
输入模块,用于将所述在未来预设时间段之前的至少一个时间段内的各网格区域对的订单数量输入至基于权利要求1~7任一所述的模型训练方法训练得到的所述压缩模型中,得到所述未来预设时间段内所述各网格区域对的参考订单数量。
12.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一项所述的模型训练方法的步骤,或执行如权利要求8至9任一项所述的需求确定方法的步骤。
13.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任一项所述的模型训练方法的步骤,或执行如权利要求8至9任一项所述的需求确定方法的步骤。
14.一种计算机程序产品,其特征在于,该计算机产品承载有程序代码,所述程序代码包括的指令可用于执行如权利要求1至7任一项所述的模型训练方法的步骤,或执行如权利要求8至9任一项所述的需求确定方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210282448.1A CN114386880B (zh) | 2022-03-22 | 2022-03-22 | 确定订单数量的模型训练方法、订单数量确定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210282448.1A CN114386880B (zh) | 2022-03-22 | 2022-03-22 | 确定订单数量的模型训练方法、订单数量确定方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114386880A true CN114386880A (zh) | 2022-04-22 |
CN114386880B CN114386880B (zh) | 2022-07-08 |
Family
ID=81205832
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210282448.1A Active CN114386880B (zh) | 2022-03-22 | 2022-03-22 | 确定订单数量的模型训练方法、订单数量确定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114386880B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985475A (zh) * | 2018-06-13 | 2018-12-11 | 厦门大学 | 基于深度神经网络的网约车召车需求预测方法 |
CN109117973A (zh) * | 2017-06-26 | 2019-01-01 | 北京嘀嘀无限科技发展有限公司 | 一种网约车订单量预测方法及装置 |
CN111291867A (zh) * | 2020-02-17 | 2020-06-16 | 北京明略软件系统有限公司 | 数据预测模型生成方法、装置及数据预测方法、装置 |
CN111476588A (zh) * | 2019-01-24 | 2020-07-31 | 北京嘀嘀无限科技发展有限公司 | 订单需求预测方法、装置、电子设备及可读存储介质 |
CN112150207A (zh) * | 2020-09-30 | 2020-12-29 | 武汉大学 | 基于时空上下文注意力网络的网约车订单需求预测方法 |
US20210027235A1 (en) * | 2018-04-10 | 2021-01-28 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for vehicle scheduling |
CN113255763A (zh) * | 2021-05-21 | 2021-08-13 | 平安科技(深圳)有限公司 | 基于知识蒸馏的模型训练方法、装置、终端及存储介质 |
-
2022
- 2022-03-22 CN CN202210282448.1A patent/CN114386880B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109117973A (zh) * | 2017-06-26 | 2019-01-01 | 北京嘀嘀无限科技发展有限公司 | 一种网约车订单量预测方法及装置 |
US20210027235A1 (en) * | 2018-04-10 | 2021-01-28 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for vehicle scheduling |
CN108985475A (zh) * | 2018-06-13 | 2018-12-11 | 厦门大学 | 基于深度神经网络的网约车召车需求预测方法 |
CN111476588A (zh) * | 2019-01-24 | 2020-07-31 | 北京嘀嘀无限科技发展有限公司 | 订单需求预测方法、装置、电子设备及可读存储介质 |
CN111291867A (zh) * | 2020-02-17 | 2020-06-16 | 北京明略软件系统有限公司 | 数据预测模型生成方法、装置及数据预测方法、装置 |
CN112150207A (zh) * | 2020-09-30 | 2020-12-29 | 武汉大学 | 基于时空上下文注意力网络的网约车订单需求预测方法 |
CN113255763A (zh) * | 2021-05-21 | 2021-08-13 | 平安科技(深圳)有限公司 | 基于知识蒸馏的模型训练方法、装置、终端及存储介质 |
Non-Patent Citations (1)
Title |
---|
谷远利等: "基于深度学习的网约车供需缺口短时预测研究", 《交通运输系统工程与信息》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114386880B (zh) | 2022-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI676783B (zh) | 用於預估到達時間之方法及系統 | |
CN111476588B (zh) | 订单需求预测方法、装置、电子设备及可读存储介质 | |
CN111862585B (zh) | 用于交通预测的系统和方法 | |
CN109791731B (zh) | 一种预估到达时间的方法和系统 | |
US20190279076A1 (en) | Learning from delayed outcomes using neural networks | |
US10719639B2 (en) | Massively accelerated Bayesian machine | |
CN112381303A (zh) | 一种任务指标数据预测方法和系统 | |
CN111832869A (zh) | 一种车辆调度方法、装置、电子设备及存储介质 | |
Herrema et al. | Taxi-out time prediction model at Charles de Gaulle Airport | |
WO2021056127A1 (en) | Systems and methods for analyzing sentiment | |
CN111275229B (zh) | 资源模型训练方法、资源缺口预测方法、装置及电子设备 | |
CN112418341A (zh) | 模型融合方法、预测方法、装置、设备及存储介质 | |
CN108416619B (zh) | 一种消费间隔时间预测方法、装置及可读存储介质 | |
CN110751395A (zh) | 一种旅客行程状态确定方法、装置及服务器 | |
CN114386880B (zh) | 确定订单数量的模型训练方法、订单数量确定方法及装置 | |
CN111833080A (zh) | 信息推送的方法、装置、电子设备和计算机可读存储介质 | |
CN115438835A (zh) | 航班的配餐量预测方法、装置、计算机设备和存储介质 | |
CN115983896A (zh) | 需求预测方法及相关装置 | |
CN111275062A (zh) | 模型训练方法、装置、服务器及计算机可读存储介质 | |
CN114722704A (zh) | 车轮磨损预测网络模型训练方法、装置 | |
CN110674962A (zh) | 车辆的行程预估处理方法、装置及存储介质 | |
CN111222932B (zh) | 订单周期计算方法、装置及电子设备 | |
CN111523005B (zh) | 网约用户分析方法、装置及电子设备 | |
CN112308344A (zh) | 一种未离港航班订座值预测方法、装置及电子设备 | |
CN111091219A (zh) | 一种预测用户是否有车的方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220818 Address after: Room 203, 2 / F, building 34, yard 8, Dongbei Wangxi Road, Haidian District, Beijing 100193 Patentee after: Beijing Qisheng Technology Co.,Ltd. Patentee after: Xiamen Qiwen Technology Co.,Ltd. Address before: Room 203, 2 / F, building 34, yard 8, Dongbei Wangxi Road, Haidian District, Beijing 100193 Patentee before: Beijing Qisheng Technology Co.,Ltd. |