CN116777056A - 预测模型的训练、确定物资需求量的方法和装置 - Google Patents
预测模型的训练、确定物资需求量的方法和装置 Download PDFInfo
- Publication number
- CN116777056A CN116777056A CN202310708372.9A CN202310708372A CN116777056A CN 116777056 A CN116777056 A CN 116777056A CN 202310708372 A CN202310708372 A CN 202310708372A CN 116777056 A CN116777056 A CN 116777056A
- Authority
- CN
- China
- Prior art keywords
- demand
- predicted
- order
- area
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000463 material Substances 0.000 title claims abstract description 227
- 238000012549 training Methods 0.000 title claims abstract description 125
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000012795 verification Methods 0.000 claims abstract description 31
- 230000006870 function Effects 0.000 claims description 58
- 230000004931 aggregating effect Effects 0.000 claims description 13
- 230000003044 adaptive effect Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 12
- 230000002123 temporal effect Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 10
- 238000010200 validation analysis Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 5
- 125000004122 cyclic group Chemical group 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 23
- 239000013077 target material Substances 0.000 description 20
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 235000013305 food Nutrition 0.000 description 5
- 238000009499 grossing Methods 0.000 description 5
- 239000003814 drug Substances 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 235000012055 fruits and vegetables Nutrition 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000005418 vegetable material Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 239000004278 EU approved seasoning Substances 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013209 evaluation strategy Methods 0.000 description 1
- 235000011194 food seasoning agent Nutrition 0.000 description 1
- 235000013350 formula milk Nutrition 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000006210 lotion Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000002483 medication Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000002453 shampoo Substances 0.000 description 1
- 229940034610 toothpaste Drugs 0.000 description 1
- 239000000606 toothpaste Substances 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开提出了一种预测模型的训练、确定物资需求量的方法和装置,涉及计算机领域。其中,预测模型的训练方法包括:根据订单数据,确定目标区域内的用户群体对目标品类物资的历史需求量;根据目标区域内的用户群体对目标品类物资的历史需求量,构建训练数据集与验证数据集;根据训练数据集与验证数据集,从搜索空间中确定预测模型的网络架构;根据训练数据集,对预测模型进行训练。通过以上方法,能够提高训练得到针对目标区域目标品类物资的需求量进行预测的模型的性能。
Description
技术领域
本公开涉及计算机技术领域,特别涉及一种预测模型的训练、确定物资需求量的方法和装置。
背景技术
如何有效保障居民的生活物资供应是一个关键问题。其中,居民生活物资供应主要涉及两个问题:1)如何了解居民需求;2)如何进行物资供需匹配。其中,如何快速、高质量地洞察居民的生活物资需求是主要的问题。
相关技术中,主要基于问卷调查方式了解居民未来的物资需求,然后基于问卷调查结果联系供应商提供物资。此外,相关技术中,还存在基于时间序列预测模型对城市范围内的居民物资需求进行预测的方法。
发明内容
本公开要解决的一个技术问题是,提供一种预测模型的训练、确定物资需求量的方法和装置。
根据本公开的第一方面,提出了一种预测模型的训练方法,包括:根据订单数据,确定目标区域内的用户群体对目标品类物资的历史需求量;根据所述目标区域内的用户群体对目标品类物资的历史需求量,构建训练数据集与验证数据集;根据所述训练数据集与所述验证数据集,从搜索空间中确定预测模型的网络架构,所述预测模型用于预测目标区域内的用户群体对目标品类物资的未来的需求量;根据所述训练数据集,对所述预测模型进行训练。
在一些实施例中,所述根据订单数据,确定目标区域内的用户群体对目标品类物资的历史需求量包括:根据订单的收货地址信息,确定所述订单的收货地的经纬度信息;根据所述订单的收货地的经纬度信息,确定所述订单所属的区域;根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到目标区域内的用户群体对目标品类物资的历史需求量。
在一些实施例中,所述根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到目标区域内的用户群体对目标品类物资的历史需求量包括:根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到所述目标区域内的订单覆盖的用户对目标品类物资的历史需求量;根据所述订单覆盖的用户的数量与所述目标区域内的用户群体的总数的比值、和所述目标品类物资的平均需求间隔中的至少一项,以及所述目标区域内的订单覆盖的用户对目标品类物资的历史需求量,确定所述目标区域内的用户群体对目标品类物资的历史需求量。
在一些实施例中,所根据所述训练数据集与验证数据集,从搜索空间中确定预测模型的网络架构包括:根据所述目标品类物资的类别,确定网络架构学习中的损失函数;根据所述训练数据集与验证数据集,以最小化所述网络架构学习中的损失函数为目标,从搜索空间中确定预测模型的网络架构。
在一些实施例中,所述根据所述目标品类物资的类别,确定网络架构学习中的损失函数包括:在所述目标品类物资为必需品的情况下,将第一损失函数作为网络架构学习中的损失函数;在所述目标品类物资为非必需品的情况下,将第二损失函数作为网络架构学习中的损失函数,所述第二损失函数与所述第一损失函数不同。
在一些实施例中,所述第一损失函数为非对称损失函数,且满足:当目标品类物资的需求量的预测值大于标签值时,根据所述预测值与标签值的差值确定第一损失函数的取值;当目标品类物资的需求量的预测值小于或等于标签值时,根据所述预测值与标签值的差值、以及设置的惩罚因子确定第一损失函数的取值。
在一些实施例中,所述根据所述训练数据集与验证数据集,以最小化所述网络架构学习中的损失函数为目标,从搜索空间中确定预测模型的网络架构包括:从所述搜索空间中确定候选网络结构;根据所述训练数据集,对所述候选网络结构的模型参数进行调整,以得到调整后的模型参数;根据所述验证数据集,以所述调整后的模型参数为约束,以最小化所述网络架构学习中的损失函数为目标,对所述候选网络结构的模型结构进行调整;迭代执行模型参数调整步骤与模型结构调整步骤,直至满足模型结构收敛条件,以得到模型结构信息;根据所述模型结构信息,构建所述预测模型的网络架构。
在一些实施例中,所述根据所述目标区域内的用户群体对目标品类物资的历史需求量,构建训练数据集与验证数据集包括:根据所述目标区域内的用户群体对目标品类物资的历史需求量、与所述历史需求量相关的日期数据以及天气数据,构建多条样本数据;根据所述多条样本数据,构建训练数据集与验证数据集。
在一些实施例中,所述搜索空间包括多个依次连接的搜索单元,每个搜索单元包括多个节点、以及多个节点之间的边对应的候选算子。
在一些实施例中,所述多个节点之间的边对应的候选算子包括循环网络算子、自注意力算子、连接类算子、激活类算子、卷积算子、时间卷积算子、时间空洞卷积算子、自适应全连接算子中的至少一项。
在一些实施例中,所述多个节点之间的边对应的候选算子包括激活类算子、时间卷积算子、时间空洞卷积算子、以及自适应全连接算子。
根据本公开的第二方面,提出了一种确定物资需求量的方法,包括:根据订单数据,确定待预测区域内的用户群体对待预测品类物资的历史需求量;获取与待预测区域以及待预测品类物资匹配的预测模型,所述预测模型为根据如前所述的预测模型的训练方法训练得到;利用所述匹配的预测模型,对所述待预测区域内的用户群体对待预测品类物资的历史需求量进行处理,以得到所述待预测区域内的用户群体对待预测品类物资的未来的需求量。
在一些实施例中,根据订单数据,确定待预测区域内的用户群体对待预测品类物资的历史需求量包括:根据订单的收货地址信息,确定所述订单的收货地的经纬度信息;根据所述订单的收货地的经纬度信息,确定所述订单所属的区域;根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到待预测区域内的用户群体对待预测品类物资的历史需求量。
在一些实施例中,所述根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到待预测区域内的用户群体对待预测品类物资的历史需求量包括:根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到所述待预测区域内订单覆盖的用户对待预测品类物资的历史需求量;根据所述待预测区域内订单覆盖的用户的数量与所述待预测区域内的用户群体的总数的比值、和所述待预测品类物资的平均需求间隔中的至少一项,以及所述待预测区域内订单覆盖的用户对待预测品类物资的历史需求量,确定所述待预测区域内的用户群体对待预测品类物资的历史需求量。
在一些实施例中,所述根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到待预测区域内的用户群体对待预测品类物资的历史需求量包括:根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到所述待预测区域内订单覆盖的用户对待预测品类物资的历史需求量;将所述待预测区域内订单覆盖的用户对待预测品类物资的历史需求量,作为所述待预测区域内的用户群体对待预测品类物资的历史需求量。
在一些实施例中,还包括:根据所述待预测区域内订单覆盖的用户的数量与所述待预测区域内的用户群体的总数的比值、和所述待预测品类物资的平均需求间隔中的至少一项,对所述待预测区域内的用户群体对待预测品类物资的未来的需求量进行修正。
在一些实施例中,还包括:获取候选供应商信息;根据所述待预测区域内的用户群体对待预测品类物资的未来的需求量、以及所述候选供应商信息,以最小化物资供应成本为目标,确定物资供需匹配方案。
根据本公开的第三方面,提出了一种预测模型的训练装置,包括:历史需求量确定模块,被配置为根据订单数据,确定目标区域内的用户群体对目标品类物资的历史需求量;数据集构建模块,被配置为根据所述目标区域内的用户群体对目标品类物资的历史需求量,构建训练数据集与验证数据集;网络架构确定模块,被配置为根据所述训练数据集与所述验证数据集,从搜索空间中确定预测模型的网络架构所述预测模型用于预测目标区域内的用户群体对目标品类物资的未来的需求量;训练模块,被配置为根据所述训练数据集,对所述预测模型进行训练。
根据本公开的第四方面,提出了一种确定物资需求量的装置,包括:确定模块,被配置为根据订单数据,确定待预测区域内的用户群体对待预测品类物资的历史需求量;获取模块,被配置为获取与待预测区域以及待预测品类物资匹配的预测模型,所述预测模型为根据如前所述的预测模型的训练方法训练得到;预测模块,被配置为利用所述匹配的预测模型,对所述待预测区域内的用户群体对待预测品类物资的历史需求量进行处理,以得到所述待预测区域内的用户群体对待预测品类物资的未来的需求量。
根据本公开的第五方面,提出一种电子设备,包括:存储器;以及,耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行如上述的预测模型的训练方法或确定物资需求量的方法。
根据本公开的第六方面,提出一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现如前所述的预测模型的训练方法或确定物资需求量的方法。
通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
图1为根据本公开一些实施例的预测模型的训练方法的流程示意图;
图2为根据本公开一些实施例的构建训练数据集与验证数据集的流程示意图;
图3为根据本公开一些实施例的确定预测模型的网络架构的流程示意图;
图4a为根据本公开一些实施例的确定预测模型的网络架构的原理示意图;
图4b为根据本公开一些实施例的确定预测模型的网络架构的原理示意图;
图4c为根据本公开一些实施例的算子示意图;
图5为根据本公开一些实施例的确定物资需求量的流程示意图;
图6为根据本公开另一些实施例的确定物资需求量的流程示意图;
图7为根据本公开一些实施例的物资供需匹配方法的流程示意图;
图8为根据本公开一些实施例的预测模型的训练装置的结构示意图;
图9为根据本公开一些实施例的确定物资需求量的装置的结构示意图;
图10为根据本公开一些实施例的电子设备的结构示意图;
图11为根据本公开一些实施例的计算机系统的结构示意图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
需要说明的是,本公开的技术方案中,所涉及的用户个人信息的采集、收集、更新、分析、处理、使用、传输、存储等方面,均符合相关法律法规的规定,被用于合法的用途,且不违背公序良俗。对用户个人信息采取必要措施,防止对用户个人信息数据的非法访问,维护用户个人信息安全、网络安全和国家安全。
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
相关技术中,基于调查的居民物资需求了解方法存在以下缺点:第一,存在滞后性,由于居民在填报物资需求问卷时,通常会优先考虑如主粮、蔬菜、水果等日常必需物资,而忽略如洗发液、沐浴露、牙膏、调味品等非必需物资,而此类物资的需求往往是在急需使用时才发现,这将会对居民的日常生活造成较大的影响;第二,缺乏个性化,基于调查的方法通常只会覆盖大众需要的物资类目,而通常会忽略一些小众群体需要的物资类目,例如,婴幼儿的配方奶粉、宠物口粮及用品、慢性病群体的日常药物等,然而,此类物资需求对于一部分居民而言又是必须的,无法及时供应可能会造成严重的后果。
相关技术中,基于时间序列预测模型预测的方法大多针对城市级别进行的,缺乏细粒度居民需求预测方法。由于城市中不同区域生活物资需求的差异是很大的,如果缺乏细粒度的居民物资需求指导,在满足居民物资需求的过程中会出现物资利用率低、居民物资供应中的物流成本与物资损耗大等问题。而且,相关技术中使用的预测模型的性能较差,需求量预测结果的准确度较低。
鉴于此,本公开提出了一种预测模型的训练、确定物资需求量的方法和装置,能够提高训练得到的针对目标区域目标品类物资的需求量进行预测的模型的性能,进而能够对不同区域不同品类物资的需求量进行更加精准、细粒度的预测。
图1为根据本公开一些实施例的预测模型的训练方法的流程示意图。如图1所示,预测模型的训练方法包括步骤S110至步骤S140。
在步骤S110中,根据订单数据,确定目标区域内的用户群体对目标品类物资的历史需求量。
在一些实施例中,预测模型的训练方法由预测模型的训练装置执行。
在一些实施例中,目标区域为一个或多个,目标品类物资为一个或多个。在目标区域、目标品类物资均为多个时,针对每个目标区域内的用户群体所需的每个目标品类物资,分别执行图1所示流程,以便于训练得到与目标区域、以及目标品类物资对应的预测模型。
例如,以社区作为需求量预测的最小空间粒度,以A城市的社区1、社区2作为两个目标区域,以主食、药品、果蔬作为社区1、社区2分别需要的三个目标品类物资。针对社区1所需的主食类物资,执行图1所示流程,以得到与社区1、主食类物资对应的预测模型。以此类推,可得到与社区1、药品类物资对应的预测模型,与社区1、果蔬类物资对应的预测模型,与社区2、主食类物资对应的预测模型,与社区2、药品类物资对应的预测模型,与社区2、果蔬类物资对应的预测模型。
在一些实施例中,由人工指定一个或多个目标区域以及一个或多个目标品类物资。
在另一些实施例中,根据预设的筛选规则从多个区域中确定一个或多个目标区域,以及,根据预设的筛选规则从多个品类物资中确定一个或多个目标品类物资。
在本公开实施例中,通过步骤S110得到目标区域内的用户群体对目标品类物资的历史需求量,便于后续对与目标区域、目标品类物资对应的需求量预测模型进行训练,进而有助于利用训练得到的预测模型进行细粒度的、更为精准地需求量预测。
在步骤S120中,根据目标区域内的用户群体对目标品类物资的历史需求量,构建训练数据集与验证数据集。
在一些实施例中,根据目标区域内的用户群体对目标品类物资的历史需求量,构建多条样本数据;按照指定比例将这些样本数据划分至两个集合中,以得到训练数据集与验证数据集。
例如,获取42天内目标区域内的用户群体对目标品类物资的日需求量序列,将前28天的日需求量作为输入、将后14天的日需求量作为输出量的标签值,从而得到一条由输入与输出量的标签值组成的样本数据。以此类推,可得到多条样本数据。按照指定比例,将这些样本数据划分为训练数据集与验证数据集。
在一些实施例中,根据目标区域内的用户群体对目标品类物资的历史需求量、与历史需求量相关的日期数据以及天气数据,构建多条样本数据;根据多条样本数据,构建训练数据集与验证数据集。
例如,获取30天内目标区域内的用户群体对目标品类物资的日需求量序列、以及这30天内每天的日期数据(比如今天是周几、以及是否是节假日等数据)、以及每天的天气数据(比如今天是否下雨等数据),将前15天的日需求量、以及每天的日期数据、每天的天气数据作为输入、将后15天的日需求量作为输出量的标签值,从而得到一条由输入与输出量的标签值组成的样本数据。
在步骤S130中,根据训练数据集与验证数据集,从搜索空间中确定预测模型的网络架构。
其中,预测模型用于预测目标区域内的用户群体对目标品类物资的未来的需求量。
神经网络架构搜索(Neural Architecture Search,NAS),用于自动设计神经网络架构。搜索空间,定义了神经网络架构搜索的范围。基于该范围可提供一组可供搜索的神经网络架构。
在本公开的一些实施例中,搜索空间包括多个依次连接的搜索单元,每个搜索单元包括多个节点、以及多个节点之间的边对应的候选算子。
搜索单元,又可称为细胞(Cell)。每个搜索单元可看作一个有向无环图(Directedacyclic graph,DAG)。其中,搜索单元中包含的节点代表神经网络的层,节点之间的边代表数据的流动,每条边对应候选算子。
在一些实施例中,在构建的搜索空间中,节点之间的边对应的候选算子包括循环网络算子、自注意力算子、连接类算子、激活类算子、卷积算子、时间卷积算子、时间空洞卷积算子、自适应全连接算子中的至少一项。
例如,连接类算子包括恒等链接(Identity)与断开(Zero),这两个算子可表示为:
opid(x)=x,opzero(x)=0
其中,x表示算子的输入,opid(x)=x表示恒等链接算子,opzero(x)=0表示断开算子。
例如,激活类算子包括tanh、relu、elu等各类激活函数。
例如,时间卷积算子为沿时间轴的一维卷积操作算子。
例如,时间空洞卷积算子是在标准的卷积映射(Convolution Map)里注入空洞,以此来扩大感受野。
例如,自适应全连接算子(也可称为自适应全连接网络算子)包括宽度自适应算子。例如,图4c所示的宽度为8、16、32的宽度自适应算子。
在一些实施例中,节点之间的边对应的候选算子包括激活类算子、时间卷积算子、时间空洞卷积算子、以及自适应全连接算子。
在本公开实施例中,通过利用自动机器学习,能够自动设计更为合适的预测模型的网络架构。进一步,在确定需求量的预测模型的网络架构时,通过采用基于搜索单元的搜索空间,有助于加快需求量的预测模型的网络架构的搜索效率。与此同时,通过构建包含激活类算子、时间卷积算子等算子的搜索空间,有助于得到性能更优的需求量的预测模型的网络架构,进而有助于更好更快地训练需求量的预测模型。
在步骤S140中,根据训练数据集,对预测模型进行训练。
在一些实施例中,从训练数据集中随机抽取部分数据,对预测模型进行迭代训练,直至满足停止条件。例如,停止条件为迭代训练次数达到预设次数,或者,停止条件为预测模型的一个或多个性能指标满足需求。
在本公开实施例中,通过以上步骤能够训练得到针对目标区域目标品类物资的需求量进行预测的模型,提高训练得到的预测模型的性能,进而能够对不同区域不同品类物资的需求量进行更加精准、细粒度的预测。
图2为根据本公开一些实施例的构建训练数据集与验证数据集的流程示意图。如图2所示,构建训练数据集与验证数据集的流程包括步骤S210至步骤S240。
在步骤S210中,根据订单的收货地址信息,确定订单的收货地的经纬度信息。
例如,利用地图服务商提供的接口或自研的接口,将订单的收货地址信息转化为订单的收货地的经纬度信息。
在步骤S220中,根据订单的收货地的经纬度信息,确定订单所属的区域。
在一些实施例中,利用地址编码算法对订单的收货地的经纬度信息进行编码,以得到订单的收货地编码;根据订单的收货地编码,确定订单所属的区域。
例如,采用地理散列(Geohash)算法对订单的收货地的经纬度信息进行编码,以得到订单的收货地编码,然后从收货地编码中截取预设位数即可得到对应的区域编码(ID)。Geohash是一种地址编码算法,它能把二维的经纬度编码成一维的字符串,该字符串表示的不是一个点,而是一个矩形区域。通常情况下,由两个地点的经纬度转换而成的字符串的匹配度越高,表示两个地点之间的距离越近。
在步骤S230中,根据订单中的物品所属类别以及订单所属的区域,对订单中的物品需求量进行聚合,以得到目标区域内的用户群体对目标品类物资的历史需求量。
在一些实施例中,在步骤S230中,根据订单中的物品所属类别以及订单所属的区域,对订单中的物品需求量进行聚合,以得到目标区域内订单覆盖的用户对目标品类物资的历史需求量;将目标区域内订单覆盖的用户对目标品类物资的历史需求量,作为目标区域内的用户群体对目标品类物资的历史需求量。
例如,A区域内的用户群体对主粮类物资的历史需求量具体为近30天内A区域内的用户群体对主粮类物资的历史日需求量序列时,根据订单日期、订单中的物品所属类别、订单所属的区域信息对订单进行筛选,对筛选出来的30天内每一天的订单中主粮类物资的重量分别进行聚合,以得到A区域内订单覆盖的用户对主粮类物资的历史日需求量,并将其作为A区域内的用户群体对主粮类物资的历史日需求序列。
在一些实施例中,在步骤S230中,根据订单中的物品所属类别以及订单所属的区域,对订单中的物品需求量进行聚合,以得到目标区域内的订单覆盖的用户对目标品类物资的历史需求量;根据订单覆盖的用户的数量与目标区域内的用户群体的总数的比值、和目标品类物资的平均需求间隔中的至少一项,以及目标区域内的订单覆盖的用户对目标品类物资的历史需求量,确定目标区域内的用户群体对目标品类物资的历史需求量。
例如,在根据订单数据确定目标区域内的订单覆盖的用户对目标品类物资的历史需求量之后,对订单覆盖的用户的数量与目标区域内的用户群体的总人数的比值、与目标区域内的订单覆盖的用户对目标品类物资的历史需求量进行乘法运算,以得到目标区域内的用户群体对目标品类物资的历史需求量。其中,目标区域内的用户群体可以是指目标区域内的所有居民,也可以是指某一类居民,比如年龄在指定年龄段内的居民。
在本公开实施例中,通过采用如上方式对根据订单数据确定的历史需求量数据进行放大处理,解决了由于用户使用偏好不同,导致订单数据并不能覆盖整个用户群体的需求数据的问题,从而能够在进行预测模型架构搜索、训练之前提高后续模型架构搜索、模型训练所用数据的准确性,进而有助于提高训练得到的预测模型的性能。
例如,在根据订单数据确定目标区域内的订单覆盖的用户对目标品类物资的历史需求量之后,根据目标品类物资的平均需求间隔,对目标区域内的订单覆盖的用户对目标品类物资的历史需求量进行平滑处理,以得到目标区域内的用户群体对目标品类物资的历史需求量。
其中,目标品类物资的平均需求间隔可通过对目标区域的各个用户对该类物资的需求时间间隔进行平均得到。
其中,平滑处理可具体为令目标区域内的订单覆盖的用户对目标品类物资的历史需求量,除以目标品类物资的平均需求间隔。
在本公开实施例中,通过采用如上方式对根据订单数据确定的历史需求量数据进行平滑处理,解决了由于电商平台开展活动等因素导致某些品类物资的订单会集中在特定时间,导致对这些特定时间内的订单中某些品类物资的需求量进行聚合得到的结果并不能真实反映用户群体的日需求量的问题,从而能够在进行预测模型架构搜索、训练之前提高后续模型架构搜索、模型训练所用数据的准确性,进而有助于提高训练得到的预测模型的性能。
例如,在根据订单数据确定目标区域内的订单覆盖的用户对目标品类物资的历史需求量之后,根据目标品类物资的平均需求间隔,对目标区域内的订单覆盖的用户对目标品类物资的历史需求量进行平滑处理,以得到平滑处理后的历史需求量;然后,对订单覆盖的用户的数量与目标区域内的用户群体的总人数的比值、与平滑处理后的历史需求量进行乘法运算,以得到目标区域内的用户群体对目标品类物资的历史需求量。
在本公开实施例中,通过采用如上方式对根据订单数据确定的历史需求量数据进行平滑处理、以及放大处理,能够在进行预测模型架构搜索、训练之前提高后续模型架构搜索、模型训练所用数据的准确性,进而有助于提高训练得到的预测模型的性能。
在步骤S240中,根据目标区域内的用户群体对目标品类物资的历史需求量,构建训练数据集与验证数据集。
在一些实施例中,根据目标区域内的用户群体对目标品类物资的历史需求量、与历史需求量相关的日期数据以及天气数据,构建多条样本数据;根据多条样本数据,构建训练数据集与验证数据集。
例如,获取30天内目标区域内的用户群体对目标品类物资的日需求量序列、以及这30天内每天的日期数据(比如今天是周几、以及是否是节假日等数据)、以及每天的天气数据(比如今天是否下雨等数据),将前15天的日需求量、以及每天的日期数据、每天的天气数据作为输入、将后15天的日需求量作为输出量的标签值,从而得到一条由输入与输出量的标签值组成的样本数据。
在本公开实施例中,通过在构建训练数据集与验证数据集时,不仅考虑目标区域内的用户群体对目标品类物资的历史需求量,还考虑对历史需求量存在影响的日期数据、以及天气数据,有助于提高训练得到的预测模型的性能。
在本公开实施例中,通过对订单按照区域、订单中的物品所属品类进行聚合,得到了目标区域内的用户群体对目标品类物资的历史需求量,便于后续训练得到能够对需求量进行更加精准与细粒度预测的模型。
图3为根据本公开一些实施例的确定预测模型的网络架构的流程示意图。如图3所示,确定预测模型的网络架构的流程包括步骤S310和步骤S320。
在步骤S310中,根据目标品类物资的类别,确定网络架构学习中的损失函数。
在一些实施例中,步骤S310包括:在目标品类物资为必需品的情况下,将第一损失函数作为网络架构学习中的损失函数;在目标品类物资为非必需品的情况下,将第二损失函数作为网络架构学习中的损失函数,所述第二损失函数与所述第一损失函数不同。
在一些实施例中,第一损失函数为非对称损失函数,且满足:当目标品类物资的需求量的预测值大于标签值时,根据预测值与标签值的差值确定第一损失函数的取值;当目标品类物资的需求量的预测值小于或等于标签值时,根据预测值与标签值的差值、以及设置的惩罚因子确定第一损失函数的取值。
例如,当目标品类物资的需求量的预测值大于标签值时,将预测值与标签值的差值作为第一损失函数的取值;当目标品类物资的需求量的预测值小于或等于标签值时,对预测值与标签值的差值、和设置的惩罚因子进行乘法运算,以得到第一损失函数的取值,其中,惩罚因子为大于1的正数。
在一些实施例中,第二损失函数为均方误差(Mean Square Error,MSE)函数。
在本公开实施例中,通过根据目标品类物资的类别,确定网络架构学习中的损失函数,能够针对不同类别的物资,设置更为恰当的损失函数,进而有助于得到更优的预测模型的网络架构。
在步骤S320中,根据训练数据集与验证数据集,以最小化网络架构学习中的损失函数为目标,从搜索空间中确定预测模型的网络架构。
在一些实施例中,采用基于梯度的网络架构搜索方法,从搜索空间中搜索出预测模型的网络架构,该网络架构搜索过程为一个两层级有约束优化过程。
在一些实施例中,步骤S320包括步骤S321至步骤S325。
在步骤S321中,从搜索空间中确定候选网络结构。
在一些实施例中,搜索空间包括多个依次连接的搜索单元,每个搜索单元包括多个节点、以及多个节点之间的边对应的候选算子。
例如,每个搜索单元包括(0)、(1)、(2)三个节点,其中(0)表示输入节点,连接上一个搜索单元的输出节点或者模型输入,(2)表示输出结点,连接下一个搜搜单元的输入节点或预测网络层(用于产生最终的需求量预测值)。并且,在(0)到(1)之间、(1)到(2)之间、(0)到(2)之间都有一个候选算子集合,每个候选算子集合包含激活类算子、时间卷积算子、时间空洞卷积算子、以及自适应全连接算子。
在步骤S322中,根据训练数据集,对候选网络结构的模型参数进行调整,以得到调整后的模型参数。
例如,在训练集中随机选择一批数据计算损失函数值、梯度值,根据计算结果对候选网络结构的模型参数进行调整。
在步骤S323中,根据验证数据集,以调整后的模型参数为约束,以最小化网络架构学习中的损失函数为目标,对候选网络结构的模型结构进行调整。
例如,在根据步骤S322得到的调整后的模型参数的约束下,在验证集中随机选择一批数据计算损失函数值、梯度值,根据计算结果对候选网络结构的模型参数进行调整。
在步骤S324中,迭代执行模型参数调整步骤与模型结构调整步骤,直至满足模型结构收敛条件,以得到模型结构信息。
例如,步骤S322与步骤S323按照固定的编排交替进行,直至模型结构收敛,得到模型结构信息。例如,模型结构信息包括节点之间的边对应的候选算子的权重信息。例如,某一边对应的候选算子为激活类算子、时间卷积算子、时间空洞卷积算子、以及自适应全连接算子,这些候选算子的权重分别为0.1、0.2、0.1、0.6。
在步骤S325中,根据模型结构信息,构建预测模型的网络架构。
例如,当模型结构信息包括候选算子的权重信息时,从每条边对应的候选算子中选择权重最大的候选算子,根据每条边对应的权重最大的候选算子,构建预测模型的网络架构。
在本公开实施例中,通过基于以上步骤能够更加快速地搜索到更优的预测模型的网络架构。进一步,通过设计独特的网络架构搜索空间,有助于进一步加快搜索速度,以及提高最终搜索到的预测模型的网络架构的性能。
图4a为根据本公开一些实施例的确定预测模型的网络架构的原理示意图。图4b为根据本公开一些实施例的确定预测模型的网络架构的原理示意图。以下结合图4a、4b对确定预测模型的网络架构的流程进行说明。
如图4a所示,在确定预测模型的网络架构时,需要确定以下要素:候选算子集合410、搜索空间420、搜索策略430以及评估策略440。
在本公开一些实施例中,确定的候选算子集合410包括:激活函数、自适应全连接网络(算子)、卷积算子、时间卷积算子、残差链接(算子)、循环网络算子、自注意力算子、时间空洞卷积算子。
在确定候选算子集合以后,从候选算子集合中选择多个算子组成混合算子,再通过不同的算子间连接方式构建搜索单元,将多个搜索单元依次连接,以形成待搜索“超”网络(即搜索空间420)。
其中,每个搜索单元可看作一个有向无环图。搜索单元包含的节点代表神经网络的层,节点之间的边代表数据的流动,每条边对应混合算子。
如图4b所示,搜索单元421包括多个节点(即图中圆圈,节点之间的边对应混合算子,混合算子中每一个的权重依次为a1、a2、a3、a4、a5。在网络架构搜索期间,基于输入x和混合算子,利用图4b中的Softmax函数计算输出y。在搜索完成后的模型训练阶段,基于输入x和权重最大的算子,计算输出y。
在本公开实施例中,通过设计包含诸如时间卷积算子、循环网络算子、自适应全连接网络算子等多种算子在内的搜索空间,较为全面的支撑了不同地区不同类型物资需求量的预测需求。
在本公开一些实施例中,搜索策略430采用基于梯度的搜索算法,评估策略440采用共享参数的评估策略。利用以上搜索策略和评估策略,以从混合算子中选择算子以及选择每个搜索单元内的连边,从而最终得到预测模型的网络架构。网络架构搜索过程为一个两层级有约束优化过程,包括:在模型结构固定时,在训练集上以选取使损失函数最小的模型参数为目标,对模型参数进行调整;在调整后的模型参数的约束下,在验证集上以选取使损失函数最小的算子权重为目标,对模型结构进行调整。
在基于搜索空间420、搜索策略430以及评估策略440进行网络架构搜索后,可得到如图4a所示出的示例性的最优网络架构450。
图5为根据本公开一些实施例的确定物资需求量的流程示意图。如图5所示,确定物资需求量的流程包括步骤S510至步骤S530。
在步骤S510中,根据订单数据,确定待预测区域内的用户群体对待预测品类物资的历史需求量。
在一些实施例中,确定物资需求量的方法由确定物资需求量的装置执行。
在一些实施例中,步骤S510具体包括步骤S511至步骤S513。
在步骤S511中,根据订单的收货地址信息,确定订单的收货地的经纬度信息。
在步骤S512中,根据订单的收货地的经纬度信息,确定订单所属的区域。
在步骤S513中,根据订单中的物品所属类别以及订单所属的区域,对订单中的物品需求量进行聚合,以得到待预测区域内的用户群体对待预测品类物资的历史需求量。
在一些实施例中,步骤S513包括:根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到所述待预测区域内订单覆盖的用户对待预测品类物资的历史需求量;将所述待预测区域内订单覆盖的用户对待预测品类物资的历史需求量,作为所述待预测区域内的用户群体对待预测品类物资的历史需求量。
在另一些实施例中,步骤S513包括:根据订单中的物品所属类别以及订单所属的区域,对订单中的物品需求量进行聚合,以得到待预测区域内订单覆盖的用户对待预测品类物资的历史需求量;根据待预测区域内订单覆盖的用户的数量与待预测区域内的用户群体的总数的比值、和待预测品类物资的平均需求间隔中的至少一项,以及待预测区域内订单覆盖的用户对待预测品类物资的历史需求量,确定待预测区域内的用户群体对待预测品类物资的历史需求量。
例如,在根据订单数据确定目标区域内的订单覆盖的用户对目标品类物资的历史需求量之后,根据目标品类物资的平均需求间隔,对目标区域内的订单覆盖的用户对目标品类物资的历史需求量进行平滑处理,以得到平滑处理后的历史需求量;然后,对订单覆盖的用户的数量与目标区域内的用户群体的总人数的比值、与平滑处理后的历史需求量进行乘法运算,以得到目标区域内的用户群体对目标品类物资的历史需求量。
在本公开实施例中,通过在利用预测模型对需求量进行预测之前,采用如上方式对根据订单数据确定的历史需求量数据进行修正处理,有助于提高最终得到的需求量预测结果的准确性。
在步骤S520中,获取与待预测区域以及待预测品类物资匹配的预测模型。
例如,根据任务要求的待预测区域、以及待预测品类物资信息,从数据库中提取匹配的预测模型。
在一些实施例中,根据本公开提供的预测模型的训练方法训练得到数据库中的预测模型。
在步骤S530中,利用匹配的预测模型,对待预测区域内的用户群体对待预测品类物资的历史需求量进行处理,以得到待预测区域内的用户群体对待预测品类物资的未来的需求量。
在一些实施例中,在利用预测模型对需求量进行预测之前,没有对根据订单数据确定的历史需求量数据进行修正,而是在利用预测模型对需求量进行预测之后,对根据订单数据确定的历史需求量数据进行修正。例如,根据待预测区域内订单覆盖的用户的数量与待预测区域内的用户群体的总数的比值、和待预测品类物资的平均需求间隔中的至少一项,对预测模型输出的待预测区域内的用户群体对待预测品类物资的未来的需求量进行修正。
在本公开实施例中,通过在利用预测模型对需求量进行预测之后,采用如上方式对模型输出结果进行修正处理,有助于提高最终得到的需求量预测结果的准确性。
在一些实施例中,在步骤S530之后,确定物资需求量的方法还包括步骤S540和步骤S550。
在步骤S540中,获取候选供应商信息。
在步骤S550中,根据待预测区域内的用户群体对待预测品类物资的未来的需求量、以及候选供应商信息,以最小化物资供应成本为目标,确定物资供需匹配方案。
例如,根据预测得到的区域需求数据、以及获取的候选供应商信息,利用KM算法或者网络流方法等最优二分匹配算法进行供需配对,以得到物资供应成本最小的物资供需匹配方案。
在本公开实施例中,通过以上步骤能够更加精准、细粒度地预测不同区域的居民对不同品类物资的需求量,进而有助于降低居民物资供应中的物流成本与物资损耗。
图6为根据本公开另一些实施例的确定物资需求量的流程示意图。如图6所示,确定物资需求量的流程包括步骤S610至步骤S630。
在步骤S610中,构造数据集。
例如,对数据库中的订单信息表与收货地址信息表进行关联,得到带有收货地址的订单信息;根据订单的收货地址,确定订单的收货地的经纬度;基于地址编码算法对订单的收货地的经纬度进行编码,以得到订单所属区域的编码(例如订单的Geohash编码);根据订单中物品所属品类、以及订单所属区域的编码,对订单进行聚合,以得到目标区域内的用户群体对目标品类物资的需求量序列;根据目标区域内的用户群体对目标品类物资的需求量序列构建训练数据集与验证数据集。
在步骤S620中,对预测模型进行离线训练。
例如,根据训练数据集与验证数据集,从设计的搜索空间中进行最优架构搜索,以得到预测模型的最优网络架构;对预测模型进行训练,并将训练后的预测模型存入深度预测模型库。
在步骤S630中,利用模型进行在线推断预测。
例如,根据需求预测任务选定待预测区域以及待预测物资品类;根据待预测区域以及待预测物资品类对订单数据进行处理,以提取出近期需求序列;根据待预测区域以及待预测物资品类,从深度预测模型库中检索出相应的已训练模型;利用该已训练模型,对近期需求序列进行处理,以预测得到待预测区域的用户群体对待预测品类物资的未来的需求量。
在本公开实施例中,通过以上步骤能够对不同区域不同品类物资的需求量进行更加精准、细粒度的预测,进而有助于降低居民物资供应中的物流成本与物资损耗。
图7为根据本公开一些实施例的物资供需匹配方法的流程示意图。如图7所示,物资供需匹配方法包括以下流程:选定待预测区域及待预测品类物资;从数据库中查询相关订单数据并聚合为历史需量求序列;利用与待预测区域及待预测品类物资匹配的预测模型,对历史需求量序列进行处理,以得到待预测区域内的用户群体对待预测品类物资的未来需求量序列;查询候选供应商信息;根据候选供应商信息、以及未来需求量序列,确定最优的物资供需匹配方案。
在本公开实施例中,利用订单数据分析城市指定区域内居民生活物资的需求,并匹配最优的供应商,有助于减少居民物资供应中的物流成本与物资损耗。
图8为根据本公开一些实施例的预测模型的训练装置的结构示意图。如图8所示,预测模型的训练装置800包括历史需求量确定模块810、数据集构建模块820、网络架构确定模块830、训练模块840。
历史需求量确定模块810,被配置为根据订单数据,确定目标区域内的用户群体对目标品类物资的历史需求量。
数据集构建模块820,被配置为根据目标区域内的用户群体对目标品类物资的历史需求量,构建训练数据集与验证数据集。
网络架构确定模块830,被配置为根据训练数据集与验证数据集,从搜索空间中确定预测模型的网络架构。其中,预测模型用于预测目标区域内的用户群体对目标品类物资的未来的需求量。
训练模块840,被配置为根据训练数据集,对预测模型进行训练。
在本公开实施例中,通过以上装置能够训练得到针对目标区域目标品类物资的需求量进行预测的模型,提高训练得到的预测模型的性能,进而能够对不同区域不同品类物资的需求量进行更加精准、细粒度的预测。
图9为根据本公开一些实施例的确定物资需求量的装置的结构示意图。如图9所示,确定物资需求量的装置900包括确定模块910、获取模块920、以及预测模块930。
确定模块910,被配置为根据订单数据,确定待预测区域内的用户群体对待预测品类物资的历史需求量。
获取模块920,被配置为被配置为获取与待预测区域以及待预测品类物资匹配的预测模型。其中,预测模型为根据本公开提供的预测模型的训练方法训练得到。
预测模块930,被配置为利用匹配的预测模型,对待预测区域内的用户群体对待预测品类物资的历史需求量进行处理,以得到待预测区域内的用户群体对待预测品类物资的未来的需求量。
在本公开实施例中,通过以上装置能够更加精准、细粒度地预测不同区域的居民对不同品类物资的需求量,进而有助于降低居民物资供应中的物流成本与物资损耗。
图10为根据本公开一些实施例的电子设备的结构示意图。
如图10所示,电子设备1000包括存储器1010;以及耦接至该存储器1010的处理器1020。存储器1010用于存储执行预测模型的训练方法或确定物资需求量的方法对应实施例的指令。处理器1020被配置为基于存储在存储器1010中的指令,执行本公开中任意一些实施例中的预测模型的训练方法或确定物资需求量的方法。
图11为根据本公开一些实施例的计算机系统的结构示意图。
如图11所示,计算机系统1100可以通用计算设备的形式表现。计算机系统1100包括存储器1110、处理器1120和连接不同系统组件的总线1130。
存储器1110例如可以包括系统存储器、非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)以及其他程序等。系统存储器可以包括易失性存储介质,例如随机存取存储器(RAM)和/或高速缓存存储器。非易失性存储介质例如存储有执行中的至少一种预测模型的训练方法或确定物资需求量的方法的对应实施例的指令。非易失性存储介质包括但不限于磁盘存储器、光学存储器、闪存等。
处理器1120可以用通用处理器、数字信号处理器(DSP)、应用专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑设备、分立门或晶体管等分立硬件组件方式来实现。相应地,诸如历史需求量确定模块、数据集构建模块等的每个模块,可以通过中央处理器(CPU)运行存储器中执行相应步骤的指令来实现,也可以通过执行相应步骤的专用电路来实现。
总线1130可以使用多种总线结构中的任意总线结构。例如,总线结构包括但不限于工业标准体系结构(ISA)总线、微通道体系结构(MCA)总线、外围组件互连(PCI)总线。
计算机系统1100这些接口1140、1150、1160以及存储器1110和处理器1120之间可以通过总线1130连接。输入输出接口1140可以为显示器、鼠标、键盘等输入输出设备提供连接接口。网络接口1150为各种联网设备提供连接接口。存储接口1160为软盘、U盘、SD卡等外部存储设备提供连接接口。
这里,参照根据本公开实施例的方法、装置和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个框以及各框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可提供到通用计算机、专用计算机或其他可编程装置的处理器,以产生一个机器,使得通过处理器执行指令产生实现在流程图和/或框图中一个或多个框中指定的功能的装置。
这些计算机可读程序指令也可存储在计算机可读存储器中,这些指令使得计算机以特定方式工作,从而产生一个制造品,包括实现在流程图和/或框图中一个或多个框中指定的功能的指令。
本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。
通过上述实施例中的预测模型的训练、确定物资需求量的方法和装置,能够提高训练得到的针对目标区域目标品类物资的需求量进行预测的模型的性能,进而能够对不同区域不同品类物资的需求量进行更加精准、细粒度的预测。
至此,已经详细描述了根据本公开的预测模型的训练方法、确定物资需求量的方法和装置。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
Claims (21)
1.一种预测模型的训练方法,包括:
根据订单数据,确定目标区域内的用户群体对目标品类物资的历史需求量;
根据所述目标区域内的用户群体对目标品类物资的历史需求量,构建训练数据集与验证数据集;
根据所述训练数据集与所述验证数据集,从搜索空间中确定预测模型的网络架构,所述预测模型用于预测目标区域内的用户群体对目标品类物资的未来的需求量;
根据所述训练数据集,对所述预测模型进行训练。
2.根据权利要求1所述的预测模型的训练方法,其中,所述根据订单数据,确定目标区域内的用户群体对目标品类物资的历史需求量包括:
根据订单的收货地址信息,确定所述订单的收货地的经纬度信息;
根据所述订单的收货地的经纬度信息,确定所述订单所属的区域;
根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到目标区域内的用户群体对目标品类物资的历史需求量。
3.根据权利要求2所述的预测模型的训练方法,其中,所述根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到目标区域内的用户群体对目标品类物资的历史需求量包括:
根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到所述目标区域内的订单覆盖的用户对目标品类物资的历史需求量;
根据所述订单覆盖的用户的数量与所述目标区域内的用户群体的总数的比值、和所述目标品类物资的平均需求间隔中的至少一项,以及所述目标区域内的订单覆盖的用户对目标品类物资的历史需求量,确定所述目标区域内的用户群体对目标品类物资的历史需求量。
4.根据权利要求1所述的预测模型的训练方法,其中,所根据所述训练数据集与验证数据集,从搜索空间中确定预测模型的网络架构包括:
根据所述目标品类物资的类别,确定网络架构学习中的损失函数;
根据所述训练数据集与验证数据集,以最小化所述网络架构学习中的损失函数为目标,从搜索空间中确定预测模型的网络架构。
5.根据权利要求4所述的预测模型的训练方法,其中,所述根据所述目标品类物资的类别,确定网络架构学习中的损失函数包括:
在所述目标品类物资为必需品的情况下,将第一损失函数作为网络架构学习中的损失函数;
在所述目标品类物资为非必需品的情况下,将第二损失函数作为网络架构学习中的损失函数,所述第二损失函数与所述第一损失函数不同。
6.根据权利要求5所述的预测模型的训练方法,其中,所述第一损失函数为非对称损失函数,且满足:
当目标品类物资的需求量的预测值大于标签值时,根据所述预测值与标签值的差值确定第一损失函数的取值;
当目标品类物资的需求量的预测值小于或等于标签值时,根据所述预测值与标签值的差值、以及设置的惩罚因子确定第一损失函数的取值。
7.根据权利要求4所述的预测模型的训练方法,其中,所述根据所述训练数据集与验证数据集,以最小化所述网络架构学习中的损失函数为目标,从搜索空间中确定预测模型的网络架构包括:
从所述搜索空间中确定候选网络结构;
根据所述训练数据集,对所述候选网络结构的模型参数进行调整,以得到调整后的模型参数;
根据所述验证数据集,以所述调整后的模型参数为约束,以最小化所述网络架构学习中的损失函数为目标,对所述候选网络结构的模型结构进行调整;
迭代执行模型参数调整步骤与模型结构调整步骤,直至满足模型结构收敛条件,以得到模型结构信息;
根据所述模型结构信息,构建所述预测模型的网络架构。
8.根据权利要求1所述的预测模型的训练方法,其中,所述根据所述目标区域内的用户群体对目标品类物资的历史需求量,构建训练数据集与验证数据集包括:
根据所述目标区域内的用户群体对目标品类物资的历史需求量、与所述历史需求量相关的日期数据以及天气数据,构建多条样本数据;
根据所述多条样本数据,构建训练数据集与验证数据集。
9.根据权利要求1至8任一所述的预测模型的训练方法,其中,所述搜索空间包括多个依次连接的搜索单元,每个搜索单元包括多个节点、以及多个节点之间的边对应的候选算子。
10.根据权利要求9所述的预测模型的训练方法,其中,所述多个节点之间的边对应的候选算子包括循环网络算子、自注意力算子、连接类算子、激活类算子、卷积算子、时间卷积算子、时间空洞卷积算子、自适应全连接算子中的至少一项。
11.根据权利要求9所述的预测模型的训练方法,其中,所述多个节点之间的边对应的候选算子包括激活类算子、时间卷积算子、时间空洞卷积算子、以及自适应全连接算子。
12.一种确定物资需求量的方法,包括:
根据订单数据,确定待预测区域内的用户群体对待预测品类物资的历史需求量;
获取与待预测区域以及待预测品类物资匹配的预测模型,所述预测模型为根据权利要求1至11中任一所述的预测模型的训练方法训练得到;
利用所述匹配的预测模型,对所述待预测区域内的用户群体对待预测品类物资的历史需求量进行处理,以得到所述待预测区域内的用户群体对待预测品类物资的未来的需求量。
13.根据权利要求12所述的确定物资需求量的方法,其中,根据订单数据,确定待预测区域内的用户群体对待预测品类物资的历史需求量包括:
根据订单的收货地址信息,确定所述订单的收货地的经纬度信息;
根据所述订单的收货地的经纬度信息,确定所述订单所属的区域;
根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到待预测区域内的用户群体对待预测品类物资的历史需求量。
14.根据权利要求13所述的确定物资需求量的方法,其中,所述根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到待预测区域内的用户群体对待预测品类物资的历史需求量包括:
根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到所述待预测区域内订单覆盖的用户对待预测品类物资的历史需求量;
根据所述待预测区域内订单覆盖的用户的数量与所述待预测区域内的用户群体的总数的比值、和所述待预测品类物资的平均需求间隔中的至少一项,以及所述待预测区域内订单覆盖的用户对待预测品类物资的历史需求量,确定所述待预测区域内的用户群体对待预测品类物资的历史需求量。
15.根据权利要求13所述的确定物资需求量的方法,其中,所述根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到待预测区域内的用户群体对待预测品类物资的历史需求量包括:
根据订单中的物品所属类别以及所述订单所属的区域,对所述订单中的物品需求量进行聚合,以得到所述待预测区域内订单覆盖的用户对待预测品类物资的历史需求量;
将所述待预测区域内订单覆盖的用户对待预测品类物资的历史需求量,作为所述待预测区域内的用户群体对待预测品类物资的历史需求量。
16.根据权利要求15所述的确定物资需求量的方法,还包括:
根据所述待预测区域内订单覆盖的用户的数量与所述待预测区域内的用户群体的总数的比值、和所述待预测品类物资的平均需求间隔中的至少一项,对所述待预测区域内的用户群体对待预测品类物资的未来的需求量进行修正。
17.根据权利要求12至16任一所述的确定物资需求量的方法,还包括:
获取候选供应商信息;
根据所述待预测区域内的用户群体对待预测品类物资的未来的需求量、以及所述候选供应商信息,以最小化物资供应成本为目标,确定物资供需匹配方案。
18.一种预测模型的训练装置,包括:
历史需求量确定模块,被配置为根据订单数据,确定目标区域内的用户群体对目标品类物资的历史需求量;
数据集构建模块,被配置为根据所述目标区域内的用户群体对目标品类物资的历史需求量,构建训练数据集与验证数据集;
网络架构确定模块,被配置为根据所述训练数据集与所述验证数据集,从搜索空间中确定预测模型的网络架构所述预测模型用于预测目标区域内的用户群体对目标品类物资的未来的需求量;
训练模块,被配置为根据所述训练数据集,对所述预测模型进行训练。
19.一种确定物资需求量的装置,包括:
确定模块,被配置为根据订单数据,确定待预测区域内的用户群体对待预测品类物资的历史需求量;
获取模块,被配置为获取与待预测区域以及待预测品类物资匹配的预测模型,所述预测模型为根据权利要求1至11中任一所述的预测模型的训练方法训练得到;
预测模块,被配置为利用所述匹配的预测模型,对所述待预测区域内的用户群体对待预测品类物资的历史需求量进行处理,以得到所述待预测区域内的用户群体对待预测品类物资的未来的需求量。
20.一种电子设备,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行权利要求1至11任一所述的预测模型的训练方法,或权利要求12至17任一所述的确定物资需求量的方法。
21.一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现权利要求1至11任一项所述的预测模型的训练方法,或权利要求12至17任一所述的确定物资需求量的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310708372.9A CN116777056A (zh) | 2023-06-14 | 2023-06-14 | 预测模型的训练、确定物资需求量的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310708372.9A CN116777056A (zh) | 2023-06-14 | 2023-06-14 | 预测模型的训练、确定物资需求量的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116777056A true CN116777056A (zh) | 2023-09-19 |
Family
ID=88012699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310708372.9A Pending CN116777056A (zh) | 2023-06-14 | 2023-06-14 | 预测模型的训练、确定物资需求量的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116777056A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117974011A (zh) * | 2024-04-01 | 2024-05-03 | 国网浙江省电力有限公司宁波供电公司 | 动态感知物资需求的采购决策方法、装置、设备及介质 |
-
2023
- 2023-06-14 CN CN202310708372.9A patent/CN116777056A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117974011A (zh) * | 2024-04-01 | 2024-05-03 | 国网浙江省电力有限公司宁波供电公司 | 动态感知物资需求的采购决策方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jiang et al. | A method to determine generalized basic probability assignment in the open world | |
Bashar et al. | Performance of machine learning algorithms in predicting the pavement international roughness index | |
WO2021135562A1 (zh) | 特征有效性评估方法、装置、电子设备及存储介质 | |
Li et al. | Analysis of attribute weighting heuristics for analogy-based software effort estimation method AQUA+ | |
Liu et al. | Particle Swarm Optimization‐Based Support Vector Regression for Tourist Arrivals Forecasting | |
Hung et al. | Answer validation for generic crowdsourcing tasks with minimal efforts | |
Jaini et al. | Trade‐off ranking method for multi‐criteria decision analysis | |
Donate et al. | Evolutionary optimization of sparsely connected and time-lagged neural networks for time series forecasting | |
Bodner et al. | Making predictive modelling ART: accurate, reliable, and transparent | |
Chen et al. | Do different cross‐project defect prediction methods identify the same defective modules? | |
Le et al. | A multi-criteria collaborative filtering approach using deep learning and Dempster-Shafer theory for hotel recommendations | |
CN116777056A (zh) | 预测模型的训练、确定物资需求量的方法和装置 | |
Alizadeh et al. | Simulating monthly streamflow using a hybrid feature selection approach integrated with an intelligence model | |
Vilaysouk et al. | Semisupervised machine learning classification framework for material intensity parameters of residential buildings | |
Pourmohseni et al. | A computational trust model for social IoT based on interval neutrosophic numbers | |
Yuan et al. | Intuitionistic Trapezoidal Fuzzy Group Decision‐Making Based on Prospect Choquet Integral Operator and Grey Projection Pursuit Dynamic Cluster | |
CN113785317A (zh) | 使用因领域而异的建模来进行反馈挖掘 | |
Abolghasemi et al. | Predicting missing pairwise preferences from similarity features in group decision making | |
Zhao et al. | Improving Top‐N Recommendation Performance Using Missing Data | |
Xu et al. | An ensemble learning method based on an evidential reasoning rule considering combination weighting | |
Baratchi et al. | Automated machine learning: past, present and future | |
Li et al. | Genetic algorithm and graph theory based matrix factorization method for online friend recommendation | |
Zhang et al. | Regional economic prediction model using backpropagation integrated with bayesian vector neural network in big data analytics | |
Keya et al. | Recurrent ALBERT for recommendation: A hybrid architecture for accurate and lightweight restaurant recommendations | |
Shofade | Considering hierarchical structure of criteria in ELECTRE decision aiding methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |