CN116402241B - 一种基于多模型的供应链数据预测方法及装置 - Google Patents

一种基于多模型的供应链数据预测方法及装置 Download PDF

Info

Publication number
CN116402241B
CN116402241B CN202310672346.5A CN202310672346A CN116402241B CN 116402241 B CN116402241 B CN 116402241B CN 202310672346 A CN202310672346 A CN 202310672346A CN 116402241 B CN116402241 B CN 116402241B
Authority
CN
China
Prior art keywords
online
samples
target
offline
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310672346.5A
Other languages
English (en)
Other versions
CN116402241A (zh
Inventor
朱海洋
周俊
陈为
肖杰
胡健
季永炜
郑励
陈晓丰
童高强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Products Zhongda Digital Technology Co ltd
Zhejiang University ZJU
Original Assignee
Products Zhongda Digital Technology Co ltd
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Products Zhongda Digital Technology Co ltd, Zhejiang University ZJU filed Critical Products Zhongda Digital Technology Co ltd
Priority to CN202310672346.5A priority Critical patent/CN116402241B/zh
Publication of CN116402241A publication Critical patent/CN116402241A/zh
Application granted granted Critical
Publication of CN116402241B publication Critical patent/CN116402241B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Operations Research (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例提供一种基于多模型的供应链数据预测方法,在训练阶段,将离线的供应链数据集切分为多批离线样本,然后分别基于该多批离线样本,训练不同的机器学习模型,得到多个预测模型。在预测阶段,先将在线的供应链数据集切分为多批在线样本。然后针对每批在线样本,从多批离线样本中确定出与其最相似的一批离线样本,并利用对应于该批离线样本的目标预测模型,针对该批在线样本进行预测,得到其中的各个在线样本的预测结果。由此,可以有效地解决数据漂移问题,进而可以提高数据预测的准确率。

Description

一种基于多模型的供应链数据预测方法及装置
技术领域
本说明书一个或多个实施例涉及机器学习领域,尤其涉及一种基于多模型的供应链数据预测方法及装置。
背景技术
大型供应链集成服务企业集团在推进数字化转型赋能管理提升、业务发展的过程中,需要建设供应链大数据中心,并结合实际的管理或业务应用场景,采用大数据及人工智能算法,构建相应的供应链数据模型(以下简称数据模型),挖掘数据背后隐藏的价值为企业管理提升、业务发展赋能。从目前的发展趋势来看,数据模型对机器学习(machinelearning,ML)技术的依赖度越来越高。然而,这些数据模型很容易受到数据漂移问题(如数据源的变化、采样偏差、环境变化等)的影响,当这些因素改变了数据的特征分布时,即过去的训练数据和未来的预测数据不匹配,数据模型可能无法适应新的数据分布,从而导致模型性能下降、预测偏差增加、数据实效、模型泛化能力降低、预测稳定性降低,从而给数据价值挖掘带来严重的后果。例如,构建跨企业多供应链环节异常分析模型的过程中发现,在测试数据上的模型验证效果较好,但在实际上线部署以后模型的效果会快速下降。经过分析后发现,由于库存异动、物流中断、船只压港、超载超限、疲劳驾驶及运输路线等供应链环节不断了产生新的变化,从而出现了新的异常情况。也就是说,如果继续采用以前的分析方法来识别新的供应链异常情况,供应链环节异常分析的结果通常是不准确的。
针对数据漂移的问题,现存的解决方案,要么通过重新训练的方法,要么通过对训练样本进行加权的方法来解决数据漂移的问题。然而,这些方法准确率低,不能解决数据化转型实践过程中存在的问题。
发明内容
本说明书一个或多个实施例描述了一种基于多模型的供应链数据预测方法及装置,可以消除数据漂移,从而可以提高数据预测的准确率。
第一方面,提供了一种基于多模型的供应链数据预测方法,所述多模型包括树模型和多个预测模型,其中,所述树模型基于离线的供应链数据集训练得到,所述多个预测模型分别基于针对所述离线的供应链数据集切分的多批离线样本,训练不同的机器学习模型而得到;所述方法包括:
获取在线的供应链数据集,并将其切分为多批在线样本;
针对所述多批在线样本中任意的第p批在线样本,将其输入所述树模型,并统计落入所述树模型的各个叶子节点的在线样本数目;
从所述各个叶子节点中确定出对应的在线样本数目最大的目标叶子节点,并从目标矩阵中查询所述目标叶子节点所对应行中的各目标矩阵元素;所述目标矩阵的一行对应于一个叶子节点,一列对应于一个批次的离线样本,且其中第i行第j列的矩阵元素,表示第j列对应的一个批次的离线样本落入第i行对应的叶子节点的离线样本数目;
根据所述各目标矩阵元素中最大的目标矩阵元素所在列,从所述多批离线样本中确定出目标批次的离线样本;
将所述第p批在线样本,输入所述多个预测模型中对应于所述目标批次的离线样本的第一目标预测模型,得到其中的各个在线样本的第一预测结果;
至少基于所述各个在线样本的第一预测结果,确定所述各个在线样本的最终预测结果。
第二方面,提供了一种基于多模型的供应链数据预测装置,所述多模型包括树模型和多个预测模型,其中,所述树模型基于离线的供应链数据集训练得到,所述多个预测模型分别基于针对所述离线的供应链数据集切分的多批离线样本,训练不同的机器学习模型而得到;所述装置包括:
获取单元,用于获取在线的供应链数据集,并将其切分为多批在线样本;
统计单元,用于针对所述多批在线样本中任意的第p批在线样本,将其输入所述树模型,并统计落入所述树模型的各个叶子节点的在线样本数目;
查询单元,用于从所述各个叶子节点中确定出对应的在线样本数目最大的目标叶子节点,并从目标矩阵中查询所述目标叶子节点所对应行中的各目标矩阵元素;所述目标矩阵的一行对应于一个叶子节点,一列对应于一个批次的离线样本,且其中第i行第j列的矩阵元素,表示第j列对应的一个批次的离线样本落入第i行对应的叶子节点的离线样本数目;
确定单元,用于根据所述各目标矩阵元素中最大的目标矩阵元素所在列,从所述多批离线样本中确定出目标批次的离线样本;
输入单元,用于将所述第p批在线样本,输入所述多个预测模型中对应于所述目标批次的离线样本的第一目标预测模型,得到其中的各个在线样本的第一预测结果;
所述确定单元,还用于至少基于所述各个在线样本的第一预测结果,确定所述各个在线样本的最终预测结果。
本说明书一个或多个实施例提供的基于多模型的供应链数据预测方法及装置,在训练阶段,将离线的供应链数据集切分为多批离线样本,然后分别基于该多批离线样本,训练不同的机器学习模型,得到多个预测模型。在预测阶段,先将在线的供应链数据集切分为多批在线样本。然后针对每批在线样本,从多批离线样本中确定出与其最相似的一批离线样本,并利用对应于该批离线样本的目标预测模型,针对该批在线样本进行预测,得到其中的各个在线样本的预测结果;如此得到在线的供应链数据集中各个供应链数据的预测结果。由此,可以有效地解决数据漂移问题,进而可以提高数据预测的准确率。
附图说明
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书披露的一个实施例的实施场景示意图;
图2示出根据一个实施例的模型训练方法流程图;
图3示出根据一个实施例的一种基于多模型的供应链数据预测方法流程图;
图4示出根据一个实施例的一种基于多模型的供应链数据预测装置示意图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
图1为本说明书披露的一个实施例的实施场景示意图。图1中,多批训练装置和在线推理装置组成预测系统,该预测系统用于针对供应链数据进行预测。
具体地,可以先获取离线的供应链数据集,并将其切分为多批离线样本。之后,可以将该多批离线样本输入多批训练装置,以利用该多批训练装置,分别基于该多批离线样本训练多个预测模型。
之后,可以获取在线的供应链数据集,并将其切分为多批在线样本,以及将该多批在线样本输入在线推理装置,以利用该在线推理装置,针对每批在线样本,从多批离线样本中确定出与其最相似的一批离线样本,并利用对应于该批离线样本的目标预测模型,针对该批在线样本进行预测,得到其中的各个在线样本的预测结果;如此得到在线的供应链数据集中各个供应链数据的预测结果。
本方案中可以通过两种搜索方法针对每批离线样本,搜索与其最相似的一批离线样本,后续对此进行详细说明。
总之,通过上述预测系统中的多批训练装置,可以对离线的供应链数据集进行切分,且分别基于切分的各个离线子集,可以训练得到多个预测模型,以便于后续在针对在线的供应链数据集进行预测时进行匹配选择。上述在线推理装置,可以对在线的供应链数据集进行切分,并针对切分的每个在线子集,可以从各个离线子集中确定出最相似的离线子集,并利用基于该离线子集训练的预测模型进行该在线子集的预测,由此可以消除数据漂移现象。
以下对利用多批训练装置训练多个预测模型的方法进行详细说明。
图2示出根据一个实施例的模型训练方法流程图。该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如图2所示,该方法可以包括如下步骤。
步骤S202,获取离线的供应链数据集,并将其切分为多批离线样本。
需要说明,上述离线的供应链数据集中的每个供应链数据可以包括样本特征和样本标签。其中样本特征可以包括,库存特征、生产特征和销售特征等,样本标签可以用于指示对应供应链数据的销量(回归值),或者用于指示对应供应链数据是否具有风险(分类值)。
具体地,上述库存特征包括以下中的至少一项:仓库所在省市区、仓储运输资源、库房、库位、物料类别、物料名称、规格型号、计量单位、当前库存数、历史最高库存数、历史最低库存数、平均库存时间、库存同比以及库存环比等。
上述生产特征包括以下中的至少一项:生产厂商、生产厂商所在省市区、物料类别、物料名称、规格型号、计量单位、产能、日产量、生产周期、本月累计产量、本年累计产量、产量同比以及产量环比等。
所述销售特征包括以下中的至少一项:合同编号、合同数量、合同时间、客户名称、客户所在省市区、客户信用等级、客户授信额度、订单编号、订单数量、订单时间、提货单编号、提货单数量、提货单时间、物料类别、物料名称、规格型号、计量单位、本月累计出库数、本年累计出库数、本月累计开票数、本年累计开票数、本月资金回笼数、本年资金回笼数、本月应收账款、本年应收账款、销售同比以及销售环比等。
在一个实施例中,针对上述离线的供应链数据集,可以按照时间维度,将其切分为多批离线样本。其中,每批离线样本可以包括若干个离线样本,每个离线样本即为一个离线的供应链数据,其中包括样本特征和样本标签。
应理解,在按照时间维度切分得到上述多批离线样本时,该多批离线样本可以对应于不同的时间段。在一个实施例中,相邻的两个时间段中的部分时刻可以是重复的,从而对应于该两个时间段的两批离线样本中的部分离线样本可以是重复的。
步骤S204,基于离线的供应链数据集训练树模型,以及基于多批离线样本,分别训练不同的机器学习模型,得到多个预测模型。
这里的不同的机器学习模型可以包括以下中的若干项:逻辑回归模型、深度学习模型以及树模型等。
需要说明,本方案基于不同的机器学习模型,来训练多个预测模型,可以提升模型多样性。
在一个实施例中,上述多批离线样本可以分别表示为:(X1,y1)、(X2,y2)和(X3,y3),其中,Xi表示第i批离线样本的样本特征,yi表示第i批离线样本的样本标签。基于上述各批离线样本训练的各预测模型可以分别表示为:M1、M2和M3。其中,i为正整数,且1≤i≤m,m为离线样本的总批次数目。
在一个更具体的实施例中,上述M1通过训练逻辑回归模型得到,M2通过训练深度学习模型得到,M3通过训练树模型而得到。
以基于第i批离线样本训练对应的第i预测模型为例来说,可以将该第i批离线样本中各个离线样本中的样本特征输入初始的第i预测模型,得到各个离线样本的输出(比如,是否具有风险)。根据各个离线样本的输出和样本标签,计算预测损失。根据预测损失,调整初始的第i预测模型的参数,从而得到最终的第i预测模型。
应理解,在实际应用中,训练每个预测模型的过程均可以包括多轮迭代,本说明书对此不复赘述。
以下以树模型为随机森林模型为例,对其中的决策树的训练过程进行说明:
假设上述离线的供应链数据集可以表示为:D1={X(i),y(i)}N i=1,其中N为供应链数据的数目。其中,X(i) 为第i个供应链数据的特征向量,其例如为n维向量,即X=(x1,x2,…,xn), 其中的xi为库存特征、生产特征或销售特征,y(i) 为第i个供应链数据的样本标签(比如,是否具有风险)。然后,通过决策树对N个供应链数据进行分割,在决策树的每个枝干节点设定分裂特征和特征阈值,通过在枝干节点处将供应链数据的对应特征与特征阈值比较而将供应链数据分割到相应的子节点中,通过这样的过程,最后将N个供应链数据分割到各个叶子节点中。于是,可以得到各个叶子节点的分值,即为该叶子节点中各个供应链数据的样本标签(即y(i))的均值。
在此基础上,还可以在残差减小的方向继续训练进一步的决策树。即,在获取上述决策树之后,通过将每个供应链数据的样本标签与该供应链数据在前述决策树中的叶子节点的分值相减,获取每个供应链数据的残差r(i) ,以D2={X(i),r(i)}N i=1为新的供应链数据集。与上述相同的方法,可获取进一步的决策树,在该决策树中,N个供应链数据同样被分割到各个叶子节点中,并且每个叶子节点的分值为各个供应链数据的残差值的均值。类似地,可顺序获取多个决策树,每个决策树都基于前一个决策树的残差获得,如此得到训练后的随机森林模型。
步骤S206,将多批离线样本分别输入树模型,并统计每一批离线样本落入树模型中各个叶子节点的离线样本数目。
根据上述的决策树的训练过程可知,本说明书实施例所训练的树模型包括枝干节点和叶子节点,且每个枝干节点设置有分裂特征和特征阈值。在将任意的一个批次的离线样本输入树模型后,其中的各个离线样本通过在枝干节点处将对应特征与特征阈值进行比较,而进入下一枝干节点,最终被划分到叶子节点,由此就可以统计得到每一批离线样本落入树模型中各个叶子节点的离线样本数目。
在一个实施例中,可以将统计得到的各批离线样本落入树模型中各个叶子节点的离线样本数目组织为目标矩阵N。具体地,该目标矩阵N的一行对应于树模型的一个叶子节点,一列对应于多批离线样本中的一个批次的离线样本,且其中第i行第j列的矩阵元素:N[i][j],表示第j列对应的一个批次的离线样本落入第i行对应的叶子节点的离线样本数目。
其中,i,j均为正整数,且1≤i≤q,1≤j≤m,q为叶子节点的数目,m为离线样本的总批次数目。
在一个更具体的实施例中,目标矩阵N中任意的第一矩阵元素的行号与该第一矩阵元素所在行对应的叶子节点的节点编号相一致,以及该第一矩阵元素的列号与该第一矩阵元素所在列对应的一个批次的离线样本的批次号相一致。
当然,在实际应用中,也可以是目标矩阵N的一列对应于树模型的一个叶子节点,一行对应于多批离线样本中的一个批次的离线样本,从而N[i][j]表示第i行对应的一个批次的离线样本落入第j列对应的叶子节点的离线样本数目,本说明书对此不作限定。
此外,也可以先执行步骤S206,再执行步骤S204,或者同时执行步骤S204和步骤S206,本说明书对此不作限定。
至此利用多批训练装置训练多个预测模型的方法结束,以下对利用在线推理装置对在线的供应链数据进行预测的过程进行详细说明。
先对基于一种搜索方法(即搜索与某批离线样本相似的在线样本的方法)进行的预测过程进行描述。
图3示出根据一个实施例的一种基于多模型的供应链数据预测方法流程图。该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如图3所示,该方法可以包括如下步骤。
步骤S302,获取在线的供应链数据集,并将其切分为多批在线样本。
与上述离线的供应链数据集不同,该在线的供应链数据集中的每个供应链数据只包括样本特征。该样本特征可以包括,库存特征、生产特征和销售特征等。其中,关于库存特征、生产特征和销售特征的具体说明可以参见步骤S202,本说明书在此不复赘述。
同样地,可以按照时间维度,将在线的供应链数据集切分为多批在线样本。其中,每批在线样本可以包括若干个在线样本,每个在线样本即为一个在线的供应链数据,其中包括样本特征。
步骤S304,针对多批在线样本中任意的第p批在线样本,将其输入树模型,并统计落入树模型的各个叶子节点的在线样本数目。
其中,p为正整数,且1≤p≤n,其中,n为在线样本的总批次数目。
与上述离线样本数目的统计方法类似地,在将第p批在线样本输入树模型后,可以统计得到第p批在线样本落入树模型中各个叶子节点的在线样本数目。
步骤S306,从各个叶子节点中确定出对应的在线样本数目最大的目标叶子节点,并从目标矩阵中查询目标叶子节点所对应行中的各目标矩阵元素。
其中,在目标矩阵N中任意的第一矩阵元素的行号与该第一矩阵元素所在行对应的叶子节点的节点编号相一致的情况下,可以将目标叶子节点的节点编号作为目标行号,从目标矩阵N中选取该目标行号对应的目标行中的各矩阵元素作为各目标矩阵元素。
以上述目标叶子节点的节点编号为k为例来说,可以从目标矩阵N 中读取N[k][*]作为各目标矩阵元素。其中,*表示目标矩阵N中的任何列。
步骤S308,根据各目标矩阵元素中最大的目标矩阵元素所在列,从多批离线样本中确定出目标批次的离线样本。
比如,可以将最大的目标矩阵元素所在列对应的一个批次的离线样本,确定为目标批次的离线样本。
当然,在目标矩阵N中任意的第一矩阵元素的列号与该第一矩阵元素所在列对应的一个批次的离线样本的批次号相一致的情况下,可以将最大的目标矩阵元素所在列的列号作为目标批次号,从多批离线样本中,选取出该目标批次号对应的一批离线样本,作为目标批次的离线样本。
举例来说,假设最大的目标矩阵元素所在列的列号为2,且m批离线样本各自对应的批次号为:1,2,3,…,m,那么将第2批离线样本确定为目标批次的离线样本。
步骤S310,将第p批在线样本,输入多个预测模型中对应于目标批次的离线样本的第一目标预测模型,得到其中的各个在线样本的第一预测结果。
在一个实施例中,上述第一预测结果为是否具有风险,其具体可以为二分类值,比如,可以为0或1,其中,0表示存在风险,1表示不存在风险。也可以为多分类值,比如,高、中和低等,本说明书对此不作限定。
步骤S312,至少基于各个在线样本的第一预测结果,确定各个在线样本的最终预测结果。
在一个实施例中,可以直接将第p批在线样本中各个在线样本的第一预测结果作为各个在线样本的最终预测结果。
与第p批在线样本中各个在线样本的第一预测结果的确定方法相类似地,还可以确定出多批在线样本中其它各批在线样本中各个在线样本的第一预测结果,至此就得到了在线的供应链数据集中各个供应链数据的第一预测结果。
综合以上,本说明书实施例提供的一种基于多模型的供应链数据预测方法,在训练阶段,将离线的供应链数据集切分为多批离线样本,然后分别基于该多批离线样本,训练不同的机器学习模型,得到多个预测模型。在预测阶段,先将在线的供应链数据集切分为多批在线样本。然后针对每批在线样本,从多批离线样本中确定出与其最相似的一批离线样本(称为第一批离线样本),并利用对应于该第一批离线样本的第一目标预测模型,针对该批在线样本进行预测,得到其中的各个在线样本的预测结果(即上述第一预测结果);如此得到在线的供应链数据集中各个供应链数据的预测结果(即上述第一预测结果)。由此,可以有效地解决数据漂移问题,进而可以提高数据预测的准确率。
如上所述,通过图2示出的方法,是基于其中的一种搜索方法实现的针对供应链数据的预测过程,为了提升预测结果的准确性,本方案还可以利用第二搜索方法,针对每批在线样本,搜索与其最相似的一批离线样本(即第二批离线样本),并基于对应于该第二批离线样本的第二目标预测模型,确定该批在线样本中各个在线样本的第二预测结果,如此得到在线的供应链数据集中各个供应链数据的第二预测结果。之后,通过融合各个供应链数据各自的第一预测结果和第二预测结果,得到各个供应链数据的最终预测结果。
以下还以第p批在线样本为例,对上述第二预测结果的确定方法进行说明。具体地,该方法可以包括如下步骤:
步骤a,对于第p批在线样本,基于多个预测模型分别针对其中的各抽样在线样本的预测结果以及抽样样本数目,计算对应于多个预测模型的多个分数。步骤b,从多个预测模型中选取对应于最大分数的第二目标预测模型,并将第p批在线样本输入第二目标预测模型,得到其中的各个在线样本的第二预测结果。
首先,在步骤a中,可以采样随机算法,从第p批在线样本中抽样Bs个在线样本,得到抽样在线样本Xs
应理解,在本说明书实施例提供的方案中,针对每个预测模型,从第p批在线样本中所抽取的抽样在线样本和抽样样本数目可不同。
在一个实施例中,上述计算对应于多个预测模型的多个分数,包括:
对于多个预测模型中任意的第一预测模型,对第一预定数值与第一预测模型针对任一抽样在线样本的预测结果求差后再求平方,得到对应于该抽样在线样本的求平方结果。对对应于各抽样在线样本的各求平方结果求平均,得到求平均结果。将第二预定数值与求平均结果的差值,确定为对应于第一预测模型的第一分数。
首先,应理解,上述任一抽样在线样本为针对第一预测模型,从第p批在线样本中所抽取的各抽样样本之一。
此外,上述第一预定数值和第二预定数值可以相同,比如,均为1。
在一个更具体的实施例中,可以根据如下公式确定对应于第一预测模型的第一分数:
其中,Mt为第一预测模型,Bs为对应于Mt的抽样在线样本的样本数目(简称抽样样本数目),Xs为抽样在线样本,µt为第一分数。其中,t为正整数,且1≤t≤T,T为预测模型的数目。
与上述第一预测模型的第一分数的确定方法类似地,可以确定出其它各预测模型各自的分数。
接着,在步骤b中,可以将对应于最大分数µmax的预测模型确定为对应于第p批在线样本的第二目标预测模型。
之后,在将第p批在线样本中的各个在线样本输入第二目标预测模型后,就可以得到其中的各个在线样本的第二预测结果。
类似地,可以选取出其它各批在线样本对应的各第二目标预测模型,以及基于选取出的各第二目标预测模型,可以得到其它各批在线样本中各在线样本的第二预测结果,如此就得到了在线的供应链数据集中各个供应链数据的第二预测结果。
最后,可以对每个供应链数据的第一预测结果和第二预测结果求平均,得到各个供应链数据的最终预测结果。
综上,本说明书实施例提供的方案,针对任一批在线样本,可以通过两种搜索方法搜索与该一批在线样本最相似的两批离线样本。之后可以利用对应于该两批离线样本的两个目标预测模型,获取该一批在线样本中各个在线样本的两个预测结果。最后,通过对每个在线样本的两个预测结果进行融合,获得在该线样本(即供应链数据)的最终预测结果,由此可以消除数据漂移,进而可以提高数据预测的准确率。
与上述一种基于多模型的供应链数据预测方法对应地,本说明书一个实施例还提供的一种基于多模型的供应链数据预测装置,该多模型包括树模型和多个预测模型,其中,树模型基于离线的供应链数据集训练得到,多个预测模型分别基于针对离线的供应链数据集切分的多批离线样本,训练不同的机器学习模型而得到。如图4所示,该装置包括:
获取单元402,用于获取在线的供应链数据集,并将其切分为多批在线样本。
统计单元404,用于针对多批在线样本中任意的第p批在线样本,将其输入树模型,并统计落入树模型的各个叶子节点的在线样本数目。
查询单元406,用于从各个叶子节点中确定出对应的在线样本数目最大的目标叶子节点,并从目标矩阵中查询目标叶子节点所对应行中的各目标矩阵元素。该目标矩阵的一行对应于一个叶子节点,一列对应于一个批次的离线样本,且其中第i行第j列的矩阵元素,表示第j列对应的一个批次的离线样本落入第i行对应的叶子节点的离线样本数目。
确定单元408,用于根据各目标矩阵元素中最大的目标矩阵元素所在列,从多批离线样本中确定出目标批次的离线样本。
输入单元410,用于将第p批在线样本,输入多个预测模型中对应于目标批次的离线样本的第一目标预测模型,得到其中的各个在线样本的第一预测结果。
确定单元408,还用于至少基于各个在线样本的第一预测结果,确定各个在线样本的最终预测结果。
在一个实施例中,该装置还包括:
计算单元412,对于第p批在线样本,基于多个预测模型分别针对其中的各抽样在线样本的预测结果以及抽样样本数目,计算对应于多个预测模型的多个分数;
选取单元414,用于从多个预测模型中选取对应于最大分数的第二目标预测模型,并将第p批在线样本输入第二目标预测模型,得到其中的各个在线样本的第二预测结果;
确定单元408具体用于:
分别对第p批在线样本中各个在线样本各自的第一预测结果和第二预测结果进行融合,得到各个在线样本的最终预测结果。
在一个实施例中,多个预测模型包括第一预测模型;计算单元412具体用于:
对第一预定数值与第一预测模型针对任一抽样在线样本的预测结果求差后再求平方,得到对应于该抽样在线样本的求平方结果;
对对应于各抽样在线样本的各求平方结果求平均,得到求平均结果;
将第二预定数值与求平均结果的差值,确定为对应于第一预测模型的第一分数。
在一个实施例中,获取单元402具体用于:
获取在线的供应链数据集,并按照时间维度,将其切分为多批在线样本,使得各批在线样本分别对应于不同的时间段。
在一个实施例中,不同的机器学习模型包括逻辑回归模型、深度学习模型以及树模型中的若干项。
在一个实施例中,目标矩阵中任意的第一矩阵元素的行号与该第一矩阵元素所在行对应的叶子节点的节点编号相一致,以及该第一矩阵元素的列号与该第一矩阵元素所在列对应的一个批次的离线样本的批次号相一致。
在一个实施例中,查询单元406具体用于:
将目标叶子节点的节点编号作为目标行号,从目标矩阵中选取该目标行号对应的目标行中的各矩阵元素作为各目标矩阵元素;
确定单元408具体用于:
确定最大的目标矩阵元素所在列的列号;
将确定的列号作为目标批次号,从多批离线样本中,选取出目标批次号对应的一批离线样本,作为目标批次的离线样本。
在一个实施例中,供应链数据集中的每个供应链数据包括样本特征和样本标签,其中,样本特征包括,库存特征、生产特征和销售特征。样本标签用于指示对应供应链数据的销量;或者样本标签用于指示对应供应链数据是否具有风险。
在一个更具体的实施例中,
上述库存特征包括以下中的至少一项:仓库所在省市区、仓储运输资源、库房、库位、物料类别、物料名称、规格型号、计量单位、当前库存数、历史最高库存数、历史最低库存数、平均库存时间、库存同比以及库存环比;
上述生产特征包括以下中的至少一项:生产厂商、生产厂商所在省市区、物料类别、物料名称、规格型号、计量单位、产能、日产量、生产周期、本月累计产量、本年累计产量、产量同比以及产量环比;
上述销售特征包括以下中的至少一项:合同编号、合同数量、合同时间、客户名称、客户所在省市区、客户信用等级、客户授信额度、订单编号、订单数量、订单时间、提货单编号、提货单数量、提货单时间、物料类别、物料名称、规格型号、计量单位、本月累计出库数、本年累计出库数、本月累计开票数、本年累计开票数、本月资金回笼数、本年资金回笼数、本月应收账款、本年应收账款、销售同比以及销售环比。
本说明书上述实施例装置的各功能单元的功能,可以通过上述方法实施例的各步骤来实现,因此,本说明书一个实施例提供的装置的具体工作过程,在此不复赘述。
本说明书一个实施例提供的一种基于多模型的供应链数据预测装置,可以提高数据预测的准确率。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
结合本说明书公开内容所描述的方法或者算法的步骤可以硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动硬盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于服务器中。当然,处理器和存储介质也可以作为分立组件存在于服务器中。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述的具体实施方式,对本说明书的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书的具体实施方式而已,并不用于限定本说明书的保护范围,凡在本说明书的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书的保护范围之内。

Claims (10)

1.一种基于多模型的供应链数据预测方法,所述多模型包括树模型和多个预测模型,其中,所述树模型基于离线的供应链数据集训练得到,所述多个预测模型分别基于针对所述离线的供应链数据集切分的多批离线样本,训练不同的机器学习模型而得到;所述方法包括:
获取在线的供应链数据集,并将其切分为多批在线样本;
针对所述多批在线样本中任意的第p批在线样本,将其输入所述树模型,并统计落入所述树模型的各个叶子节点的在线样本数目;p为正整数;
从所述各个叶子节点中确定出对应的在线样本数目最大的目标叶子节点,并从目标矩阵中查询所述目标叶子节点所对应行中的各目标矩阵元素;所述目标矩阵的一行对应于一个叶子节点,一列对应于一个批次的离线样本,且其中第i行第j列的矩阵元素,表示第j列对应的一个批次的离线样本落入第i行对应的叶子节点的离线样本数目;其中,i和j均为正整数;
根据所述各目标矩阵元素中最大的目标矩阵元素所在列,从所述多批离线样本中确定出目标批次的离线样本;
将所述第p批在线样本,输入所述多个预测模型中对应于所述目标批次的离线样本的第一目标预测模型,得到其中的各个在线样本的第一预测结果;
至少基于所述各个在线样本的第一预测结果,确定所述各个在线样本的最终预测结果。
2.根据权利要求1所述的方法,还包括:
对于所述第p批在线样本,基于所述多个预测模型分别针对其中的各抽样在线样本的预测结果以及抽样样本数目,计算对应于所述多个预测模型的多个分数;
从所述多个预测模型中选取对应于最大分数的第二目标预测模型,并将所述第p批在线样本输入所述第二目标预测模型,得到其中的各个在线样本的第二预测结果;
所述确定所述各个在线样本的最终预测结果,包括:
分别对所述第p批在线样本中各个在线样本各自的第一预测结果和第二预测结果进行融合,得到所述各个在线样本的最终预测结果。
3.根据权利要求2所述的方法,其中,所述多个预测模型包括第一预测模型;所述计算对应于所述多个预测模型的多个分数,包括:
对第一预定数值与所述第一预测模型针对任一抽样在线样本的预测结果求差后再求平方,得到对应于该抽样在线样本的求平方结果;
对对应于所述各抽样在线样本的各求平方结果求平均,得到求平均结果;
将第二预定数值与所述求平均结果的差值,确定为对应于所述第一预测模型的第一分数。
4.根据权利要求1所述的方法,其中,所述获取在线的供应链数据集,并将其切分为多批在线样本,包括:
获取在线的供应链数据集,并按照时间维度,将其切分为多批在线样本,使得各批在线样本分别对应于不同的时间段。
5.根据权利要求1所述的方法,其中,所述不同的机器学习模型包括逻辑回归模型、深度学习模型以及树模型。
6.根据权利要求1所述的方法,其中,所述目标矩阵中任意的第一矩阵元素的行号与该第一矩阵元素所在行对应的叶子节点的节点编号相一致,以及该第一矩阵元素的列号与该第一矩阵元素所在列对应的一个批次的离线样本的批次号相一致。
7.根据权利要求6所述的方法,其中,
所述从目标矩阵中查询所述目标叶子节点所对应行中的各目标矩阵元素,包括:
将所述目标叶子节点的节点编号作为目标行号,从所述目标矩阵中选取该目标行号对应的目标行中的各矩阵元素作为所述各目标矩阵元素;
所述从所述多批离线样本中确定出目标批次的离线样本,包括:
确定所述最大的目标矩阵元素所在列的列号;
将所述列号作为目标批次号,从所述多批离线样本中,选取出所述目标批次号对应的一批离线样本,作为所述目标批次的离线样本。
8.根据权利要求1所述的方法,其中,所述供应链数据集中的每个供应链数据包括样本特征和样本标签;所述样本特征包括,库存特征、生产特征和销售特征;所述样本标签用于指示对应供应链数据的销量;或者所述样本标签用于指示对应供应链数据是否具有风险。
9.根据权利要求8所述的方法,其中,
所述库存特征包括以下中的至少一项:仓库所在省市区、仓储运输资源、库房、库位、物料类别、物料名称、规格型号、计量单位、当前库存数、历史最高库存数、历史最低库存数、平均库存时间、库存同比以及库存环比;
所述生产特征包括以下中的至少一项:生产厂商、生产厂商所在省市区、物料类别、物料名称、规格型号、计量单位、产能、日产量、生产周期、本月累计产量、本年累计产量、产量同比以及产量环比;
所述销售特征包括以下中的至少一项:合同编号、合同数量、合同时间、客户名称、客户所在省市区、客户信用等级、客户授信额度、订单编号、订单数量、订单时间、提货单编号、提货单数量、提货单时间、物料类别、物料名称、规格型号、计量单位、本月累计出库数、本年累计出库数、本月累计开票数、本年累计开票数、本月资金回笼数、本年资金回笼数、本月应收账款、本年应收账款、销售同比以及销售环比。
10.一种基于多模型的供应链数据预测装置,所述多模型包括树模型和多个预测模型,其中,所述树模型基于离线的供应链数据集训练得到,所述多个预测模型分别基于针对所述离线的供应链数据集切分的多批离线样本,训练不同的机器学习模型而得到;所述装置包括:
获取单元,用于获取在线的供应链数据集,并将其切分为多批在线样本;
统计单元,用于针对所述多批在线样本中任意的第p批在线样本,将其输入所述树模型,并统计落入所述树模型的各个叶子节点的在线样本数目;
查询单元,用于从所述各个叶子节点中确定出对应的在线样本数目最大的目标叶子节点,并从目标矩阵中查询所述目标叶子节点所对应行中的各目标矩阵元素;所述目标矩阵的一行对应于一个叶子节点,一列对应于一个批次的离线样本,且其中第i行第j列的矩阵元素,表示第j列对应的一个批次的离线样本落入第i行对应的叶子节点的离线样本数目;
确定单元,用于根据所述各目标矩阵元素中最大的目标矩阵元素所在列,从所述多批离线样本中确定出目标批次的离线样本;
输入单元,用于将所述第p批在线样本,输入所述多个预测模型中对应于所述目标批次的离线样本的第一目标预测模型,得到其中的各个在线样本的第一预测结果;
所述确定单元,还用于至少基于所述各个在线样本的第一预测结果,确定所述各个在线样本的最终预测结果。
CN202310672346.5A 2023-06-08 2023-06-08 一种基于多模型的供应链数据预测方法及装置 Active CN116402241B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310672346.5A CN116402241B (zh) 2023-06-08 2023-06-08 一种基于多模型的供应链数据预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310672346.5A CN116402241B (zh) 2023-06-08 2023-06-08 一种基于多模型的供应链数据预测方法及装置

Publications (2)

Publication Number Publication Date
CN116402241A CN116402241A (zh) 2023-07-07
CN116402241B true CN116402241B (zh) 2023-08-18

Family

ID=87008001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310672346.5A Active CN116402241B (zh) 2023-06-08 2023-06-08 一种基于多模型的供应链数据预测方法及装置

Country Status (1)

Country Link
CN (1) CN116402241B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052979A (zh) * 2017-12-15 2018-05-18 阿里巴巴集团控股有限公司 对模型预测值进行融合的方法、装置和设备
CN109685583A (zh) * 2019-01-10 2019-04-26 博拉网络股份有限公司 一种基于大数据的供应链需求预测方法
CN111178624A (zh) * 2019-12-26 2020-05-19 浙江大学 一种新产品需求预测的方法
CN111340244A (zh) * 2020-05-15 2020-06-26 支付宝(杭州)信息技术有限公司 预测方法、训练方法、装置、服务器及介质
CN114118242A (zh) * 2021-11-16 2022-03-01 中汽创智科技有限公司 一种分类模型训练方法、对象分类方法及相关设备
US11334827B1 (en) * 2019-06-03 2022-05-17 Blue Yonder Group, Inc. Image-based decomposition for fast iterative solve of complex linear problems
CN116090657A (zh) * 2023-02-22 2023-05-09 西安电子科技大学 一种基于联邦学习的供应链需求预测方法
CN116187524A (zh) * 2022-12-19 2023-05-30 物产中大数字科技有限公司 一种基于机器学习的供应链分析模型对比方法及装置
CN116188061A (zh) * 2023-04-27 2023-05-30 北京永辉科技有限公司 商品销量预测方法、装置、电子设备及存储介质
CN116226747A (zh) * 2023-02-06 2023-06-06 中国铁道科学研究院集团有限公司 数据分类模型的训练方法、数据分类方法和电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9224110B2 (en) * 2007-03-08 2015-12-29 Jda Software Group, Inc. Sub-problem optimization of supply chain planning problems
US20220164699A1 (en) * 2020-11-25 2022-05-26 Paypal, Inc. Training and Using a Machine Learning Model to Make Predictions

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052979A (zh) * 2017-12-15 2018-05-18 阿里巴巴集团控股有限公司 对模型预测值进行融合的方法、装置和设备
CN109685583A (zh) * 2019-01-10 2019-04-26 博拉网络股份有限公司 一种基于大数据的供应链需求预测方法
US11334827B1 (en) * 2019-06-03 2022-05-17 Blue Yonder Group, Inc. Image-based decomposition for fast iterative solve of complex linear problems
CN111178624A (zh) * 2019-12-26 2020-05-19 浙江大学 一种新产品需求预测的方法
CN111340244A (zh) * 2020-05-15 2020-06-26 支付宝(杭州)信息技术有限公司 预测方法、训练方法、装置、服务器及介质
CN114118242A (zh) * 2021-11-16 2022-03-01 中汽创智科技有限公司 一种分类模型训练方法、对象分类方法及相关设备
CN116187524A (zh) * 2022-12-19 2023-05-30 物产中大数字科技有限公司 一种基于机器学习的供应链分析模型对比方法及装置
CN116226747A (zh) * 2023-02-06 2023-06-06 中国铁道科学研究院集团有限公司 数据分类模型的训练方法、数据分类方法和电子设备
CN116090657A (zh) * 2023-02-22 2023-05-09 西安电子科技大学 一种基于联邦学习的供应链需求预测方法
CN116188061A (zh) * 2023-04-27 2023-05-30 北京永辉科技有限公司 商品销量预测方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
大型供应链企业数字化转型规划与实施路径;王露宁,朱海洋;《中国流通经济》;第36卷(第4期);1-10 *

Also Published As

Publication number Publication date
CN116402241A (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
Van Steenbergen et al. Forecasting demand profiles of new products
CN108320171A (zh) 热销商品预测方法、系统及装置
CN109446251A (zh) 分布式人工智能应用开发的系统及方法
CN110991474A (zh) 一种机器学习建模平台
CN116187524B (zh) 一种基于机器学习的供应链分析模型对比方法及装置
CN113674087A (zh) 企业信用等级评定方法、装置、电子设备和介质
CN113177643A (zh) 一种基于大数据的自动建模系统
CN115760380A (zh) 一种融合用电信息的企业信用评估方法与系统
Naik et al. Machine learning based food sales prediction using random forest regression
CN112418987B (zh) 交通运输单位信用评级方法、系统、电子设备及存储介质
CN116402241B (zh) 一种基于多模型的供应链数据预测方法及装置
Riskiyadi Detecting future financial statement fraud using a machine learning model in Indonesia: a comparative study
CN108305174B (zh) 资源处理方法、装置、存储介质和计算机设备
Kirshners et al. A comparative analysis of short time series processing methods
Pang et al. WT combined early warning model and applications for loaning platform customers default prediction in smart city
Murakami et al. Time Series Analysis of Global Automakers Stock Price Clustering
CN114297582A (zh) 基于多探针局部敏感哈希负二项式回归模型的离散计数数据的建模方法
Sangadiev et al. A review on recent advances in scenario aggregation methods for power system analysis
Wang et al. Research on House Price Forecast Based on Hyper Parameter Optimization Gradient Boosting Regression Model
CN113379125B (zh) 一种基于TCN和LightGBM组合模型的物流仓储销售量预测方法
Dewi et al. Modeling Salesperson Performance Based On Sales Data Clustering
Filipe Using tree-based ensemble methods to improve the B2B customer acquisition process in the fashion industry
Wang et al. Research on bank customer churn model based on attention network
Rostami et al. Time series forecasting of house prices: An evaluation of a support vector machine and a recurrent neural network with LSTM cells
Setiawan et al. Implementation of data mining method for classifying company application data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant