CN114004425B - 物品流转信息预测模型生成方法、信息生成方法、装置 - Google Patents

物品流转信息预测模型生成方法、信息生成方法、装置 Download PDF

Info

Publication number
CN114004425B
CN114004425B CN202111628208.4A CN202111628208A CN114004425B CN 114004425 B CN114004425 B CN 114004425B CN 202111628208 A CN202111628208 A CN 202111628208A CN 114004425 B CN114004425 B CN 114004425B
Authority
CN
China
Prior art keywords
circulation information
training sample
article circulation
training
sample set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111628208.4A
Other languages
English (en)
Other versions
CN114004425A (zh
Inventor
刘葳
蒋新田
庄晓天
王忠帅
吴盛楠
伍斌杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Zhenshi Information Technology Co Ltd
Original Assignee
Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Zhenshi Information Technology Co Ltd filed Critical Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority to CN202111628208.4A priority Critical patent/CN114004425B/zh
Publication of CN114004425A publication Critical patent/CN114004425A/zh
Application granted granted Critical
Publication of CN114004425B publication Critical patent/CN114004425B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开的实施例公开了物品流转信息预测模型生成方法、信息生成方法、装置。该方法的一具体实施方式包括:获取训练样本集,训练样本集中的训练样本包括历史时间段的历史物品流转信息和预测时间段的真实物品流转信息;获取多个基准时序模型和集成模型,集成模型用于根据多个基准时序模型的输出结果,生成预测物品流转信息;基于训练样本集对多个基准时序模型和集成模型进行训练,以及将训练完成的多个基准时序模型和集成模型确定为物品流转信息预测模型。该实施方式实现了提高生成的物品流转信息预测模型的预测准确率。

Description

物品流转信息预测模型生成方法、信息生成方法、装置
技术领域
本公开的实施例涉及计算机技术领域,具体涉及物品流转信息预测模型生成方法、信息生成方法、装置。
背景技术
物品流转信息(例如物品销量、仓库出货量等)的预测一般采用多个时间序列模型进行预测。不同的模型适用的数据趋势有所不同。为了选取效果好的模型,需要先对近期历史物品流转信息进行回测,然后选取回测效果好的N个模型作为预测模型。
然而,当采用上述方式生成预测模型时,经常会存在如下技术问题:
第一,数值N的准确值难以确定,其过大或过小都会影响预测模型的预测准确率,进而造成预测模型的准确率不高。
第二,近期历史物品流转信息的数据量小,仅根据近期历史物品流转信息进行回测,回测结果存在不稳定性和偶然性,进而导致生成的预测模型的准确率。
与本公开相关的文件包括:CN113408797A,CN113743643A。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。本公开的一些实施例提出了物品流转信息预测模型生成方法、物品流转信息生成方法、装置、设备和计算机可读介质,来解决以上背景技术部分提到的技术问题中的一项或多项。
第一方面,本公开的一些实施例提供了一种物品流转信息预测模型生成方法,该方法包括:获取训练样本集,训练样本集中的训练样本包括历史时间段的历史物品流转信息和预测时间段的真实物品流转信息;获取多个基准时序模型和集成模型,集成模型用于根据多个基准时序模型的输出结果,生成预测物品流转信息,其中,多个基准时序模型中的基准时序模型用于预测物品流转信息;基于训练样本集对多个基准时序模型和集成模型进行训练,以及将训练完成的多个基准时序模型和集成模型确定为物品流转信息预测模型。
第二方面,本公开的一些实施例提供了一种物品流转信息生成方法,包括:基于第一数据长度确定当前时间对应的历史物品流转信息;将历史物品流转信息分别输入预先训练的多个基准时序模型,得到多个输出结果;将多个输出结果输入集成模型,得到物品流转信息,其中,多个基准时序模型和集成模型是根据第一方面中任一的实现方式所描述的方法生成的。
第三方面,本公开的一些实施例提供了一种物品流转信息预测模型生成装置,装置包括:样本集获取单元,被配置成获取训练样本集,训练样本集中的训练样本包括历史时间段的历史物品流转信息和预测时间段的真实物品流转信息;模型获取单元,被配置成获取多个基准时序模型和集成模型,集成模型用于根据多个基准时序模型的输出结果,生成预测物品流转信息,其中,多个基准时序模型中的基准时序模型用于预测物品流转信息;训练单元,被配置成基于训练样本集对多个基准时序模型和集成模型进行训练,以及将训练完成的多个基准时序模型和集成模型确定为物品流转信息预测模型。
第四方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
第五方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
本公开的上述各个实施例具有如下有益效果:提高了生成的物品流转信息预测模型的预测准确率。相关的物品流转信息生成方法之所以准确率不高的原因在于:受到选取数值N,数值N的准确值难以确定,进而影响预测模型的准确率。基于此,本公开的一些物品流转信息预测模型生成方法,采用集成模型来自动融合多个基准时序模型的输出结果,不需要设置选取数值N,排除了数值N的干扰,从而提高生成的物品流转信息预测模型的预测准确率。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
图1是根据本公开的一些实施例的物品流转信息预测模型生成方法的一个应用场景的示意图;
图2是根据本公开的物品流转信息预测模型生成方法的一些实施例的流程图;
图3是根据本公开的一些实施例物品流转信息预测模型生成方法中的生成训练样本集的示例性流程图;
图4是根据本公开的物品流转信息预测模型生成方法的另一些实施例的流程图;
图5是根据本公开的物品流转信息生成方法的一些实施例的流程图;
图6是根据本公开的物品流转信息预测模型生成装置的一些实施例的结构示意图;
图7是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
下面将参考附图并结合实施例来详细说明本公开。
图1是根据本公开一些实施例的物品流转信息预测模型生成方法、物品流转信息生成方法的一个应用场景的示意图。
如图1所示,物品流转信息预测模型生成方法的执行主体可以是计算设备101。在此基础上,计算设备101可以首先获取训练样本集102。其中的训练样本包括历史时间段的历史物品流转信息和预测时间段的真实物品流转信息。其中,历史时间段一般是预测时间段之前的一个时间段。举例来说,历史时间段的历史物品流转信息可以是:9月5日-9月10日销量:100个;预测时间段的真实物品流转信息可以是:9月15日-9月20日销量:150个。然后,计算设备101可以继续获取多个基准时序模型103,如图中所示,包括基准时序模型1、2……n。此外,还可以获取集成模型105。其中,集成模型105用于根据多个基准时序模型103的输出结果104,如图中所示,包括输出结果1、2……n,生成预测物品流转信息106。在此基础上,可以利用训练样本集102对多个基准时序模型103和集成模型105进行训练,得到训练完成的多个基准时序模型109和训练完成的集成模型111,以及训练完成的多个基准时序模型109和训练完成的集成模型111确定为物品流转信息预测模型。
如图1所示,物品流转信息生成方法的执行主体可以是计算设备107。在此基础上,如果需要进行物品流转信息预测,计算设备107可以基于第一数据长度确定当前时间对应的历史物品流转信息。在本应用场景下,第一数据长度可以是历史物品流转信息的数据长度。从而可以以当前时间为起点,向前回溯连续6天的数据。举例来说,当前时间为2021年11月9日,回溯6天的数据可以是2021年11月4日至2021年11月9日的历史物品流转信息,即当前时间对应的历史物品流转信息108。然后,计算设备107可以将历史物品流转信息108分别输入训练完成的多个基准时序模型109,得到输出结果110。然后将输出结果110输入训练完成的集成模型111,得到物品流转信息112。
继续参考图2,示出了根据本公开的物品流转信息预测模型生成方法的一些实施例的流程200。该物品流转信息预测模型生成方法,包括以下步骤:
步骤201,获取训练样本集,训练样本集中的训练样本包括历史时间段的历史物品流转信息和预测时间段的真实物品流转信息。
在一些实施例中,物品流转信息预测模型生成方法的执行主体(例如图1中的计算设备101)可以首先获取训练样本集。每个训练样本可以包括历史时间段的历史物品流转信息和预测时间段的真实物品流转信息。其中,历史时间段一般是预测时间段之前的时间段。例如,历史时间段可以是9月5日-9月10日,预测时间段可以是9月15日-9月20日。根据实际需要,两个时间段可以有重叠部分,也可以没有重叠部分。此外,历史物品流转信息可以是历史时间段中各个时间点对应的物品流转信息组成的序列,例如,9月5日-9月10日的历史物品流转信息可以是这段时间每天的销量组成的序列50,60,70,50,80,90。当然,也可以不采用序列而采用总量或均值等指标作为历史物品流转信息。类似的,真实物品流转信息也可以是序列也可以是一个值。此外,训练样本集中不同的训练样本对应的历史时间段可以相同,也可以不同。例如,历史时间段可以是9月5日-9月10日
步骤202,获取多个基准时序模型和集成模型,集成模型用于根据多个基准时序模型的输出结果,生成预测物品流转信息。
在一些实施例中,上述执行主体可以获取多个基准时序模型。其中,基准时序模型用于预测物品流转信息。其中,基准时序模型可以是时间序列模型,例如可以是随机森林、Xgboost(eXtreme Gradient Boosting,极致梯度提升)、Holt Winters(三次指数平滑)、LSTM(长短期记忆,Long short-term memory)等等各种模型。多个基准时序模型中的各个基准时序模型一般是不同的模型。不同的基准时序模型适用的数据趋势不同,因此,对于相同的输入数据,输出结果也会有差异。每个基准时序模型以历史时间段的历史物品流转信息为输入,输出预测时间段的预测物品流转信息。基准时序模型可以是未经训练的,或未训练完成的模型。
在一些实施例中,上述执行主体还可以获取集成模型。其中,集成模型以多个基准时序模型的输出结果作为输入,输出预测物品流转信息。也就是说,集成模型对于多个基准时序模型的输出结果进行融合,并得到最终的预测物品流转信息。作为示例,集成模型可以是各种线性模型。线性模型可以对不同的输出结果进行加权,最终得到预测物品流转信息,从而可以使得得到的预测物品流转信息更加准确。
在一些实施例的一些可选的实现方式中,集成模型为脊回归模型(RidgeRegression)。由于脊回归模型包含L2正则项可以有效约束模型复杂度,给予无效自变量极小的系数。由于这种特性,于预测效果不好的基准时序模型,可以对将其权重分配的很小,降低或者抹去对最终生成结果的影响。
步骤203,基于训练样本集对多个基准时序模型和集成模型进行训练,以及将训练完成的多个基准时序模型和集成模型确定为物品流转信息预测模型。
在一些实施例中,上述执行主体可以基于训练样本集对多个基准时序模型和集成模型进行训练。
在一些实施例的一些可选的实现方式中,基于训练样本集对多个基准时序模型和集成模型进行训练,包括:从训练样本集中选取训练样本,将训练样本中的历史物品流转信息分别输入多个基准时序模型,得到多个输出结果;将多个输出结果输入集成模型,得到预测物品流转信息;基于预设损失函数,确定预测物品流转信息和训练样本中的真实物品流转信息之间的差异;基于差异调整多个基准时序模型和集成模型的参数。在这些实现方式中,预设损失函数可以是mape、wmape等等,从而可以使得预测模型朝着准确率横向指标更好的方向优化。
可选的,可以从训练样本集中选取训练样本子集,对多个基准时序模型进行预训练。具体的,可以将训练样本中的历史物品流转信息输入每个基准时序模型,从而得到输出结果。之后,对于每个基准时序模型,确定该基准时序模型的输出结果与输入样本中的真实物品流转信息之间的差异,然后将差异反向传入该基准时序模型,以调整该基准时序模型的参数。在基础上,经过一定次数的迭代可以得到经过预训练的多个基准时序模型。通过对多个基准时序模型进行预训练可以缩短联合训练的训练时长。实践中,不同的基准时序模型可以对应同样的训练样本子集,也可以是不一样的训练样本子集。
在此基础上,可以对多个基准时序模型和集成模型进行联合训练。具体的,可以从训练样本集中选取训练样本,将训练样本分别输入上述经过预训练的多个基准时序模型,从而可以得到多个输出结果。然后,将多个输出结果输入集成模型,从而得到预测物品流转信息。然后,确定预测物品流转信息与输入上述经过预训练的多个基准时序模型的训练样本中的真实物品流转信息之间的差异。然后将差异反向传入集成模型和预训练的多个基准时序模型,以调整集成模型和预训练的多个基准时序模型的参数。在基础上,经过一定次数的迭代可以得到训练完成的多个基准时序模型和集成模型确定,即为物品流转信息预测模型。
本公开的一些实施例提供的方法,采用集成模型来自动融合多个基准时序模型的输出结果,不需要设置选取数值N,排除了数值N的干扰,从而提高生成的物品流转信息预测模型的预测准确率。
继续参考图3,示出了根据本公开的训练样本集生成方法的一些实施例的流程300。该训练样本集生成方法,包括以下步骤:
步骤301,确定训练样本集中拟包括的训练样本的目标数量、历史物品流转信息的第一数据长度、真实物品流转信息的第二数据长度。
在一些实施例,训练样本集生成方法的执行主体可以与上述物品流转信息预测模型生成方法相同,也可以不同。在此基础上,上述执行主体可以首先确定训练样本集中拟包括的训练样本的目标数量、历史物品流转信息的第一数据长度、真实物品流转信息的第二数据长度。其中,训练样本集中拟包括的训练样本的目标数量可以是需要生成的训练样本的数量。实践中,目标数量、第一数据长度、第二数据长度可以根据实际需要进行确定。例如,可以通过人工指定的方式确定。
步骤302,确定历史物品流转信息序列对应的目标数量个切分时间点。
在一些实施例中,上述执行主体可以根据目标数量,确定历史物品流转信息序列对应的目标数量个切分时间点。其中,历史物品流转信息序列可以由过去较长一段时间的物品流转信息组成。例如,可以是过去一年每天的物品销量组成的历史物品销量序列。目标数量个切分时间点可以根据实际需要进行确定,例如可以指定,也可以随机确定。例如,对于过去一年的历史物品销量序列,可以随机确定过去一年中目标数量个日期作为目标数量个切分时间点。
步骤303,对于每个切分时间点,以切分时间点对应的物品流转信息为起点,分别截取长度为第一数据长度和第二数据长度的信息作为历史物品流转信息和真实物品流转信息,得到切分时间点对应的训练样本。
在此基础上,对于每个切分时间点,可以以对应的物品流转信息为起点分别截取长度为第一数据长度和第二数据长度的信息作为历史物品流转信息和真实物品流转信息,得到切分时间点对应的训练样本。举例来说,过去一年的历史物品销量序列为90,80,70,80,60,…60,50,由过去一年每天的物品销量组成。即,第一天物品销量为90,第二天物品销量为80,第三天物品销量为70,以此类推。若以第三天作为一个切分时间点。则以第三天对应的物品销量(70)为起点,截取第一数据长度(例如三天的数据)的信息作为历史物品流转信息,即90,80,70。类似的,可以截取第二数据长度(例如两天)的信息作为真实物品流转信息,即80,60。
实践中,截取时可以包括起点,也可以不包括起点。此外,根据实际需要,可以从起点向前截取,也可以向后截取。类似的,可以对于。
步骤304,将目标数量个切分时间点分别对应的训练样本确定为训练样本集。
在一些实施例中,同一个切分时间点对应的历物品流转信息和真实物品流转信息组成一个训练样本。目标数量个切分时间点对应目标数量个训练样本,组成训练样本集。由此,可以自动生成有序的时间序列训练样本集,保证训练样本的有序性以及具有充足的训练样本。
进一步参考图4,其示出了物品流转信息预测模型生成方法的另一些实施例的流程400。该物品流转信息预测模型生成方法的流程400,包括以下步骤:
步骤401,获取训练样本集,训练样本集中的训练样本包括历史时间段的历史物品流转信息和预测时间段的真实物品流转信息。
在一些实施例中,训练样本集可以是通过图3对应的那些实施例中所描述的方法生成的。
步骤402,获取多个基准时序模型和集成模型,集成模型用于根据多个基准时序模型的输出结果,生成预测物品流转信息。
在一些实施例中,步骤402的具体实现可以参考图2对应的那些实施例中的步骤,在此不再赘述。
步骤403,为训练样本集中各个训练样本设置抽样权重,每个训练样本的抽样权重与训练样本对应的切分时间点相关。
在一些实施例中,物品流转信息预测模型生成方法的执行主体可以为各个训练样本设置抽样权重,每个训练样本的抽样权重与训练样本对应的切分时间点相关。作为示例,可以预先设置每个时间点对应的权重。若某个时间点被确定为切分时间点,可以将其权重确定为该切分时间点对应的训练样本的抽样权重。
在一些实施例的一些可选的实现方式中,为训练样本集中各个训练样本设置抽样权重,包括:确定每个训练样本的切分时间点与当前时间的差值;对于差值进行对数变换,得到变换差值;对变换差值进行标准化,得到训练样本的抽样权重。由此,距离当前时间越久远的训练样本,抽样权重越小,反之越大。从而可以在确保更多抽取到近期训练样本的同时,也考虑到远期训练样本。从而解决背景技术中的技术问题二“仅根据近期历史物品流转信息进行回测,回测结果存在不稳定性和偶然性,进而导致生成的预测模型的准确率”,以提高预测模型的准确率。
步骤404,根据各个训练样本的抽样权重,从训练样本集中加权选取训练样本。
在一些实施例中,上述执行主体可以根据各个训练样本设置抽样权重,从训练样本集中加权选取一个或多个训练样本。
步骤405,基于训练样本,对多个基准时序模型和集成模型进行训练。
在一些实施例中,上述执行主体可以基于所选取的一个或多个训练样本,对多个基准时序模型和集成模型进行训练。根据实际需要,可以每次采用单个训练样本,也可以采用一批训练样本进行训练。具体的训练方法可以参考图2对应的那些实施例中的步骤203,在此不再赘述。
从图4中可以看出,与图2对应的一些实施例的描述相比,图4对应的一些实施例中的物品流转信息预测模型生成方法的流程400,根据训练样本的抽样权重选取训练样本并进行训练。从而可以在考虑不同时期的训练样本的同时,控制不同时期的训练样本的权重,以克服仅采用同一时期的训练样本所带来的不稳定性和偶然性,进而提高预测模型的准确率。
进一步参考图5,其示出了物品流转信息生成方法的一些实施例的流程500。该物品流转信息生成方法的流程500,包括以下步骤:
步骤501,基于第一数据长度确定当前时间对应的历史物品流转信息。
在一些实施例中,物品流转信息生成方法的执行主体与物品流转信息预测模型生成方法的执行主体可以相同,也可以不同。在此基础上,如果需要进行预测,物品流转信息生成方法的执行主体可以基于第一数据长度确定当前时间对应的历史物品流转信息。例如,从当前时间对应的物品流转信息向前截取第一数据长度的信息作为历史物品流转信息。
步骤502,将历史物品流转信息分别输入预先训练的多个基准时序模型,得到多个输出结果。
在一些实施例中,上述执行主体可以将历史物品流转信息分别输入预先训练的多个基准时序模型,每个基准时序模型输出一个输出结果,得到多个输出结果。
步骤503,将多个输出结果输入集成模型,得到物品流转信息。
在一些实施例中,上述执行主体可以将多个输出结果输入集成模型,得到物品流转信息。其中,多个基准时序模型和集成模型是根据图2或图4对应的那些实现方式所生成的,从而提高了物品流转信息的准确率。
进一步参考图6,作为对上述各图所示方法的实现,本公开提供了一种物品流转信息预测模型生成装置的一些实施例,这些装置实施例与图2所示的那些方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图6所示,一些实施例的物品流转信息预测模型生成装置600包括:样本集获取单元601被配置成获取训练样本集,训练样本集中的训练样本包括历史时间段的历史物品流转信息和预测时间段的真实物品流转信息。模型获取单元602被配置成获取多个基准时序模型和集成模型,集成模型用于根据多个基准时序模型的输出结果,生成预测物品流转信息。训练单元603被配置成基于训练样本集对多个基准时序模型和集成模型进行训练,以及将训练完成的多个基准时序模型和集成模型确定为物品流转信息预测模型。
在一些实施例的可选实现方式中,训练样本集是通过以下步骤生成的:确定训练样本集中拟包括的训练样本的目标数量、历史物品流转信息的第一数据长度、真实物品流转信息的第二数据长度;确定历史物品流转信息序列对应的目标数量个切分时间点;对于每个切分时间点,以切分时间点对应的物品流转信息为起点,分别截取长度为第一数据长度和第二数据长度的信息作为历史物品流转信息和真实物品流转信息,得到切分时间点对应的训练样本;将目标数量个切分时间点分别对应的训练样本确定为训练样本集。
在一些实施例的可选实现方式中,训练单元603进一步被配置成为训练样本集中各个训练样本设置抽样权重,每个训练样本的抽样权重与训练样本对应的切分时间点相关;根据各个训练样本的抽样权重,从训练样本集中加权选取训练样本;基于训练样本,对多个基准时序模型和集成模型进行训练。
在一些实施例的可选实现方式中,训练单元603进一步被配置成将训练样本中的历史物品流转信息分别输入多个基准时序模型,得到多个输出结果;将多个输出结果输入集成模型,得到预测物品流转信息;基于预设损失函数,确定预测物品流转信息和训练样本中的真实物品流转信息之间的差异;基于差异调整多个基准时序模型和集成模型的参数。
在一些实施例的可选实现方式中,集成模型为脊回归模型。
在一些实施例的可选实现方式中,训练单元603进一步被配置成确定每个训练样本的切分时间点与当前时间的差值;对于差值进行对数变换,得到变换差值;对变换差值进行标准化,得到训练样本的抽样权重。
可以理解的是,该装置600记载的诸单元与参考图2描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置600其包含的单元,在此不再赘述。
下面参考图7,其示出了适于用来实现本公开的一些实施例的电子设备(例如图1中的计算设备)700的结构示意图。图7示出的电子设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700可以包括处理装置(例如中央处理器、图形处理器等)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储装置708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有电子设备700操作所需的各种程序和数据。处理装置701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
通常,以下装置可以连接至I/O接口705:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置706包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置707;包括例如磁带、硬盘等的存储装置708;以及通信装置709。通信装置709可以允许电子设备700与其他设备进行无线或有线通信以交换数据。虽然图7示出了具有各种装置的电子设备700,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图7中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置709从网络上被下载和安装,或者从存储装置708被安装,或者从ROM 702被安装。在该计算机程序被处理装置701执行时,执行本公开的一些实施例的方法中限定的上述功能。
需要说明的是,本公开的一些实施例中记载的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取训练样本集,训练样本集中的训练样本包括历史时间段的历史物品流转信息和预测时间段的真实物品流转信息;获取多个基准时序模型和集成模型,集成模型用于根据多个基准时序模型的输出结果,生成预测物品流转信息;基于训练样本集对多个基准时序模型和集成模型进行训练,以及将训练完成的多个基准时序模型和集成模型确定为物品流转信息预测模型。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括样本集获取单元、模型获取单元和训练单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,样本集获取单元还可以被描述为“获取训练样本集的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上描述仅为本公开的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (7)

1.一种物品流转信息预测模型生成方法,包括:
获取训练样本集,所述训练样本集中的训练样本包括历史时间段的历史物品流转信息和预测时间段的真实物品流转信息;
获取多个基准时序模型和集成模型,所述集成模型用于根据所述多个基准时序模型的输出结果,生成预测物品流转信息,其中,所述多个基准时序模型中的基准时序模型用于根据所述历史物品流转信息预测物品流转信息;
基于所述训练样本集对所述多个基准时序模型和所述集成模型进行训练,以及将训练完成的所述多个基准时序模型和所述集成模型确定为所述物品流转信息预测模型;
其中,所述训练样本集是通过以下步骤生成的:
确定所述训练样本集中拟包括的训练样本的目标数量、所述历史物品流转信息的第一数据长度、所述真实物品流转信息的第二数据长度;
确定历史物品流转信息序列对应的所述目标数量个切分时间点;
对于每个切分时间点,以所述切分时间点对应的物品流转信息为起点,分别截取长度为所述第一数据长度和所述第二数据长度的信息作为所述历史物品流转信息和所述真实物品流转信息,得到所述切分时间点对应的训练样本;
将所述目标数量个切分时间点分别对应的训练样本确定为所述训练样本集;
其中,所述基于所述训练样本集对所述多个基准时序模型和所述集成模型进行训练,包括:
为所述训练样本集中各个训练样本设置抽样权重,每个训练样本的抽样权重与所述训练样本对应的切分时间点相关;
根据所述各个训练样本的抽样权重,从所述训练样本集中加权选取训练样本;
基于所述训练样本,对所述多个基准时序模型和所述集成模型进行训练;
其中,所述为所述训练样本集中各个训练样本设置抽样权重,包括:
确定每个训练样本的切分时间点与当前时间的差值;
对于所述差值进行对数变换,得到变换差值;
对所述变换差值进行标准化,得到所述训练样本的抽样权重。
2.根据权利要求1所述的方法,其中,所述基于所述训练样本,对所述多个基准时序模型和所述集成模型进行训练,包括:
将所述训练样本中的历史物品流转信息分别输入所述多个基准时序模型,得到多个输出结果;
将所述多个输出结果输入所述集成模型,得到预测物品流转信息;
基于预设损失函数,确定所述预测物品流转信息和所述训练样本中的真实物品流转信息之间的差异;
基于所述差异调整所述多个基准时序模型和所述集成模型的参数。
3.根据权利要求2所述的方法,其中,所述集成模型为脊回归模型。
4.一种物品流转信息生成方法,包括:
基于第一数据长度确定当前时间对应的历史物品流转信息;
将所述历史物品流转信息分别输入预先训练的多个基准时序模型,得到多个输出结果;
将所述多个输出结果输入集成模型,得到物品流转信息,其中,所述多个基准时序模型和所述集成模型是根据权利要求1-3中任一所述的方法生成的。
5.一种物品流转信息预测模型生成装置,包括:
样本集获取单元,被配置成获取训练样本集,所述训练样本集中的训练样本包括历史时间段的历史物品流转信息和预测时间段的真实物品流转信息;
模型获取单元,被配置成获取多个基准时序模型和集成模型,所述集成模型用于根据所述多个基准时序模型的输出结果,生成预测物品流转信息,其中,所述多个基准时序模型中的基准时序模型用于根据所述历史物品流转信息预测物品流转信息;
训练单元,被配置成基于所述训练样本集对所述多个基准时序模型和所述集成模型进行训练,以及将训练完成的所述多个基准时序模型和所述集成模型确定为所述物品流转信息预测模型;
其中,所述训练样本集是通过以下步骤生成的:
确定所述训练样本集中拟包括的训练样本的目标数量、所述历史物品流转信息的第一数据长度、所述真实物品流转信息的第二数据长度;
确定历史物品流转信息序列对应的所述目标数量个切分时间点;
对于每个切分时间点,以所述切分时间点对应的物品流转信息为起点,分别截取长度为所述第一数据长度和所述第二数据长度的信息作为所述历史物品流转信息和所述真实物品流转信息,得到所述切分时间点对应的训练样本;
其中,所述基于所述训练样本集对所述多个基准时序模型和所述集成模型进行训练,包括:
为所述训练样本集中各个训练样本设置抽样权重,每个训练样本的抽样权重与所述训练样本对应的切分时间点相关;
根据所述各个训练样本的抽样权重,从所述训练样本集中加权选取训练样本;
基于所述训练样本,对所述多个基准时序模型和所述集成模型进行训练;
其中,所述为所述训练样本集中各个训练样本设置抽样权重,包括:
确定每个训练样本的切分时间点与当前时间的差值;
对于所述差值进行对数变换,得到变换差值;
对所述变换差值进行标准化,得到所述训练样本的抽样权重。
6.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-3或4中任一所述的方法。
7.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-3或4中任一所述的方法。
CN202111628208.4A 2021-12-29 2021-12-29 物品流转信息预测模型生成方法、信息生成方法、装置 Active CN114004425B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111628208.4A CN114004425B (zh) 2021-12-29 2021-12-29 物品流转信息预测模型生成方法、信息生成方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111628208.4A CN114004425B (zh) 2021-12-29 2021-12-29 物品流转信息预测模型生成方法、信息生成方法、装置

Publications (2)

Publication Number Publication Date
CN114004425A CN114004425A (zh) 2022-02-01
CN114004425B true CN114004425B (zh) 2022-06-07

Family

ID=79932120

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111628208.4A Active CN114004425B (zh) 2021-12-29 2021-12-29 物品流转信息预测模型生成方法、信息生成方法、装置

Country Status (1)

Country Link
CN (1) CN114004425B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116664041A (zh) * 2022-02-17 2023-08-29 北京京东振世信息技术有限公司 调货方法、装置、电子设备和计算机可读介质
CN114792257B (zh) * 2022-06-24 2022-11-08 北京京东振世信息技术有限公司 物品流转信息生成方法、流转预测信息生成方法和装置
CN114792258B (zh) * 2022-06-27 2022-12-27 北京京东振世信息技术有限公司 信息生成方法、装置、电子设备和计算机可读介质
CN115640917A (zh) * 2022-12-26 2023-01-24 北京京东振世信息技术有限公司 物品需求量生成方法、装置、设备、介质和程序产品

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109741113A (zh) * 2019-01-10 2019-05-10 博拉网络股份有限公司 一种基于大数据的用户购买意向预测方法
CN110222416A (zh) * 2019-06-05 2019-09-10 重庆邮电大学 一种基于大数据的工业蒸汽量预测方法
CN110956497A (zh) * 2019-11-27 2020-04-03 桂林电子科技大学 一种电子商务平台用户重复购买行为预测方法
CN111275136A (zh) * 2020-03-13 2020-06-12 安图实验仪器(郑州)有限公司 基于小样本下的故障预测系统及其预警方法
CN112257884A (zh) * 2020-09-25 2021-01-22 南京意博软件科技有限公司 一种订单管理方法和系统
CN112465256A (zh) * 2020-12-08 2021-03-09 华中科技大学 一种基于Stacking模型融合的楼宇用电量预测方法和系统
CN113408617A (zh) * 2021-06-18 2021-09-17 湘潭大学 一种基于XGBoost与Stacking模型融合的非侵入式负荷识别方法
CN113408797A (zh) * 2021-06-07 2021-09-17 北京京东振世信息技术有限公司 流转量预测多时序模型生成方法、信息发送方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948773A (zh) * 2017-12-20 2019-06-28 北京京东尚科信息技术有限公司 生成信息的方法和装置
CN109003260B (zh) * 2018-06-28 2021-02-09 深圳视见医疗科技有限公司 Ct图像肺结节检测方法、装置、设备及可读存储介质
CN109711907B (zh) * 2019-01-21 2022-09-23 南京大学 一种基于顶端排序的在线广告排序方法
CN112288447A (zh) * 2020-10-30 2021-01-29 北京每日优鲜电子商务有限公司 物品信息显示方法、装置、电子设备和计算机可读介质
CN113723985A (zh) * 2021-03-04 2021-11-30 京东城市(北京)数字科技有限公司 销量预测模型的训练方法、装置及电子设备、存储介质
CN113657934A (zh) * 2021-08-16 2021-11-16 京东城市(北京)数字科技有限公司 客流量预测模型的训练方法和客流量的预测方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109741113A (zh) * 2019-01-10 2019-05-10 博拉网络股份有限公司 一种基于大数据的用户购买意向预测方法
CN110222416A (zh) * 2019-06-05 2019-09-10 重庆邮电大学 一种基于大数据的工业蒸汽量预测方法
CN110956497A (zh) * 2019-11-27 2020-04-03 桂林电子科技大学 一种电子商务平台用户重复购买行为预测方法
CN111275136A (zh) * 2020-03-13 2020-06-12 安图实验仪器(郑州)有限公司 基于小样本下的故障预测系统及其预警方法
CN112257884A (zh) * 2020-09-25 2021-01-22 南京意博软件科技有限公司 一种订单管理方法和系统
CN112465256A (zh) * 2020-12-08 2021-03-09 华中科技大学 一种基于Stacking模型融合的楼宇用电量预测方法和系统
CN113408797A (zh) * 2021-06-07 2021-09-17 北京京东振世信息技术有限公司 流转量预测多时序模型生成方法、信息发送方法和装置
CN113408617A (zh) * 2021-06-18 2021-09-17 湘潭大学 一种基于XGBoost与Stacking模型融合的非侵入式负荷识别方法

Also Published As

Publication number Publication date
CN114004425A (zh) 2022-02-01

Similar Documents

Publication Publication Date Title
CN114004425B (zh) 物品流转信息预测模型生成方法、信息生成方法、装置
CN109460513B (zh) 用于生成点击率预测模型的方法和装置
CN109976997B (zh) 测试方法和装置
CN111061956A (zh) 用于生成信息的方法和装置
CN110688528A (zh) 生成视频的分类信息的方法、装置、电子设备和介质
CN111783810A (zh) 用于确定用户的属性信息的方法和装置
CN115130065B (zh) 供应端特征信息处理方法、装置、设备和计算机可读介质
CN115085196B (zh) 电力负荷预测值确定方法、装置、设备和计算机可读介质
CN111340220A (zh) 用于训练预测模型的方法和装置
CN112836128A (zh) 信息推荐方法、装置、设备和存储介质
CN114049072A (zh) 指标确定方法、装置、电子设备和计算机可读介质
CN110473042B (zh) 用于获取信息的方法及装置
CN112102043B (zh) 物品推荐页面生成方法、装置、电子设备和可读介质
CN116542328B (zh) Ctr预测模型的知识蒸馏方法及装置
CN113159453A (zh) 资源数据预测方法、装置、设备及存储介质
CN110991661A (zh) 用于生成模型的方法和装置
Zadorozhnyi et al. Methods of simulation queueing systems with heavy tails
CN111767290B (zh) 用于更新用户画像的方法和装置
CN109857838B (zh) 用于生成信息的方法和装置
CN113934894A (zh) 基于指标树的数据显示方法、终端设备
CN114792258B (zh) 信息生成方法、装置、电子设备和计算机可读介质
CN110619537A (zh) 用于生成信息的方法和装置
CN115098664B (zh) 智能问答方法、装置、电子设备和计算机可读介质
WO2023155425A1 (zh) 调货方法、装置、电子设备和计算机可读介质
CN111522887B (zh) 用于输出信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant