CN110110931A - 订单预测方法和装置、物流系统及计算机可读介质 - Google Patents

订单预测方法和装置、物流系统及计算机可读介质 Download PDF

Info

Publication number
CN110110931A
CN110110931A CN201910382430.7A CN201910382430A CN110110931A CN 110110931 A CN110110931 A CN 110110931A CN 201910382430 A CN201910382430 A CN 201910382430A CN 110110931 A CN110110931 A CN 110110931A
Authority
CN
China
Prior art keywords
order
data
similarity
history
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910382430.7A
Other languages
English (en)
Inventor
金忠孝
张伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SAIC Anji Logistics Co Ltd
Original Assignee
SAIC Anji Logistics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SAIC Anji Logistics Co Ltd filed Critical SAIC Anji Logistics Co Ltd
Priority to CN201910382430.7A priority Critical patent/CN110110931A/zh
Publication of CN110110931A publication Critical patent/CN110110931A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种订单预测方法和装置、物流系统及计算机可读介质。该方法包括:采集线路的历史订单数据,所述历史订单数据包括订单生成时间和订单量;从历史订单数据截取N天的订单量作为时序输入序列,并以第N+1天的订单量作为该时序输入序列的标签,移动数据截取窗口获取多个训练样本,所述训练样本包括时序输入序列及对应的标签;计算多个训练样本与测试样本的相似度,根据相似度对多个训练样本进行排序;根据所述订单生成时间对排序后的所述训练样本进行整合;使用经整合的所述训练样本训练长短期记忆模型;使用经训练的长短期记忆模型对测试时间的订单量进行预测。

Description

订单预测方法和装置、物流系统及计算机可读介质
技术领域
本发明主要涉及智能物流领域,尤其涉及一种订单预测方法和装置、物流系统及计算机可读介质。
背景技术
智能物流运输领域是人工智能技术与物流领域的交叉领域,旨在利用人工智能技术中的智能算法替代人工的方法来解决物流领域中的常见问题,例如订单预测问题、路径规划问题、道口计划问题、车辆调度问题、仓库选址问题等。其中订单预测问题又可以根据预测周期分为天度、周度、月度、年度订单预测等。在订单预测问题中,可以进一步根据发货地和收货地分为各线路订单预测问题,根据车型分为各车型订单预测问题,以及更复杂的各车型线路在多周期上的订单预测问题等。
智能物流运输领域解决订单预测问题的方案,一般是依据经验公式,通过分析历史订单数据、整车厂产量、运力数据、市场情况等,对历史订单数据进行线性拟合,并且所解决的订单预测问题多为月度或更长周期的预测。这种方案存在如下缺点:
1、线性拟合的预测方式预测精度低、响应速度慢,无法满足每天物流调度的预测需求。
2、对预测人员的经验要求较高,预测效果与人的经验高度相关,难以满足智能物流运输领域持续优化算法的需要。
发明内容
本发明要解决的技术问题是提供基于深度学习长短期记忆与K最邻近算法组合模型的订单预测方法和装置、物流系统及计算机可读介质。
为解决上述技术问题,本发明的一方面提供了一种订单预测方法,该方法包括:采集线路的历史订单数据,所述历史订单数据包括订单生成时间和订单量;从历史订单数据截取N天的订单量作为时序输入序列,并以第N+1天的订单量作为该时序输入序列的标签,移动数据截取窗口获取多个训练样本,所述训练样本包括时序输入序列及对应的标签;计算多个训练样本与测试样本的相似度,根据相似度对多个训练样本进行排序;根据所述订单生成时间对排序后的所述训练样本进行整合;使用经整合的所述训练样本训练长短期记忆模型;使用经训练的长短期记忆模型对测试时间的订单量进行预测。
在本发明的一实施例中,采用K最邻近节点算法计算多个训练样本与测试样本的相似度。
在本发明的一实施例中,所述K最邻近节点算法为曼哈顿距离相似度算法、欧式距离相似度算法、余弦相似度算法或皮尔森相似度算法。
在本发明的一实施例中,还包括采集多条线路的历史订单数据,计算多条线路中每两条线路历史订单数据的相似度,合并相似度大于预设值的两条线路。
在本发明的一实施例中,采用曼哈顿距离相似度算法、欧式距离相似度算法、余弦相似度算法或皮尔森相似度算法计算多条线路中每两条线路历史订单数据的相似度。
在本发明的一实施例中,根据所述订单生成时间的星期数对排序后的所述训练样本进行整合。
在本发明的一实施例中,采集线路的历史订单数据包括:获取历史订单对应的原始数据;对原始数据进行预处理,获取历史订单数据的订单生成时间和订单量。
在本发明的一实施例中,所述预处理包括异常值处理或缺失值处理中的至少一种。
在本发明的一实施例中,还包括获取订单的在线数据,基于所述在线数据训练并更新所述长短期记忆模型。
本发明的另一方面提供了一种订单预测装置,该装置包括:采集单元,采集线路的历史订单数据,所述历史订单数据包括订单生成时间和订单量;训练样本获取单元,从历史订单数据截取N天的订单量作为时序输入序列,并以第N+1天的订单量作为该时序输入序列的标签,移动数据截取窗口获取多个训练样本,所述训练样本包括时序输入序列及对应的标签;计算单元,计算多个训练样本与测试样本的相似度,根据相似度对多个训练样本进行排序;整合单元,根据所述订单生成时间对排序后的所述训练样本进行整合;训练单元,使用经整合的所述训练样本训练长短期记忆模型;预测单元,使用经训练的长短期记忆模型对测试时间的订单量进行预测。
在本发明的一实施例中,所述计算单元采用K最邻近节点算法计算多个时序输入序列和对应的标签与测试样本的相似度。
在本发明的一实施例中,所述K最邻近节点算法为曼哈顿距离相似度算法、欧式距离相似度算法、余弦相似度算法或皮尔森相似度算法。
在本发明的一实施例中,所述采集单元采集多条线路的历史订单数据,计算多条线路中每两条线路历史订单数据的相似度,合并相似度大于预设值的两条线路。
在本发明的一实施例中,所述采集单元采用曼哈顿距离相似度、欧式距离相似度、余弦相似度或皮尔森相似度计算多条线路中每两条线路历史订单数据的相似度。
在本发明的一实施例中,所述整合单元根据所述订单生成时间的星期数对排序后的所述训练样本进行整合。
在本发明的一实施例中,所述采集单元采集线路的历史订单数据包括:获取历史订单对应的原始数据;对原始数据进行预处理,获取历史订单数据的订单生成时间和订单量。
在本发明的一实施例中,所述预处理包括异常值处理或缺失值处理中的至少一种。
在本发明的一实施例中,所述训练单元获取订单的在线数据,基于所述在线数据训练并更新所述长短期记忆模型。
本发明的又一方面提供了一种物流系统,包括:存储器,用于存储可由处理器执行的指令;处理器,用于执行所述指令以实现如上所述的方法。
本发明的再一方面提供了一种计算机可读介质,其上存储有计算机指令,其中当计算机指令被处理器执行时,执行如上所述的方法。
与现有技术相比,本发明利用基于深度学习长短期记忆与K最邻近算法组合模型,根据订单变化相似性对相似线路的订单数据进行整合,应用K最邻近算法寻找历史订单数据中相似的历史片段作为训练样本,利用这些训练样本对长短期记忆模型进行训练,可以预测出未来一段时间内可能发生的订单量,使得后续的物流优化算法可以达到目标函数的最优值,具有通用性强、时效性强、精确度高、智能化的优点。
附图说明
为让本发明的上述目的、特征和优点能更明显易懂,以下结合附图对本发明的具体实施方式作详细说明,其中:
图1是本发明一实施例的订单预测方法的示例性流程图;
图2是本发明一实施例的移动数据截取窗口获得训练样本的示意图;
图3是长短期记忆模型中的重复模块的结构示意图;
图4是本发明一实施例中的长短期记忆模型的结构示意图;
图5是本发明一实施例中使用经训练的长短期记忆模型对测试时间的订单量进行预测的示例性流程图;
图6是本发明一实施例的订单预测结果对比图;
图7是本发明一实施例的订单预测装置的结构框图;
图8是本发明一实施例的物流系统的框图。
具体实施方式
为让本发明的上述目的、特征和优点能更明显易懂,以下结合附图对本发明的具体实施方式作详细说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其它不同于在此描述的其它方式来实施,因此本发明不受下面公开的具体实施例的限制。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
图1是本发明一实施例的订单预测方法的示例性流程图。参考图1所示,该订单的预测方法包括以下步骤:
步骤110,采集线路的历史订单数据。
该历史订单数据包括对应于某一线路的订单生成时间和订单量。线路可以由发货地和收货地来确定,该发货地和收货地可以分别是发出城市和目的城市,例如上海-上海线路、上海-苏州线路等。发货地和收货地也可以是省、县级市、地区、仓库代码等。例如,表一所示为由上海-上海路线所得到的历史订单数据。
表一:
表一中的*为表示订单量的任意数值。订单生成时间不限于表一中的记录形式,还可以包括年、月、日、时、分、秒以及星期几的信息。由于本发明的目的是为了根据历史订单数据对未来某一天的订单量进行预测,也就是进行天度订单预测,因此历史订单数据中订单生成时间至少应以天为周期来生成。在一些实施例中,历史订单数据中订单生成时间还可以以小时为周期来生成。
在本步骤中,可以同时采集多条线路的历史订单数据,计算多条线路中每两条线路历史订单数据的相似度,合并相似度大于预设值的两条线路,从而可以增大后续进行长短期记忆模型的训练数据集的规模。其中,计算多条线路中每两条线路历史订单数据的相似度的方法可以包括但不限于曼哈顿距离相似度算法、欧式距离相似度算法、余弦相似度算法或皮尔森相似度算法。例如,经过相似度计算的结果表明,上海-上海线路与上海-苏州线路的相似度较高,大于预设值,则将该两条线路合并,即将对应于该两条线路的历史订单数据合并起来作为同一条线路(例如记为A线路)的历史订单数据。显然,合并后所产生的A线路中包括了原上海-上海线路与上海-苏州线路中的所有历史订单数据,由A线路所采集而得到的历史订单数据的数据量等于原上海-上海线路与上海-苏州线路中历史订单数据的数据量之和。
可以理解的是,也可以有多于两条线路的历史订单数据彼此之间的相似度都大于预设值,则合并该多于两条线路。
在一些实施例中,采集线路的历史订单数据可以包括:获取历史订单对应的原始数据;对原始数据进行预处理,获取历史订单数据的订单生成时间和订单量。在一些实施例中,预处理包括异常值处理或缺失值处理中的至少一种。
异常值处理可以是对历史订单对应的原始数据进行检查核对,剔除异常值,以避免异常值影响后续预测的准确度。缺失值处理可以是,对历史订单对应的原始数据进行检查核对,填补相应的缺失值,以提高订单预测的准确度。
步骤120,从历史订单数据截取N天的订单量作为时序输入序列,并以第N+1天的订单量作为该时序输入序列的标签,移动数据截取窗口获取多个训练样本。该训练样本包括时序输入序列及对应的标签。
图2是本发明一实施例的移动数据截取窗口获得训练样本的示意图。首先确定所要截取的天数N。在图2所示的实施例中,N=15。参考图2所示,数据截取窗口的长度为N+1=16,其中包括了从D1到D16共16天的历史订单数据,即订单量。其中,D1到D15的订单量作为时序输入序列,即如图2中所示的时序输入序列1,D16作为该时序输入序列的标签,即如图2中所示的标签1。时序输入序列1和标签1即组成一个训练样本。
在图2所示的实施例中,该移动数据截取窗口的步长为单天的历史订单数据。如图2所示,在确定好时序输入序列1和标签1之后。将数据截取窗口向后移动1天,从而获得时序输入序列2和标签2。其中时序输入序列2中包括D2到D16的订单量,标签2为D17的订单量。时序输入序列2和标签2即组成第二个训练样本。显然,时序输入序列1和时序输入序列2中的订单量数据是有部分重叠的。按照图2所示的移动数据截取窗口的方法,可以获得多个训练样本。该训练样本的数量与总的数据集的大小数量有关。
可以理解的是,在其他的实施例中,移动数据截取窗口的步长可以大于一天。为了充分利用数据集中的所有数据,移动数据截取窗口的步长应小于N,以保证数据集中的每一个数据都可以用于时序输入序列。当该步长为单天时,预测效果最好。
步骤130,计算多个训练样本与测试样本的相似度,根据相似度对多个训练样本进行排序。其中,测试样本也是与训练样本属于同样线路的历史订单数据。测试样本数据的订单生成时间不同于训练样本。本发明的实施例对测试样本的数量没有限制。对于包含有多个历史订单数据的测试样本数据集来说,可以采用与步骤120相似的移动数据截取窗口的方法,对测试样本数据集进行处理,获得多个测试样本。
在一些实施例中,采用K最邻近节点算法(K-Nearest Neighbor algorithm,KNN)计算多个训练样本与测试样本的相似度。K最邻近节点算法是电子信息分类器算法中的一种。其基本思路为,当新的样本(测试样本)出现后,考虑在训练样本集中与新样本距离最近(最相似)的K个样本,根据这K个样本的分类来决定新样本的类别。
在本发明的订单预测方法中,K最邻近节点算法计算历史订单数据中的多个训练样本与测试样本之间的相似度,并将多个训练样本按照该相似度进行排序。
K最邻近节点算法包括但不限于:曼哈顿距离相似度算法、欧式距离相似度算法、余弦相似度算法、皮尔森相似度算法和Tanimoto系数等。下面列举几种预测效果较好的相似度算法的相似度计算公式,其中,x、y表示待计算相似度的两个向量:
(1)曼哈顿距离相似度算法
d(x,y)=∑|xi-yi|
(2)欧式距离相似度算法
(3)余弦相似度算法
(4)皮尔森相似度算法
K最邻近节点算法的数学模型如下式所示:
xk=argmax Sim(dtest,di),k=1,...,k
其中,dtest为测试数据,di为训练数据。xk为从步骤120中所获得的多个训练样本中所抽取出来的K个与测试样本最为相似的训练样本,如表二所示。
表二:
在表二中,相似度S1、S2、……、SK的排列顺序为从高到低,即相似度为S1的训练样本与测试样本的相似度最高,依次类推。在一行中,对应于一个相似度的时序输入序列和标签组成了该相似度所对应的训练样本。测试样本是由时序输入序列Daytest、Daytest+1、……、Daytest+N-1以及标签Daytest+N组成。
步骤140,根据订单生成时间对排序后的训练样本进行整合。
本步骤的目的在于通过对排序后的训练样本进行整合,使这些排序后的训练样本适用于后续的长短期记忆模型的训练和测试。
在一些实施例中,根据订单生成时间的星期数对排序后的训练样本进行整合。假设表二中的Dayi1所对应的订单生成时间是星期一,Dayi1、Dayi1+1、……、Dayi1+N是按照天数顺序排列。即Dayi1+1所对应的订单生成时间是星期二、Dayi1+2所对应的订单生成时间是星期三等等,以此类推。表三是根据订单生成时间的星期数对排序后的训练样本进行整合之后的结果。
表三:
在本实施例中,表三中N=7,即在属于训练集的序列1至序列N中分别包含所有对应于星期一至星期日的训练样本。对测试集中的测试样本也用同样的方法进行整合,即测试集的序列N+1中所包含的测试样本是对应于某一个星期数的。表三仅示出了一行测试集的测试样本,实际中,测试样本可以有多个,在本步骤对多个测试样本按照星期数进行整合。
步骤150,使用经整合的训练样本训练长短期记忆模型。
图3是长短期记忆模型中的重复模块的结构示意图。长短期记忆(Long Short-Term Memory,LSTM)模型是一种特殊的循环神经网络(RNN)模型,能够学习长的依赖关系。参考图3所示,该LSTM模型的重复模块中包含了四层交互神经网络层(311-314)。穿过该结构示意图顶部的水平线表示细胞的状态。其中由前一重复模块输出的细胞状态为Ct-1,由本重复模块输出的细胞状态为Ct。每一个神经网络层和一个点乘法运算组成一个门(Gate)。其中,神经网络层311、312和313都是Sigmoid神经网络层。神经网络层311与点乘法运算321形成遗忘门层。神经网络层312与点乘法运算322形成输入门层。神经网络层314与点乘法运算323形成输出门层。图3中所示的χt为输入向量,分别代表隐层、LSTM模型输入门、遗忘门、状态和输出门的激活函数参数。l分别表示模型的第l层,t表示时序输入时间t。
图4是本发明一实施例中的长短期记忆模型的结构示意图。参考图4所示,该LSTM模型可以由图3所示的重复模块串联起来形成链状结构,包括输入层410、隐层420和输出层430。其中各层均由LSTM模型的重复模块所组成。在该LSTM模型中的各个激活函数参数可以由下列公式获得:
在上述的公式中,W表示模型训练参数矩阵,b表示训练偏差参数。在图4中,Wi为输入层的模型训练参数矩阵,Wf为隐层的模型训练参数矩阵,Wo为输出层的模型训练参数矩阵。
利用由步骤140中所获的一定数量的训练样本,将这些训练样本作为LSTM模型的输入,对该LSTM模型进行训练。例如,每一个训练样本都包括具有N天的订单量的时序输入序列和具有第N+1天的订单量的标签。将这些训练样本都输入到LSTM模型中,利用多个时序输入序列对LSTM模型进行训练,将由时序输入序列所估计出的第N+1天的订单量与该时序输入序列所对应的标签进行比较,使二者之间的误差达到极小,则训练结束。
可以理解的是,对应于不同的线路,训练样本也是不同的。因此,对于不同的线路来说,经训练的LSTM模型中的各个参数也是不一样的。
在一些实施例中,还包括获取订单的在线数据,基于在线数据训练并更新长短期记忆模型。通过对在线数据的再学习更新先前离线训练完成的长短期记忆模型,可以使长短期记忆模型动态更新,提高预测的准确性。
步骤160,使用经训练的长短期记忆模型对测试时间的订单量进行预测。
图5是本发明一实施例中使用经训练的长短期记忆模型对测试时间的订单量进行预测的示例性流程图。参考图5所示,该预测流程包括以下步骤:
步骤510,收集线路j在测试时间之前N天的历史订单数据作为测试输入集。
步骤520,采用K最邻近节点算法从历史订单数据中抽取出与测试输入集相似度最高的K个历史样本。
本步骤中用于抽取K个历史样本的历史订单数据是对应线路j的历史订单数据,并且该历史订单数据的数据量应大于测试时间之前N天的历史订单数据。例如,可以是测试时间之前一年的历史订单数据。
在本步骤中还包括采用如图1中的步骤120的方法进行处理,并采用如图1中的步骤140的方法对历史订单数据进行整合。
步骤530,将K个历史样本与测试输入集输入训练好的线路j的长短期记忆模型。在本步骤中,对应线路j的LSTM模型是已经按照图1所示的步骤训练好的。用于训练LSTM模型的数据及其数量可以不同于步骤510中所收集的历史订单数据。
步骤540,输出测试时间的预测订单量。
由于采用K最邻近节点算法抽取出了与测试输入集相似度最高的K个历史样本,并与测试输入集一起整合成新的测试数据集,再将该测试数据集输入已经训练好的LSTM模型,对测试时间的订单量进行预测,可以节省模型的预测时间,提高预测的准确性。
图5所示的预测流程可以是一个循环的步骤,在完成了对线路j在测试时间的订单量的预测之后,可以紧接着对线路j+1在测试时间的订单量进行预测。其中,对于不同线路想要预测订单量的测试时间可以是不同的,对于不同线路的训练好的LSTM模型的参数也是不同的。
需要说明的是,当按照星期数对排序后的训练样本进行整合,并使用该整合后的训练样本对LSTM模型进行训练时,该LSTM模型对未来一个星期的订单量预测具有最好的效果。
下面通过一个具体实施例说明本发明的订单预测方法的效果。该实施例所采集的线路为上海-江苏线路。其中,训练数据中的历史天度订单数据的订单生成时间是从2013年1月年1月8日至2015年12月31日,共1065个有效样本;测试数据中的历史天度订单数据的订单生成时间是从2016年1月1日至2016年12月31日,共320个有效样本。按照本发明的订单预测方法,对训练数据和测试数据进行移动数据截取窗口的处理获得训练样本和测试样本,从该线路的训练数据中选择相似度最高的训练样本,并对训练样本进行整合,使用经整合的训练样本对LSTM模型进行训练,获得对应于该线路的模型参数。再根据图5所示的预测流程,对测试数据中每一天的数据进行预测。
图6是本发明一实施例的订单预测结果对比图。图6所示即为上述上海-江苏线路的订单预测结果对比图。图中横轴为天数,共有320天,纵轴为订单量。对应于每一天的订单量的实际值由虚线所示,预测值由实线所示。可见,对于该实施例来说,预测值与实际值具有较好的吻合度。
可以理解的是,本发明的实施例是以线路为例,对某条线路所对应的订单量进行预测。根据本发明的思想,也可以针对不同的车型、运力类型等采集历史订单数据,并针对这些类型所对应的订单量来进行预测。
根据本发明的订单预测方法可以在天度周期上对未来订单量进行预测。其优势在于:
(1)通用性强:本发明的订单预测方法可以在任何物流调度算法之前使用,为下一个工作日乃至未来某一段时间内的物流调度提供预测指导,更高效的进行物流线路优化、运力调度、以及运输周期优化。
(2)时效性强,精确度高:本发明使用人工智能算法,实现智能化地对历史数据进行分析并对未来订单量进行预测,预测时效性强、准确度高,能够实现天度的高频预测,并且具有很高的预测精确度。
(3)智能化:本发明通过人工智能算法,能够智能实现自我学习、优化,并且可以自动根据每条物流线路、车型、运力类型等物流条件,自适应地自我优化,具有很高的智能度。
图7是本发明一实施例的订单预测装置的结构框图。参考图7所示,该装置包括采集单元710、训练样本获取单元720、计算单元730、整合单元740、训练单元750和预测单元760。
其中,采集单元710用于采集线路的历史订单数据,该历史订单数据包括订单生成时间和订单量。在一些实施例中,采集单元710采集多条线路的历史订单数据,计算多条线路中每两条线路历史订单数据的相似度,合并相似度大于预设值的两条线路。采集单元710可以采用曼哈顿距离相似度、欧式距离相似度、余弦相似度或皮尔森相似度计算多条线路中每两条线路历史订单数据的相似度。具体的采集方法可以参考图1所示的步骤110及其说明内容。
在一些实施例中,采集单元采集线路的历史订单数据可以包括:获取历史订单对应的原始数据;对原始数据进行预处理,获取历史订单数据的订单生成时间和订单量。在一些实施例中,预处理可以包括异常值处理或缺失值处理中的至少一种。
异常值处理可以是对历史订单对应的原始数据进行检查核对,剔除异常值,以避免异常值影响后续预测的准确度。缺失值处理可以是,对历史订单对应的原始数据进行检查核对,填补相应的缺失值,以提高订单预测的准确度。
训练样本获取单元720用于从历史订单数据截取N天的订单量作为时序输入序列,并以第N+1天的订单量作为该时序输入序列的标签,移动数据截取窗口获取多个训练样本,该训练样本包括时序输入序列及对应的标签。具体的训练样本获取方法可以参考图1所示的步骤120及其说明内容。
计算单元730用于计算多个训练样本与测试样本的相似度,根据相似度对多个训练样本进行排序。在一些实施例中,计算单元730采用K最邻近节点算法计算多个时序输入序列和对应的标签与测试样本的相似度。该K最邻近节点算法可以是但不限于曼哈顿距离相似度算法、欧式距离相似度算法、余弦相似度算法或皮尔森相似度算法。具体的计算方法可以参考图1所示的步骤130及其说明内容。
整合单元740用于根据订单生成时间对排序后的训练样本进行整合。在一些二实施例中,整合单元740根据订单生成时间的星期数对排序后的训练样本进行整合。具体的整合方法可以参考图1所示的步骤140及其说明内容。
训练单元750用于使用经整合的训练样本训练LSTM模型。具体的训练方法可以参考图1所示的步骤150及其说明内容。
在一些实施例中,训练单元获取订单的在线数据,基于在线数据训练并更新所述长短期记忆模型。通过对在线数据的再学习更新先前离线训练完成的长短期记忆模型,可以使长短期记忆模型动态更新,提高预测的准确性。
预测单元760用于使用经训练的LSTM模型对测试时间的订单量进行预测。具体的预测方法可以参考图1所示的步骤160及其说明内容。
本发明的技术方案还提出了一种物流系统,包括存储器和处理器。其中,存储器用于存储可由处理器执行的指令;处理器用于执行该指令以实现本发明实施例所示的订单预测方法。图8是本发明一实施例的物流系统的框图。参考图8所示,该物流系统可以包括内部通信总线801、处理器802、只读存储器(ROM)803、随机存取存储器(RAM)804、通信端口805、以及硬盘806。内部通信总线801可以实现物流系统内部各个组件之间的数据通信。处理器802可以进行判断和发出提示。在一些实施例中,处理器802可以由一个或多个处理器组成。通信端口805可以实现物流系统与外部组件,例如客户端等,之间进行数据通信。
在一些实施例中,物流系统通过通信端口805可以连接到网络,并从网络发送和接受信息及数据。该连接可以是有线连接、无线连接、能够实现数据传送和/或接收的任意其他通信连接、和/或这些连接的任意组合。有线连接可包括例如电缆、光缆、电话线等或者其任意组合。无线连接可包括例如蓝牙TM链路、Wi-FiTM链路、WiMaxTM链路、WLAN链路、ZigBee链路、移动网络链路(例如,3G,4G,5G等)等或其组合。在一些实施例中,通信端口805可以是包括标准化通信端口,诸如RS232、RS485等。
物流系统中的存储器可以包括不同形式的程序储存单元以及数据储存单元,例如硬盘806,只读存储器803和随机存取存储器804,能够存储计算机处理和/或通信使用的各种数据文件,以及处理器802所执行的可能的程序指令。物流系统中的处理器802执行这些指令以实现本发明的预测订单的方法的主要部分。处理器802处理的结果通过通信端口805传给客户端,并可以在用户界面上显示。
本发明的订单预测方法可以以计算机程序代码的形式存储在计算机可读介质中,该计算机程序代码由处理器执行以实现该方法所包要达到的功能。
本发明的订单预测方法的一些方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。处理器可以是一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理器件(DAPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器或者其组合。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。例如,计算机可读介质可包括,但不限于,磁性存储设备(例如,硬盘、软盘、磁带……)、光盘(例如,压缩盘CD、数字多功能盘DVD……)、智能卡以及闪存设备(例如,卡、棒、键驱动器……)。
计算机可读介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等等、或合适的组合形式。计算机可读介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机可读介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、射频信号、或类似介质、或任何上述介质的组合。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个申请实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
虽然本发明已参照当前的具体实施例来描述,但是本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,在没有脱离本发明精神的情况下还可做出各种等效的变化或替换,因此,只要在本发明的实质精神范围内对上述实施例的变化、变型都将落在本申请的权利要求书的范围内。

Claims (10)

1.一种订单预测方法,该方法包括:
采集线路的历史订单数据,所述历史订单数据包括订单生成时间和订单量;
从历史订单数据截取N天的订单量作为时序输入序列,并以第N+1天的订单量作为该时序输入序列的标签,移动数据截取窗口获取多个训练样本,所述训练样本包括时序输入序列及对应的标签;
计算多个训练样本与测试样本的相似度,根据相似度对多个训练样本进行排序;
根据所述订单生成时间对排序后的所述训练样本进行整合;
使用经整合的所述训练样本训练长短期记忆模型;
使用经训练的长短期记忆模型对测试时间的订单量进行预测。
2.如权利要求1所述的订单预测方法,其特征在于,采用K最邻近节点算法计算多个训练样本与测试样本的相似度。
3.如权利要求2所述的订单预测方法,其特征在于,所述K最邻近节点算法为曼哈顿距离相似度算法、欧式距离相似度算法、余弦相似度算法或皮尔森相似度算法。
4.如权利要求1所述的订单预测方法,其特征在于,还包括采集多条线路的历史订单数据,计算多条线路中每两条线路历史订单数据的相似度,合并相似度大于预设值的两条线路。
5.如权利要求4所述的订单预测方法,其特征在于,采用曼哈顿距离相似度算法、欧式距离相似度算法、余弦相似度算法或皮尔森相似度算法计算多条线路中每两条线路历史订单数据的相似度。
6.如权利要求1所述的订单预测方法,其特征在于,根据所述订单生成时间的星期数对排序后的所述训练样本进行整合。
7.如权利要求1所述的订单预测方法,其特征在于,采集线路的历史订单数据包括:
获取历史订单对应的原始数据;
对原始数据进行预处理,获取历史订单数据的订单生成时间和订单量。
8.一种订单预测装置,该装置包括:
采集单元,采集线路的历史订单数据,所述历史订单数据包括订单生成时间和订单量;
训练样本获取单元,从历史订单数据截取N天的订单量作为时序输入序列,并以第N+1天的订单量作为该时序输入序列的标签,移动数据截取窗口获取多个训练样本,所述训练样本包括时序输入序列及对应的标签;
计算单元,计算多个训练样本与测试样本的相似度,根据相似度对多个训练样本进行排序;
整合单元,根据所述订单生成时间对排序后的所述训练样本进行整合;
训练单元,使用经整合的所述训练样本训练长短期记忆模型;
预测单元,使用经训练的长短期记忆模型对测试时间的订单量进行预测。
9.一种物流系统,包括:
存储器,用于存储可由处理器执行的指令;
处理器,用于执行所述指令以实现如权利要求1-7任一项所述的方法。
10.一种计算机可读介质,其上存储有计算机指令,其中当计算机指令被处理器执行时,执行如权利要求1-7任一项所述的方法。
CN201910382430.7A 2019-05-09 2019-05-09 订单预测方法和装置、物流系统及计算机可读介质 Pending CN110110931A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910382430.7A CN110110931A (zh) 2019-05-09 2019-05-09 订单预测方法和装置、物流系统及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910382430.7A CN110110931A (zh) 2019-05-09 2019-05-09 订单预测方法和装置、物流系统及计算机可读介质

Publications (1)

Publication Number Publication Date
CN110110931A true CN110110931A (zh) 2019-08-09

Family

ID=67488941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910382430.7A Pending CN110110931A (zh) 2019-05-09 2019-05-09 订单预测方法和装置、物流系统及计算机可读介质

Country Status (1)

Country Link
CN (1) CN110110931A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598940A (zh) * 2019-09-18 2019-12-20 深圳宇德金昌贸易有限公司 一种基于物联网贸易的物流订单分析预测系统
CN110766194A (zh) * 2019-09-16 2020-02-07 北京旷视机器人技术有限公司 订单处理方法及装置、仓储系统、计算机设备和存储介质
CN111242368A (zh) * 2020-01-09 2020-06-05 中央财经大学 一种基于场景推演的物流配送调度算法
CN112949888A (zh) * 2019-12-11 2021-06-11 顺丰科技有限公司 件量预测模型训练以及件量预测方法、装置和计算机设备
CN113077069A (zh) * 2020-01-03 2021-07-06 顺丰科技有限公司 预测中转班次件量的建模方法、装置、设备及存储介质
CN115423393A (zh) * 2022-08-12 2022-12-02 北京邮电大学 一种基于lstm的动态自适应调度周期的订单调度方法及装置
CN116151931A (zh) * 2023-04-04 2023-05-23 济宁大爱服装有限公司 基于人工智能的跨境电商销产一体化数据处理系统
US20230386584A1 (en) * 2022-05-27 2023-11-30 Sandisk Technologies Llc Systems and methods of correcting errors in unmatched memory devices

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103310286A (zh) * 2013-06-25 2013-09-18 浙江大学 一种具有时间序列特性的产品订单预测方法及装置
CN108108251A (zh) * 2017-11-30 2018-06-01 重庆邮电大学 一种基于MPI并行化的参考点k近邻分类方法
CN108564326A (zh) * 2018-04-19 2018-09-21 安吉汽车物流股份有限公司 订单的预测方法及装置、计算机可读介质、物流系统
CN108960537A (zh) * 2018-08-17 2018-12-07 安吉汽车物流股份有限公司 物流订单的预测方法及装置、可读介质
CN109214559A (zh) * 2018-08-17 2019-01-15 安吉汽车物流股份有限公司 物流业务的预测方法及装置、可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103310286A (zh) * 2013-06-25 2013-09-18 浙江大学 一种具有时间序列特性的产品订单预测方法及装置
CN108108251A (zh) * 2017-11-30 2018-06-01 重庆邮电大学 一种基于MPI并行化的参考点k近邻分类方法
CN108564326A (zh) * 2018-04-19 2018-09-21 安吉汽车物流股份有限公司 订单的预测方法及装置、计算机可读介质、物流系统
CN108960537A (zh) * 2018-08-17 2018-12-07 安吉汽车物流股份有限公司 物流订单的预测方法及装置、可读介质
CN109214559A (zh) * 2018-08-17 2019-01-15 安吉汽车物流股份有限公司 物流业务的预测方法及装置、可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
罗向龙等: "基于KNN-LSTM 的短时交通流预测", 北京工业大学学报, pages 1521 - 1527 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110766194A (zh) * 2019-09-16 2020-02-07 北京旷视机器人技术有限公司 订单处理方法及装置、仓储系统、计算机设备和存储介质
CN110598940A (zh) * 2019-09-18 2019-12-20 深圳宇德金昌贸易有限公司 一种基于物联网贸易的物流订单分析预测系统
CN112949888A (zh) * 2019-12-11 2021-06-11 顺丰科技有限公司 件量预测模型训练以及件量预测方法、装置和计算机设备
CN113077069A (zh) * 2020-01-03 2021-07-06 顺丰科技有限公司 预测中转班次件量的建模方法、装置、设备及存储介质
CN113077069B (zh) * 2020-01-03 2023-06-13 顺丰科技有限公司 预测中转班次件量的建模方法、装置、设备及存储介质
CN111242368A (zh) * 2020-01-09 2020-06-05 中央财经大学 一种基于场景推演的物流配送调度算法
CN111242368B (zh) * 2020-01-09 2024-03-15 中央财经大学 一种基于场景推演的物流配送调度算法
US20230386584A1 (en) * 2022-05-27 2023-11-30 Sandisk Technologies Llc Systems and methods of correcting errors in unmatched memory devices
US12100458B2 (en) * 2022-05-27 2024-09-24 Sandisk Technologies Llc Systems and methods of correcting errors in unmatched memory devices
CN115423393A (zh) * 2022-08-12 2022-12-02 北京邮电大学 一种基于lstm的动态自适应调度周期的订单调度方法及装置
CN116151931A (zh) * 2023-04-04 2023-05-23 济宁大爱服装有限公司 基于人工智能的跨境电商销产一体化数据处理系统

Similar Documents

Publication Publication Date Title
CN110110931A (zh) 订单预测方法和装置、物流系统及计算机可读介质
Al-Janabi et al. A new method for prediction of air pollution based on intelligent computation
CN110097320A (zh) 订单预测方法和装置、物流系统及计算机可读介质
CN108694673A (zh) 一种保险业务风险预测的处理方法、装置及处理设备
CN110110932A (zh) 订单预测方法和装置、物流系统及计算机可读介质
CN114664091A (zh) 一种基于节假日流量预测算法的预警方法及系统
CN110400021A (zh) 银行网点现金用量预测方法及装置
CN111582559B (zh) 一种到达时间的预估方法及装置
CN109767032A (zh) 一种基于数据分析的企业财务运营数字化管理优化系统
CN112036598A (zh) 一种基于多信息耦合的充电桩使用信息预测方法
CN116662815B (zh) 时间预测模型的训练方法以及相关设备
CN110222610A (zh) 一种信号分类的方法及装置
Zhu et al. A novel hybrid deep learning model for taxi demand forecasting based on decomposition of time series and fusion of text data
CN109190800A (zh) 一种基于spark框架的海面温度预测方法
Rodríguez-Rueda et al. Origin–Destination matrix estimation and prediction from socioeconomic variables using automatic feature selection procedure-based machine learning model
Sharma et al. Deep Learning Based Prediction Of Weather Using Hybrid_stacked Bi-Long Short Term Memory
CN114358448B (zh) 一种行驶路线规划方法和装置
CN112820111A (zh) 一种异常车辆识别方法、装置和电子设备
Chen et al. Reconciling spatiotemporal conjunction with digital twin for sequential travel time prediction and intelligent routing
Sumarjaya et al. Forecasting Monthly Inflation Rate in Denpasar Using Long Short-Term Memory
KR102433431B1 (ko) 이종 데이터를 이용한 향상된 예측 시스템 및 예측 방법
Mitchell Predicting Bike-Sharing Traffic Flow using Machine Learning
CN116150699B (zh) 基于深度学习的交通流预测方法、装置、设备及介质
Zhang et al. Design and investigation of small-scale long-distance RF energy harvesting system for wireless charging using CNN, LSTM, and reinforcement learning
CN113283184B (zh) 一种出行推荐方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190809

RJ01 Rejection of invention patent application after publication