CN112686433A - 快递数量的预测方法、装置、设备及存储介质 - Google Patents
快递数量的预测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112686433A CN112686433A CN202011519275.8A CN202011519275A CN112686433A CN 112686433 A CN112686433 A CN 112686433A CN 202011519275 A CN202011519275 A CN 202011519275A CN 112686433 A CN112686433 A CN 112686433A
- Authority
- CN
- China
- Prior art keywords
- data
- express
- historical
- preset
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及物流技术领域,公开了一种快递数量的预测方法、装置、设备及存储介质,用于基于对数正态分布函数对快递数量进行预测,提高了预测的准确率,降低了成本,同时有利于资源的合理调度。快递数量的预测方法包括:获取快递数量历史数据,快递数量历史数据为历史时间段内的快递件量数据;对快递数量历史数据进行清洗,去除快递数量历史数据中的冗余数据,替换空数据及异常数据,得到预处理数据;基于预置的数据变化趋势图对预处理数据的变化趋势进行分析,得到变化数据集,并根据变化数据集进行数据的平滑处理,生成目标数据集;基于预置的对数正态分布模型和目标数据集进行快递数量的预测并生成预测结果。
Description
技术领域
本发明涉及物流技术领域,尤其涉及一种快递数量的预测方法、装置、设备及存储介质。
背景技术
在每年的电商活动期间,快递件量波动大,精确的业务量预测信息对商家提前生产仓储、快递企业业务规模人员准备和物流车辆等资源的准备都具有重大的意义。
在现有方案中,对快递数量的预测误差较大,会影响人力、物流车辆等资源的配置以及快递各环节的效率。
发明内容
本发明提供了一种快递数量的预测方法、装置、设备及存储介质,用于基于对数正态分布函数对快递数量进行预测,提高了预测的准确率,降低了成本,同时有利于资源的合理调度。
本发明第一方面提供了一种快递数量的预测方法,包括:获取快递数量历史数据,所述快递数量历史数据为历史时间段内的快递件量数据,所述历史时间段为快递数量历史高峰时间段;对所述快递数量历史数据进行清洗,去除所述快递数量历史数据中的冗余数据,替换空数据及异常数据,得到预处理数据;基于预置的数据变化趋势图对所述预处理数据的变化趋势进行分析,得到变化数据集,并根据所述变化数据集进行数据的平滑处理,生成目标数据集;基于预置的对数正态分布模型和所述目标数据集进行快递数量的预测并生成预测结果。
可选的,在本发明第一方面的第一种实现方式中,在所述基于预置的数据变化趋势图对所述预处理数据的变化趋势进行分析,得到变化数据集,并根据所述变化数据集进行数据的平滑处理,生成目标数据集之后,所述基于预置的对数正态分布模型和所述目标数据集进行快递数量的预测并生成预测结果之前,所述快递数量的预测方法还包括:根据所述目标数据集进行模型拟合,得到对数正态分布模型。
可选的,在本发明第一方面的第二种实现方式中,所述根据所述目标数据集进行模型拟合,得到对数正态分布模型包括:判断所述目标数据集是否符合对数正态分布,得到判别结果;当所述判别结果符合对数正态分布时,基于预置的密度函数计算公式、预置的期望计算公式和预置的方差计算公式分别计算所述目标数据集对应的密度值、期望值和方差值;基于所述目标数据集对应的密度值、期望值和方差值进行模型拟合,得到对数正态分布模型。
可选的,在本发明第一方面的第三种实现方式中,所述当所述判别结果符合对数正态分布时,基于预置的密度函数计算公式、预置的期望计算公式和预置的方差计算公式分别计算所述目标数据集对应的密度值、期望值和方差值包括:将所述目标数据集表示为X,X是取值为正数的连续随机变量,当X服从对数正态分布时,记为InX~N(μ,σ2),其中,μ是所述随机变量对数的平均值,σ是所述随机变量对数的标准差;基于预置的密度函数计算公式计算所述目标数据集对应的密度值,所述预置的密度函数计算公式为基于预置的期望计算公式计算所述目标数据集对应的期望值,所述预置的期望计算公式为基于预置的方差计算公式计算所述目标数据集对应的方差值,所述预置的方差计算公式为
可选的,在本发明第一方面的第四种实现方式中,所述对所述快递数量历史数据进行清洗,去除所述快递数量历史数据中的冗余数据,替换空数据及异常数据,得到预处理数据包括:对所述快递数量历史数据进行分类处理,将所述快递数量历史数据中的单号信息及地址信息筛除,得到基础数据;将所述基础数据中的空数据删除,将异常数据转换为缺失数据,并采用预设的插补流程对所述缺失数据进行补齐处理,得到预处理数据,所述预置的插补流程包括回归插补和多重插补。
可选的,在本发明第一方面的第五种实现方式中,所述基于预置的对数正态分布模型和所述目标数据集进行快递数量的预测并生成预测结果包括:确定目标时间段,所述目标时间段为快递件量的待遇测时间段;从所述目标数据集中提取目标历史时间段内的快递件量历史数据,所述目标历史时间段为进行快递数量预测时依据的历史周期;根据所述预置的对数正态分布模型和所述目标历史时间段内的快递件量历史数据进行快递数量的预测,生成预测结果。
可选的,在本发明第一方面的第六种实现方式中,在所述基于所述对数正态分布模型预测快递的数量并生成预测结果之后,所述方法还包括:获取快递实际数量,根据预置的误差计算公式计算所述预测结果的误差值,并基于所述预测结果的误差值对所述对数正态分布模型进行训练和修正。
本发明第二方面提供了一种快递数量的预测装置,包括:获取模块,用于获取快递数量历史数据,所述快递数量历史数据为历史时间段内的快递件量数据,所述历史时间段为快递数量历史高峰时间段;预处理模块,用于对所述快递数量历史数据进行清洗,去除所述快递数量历史数据中的冗余数据,替换空数据及异常数据,得到预处理数据;分析模块,用于基于预置的数据变化趋势图对所述预处理数据的变化趋势进行分析,得到变化数据集,并根据所述变化数据集进行数据的平滑处理,生成目标数据集;预测模块,用于基于预置的对数正态分布模型和所述目标数据集进行快递数量的预测并生成预测结果。
可选的,在本发明第二方面的第一种实现方式中,在所述基于预置的数据变化趋势图对所述预处理数据的变化趋势进行分析,得到变化数据集,并根据所述变化数据集进行数据的平滑处理,生成目标数据集之后,所述基于预置的对数正态分布模型和所述目标数据集进行快递数量的预测并生成预测结果之前,所述装置还包括:拟合模块,用于根据所述目标数据集进行模型拟合,得到对数正态分布模型。
可选的,在本发明第二方面的第二种实现方式中,所述拟合模块包括:判断单元,用于判断所述目标数据集是否符合对数正态分布,得到判别结果;计算单元,用于当所述判别结果符合对数正态分布时,基于预置的密度函数计算公式、预置的期望计算公式和预置的方差计算公式分别计算所述目标数据集对应的密度值、期望值和方差值;生成单元,用于基于所述目标数据集对应的密度值、期望值和方差值进行模型拟合,得到对数正态分布模型。
可选的,在本发明第二方面的第三种实现方式中,所述计算单元具体用于:将所述目标数据集表示为X,X是取值为正数的连续随机变量,当X服从对数正态分布时,记为InX~N(μ,σ2),其中,μ是所述随机变量对数的平均值,σ是所述随机变量对数的标准差;基于预置的密度函数计算公式计算所述目标数据集对应的密度值,所述预置的密度函数计算公式为基于预置的期望计算公式计算所述目标数据集对应的期望值,所述预置的期望计算公式为基于预置的方差计算公式计算所述目标数据集对应的方差值,所述预置的方差计算公式为
可选的,在本发明第二方面的第四种实现方式中,所述预处理模块包括:分类单元,用于对所述快递数量历史数据进行分类处理,将所述快递数量历史数据中的单号信息及地址信息筛除,得到基础数据;删除单元,用于将所述基础数据中的空数据删除,将异常数据转换为缺失数据,并采用预设的插补流程对所述缺失数据进行补齐处理,得到预处理数据,所述预置的插补流程包括回归插补和多重插补。
可选的,在本发明第二方面的第五种实现方式中,所述预测模块包括:确定单元,用于确定目标时间段,所述目标时间段为快递件量的待遇测时间段;提取单元,用于从所述目标数据集中提取目标历史时间段内的快递件量历史数据,所述目标历史时间段为进行快递数量预测时依据的历史周期;预测单元,用于根据所述预置的对数正态分布模型和所述目标历史时间段内的快递件量历史数据进行快递数量的预测,生成预测结果。
可选的,在本发明第二方面的第六种实现方式中,在所述基于所述对数正态分布模型预测快递的数量并生成预测结果之后,所述装置还包括:训练模块,用于获取快递实际数量,根据预置的误差计算公式计算所述预测结果的误差值,并基于所述预测结果的误差值对所述对数正态分布模型进行训练和修正。
本发明第三方面提供了一种快递数量的预测设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述快递数量的预测设备执行上述的快递数量的预测方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的快递数量的预测方法。
本发明提供的技术方案中,获取快递数量历史数据,所述快递数量历史数据为历史时间段内的快递件量数据,所述历史时间段为快递数量历史高峰时间段;对所述快递数量历史数据进行清洗,去除所述快递数量历史数据中的冗余数据,替换空数据及异常数据,得到预处理数据;基于预置的数据变化趋势图对所述预处理数据的变化趋势进行分析,得到变化数据集,并根据所述变化数据集进行数据的平滑处理,生成目标数据集;基于预置的对数正态分布模型和所述目标数据集进行快递数量的预测并生成预测结果。本发明实施例中,基于对数正态分布函数对快递数量进行预测,提高了预测的准确率,降低了成本,同时有利于资源的合理调度。
附图说明
图1为本发明实施例中快递数量的预测方法的一个实施例示意图;
图2为本发明实施例中快递数量的预测方法的另一个实施例示意图;
图3为本发明实施例中快递数量的预测装置的一个实施例示意图;
图4为本发明实施例中快递数量的预测装置的另一个实施例示意图;
图5为本发明实施例中快递数量的预测设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种快递数量的预测方法、装置、设备及存储介质,用于基于对数正态分布函数对快递数量进行预测,提高了预测的准确率,降低了成本,同时有利于资源的合理调度。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中快递数量的预测方法的一个实施例包括:
101、获取快递数量历史数据,快递数量历史数据为历史时间段内的快递件量数据,历史时间段为快递数量历史高峰时间段。
服务器获取快递数量历史数据,快递数量历史数据为历史时间段内的快递件量数据,历史时间段为快递数量历史高峰时间段。在本实施例中,快递数量历史数据是指历史高峰时间段内的快递件量数据,件量包含收件量,也可以包含发件量,数据可以但不限于包含件量的类型和时间,时间可以是按天存储,也可以按照周存储,也可以按照录入系统的具体时间存储。
可以理解的是,本发明的执行主体可以为快递数量的预测装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
102、对快递数量历史数据进行清洗,去除快递数量历史数据中的冗余数据,替换空数据及异常数据,得到预处理数据。
服务器对快递数量历史数据进行清洗,去除快递数量历史数据中的冗余数据,替换空数据及异常数据,得到预处理数据。具体的,服务器对快递数量历史数据进行分类处理,将快递数量历史数据中的单号信息及地址信息筛除,得到基础数据;服务器将基础数据中的空数据删除,将异常数据转换为缺失数据,并采用预设的插补流程对缺失数据进行补齐处理,得到预处理数据,预置的插补流程包括回归插补和多重插补。
通常在对数据进行统计分析之前,需要将一些不规则数据滤除掉,以确保分析的准确性,数据清洗是一个减少数据错误与不一致性的过程,主要是检测并删除或改正不规则数据,在本实施例中,主要是针对件量进行预测,因此可以去除历史数据中包含的单号信息及地址信息,在这些历史数据中,可能会出现空数据或数值异常,如非数值表示的数据,除了直接删除,可以先把异常值变成缺失值,然后进行后续缺失值补齐,缺失值补齐的过程包括回归插补和多重插补,回归插补(regression imputation)通常选择若干个预测缺失值的自变量,然后建立回归方程估计缺失值,用缺失数据的条件期望值对缺失值进行替换,多重插补方法(multiple imputation)建立在贝叶斯理论基础之上,基于最大期望算法来实现对缺失数据的处理,多重插补过程产生多个中间插补值,通过模拟缺失数据的分布,较好地保持变量之间的关系。
103、基于预置的数据变化趋势图对预处理数据的变化趋势进行分析,得到变化数据集,并根据变化数据集进行数据的平滑处理,生成目标数据集。
服务器基于预置的数据变化趋势图对预处理数据的变化趋势进行分析,得到变化数据集,并根据变化数据集进行数据的平滑处理,生成目标数据集。根据数据变化趋势图可以更好地进行数据分析,趋势分析更多的是明确数据的变化,以及对变化原因进行分析,本实施例中的变化数据集特指电商活动时间范围内的数据集,数据的平滑处理主要通过预置的Savitzky-Golay滤波器,其核心思想是对一定长度窗口内的数据点进行k阶多项式拟合,从而得到拟合后的结果。
104、基于预置的对数正态分布模型和目标数据集进行快递数量的预测并生成预测结果。
服务器基于预置的对数正态分布模型和目标数据集进行快递数量的预测并生成预测结果。具体的,服务器确定目标时间段,目标时间段为快递件量的待遇测时间段;服务器从目标数据集中提取目标历史时间段内的快递件量历史数据,目标历史时间段为进行快递数量预测时依据的历史周期;服务器根据预置的对数正态分布模型和目标历史时间段内的快递件量历史数据进行快递数量的预测,生成预测结果。例如,已知2020年11月的快递件量走势,预测2021年同期快递数量的时候,也假定是这种走势,结合2021年11月之前一个月的数据以及拟合得到的正态分布模型,从而预测2021年11月份每天的快递件量数据。
本发明实施例中,基于对数正态分布函数对快递数量进行预测,提高了预测的准确率,降低了成本,同时有利于资源的合理调度。
请参阅图2,本发明实施例中快递数量的预测方法的另一个实施例包括:
201、获取快递数量历史数据,快递数量历史数据为历史时间段内的快递件量数据,历史时间段为快递数量历史高峰时间段。
服务器获取快递数量历史数据,快递数量历史数据为历史时间段内的快递件量数据,历史时间段为快递数量历史高峰时间段。在本实施例中,快递数量历史数据是指历史高峰时间段内的快递件量数据,件量包含收件量,也可以包含发件量,数据可以但不限于包含件量的类型和时间,时间可以是按天存储,也可以按照周存储,也可以按照录入系统的具体时间存储。
202、对快递数量历史数据进行清洗,去除快递数量历史数据中的冗余数据,替换空数据及异常数据,得到预处理数据。
服务器对快递数量历史数据进行清洗,去除快递数量历史数据中的冗余数据,替换空数据及异常数据,得到预处理数据。具体的,服务器对快递数量历史数据进行分类处理,将快递数量历史数据中的单号信息及地址信息筛除,得到基础数据;服务器将基础数据中的空数据删除,将异常数据转换为缺失数据,并采用预设的插补流程对缺失数据进行补齐处理,得到预处理数据,预置的插补流程包括回归插补和多重插补。
通常在对数据进行统计分析之前,需要将一些不规则数据滤除掉,以确保分析的准确性,数据清洗是一个减少数据错误与不一致性的过程,主要是检测并删除或改正不规则数据,在本实施例中,主要是针对件量进行预测,因此可以去除历史数据中包含的单号信息及地址信息,在这些历史数据中,可能会出现空数据或数值异常,如非数值表示的数据,除了直接删除,可以先把异常值变成缺失值,然后进行后续缺失值补齐,缺失值补齐的过程包括回归插补和多重插补,回归插补(regression imputation)通常选择若干个预测缺失值的自变量,然后建立回归方程估计缺失值,用缺失数据的条件期望值对缺失值进行替换,多重插补方法(multiple imputation)建立在贝叶斯理论基础之上,基于最大期望算法来实现对缺失数据的处理,多重插补过程产生多个中间插补值,通过模拟缺失数据的分布,较好地保持变量之间的关系。
203、基于预置的数据变化趋势图对预处理数据的变化趋势进行分析,得到变化数据集,并根据变化数据集进行数据的平滑处理,生成目标数据集。
服务器基于预置的数据变化趋势图对预处理数据的变化趋势进行分析,得到变化数据集,并根据变化数据集进行数据的平滑处理,生成目标数据集。根据数据变化趋势图可以更好地进行数据分析,趋势分析更多的是明确数据的变化,以及对变化原因进行分析,本实施例中的变化数据集特指电商活动时间范围内的数据集,数据的平滑处理主要通过预置的Savitzky-Golay滤波器,其核心思想是对一定长度窗口内的数据点进行k阶多项式拟合,从而得到拟合后的结果。
204、判断目标数据集是否符合对数正态分布,得到判别结果。
服务器判断目标数据集是否符合对数正态分布,得到判别结果。对数正态分布(logarithmic normal distribution)是指一个随机变量的对数服从正态分布,则该随机变量服从对数正态分布,在很多应用中,特别是在可靠性和维修性方面,数据可能不符合正态分布,但随机变量的对数可能符合正态分布,对此情况称为对数正态分布,对数正态分布与正态分布很类似,除了它的概率分布向右进行了移动,对数正态分布从短期来看,与正态分布非常接近,长期来看,对数正态分布向上分布的数值更多一些,在对数正态分布中,有更大向上波动的可能,更小向下波动的可能。本实施例中通过K-S检验方法(kolmogorov–smirnov test)对目标数据集进行分析判断,K-S检验是基于累计分布函数的,用于检验一个分布是否符合某种理论分布或比较两个经验分布是否有显著差异。
205、当判别结果符合对数正态分布时,基于预置的密度函数计算公式、预置的期望计算公式和预置的方差计算公式分别计算目标数据集对应的密度值、期望值和方差值。
当判别结果符合对数正态分布时,服务器基于预置的密度函数计算公式、预置的期望计算公式和预置的方差计算公式分别计算目标数据集对应的密度值、期望值和方差值。具体的,服务器将目标数据集表示为X,X是取值为正数的连续随机变量,当X服从对数正态分布时,记为InX~N(μ,σ2),其中,μ是随机变量对数的平均值,σ是随机变量对数的标准差;服务器基于预置的密度函数计算公式计算目标数据集对应的密度值,预置的密度函数计算公式为服务器基于预置的期望计算公式计算目标数据集对应的期望值,预置的期望计算公式为服务器基于预置的方差计算公式计算目标数据集对应的方差值,预置的方差计算公式为
206、基于目标数据集对应的密度值、期望值和方差值进行模型拟合,得到对数正态分布模型。
服务器基于目标数据集对应的密度值、期望值和方差值进行模型拟合,得到对数正态分布模型。预置的对数正态预测模型是一种有效可行的揽件量预测模型,但并不能对累积揽件量进行预测,也不能预测累积揽件量随时间的变化,同时,采用线性试差法求解模型参数较为复杂,在对该模型进行细致研究的基础上,本实施例中给出了累积揽件量的预测模型,并对模型进行了必要的简化和修正,具体的,服务器获取快递实际数量,将预测结果和快递实际数量进行对比,生成对比图;服务器根据预置的误差计算公式计算预测结果的误差值,预置的误差计算公式为ε=(A-E)/(E/100),其中ε为得到的预测误差值,A为预测结果,E为快递实际数量,根据预测结果的误差值对对数正态分布模型进行训练和修正,提升了预测的准确度,降低了误差。
207、基于预置的对数正态分布模型和目标数据集进行快递数量的预测并生成预测结果。
服务器基于预置的对数正态分布模型和目标数据集进行快递数量的预测并生成预测结果。具体的,服务器确定目标时间段,目标时间段为快递件量的待遇测时间段;服务器从目标数据集中提取目标历史时间段内的快递件量历史数据,目标历史时间段为进行快递数量预测时依据的历史周期;服务器根据预置的对数正态分布模型和目标历史时间段内的快递件量历史数据进行快递数量的预测,生成预测结果。例如,已知2020年11月的快递件量走势,预测2021年同期快递数量的时候,也假定是这种走势,结合2021年11月之前一个月的数据以及拟合得到的正态分布模型,从而预测2021年11月份每天的快递件量数据。
本发明实施例中,基于对数正态分布函数对快递数量进行预测,提高了预测的准确率,降低了成本,同时有利于资源的合理调度。
上面对本发明实施例中快递数量的预测方法进行了描述,下面对本发明实施例中快递数量的预测装置进行描述,请参阅图3,本发明实施例中快递数量的预测装置的一个实施例包括:
获取模块301,用于获取快递数量历史数据,快递数量历史数据为历史时间段内的快递件量数据,历史时间段为快递数量历史高峰时间段;
预处理模块302,用于对快递数量历史数据进行清洗,去除快递数量历史数据中的冗余数据,替换空数据及异常数据,得到预处理数据;
分析模块303,用于基于预置的数据变化趋势图对预处理数据的变化趋势进行分析,得到变化数据集,并根据变化数据集进行数据的平滑处理,生成目标数据集;
预测模块304,用于基于预置的对数正态分布模型和目标数据集进行快递数量的预测并生成预测结果。
本发明实施例中,基于对数正态分布函数对快递数量进行预测,提高了预测的准确率,降低了成本,同时有利于资源的合理调度。
请参阅图4,本发明实施例中快递数量的预测装置的另一个实施例包括:
获取模块301,用于获取快递数量历史数据,快递数量历史数据为历史时间段内的快递件量数据,历史时间段为快递数量历史高峰时间段;
预处理模块302,用于对快递数量历史数据进行清洗,去除快递数量历史数据中的冗余数据,替换空数据及异常数据,得到预处理数据;
分析模块303,用于基于预置的数据变化趋势图对预处理数据的变化趋势进行分析,得到变化数据集,并根据变化数据集进行数据的平滑处理,生成目标数据集;
预测模块304,用于基于预置的对数正态分布模型和目标数据集进行快递数量的预测并生成预测结果。
可选的,在生成目标数据集之后,生成预测结果之前,快递数量的预测装置还包括:拟合模块305,用于根据目标数据集进行模型拟合,得到对数正态分布模型。
可选的,拟合模块305包括:
判断单元3051,用于判断目标数据集是否符合对数正态分布,得到判别结果;
计算单元3052,用于当判别结果符合对数正态分布时,基于预置的密度函数计算公式、预置的期望计算公式和预置的方差计算公式分别计算目标数据集对应的密度值、期望值和方差值;
生成单元3053,用于基于目标数据集对应的密度值、期望值和方差值进行模型拟合,得到对数正态分布模型。
可选的,计算单元3052还可以具体用于:
将目标数据集表示为X,X是取值为正数的连续随机变量,当X服从对数正态分布时,记为InX~N(μ,σ2),其中,μ是随机变量对数的平均值,σ是随机变量对数的标准差;基于预置的密度函数计算公式计算目标数据集对应的密度值,预置的密度函数计算公式为基于预置的期望计算公式计算目标数据集对应的期望值,预置的期望计算公式为基于预置的方差计算公式计算目标数据集对应的方差值,预置的方差计算公式为
可选的,预处理模块302包括:
分类单元3021,用于对快递数量历史数据进行分类处理,将快递数量历史数据中的单号信息及地址信息筛除,得到基础数据;
删除单元3022,用于将基础数据中的空数据删除,将异常数据转换为缺失数据,并采用预设的插补流程对缺失数据进行补齐处理,得到预处理数据,预置的插补流程包括回归插补和多重插补。
可选的,预测模块304包括:
确定单元3041,用于确定目标时间段,目标时间段为快递件量的待遇测时间段;
提取单元3042,用于从目标数据集中提取目标历史时间段内的快递件量历史数据,目标历史时间段为进行快递数量预测时依据的历史周期;
预测单元3043,用于根据预置的对数正态分布模型和目标历史时间段内的快递件量历史数据进行快递数量的预测,生成预测结果。
可选的,在基于对数正态分布模型预测快递的数量并生成预测结果之后,快递数量的预测装置还包括:
训练模块306,用于获取快递实际数量,根据预置的误差计算公式计算预测结果的误差值,并基于预测结果的误差值对对数正态分布模型进行训练和修正。
本发明实施例中,基于对数正态分布函数对快递数量进行预测,提高了预测的准确率,降低了成本,同时有利于资源的合理调度。
上面图3和图4从模块化功能实体的角度对本发明实施例中的快递数量的预测装置进行详细描述,下面从硬件处理的角度对本发明实施例中快递数量的预测设备进行详细描述。
图5是本发明实施例提供的一种快递数量的预测设备的结构示意图,该快递数量的预测设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对快递数量的预测设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在快递数量的预测设备500上执行存储介质530中的一系列指令操作。
快递数量的预测设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的快递数量的预测设备结构并不构成对快递数量的预测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种快递数量的预测设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述快递数量的预测方法的步骤。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述快递数量的预测方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种快递数量的预测方法,其特征在于,所述快递数量的预测方法包括:
获取快递数量历史数据,所述快递数量历史数据为历史时间段内的快递件量数据,所述历史时间段为快递数量历史高峰时间段;
对所述快递数量历史数据进行清洗,去除所述快递数量历史数据中的冗余数据,替换空数据及异常数据,得到预处理数据;
基于预置的数据变化趋势图对所述预处理数据的变化趋势进行分析,得到变化数据集,并根据所述变化数据集进行数据的平滑处理,生成目标数据集;
基于预置的对数正态分布模型和所述目标数据集进行快递数量的预测并生成预测结果。
2.根据权利要求1所述的快递数量的预测方法,其特征在于,在所述基于预置的数据变化趋势图对所述预处理数据的变化趋势进行分析,得到变化数据集,并根据所述变化数据集进行数据的平滑处理,生成目标数据集之后,所述基于预置的对数正态分布模型和所述目标数据集进行快递数量的预测并生成预测结果之前,所述快递数量的预测方法还包括:
根据所述目标数据集进行模型拟合,得到对数正态分布模型。
3.根据权利要求2所述的快递数量的预测方法,其特征在于,所述根据所述目标数据集进行模型拟合,得到对数正态分布模型包括:
判断所述目标数据集是否符合对数正态分布,得到判别结果;
当所述判别结果符合对数正态分布时,基于预置的密度函数计算公式、预置的期望计算公式和预置的方差计算公式分别计算所述目标数据集对应的密度值、期望值和方差值;
基于所述目标数据集对应的密度值、期望值和方差值进行模型拟合,得到对数正态分布模型。
4.根据权利要求3所述的快递数量的预测方法,其特征在于,所述当所述判别结果符合对数正态分布时,基于预置的密度函数计算公式、预置的期望计算公式和预置的方差计算公式分别计算所述目标数据集对应的密度值、期望值和方差值包括:
将所述目标数据集表示为X,X是取值为正数的连续随机变量,当X服从对数正态分布时,记为InX~N(μ,σ2),其中,μ是所述随机变量对数的平均值,σ是所述随机变量对数的标准差;
5.根据权利要求1所述的快递数量的预测方法,其特征在于,所述对所述快递数量历史数据进行清洗,去除所述快递数量历史数据中的冗余数据,替换空数据及异常数据,得到预处理数据包括:
对所述快递数量历史数据进行分类处理,将所述快递数量历史数据中的单号信息及地址信息筛除,得到基础数据;
将所述基础数据中的空数据删除,将异常数据转换为缺失数据,并采用预设的插补流程对所述缺失数据进行补齐处理,得到预处理数据,所述预置的插补流程包括回归插补和多重插补。
6.根据权利要求1所述的快递数量的预测方法,其特征在于,所述基于预置的对数正态分布模型和所述目标数据集进行快递数量的预测并生成预测结果包括:
确定目标时间段,所述目标时间段为快递件量的待遇测时间段;
从所述目标数据集中提取目标历史时间段内的快递件量历史数据,所述目标历史时间段为进行快递数量预测时依据的历史周期;
根据所述预置的对数正态分布模型和所述目标历史时间段内的快递件量历史数据进行快递数量的预测,生成预测结果。
7.根据权利要求1-6中任一项所述的快递数量的预测方法,其特征在于,在所述基于所述对数正态分布模型预测快递的数量并生成预测结果之后,所述方法还包括:
获取快递实际数量,根据预置的误差计算公式计算所述预测结果的误差值,并基于所述预测结果的误差值对所述对数正态分布模型进行训练和修正。
8.一种快递数量的预测装置,其特征在于,所述快递数量的预测装置包括:
获取模块,用于获取快递数量历史数据,所述快递数量历史数据为历史时间段内的快递件量数据,所述历史时间段为快递数量历史高峰时间段;
预处理模块,用于对所述快递数量历史数据进行清洗,去除所述快递数量历史数据中的冗余数据,替换空数据及异常数据,得到预处理数据;
分析模块,用于基于预置的数据变化趋势图对所述预处理数据的变化趋势进行分析,得到变化数据集,并根据所述变化数据集进行数据的平滑处理,生成目标数据集;
预测模块,用于基于预置的对数正态分布模型和所述目标数据集进行快递数量的预测并生成预测结果。
9.一种快递数量的预测设备,其特征在于,所述快递数量的预测设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述快递数量的预测设备执行如权利要求1-7中任意一项所述的快递数量的预测方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-7中任一项所述快递数量的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011519275.8A CN112686433B (zh) | 2020-12-21 | 2020-12-21 | 快递数量的预测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011519275.8A CN112686433B (zh) | 2020-12-21 | 2020-12-21 | 快递数量的预测方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112686433A true CN112686433A (zh) | 2021-04-20 |
CN112686433B CN112686433B (zh) | 2023-07-28 |
Family
ID=75449823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011519275.8A Active CN112686433B (zh) | 2020-12-21 | 2020-12-21 | 快递数量的预测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112686433B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114579643A (zh) * | 2022-05-05 | 2022-06-03 | 国家邮政局邮政业安全中心 | 快递业务量预测方法、装置及电子设备 |
CN116228075A (zh) * | 2023-04-28 | 2023-06-06 | 深圳市宏大供应链服务有限公司 | 一种基于人工智能的数据分析方法、系统及介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6611726B1 (en) * | 1999-09-17 | 2003-08-26 | Carl E. Crosswhite | Method for determining optimal time series forecasting parameters |
CN105550772A (zh) * | 2015-12-09 | 2016-05-04 | 中国电力科学研究院 | 一种在线历史数据潮流趋势分析方法 |
JP2017045120A (ja) * | 2015-08-24 | 2017-03-02 | 日本電信電話株式会社 | 需要分布再現装置及び需要分布再現方法 |
US20170140278A1 (en) * | 2015-11-18 | 2017-05-18 | Ca, Inc. | Using machine learning to predict big data environment performance |
CN108549957A (zh) * | 2018-04-11 | 2018-09-18 | 中译语通科技股份有限公司 | 互联网话题趋势辅助预测方法及系统、信息数据处理终端 |
CN109272156A (zh) * | 2018-09-12 | 2019-01-25 | 河海大学 | 一种超短期风电功率概率预测方法 |
CN109558975A (zh) * | 2018-11-21 | 2019-04-02 | 清华大学 | 一种电力负荷概率密度多种预测结果的集成方法 |
CN110222905A (zh) * | 2019-06-14 | 2019-09-10 | 智慧足迹数据科技有限公司 | 一种预测人流量的方法及装置 |
US20200097813A1 (en) * | 2018-09-26 | 2020-03-26 | International Business Machines Corporation | Deep learning model for probabilistic forecast of continuous manufacturing process |
CN112070292A (zh) * | 2020-08-28 | 2020-12-11 | 上海东普信息科技有限公司 | 件量预测方法、装置、设备和存储介质 |
-
2020
- 2020-12-21 CN CN202011519275.8A patent/CN112686433B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6611726B1 (en) * | 1999-09-17 | 2003-08-26 | Carl E. Crosswhite | Method for determining optimal time series forecasting parameters |
JP2017045120A (ja) * | 2015-08-24 | 2017-03-02 | 日本電信電話株式会社 | 需要分布再現装置及び需要分布再現方法 |
US20170140278A1 (en) * | 2015-11-18 | 2017-05-18 | Ca, Inc. | Using machine learning to predict big data environment performance |
CN105550772A (zh) * | 2015-12-09 | 2016-05-04 | 中国电力科学研究院 | 一种在线历史数据潮流趋势分析方法 |
CN108549957A (zh) * | 2018-04-11 | 2018-09-18 | 中译语通科技股份有限公司 | 互联网话题趋势辅助预测方法及系统、信息数据处理终端 |
CN109272156A (zh) * | 2018-09-12 | 2019-01-25 | 河海大学 | 一种超短期风电功率概率预测方法 |
US20200097813A1 (en) * | 2018-09-26 | 2020-03-26 | International Business Machines Corporation | Deep learning model for probabilistic forecast of continuous manufacturing process |
CN109558975A (zh) * | 2018-11-21 | 2019-04-02 | 清华大学 | 一种电力负荷概率密度多种预测结果的集成方法 |
CN110222905A (zh) * | 2019-06-14 | 2019-09-10 | 智慧足迹数据科技有限公司 | 一种预测人流量的方法及装置 |
CN112070292A (zh) * | 2020-08-28 | 2020-12-11 | 上海东普信息科技有限公司 | 件量预测方法、装置、设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
胡建国, 潘增耀: "对数正态预测模型的完善与简化", 新疆石油地质, vol. 21, no. 5, pages 412 - 414 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114579643A (zh) * | 2022-05-05 | 2022-06-03 | 国家邮政局邮政业安全中心 | 快递业务量预测方法、装置及电子设备 |
CN116228075A (zh) * | 2023-04-28 | 2023-06-06 | 深圳市宏大供应链服务有限公司 | 一种基于人工智能的数据分析方法、系统及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112686433B (zh) | 2023-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112686433A (zh) | 快递数量的预测方法、装置、设备及存储介质 | |
CN112365070B (zh) | 一种电力负荷预测方法、装置、设备及可读存储介质 | |
CN107918579A (zh) | 一种批量生成基线数据的方法和装置 | |
CN111786385A (zh) | 一种电网运维方案规划方法、系统及设备 | |
CN111833594A (zh) | 车流量预测方法、装置、电子设备及存储介质 | |
CN114328095A (zh) | 一种任务异常告警方法及装置 | |
CN116882804A (zh) | 一种智能电力监控方法及系统 | |
CN112256686A (zh) | 一种基于mes的故障数据压缩与预测方法及系统 | |
CN102622367B (zh) | 流程数据的过滤和压缩方法 | |
CN113469612A (zh) | 物流时效提示方法、装置、设备及存储介质 | |
CN117235062A (zh) | 基于数据中台的业务系统数据建模方法 | |
CN112183827A (zh) | 快递月揽件量的预测方法、装置、设备和存储介质 | |
CN115114124A (zh) | 主机风险的评估方法及评估装置 | |
CN117010549A (zh) | 基于大数据管理体系的信息溯源方法及终端 | |
US20060100844A1 (en) | Test time forecast system and method thereof | |
CN111311318A (zh) | 用户流失预警的方法、装置、设备及存储介质 | |
CN113298291A (zh) | 快递件量预测方法、装置、设备及存储介质 | |
CN112347069B (zh) | 一种基于制造大数据的制造企业预测型维修服务方法 | |
CN107121616B (zh) | 一种用于对智能仪表进行故障定位的方法和装置 | |
CN114252794A (zh) | 一种拆回智能电能表剩余寿命预测方法及装置 | |
CN112445632A (zh) | 基于故障数据建模的hpc可靠性评估方法 | |
CN114245895A (zh) | 为至少两个日志文件生成一致表示的方法 | |
CN110727910A (zh) | 一种抄核收风险预测及业务联动的实现方法和系统 | |
Sembiring et al. | Quality control of cutter case at PT. X with six sigma approach | |
CN111047438A (zh) | 数据处理方法、装置和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |