CN110097211B - 基于蒙特卡洛组合的物流业务预测方法及系统 - Google Patents

基于蒙特卡洛组合的物流业务预测方法及系统 Download PDF

Info

Publication number
CN110097211B
CN110097211B CN201910240346.1A CN201910240346A CN110097211B CN 110097211 B CN110097211 B CN 110097211B CN 201910240346 A CN201910240346 A CN 201910240346A CN 110097211 B CN110097211 B CN 110097211B
Authority
CN
China
Prior art keywords
prediction
model
features
entering
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910240346.1A
Other languages
English (en)
Other versions
CN110097211A (zh
Inventor
赵兴
林灿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kuayue Express Group Co ltd
Original Assignee
Kuayue Express Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kuayue Express Group Co ltd filed Critical Kuayue Express Group Co ltd
Priority to CN201910240346.1A priority Critical patent/CN110097211B/zh
Publication of CN110097211A publication Critical patent/CN110097211A/zh
Application granted granted Critical
Publication of CN110097211B publication Critical patent/CN110097211B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于蒙特卡洛组合的物流业务预测方法及系统,其中,该方法包括:S1,获取客户历史下单信息;S2,对客户历史下单信息进行特征工程,根据预测类型,构建预测模型所需要的特征;特征包括确定特征和随机特征;S3,对特征进行蒙特卡洛筛选,随机组合出一组进入预测模型的入模特征,入模特征包括所有确定特征和至少一个随机特征;S4,预设的多个预测模型分别根据入模特征进行独立训练;S5,对完成训练后的每个预测模型的预测结果进行评估,确定预测结果准确率最高的预测模型为最佳预测模型,并保留相应的入模特征。本发明有效将物流业务经验和预测模型随机结合,避免了两者盲目结合,从而提升了模型预测准确度。

Description

基于蒙特卡洛组合的物流业务预测方法及系统
技术领域
本发明涉及物流业务预测技术领域,尤其涉及一种基于蒙特卡洛组合的物流业务预测方法及系统。
背景技术
物流行业发展迅猛,物流货量逐年增加。传统物流公司依靠具有行业经验的管理人才来提升管理效率。但是随着行业的快速发展与企业的快速扩张,管理人员的对业务的把控显得不足,主要表现在货量的增加伴随着物流公对业务增长的预期与招聘人员的乏力。为了让传统人力密集型的企业从“粗放”向“集约”转变,智能化系统在物流行业扮演着越加重要的角色。作为精细化运营的一部分,深入的了解客户,精准地把握客户需求与意图对物流公司的发展至关重要。以物流业务中的下单场景为例,客户根据自己货物的所需要的时效类型和重要程度,往往会带有倾向性地选择不同的服务方式。比如,一个手机电商往往倾向选择较快的服务方式发货,因为客户往往在下单后对到货时间有着比较强烈的需求;而一个做家具的厂商往往选择慢而便宜的服务方式,因为货物本身的重量大,一味地要求时效会造成产品成本的增高。因此,对于物流公司而言,不少物流公司的大客户具有一定的下单规律,如果能深入地了解了这些规律就可以更好地准备人、车并协调货物间的关系,更加精准而快速地准备资源,满足地区客户的需求,提升客户感知与时效。
而现有的物流业务预测方法,一般都是基于历史物流业务数据的所有特征且采用同一种预测模型对不同类型的物流业务进行预测。但是,在预测过程中,过多的特征会导致预测模型的精度下降,与此同时,多种类型的物流物业采用同一种预测模型进行预测时,其中某些类型的物流业务的预测精准度会比较低。
因此,寻求一种适用于所有物流业务,且能保证每一个物流业务的预测精准度的预测方法,是当前亟待解决的技术问题。
发明内容
本发明的目的在于提供一种基于蒙特卡洛组合的物流业务预测方法及系统,以解决现有的物流业务预测方法,适用的物流业务对象单一且预测精准度低的技术问题。
为了解决上述问题,本发明提供了一种基于蒙特卡洛组合的物流业务预测方法,其包括:
S1,获取客户历史下单信息;
S2,对客户历史下单信息进行特征工程,根据预测类型,构建预测模型所需要的特征;特征包括确定特征和随机特征;
S3,对特征进行蒙特卡洛筛选,随机组合出一组进入预测模型的入模特征,入模特征包括所有确定特征和至少一个随机特征;
S4,预设的多个预测模型分别根据入模特征进行独立训练;
S5,对完成训练后的每个预测模型的预测结果进行评估,确定预测结果准确率最高的预测模型为最佳预测模型,并保留相应的入模特征。
作为本发明的进一步改进,步骤S2中的预测类型为是否下单预测;确定特征包括服务类型和货量,随机特征包括下单年份、下单月份、下单日期、目的地城市区号、托寄物类型、年内第几周、上旬、中旬、下旬、以及客户下单时间。
作为本发明的进一步改进,步骤S5之后,还包括:
S61,设置当前迭代次数加1,迭代次数初始值为0;
S62,判断当前迭代次数是否等于预设迭代阈值,若否,继续执行步骤S3;若是,则执行步骤S63。
S63,在每次步骤S5中确定的最佳预测模型中,确定预测结果准确率最高的为最终最佳预测模型,并保留相应的入模特征,结束执行。
作为本发明的进一步改进,步骤S4中的预测模型包括GBDT模型、XGboost模型和LR模型。
作为本发明的进一步改进,步骤S1之后还包括
S11,对客户历史下单信息中的异常数据进行删除或者估值补全。
为了解决上述问题,本发明还提供了一种基于蒙特卡洛组合的客户下单预测系统,其包括:
数据库模块,用于存储客户历史下单信息;
数据获取模块,用于从数据库模块中获取客户历史下单信息;
特征工程模块,用于对客户历史下单信息进行特征工程,根据预测类型,构建预测模型所需要的特征;特征包括确定特征和随机特征;
特征筛选模块,用于对特征进行蒙特卡洛筛选,随机组合出一组进入预测模型的入模特征,入模特征包括所有确定特征和至少一个随机特征;
智能预测模块,包括多个预测模型,用于每一个预测模型根据入模特征进行独立训练;
模型筛选模块,用于对完成训练后的每个预测模型的预测结果进行评估,确定预测结果准确率最高的预测模型为最佳预测模型,并保留相应的入模特征。
作为本发明的进一步改进,其还包括:预测类型为是否下单预测;确定特征包括服务类型和货量,随机特征包括下单年份、下单月份、下单日期、目的地城市区号、托寄物类型、年内第几周、上旬、中旬、下旬、以及客户下单时间。
作为本发明的进一步改进,其还包括:
迭代次数累计模块,用于在模型筛选模块完成一次评估后,设置当前迭代次数加1,迭代次数初始值为0;
迭代处理模块,用于判断当前迭代次数是否等于预设迭代阈值,若否,反馈特征筛选模块,继续筛选入模特征进入智能预测模块;若是,则反馈并执行最终评估模块;
最终评估模块,在每次模型筛选模块确定的最佳预测模型中,确定预测结果准确率最高的为最终最佳预测模型,并保留相应的入模特征。
作为本发明的进一步改进,预测模型包括GBDT模型、XGboost模型和LR模型。
作为本发明的进一步改进,其还包括:
异常数据处理模块,对客户历史下单信息中的异常数据进行删除或者估值补全。
与现有技术相比,一方面,本发明根据预测类型,构建预测模型所需的特征,以基于蒙特卡洛筛选出包括所有确定特征和至少一个随机特征的一组入模特征,有效将物流业务经验和预测模型随机结合,避免了两者盲目结合,提升了模型预测准确度;另一方面,本发明集成了多个预测模型,可以根据不同客户数据特征智能选择最佳模型进行匹配,进一步有效提升了预测准确度。
附图说明
图1为本发明基于蒙特卡洛组合的物流业务预测方法第一个实施例的流程示意图;
图2为蒙特卡洛筛选过程一个实施例的筛选示意图;
图3为本发明基于蒙特卡洛组合的物流业务预测方法第二个实施例的流程示意图;
图4为本发明基于蒙特卡洛组合的客户下单预测系统第一个实施例的功能模块示意图;
图5为本发明基于蒙特卡洛组合的客户下单预测系统第二个实施例的功能模块示意图。
具体实施方式
下面将结合本发明实施例中的附图,对实施例中的技术方案进行清楚、完整地描述,附图中类似的组件标号代表类似的组件。显然,以下将描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1-图2展示了本发明基于蒙特卡洛组合的物流业务预测方法的一个实施例。在本实施例中,如图1所示,该基于蒙特卡洛组合的物流业务预测方法包括如下步骤:
S1,获取客户历史下单信息。
在本实施例中,本发明设置了一个数据库模块,该数据库模块为系统的数据库,为整个系统输入数据提供接口。通过该接口,数据获取模块可以访问历史的客户的下单信息,包括下单的服务类型、下单时间、货物重量、货物货好时间、客户公司、联系方式等等。
在本实施例中,步骤S1由本发明的数据获取模块执行,该数据获取模块访问数据库模块。具体的,数据获取模块获取的内容如下表示例所示,其中,客户名称通过“客户代码”来代替。
字段名称 示例
客户代码 755934XXX
服务类型 次日达
客户下单时间 XX年XX月XX日
下单重量 Xkg
托寄物类型 XX产品
归属点部 福永XX点部
寄件城市 深圳市
收件城市 北京市
S2,对客户历史下单信息进行特征工程,根据预测类型,构建预测模型所需要的特征;特征包括确定特征和随机特征。
该预测类包括是否下单预测、货量预测以及其他物流业务相关的预测。本实施例中,预测类型为是否下单预测。
进一步地,本发明的步骤S2由特征工程模块执行,该特征工程模块根据预测类型,构建预测模型所需要的特征。根据预测类型的不同,构建的预测模型所需要的特征相应的会有不同。
特征包括直接获得的基础特征数据以及衍生特征数据。所谓衍生特征数据,是根据基础特征数据,通过数学变换处理,得到的新的特征,从而提高了预测模型对数据结构的感知。本示例中,在基础特征数据和衍生特征数据的基础上,将构建出的预测模型特征进一步区分为确定特征和随机特征。
在本实施例中,根据预测类型为是否下单预测,构建出的预测模型所需要的特征中,确定特征包括服务类型和货量,随机特征包括下单年份、下单月份、下单日期、目的地城市区号、托寄物类型、年内第几周、上旬、中旬、下旬、以及客户下单时间。
具体地,常见的随机特征为时间特征,进一步地,根据客户下单时间,从而衍生出下单年份、下单月份、下单日期、下单中上下旬等特征,具体参见下表:
Figure GDA0003582505920000071
S3,对特征进行蒙特卡洛筛选,随机组合出一组进入预测模型的入模特征,入模特征包括所有确定特征和至少一个随机特征。
在本实施例中,该步骤S3由特征筛选模块执行,该特征筛选模块对特征进行蒙特卡洛筛选,保证每次会自动产生一组随机入模特征,作为预测模型的入模特征,入模特征包括所有确定特征和至少一个随机特征。该蒙特卡洛筛选示意请参见图2,产生的入模特征组中,入模特征组1中随机特征为1个,入模特征组2中随机特征为2个,随机特征的数量随机产生,但至少一个。
S4,预设的多个预测模型分别根据入模特征进行独立训练。
在本实施例中,本发明的步骤S4由智能预测模块执行。具体地,经步骤S3筛选出一组入模特征后,预设的多个预测模型分别根据入模特征进行独立训练。模型训练采用的训练集数据为从客户历史下单信息中截取的一段期限的数据。譬如:截取客户历史下单信息中某一段连续100天的数据,则将前90天的数据用于模型训练。每一个预测模型根据输入的入模特征调整自身的各项权重参数,以提升预测模型的精度,最终完成模型的训练,从而将确定好的预测模型数据输出至模型筛选模块中。
根据预测类型的不同,相应选择业界通用的预测模型。在本实施例中,预测类型为是否下单预测,因此预测模型包括GBDT模型、XGboost模型和LR模型。
S5,对完成训练后的每个预测模型的预测结果进行评估,确定预测结果准确率最高的预测模型为最佳预测模型,并保留相应的入模特征。
在本实施例中,该步骤S5由模型筛选模块执行,该模型筛选模块完成了对模型预测结果准确率的评估,评估的方法是根据模型在验证集上的表现确定的。所谓验证集是在历史数据中截取一段数据,专门用于验证预测模型的预测效果。以步骤S4中,截取客户历史下单信息中某一段连续100天的数据,将前90天的数据用于模型训练为例,继续的,将该段数据中后10天的数据作为验证集,用于评价模型预测结果的准确性。根据预测模型在验证集上的表现,我们用准确率(Accuracy)评价智能预测模块中的预测模型。
具体地,最佳预测模型确认流程如下:
结合验证集数据,采用如下公式对预测模型预测结果的准确率进行评价:
Figure GDA0003582505920000091
其中,TP表示,真实为客户下单,预测也为客户下单的数目;FN表示,真实为客户下单,预测为客户不下单的数目;FP表示,真实为客户不下单,预测为客户下单的数目;TN表示,真实为客户不下单,预测也为客户不下单的数目。
经过计算,确定预测结果准确率AC最高的预测模型为最佳预测模型,并保留相应的入模特征。
本实施例一方面,本发明根据预测类型,构建预测模型所需的特征,以基于蒙特卡洛筛选出包括所有确定特征和至少一个随机特征的一组入模特征,有效将物流业务经验和预测模型随机结合,避免了两者盲目结合,提升了模型预测准确度;另一方面,本发明集成了多个预测模型,可以根据不同客户数据特征智能选择最佳模型进行匹配,进一步有效提升了预测准确度。
进一步地,根据预测类型为是否下单预测的需要,结合业务经验和模拟训练结果,所构建的入模特征,尤其是随机特征的构建,提高了对客户下单预测结果的准确率。
图3展示了本发明基于蒙特卡洛组合的物流业务预测方法的另一个实施例。在本实施例中,如图3所示,该基于蒙特卡洛组合的物流业务预测方法包括如下步骤:
S1,获取客户历史下单信息。
S11,对客户历史下单信息中的异常数据进行删除或者估值补全。
在本实施例中,存储至数据库模块的客户历史下单信息,由于种种不确定因素,往往造成了数据异常,该异常包括数据缺失或数据不完整。具体地,数据库的数据通常通过巴枪(快递员扫码终端)或者人为输入产生,导致导入至数据库的数据有时并不完整。譬如:巴枪访问流量过大造成服务器堵塞,或者断网都会造成数据库数据缺失。
进一步地,该步骤S11由异常数据处理模块执行,该异常数据处理模块用于对客户历史下单信息中的异常数据进行删除或者估值补全。
具体地,以进行是否下单预时,获取的客户历史下单信息为例,对于一些关键性,且无法通过参考历史数据能进行补全的数据,如“客户代码”存在缺失时,则直接对该条数据进行删除;对于一些同样关键,但可以通过参考历史数据进行补全的数据,如当“客户下单时间”、“托寄物类型”、“下单重量”存在缺失或不完整的数据,则可以采用最近七个众数进行估值补全,或者采用最近七个正常值的平均值进行估值补全。
在本实施例的基础上,其他实施例中,参见图3,步骤S11执行完成后,在执行步骤S2的同时,执行步骤S12。
S12,获取客户代码相同的所有客户历史下单信息,并按照预设属性对所有客户历史下单信息进行归类处理,以生成聚类分析报表并进行输出显示。
在本实施例中,该步骤由数据展示模块执行,该数据展示模块可以对异常数据处理模块处理后的数据进行输出显示。具体地,该数据展示模块可以根据客户代码追踪该公司历史是否下单和下单服务类型的规律;即根据公司名称或者公司代码对服务类型和下单时间进行归类,通过输出显示聚类分析报表,以便公司现场操作点部的人员分析客户下单规律,管理调度员工,进行资源的合理优化。
S2,对客户历史下单信息进行特征工程,根据预测类型,构建预测模型所需要的特征;特征包括确定特征和随机特征。
S3,对特征进行蒙特卡洛筛选,随机组合出一组进入预测模型的入模特征,入模特征包括所有确定特征和至少一个随机特征。
S4,预设的多个预测模型分别根据入模特征进行独立训练。
S5,对完成训练后的每个预测模型的预测结果进行评估,确定预测结果准确率最高的预测模型为最佳预测模型,并保留相应的入模特征。
本实施例对客户历史下单信息中的异常数据进行删除或者估值补全,因此,依据处理后的数据进行训练和预测,降低了异常数据对预测结果的影响度,从而进一步提升了预测准确度。
进一步地,在上述实施例的基础上,其他实施例中,参见图3,该步骤S5之后,还包括:
S61,设置当前迭代次数加1,迭代次数初始值为0。
S62,判断当前迭代次数是否等于预设迭代阈值,若否,继续执行步骤S3;若是,则执行步骤S63。
S63,在每次步骤S5中确定的最佳预测模型中,确定预测结果准确率最高的为最终最佳预测模型,并保留相应的入模特征,结束执行。
本实施例中,每执行步骤S3-S5一次,定义为经过1次迭代;以进行下单预测为例,通过选取客户历史下单信息中579家活跃客户最近一年的历史数据进行训练和验证,当进行首次迭代,确定出来的最佳预测模型,其预测结果统计如下表所示:
Figure GDA0003582505920000111
首次迭代后确定出来的最佳预测模型预测结果统计为:下单客户有411个实际下单客户,其中模型预测正确的有293个,占比71.3%;未下单客户有168个客户中,预测正确的只有78个,占比46.4%。
经过测试,在步骤S5之后继续执行步骤S61、S62和S63,通过增加迭代次数,可以有效提高预测的准确率。预设迭代阈值根据兼顾计算性能和计算时长进行选定。本实施例中,预设迭代阈值设置为20次。当进行20次迭代,确定出来的最终最佳预测模型,其预测结果统计如下表所示:
Figure GDA0003582505920000121
20次迭代后确定出来的最终最佳预测模型预测结果统计为:预测下单正确的客户数量为316个,占比增加到76.9%;预测未下单正确的客户数量为113个,占比为67.3%。
20次迭代与首次迭代进行对比,下单召回率从71.3%增长到76.9%,未下单召回率由46.4%增长到67.3%。同时,我们计算一下整体准确率,首次迭代准确率(293+78)/579=64.1%,20次迭代后准确率为(316+113)/579=74.1%;因此,通过20次迭代,准确率总体提升约10%。
进一步地,在上述实施例的基础上,其他实施例中,参见图3,在步骤S63之后,还包括步骤S70。
S70,上传最终最佳预测模型和相应的入模特征至数据库,且规整最终最佳预测模型和相应的入模特征为预设格式,以生成预测报告并进行输出。
在本实施例中,该步骤由报告生成模块执行,该报告生成模块会将产生的结果数据按照业务需要进行格式处理;同时该模块也负责预测数据的上传并更新数据库。
本实施例特征工程对预测模型的结果至关重要,过多的特征会导致预测模型的精度下降,而过少或者不恰当地删除特征会让预测模型结果失真,因此,本实施例通过多次迭代,最终最佳预测模型对应的预测结果准确率最高,且相应的入模特征的特征数量和特征对象最为适宜,从而有效提升了系统整体的预测准确度。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
图4展示了本发明基于蒙特卡洛组合的客户下单预测系统的一个实施例。在本实施例中,如图4所示,该基于蒙特卡洛组合的客户下单预测系统包括数据库模块10、数据获取模块11、特征工程模块12、特征筛选模块13、智能预测模块14和模型筛选模块15。
其中,数据库模块10,用于存储客户历史下单信息;数据获取模块11,用于从数据库模块10中获取客户历史下单信息;特征工程模块12,用于对客户历史下单信息进行特征工程,根据预测类型,构建预测模型所需要的特征;特征包括确定特征和随机特征;特征筛选模块13,用于对特征进行蒙特卡洛筛选,随机组合出一组进入预测模型的入模特征,入模特征包括所有确定特征和至少一个随机特征;智能预测模块14,包括多个预测模型,用于每一个预测模型根据入模特征进行独立训练;模型筛选模块15,用于对完成训练后的每个预测模型的预测结果进行评估,确定预测结果准确率最高的预测模型为最佳预测模型,并保留相应的入模特征。
在本实施例的基础上,其他实施例中,预测类型为是否下单预测;确定特征包括服务类型和货量,随机特征包括下单年份、下单月份、下单日期、目的地城市区号、托寄物类型、年内第几周、上旬、中旬、下旬、以及客户下单时间。
作为本发明的进一步改进,参见图5,该基于蒙特卡洛组合的客户下单预测系统还包括迭代次数累计模块20、迭代处理模块21和最终评估模块22。
其中,迭代次数累计模块20,用于在模型筛选模块15完成一次评估后,设置当前迭代次数加1,迭代次数初始值为0;迭代处理模块21,用于判断当前迭代次数是否等于预设迭代阈值,若否,反馈特征筛选模块13,继续筛选入模特征进入智能预测模块14;若是,则反馈并执行最终评估模块22。最终评估模块22,用于在每次模型筛选模块15确定的最佳预测模型中,确定预测结果准确率最高的为最终最佳预测模型,并保留相应的入模特征。
进一步地,参见图5,该基于蒙特卡洛组合的客户下单预测系统还包括异常数据处理模块30。其中,异常数据处理模块30,用于对客户历史下单信息中的异常数据进行删除或者估值补全。
进一步地,参见图5,该基于蒙特卡洛组合的客户下单预测系统还包括报告生成模块40。其中,该报告生成模块40,用于上传最终最佳预测模型和相应的入模特征至数据库,且规整最终最佳预测模型和相应的入模特征为预设格式,以生成预测报告并进行输出。
进一步地,参见图5,该基于蒙特卡洛组合的客户下单预测系统还包括数据展示模块50。其中,该数据展示模块50,用于获取客户代码相同的所有客户历史下单信息,并按照预设属性对所有客户历史下单信息进行归类处理,以生成聚类分析报表并进行输出显示。
在本实施例的基础上,其他实施例中,预测模型包括GBDT模型、XGboost模型和LR模型。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将基于蒙特卡洛组合的客户下单预测系统的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上对发明的具体实施方式进行了详细说明,但其只作为范例,本发明并不限制与以上描述的具体实施方式。对于本领域的技术人员而言,任何对该发明进行的等同修改或替代也都在本发明的范畴之中,因此,在不脱离本发明的精神和原则范围下所作的均等变换和修改、改进等,都应涵盖在本发明的范围内。

Claims (8)

1.一种基于蒙特卡洛组合的物流业务预测方法,其特征在于,其包括:
S1,获取客户历史下单信息;
S2,对客户历史下单信息进行特征工程,根据预测类型,构建预测模型所需要的特征;所述特征包括确定特征和随机特征;
预测类型为是否下单预测;所述确定特征包括服务类型、和货量,所述随机特征包括下单年份、下单月份、下单日期、目的地城市区号、托寄物类型、年内第几周、上旬、中旬、下旬、以及客户下单时间;
S3,对特征进行蒙特卡洛筛选,随机组合出一组进入预测模型的入模特征,所述入模特征包括所有确定特征和至少一个随机特征;
S4,预设的多个预测模型分别根据所述入模特征进行独立训练;
S5,对完成训练后的每个预测模型的预测结果进行评估,确定预测结果准确率最高的预测模型为最佳预测模型,并保留相应的入模特征。
2.根据权利要求1所述的基于蒙特卡洛组合的物流业务预测方法,其特征在于,步骤S5之后,还包括:
S61,设置当前迭代次数加1,所述迭代次数初始值为0;
S62,判断当前迭代次数是否等于预设迭代阈值,若否,继续执行步骤S3;若是,则执行步骤S63;
S63,在每次步骤S5中确定的最佳预测模型中,确定预测结果准确率最高的为最终最佳预测模型,并保留相应的入模特征,结束执行。
3.根据权利要求1所述的基于蒙特卡洛组合的物流业务预测方法,其特征在于,所述步骤S4中的预测模型包括GBDT模型、XGboost模型和LR模型。
4.根据权利要求2所述的基于蒙特卡洛组合的物流业务预测方法,其特征在于,所述步骤S1之后还包括
S11,对客户历史下单信息中的异常数据进行删除或者估值补全。
5.一种基于蒙特卡洛组合的客户下单预测系统,其特征在于,其包括:
数据库模块,用于存储客户历史下单信息;
数据获取模块,用于从所述数据库模块中获取所述客户历史下单信息;
特征工程模块,用于对客户历史下单信息进行特征工程,根据预测类型,构建预测模型所需要的特征;所述特征包括确定特征和随机特征;
所述预测类型为是否下单预测;所述确定特征包括服务类型和货量,所述随机特征包括下单年份、下单月份、下单日期、目的地城市区号、托寄物类型、年内第几周、上旬、中旬、下旬、以及客户下单时间;
特征筛选模块,用于对特征进行蒙特卡洛筛选,随机组合出一组进入预测模型的入模特征,所述入模特征包括所有确定特征和至少一个随机特征;
智能预测模块,包括多个预测模型,用于每一个预测模型根据所述入模特征进行独立训练;
模型筛选模块,用于对完成训练后的每个预测模型的预测结果进行评估,确定预测结果准确率最高的预测模型为最佳预测模型,并保留相应的入模特征。
6.根据权利要求5所述的基于蒙特卡洛组合的客户下单预测系统,其特征在于,其还包括:
迭代次数累计模块,用于在模型筛选模块完成一次评估后,设置当前迭代次数加1,所述迭代次数初始值为0;
迭代处理模块,用于判断当前迭代次数是否等于预设迭代阈值,若否,反馈所述特征筛选模块,继续筛选入模特征进入智能预测模块;若是,则反馈并执行最终评估模块;
最终评估模块,在每次所述模型筛选模块确定的最佳预测模型中,确定预测结果准确率最高的为最终最佳预测模型,并保留相应的入模特征。
7.根据权利要求5所述的基于蒙特卡洛组合的客户下单预测系统,其特征在于,所述预测模型包括GBDT模型、XGboost模型和LR模型。
8.根据权利要求6所述的基于蒙特卡洛组合的客户下单预测系统,其特征在于,其还包括:
异常数据处理模块,对客户历史下单信息中的异常数据进行删除或者估值补全。
CN201910240346.1A 2019-03-27 2019-03-27 基于蒙特卡洛组合的物流业务预测方法及系统 Active CN110097211B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910240346.1A CN110097211B (zh) 2019-03-27 2019-03-27 基于蒙特卡洛组合的物流业务预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910240346.1A CN110097211B (zh) 2019-03-27 2019-03-27 基于蒙特卡洛组合的物流业务预测方法及系统

Publications (2)

Publication Number Publication Date
CN110097211A CN110097211A (zh) 2019-08-06
CN110097211B true CN110097211B (zh) 2022-06-17

Family

ID=67443968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910240346.1A Active CN110097211B (zh) 2019-03-27 2019-03-27 基于蒙特卡洛组合的物流业务预测方法及系统

Country Status (1)

Country Link
CN (1) CN110097211B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111861704A (zh) * 2020-07-10 2020-10-30 深圳无域科技技术有限公司 风控特征生成方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8655799B1 (en) * 2011-03-31 2014-02-18 The United States Of America As Represented By The Secretary Of The Navy Anticipatory logistics through sensor fusion and evolutionary minimization of response time in automated vehicles
CN105760970A (zh) * 2016-03-21 2016-07-13 重庆灵狐科技股份有限公司 空气质量指数的预测方法
CN102968670B (zh) * 2012-10-23 2016-08-17 北京京东世纪贸易有限公司 预测数据的方法和装置
CN109214559A (zh) * 2018-08-17 2019-01-15 安吉汽车物流股份有限公司 物流业务的预测方法及装置、可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160092969A1 (en) * 2014-09-30 2016-03-31 Wal-Mart Stores, Inc. Methods and systems for in-store fulfillment prioritization based on customer location

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8655799B1 (en) * 2011-03-31 2014-02-18 The United States Of America As Represented By The Secretary Of The Navy Anticipatory logistics through sensor fusion and evolutionary minimization of response time in automated vehicles
CN102968670B (zh) * 2012-10-23 2016-08-17 北京京东世纪贸易有限公司 预测数据的方法和装置
CN105760970A (zh) * 2016-03-21 2016-07-13 重庆灵狐科技股份有限公司 空气质量指数的预测方法
CN109214559A (zh) * 2018-08-17 2019-01-15 安吉汽车物流股份有限公司 物流业务的预测方法及装置、可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"蒙特卡洛特征样本采样方法研究";刘雪晨 等;《统计与信息论坛》;20190131;第34卷(第1期);3-12页 *

Also Published As

Publication number Publication date
CN110097211A (zh) 2019-08-06

Similar Documents

Publication Publication Date Title
US8838469B2 (en) System and method for optimizing display space allocation of merchandising using regression analysis to generate space elasticity curves
US7213007B2 (en) Method for forecasting using a genetic algorithm
WO2019144516A1 (zh) 坐席分配方法、电子装置及计算机可读存储介质
US20150154619A1 (en) Systems and Methods for Forecasting
JP4678879B2 (ja) 販売予測システム、方法及びコンピュータプログラム
US20150371243A1 (en) Systems and methods for parts forecasting
CN112825161A (zh) 产品良率预测方法、装置、计算机装置及存储介质
CN112860769A (zh) 一种能源规划数据管理系统
US20210286780A1 (en) Auto reinforced anomaly detection
Ng et al. Robust demand service achievement for the co-production newsvendor
Jemelka et al. ABC analyses with recursive method for warehouse
CN112036631A (zh) 采购量确定方法、装置、设备及存储介质
CN112418758A (zh) 一种为货主智能推荐承运商的方法及系统
Li et al. Production systems engineering: main results and recommendations for management
CN110097211B (zh) 基于蒙特卡洛组合的物流业务预测方法及系统
CN111274531A (zh) 商品销售额预测方法、装置、计算机设备和存储介质
CN111353794A (zh) 数据处理的方法、供应链调度的方法和装置
Vanhoucke et al. Fitting activity distributions using human partitioning and statistical calibration
CN111652471B (zh) 名单分配控制方法、装置、电子设备及存储介质
Desmet et al. Safety stock optimisation in two-echelon assembly systems: normal approximation models
US20150371242A1 (en) Systems and methods for prime product forecasting
Allen et al. Determining resource requirements for elections using indifference-zone generalized binary search
CN112132498A (zh) 库存管理方法、装置、设备及存储介质
US20050015294A1 (en) Method and system for modeling and simulating an automobile service facility
CN108537654B (zh) 客户关系网络图的渲染方法、装置、终端设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 518000 1 / F-8 / F, building a, Lufthansa Park, terminal 4 road, Shenzhen airport, hourui community, Hangcheng street, Bao'an District, Shenzhen City, Guangdong Province

Applicant after: KUAYUE EXPRESS GROUP Co.,Ltd.

Address before: 518000 the first and second floors of buildings 7 and 8, Shenxiang logistics base, Aviation City Industrial Park, No.5 Fuyuan 2nd Road, Heping community, Fuyong street, Bao'an District, Shenzhen City, Guangdong Province

Applicant before: KUAYUE EXPRESS GROUP Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant