CN112150237B - 多模型融合的订单逾期预警方法、装置、设备及存储介质 - Google Patents
多模型融合的订单逾期预警方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112150237B CN112150237B CN202010880475.XA CN202010880475A CN112150237B CN 112150237 B CN112150237 B CN 112150237B CN 202010880475 A CN202010880475 A CN 202010880475A CN 112150237 B CN112150237 B CN 112150237B
- Authority
- CN
- China
- Prior art keywords
- data
- overdue
- order
- model
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000003860 storage Methods 0.000 title description 13
- 238000004519 manufacturing process Methods 0.000 claims abstract description 113
- 238000004458 analytical method Methods 0.000 claims abstract description 30
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 14
- 230000004927 fusion Effects 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 8
- 238000007477 logistic regression Methods 0.000 claims description 7
- 238000013145 classification model Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims 1
- 238000012384 transportation and delivery Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 239000002994 raw material Substances 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 206010012186 Delayed delivery Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
- G06Q30/0635—Processing of requisition or of purchase orders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Human Resources & Organizations (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Finance (AREA)
- Medical Informatics (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- General Factory Administration (AREA)
Abstract
本发明公开了一种多模型融合的订单逾期预警方法,包括:获取当前的订单数据、生产数据以及库存数据;对所述当前的订单数据、生产数据以及库存数据进行预处理,得到订单特征数据;将所述订单特征数据分别输入预先训练的逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型,得到预测的逾期概率、剩余完工时间以及逾期原因。本方明公开的订单逾期预警方法,可以有效地预测制造业企业中订单逾期的概率、订单完工剩余的时间,还能分析造成逾期的原因,帮助车间管理人员调整订单生产计划,更好地指导订单的生产。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种多模型融合的订单逾期预警方法、装置、设备及存储介质。
背景技术
越来越多的制造业企业开始利用工业大数据和人工智能的技术推动数字化、智能化的改造升级。尤其在传统制造业,智能化的改造升级成为了一种急切的需求。对于面向订单生产的制造型企业来说,能否保证订单按时交货是衡量企业竞争力的重要指标,订单的逾期或延误交货会导致订单违约,引发客户的不满,甚至会导致客户流失,降低企业信誉度和竞争力。并且对于企业来说,订单逾期或延误会打乱企业内部的生产计划,造成管理混乱、资源浪费。
现有技术中,对于订单是否会逾期往往是企业车间管理人员通过历史经验来判断,这种通过人工判断订单是否会逾期的方式比较主观,需要大量的车间以及生产流程的管理经验,并且人工预测无法利用制造业生产管理系统里存储的历史订单数据和生产数据,导致对订单逾期的判断和预测缺乏科学性,容易出现误判,甚至会打乱原有的合理的生产计划,因此,传统的订单逾期的预测方式存在可靠性低,时效性差的缺点,无法高效地保证企业的生产效率。
发明内容
本公开实施例提供了一种多模型融合的订单逾期预警方法、装置、设备及存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
第一方面,本公开实施例提供了一种多模型融合的订单逾期预警方法,包括:
获取当前的订单数据、生产数据以及库存数据;
对当前的订单数据、生产数据以及库存数据进行预处理,得到订单特征数据;
将订单特征数据分别输入预先训练的逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型,得到预测的逾期概率、剩余完工时间以及逾期原因。
可选地,订单特征数据包括:
当前订单规格特征、历史生产周期特征、当前生产数量特征以及当前订单的生产进度特征。
可选地,对当前的订单数据、生产数据以及库存数据进行预处理,得到订单特征数据,包括:
对当前的订单数据、生产数据以及库存数据中的异常数据和缺失数据进行删除或填补处理,得到修正后的数据;
根据修正后的数据构建数据集,其中,数据集包含各个订单在各个时间节点的数据;
对数据集进行特征提取,得到订单特征数据。
可选地,将订单特征数据分别输入预先训练的逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型,得到预测的逾期概率、剩余完工时间以及逾期原因,包括:
将订单特征数据输入逾期概率预测模型,得到预测的第一逾期概率;
将订单特征数据输入剩余完工时间预测模型,得到预测的剩余完工时间以及第二逾期概率;
将订单特征数据输入逾期原因分析模型,得到预测的逾期原因以及第三逾期概率。
可选地,第一逾期概率、第二逾期概率以及第三逾期概率的加权平均为预测的最终逾期概率。
可选地,将订单特征数据分别输入预先训练的逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型之前,还包括:
获取历史订单数据、生产数据以及库存数据;
对历史订单数据、生产数据以及库存数据进行预处理,得到历史订单特征数据;
根据历史订单特征数据训练逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型。
可选地,逾期概率预测模型是一个分类模型;剩余完工时间预测模型是一个回归模型。
第二方面,本公开实施例提供了一种多模型融合的订单逾期预警装置,包括:
获取模块,用于获取当前的订单数据、生产数据以及库存数据;
数据处理模块,用于对当前的订单数据、生产数据以及库存数据进行预处理,得到订单特征数据;
预测模块,用于将订单特征数据分别输入预先训练的逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型,得到预测的逾期概率、剩余完工时间以及逾期原因。
第三方面,本公开实施例提供了一种多模型融合的订单逾期预警设备,包括处理器和存储有程序指令的存储器,处理器被配置为在执行程序指令时,执行上述实施例提供的多模型融合的订单逾期预警方法。
第四方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机可读指令,计算机可读指令可被处理器执行以实现上述实施例提供的一种多模型融合的订单逾期预警方法。
本公开实施例提供的技术方案可以包括以下有益效果:
本公开实施例提供了一种多模型融合的订单实时逾期预警方法,不仅能预测订单逾期的概率、订单完工剩余所需的时间,还能分析逾期原因,更好地指导订单的生产。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种多模型融合的订单逾期预警方法的流程示意图;
图2是根据一示例性实施例示出的一种多模型融合的订单逾期预警装置的结构示意图;
图3是根据一示例性实施例示出的一种多模型融合的订单逾期预警装置的结构示意图;
图4是根据一示例性实施例示出的一种多模型融合的订单逾期预警设备的结构示意图;
图5是根据一示例性实施例示出的一种计算机存储介质的示意图。
具体实施方式
为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或一个以上实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
本公开实施例提供的多模型融合的订单逾期预警方法,首先从企业内部的数据库中获取原始的历史订单数据、生产数据和库存数据,并对这些原始数据进行预处理,得到订单特征数据,然后用订单特征数据训练三个机器学习模型来预测订单逾期的概率、订单完工剩余所需的时间以及自动分析导致订单逾期的因素。最后在生产过程中,企业或者车间管理人员将从实时的订单数据、生产数据、库存数据中得到订单特征数据,并输入以上三个模型获取实时逾期预警提示,来调整订单的生产计划和安排。
该方法提出了一种应用于制造业领域的数据处理、数据集构造以及特征生成的全新方法,使用处理后得到的数据训练的模型能更好地提升逾期预测的准确率。针对传统制造业人工判断的滞后性,本公开实施例通过划分订单生命周期中的各个时间节点,达到实时预测的效果。针对传统制造业企业的使用人工判断方式的局限性,本公开实施例提出了一种全面的订单逾期预警系统,不仅能预测订单逾期的概率、订单完工剩余所需的时间、还能提供逾期原因分析,更好地指导订单的生产。
下面将结合附图1-附图5,对本申请实施例提供的多模型融合的订单逾期预警方法、装置、设备及存储介质进行详细介绍。
参见图1,该方法具体包括以下步骤。
S101获取当前的订单数据、生产数据以及库存数据。
具体地,可从企业内部的数据库中获取ERP(Enterprise Resource Planning,企业资源计划)、MES(Manufacturing Execution System,制造业生产过程执行系统)等管理系统的当前订单数据、生产数据和库存数据。其中,订单数据包括订单产品的数量、订单产品的规格、订单完成的时间、订单所需的原材料等数据,生产数据包括可用的生产车间、可用的生产机械、生产车间的人员数量等数据,库存数据包括所需原材料的剩余库存、订单产品的库存、生产设备的库存等数据。
S102对当前的订单数据、生产数据以及库存数据进行预处理,得到订单特征数据。
获取到所需的数据之后,对当前的订单数据、生产数据以及库存数据中的异常数据和缺失数据进行删除或填补处理,得到修正后的数据。
由于部分订单及生产数据是由人工记录来存入数据库的,存储的过程中会出现记录错误,遗漏等问题,所以我们需要对原始数据进行预处理工作,主要是对数据中的异常数据和缺失数据进行删除或填补操作。
对于异常数据,按照业务理解和正态分布中的拉依达准则删除异常数据,比如对于一笔订单来说,需要生产的产品数肯定是大于0的,如果小于0那么这个数据可以直接删除或者用均值来填补;对于缺失数据,根据实际情况可以进行填补或者删除操作,若某笔订单需要生产的产品数量缺失,那么可以用下这笔订单对应的客户的所有订单的产品数量的平均值替代,如果一笔订单的时间缺失,那么可以直接删除这条订单的数据。
根据修正后的数据构建数据集,其中,数据集包含各个订单在各个时间节点的数据。
在制造业企业中,订单从下单到交货的生命周期往往分成多个步骤,传统的离散制造的订单流程一般包括下单、产前准备、排程、生产、入库、装车送货这六个步骤,其中生产又可以细分成各类子工序。为了能实时地预测订单的逾期概率等,我们需要从原始数据中获取每一笔订单在生命周期中每个步骤或者工序的信息,记录该笔订单在该节点所有已知数据及生产情况,并把该订单是否逾期以及在该节点到实际完工交货剩余所需的时间分别作为预测目标。
这样就可以得到完整的包含各个订单各个时间节点的数据。
对数据集进行特征提取,得到订单特征数据。
由于原始数据集中的数据维度比较单一,直接利用原始数据集训练模型以及进行预测,准确率较低,为了提升模型的预测准确度,本申请特别涉及了四类“强特征”来涵盖与订单生命周期相关的信息。
具体地,对数据集进行特征提取,得到四类订单特征数据,分别为当前订单规格特征,这部分特征主要描述当前订单的规模和所需要的生产产品的规格,主要包含订单产品规格,例如,包含订单产品的单价、面积、体积、订单产品数量、订单产品的工序复杂度、订单附件的产品规格、订单产品所需的原材料类型等。
还包括历史生产周期特征,基于相同类型的订单的生产周期和逾期情况具有相似性的假设,统计了该订单对应的历史统计特征,主要包含该订单对应的下单客户的历史所有订单的逾期统计值,例如历史平均逾期率,逾期方差等,历史所有订单在某一时间节点到完工交货所需时间的统计值,例如历史平均剩余完工时间、方差、最大/最小剩余完工时间、历史交付周期等。
还包括当前生产数量特征,这部分特征用来描述当前工厂的繁忙程度,如果工厂繁忙,那么订单之间会相互争夺工厂的人力、原料、机器等资源,、有可能导致订单逾期,相反如果当前工厂比较空闲,即订单量少,那么资源就比较充足,订单逾期的可能性小。这部分特征主要包含当前未生产或未交货的订单总数、产品总量、当前机器占用率、产能利用率、当前水电消耗、当前库存等。
还包括当前订单的生产进度特征,这部分特征主要描述当前订单的生产进度情况。主要包含当前订单进行到的时间节点、当前订单从下单到该节点所花的时间及占预定交货时间的比例、当前订单已经生产的产品数量等。
通过对原始数据集提取特征,得到的以上四类特征蕴含了关于订单的详尽信息,这部分特征可以有效的提高模型预测的精度。
S103将订单特征数据分别输入预先训练的逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型,得到预测的逾期概率、剩余完工时间以及逾期原因。
具体地,再将订单特征数据分别输入预先训练的逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型之前,还包括,训练逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型。
基于企业内部数据库中的历史订单数据、生产数据以及库存数据训练逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型。
具体地,首先从ERP、MES等管理系统中获取历史订单数据、生产数据和库存数据,然后对历史订单数据、生产数据以及库存数据进行预处理,具体地数据预处理方法和上述步骤相同,在此不再详细叙述,得到四类历史订单特征数据。
首先,根据得到的四类历史订单特征数据训练逾期概率预测模型,逾期概率预测模型是一个分类模型,在一种可能的实施方式中,采用CatBoost分类模型,CatBoost分类模型是一种开源的机器学习库,是一种以对称决策树为基学习器,实现的参数较少、支持类别型变量以及高准确性的GBDT框架。CatBoost模型嵌入了自动将类别型特征处理为数值型特征的创新算法,它首先对范畴特征做一些统计,计算某个类别特征出现的频率,之后加上超参数,生成新的数值型特征。其次,Catboost模型还使用了组合类别特征,可以利用特征之间的联系,这极大的丰富了特征维度。最后CatBoost模型采用有序推进的方法避免梯度估计的偏差,进而解决预测偏移的问题,从而减少过拟合的发生,提高算法的准确性和泛化能力。
将历史订单特征数据中的当前订单规格特征、历史生产周期特征、当前生产数量特征以及当前订单的生产进度特征输入该CatBoost模型,以是否逾期为标签,训练该CatBoost模型。得到训练好的逾期概率预测模型,将当前订单特征数据中的当前订单规格特征、历史生产周期特征、当前生产数量特征以及当前订单的生产进度特征输入训练好的逾期概率预测模型,得到当前订单的逾期概率,记为第一逾期概率。
可选地,逾期概率预测模型还可以选用集成树模型,例如选用AdaBoost、GBDT、XGBoost、Light GBM、Random Forest等集成树模型。
可选地,逾期概率预测模型还可以选用神经网络模型,例如选用SVM、LogisticRegression等神经网络模型。
然后根据得到的四类历史订单特征数据训练剩余完工时间预测模型,在一种可能的实现方式中,选用CatBoost回归模型,将历史订单特征数据中的当前订单规格特征、历史生产周期特征、当前生产数量特征以及当前订单的生产进度特征输入该CatBoost模型,以订单当前节点到实际完工交货剩余的时间为标签,训练该catboost回归模型,得到训练好的剩余完工时间预测模型,将当前订单特征数据中的当前订单规格特征、历史生产周期特征、当前生产数量特征以及当前订单的生产进度特征输入训练好的剩余完工时间预测模型,得到预测的剩余完工时间,将得到的剩余完工时间再输入一个Logistic Regression模型可以转换为逾期概率,记为“第二逾期概率”。
可选地,剩余完工时间预测模型还可以选用集成树模型,例如选用AdaBoost、GBDT、XGBoost、Light GBM、Random Forest等集成树模型。
可选地,剩余完工时间预测模型还可以选用神经网络模型,例如选用SVR模型、线性回归模型等神经网络模型。
最后,根据得到的四类历史订单特征数据训练逾期原因分析模型,逾期原因分析模型的训练方法首先是进行特征分箱操作,特征分箱操作是对连续变量进行分段离散化,将多状态的离散变量进行合并,减少离散变量的状态数。在一种可能的实现方式中,设定分箱数为5箱,特征分箱有利于简化模型,降低模型过拟合的风险,提高模型的泛化能力,常用的分箱方法有无监督分箱,包括等频分箱、等距分箱、聚类分箱,和有监督分箱,包括split分箱,卡方分箱两大类。
在一种可能的实现方式中,使用卡方分箱对所有特征进行分箱,卡方分箱的基本思想是如果两个相邻的区间具有类似的类分布,则将这两个区间合并,卡方分箱通常采用卡方值来衡量两相邻区间的类分布相似度,通过卡方分箱可以使箱与箱之间的差异尽可能大,箱内数据尽可能接近,相对于普通分箱方法分箱效果更好,具体分箱的步骤如下:
(1)预先设定一个卡方阈值,或者设定分箱数。
(2)对特征的取值进行排序,每个样本为单独的一个区间。
(3)计算每一对相邻区间的卡方值:
其中,Aij表示第i个区间第j类的样本数量,Eij表示Aij的期望频率,Ni是第i组的样本数,Cj是总体中第j类样本的占比,N是总样本数。
(4)将卡方值最小的两个区间合并。
(5)重复执行步骤(3)和步骤(4),直到卡方值都大于预设卡方阈值,或者分箱数等于预设分箱数。
分箱之后便得到了一系列的离散变量,下面需要对变量进行WOE(weight ofevidence,证据权重)编码,WOE编码是一种有监督的编码方式,它将预测类别的集中度的属性作为编码的数值,反映了当前分箱中订单是否逾期的情况与总体的差异,对于自变量在第i箱的WOE值为:
其中,Bi是第i箱中逾期样本数,Gi是第i箱中未逾期样本数;BT是所有逾期样本数,GT是所有未逾期样本数。
最后,将经过WOE编码后的特征输入Logistic Regression模型,以是否逾期为目标训练模型,模型输出一个逾期概率,记为第三逾期概率。
另外,由于Logistic Regression模型的特殊性,可以获得各个特征系数的权重,然后将各个特征的值和对应系数相乘,然后将特征的值和对应系数相乘的结果从大到小排序,越大的特征说明对逾期的影响越大,这样就可以分析订单逾期的原因。
在一些示例性场景中,如果当前生产数量特征中某个特征的值和对应系数相乘的值最大,说明当前工厂过于繁忙,很可能会导致该订单逾期,这时候管理人员可以调整生产节奏;如果是当前生产节奏中某个特征的值和对应系数相乘的值最大,说明该订单的进度过慢,需要加快进度;如果是订单生产规格中某个特征,比如产品数量的值和对应系数相乘的值最大,说明该订单的产品数量比较大,需要安排更多的机器、原材料和人力资源来避免订单逾期。
将当前实时的订单特征数据输入训练好的逾期概率预测模型,得到预测的第一逾期概率;将当前实时的订单特征数据输入训练好的剩余完工时间预测模型,得到预测的剩余完工时间以及第二逾期概率;将当前实时的订单特征数据输入训练好的逾期原因分析模型,得到预测的逾期原因以及第三逾期概率。
为了提高预测的泛化性能,将第一逾期概率、第二逾期概率以及第三逾期概率的加权平均做为预测的最终逾期概率,在一种可能的实现方式中,0.5*第一逾期概率+0.25*第二逾期概率+0.25*第三逾期概率=最终逾期概率。具体的权值取值本领域技术人员可根据生产情况进行合理选择,本公开实施例不做具体限定。
可选地,在企业利用本公开实施例提供的订单逾期预警方法时,可以先抽取所有历史订单数据、生产数据以及库存数据,然后对这些数据进行修正处理,构建数据集,并提取订单特征数据,将订单特征数据存入数据库,在实时生产过程中,间隔预设时间段后,将新增订单数据进行同样处理,并存入数据库,例如,每隔10分钟后将新增订单数据进行同样的处理,并存入数据库。另外,考虑到模型训练的时间消耗以及数据新增的频率及数量,每隔一周重新训练并存储模型,接下来一周统一加载最新的模型进行逾期预警。具体的更新时间本领域技术人员可自行设定,本公开实施例不做具体限制。
基于本公开实施例提供的多模型融合的订单逾期预警方法,可以通过划分订单生命周期中的各个时间节点,达到实时预测的效果,而且该方法提出了一种数据处理、数据集构造以及特征生成的全新方法,使用处理后的特征数据训练的模型能更好地提升逾期预测的准确率,该方法还可以全面的预测订单逾期的概率、订单完工剩余所需的时间,以及分析逾期的原因,更好地指导车间管理人员制定生产计划,避免企业造成订单逾期。
第二方面,本公开实施例还提供一种多模型融合的订单逾期预警装置,该装置用于执行上述实施例的多模型融合的订单逾期预警方法,如图2所示,该装置包括:
获取模块201,用于获取当前的订单数据、生产数据以及库存数据;
数据处理模块202,用于对当前的订单数据、生产数据以及库存数据进行预处理,得到订单特征数据;
预测模块203,用于将订单特征数据分别输入预先训练的逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型,得到预测的逾期概率、剩余完工时间以及逾期原因。
进一步地,订单特征数据包括:
当前订单规格特征、历史生产周期特征、当前生产数量特征以及当前订单的生产进度特征。
进一步地,数据处理模块202,包括:
修正单元,用于对当前的订单数据、生产数据以及库存数据中的异常数据和缺失数据进行删除或填补处理,得到修正后的数据;
数据集构建单元,用于根据修正后的数据构建数据集,其中,数据集包含各个订单在各个时间节点的数据;
特征提取单元,用于对数据集进行特征提取,得到订单特征数据。
进一步地,预测模块203,包括:
概率预测单元,用于将订单特征数据输入逾期概率预测模型,得到预测的第一逾期概率;
剩余完工时间预测单元,用于将订单特征数据输入剩余完工时间预测模型,得到预测的剩余完工时间以及第二逾期概率;
逾期原因分析单元,用于将订单特征数据输入逾期原因分析模型,得到预测的逾期原因以及第三逾期概率。
进一步地,第一逾期概率、第二逾期概率以及第三逾期概率的加权平均为预测的最终逾期概率。
进一步地,还包括:
模型训练模块,用于获取历史订单数据、生产数据以及库存数据,用于对历史订单数据、生产数据以及库存数据进行预处理,得到历史订单特征数据,用于根据历史订单特征数据训练逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型。
进一步地,逾期概率预测模型是一个分类模型;剩余完工时间预测模型是一个回归模型。
为了便于理解本公开实施例提供的多模型融合的订单逾期预警装置,下面结合附图3进行详细介绍,如图3所示,该订单逾期预警装置,包括:数据处理模块,数据处理模块具体用于对原始数据中的订单数据、生产数据以及库存数据进行数据处理,包括删除或填补异常数据和缺失数据,构建各个订单在各个时间节点的数据集,提取数据集中的订单特征数据,得到入模特征,提取的入模特征包括当前订单规格特征、历史生产周期特征、当前生产数量特征以及当前订单生产进度特征。
还包括多模型融合的逾期预测模块,具体用于,根据历史数据中的当前订单规格特征、历史生产周期特征、当前生产数量特征以及当前订单生产进度特征训练逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型,然后将提取的当前订单数据中的入模特征输入训练好的逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型,得到预测的剩余完工时间、逾期概率以及逾期原因。
需要说明的是,上述实施例提供的多模型融合的订单逾期预警装置在执行多模型融合的订单逾期预警方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的多模型融合的订单逾期预警装置与多模型融合的订单逾期预警方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
第三方面,本公开实施例还提供一种与前述实施例所提供的多模型融合的订单逾期预警方法对应的电子设备,以执行上述多模型融合的订单逾期预警方法。
请参考图4,其示出了本申请的一些实施例所提供的一种电子设备的示意图。如图4所示,电子设备包括:处理器400,存储器401,总线402和通信接口403,处理器400、通信接口403和存储器401通过总线402连接;存储器401中存储有可在处理器400上运行的计算机程序,处理器400运行计算机程序时执行本申请前述任一实施例所提供的多模型融合的订单逾期预警方法。
其中,存储器401可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口403(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
总线402可以是ISA总线、PCI总线或EISA总线等。总线可以分为地址总线、数据总线、控制总线等。其中,存储器401用于存储程序,处理器400在接收到执行指令后,执行程序,前述本申请实施例任一实施方式揭示的多模型融合的订单逾期预警方法可以应用于处理器400中,或者由处理器400实现。
处理器400可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器400中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器400可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器401,处理器400读取存储器401中的信息,结合其硬件完成上述方法的步骤。
本申请实施例提供的电子设备与本申请实施例提供的多模型融合的订单逾期预警方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。
第四方面,本申请实施例还提供一种与前述实施例所提供的多模型融合的订单逾期预警方法对应的计算机可读存储介质,请参考图5,其示出的计算机可读存储介质为光盘500,其上存储有计算机程序(即程序产品),计算机程序在被处理器运行时,会执行前述任意实施例所提供的多模型融合的订单逾期预警方法。
需要说明的是,计算机可读存储介质的例子还可以包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
本申请的上述实施例提供的计算机可读存储介质与本申请实施例提供的多模型融合的订单逾期预警方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (6)
1.一种多模型融合的订单逾期预警方法,其特征在于,包括:
获取当前的订单数据、生产数据以及库存数据;
对所述当前的订单数据、生产数据以及库存数据进行预处理,得到订单特征数据,所述订单特征数据包括:当前订单规格特征、历史生产周期特征、当前生产数量特征以及当前订单的生产进度特征;
获取历史订单数据、生产数据以及库存数据;对所述历史订单数据、生产数据以及库存数据进行预处理,得到历史订单特征数据;根据所述历史订单特征数据训练逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型;
其中,训练逾期原因分析模型,包括:首先是进行特征分箱操作,分箱之后得到了一系列的离散变量,对离散变量进行WOE编码,将经过WOE编码后的特征输入LogisticRegression模型,以是否逾期为目标训练模型,模型输出一个逾期概率,记为第三逾期概率;获得各个特征系数的权重,然后将各个特征的值和对应系数相乘,将特征的值和对应系数相乘的结果从大到小排序,越大的特征说明对逾期的影响越大,得到逾期原因;
将所述订单特征数据分别输入预先训练的逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型,得到预测的逾期概率、剩余完工时间以及逾期原因,包括:将所述订单特征数据输入所述逾期概率预测模型,得到预测的第一逾期概率;将所述订单特征数据输入所述剩余完工时间预测模型,得到预测的剩余完工时间以及第二逾期概率;将所述订单特征数据输入所述逾期原因分析模型,得到预测的逾期原因以及第三逾期概率;所述第一逾期概率、第二逾期概率以及第三逾期概率的加权平均为预测的最终逾期概率。
2.根据权利要求1所述的方法,其特征在于,对所述当前的订单数据、生产数据以及库存数据进行预处理,得到订单特征数据,包括:
对所述当前的订单数据、生产数据以及库存数据中的异常数据和缺失数据进行删除或填补处理,得到修正后的数据;
根据所述修正后的数据构建数据集,其中,所述数据集包含各个订单在各个时间节点的数据;
对所述数据集进行特征提取,得到所述订单特征数据。
3.根据权利要求1-2任一项所述的方法,其特征在于,所述逾期概率预测模型是一个分类模型;所述剩余完工时间预测模型是一个回归模型。
4.一种多模型融合的订单逾期预警装置,其特征在于,包括:
获取模块,用于获取当前的订单数据、生产数据以及库存数据;
数据处理模块,用于对所述当前的订单数据、生产数据以及库存数据进行预处理,得到订单特征数据,所述订单特征数据包括:当前订单规格特征、历史生产周期特征、当前生产数量特征以及当前订单的生产进度特征;
训练模块,用于获取历史订单数据、生产数据以及库存数据;对所述历史订单数据、生产数据以及库存数据进行预处理,得到历史订单特征数据;根据所述历史订单特征数据训练逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型;
其中,训练逾期原因分析模型,包括:首先是进行特征分箱操作,分箱之后得到了一系列的离散变量,对离散变量进行WOE编码,将经过WOE编码后的特征输入LogisticRegression模型,以是否逾期为目标训练模型,模型输出一个逾期概率,记为第三逾期概率;由于Logistic Regression模型的特殊性,获得各个特征系数的权重,然后将各个特征的值和对应系数相乘,将特征的值和对应系数相乘的结果从大到小排序,越大的特征说明对逾期的影响越大,得到逾期原因;
预测模块,用于将所述订单特征数据分别输入预先训练的逾期概率预测模型、剩余完工时间预测模型以及逾期原因分析模型,得到预测的逾期概率、剩余完工时间以及逾期原因,包括:将所述订单特征数据输入所述逾期概率预测模型,得到预测的第一逾期概率;将所述订单特征数据输入所述剩余完工时间预测模型,得到预测的剩余完工时间以及第二逾期概率;将所述订单特征数据输入所述逾期原因分析模型,得到预测的逾期原因以及第三逾期概率;所述第一逾期概率、第二逾期概率以及第三逾期概率的加权平均为预测的最终逾期概率。
5.一种多模型融合的订单逾期预警设备,其特征在于,包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在执行所述程序指令时,执行如权利要求1至3任一项所述的多模型融合的订单逾期预警方法。
6.一种计算机可读介质,其特征在于,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1至3任一项所述的一种多模型融合的订单逾期预警方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010880475.XA CN112150237B (zh) | 2020-08-27 | 2020-08-27 | 多模型融合的订单逾期预警方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010880475.XA CN112150237B (zh) | 2020-08-27 | 2020-08-27 | 多模型融合的订单逾期预警方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112150237A CN112150237A (zh) | 2020-12-29 |
CN112150237B true CN112150237B (zh) | 2023-06-20 |
Family
ID=73889139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010880475.XA Active CN112150237B (zh) | 2020-08-27 | 2020-08-27 | 多模型融合的订单逾期预警方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112150237B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112785377B (zh) * | 2021-01-22 | 2022-05-24 | 华南理工大学 | 基于数据分布的订单完工期预测模型构建方法及预测方法 |
CN113159653A (zh) * | 2021-05-24 | 2021-07-23 | 汇信软投(佛山)软件科技发展有限公司 | 超期订单获取方法及装置 |
CN113361105B (zh) * | 2021-06-07 | 2023-09-19 | 杭州未名信科科技有限公司 | 一种订单分配方法、装置、存储介质及终端 |
CN113554483A (zh) * | 2021-07-19 | 2021-10-26 | 浙江工企信息技术股份有限公司 | 一种订单全生命周期管理方法及系统 |
WO2024065407A1 (zh) * | 2022-09-29 | 2024-04-04 | 京东方科技集团股份有限公司 | 生产排程方法、电子设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008171171A (ja) * | 2007-01-11 | 2008-07-24 | Hitachi Ltd | 需要予測方法、および需要予測分析サーバ、並びに需要予測プログラム |
US10713706B1 (en) * | 2018-01-30 | 2020-07-14 | EMC IP Holding Company LLC | Multi-model prediction and resolution of order issues |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004295188A (ja) * | 2003-03-25 | 2004-10-21 | Renesas Technology Corp | 納期予測を用いた生産管理方法 |
US20170098186A1 (en) * | 2015-10-02 | 2017-04-06 | The Boeing Company | Product Management System with Supplier Risk Management |
US20180096295A1 (en) * | 2016-10-05 | 2018-04-05 | General Electric Company | Delivery status diagnosis for industrial suppliers |
CN108492141A (zh) * | 2018-03-28 | 2018-09-04 | 联想(北京)有限公司 | 一种多模型融合的预测方法及装置 |
CN109255506B (zh) * | 2018-11-22 | 2022-05-03 | 重庆邮电大学 | 一种基于大数据的互联网金融用户贷款逾期预测方法 |
CN109685276B (zh) * | 2018-12-27 | 2021-01-01 | 拉扎斯网络科技(上海)有限公司 | 订单处理方法、装置、电子设备及计算机可读存储介质 |
CN110390433A (zh) * | 2019-07-22 | 2019-10-29 | 国网河北省电力有限公司邢台供电分公司 | 一种订单预测方法、订单预测装置及终端设备 |
-
2020
- 2020-08-27 CN CN202010880475.XA patent/CN112150237B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008171171A (ja) * | 2007-01-11 | 2008-07-24 | Hitachi Ltd | 需要予測方法、および需要予測分析サーバ、並びに需要予測プログラム |
US10713706B1 (en) * | 2018-01-30 | 2020-07-14 | EMC IP Holding Company LLC | Multi-model prediction and resolution of order issues |
Also Published As
Publication number | Publication date |
---|---|
CN112150237A (zh) | 2020-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112150237B (zh) | 多模型融合的订单逾期预警方法、装置、设备及存储介质 | |
CN106408341A (zh) | 货品销量的预测方法及装置、电子设备 | |
CN108614778B (zh) | 基于高斯过程回归的安卓App程序演化变更预测方法 | |
CN114782065A (zh) | 一种基于模型组合的商品销量预测方法、装置及存储介质 | |
CN116362607B (zh) | 一种物资储备效能评估方法及装置 | |
CN115564071A (zh) | 一种电力物联网设备数据标签生成方法及系统 | |
CN113191533A (zh) | 仓库用工预测方法、装置、设备及存储介质 | |
CN116579804A (zh) | 一种节假日商品销量预测方法、装置及计算机存储介质 | |
CN113326177A (zh) | 一种指标异常检测方法、装置、设备及存储介质 | |
CN115689334A (zh) | 仓库管理系统的效率分析方法、系统及计算机设备 | |
CN114330816A (zh) | 一种工业原材料采购控制方法及系统 | |
CN117391257A (zh) | 一种道路拥堵情况的预测方法及装置 | |
CN112231299A (zh) | 一种特征库动态调整的方法和装置 | |
CN116308494A (zh) | 供应链需求预测方法 | |
CN115796398A (zh) | 基于电力物资的需求智能分析方法、系统、设备及介质 | |
CN113743695A (zh) | 基于大数据的国际工程项目投标报价风险管理方法 | |
CN113762842A (zh) | 仓库调度方法、服务器和系统 | |
CN113379125B (zh) | 一种基于TCN和LightGBM组合模型的物流仓储销售量预测方法 | |
CN114548523B (zh) | 用户观影信息预测方法、装置、设备及存储介质 | |
CN112651534B (zh) | 一种预测资源供应链需求量的方法、装置及存储介质 | |
US20230376796A1 (en) | Method and system for knowledge-based process support | |
CN118313568A (zh) | 设备运行状态预测方法、电子设备及存储介质 | |
EP4270278A1 (en) | Resource allocation in complex environments | |
Huovila | Use of machine learning in supply chain management: case study with DataRobot | |
CN116644826A (zh) | 基于融合模型来预测用户消费的方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |