CN111950785B - 事件预测及因子识别动态模拟模型建模方法及系统 - Google Patents
事件预测及因子识别动态模拟模型建模方法及系统 Download PDFInfo
- Publication number
- CN111950785B CN111950785B CN202010779604.6A CN202010779604A CN111950785B CN 111950785 B CN111950785 B CN 111950785B CN 202010779604 A CN202010779604 A CN 202010779604A CN 111950785 B CN111950785 B CN 111950785B
- Authority
- CN
- China
- Prior art keywords
- batch
- establishing
- time
- products
- quality inspection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000005094 computer simulation Methods 0.000 title claims abstract description 42
- 238000004519 manufacturing process Methods 0.000 claims abstract description 71
- 238000004088 simulation Methods 0.000 claims abstract description 17
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 16
- 238000013461 design Methods 0.000 claims abstract description 6
- 230000002950 deficient Effects 0.000 claims description 67
- 238000007689 inspection Methods 0.000 claims description 54
- 230000008569 process Effects 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000012544 monitoring process Methods 0.000 claims description 10
- 239000000463 material Substances 0.000 claims description 8
- 238000000556 factor analysis Methods 0.000 claims description 7
- 239000000654 additive Substances 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 230000002123 temporal effect Effects 0.000 claims description 3
- 230000000996 additive effect Effects 0.000 claims description 2
- 230000004044 response Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 9
- 238000000354 decomposition reaction Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 239000002994 raw material Substances 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 238000010206 sensitivity analysis Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Manufacturing & Machinery (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- General Factory Administration (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种事件预测及因子识别动态模拟模型建模方法及系统,包括:步骤S1:确立需要监测和评估的事件属性,以及相应的指标算式;步骤S2:建立动态数字模拟流程图;步骤S3:建立批次数据;步骤S4:形成配置文件;步骤S5:将数据和配置文件导入算法平台,进行运算,并生成结果;步骤S6:模型应用。本发明的事件预测及因子识别动态模拟模型通过其独有的建模设计和算法,解决了对产品制造业的离散型随机序列数据进行分析和建模的疑难问题,从而是对建模方法的基础性创新,将在产品制造业获得广泛的应用。
Description
技术领域
本发明涉及产品制造技术领域,具体地,涉及事件预测及因子识别动态模拟模型建模方法及系统。尤其地,涉及针对产品制造中随机离散序列变量的一种基本建模 方法。
背景技术
Multiple Time-Dimension Simulation Models and Lifecycle DynamicScoring System是美国Dynamic Simulation Systems LTD公司的Ruizhi Bu和 YuanyuanPeng在美国共同申请并已公开的专利申请。
上述专利申请中创建的评分方法,所针对的是0/1型结果数据。本专利申请中 的建模方法,针对的是产品制造行业中最为常见的离散型随机序列数据。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种事件预测及因子识别动态模拟模型建模方法及系统。
根据本发明提供的一种事件预测及因子识别动态模拟模型建模方法,包括:
步骤S1:确立需要监测和评估的事件属性,以及相应的指标算式;
步骤S2:建立动态数字模拟流程图;
步骤S3:建立批次数据;
步骤S4:形成配置文件;
步骤S5:将批次数据和配置文件导入算法平台,进行运算,并生成模拟模型;
步骤S6:应用生成的模拟模型。
优选地,所述步骤S1包括:
步骤S101:确立监测、预测和进行因子分析所针对的事件:
步骤S102:确立目标指标的计算公式;
所述监测、预测和进行因子分析所针对的事件包括:
质检机质检过程中次品的出现;
所述质检机质检包括:生产线上质检和生产线下批检;
所述生产线上质检:工件按照在生产中被完成的时间顺序进入质检机;质检机被用 来实时识别质差产品、质差类别,并对质差产品的数目以及良品的数目进行实时计数;最终的总产出数目=良品数目+次品数目;
所述生产线下批检:成批的已完成工件依次进入质检机,排序与生产顺序无关,并为非实时;工件进入质检机后,质检机被用来实时识别质差产品、质差类别,并对质差 产品的数目以及良品的数目进行实时计数;最终的总产出数目=良品数目+次品数 目;
所述目标指标的计算公式包括针对次品率的指标和算式:
总体次品率=次品数目/总产出数目;
分类次品率=分类次品数目/总产出数目。
优选地,所述步骤S2包括:
步骤S201:建立动态模拟流程图:
步骤S202:建立特征分类格栅;
所述步骤S201:
以流程图的方式展示需要进行建模的指标以及数量或规模变量;
所述指标是比率,包括:次品率;
所述变量包括:次品数目,良品数目。
步骤S202:
格栅中对分类维度的选择有两个依据,包括:业务决策的需要、数据中可能对目标指标产生影响的其他变量;
所述其他变量包括:产品种类、生产线、班组、工艺、材料、添加剂、公差以及生 产环境变量。
优选地,所述步骤S3包括:
步骤S301:建立初始表:
步骤S302:建立指标表现跟踪表:
步骤S303:数据采集、清洗和标准化;
所述初始表对应于特征分类格栅表,记录每个批次与格栅的对应,以及批次的生产 起始时间,计划产量或最终实际产量;
所述指标表现跟踪表记录每个批次在细分时间间隔上的表现;
所述步骤S303:
对流程图中所涉及的变量,原始字段需要从数据库或设备端获取;建模前进行数据 的清洗和标准化。
优选地,所述步骤S4:
所述配置文件指将流程图中的信息发送给软件平台;软件平台是通用动态模拟工具, 可以适配任何流程设计,而配置文件就是将通用动态模拟工具用于个性化流程图的媒介。
优选地,所述步骤S5:
对于流程图中的任何一个指标,用两种时间形式来表达,即:
rvi(otvi,t)(1)或者是rvi(otvi,avi)(2)
其中avi=t-otvi
表达式中使用r来表示目标指标,包括次品率;vi表示任何一个生产批次,即第i个批次;otvi用来标注这个批次的开始时间;
rvi(otvi,t)所显示的,是以日历时间t来计数时间的流逝,而rvi(otvi,avi)所显 示的,是以增龄avi来计数时间的流逝;
由于两个时间轴的转换对于任何既定的批次都是一对一的关系,即公式(2),即增龄(月份数)=日历时间-初始时间,所以公式(1)中的两个表述形式是等同的。
与现有技术相比,本发明具有如下的有益效果:
本发明的事件预测及因子识别动态模拟模型通过其独有的建模设计和算法,解决了对产品制造业的离散型随机序列数据进行分析和建模的疑难问题,从而是对建 模方法的基础性创新,将在产品制造业获得广泛的应用。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明提供的模型的功用示意图。
图2为本发明提供的样本中对被解释变量的计算示意图。
图3为本发明提供的样本中的解释变量示意图。
图4为本发明提供的对样本数目的计算示意图。
图5为本发明提供的对业绩指标和规模变量进行同时建模流程示意图。
图6为本发明提供的特征分类格栅–决策的维度和各个维度中的选项示意图。
图7为本发明提供的初始表的结构与内容示意图。
图8为本发明提供的生产表现跟踪表的结构与内容示意图。
图9为本发明提供的对事件预测及因子识别动态模拟模型建模方法的展示示意图。
图10为本发明提供的批次数据过少的情形示意图。
图11为本发明提供的批次数据充分的情形示意图。
图12为本发明提供的将全(所有)维度建模降维到单一因素建模示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人 员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于 本发明的保护范围。
根据本发明提供的一种事件预测及因子识别动态模拟模型建模方法,包括:
步骤S1:确立需要监测和评估的事件属性,以及相应的指标算式;
步骤S2:建立动态数字模拟流程图;
步骤S3:建立批次数据;
步骤S4:形成配置文件;
步骤S5:将数据和配置文件导入算法平台,进行运算,并生成结果;
步骤S6:模型应用。
具体地,所述步骤S1包括:
步骤S101:确立监测、预测和进行因子分析所针对的事件:
步骤S102:确立目标指标的计算公式;
所述监测、预测和进行因子分析所针对的事件包括:
质检机质检过程中次品的出现;
所述质检机质检包括:生产线上质检和生产线下批检;
所述生产线上质检:工件按照在生产中被完成的时间顺序进入质检机;质检机被用 来实时识别质差产品、质差类别,并对质差产品的数目以及良品的数目进行实时计数;最终的总产出数目=良品数目+次品数目;
所述生产线下批检:成批的已完成工件依次进入质检机,排序与生产顺序无关,并为非实时;工件进入质检机后,质检机被用来实时识别质差产品、质差类别,并对质差 产品的数目以及良品的数目进行实时计数;最终的总产出数目=良品数目+次品数 目;
所述目标指标的计算公式包括针对次品率的指标和算式:
总体次品率=次品数目/总产出数目;
分类次品率=分类次品数目/总产出数目。
具体地,所述步骤S2包括:
步骤S201:建立动态模拟流程图:
步骤S202:建立特征分类格栅;
所述步骤S201:
以流程图的方式展示需要进行建模的指标以及数量或规模变量;
所述指标是比率,包括:次品率;
所述变量包括:次品数目,良品数目。
步骤S202:
格栅中对分类维度的选择有两个依据,包括:业务决策的需要、数据中可能对目标指标产生影响的其他变量;
所述其他变量包括:品种类、生产线、班组、工艺、材料、添加剂、公差以及环境 温度。
具体地,所述步骤S3包括:
步骤S301:建立初始表:
步骤S302:建立指标表现跟踪表:
步骤S303:数据采集、清洗和标准化;
所述初始表对应于特征分类格栅表,记录每个批次与格栅的对应,以及批次的生产 起始时间,计划产量或最终实际产量;
所述指标表现跟踪表记录每个批次在细分时间间隔上的表现;
所述步骤S303:
对流程图中所涉及的变量,原始字段需要从数据库或设备端获取;建模前进行数据 的清洗和标准化。
具体地,所述步骤S4:
所述配置文件指将流程图中的信息发送给软件平台;软件平台是通用动态模拟工具, 可以适配任何流程设计,而配置文件就是将通用动态模拟工具用于个性化流程图的媒介。
具体地,所述步骤S5:
对于流程图中的任何一个指标,用两种时间形式来表达,即:
rvi(otvi,t)(1)或者是rvi(otvi,avi)(2)
其中avi=t-otvi
表达式中使用r来表示目标指标,包括次品率;vi表示任何一个生产批次,即第i个批次;otvi用来标注这个批次的开始时间;
rvi(otvi,t)所显示的,是以日历时间t来计数时间的流逝,而rvi(otvi,avi)所显 示的,是以增龄avi来计数时间的流逝;
由于两个时间轴的转换对于任何既定的批次都是一对一的关系,即公式(2),即增龄(月份数)=日历时间-初始时间,所以公式(1)中的两个表述形式是等同的。
下面通过优选例,对本发明进行更为具体地说明。
优选例1:
A综述—对发明的总体定性描述
本专利所涉及的,是以产品制造数据为基础,以量化建模为基本手段的预测和 识别方法。本发明针对产品制造业事件数据的独特性,创立了针对随机离散序列变 量的运行监测、运行质量评估、因子(即触发或影响因素)识别与量化分析的独特方 法;
产品制造业中大数据应用,抽象来看,都是围绕模型行当中所称的“事件”进行的。“事件”的典型例子包括但不限于:次品的出现、设备状态异常、设备事故、 运维失当等一切负面情形;“因子”是指触发事件的直接原因,或者是影响因素;
基于上述对事件的定义,本发明将普适于产品制造业中的产品质量管理、设备 运维、运行状态异常预警和报警等各个主要层面。
模型在产品制造过程中的功能,均可以归结为预测和识别;因此,本发明涉及 的是高度通用性的建模方法。
本申请的核心是“事件预测及因子识别动态模拟模型”的独创性;换言之,本专 利的实质是发明了不同的建模手段。
B.模型的应用场景—即模型对于业务的意义
本部分介绍本发明在事件预测及因子识别中的应用场景;通过图1进行逐点说明:
1.产品生产的决策管理与控制层面
模型应用是为产品生产过程中的决策管理与控制职能服务的;作为举例,典型 的决策与控制在图1中按照大类列出;可见其涵盖范围是广泛的,而本发明可以应 用于图中所示的所有方面。
2.产品生产的决策内容举例
这些例子旨在帮助读者了解在产品生产环节中具体的决策与管理内容,并能举一反三,充分认识本专利应用的广泛性;
3.控制内容举例
要实现对生产环节的控制,就必须知道决策选项;如供应商清单是为了选择原 材料供给企业;设备运行温度区间将温度划分为比如[300-350],[350-400],…等 温度区间,作为设备设置中的选项。决策的目的是寻求各个选项的最优组合,从而 完善诸如良品率、单位人员产出和利润率等业绩指标;
4.模型体系
模型体系是实现上述优选的量化分析手段,目的是建立上述选项与业绩表现变量之间的数量关系。以次品率这一目标指标为例,建模的目的是看不同制造商生产 的设备、运行的温度区间等在控制内容举例中列出的各种选项是否能导致不同的次 品率。
好的模型可以充分区分不同因素和不同选项对业绩表现指标的影响,不好的模型或者没有区分能力,或者不能充分区分,或者不能得到切实可信的结果。
5.目标指标
目标指标是生产决策中所针对的业绩变量,以上的次品率只是作为例子,而可 以成为目标指标的清单是广泛的,如利润率、单产效率,等等。
C.产品制造业数据的特性—即在建模中遇到的技术挑战是什么
产品制造业数据的特征属性是可以明确归纳的,因而可以针对这些特有属性建立适用性更强,分辨率更高的模型。
本节是对产品制造业数据特征属性的总结和描述,包括离散性、随机性和序列性,从而形成了离散型随机序列数据。
对数据本质的认识是选取适配模型的前提,在没有适配模型的情况下,就需要 发明与创新。
对于产品制造业数据的特征,以质检数据为例的解释如下,其结论适用于任何“事件”:
·离散性—在生产和质检过程中,次品的浮现从性质上讲是非连续性的,即 次品与良品会交叉出现;
·随机性—次品的浮现没有既定的规律;但某种导致次品的原因可能会使次 品的出现显现某种模式,如次品率逐步攀升或次品连续出现;
·序列性—次品和良品按照生产中的时间顺序,或进入批检(查检机)的先后 顺序浮现。
对于以此界定的离散型随机序列数据,目前尚无能够充分满足业务需要的建模方式。进一步的说明如下。
D.现有的模型及其在应用于离散随机序列数据建模时的局限性(即为什么需要在建模手段上进行创新)
当前对于序列性数据的建模方式包括以下两个大类:
·回归模型:
回归模型做为一个模型大类,含有若干细分种类,如线性回归、非线性回归、逻 辑回归等等;所有回归方法均具有如下的共同属性,因而在应用于对离散随机序 列数据的建模时会受到同样的局限。
回归模型将某个时间间隔上的次品率做为被解释变量,将对次品率产生影响的因素(工业上称为质量因子)做为解释变量;以线性回归为例,在统计学上的表达式 为:
Yi=C+A1*X1i+A2*X2i+...+An*Xni+εi
上式中,Y为被解释变量,如本例中的次品率;X1、X2…Xn为解释变量,或称 质量因子,如原料供应商、设备运行中的某个参数,产品规格,…,等等。
Yi和(X1i、X2i…Xni)构成了建模中的一个样本;如果有M个样本,i将依 次为1,2,3,…,M.
在图2中,标注1显示的是对次品率的一个样本数值的计算,即在某个时段内次 品数目与产出数目的比率,即Yi。图中以星号*表示数字。
图3中的标注2显示的是同一个样本中对各个解释变量的取值,即图2中的次品 率发生在图3所示的各个状态维度的取值上,也即(X1i、X2i…Xni)。
Yi和(X1i、X2i…Xni)共同构成了一个建模样本。对于有M个样本的情形,上述 过程要重复进行M次。
被解释变量和解释变量之间的数量关系由回归算法完成,最终产生模型参 数,即(C,A1,A2...+An)的具体数值;建模就此完成。
传统回归方法在产品生产领域的局限性来自两个方面:
a.样本的获取须要靠对每个解释变量取值的严格控制来完成。具体说来,如 果有M个解释变量,那么每次需要固定其中的M-1个变量,而只让一个变 量变化。在产品生产中,这个操作的工作量是巨大的,因为要得到M个解 释变量所有可能取值的组合,数目通常会很大。图4中显示的是对于15个 解释变量(维度),而每个解释变量只有2个可能取值的情形,那么需要 的最小样本数目是32,768个。对其余列的解释同理。如此大规模的实验 室操作,是对产品生产进行回归建模的一个关键障碍。
b.回归模型的算法使得最终结果只会含有若干解释变量,即多数解释变量会 被各种检验标准排除在外,因而无法满足广泛的生产决策需要。
以上两点构成了回归这一常用模型在产品生产领域难以使用的关键瓶颈。
·神经网络模型:
神经网络属于深度机器学习的方法范畴,目前在产品生产领域的应用仍处在探索阶段,需要解决的主要问题是其结果在业务上的可解释性以及结论的稳定性。因 此,在前述两个基本问题被解决之前,神经网络模型尚不能成为实用的选项。
总之,对于制造业中的离散型随机序列数据,目前还没有最为适用的预测与因子识 别模型。本专利申请中呈现的“事件预测及因子识别动态模拟模型”旨在解决这一问题。
E.新建模型的实施步骤及其原理(与回归模型在本质上的不同点,以及如何 解决了问题回归模型的瓶颈制约)本节阐述建模中的实施步骤;在陈述中并以举例 的方式给出说明.
1、一种基于事件预测及因子识别的动态模拟建模方法,包括:
步骤S1:确立需要监测和评估的事件属性,以及相应的指标算式;
步骤S2:建立动态数字模拟流程图;
步骤S3:建立批次数据;
步骤S4:形成配置文件;
步骤S5:将批次数据和配置文件导入算法平台,进行运算,并生成模拟模型;
步骤S6:应用生成的模拟模型。
2、根据所述的基于事件预测及因子识别动态模拟的建模方法,所述步骤S1(确立需 要监测和评估的事件属性,以及相应的指标算式)包括:
步骤S101:确立监测、预测和进行因子分析所针对的事件:
场景示例:以质检机质检过程为例,事件即为次品的出现;
质检可分为(生产)线上质检和(生产)线下批检;两者所产生的数据将有不同的业务 解释和不同的应用场景;
对两类质检过程的定义如下:
线上质检:工件按照在生产中被完成的时间顺序进入质检机;质检机被用来实时识 别质差产品、质差类别,并对质差产品的数目以及良品的数目进行实时计数;最终的总产出数目=良品数目+次品数目;
线下批检:成批的已完成工件依次进入质检机,排序与生产顺序无关,并为非实时; 工件进入质检机后,质检机被用来实时识别质差产品、质差类别,并对质差产品的数目以及良品的数目进行实时计数;最终的总产出数目=良品数目+次品数目;
步骤S102:确立目标指标的计算公式;
针对次品率的指标和算式:
总体次品率=次品数目/总产出数目;
分类次品率=分类次品数目/总产出数目;
3、根据所述的基于事件预测及因子识别动态模拟的建模方法,其特征在于,所述步 骤S2(建立动态数字模拟流程图)包括:
步骤S201:建立动态模拟流程图:
传统的回归方法,每次只能对一个目标指标建模;本发明中的动态模拟方法可以对 任意数量的目标指标同时建模。
本步骤是以流程图的方式展示需要进行建模的指标,即图中没有虚线方框标记的各 个比率;以及数量或规模变量,即图中以虚线方框标识的变量。
在本申请中,为了明确起见,指标是比率,如次品率;变量代表如次品数目,良品数目等数值变量。
对于分析和建模中所针对的指标和变量,作为一个体系是以流程图的方式体现的, 例如在图5中包含了21个变量(虚线方框变量)和20个指标(比率)变量(无虚线方框变量)。
事件预测及因子识别动态模拟模型可以对流程图中的所有变量同时建模,进行历史 表现跟踪和未来预测。
步骤S202:建立特征分类格栅;
特征分类格栅是由各个分类维度(解释变量)构成的所有唯一组合;作为简单的例子,假设决策需要按照三个维度进行,即工件外形复杂程度、最大公差区间和原料种类; 同时每个维度分别只有两个可能的选项,于是就形成了图6所示特征分类格栅,含有八 个唯一组合:
格栅中对分类维度的选择有两个依据,包括:
·业务决策的需要
例如,寻求产品公差范围与次品率的关系;原料配方与次品率的关系,等等。
·数据中可能对目标指标产生影响的其他变量
许多因素的影响是仍未被感知的,尤其是例如对不同配方下最优炉温和烘烤时长的 设置等等,是需要依靠数据建模来发现的。
其他的特征分类变量包括但不限于产品种类、生产线、班组、工艺、材料、添加剂、公差、环境温度等等。事件预测及因子识别动态模拟模型,与回归模型不同,可以使用 任意数量的特征变量解释对目标指标的影响,从而可以为广泛的生产决策服务。
4、根据所述的基于事件预测及因子识别动态模拟的建模方法,其特征在于,所述步 骤S3(建立批次数据)包括:
步骤S301:建立初始表:
产品生产是按照批次进行的;无论是线上还是线下质检,也都是按照批次进行的。因此动态模拟技术对数据是按照批次进行组织的,一来体现对实际过程进行数字化模拟的真实性,二来模型将因此能够比较批次间的不同,并揭示造成批次之间差异的原因。
图7是初始表的结构,其功用是对应于特征分类格栅表,记录每个批次与格栅的对应,以及这个批次的生产起始时间,计划产量或最终实际产量。
步骤S302:建立指标表现跟踪表:
指标表现跟踪表记录每个批次在细分时间间隔上的表现,以次品率分析与建模为例, 图8中记录并汇总了每五分钟(本例)间隔的良品数目和次品数目,并由此可以计算出次品率这一目标指标。这个表对流程图上的所有变量按照每个批次进行,是完整的表现 记录。
步骤S303:数据采集、清洗和标准化;
对流程图中所涉及的变量,原始字段需要从数据库或设备端获取;数据的清洗和标 准化是建模前的必要准备;本步骤最终的产出是上述数据表。
5、根据所述的基于事件预测及因子识别动态模拟的建模方法,其特征在于,所述步 骤S4(形成配置文件)包括:
配置文件是将流程图中的信息“通知”给软件平台;软件平台是通用动态模拟工具, 可以适配任何流程设计,而配置文件就是将通用动态模拟工具用于个性化流程图的媒介。
6、根据所述的基于事件预测及因子识别动态模拟的建模方法,其特征在于,所述步 骤S5(将批次数据和配置文件导入算法平台,进行运算,并生成模拟模型)包括:
本部分展示动态模拟建模的核心算法,即从数学和统计的角度讲如何按照如下操作 实现建模:
·数据导入后,将每个批次分入各个格栅;
·对分入同一个格栅中所有批次,按照增齢时间书写历史轨迹方程,即从 rvi(otvi,t)转换为rvi(otvi,avi);
·使用每个格栅中按照增齢时间排布的所有批次数据,计算平均表现曲线;计 算的方式可以有多种,是算法中的重要细节选项;
·通过以上步骤,就得出了每个格栅所特有的平均表现曲线;这一曲线刻画了 格栅内所有批次的共性,为每个格栅所独有,因此构成了每个格栅的特性曲 线;
·通过以上步骤,同时得出了不同格栅的平均表现(特征)曲线的差异性;所有 格栅的特征曲线就构成了本发明的建模结果的基体;
·每个单机的初始表和特征曲线表上传到局域机后,可以在局域机上把机群做为一个整体,二次生成针对机群的初始表和格栅特征曲线表;这就是本发明 中可以根据单机模型进行二次建模的原理;
·从上述基础格栅出发,可以根据业务需要得到降维结果;如果基础格栅是由 三个维度决定的,那么按照一个维度和两个维度的特征曲线,是可以通过简 单的汇总计算得到的;
·为了去除生产运行中各种不期因素的影响,如故障、操作失误、停电等不可控或突发性因素对建模的影响,在算法中使用了一级分解过程;
·为了衡量上述不期因素、周期性因素和趋势性因素的影响,算法中加入了二 级分解过程;
·为了实现对历史轨迹的数字化模拟,以及对未来的预测,在算法中加入了模 型方程。
对于流程图中的任何一个指标,都可以用两种时间形式来表达其真实的历史轨迹, 即:
rvi(otvi,t)或者是rvi(otvi,avi)
公式E-1
其中avi=t-otvi
公式E-2
表达式中使用r来表示任一目标指标,如次品率;vi表示任何一个生产批次,即第i个批次;otvi用来标注这个批次的开始时间。
于是,rvi(otvi,t)所显示的,是以日历时间t来计数时间的流逝,而rvi(otvi,avi)所显示的,是以增龄avi来计数时间的流逝;r随着日历时间或增齢而变化,形成历史 轨迹。
由于日历和增齢这两个时间轴之间的转换对于任何一个批次都是一对一的关系(公 式E-2),即增龄=日历时间-初始时间,所以公式E-1中的两个表述形式是等同的。 在以下的数学过程中,将交叉使用这两种表达方式。
步骤S501:一级因素分解
用LC(a)来表示所有批次的平均增齢曲线,a为对增齢时间的计数。于是,对LC(a)曲线的首次逐点估计可以通过以下算式得到:
上式中,a是对增龄的计数,而avi是批次vi自身的月龄;N(a)为在月龄为a时 样本点的数目。
在进入对时间响应曲线的估计之前,需要引入多级滤波和逐级提纯的概念。上文中 多次提到了(对样本批次的平均增齢曲线的)初始估计,原因是最终曲线的形成,需要通过多级滤波和逐级提纯得到。
提纯机制的引入,是从批次平均增齢曲线的第二轮估算开始,用公式E-4代替公式E-3, 即:
本申请将暂不提供上式的算法指引。
使用类似于对批次平均增齢曲线的初始估计方法,即对所有批次拟合的误差曲线求 简单算术平均,就得到了平均拟合误差曲线,也就是初始的时间响应曲线,如公式E-5所示:
通过多级滤波和反复提纯,批次平均增齢曲线和时间响应因素在样本曲线族历史轨 迹形成中的独立影响,将被逐步剥离,从而纯化批次平均增齢曲线和时间响应曲线。
在得到了初始时间响应曲线(公式E-5)以后,如果从实际轨迹曲线rvi(otvi,t)中滤除初始轮时间响应曲线得到的就是将日历时间因素影响剔除后的轨迹曲线, 可命名为[rvi(otvi,t)]adj,即‘经调整的’的历史轨迹:
由于[rvi(otvi,t)]adj是在滤除了时间响应因素后得到的轨迹曲线,将其再次带入批 次平均增齢曲线的估计公式E-4,就对批次平均增齢曲线完成了一轮纯化;继而重复从 公式E-5到公式E-6的过程,得到的时间响应曲线也实现了一轮纯化,如此循环迭代。 每经过一个闭环,两条曲线就得到一轮纯化,直至运算结果符合数学中所说的收敛。
步骤S502:二级分解
本专利基于事件预测及因子识别动态模拟中,一级分解(即增龄时间和日历时间的 双时分解)后得出的时间响应曲线可以被进一步分解,其过程被称为二级分解。这个过程是从事政策分析和经济分析的必要步骤。
由于时间响应曲线是时间序列数据,两种常用的时间序列建模方式均可以用于二级 分解。第一种方法是使用综合性的回归和时间序列组合模型,例如ARIMAX或X13等。 这些回归分析在各类教学材料中有广泛说明,本书就不赘述了。
第一阶回归是从时间响应曲线中剥离出事件、季节波动曲线以及长期趋势曲线三个 因素;第二阶回归进一步将长期趋势曲线分解为可被宏观变量解释的部分以及残差部分。
二阶联立回归具有特定的结构,自成分析体系,其方程表达如下:
以此得到的时间响应曲线TR(t)被分解为如下影响因素:
步骤S503:对目标指标变量的预测方程
综上所述,就得到了对目标指标变量的预测方程:
7、根据所述的基于事件预测及因子识别动态模拟的建模方法,其特征在于,所述步 骤S6(应用生成的模拟模型)包括:
步骤S601:原理说明。
事件预测及因子识别动态模拟模型的原理与回归方法的本质性区别在于:
·回归模型将特征分类格栅表中的特征变量作为解释变量,其在应用中受到 的各种制约已有前述;本方法使用特征变量建立格栅构架,将所有批次分 入各个独立的格栅,然后对每个格栅分别刻画目标指标的特征轨迹,如图 9所示。
步骤S602:算法实施说明
·对于样本较小的情形,得到的结果会如图10所示,表明数据需要在时间 上进一步积累。
·随着批次数据的积累,会得到如图11所示的结果,即严谨地区分了不同 格栅中指标变量的自有特征,在本例中即累计次品率的高低。
·按照业务需要,上述结果可以降维显示。例如仅对图6中的最大公差区间 进行分析,即当允许的最大公差范围收紧或放宽时,次品率会有怎样的不 同。
·识别最佳、中等及须预警的格栅;如图11中的安全线和预警线将次品率 分为三个层级,通过这三个层级与图6中各个格栅的对应关系,即可识别 对应的特征变量组合,并从中找到规律。
总结起来,本发明的其他优势在于:
a.本发明连续实时积累历史批次数据,无需回归建模中所需的“实验室 操作”;通过在时间上的积累逐步填充在每个格栅中的批次数目,依 靠大数据进行智能建模;
b.本发明中使用累计曲线进行建模,因而是可以在汇总单机累计曲线的 基础上开展二次建模的;换言之,使用每个单机数据形成的模型, 可以实现多机联合建模,避免了大量单机基础数据的上传;
c.本发明可以对业务中所需的各个目标指标同时建模,避免了回归建模 对每个目标指标分别建模的繁冗;
d.本发明为AI技术的深入使用提供了基础;
e.本发明为正在形成趋势的边缘计算提供了基础,即所有建模在置于设 备边缘的单板机上进行。
综上所述,根据所述的基于事件预测及因子识别动态模拟的建模方法,其业务 应用范围包括但不仅限于:
·对设备运行状态的实时监测,并建立设备正常运行的标尺
·从事设备运行异常报警
·对设备运行参数的优化设置
·预测未来次品率
·识别导致质差的工序环节
·对导致质差的其他因素进行敏度分析,内容包括但不限于:材料层面、生产 线、班组、工艺、材料、添加剂、公差、环境温度、质检设备
·对设备运行状态的实时监测,并建立设备正常运行的标尺
·从事设备运行异常报警
·建立产品质量与设备运行状态及运行环境等因子之间的数量关系
·智能(预防性)维护
·对设备运行参数的优化设置
·对必要基层数据的上传
在本申请的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、 “竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示 的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装 置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的 限制。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、 装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系 统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以 被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件 内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以 是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上 述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改, 这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的 特征可以任意相互组合。
Claims (2)
1.一种事件预测及因子识别动态模拟模型建模方法,其特征在于,包括:
步骤 S1:确立需要监测和评估的事件属性,以及相应的指标算式;
步骤S2:建立动态数字模拟流程图;
步骤S3:建立批次数据;
步骤S4:形成配置文件;
步骤S5:将批次数据和配置文件导入算法平台,进行运算,并生成模拟模型;
步骤S6:应用生成的模拟模型;
所述步骤S5:
对于流程图中的任何一个指标,用两种时间形式来表达,即:
所述步骤 S1包括:
步骤S101:确立监测、预测和进行因子分析所针对的事件:
步骤S102:确立目标指标的计算公式;
所述监测、预测和进行因子分析所针对的事件包括:
质检机质检过程中次品的出现;
所述质检机质检包括:生产线上质检或生产线下批检;
所述生产线上质检:工件按照在生产中被完成的时间顺序进入质检机;质检机被用来实时识别质差产品、质差类别,并对质差产品的数目以及良品的数目进行实时计数;最终的总产出数目 = 良品数目 + 次品数目;
所述生产线下批检:成批的已完成工件依次进入质检机,排序与生产顺序无关,并为非实时;工件进入质检机后,质检机被用来实时识别质差产品、质差类别,并对质差产品的数目以及良品的数目进行实时计数;最终的总产出数目 = 良品数目 + 次品数目;
所述目标指标的计算公式包括针对次品率的指标和算式:
总体次品率 = 次品数目 / 最终的总产出数目;
分类次品率 = 分类次品数目 / 总产出数目;
所述步骤S2包括:
步骤S201:建立动态模拟流程图:
步骤S202:建立特征分类格栅;
所述步骤S201:
以流程图的方式展示需要进行建模的指标以及数量或规模变量;
所述指标是比率,包括:次品率;
所述变量包括:次品数目,良品数目;
步骤S202:
格栅中对分类维度的选择有两个依据,包括:业务决策的需要、数据中能对目标指标产生影响的其他变量;
所述其他变量包括:产品种类、生产线、班组、工艺、材料、添加剂、公差以及生产环境变量;
所述步骤S3包括:
步骤S301:建立初始表:
步骤S302:建立指标表现跟踪表:
步骤S303:数据采集、清洗和标准化;
所述初始表对应于特征分类格栅表,记录每个批次与格栅的对应,以及批次的生产起始时间,计划产量或最终实际产量;
所述指标表现跟踪表记录每个批次在细分时间间隔上的表现;
所述步骤S303:
对流程图中所涉及的变量,原始字段需要从数据库或设备端获取;建模前进行数据的清洗和标准化。
2.根据权利要求1所述的事件预测及因子识别动态模拟模型建模方法,其特征在于,所述步骤S4:
所述配置文件指将流程图中的信息发送给软件平台;软件平台是通用动态模拟工具,可以适配任何流程设计,而配置文件就是将通用动态模拟工具用于个性化流程图的媒介。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010779604.6A CN111950785B (zh) | 2020-08-05 | 2020-08-05 | 事件预测及因子识别动态模拟模型建模方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010779604.6A CN111950785B (zh) | 2020-08-05 | 2020-08-05 | 事件预测及因子识别动态模拟模型建模方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111950785A CN111950785A (zh) | 2020-11-17 |
CN111950785B true CN111950785B (zh) | 2021-09-28 |
Family
ID=73339567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010779604.6A Active CN111950785B (zh) | 2020-08-05 | 2020-08-05 | 事件预测及因子识别动态模拟模型建模方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111950785B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112785263A (zh) * | 2021-01-22 | 2021-05-11 | 山西青峰软件股份有限公司 | 一种工作流引擎动态生成流程模型的方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104700200B (zh) * | 2014-12-18 | 2018-03-16 | 西安交通大学 | 一种面向数字化车间的产品多元质量监控方法 |
US10394229B2 (en) * | 2017-09-27 | 2019-08-27 | International Business Machines Corporation | Orchestration of learning and execution of model predictive control tool for manufacturing processes |
CN109902931B (zh) * | 2019-01-28 | 2021-04-13 | 北京航空航天大学 | 一种基于运行数据融合的多态制造系统运行风险建模方法 |
CN110033201A (zh) * | 2019-04-22 | 2019-07-19 | 浙江中烟工业有限责任公司 | 一种烟草工业批次全过程数据质量评价和改进的方法和装置 |
CN110728437A (zh) * | 2019-09-26 | 2020-01-24 | 华南师范大学 | 一种开放数据的质量评估方法及系统 |
-
2020
- 2020-08-05 CN CN202010779604.6A patent/CN111950785B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111950785A (zh) | 2020-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108763729B (zh) | 基于网络结构熵的流程工业机电系统耦合状态评估方法 | |
Brundage et al. | Smart manufacturing through a framework for a knowledge-based diagnosis system | |
Oberoi et al. | SPC (statistical process control): a quality control technique for confirmation to ability of process | |
Aleš et al. | Methodology of overall equipment effectiveness calculation in the context of industry 4.0 environment | |
CN113469241A (zh) | 基于工艺网络模型与机器学习算法的产品质量控制方法 | |
Kozjek et al. | Data mining for fault diagnostics: A case for plastic injection molding | |
Ungermann et al. | Data analytics for manufacturing systems–a data-driven approach for process optimization | |
Villalonga et al. | Condition-based monitoring architecture for CNC machine tools based on global knowledge | |
CN117670378B (zh) | 一种基于大数据的食品安全监控方法及系统 | |
CN111950785B (zh) | 事件预测及因子识别动态模拟模型建模方法及系统 | |
DE102021201296A1 (de) | Vorhersagemodell zum Vorhersagen von Produktqualitätsparameterwerten | |
CN115630839A (zh) | 一种基于数据挖掘的生产智能反馈调控系统 | |
EP3844661A2 (en) | A method for building a model of a physical system | |
Azimpoor et al. | Joint inspection and product quality optimization for a system with delayed failure | |
CN117393076B (zh) | 耐热环氧树脂生产过程智能监测方法及系统 | |
Lee et al. | In-line predictive monitoring framework | |
RU2295590C1 (ru) | Способ статистического управления качеством электродной продукции | |
Dobra et al. | Overall Equipment Effectiveness-Related Assembly Pattern Catalogue based on Machine Learning | |
Andrijić et al. | Development of inferential models for fractionation reformate unit | |
CN116911469B (zh) | 一种数控机床加工时间预测方法 | |
KR102666880B1 (ko) | 인공지능이 적용된 조립 공정 통합 품질 관리 시스템 | |
EP3705964B1 (en) | A method for the scalable real-time state recognition of processes and/or sub-processes during production with electrically driven production plants | |
Koppel | A big data computational framework for enterprise level statistical process monitoring | |
CN116805037A (zh) | 一种基于数据分析的能源消耗预测方法和系统 | |
DOBRA et al. | A Novel Adaptive Model for Overall Equipment Effectiveness Prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |