CN114692091A - 基于大数据资源的数据治理任务运行系统 - Google Patents

基于大数据资源的数据治理任务运行系统 Download PDF

Info

Publication number
CN114692091A
CN114692091A CN202210435896.0A CN202210435896A CN114692091A CN 114692091 A CN114692091 A CN 114692091A CN 202210435896 A CN202210435896 A CN 202210435896A CN 114692091 A CN114692091 A CN 114692091A
Authority
CN
China
Prior art keywords
data
abnormal
raw material
material supply
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210435896.0A
Other languages
English (en)
Other versions
CN114692091B (zh
Inventor
韩岭
蔡进
胥传龙
李明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Sixiang Software Co ltd
Original Assignee
Jiangsu Sixiang Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Sixiang Software Co ltd filed Critical Jiangsu Sixiang Software Co ltd
Priority to CN202210435896.0A priority Critical patent/CN114692091B/zh
Publication of CN114692091A publication Critical patent/CN114692091A/zh
Application granted granted Critical
Publication of CN114692091B publication Critical patent/CN114692091B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Game Theory and Decision Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Manufacturing & Machinery (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据处理领域,具体涉及基于大数据资源的数据治理任务运行系统,包括数据采集模块,用于采集原料供给数据,并得到原料供给指标;数据计算模块,基于所有原料供给指标的方差以及变化程度,计算评估指标;根据相邻两时刻的原料供给数据的差分值,确定各级出料变动序列,进而确定不同工艺节点对应的权重;根据各时刻的评估指标以及各工艺节点的权重,计算流水线各工艺节点的出料量变动异常程度评价值;数据提示模块,将各工艺节点的出料量变动异常程度评价值与设定阈值进行比较,确定各工艺节点的异常集合,并将所有工艺节点的异常集合进行时间同步处理,得到处理结果,并进行分级提示。即本发明的方案能够对流水线的数据进行治理、管理。

Description

基于大数据资源的数据治理任务运行系统
技术领域
本发明涉及数据处理领域,具体为基于大数据资源的数据治理任务运行系统。
背景技术
随着大数据技术和应用的发展,促使了传统制造业行业(如机加工、纺织等)需要将海量的业务数据向大数据平台迁移,在这个过程中,对数据进行转换、清洗的过程,称为数据治理。由于工业大数据增量快,重复性高,数据清洗容易疏忽的问题,导致数据治理的质量难以保证,后期工作难以进行下去。
目前,数据治理需要由专业的技术人员来进行数据清洗难以去重、映射等一系列的操作,效率不高且容易出错,不仅对技术人员的技术要求较高,而且对技术人员在业务层面的要求也非常高。
发明内容
为了解决上述技术问题,本发明的目的在于提供基于大数据资源的数据治理任务运行系统,所采用的技术方案具体如下:
本发明的基于大数据资源的数据治理任务运行系统,包括:
数据采集模块,用于采集流水线在设定时间内不同时刻的原料供给数据,得到不同时刻的原料供给指标;
数据计算模块,基于所有原料供给指标的方差以及变化程度,计算评估指标;
根据相邻两时刻的原料供给数据的差分值,确定流水线的不同工艺节点的各级出料变动序列,并利用非线性优化求解的方法,确定在流水线设定时间内的不同工艺节点对应的权重,进而得到每个工艺节点的权重;
根据各时刻的评估指标以及各工艺节点的权重,计算流水线各工艺节点的出料量变动异常程度评价值;
数据提示模块,用于将各工艺节点的出料量变动异常程度评价值与设定阈值进行比较,确定各工艺节点的异常集合,并将所有工艺节点的异常集合进行时间同步处理,得到处理结果,根据所述处理结果进行分级提示。
进一步地,还包括数据确认模块,用于构建流水线累计状态函数:Et=Min(4,Max(0,Et-1))+statet
其中,statet第t时间对应的流水线状态,
Figure BDA0003612890990000021
Et-1为第t-1时间段对应的流水线累计状态,gi为根据获取流水线出品的质量结果,对所述质量结果归一化后得到品质因子;
当所述累计状态大于设定状态值时,则出料量变动导致流水线发生异常。
进一步地,所述原材料供给数据为原材料数据与慢速更新原料供给指标的比值,其中慢速更新原料供给指标是设定时间窗口,对该时间窗口对应的原材料数据进行均值计算。
进一步地,获取处理结果的过程为:将各个工艺节点的异常集合内的数据的时间戳进行时间对齐,确定各异常集合的时间同步长度,确定在该段时间同步长度内的工艺节点的数量。
进一步地,所述分级提示为:
若在时间对齐的时间段内,存在工艺节点的异常集合的数量为1,则提示为一级异常;存在工艺节点的异常集合的数量为2,则提示为二级异常,以此类推,得到各个提示级别。
本发明的有益效果:
本发明提出了流水线工艺的各级异常数据治理方法,能够解析各级工艺出料量变动而导致的异常的结果,考虑到了原料供给异常对于结果的影响,并从实际的应用角度出发,设计流水线作业的出料量变动对于品质的影响判断方法,进而自动寻找异常的生产时间,从而在大量工业数据中对数据进行治理,且基于流水线运行情况持续治理其新产生的数据。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明的基于大数据资源的数据治理任务运行系统的结构框图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明的方案,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
具体地,请参阅图1所示,本发明提供的基于大数据资源的数据治理任务运行系统,包括:数据采集模块、数据计算模块、数据比较模块以及数据提示模块。
其中,数据采集模块,用于采集流水线在设定时间内不同时刻的原料供给数据,计算相邻两时刻的后一时刻原料供给数据与前一时刻原料供给数据的比值,将所述比值作为原料供给指标。
具体地,本实施例中,采集流水线在设定时间内不同时刻的原料供给数据Qsrc,计算相邻两时刻的后一时刻原料供给数据与前一时刻原料供给数据的比值。
其中,原料供给数据Qsrc是一段时间内真实的原料供给数量,可以以一个生产时间为单位进行记录。在流水线前端的原料供给数据Qsrc上进行连续时间的记录。
作为其他实施方式,还可以对原料供给数据Qsrc,做运行平均(MA)处理,其时间长度由实施者确定,得到慢速更新原料供给指标Q%A
基于慢速更新原料供给指标Q%A,与原始数据做自商处理,得到原料供给指标Q:
Figure BDA0003612890990000031
上述中,慢速更新原料供给指标Q%A能够呈现原料供给的趋势,且基于这个趋势有一定的“惯性”,即滞后性,由于慢速更新原料供给指标Q%A能够呈现多次记录供给量的变动,将变动小的现象分摊到多日,因此得到一种慢速更新指标,因此由于慢速更新指标能够呈现趋势,当自商后,原始数据相对于趋势数据有小幅变动的特征,且该特征在局部的若干个时间内受到慢速更新原料供给指标Q1的归一化处理。因此该指标能够体现相对的供给量变动。
上述中的记录流水线的原料供给指标Q,得到按照生产时间而计算得到的实时原料供给指Q={Q1,…,Qt},此处的Q为一段时间内的数据,起始和结束可以按照每日的开工、停工来处理,也可以按照一定时间周期来截取。
其中,数据计算模块,基于所有原料供给指标的方差以及变化程度,计算评估指标;
根据相邻两时刻的原料供给数据的差分值,确定流水线的不同工艺节点的各级出料变动序列,并利用非线性优化求解的方法,确定在流水线设定时间内的不同工艺节点对应的权重,进而得到每个工艺节点的权重;根据各时刻的评估指标以及各工艺节点的权重,计算流水线各工艺节点的出料量变动异常程度评价值。
其中,本实施例中的评估指标为:
Figure BDA0003612890990000032
其中,qt是第t个时间的基于原料供给指标的流水线异常程度评价,
Figure BDA0003612890990000041
是表明第t个时间的原料供给指标Q数据与相邻时间下的波动性,该值越大说明截止到第t时间的数据变化率越稳定,此时的是原料供给指标Q的变化是在一个可控的范围之内,即此时流水线此时正常运行。由于关注的是流水线的运行过程,对于其启动和结束过程的原料供给指标Q不做记录,因此假设所分析的运行的过程中,作业速率保持稳定。8ange(Q)-1表明在此截止到第t时间之内的流水线的原料供给指标Q变化的范围是否受限,也即在是否存在较大的原料供给指标Q变化,若Q变化较小即说明此时的流水线处于合理的变化的区间之内。
其中,X为计算Q%A的数量,也即是时间窗口的数量。
上述中的评估指标为用本发明可以较为的准确地把握实时原料供给指标Q的瞬时变化,又不会因为流水线长时间的原料供给指标Q变化而影响评价结果。至此,得到的基于原料供给指标Q的流水线异常程度评价序列{q1,…,qi}。
本实施例中,流水线在作业时,会伴随着流水线工艺误差,是由流水线的内在工序的随机因素导致的,在流水线的终点时,是由流水线的流水线制动导致的上级瑕疵没有被有效处理掉。
以六个工艺环节的流水线为例,在六个出料数据上分别整理其出料量,以监测流水线整体出料量变动情况。
在流水线前端,可以测得Qsrc差分值a。计算对应各工艺环节的出料量变动序列(从下到上的工艺排布),记录频率为每时间一次。
第一出料量差分得到
Figure BDA0003612890990000042
即第一工艺的出料量变动。
第二出料量差分得到
Figure BDA0003612890990000043
第三出料量差分得到
Figure BDA0003612890990000044
.........
第六出料量差分得到
Figure BDA0003612890990000045
出料量差分下的流水线出料量变动序列,进行流水线的工艺节点的出料量变动异常程度评价。
其中,非线性模型为:
Figure BDA0003612890990000046
Figure BDA0003612890990000047
其中
Figure BDA0003612890990000051
j为工艺节点的个数。
其中,损失函数loss=A*B,优化器为Adam,能够适应生产线中的数据的稀疏梯度问题。
其中
Figure BDA0003612890990000052
是在第t时间下的各个工艺节点的出料量变动值,a为Qsrc差分值,表达流水线整体的速率变动。
上述数据清洗模型的设计原理是:
各个工艺节点出料量变动的影响方向不同,对整体的影响不一致,列如当第一工艺节点品质异常时,则对整体的出料量变动存在决定性影响,其它工艺出料量也会随之变动。若瑕疵能够被解决,往流水线的末端其产生的影响越小,在末端发生的出料量变动异常,对流水线整体产生的影响较小。故会采用此种计算方法,由前端位置的工艺得到较大的出料量变动影响权重。
得到t时间下的各工艺节点的权重为
Figure BDA0003612890990000053
以此权重表达t时间各个工艺节点的出料量变动对整体出料量变动的影响大小。
基于得到的各个工艺节点对整体的出料量变动影响权重,得到流水线的工艺节点出料量变动异常程度评价。由于各个工艺的影响在流水线的运行中是同时增大和减小的,且由于各工艺权重加和为1,计算的结果在流水线的正常运转下,各工艺的权重在正常作业下保持几乎不变。
以第一工艺节点的出料量变动异常程度评价为例:
Figure BDA0003612890990000054
公式中,
Figure BDA0003612890990000055
为第t时间的第一工艺节点的出料量变动异常程度评价。该值越大,出料量变动异常存在的可能性越大。
其中,
Figure BDA0003612890990000056
为第一工艺节点的i时间的出料量变动与历史时期出料量变动的离散变化大小,离散程度越大,说明出料量变动的异常程度越大,可能出现后续工艺的异常。
在流水线的工作过程中,由于流水线的作业范围在变化,会导致各个工艺节点的影响,
Figure BDA0003612890990000057
为第一工艺节点在t时间的出料量变动与历史时期普遍值的差距大小,该值越大说明此时的出料量变动的相对与历史时期越特别,即异常程度越高。
其中,qi的参与是为了确保在第i时间的出料量变动与原料供给指标Q异常程度相关;得到各个时间的第一节点的出料量变动异常程度评价序列
Figure BDA0003612890990000061
i代表第i时间。以此类推得到的各个节点的出料量变动异常程度评价序列R1,…R6
其中,数据提示模块,用于将所述出料量变动异常程度评价值与设定阈值进行比较,确定异常集合,对异常集合中的数据进行时间同步处理,得到处理结果,并根据所述处理结果进行分级提示。
其中,所述分级提示为:若在同时间段内的工艺数量为1,则提示为一级异常;若在同时间段内的工艺数量为2,则提示为二级异常,以此类推,得到各个提示级别。
本实施例中,基于得到的各个节点的出料量变动异常程度序列,寻找出料量变动异常程度的情况:
由于工艺的出料量变动异常出现的原因较为复杂,因此基于无监督分类算法DBSCAN进行分类,从而联合对数据的分析。
首先,对于各个流水线出料量变动受到工艺异常程度进行分类,确定工艺异常程度的来源。利用DBSCAN算法进行工艺异常程度的密度聚类,对于工艺异常程度聚类,设定聚类的寻找半径为r,寻找半径r是通过具体的流水线最大产量决定的,最大产量越小,所需要的寻找半径越小。
其次,基于DBSCAN算法得到若干聚类类别,基于得到的具体聚类的类别,将未聚类的单个数据进行剔除。此步骤的目的是除掉个别瞬时原料供给指标Q过高的时间,此时间并不是流水线异常导致的,而是流水线供给出现延迟导致的。
设置出料量变动异常阈值,阈值的设定是为了确定各工艺节点异常程度极限,从而进一步确定的工艺异常的时间时。阈值以下的聚类为边缘聚类,对于聚类进行边缘聚类的寻找目的是确定工艺的异常的极限。
得到各个工艺节点的极限聚类内的异常集合U1,…,U6,确定了工艺出现异常出料量变动的时间时集合。
对于上述的异常聚类中的数据进行时间同步处理:
首先,对于各个工艺节点的极限聚类内的异常集合U1,…,U6进行时间同步的搜寻。
其次,由于工艺的出料量变动异常会影响整体的出料量变动评价,故需要在各个工艺节点的极限聚类内的异常集合U1,…,U6,确定时间的统一性。时间的统一性越高,说明此刻的流水线出现了工艺的异常可能性越高。
最后,基于各个聚类内的数据的时间戳进行对比,即找到各聚类内的时间同步长度,在该段时间内的出料量变动异常出现了时间上的持续性,出料量变动的幅度较大,且持续时间较长。故此刻为工艺的异常情况可能性更高。在该时间段内六个工艺同时出现异常,且出现异常的工艺越多,则工艺的瑕疵带来的出料量变动异常情况可能性更高。
进一步地,由于出料量变动异常的报警只是对于出料量变动来源于工艺的流水线异常得到的,同时缺乏数据的具体确定,即在实际应用中需要根据具体的环境为依据,可能会出现报警错误的情况,即出料量变动的异常评价达到了提示标准,但没有造成出品异常(不影响正常出品,该出料量变动异常不影响实际出品,可以接受),故需要追加精度异常评价,同时进行数据治理的数据自动标注,降低人工工作量;因此,还包括数据确认模块,用于构建流水线累计状态函数:
Et=Min(4,Max(0,Et-1))+statet
其中,statet第t时间段对应的流水线状态,
Figure BDA0003612890990000071
Et-1为第t-1时间段对应的流水线累计状态,gi为根据获取流水线出品的质量结果,对所述质量结果归一化后得到品质因子;
当所述累计状态大于设定状态值时,则出料量变动导致流水线发生明显异常,进行提醒;反之,不进行提醒。
具体地,当累计状态E大于设定状态值3时,意味着连续3时间的品控得分低于0.6,认为流水线的精度受震动影响出现误差较大的情况,说明此出料量变动导致流水线发生明显异常,因此自动将该段时间数据自动标记为异常,从而更好地基于时间位置来对其余的数据进行管理治理,例如:1)生成时间报表;2)研究异常时间段的分布;3)优化生产线流程。
当累计状态E小于设定状态值3时,连续3至4时间的品控得分均高于0.6,流水线的精度受瑕疵影响出现误差较小的情况,此时不标记为异常。
至此,在一段时间内能够自动标注该段时间的异常等级。
上述实施例中的品质因子是指工艺结束后的品控打分结果,对结果进行归一化处理,使其区间位于[0,1],例如百分制的品控打分结果被除以100,缩放至[0,1],得到品质因子数据G={g1,…,gi},其采样频率为每时间一次。
因此,本发明提出了流水线工艺的各级异常数据治理方法,能够解析各级工艺出料量变动而导致的异常的结果,考虑到了原料供给异常对于结果的影响,并从实际的应用角度出发,设计流水线作业的出料量变动对于品质的影响判断方法,进而自动寻找异常的生产时间,从而在大量工业数据中对数据进行治理,且基于流水线运行情况持续治理其新产生的数据。
首先完成步骤一中的对流水线在实验工作中的数据采集,以及对应的计算过程,得到各个工艺节点的异常程度评价序列,并对异常程度的评价序列进行报警等级划分;实对实际的生产需要对提示等级进行生产时间的定位。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (5)

1.基于大数据资源的数据治理任务运行系统,其特征在于,包括:
数据采集模块,用于采集流水线在设定时间内不同时刻的原料供给数据,得到不同时刻的原料供给指标;
数据计算模块,基于所有原料供给指标的方差以及变化程度,计算评估指标;
根据相邻两时刻的原料供给数据的差分值,确定流水线的不同工艺节点的各级出料变动序列,并利用非线性优化求解的方法,确定在流水线设定时间内的不同工艺节点对应的权重,进而得到每个工艺节点的权重;
根据各时刻的评估指标以及各工艺节点的权重,计算流水线各工艺节点的出料量变动异常程度评价值;
数据提示模块,用于将各工艺节点的出料量变动异常程度评价值与设定阈值进行比较,确定各工艺节点的异常集合,并将所有工艺节点的异常集合进行时间同步处理,得到处理结果,根据所述处理结果进行分级提示。
2.根据权利要求1所述的基于大数据资源的数据治理任务运行系统,其特征在于,还包括数据确认模块,用于构建流水线累计状态函数:Et=Min(4,Max(0,Et-1))+statet
其中,statet第t时间对应的流水线状态,
Figure FDA0003612890980000011
Et-1为第t-1时间段对应的流水线累计状态,gi为根据获取流水线出品的质量结果,对所述质量结果归一化后得到品质因子;
当所述累计状态大于设定状态值时,则出料量变动导致流水线发生异常。
3.根据权利要求1所述的基于大数据资源的数据治理任务运行系统,其特征在于,
所述原材料供给数据为原材料数据与慢速更新原料供给指标的比值,其中慢速更新原料供给指标是设定时间窗口,对该时间窗口对应的原材料数据进行均值计算。
4.根据权利要求1所述的基于大数据资源的数据治理任务运行系统,其特征在于,获取处理结果的过程为:将各个工艺节点的异常集合内的数据的时间戳进行时间对齐,确定各异常集合的时间同步长度,确定在该段时间同步长度内的工艺节点的数量。
5.根据权利要求4所述的基于大数据资源的数据治理任务运行系统,其特征在于,所述分级提示为:
若在时间对齐的时间段内,存在工艺节点的异常集合的数量为1,则提示为一级异常;存在工艺节点的异常集合的数量为2,则提示为二级异常,以此类推,得到各个提示级别。
CN202210435896.0A 2022-04-24 2022-04-24 基于大数据资源的数据治理任务运行系统 Active CN114692091B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210435896.0A CN114692091B (zh) 2022-04-24 2022-04-24 基于大数据资源的数据治理任务运行系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210435896.0A CN114692091B (zh) 2022-04-24 2022-04-24 基于大数据资源的数据治理任务运行系统

Publications (2)

Publication Number Publication Date
CN114692091A true CN114692091A (zh) 2022-07-01
CN114692091B CN114692091B (zh) 2022-12-16

Family

ID=82144794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210435896.0A Active CN114692091B (zh) 2022-04-24 2022-04-24 基于大数据资源的数据治理任务运行系统

Country Status (1)

Country Link
CN (1) CN114692091B (zh)

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007107979A2 (en) * 2006-03-20 2007-09-27 Technion Research & Development Foundation Ltd. A geometric approach to monitoring threshold functions over distributed data streams
CN102116773A (zh) * 2010-01-06 2011-07-06 北京化工大学 一种乙烯工业能效指标提取分析方法
KR20140009853A (ko) * 2012-07-13 2014-01-23 고려대학교 산학협력단 수질 관리 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체
CN103580028A (zh) * 2013-11-13 2014-02-12 丽水职业技术学院 一种基于物联网技术的动态电压恢复系统
CN103632234A (zh) * 2013-12-05 2014-03-12 中国海洋石油总公司 一种网络型lng产业链综合预测调度方法
CN108510147A (zh) * 2018-01-23 2018-09-07 浙江工业大学 一种基于残差波动模型的电能质量综合评价方法
CN108627340A (zh) * 2018-03-27 2018-10-09 扬州美达灌装机械有限公司 一种灌装生产线滚子轴承故障预测方法
CN109712905A (zh) * 2018-12-29 2019-05-03 苏州阿特斯阳光电力科技有限公司 太阳能电池片的双面率异常分析方法
CN110373510A (zh) * 2019-07-16 2019-10-25 中南大学 一种基于双模态切换的钢水质量窄窗口控制方法及系统
CN110909912A (zh) * 2019-10-08 2020-03-24 西安交通大学 基于自适应误差反馈的园区电力系统净负荷组合预测方法
CN111708332A (zh) * 2020-05-28 2020-09-25 上海航天精密机械研究所 一种生产线数字孪生系统
CN112288295A (zh) * 2020-11-03 2021-01-29 北京国电龙源环保工程有限公司 一种基于在线的脱硫子系统评价装置及其应用方法
CN112499067A (zh) * 2020-11-11 2021-03-16 温州忆初科技有限公司 一种基于智慧环卫云平台的智能收集箱体
CN112529449A (zh) * 2020-12-20 2021-03-19 大唐互联科技(武汉)有限公司 一种基于大数据的供应商质量评价方法及系统
CN113536046A (zh) * 2021-06-25 2021-10-22 浙江中控技术股份有限公司 供应链计划服务优化方法、系统、电子设备及存储介质
CN113570254A (zh) * 2021-07-30 2021-10-29 江苏西格数据科技有限公司 一种工业数据质量分析方法
CN113765921A (zh) * 2021-09-08 2021-12-07 沈阳理工大学 一种面向工业物联网的异常流量分级检测方法

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007107979A2 (en) * 2006-03-20 2007-09-27 Technion Research & Development Foundation Ltd. A geometric approach to monitoring threshold functions over distributed data streams
CN102116773A (zh) * 2010-01-06 2011-07-06 北京化工大学 一种乙烯工业能效指标提取分析方法
KR20140009853A (ko) * 2012-07-13 2014-01-23 고려대학교 산학협력단 수질 관리 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체
CN103580028A (zh) * 2013-11-13 2014-02-12 丽水职业技术学院 一种基于物联网技术的动态电压恢复系统
CN103632234A (zh) * 2013-12-05 2014-03-12 中国海洋石油总公司 一种网络型lng产业链综合预测调度方法
CN108510147A (zh) * 2018-01-23 2018-09-07 浙江工业大学 一种基于残差波动模型的电能质量综合评价方法
CN108627340A (zh) * 2018-03-27 2018-10-09 扬州美达灌装机械有限公司 一种灌装生产线滚子轴承故障预测方法
CN109712905A (zh) * 2018-12-29 2019-05-03 苏州阿特斯阳光电力科技有限公司 太阳能电池片的双面率异常分析方法
CN110373510A (zh) * 2019-07-16 2019-10-25 中南大学 一种基于双模态切换的钢水质量窄窗口控制方法及系统
CN110909912A (zh) * 2019-10-08 2020-03-24 西安交通大学 基于自适应误差反馈的园区电力系统净负荷组合预测方法
CN111708332A (zh) * 2020-05-28 2020-09-25 上海航天精密机械研究所 一种生产线数字孪生系统
CN112288295A (zh) * 2020-11-03 2021-01-29 北京国电龙源环保工程有限公司 一种基于在线的脱硫子系统评价装置及其应用方法
CN112499067A (zh) * 2020-11-11 2021-03-16 温州忆初科技有限公司 一种基于智慧环卫云平台的智能收集箱体
CN112529449A (zh) * 2020-12-20 2021-03-19 大唐互联科技(武汉)有限公司 一种基于大数据的供应商质量评价方法及系统
CN113536046A (zh) * 2021-06-25 2021-10-22 浙江中控技术股份有限公司 供应链计划服务优化方法、系统、电子设备及存储介质
CN113570254A (zh) * 2021-07-30 2021-10-29 江苏西格数据科技有限公司 一种工业数据质量分析方法
CN113765921A (zh) * 2021-09-08 2021-12-07 沈阳理工大学 一种面向工业物联网的异常流量分级检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
COHEN GUY 等: "A linear-system-theoretic view of discrete-event processes and its use for performance evaluation in manufacturing", 《IEEE TRANSACTIONS ON AUTOMATIC CONTROL》 *
LEKMANEE PATTAMON 等: "A Limitation of On-line Partial Discharge Measurement in a Petrochemical Plant", 《2020 8TH INTERNATIONAL CONFERENCE ON CONDITION MONITORING AND DIAGNOSIS (CMD)》 *
唐光波: "精轧机异常工况检测系统设计与实现", 《中国优秀硕士学位论文全文数据库工程科技Ⅰ辑》 *
张海峰: "基于Petri网的FMS物流系统建模及仿真", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》 *

Also Published As

Publication number Publication date
CN114692091B (zh) 2022-12-16

Similar Documents

Publication Publication Date Title
CN108197845B (zh) 一种基于深度学习模型lstm的交易指标异常的监测方法
CN117035513A (zh) 一种智慧工业园区能源运行智能监测管理系统及方法
CN114819628B (zh) 一种可视化工程监理系统
CN116028887B (zh) 一种连续性工业生产数据的分析方法
US20240061409A1 (en) Part, sensor, and metrology data integration
CN117951128A (zh) 一种基于人工智能的数据质量稽查方法
CN113609770A (zh) 基于分段线性拟合hi及lstm的滚动轴承rul预测方法
CN114692091B (zh) 基于大数据资源的数据治理任务运行系统
CN110781206A (zh) 一种学习拆回表故障特征规则预测在运电能表是否故障的方法
CN113919204A (zh) 一种多状态制造系统可用性综合重要度分析方法
CN109829115B (zh) 搜索引擎关键词优化方法
CN112560348A (zh) 一种基于集成学习的光纤生产中的断纤预警方法
CN117290405A (zh) 一种大规模设备数据快速查询的物联网系统
CN116910579A (zh) 一种基于迁移学习的变工况机械加工颤振监测方法
CN116108358A (zh) 一种设备监测阈值确定方法、装置、设备及存储介质
CN115511159A (zh) 一种基于贝叶斯神经网络的快速路事件检测方法和装置
CN117708622B (zh) 运维系统的异常指标分析方法、系统和电子装置
CN114252794A (zh) 一种拆回智能电能表剩余寿命预测方法及装置
CN113377630A (zh) 一种通用的kpi异常检测框架实现方法
CN117971818B (zh) 一种基于大数据的数据治理任务运行方法
CN113158552B (zh) 基于时间序列的生物反应器运行状况分级预测方法及系统
TWI821666B (zh) 服務管理系統及服務資訊流程的調適方法
CN118690908A (zh) 一种基于异构图注意力网络的供应链风险预测方法及系统
WO2021157666A1 (ja) 制御装置、制御方法及びプログラム
CN115221789A (zh) 一种基于数据分类的滑动窗口法在线更新熔融指数预测模型系数的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant