CN111338302B - 基于工业大数据和工业物联网的化工工艺建模处理系统 - Google Patents

基于工业大数据和工业物联网的化工工艺建模处理系统 Download PDF

Info

Publication number
CN111338302B
CN111338302B CN202010127943.6A CN202010127943A CN111338302B CN 111338302 B CN111338302 B CN 111338302B CN 202010127943 A CN202010127943 A CN 202010127943A CN 111338302 B CN111338302 B CN 111338302B
Authority
CN
China
Prior art keywords
data
module
modeling
industrial
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010127943.6A
Other languages
English (en)
Other versions
CN111338302A (zh
Inventor
潘明
芮强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Rio Tinto Cloud Computing Technology Co ltd
Original Assignee
Hefei Rio Tinto Cloud Computing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Rio Tinto Cloud Computing Technology Co ltd filed Critical Hefei Rio Tinto Cloud Computing Technology Co ltd
Priority to CN202010127943.6A priority Critical patent/CN111338302B/zh
Publication of CN111338302A publication Critical patent/CN111338302A/zh
Application granted granted Critical
Publication of CN111338302B publication Critical patent/CN111338302B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/41865Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by job scheduling, process planning, material flow
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33273DCS distributed, decentralised controlsystem, multiprocessor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Manufacturing & Machinery (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Processing Of Solid Wastes (AREA)

Abstract

本发明涉及一种基于工业大数据和工业物联网的化工工艺建模处理系统,包括设置于化工厂区的数据采集单元,数据采集单元上设置数据统计模块;工业大数据处理单元,工业大数据处理单元包括数据分析模块,建模模块,报表模块;数据统计模块的数据传输至工业大数据处理单元的数据分析模块,数据分析模块对数据统计模块的数据通过绘制各项数据的时序曲线,统计各个数据分布情况,再通过数据散点图分析或者线性相关性分析供建模模块建模;建模模块包括数据清洗子模块和数据关联子模块,数据清洗子模块对不合理数据清洗和缺失值填充;工业大数据处理单元利用建模模块数据建模后进行算法建模。

Description

基于工业大数据和工业物联网的化工工艺建模处理系统
技术领域
本发明涉及智能工厂技术领域,具体涉及一种基于工业大数据和工业物联网的化工工艺建模处理系统。
背景技术
智能工厂是基于物联网技术与工业大数据的新型工厂。现在基于物联网技术与工业大数据的支撑,通过物联网产生、收集海量的数据存储于云平台,再通过利用云计算大数据分析并通过AI创作为新一轮工业的生产活动提供更好的服务,而现在对这三者的结合应用产生了工业大脑。
工业大脑的目标是把人工智能与大数据技术接入到传统的生产线中,帮助生产企业实现数据流、生产流与控制流的协同,提高生产效率,降低生产成本,以自主可控的路径实现自主可控的智能制造。其中,ET工业大脑(即阿里云ET工业大脑)让机器能够感知、传递和自我诊断问题,通过分析工业生产中收集的数据,优化机器的产出和减少废品成本。通过并不昂贵的传感器、智能算法和强大的计算能力,ET工业大脑的部署原理可以分为以下四个步骤:
1、数据采集:对企业系统数据、工厂设备数据、传感器数据、人员管理数据等多方工业企业数据进行采集。
2、数据预处理:包括过滤脏数据与噪音、解决数据的多源异构、找回丢失的数据以及修正错误的数据等。同时,还要根据用途,对数据进行分割、分解、分类,为下一步的算法建模做好准备。
3、算法建模:通过ET工业大脑AI创作间内置的算法引擎或算法市场提供的算法,对所收集并预处理完成的历史数据进行快速建模,该模型可以是描述模型、预测模型或优化模型。
4、模型应用:将已经建立的算法模型,发布成服务并集成到生产系统中,作用到业务,完成数据智能应用的闭环。
而为了实现化工智能制造大数据项目增量实时数据持续上云、以及满足可能存在的实时数据展示、实时数据计算以及部分数据复制分流等需求,需要构建一套高性能的数据上云的化工数据分析系统。即根据化工企业系统的信息规划及业务规划,结合大数据建设一个优化生产、管理和服务的化工工业基础及环境大数据平台。如位于化工企业系统拟建立起一个面向现有复合肥的生产、管理和服务的工业基础及环境大数据平台,以优化复合肥养分含量,并降低粉尘和氨气的排放,通过连接人和设备,加强数据洞察能力和促进数据驱动决策,构建快速业务响应能力,全面加速化工企业的数字化转型。通过数字化转型主要能够带来两方面的价值,1)优化复合肥生产过程,使养分等指标在满足行业标准的同时,降低其不确定性,从而达到降低物料成本的目的;2)通过优化工艺参数,降低排放,降低减排等措施对生产的影响,并且同时提高原料的利用率。具体的目标是复合肥生产工艺的参数优化,通过对历史数据进行分析建模,给出各环节工艺参数及物料量的优化建议。就复合肥产线来讲,环保优化的主要目标降低粉尘和氨气的排放,从而达到减排和减少物料成本的双重目的。
而构建一套数据上云的化工数据分析系统中最难攻克的问题就是建模环节。
发明内容
本发明目的是提供一种基于工业大数据和工业物联网的化工工艺建模处理系统,通过该建模处理系统建立一套数据上云的化工数据分析系统,从而优化生产、管理和服务的化工工业基础及环境。
为了实现以上目的,本发明采用的技术方案为:一种基于工业大数据和工业物联网的化工工艺建模处理系统,包括设置于化工厂区的数据采集单元,所述的数据采集单元上设置数据统计模块;工业大数据处理单元,所述的工业大数据处理单元包括数据分析模块,建模模块,报表模块;
所述的数据采集单元采集业务系统数据,所述的业务系统数据包括化工生产过程DCS数据和化工生产品类计划生产报表数据;所述的DCS数据包括化工生产中各个过程相应的参数,包括流量类数据、压力类数据、温度类数据、风量数据、电流数据、优化目标类数据,所述的优化目标类数据包括成品量、尾气含尘量、尾气含氨量数据,所述的DCS数据导出后对获取到的数据进行基本情况筛查,将不属于化工生产过程相应的参数范围的数据剔除,并将筛查后的数据传输至数据统计模块中;
数据统计模块的数据传输至工业大数据处理单元的数据分析模块,所述的数据分析模块对数据统计模块的数据通过绘制各项数据的时序曲线,统计各个数据分布情况,再通过数据散点图分析或者线性相关性分析供所述的建模模块建模;所述的建模模块包括数据清洗子模块和数据关联子模块,所述的数据清洗子模块对不合理数据清洗和缺失值填充;所述的工业大数据处理单元利用建模模块数据建模后进行算法建模;
所述的建模模块首先利用历史数据进行推荐算法模块建模;最后进行推荐算法实地验证并迭代。
进一步的,推荐算法模块建模的模型为时序预测模型或者取最优模型。
再进一步的,推荐算法实地验证的基本步骤:
1)、根据经验,结合决策树优化结果,挑选合理可控的工艺优化方案,形成优化规则进行实施;
2)、根据经验,选择较差样本的节点,识别出不良产品的工艺参数,形成规避规则进行实施;
3)、选择其中一条产线进行为期一周的实验;
4)、选择AB法交替实验,互为验证,选取综合最优。
再进一步的,所述的DCS数据包括管式反应系统、洗涤系统、造粒系统、干燥系统、冷却系统、成品量、尾气的数据。
再进一步的,绘制各项数据的时序曲线前通过时间序列及滑动平均分析步骤:对历史数据进行相关的统计分析,分析的数据包括管式反应系统,造粒系统、干燥系统、冷却系统及洗涤和排放系统。
进一步的,DCS数据导出后对获取到的数据进行基本情况筛查的步骤为:获取多段时间的DCS历史数据,针对DCS数据,数据通过行业软件导出成csv的格式来分析,再对获取到的数据进行基本情况筛查。
再进一步的,所述的算法模块建模包括粉尘和氨气排放预测:使用机器学习算法利用复合肥的管反数据、造粒系统数据、干燥系统数据及冷却和洗涤系统数据,建立排放预测模型。
再进一步的,模型的建立依赖历史数据,历史数据会根据时间段和产品做具体的归类和划分,算法数据经过关联与特征工程化后的数据,输出粉尘和氨气的排放预测,包括关键因素原理介绍和特征选择。
再进一步的,所述的关键因素原理介绍采用:
随机森林法:进行特征的重要性度量,选择重要性较高的特征;
或者最大信息系数(MIC)法:基本的重要特征量识别可计算参数与优化目标坚的线性相关和非线性相关性。
再进一步的,所述的特征选择:采用去掉取值变化小的特征法,或者Pearson相关系数法,或者最大信息系数(MIC)法,或者随机森林法。
本发明的技术效果在于:通过本发明建模处理系统建立一套数据上云的化工数据分析系统,从而优化生产、管理和服务的化工工业基础及环境。从而实现具体的应用:1)优化复合肥生产过程,使养分等指标在满足行业标准的同时,降低其不确定性,从而达到降低物料成本的目的;2)通过优化工艺参数,降低排放,降低减排等措施对生产的影响,并且同时提高原料的利用率。
附图说明
图1为数据上云的化工数据分析系统的结构简图;
图2为数据链路架构即实时上云数据架构结构图;
图3为数据链路流程图;
图4-图11为本发明具体实施应用在化工复合肥领域的附图,其中:
图4为现有的复合肥生产工艺;
图5为复合肥生产工艺的物料衡算图;
图6为实施例中2018年10月3日-13日时间段参数相关性分析图;
图7为实施例中2018年11月28日-12月20日时间段参数相关性分析图;
图8为参考时间段数据和粉尘相关性的参数图;
图9为最大信息系数分析(MIC)尾气含尘量图;
图10为主成份分析方差贡献率图;
图11为AB法的流程图。
具体实施方式
参照图1,其为本发明的数据上云的化工数据分析系统结构简图,包括接收并存储工业大数据信息的云服务平台10;设置于化工厂区的数据采集单元20,所述的数据采集单元20上设置数据统计模块21;工业大数据处理单元30,所述的工业大数据处理单元30包括监控预警模块31,产品品质控制模块32,数据分析模块33,建模模块34,报表模块35;所述的云服务平台10链接工业大数据处理单元30,所述的云服务平台10包括云上资源单元11和本地资源单元12,所述的本地资源单元12将化工内网数据传输至云上资源单元11的数采外网接口服务器,所述的云上资源单元11包括数据服务API网关模块、数据总线DataHub模块、大数据存储计算服务MaxCompute模块;所述的数据采集单元20采集业务系统数据,所述的业务系统数据包括化工生产过程DCS数据和化工生产品类计划生产报表数据;所述的DCS数据包括化工生产中各个过程相应的参数,包括流量类数据、压力类数据、温度类数据、风量数据、电流数据、优化目标类数据,所述的优化目标类数据包括成品量、尾气含尘量、尾气含氨量数据,所述的DCS数据导出后对获取到的数据进行基本情况筛查,将不属于化工生产过程相应的参数范围的数据剔除,并将筛查后的数据传输至数据统计模块21中;数据统计模块21的数据传输至工业大数据处理单元30的数据分析模块33,所述的数据分析模块33对数据统计模块21的数据通过绘制各项数据的时序曲线,统计各个数据分布情况,再通过数据散点图分析或者线性相关性分析供所述的建模模块34建模;所述的建模模块34包括数据清洗子模块和数据关联子模块,所述的数据清洗子模块对不合理数据清洗和缺失值填充;所述的工业大数据处理单元30利用建模模块34数据建模后进行算法建模。
参照附图,本发明基于大数据分析,主要实现了数据上云,数据清洗,数据挖掘,数据展示四大功能。本发明无缝对接StreamCompute实现数据实时传输和计算,并将计算结果实时推送至机器学习平台。实时数据上云链路主要是针对PLC/OPC这类实时性高的数据,业务系统数据[DCS(系统)数据、磷酸车间检验数据、磷石膏检验数据]都可以从此上云链路。其中,接收并存储工业大数据信息的云服务平台10包括云上资源单元11和本地资源单元12。云上资源单元11将所需的云上资源通过云服务平台10提供(如采用阿里云,在化工项目公共云账号开通相应资源即可),主要包含数据总线DataHub以及MaxCompute等存储云资源,数据服务API网关则用工业大脑数据工厂提供支持。本地资源单元12将数据上云在化工企业本地侧只需要部署一套支持http/https服务即可,具体的,此服务对接本地实时数采服务,数采服务通过调用云端数据服务API restful接口实现业务数据的实时上云。
所述的云上资源单元11包括:
数据服务API网关模块:数据服务API网关提供高可用、高并发的云上数据接收服务,本地数采服务通过实时调用此接口API完成实时DCS数据同步上云。
数据总线DataHub模块:数据总线DataHub对各种移动设备,应用软件,网站服务,传感器等产生的大量流式数据进行持续不断的采集,存储和处理。用户可以编写应用程序或者使用流计算引擎来处理写入到DataHub的流式数据比如实时web访问日志、应用日志、各种事件等,并产出各种实时的数据处理结果比如实时图表、报警信息、实时统计等。且优选的,将数据服务API网关中接收到的DCS系统数据(由数采服务推送)通过Datahub sdk推送到DataHub中,减少中转数据库压力的同时也可以降低数据上云的时延。
大数据存储计算服务MaxCompute模块:大数据计算服务(MaxCompute,原名ODPS)是一种快速、完全托管的GB/TB/PB级数据仓库,即MaxCompute提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决海量数据计算问题,有效降低企业成本,并保障数据安全。
下面结合复合肥化工企业进行实施说明:
参照N P K含量分析,其简要流程:1.化验中心,会给出原料的检测值;2.控制室会进行操作,确定化肥需要N含量多少,P含量多少,K含量多少。即通过数据具体推荐怎么做可以减少粉尘及氮排放,即控制室会进行控制一个批次的化肥需要N含量多少,P含量多少,K含量多少。具体的,通过本发明系统用大数据去计算,按目前的原料检测报告,之前几个小时的产品检测报告以及工厂各个点位的数据,来计算为了生产目标养分的产品,按照控制需要修改值,就可以生产出符合要求的化肥了。基于此,用大数据搜集所有的复合肥工厂的数据,最终确定相应数据,实现产品质量的稳定。比如要总养分是51的化肥,即N P K含量加一起是51%,多了就浪费成本,少了就不合格,那么首先必须要合格,也就是至少要总养分>51%,现有的是人工凭经验来操作,即各复合肥工厂的人工按照经验加料,这样就存在各厂生产复合肥的标准不一,而直接导致复合肥的质量有别,即整个复合肥行业所有的复合肥质量非常不稳定,总养分可能会到52%,或者53%,就整个行业的复合肥工厂而言产品不可控的同时还会浪费成本。通过本发明系统直接传输控制室按量生产,节约成本的同时相比现有的直接人工操作精确且稳定。
本发明系统在复合肥生产流程工艺中的应用实施例:
参照图4,现有的复合肥生产工艺,具体为S-硫磷铵装置带“三废”排放点的工艺流程:化工复合肥生产流程涉及到了以下几个主要工序,1)管式反应,主要是硫酸、磷酸和液氨的反应容器,硫酸和液氨反应生成硫酸铵,进入的氨量是酸完全被中和,生成硫酸铵,并且产生热量,产生的热量可以提高后续环境的生产温度,达到节能的效果,从而从能耗的维度降低成本;2)造粒系统:氨酸经管式反应器反应生成高温低湿料浆经喷嘴喷洒到到造粒系统造粒物料床层上,同时通过斗提机皮带系统加入各种养分物料及返料,同时往造粒系统加入液氨,蒸汽机空气,控制造粒的温度等,干湿物料在转鼓造粒机的转动下团聚成粒,造粒系统会有逃逸的氨气经过洗涤系统处理;3)干燥系统:造粒机出口物料输送到干燥系统,干燥系统通过天然气,加热空气,然后通过鼓风机将热空气送至干燥炉内干燥,此过程的会有较多粉尘产生,产生的粉尘被抽送到洗涤系统;4)冷却系统:经过干燥系统的物料进入冷却系统,进行冷却,冷却好的物料经过振动筛筛选颗粒大小符合标准的粒子,进行养分测测定,而粒径过大或者过小的不合格的产品会经斗提皮带送到造粒系统再次参与造粒反应,其中大粒径的产品会经振动筛震碎。
再参照图5,其为上述的工艺流程的关键参数图,即物料衡算图。给出此图是说明复合肥生产的造粒和干燥过程直接影响了粒子生成的比例,进而影响粉尘和氨气的排放,氨酸反应是否充分直接影响了液氨的利用率,从而影响氨气的排放。
采用本发明系统的处理过程:
由数据采集单元20采集数据来源:
从系统的角度出发,需要尽可能的从数据上反映出生产的所有过程,即来料情况,生产过程数据以及生产结果数据。获取到数据来源情况如下:
生产过程 生产品类计划
DCS数据 生产报表
下面是数据的一些基本信息,即化工复合肥生产过程主要参数如下:
Figure GDA0003886622590000091
Figure GDA0003886622590000101
上表列出了复合肥生产过程中的主要参数,生产工艺的各个过程都有相应的参数影响,主要分为以下几类:1)流量类数据,主要是酸、氨及洗涤液,例如磷酸量、硫酸量、液氨量及洗涤液,其中液氨是从兄弟单位直接接入,所以流量基本稳定,变化较小,还有天然气量,会影响干燥系统的效果;2)压力类数据,比如干燥机进口压力;3)温度类数据,主要包括干燥系统的进口温度、尾气温度,出口物料温度;4)风量数据,干燥系统和冷却系统,会影响尾气的排放;5)电流数据:主要是斗提机物料的电流和皮带秤电流,电流和物料的量有直接的关系;6)优化目标类,主要是成品量,尾气含尘量,尾气含氨量。上述参数又可以分为过程参数及原料量参数,原料主要包括硫酸、磷酸、液氨、不同的物料、返料、洗涤液;而过程控制参数主要包括对温度、风量等的控制。
获取多段时间的DCS(数据通讯系统采集数据)历史数据,针对DCS数据,数据通过行业软件导出成csv的格式来分析,这里对获取到的数据进行基本情况筛查。如用干燥机电流为指标来判断生产是否正常,通过分析,从分析曲线看出数据的正常范围,给出数据作为指标。实际上,目前把DCS的数据以5分钟的间隔导出,在实际的生产过程中,大部分参数是实时的采集,这里选择5分钟的间隔,一天的总数据记录为288条,能够观察到温度、压力类参数的高频的变化规律,也可以发现日变化的特征。
再由数据采集单元20上的数据统计模块21进行数据统计:
下面是2018年10月3日-13日数据统计表格:
Figure GDA0003886622590000111
Figure GDA0003886622590000121
上表为2018年10月3日-13日的数据,部分电流和调频数据没有,天然气流量数据缺失。其中总记录条数为2808条数据(根据行业专家的建议,扣除了前后不可靠的数据),时间跨度从2018年10月3-到10月13日。
同理,针对2018年11月28-12月30日期间数据,记录条数为4478条数据(根据行业专家的建议,扣除了前后不可靠的数据),时间跨度为2018年11月28-12月20日。
接下来,根据数据分析模块33对时间序列及滑动平均分析:
即对历史数据进行相关的统计分析,分析的数据包括管式反应系统,造粒系统、干燥系统、冷却系统及洗涤和排放系统。通过绘制各项数据的时序曲线,统计各个数据分布情况,反应出数据的概貌,为数据分析及预测建模做准备。
具体的,管式反应包括液氨数据:即相应时间段进管反液氨流量、进管反液氨压力、进管反液氨调节阀调节数据;硫酸数据:即相应时间段进管反硫酸流量、进管反硫酸压力;磷酸数据:即相应时间段进管反磷酸流量、进管反磷酸压力;洗涤液数据:即相应时间段进管反洗涤液流量、进管反洗涤液压力;
造粒系统包括物料称重数据:即相应时间段称重数据;造粒温度数据:即相应时间段造粒尾气温度;返料量电流数据:即相应时间段(L5303)皮带电流数据、(L5307)斗提电流数据、(L5308)斗提电流数据;风量数据:即相应时间段(C5201)风机电流数据。
干燥系统包括干燥机电流数据:即相应时间段干燥机电流;压力数据:即相应时间段干燥机进口压力;温度数据:即相应时间段干燥机进口温度、干燥机出口温度;天然气量数据:即相应时间段天然气流量。
冷却系统包括冷却系统的风机电流变化幅度:即相应时间段(C5303)风机电流数据。
成品量及污染排放包括成品量数据;排放数据:即相应时间段粉尘排放数据、氨气排放数据。
再根据上述数据通过途径一:
数据散点图分析:即相应时间段数据分析的散点图,由于本实施例散点图较复杂,本申请中就不附上,实际可以从中读出其中干燥机进口温度、干燥机出口物料温度和干燥机出口温度具有较强的相关性。
途径二:线性相关性分析
参照图6,其为2018年10月3-13日数据分析相关性热力图,这段时间的数据并没有反映出主要和排放的相关性,如前所述,这可能和观察的排放为洗涤后的结果,但洗涤系统对排放的影响起主导作用。
参照图7,其为2018年11月28-12月20日数据分析相关性热力图,这段时间的数据部分指标和排放有一定的相关性,该短数据的相关性大于0.3(中等程度的相关)。
参照图9,从MIC的分析来看,更多的变量和污染物的排放有较明显的相关性(线性+非线性),尤其是尾气含尘量的关联。但和氨排放相关的因子只有2个。
PI_5204 FI_5218
参数 管反压力 天然气流量
MIC 0.52 0.32
图10中看出40个参数中选取了8个,做主成分分析,可以看出这8个的对方差贡献为67.2%。但总体来看还有一些不确定的因素,有30%+的贡献来源于其它分散的要素,所以整个系统具有较强的非线性特征。
这里,申请人表示:本实施例中是两个时间段历史数据的分析。实际应用时经过更多个时间段分析,随着实时数据的接入,后续更多的数据引入分析模型,确保分析的全面和确定性。
上述分析后再由建模模块(34)数据建模,所述的建模模块(34)包括数据清洗子模块和数据关联子模块。
其中,数据清洗子模块的目的在于处理原始数据中存在的不合理数据,并按照规则对缺失的数据进行填充。数据清洗子模块对不合理数据清洗和缺失值填充。
其中,不合理数据主要是指错误数据以及异常数据,比如干燥机电流数据无效的情况下,其它参数的数据都是不用的,还有很短时间的氨酸反应不好造成的极少数点的值太高的数据。对于这种情况,将把相关的少数数据剔除掉,从而避免少数数据对数据总体分析的极端影响。而缺失值是值数据中存在的没有记录的空值数据。缺失值的存在导致了数据的不连贯性,对数据分析处理存在一定影响。缺失值填充的方式包括前向填充,后向填充,均值填充等方式。本实施例中,将会对连续缺失值不超过一定数量的控制,进行均值填充,填充的数量主要取决于缺失数的比例。
数据关联子模块是复合肥生产作为流程型生产过程,为了能够正确的还原排放产生的整个过程,需要把各个环节的数据做好关联,即做好管反过程、造粒系统、干燥系统、冷区系统和洗涤系统的关联,过程中包括来料数据,例如磷酸、硫酸、液氨、物料的数据,和过程数据,例如温度等数据间的关联。
复合肥生产过程中有多种物料的输入,还有返料(废料),物料包括尿素、磷酸一铵、氯化钾、硫酸钾、氯化铵、硫酸铵,和返料的量对最终的产品量有着至关重要的作用,而加入的氨酸反应及温度湿度的控制,会影响造粒的效果。从这个流程来看,管式反应器内液氨和硫酸发生中和反应,产生硫酸铵料浆并且放热,在造粒系中,温度会影响复合反应的速度,并且影响氨气的排放。干燥系统的主要是粉尘的排放,影响因素主要有温度及造粒的效果,如果造粒效果不好,粉末过多,明显会增加粉尘的排放。后续筛分与冷却系统也会影响粉尘的排放。
再进行算法模块建模:
包括粉尘和氨气排放预测:使用机器学习算法利用复合肥的管反数据、造粒系统数据、干燥系统数据及冷却和洗涤系统数据,建立排放预测模型。模型的建立主要依赖历史数据,历史数据会根据时间段和产品等做具体的归类和划分,算法数据经过关联与特征工程化后的数据,输出粉尘和氨气的排放预测。其包括:一、关键因素原理介绍:目前数据分析过程中特征选择方法中,其中随机森林是一种常用的方法,进行特征的重要性度量,选择重要性较高的特征。除了随机森林方法,基本的重要特征量识别可计算参数与优化目标坚的线性相关和非线性相关性,例如最大信息系数(MIC)。二、特征选择:好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重要作用。特征选择主要有两个功能:1.减少特征数量、降维,使模型泛化能力更强,减少过拟合;2.增强对特征和特征值之间的理解。
特征选择用可以用以下几种方法:
1.去掉取值变化小的特征
假设某特征的特征值只有0和1,并且在所有输入样本中,95%的实例的该特征取值都是1,那就可以认为这个特征作用不大。如果100%都是,那这个特征对模型的搭建没有任何价值。这种方法虽然简单但是不太好用。可以把它作为特征选择的预处理,先去掉那些取值变化小的特征,然后再从接下来提到的的特征选择方法中选择合适的进行进一步的特征选择。
2.Pearson相关系数Pearson Correlation
皮尔森相关系数是一种最简单的,能帮助理解特征和响应变量之间关系的方法,该方法衡量的是变量之间的线性相关性,结果的取值区间为[-1,1],-1表示完全的负相关(这个变量下降,那个就会上升),+1表示完全的正相关,0表示没有线性相关。这种方法也是我们前述的分析方法之一。
3.互信息和最大信息系数Mutual information and maximal informationcoefficient(MIC)。
4.随机森林
随机森林具有准确率高、鲁棒性好、易于使用等优点,这使得它成为了目前最流行的机器学习算法之一。
其生产工艺参数推荐:
在确定了关键因素后,将利用筛选出来的关键因素进一步进行工艺参数推荐。这里工艺参数推荐的建模是可采取决策树的方式进行,目标变量不变,输入变量则替换成关键因素识别出来的前N个特征,这里N是根据模型情况确定的值。
通过决策树的方式,可以寻找到在当前的来料情况下,满足一定的样本量要求的最优节点所在,从而确定出对应的工艺推荐参数。这里为了使推荐的参数具备一定的普适性,要求能覆盖至少15%以上的样本量。
其控制参数推荐:
为了能更好的执行推荐的工艺参数,需要各个岗位,尤其是中控室的操作人员能够准确把各个工艺指标调整到目标值范围内。但受限于操作人员的经验以及各变量的相互关联性,往往难以准确的调控目标工艺参数。
本实施例中将对不同的调控参数,建立控制优化模型。通过学习历史的控制变量与目标变量的关系,构建出控制模型。在应用控制的时候,输入当前工艺参数数值与目标工艺参数数值,给出推荐的控制参数设定值区间。
以下为时序预测模型或者取最优模型的算法:
1.预测模型:时序预测模型
Figure GDA0003886622590000173
Figure GDA0003886622590000171
2.优化模型:
Figure GDA0003886622590000172
此外,申请人表示:基于背景技术中给出的ET工业大脑的部署原理,化工工业可以通过以下步骤,在ET工业大脑控制台创建并应用到实际生产环境中:
1、准备云资源:在使用ET工业大脑前,添加用来存储数据的云资源,为数据接入做准备。
2、创建相应模块:在ET工业大脑控制台创建相应模块。如数据类型为时序数据,采用相应模块-时序数据。如数据类型为图像数据,相应模块-图像数据。
3、设置知识图谱单元:在知识图谱页面配置业务流程、数据字典和业务规则子模块。
4、设置数据链路单元:通过数据链路配置功能,完成从数据接入、数据预处理,到数据映射,再到算法的一系列配置。如数据类型为时序数据,配置数据链路-时序数据。如数据类型为图像数据,配置数据链路-图像数据。
5、设置数据接入单元:通过数据接入配置功能,将设备数据、数据库数据或本地文件数据接入到工业大脑平台中,实现数据上云。如数据类型为时序数据,配置数据接入。如数据类型为图像数据,上传图像。
6、设置数据预处理单元:通过数据预处理功能,对设备数据的缺失值进行填充。如数据类型为时序数据,配置数据预处理。如数据类型为图像数据,则不需要进行数据预处理。
7、设置数据映射单元:通过知识图谱单元数据映射功能,将设备数据与相应的设备属性进行关联,作为算法组件的输入源或输出源。如数据类型为时序数据,配置数据映射。如数据类型为图像数据,则不需要进行数据映射配置,但需要对图像进行标注,使用外部标注工具。
8、配置AI算法单元:配置算法组件的输入输出,实现模型训练和在线预测功能。如数据类型为时序数据,配置算法组件。如数据类型为图像数据,算法训练。
9、调用API:算法运行完成后,会生成相应的API,通过在配置API对应的serviceId,并下载SDK开发包,来调用对应的API。

Claims (7)

1.一种基于工业大数据和工业物联网的化工工艺建模处理系统,包括接收并存储工业大数据信息的云服务平台(10),所述的云服务平台(10)包括云上资源单元(11)和本地资源单元(12),所述的本地资源单元(12)将化工内网数据传输至云上资源单元(11)的数采外网接口服务器,所述的云上资源单元(11)包括数据服务API网关模块、数据总线DataHub模块、大数据存储计算服务MaxCompute模块;设置于化工厂区的数据采集单元(20),所述的数据采集单元(20)上设置数据统计模块(21);工业大数据处理单元(30),所述的工业大数据处理单元(30)包括数据分析模块(33),建模模块(34),报表模块(35);其特征在于:
所述的数据采集单元(20)采集业务系统数据,所述的业务系统数据包括化工生产过程DCS数据和化工生产品类计划生产报表数据;所述的DCS数据包括化工生产中各个过程相应的参数,包括流量类数据、压力类数据、温度类数据、风量数据、电流数据、优化目标类数据,所述的优化目标类数据包括成品量、尾气含尘量、尾气含氨量数据,所述的DCS数据导出后对获取到的数据进行基本情况筛查,将不属于化工生产过程相应的参数范围的数据剔除,并将筛查后的数据传输至数据统计模块(21)中;
数据统计模块(21)的数据传输至工业大数据处理单元(30)的数据分析模块(33),所述的数据分析模块(33)对数据统计模块(21)的数据通过绘制各项数据的时序曲线,统计各个数据分布情况,再通过数据散点图分析或者线性相关性分析供所述的建模模块(34)建模;所述的建模模块(34)包括数据清洗子模块和数据关联子模块,所述的数据清洗子模块对不合理数据清洗和缺失值填充;所述的工业大数据处理单元(30)利用建模模块(34)数据建模后进行算法建模;
所述的建模模块(34 )首先利用历史数据进行推荐算法模块建模;最后进行推荐算法实地验证并迭代;
推荐算法模块建模的模型为时序预测模型或者取最优模型;
推荐算法实地验证的基本步骤:
1)、根据经验,结合决策树优化结果,挑选合理可控的工艺优化方案,形成优化规则进行实施;
2)、根据经验,选择较差样本的节点,识别出不良产品的工艺参数,形成规避规则进行实施;
3)、选择其中一条产线进行为期一周的实验;
4)、选择AB法交替实验,互为验证,选取综合最优;
所述的算法模块建模包括粉尘和氨气排放预测:使用机器学习算法利用复合肥的管反数据、造粒系统数据、干燥系统数据及冷却和洗涤系统数据,建立排放预测模型。
2.根据权利要求1所述的基于工业大数据和工业物联网的化工工艺建模处理系统,其特征在于:所述的DCS数据包括管式反应系统、洗涤系统、造粒系统、干燥系统、冷却系统、成品量、尾气的数据。
3.根据权利要求2所述的基于工业大数据和工业物联网的化工工艺建模处理系统,其特征在于:绘制各项数据的时序曲线前通过时间序列及滑动平均分析步骤:对历史数据进行相关的统计分析,分析的数据包括管式反应系统,造粒系统、干燥系统、冷却系统及洗涤和排放系统。
4.根据权利要求1所述的基于工业大数据和工业物联网的化工工艺建模处理系统,其特征在于:DCS数据导出后对获取到的数据进行基本情况筛查的步骤为:获取多段时间的DCS历史数据,针对DCS数据,数据通过行业软件导出成csv的格式来分析,再对获取到的数据进行基本情况筛查。
5.根据权利要求1所述的基于工业大数据和工业物联网的化工工艺建模处理系统,其特征在于:模型的建立依赖历史数据,历史数据会根据时间段和产品做具体的归类和划分,算法数据经过关联与特征工程化后的数据,输出粉尘和氨气的排放预测,包括关键因素原理介绍和特征选择。
6.根据权利要求1所述的基于工业大数据和工业物联网的化工工艺建模处理系统,其特征在于:所述的关键因素原理介绍采用:
随机森林法:进行特征的重要性度量,选择重要性较高的特征;
或者最大信息系数(MIC)法:基本的重要特征量识别可计算参数与优化目标坚的线性相关和非线性相关性。
7.根据权利要求1所述的基于工业大数据和工业物联网的化工工艺建模处理系统,其特征在于:所述的特征选择:采用去掉取值变化小的特征法,或者Pearson相关系数法,或者最大信息系数(MIC)法,或者随机森林法。
CN202010127943.6A 2020-02-28 2020-02-28 基于工业大数据和工业物联网的化工工艺建模处理系统 Active CN111338302B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010127943.6A CN111338302B (zh) 2020-02-28 2020-02-28 基于工业大数据和工业物联网的化工工艺建模处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010127943.6A CN111338302B (zh) 2020-02-28 2020-02-28 基于工业大数据和工业物联网的化工工艺建模处理系统

Publications (2)

Publication Number Publication Date
CN111338302A CN111338302A (zh) 2020-06-26
CN111338302B true CN111338302B (zh) 2022-12-02

Family

ID=71183939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010127943.6A Active CN111338302B (zh) 2020-02-28 2020-02-28 基于工业大数据和工业物联网的化工工艺建模处理系统

Country Status (1)

Country Link
CN (1) CN111338302B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113673093B (zh) * 2021-08-04 2023-12-15 合肥力拓云计算科技有限公司 一种基于线性规划的工业智能的复合肥原料配比方法
CN113703506B (zh) * 2021-10-27 2021-12-31 南通朗迪机械科技有限公司 一种建筑材料生产车间环境控制调节方法及系统
CN114139839B (zh) * 2022-02-08 2022-05-17 希望知舟技术(深圳)有限公司 一种基于工况的机器学习方法及相关装置
CN114662698A (zh) * 2022-02-11 2022-06-24 南京英锐祺科技有限公司 工业互联网多模态机器学习数据处理方法
CN115689260B (zh) * 2023-01-05 2023-07-11 中国科学院合肥物质科学研究院 一种基于物联网的氨酸法复合肥造粒生产管理系统及方法
CN116661402B (zh) * 2023-07-27 2023-10-03 北京盛世利科技有限公司 一种化工材料的生产管控方法及系统
CN117236793B (zh) * 2023-11-10 2024-02-06 一夫科技股份有限公司 一种α型半水石膏性能测试方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101604418A (zh) * 2009-06-29 2009-12-16 浙江工业大学 基于量子粒子群算法的化工企业智能生产计划控制系统
CN103268069A (zh) * 2013-05-22 2013-08-28 常州大学 基于Hammerstein模型的自适应预测控制方法
CN104636600A (zh) * 2014-12-31 2015-05-20 中国石油化工股份有限公司中原油田普光分公司 基于极限学习机的高含硫天然气净化工艺建模、优化方法
JP2016189166A (ja) * 2015-03-30 2016-11-04 国立大学法人山口大学 化学プラントの制御装置及び操業支援方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880151B (zh) * 2012-10-11 2015-02-11 浙江大学 双层数据模型驱动的厂级化工过程监测方法
CN106951564A (zh) * 2017-04-02 2017-07-14 北京军秀咨询有限公司 一种基于数据挖掘和大数据分析的云计算平台及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101604418A (zh) * 2009-06-29 2009-12-16 浙江工业大学 基于量子粒子群算法的化工企业智能生产计划控制系统
CN103268069A (zh) * 2013-05-22 2013-08-28 常州大学 基于Hammerstein模型的自适应预测控制方法
CN104636600A (zh) * 2014-12-31 2015-05-20 中国石油化工股份有限公司中原油田普光分公司 基于极限学习机的高含硫天然气净化工艺建模、优化方法
JP2016189166A (ja) * 2015-03-30 2016-11-04 国立大学法人山口大学 化学プラントの制御装置及び操業支援方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于云点播生产平台的智能分析系统;杨继伟;《科技创新导报》;20151231(第34期);正文第1-4节 *

Also Published As

Publication number Publication date
CN111338302A (zh) 2020-06-26

Similar Documents

Publication Publication Date Title
CN111984692B (zh) 基于工业大数据的化工数据分析系统
CN111338302B (zh) 基于工业大数据和工业物联网的化工工艺建模处理系统
Tamás et al. PROCESS IMPROVEMENT TRENDS FOR MANUFACTURING SYSTEMS IN INDUSTRY 4.0.
CN114742294A (zh) 一种碳排放预测的神经网络算法
CN115860529A (zh) 基于工业互联网的供应链碳核算系统
CN106779259A (zh) 一种火电厂燃料全过程智能管理系统
Ungureanu et al. Industrial load forecasting using machine learning in the context of smart grid
CN116109089A (zh) 一种用于钢厂低碳转型的数字监控管理方法
CN107942873A (zh) 一种家具制造生产线的运营成本智能化核算及监控方法
CN114648216A (zh) 基于生命周期评价的餐厨垃圾处理效果的监测系统和方法
CN114253242A (zh) 一种基于vpn的物联网云端设备数据采集系统
CN117296538A (zh) 基于植被土壤成分检测的绿植维护方法、装置与系统
Tao et al. [Retracted] Optimization Analysis of Power Coal‐Blending Model and Its Control System Based on Intelligent Sensor Network and Genetic Algorithm
CN111222733A (zh) 一种工业智能决策系统及其工作方法
Laktionov et al. Computer-Oriented Model for Network Aggregation of Measurement Data in IoT Monitoring of Soil and Climatic Parameters of Agricultural Crop Production Enterprises.
CN103488089A (zh) 自适应的农药废液焚烧炉有害物排放达标控制系统及方法
CN114970348A (zh) 一种基于虚拟运营的燃煤电厂经营智能决策方法及系统
Liu et al. Time series forecasting fusion network model based on prophet and improved LSTM
Chuentawat et al. The forecast of PM10 pollutant by using a hybrid model
CN103558762B (zh) 基于图形化组态技术的免疫遗传pid控制器的实现方法
Boguhn Forecasting power consumption of manufacturing industries using neural networks
CN115222153B (zh) 一种火电企业低碳调度寻优方法及系统
CN107479479A (zh) 一种基于能量守恒的能源平衡网络监测系统
Andayani et al. Control Valve Discharge Prediction Using Multiple Linear Regression for Smart Precision Farming
CN117751742A (zh) 一种智慧园林水肥灌溉优化方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant