CN113722403A - 异常运行数据的聚类方法、装置、存储介质及处理器 - Google Patents

异常运行数据的聚类方法、装置、存储介质及处理器 Download PDF

Info

Publication number
CN113722403A
CN113722403A CN202010451649.0A CN202010451649A CN113722403A CN 113722403 A CN113722403 A CN 113722403A CN 202010451649 A CN202010451649 A CN 202010451649A CN 113722403 A CN113722403 A CN 113722403A
Authority
CN
China
Prior art keywords
fluctuation
operating
parameter
data
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010451649.0A
Other languages
English (en)
Inventor
韩华伟
王春利
高新江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chemical Registration Center Of Emergency Management Department
China Petroleum and Chemical Corp
Sinopec Qingdao Safety Engineering Institute
Original Assignee
Chemical Registration Center Of Emergency Management Department
China Petroleum and Chemical Corp
Sinopec Qingdao Safety Engineering Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chemical Registration Center Of Emergency Management Department, China Petroleum and Chemical Corp, Sinopec Qingdao Safety Engineering Institute filed Critical Chemical Registration Center Of Emergency Management Department
Priority to CN202010451649.0A priority Critical patent/CN113722403A/zh
Publication of CN113722403A publication Critical patent/CN113722403A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明实施例提供一种异常运行数据的聚类方法、装置、存储介质及处理器,属于化工技术领域。该方法包括:确定第一时间段内多个运行参数中每个运行参数的运行数据的至少一个波动时刻;根据所述每个运行参数的运行数据的至少一个波动时刻,确定所述多个运行参数中任意两个运行参数的波动关联性;将所述多个运行参数中具有波动关联性的运行参数连接以形成关系网络;根据所述关系网络,基于快速模块度优化算法,对所述每个运行参数的运行数据进行聚类。本发明可以不依赖专家知识和工艺流程信息对数据自动化划分,提高了监控系统信息的有效性和准确性。

Description

异常运行数据的聚类方法、装置、存储介质及处理器
技术领域
本发明涉及化工技术领域,具体地涉及一种异常运行数据的聚类方法、装置、存储介质及处理器。
背景技术
化工系统是由各种基本单元(设备、装置、系统等)通过各种管道和电线连接在一起,基本单元之间的相互作用关系构成复杂网络系统,实现物质、能量、信号的交换与传递。
通常化工装置规模较大,区分为多个工段,每个工段涉及到的监控位点有数十个甚至上百个,从DCS中采集的数据每秒中有数百个,短短几天的数据量就高达上百兆,对如此巨量的数据进行无差别分析为异常状况的分析带来了障碍。而利用专家知识或数据统计特性对数据进行聚类和划分是异常状况分析中的首要环节。
针对化工装置的海量运行数据,如何有效合理的将其数据进行分类,从而进一步针对局部异常进行关联性分析,是化工装置安全运行监控系统中的重要一环。现有化工装置的安全运行监控系统中,对整体装置运行数据的划分主要依据装置物料流程的区分,这种基于工艺流程的划分方法主要依赖工艺人员的专业知识,不具有普遍性;并且该方法机械的分割了数据,忽视不同工段之间局部关联性,准确性较低。
发明内容
本发明的目的是提供一种异常运行数据的聚类方法、装置、存储介质及处理器,该异常运行数据的聚类方法、装置、存储介质及处理器可以不依赖专家知识和工艺流程信息对数据自动化划分,提高了监控系统信息的有效性和准确性。
为了实现上述目的,本发明提供一种化工装置异常运行数据的聚类方法,该方法包括:确定第一时间段内多个运行参数中每个运行参数的运行数据的至少一个波动时刻;根据所述每个运行参数的运行数据的至少一个波动时刻,确定所述多个运行参数中任意两个运行参数的波动关联性;将所述多个运行参数中具有波动关联性的运行参数连接以形成关系网络;根据所述关系网络,基于快速模块度优化算法,对所述每个运行参数的运行数据进行聚类。
优选地,所述确定第一时间段内多个运行参数中每个运行参数的运行数据的至少一个波动时刻包括:确定第一时间段内所述每个运行参数的运行数据的标准差和均值;针对每个运行参数,确定大于所述均值与预设倍数的标准差之和的运行数据的运行时刻作为所述至少一个波动时刻。
优选地,所述根据所述每个运行参数的至少一个波动时刻,确定所述多个运行参数中任意两个运行参数的波动关联性包括:根据所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数以及所述第二运行参数的波动时刻的数量,得到隶属度;根据所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和以及所述第一运行参数的波动时刻的数量,得到置信度;根据所述隶属度和所述置信度判断所述波动关联性。
优选地,所述根据所述隶属度和所述置信度判断所述波动关联性还包括:在所述置信度大于置信度阈值且所述隶属度大于隶属度阈值时,确定所述第二运行参数和所述第一运行参数具有波动关联性;在所述置信度小于等于置信度阈值和/或所述隶属度小于等于隶属度阈值时,确定所述第二运行参数和所述第一运行参数不具有波动关联性。
优选地,所述根据所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数以及所述第二运行参数的波动时刻的数量,得到隶属度包括:使用所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数除以所述第二运行参数的波动时刻的数量以得到隶属度。
优选地,所述根据所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和以及所述第一运行参数的波动时刻的数量,得到置信度包括:使用所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和除以所述第一运行参数的波动时刻的数量以得到置信度。
优选地,快速模块度优化算法中的模块度通过以下公式计算:
Figure BDA0002507790750000031
其中m为所述关系网络中的总连接数,Aij表示运行参数i和j之间是否有连接,如果有连接则Aij=1,如果没有连接则Aij=0,ki和kj为运行参数i和j的连接数,Ci和Cj为运行参数i和j所属的社区,当Ci=Cj时δ(Ci,Cj)为1,否则δ(Ci,Cj)为0。
本发明还提供一种化工装置异常运行数据的聚类装置,该装置包括:波动时刻确定单元、波动关联性确定单元、波动路径确定单元以及聚类单元,其中,所述波动时刻确定单元用于确定第一时间段内多个运行参数中每个运行参数的运行数据的至少一个波动时刻;所述波动关联性确定单元用于根据所述每个运行参数的运行数据的至少一个波动时刻,确定所述多个运行参数中任意两个运行参数的波动关联性;所述波动路径确定单元用于将所述多个运行参数中具有波动关联性的运行参数连接以形成关系网络;所述聚类单元用于根据所述关系网络,基于快速模块度优化算法,对所述每个运行参数的运行数据进行聚类。
优选地,所述波动时刻确定单元还用于:确定第一时间段内所述每个运行参数的运行数据的标准差和均值;针对每个运行参数,确定大于所述均值与预设倍数的标准差之和的运行数据的运行时刻作为所述至少一个波动时刻。
优选地,所述波动关联性确定单元还用于:根据所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数以及所述第二运行参数的波动时刻的数量,得到隶属度;根据所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和以及所述第一运行参数的波动时刻的数量,得到置信度;根据所述隶属度和所述置信度判断所述波动关联性。
优选地,所述波动关联性确定单元还用于:在所述置信度大于置信度阈值且所述隶属度大于隶属度阈值时,确定所述第二运行参数和所述第一运行参数具有波动关联性;在所述置信度小于等于置信度阈值和/或所述隶属度小于等于隶属度阈值时,确定所述第二运行参数和所述第一运行参数不具有波动关联性。
优选地,所述波动关联性确定单元还用于:使用所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数除以所述第二运行参数的波动时刻的数量以得到隶属度。
优选地,所述波动关联性确定单元还用于:使用所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和除以所述第一运行参数的波动时刻的数量以得到置信度。
优选地,快速模块度优化算法中的模块度通过以下公式计算:
Figure BDA0002507790750000041
其中m为所述关系网络中的总连接数,Aij表示运行参数i和j之间是否有连接,如果有连接则Aij=1,如果没有连接则Aij=0,ki和kj为运行参数i和j的连接数,Ci和Cj为运行参数i和j所属的社区,当Ci=Cj时δ(Ci,Cj)为1,否则δ(Ci,Cj)为0。
本发明还提供一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行上文所述的化工装置异常运行数据的聚类方法。
本发明还提供一种处理器,用于运行程序,其中,所述程序被运行时用于执行:上文所述的化工装置异常运行数据的聚类方法。
通过上述技术方案,采用本发明提供的异常运行数据的聚类方法、装置、存储介质及处理器,首先确定第一时间段内多个运行参数中每个运行参数的运行数据的至少一个波动时刻;然后根据所述每个运行参数的运行数据的至少一个波动时刻,确定所述多个运行参数中任意两个运行参数的波动关联性;接着将所述多个运行参数中具有波动关联性的运行参数连接以形成关系网络;最后根据所述关系网络,基于快速模块度优化算法,对所述每个运行参数的运行数据进行聚类。可以不依赖专家知识和工艺流程信息对数据自动化划分,提高了监控系统信息的有效性和准确性。
本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1是本发明一实施例提供的化工装置异常运行数据的聚类方法的流程图;
图2是本发明一实施例提供的波动时刻的确定方法的流程图;
图3是本发明一实施例提供的波动关联性的确定方法的流程图;
图4是本发明另一实施例提供的波动关联性的确定方法的流程图;
图5是本发明一实施例提供的化工装置异常运行数据的聚类装置的结构框图。
附图标记说明
1 波动时刻确定单元 2 波动关联性确定单元
3 波动路径确定单元 4 聚类单元
具体实施方式
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。
实施例一
图1是本发明一实施例提供的化工装置运行参数波动路径提取方法的流程图。如图1所示,该方法包括:
步骤S11,确定第一时间段内多个运行参数中每个运行参数的运行数据的至少一个波动时刻;
具体地,在线监测化工装置系统中的测量点运行数据,并记录一段时间内的相应历史数据。根据企业提供的数据采集接口,使用OPC DA服务器框架,从装置的控制系统或企业实时数据库采集运行实时数据,并刷新服务器的实时数据表,同时将实时数据以时间为序列存入每个参数的历史数据表。每个变量在服务器实时数据表中保存10000个数据,并且每经过1000个数据的运行时刻滚动更新一次实时数据库,即假设产生1000个数据的时间是10天,那么每经过10天舍弃前1000个数据,保存新产生的1000个数据。
对于每个运行参数的1000个数据的产生时间,可以设为第一时间段,然后确定出这1000个数据哪些数据是波动数据,这些波动数据的运行时刻就是波动时刻。
步骤S12,根据所述每个运行参数的运行数据的至少一个波动时刻,确定所述多个运行参数中任意两个运行参数的波动关联性;
具体地,在对每个运行参数确定出波动数据的波动时刻之后,利用这些波动时刻,可以确定任意两个参数的波动关联性,例如两个参数的波动情形是否相似(比如是否波动时刻都很接近,甚至相同)等。
步骤S13,将所述多个运行参数中具有波动关联性的运行参数连接以形成关系网络;
具体地,如上述步骤例如确定出6个运行参数A、B、C、D、E、F的波动关联性,是A与B、B与C、C与D、D与E、A与F、C与F有波动关联性,那么将A与B、B与C、C与D、D与E、A与F、C与F连接,这样形成了一个关系网络。
步骤S14,根据所述关系网络,基于快速模块度优化算法,对所述每个运行参数的运行数据进行聚类。快速模块度优化算法涉及模块度的计算,具体将在下文详述。
实施例二
本实施例提供一种具体的确定每个运行参数的运行数据的至少一个波动时刻的方法,其他实施方式与实施例一类似,在此不再赘述。波动时刻的确定方法包括:
步骤S21,确定第一时间段内所述每个运行参数的运行数据的标准差和均值;
具体地,标准差可以通过以下公式计算:
Figure BDA0002507790750000081
其中xi为i时刻的运行数据,
Figure BDA0002507790750000082
为1到n时刻的运行数据的均值,σ为标准差。
步骤S22,针对每个运行参数,确定大于所述均值与预设倍数的标准差之和的运行数据的运行时刻作为所述至少一个波动时刻。
具体地,预设倍数优选为3,但是本发明不做限定。如果运行数据比均值超过3σ,那么这个运行数据的运行时刻就是波动时刻。如此,可以将每个参数的波动时刻记录下来,建立运行数据的波动时间序列,并定时更新所有序列列表。波动时间序列的数据结构:每个测量点分配一个不固定长度的列表,列表中记录波动时刻。
实施例三
本实施例提供一种具体的确定任意两个运行参数的波动关联性的方法,其他实施方式与实施例一和二类似,在此不再赘述。波动关联性的确定方法包括:
步骤S31,根据所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数以及所述第二运行参数的波动时刻的数量,得到隶属度;
具体地,假设第二运行参数在第700和400个运行数据具有波动时刻,并且预设时间优选为100个运行数据产生的时间(但不限于此),那么则判断第一运行参数在第二运行参数的700-800个运行数据对应的运行时刻内,是否有波动时刻,假设有波动时刻,则计1。同样的,假设第二运行参数第400个运行数据也具有波动时刻,则也如上述再判断第一运行参数是否在400-500个运行数据对应的运行时刻内有波动时刻,假设有波动时刻则再计1。如此,将所有计数相加得到总共的次数,即1+1得到2,使用这个次数和第二运行参数的波动时刻的数量(如上假设也是2),可以看出第一运行参数和第二运行参数的波动时刻是否相似。如上假设二者都是2,可以看出二者的波动时刻非常相似,隶属度较高。
步骤S32,根据所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和以及所述第一运行参数的波动时刻的数量,得到置信度;
具体地,假设第一运行参数在第800和500个运行数据具有波动时刻,那么判断第二运行参数在第一运行参数的第700-800个运行数据的运行时刻内,具有多少个波动时刻,假设有2个波动时刻。再判断第二运行参数在第一运行参数的第400-500个运行数据的运行时刻内,具有多少个波动时刻,假设有3个波动时刻。如此对第一运行参数的每个波动时刻都进行同样的判断,可以得到对应于第一运行参数的每个波动时刻之前的预设时间内,第二运行参数有多少个波动时刻,将这些判断得到的第二运行参数的波动时刻的数量相加,即如上假设2+3=5,使用该数量与第一运行参数的波动时刻的数量(如上假设为2),可以看出在第一运行参数的波动时刻之前有很多第二运行参数的波动时刻,可信度较高。
步骤S33,根据所述隶属度和所述置信度判断所述波动关联性;
具体地,如上假设,在隶属度和可信度都较高时,可以判断第一运行参数和第二运行参数具有波动关联性。
实施例四
本实施例提供一种具体的确定隶属度和置信度以及使用隶属度和置信度确定波动关联性的方法,其他实施方式与实施例一、二和三类似,在此不再赘述。
步骤S41,使用所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数除以所述第二运行参数的波动时刻的数量以得到隶属度。如上假设,使用2除以2得到1。则隶属度为1。
步骤S42,使用所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和除以所述第一运行参数的波动时刻的数量以得到置信度。如上假设,使用5除以2得到2.5。则置信度为2.5。
步骤S43,判断所述置信度是否大于置信度阈值且所述隶属度是否大于隶属度阈值;
具体地,置信度阈值优选为0.7,隶属度阈值优选为0.75,但本发明不限于此。如上假设,隶属度1大于0.75,置信度2.5大于0.7。
步骤S44,在所述置信度大于置信度阈值且所述隶属度大于隶属度阈值时,确定所述第二运行参数和所述第一运行参数具有波动关联性;
具体地,如上假设,隶属度1大于0.75,置信度2.5大于0.7,则第二运行参数和第一运行参数具有波动关联性。
步骤S45,在所述置信度小于等于置信度阈值和/或所述隶属度小于等于隶属度阈值时,确定所述第二运行参数和所述第一运行参数不具有波动关联性。
具体地,只要置信度和隶属度有一者小于他们对应的阈值,第二运行参数和第一运行参数都不具有波动关联性。
实施例五
本实施例提供一种具体的快速模块度优化算法,其他实施方式与实施例一到四类似,在此不再赘述。
模块度通过以下公式计算:
Figure BDA0002507790750000111
其中m为所述关系网络中的总连接数,Aij表示运行参数i和j之间是否有连接,如果有连接则Aij=1,如果没有连接则Aij=0,ki和kj为运行参数i和j的连接数,Ci和Cj为运行参数i和j所属的社区,当Ci=Cj时δ(Ci,Cj)为1,否则δ(Ci,Cj)为0。
在现有关系网络基础上,以模块度为指标,设计网络社区划分算法:
1、初始设置网络中所有运行参数各自为一个社区,即初始社区数与网络中运行参数的数量相同。
2、待选取集合S中包含所有运行参数,对S中的运行参数按照连接数进行排序。
3、选取S中连接数最大的运行参数i,考察i的所有相邻运行参数n1,n2,…,nmi,计算将i并入这些相邻运行参数所在的社区后整个网络模块度值的变化;找到模块度值提升最大的社区将运行参数i移入该社区;若模块度值的变化均为负,则不移动运行参数i。将运行参数i从集合S中删除。
4、重复步骤3直到集合S为空。进行社区归并,将现有的社区视为新的初始社区,重复进行合并操作,对模块度值进行提升。直至模块度值无法继续提升,或模块度值已到达要求的阈值(例如优选为0.74),结束算法。
5、根据上述算法得出的社区划分,完成聚类。
实施例六
本实施例提供一种对应实施例一到五的化工装置异常运行数据的聚类方法的化工装置异常运行数据的聚类装置,如图5所示,该装置包括:波动时刻确定单元1、波动关联性确定单元2、波动路径确定单元3以及聚类单元4,其中,所述波动时刻确定单元1用于确定第一时间段内多个运行参数中每个运行参数的运行数据的至少一个波动时刻;所述波动关联性确定单元2用于根据所述每个运行参数的运行数据的至少一个波动时刻,确定所述多个运行参数中任意两个运行参数的波动关联性;所述波动路径确定单元3用于将所述多个运行参数中具有波动关联性的运行参数连接以形成关系网络;所述聚类单元4用于根据所述关系网络,基于快速模块度优化算法,对所述每个运行参数的运行数据进行聚类。
优选地,所述波动时刻确定单元1还用于:确定第一时间段内所述每个运行参数的运行数据的标准差和均值;针对每个运行参数,确定大于所述均值与预设倍数的标准差之和的运行数据的运行时刻作为所述至少一个波动时刻。
优选地,所述波动关联性确定单元2还用于:根据所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数以及所述第二运行参数的波动时刻的数量,得到隶属度;根据所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和以及所述第一运行参数的波动时刻的数量,得到置信度;根据所述隶属度和所述置信度判断所述波动关联性。
优选地,所述波动关联性确定单元2还用于:在所述置信度大于置信度阈值且所述隶属度大于隶属度阈值时,确定所述第二运行参数和所述第一运行参数具有波动关联性;在所述置信度小于等于置信度阈值和/或所述隶属度小于等于隶属度阈值时,确定所述第二运行参数和所述第一运行参数不具有波动关联性。
优选地,所述波动关联性确定单元2还用于:使用所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数除以所述第二运行参数的波动时刻的数量以得到隶属度。
优选地,所述波动关联性确定单元2还用于:使用所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和除以所述第一运行参数的波动时刻的数量以得到置信度。
优选地,快速模块度优化算法中的模块度通过以下公式计算:
Figure BDA0002507790750000131
其中m为所述关系网络中的总连接数,Aij表示运行参数i和j之间是否有连接,如果有连接则Aij=1,如果没有连接则Aij=0,ki和kj为运行参数i和j的连接数,Ci和Cj为运行参数i和j所属的社区,当Ci=Cj时δ(Ci,Cj)为1,否则δ(Ci,Cj)为0。
本实施例的具体实施方式与上文所述的实施例一到五类似,在此不再赘述。
通过上述技术方案,采用本发明提供的异常运行数据的聚类方法、装置、存储介质及处理器,首先确定第一时间段内多个运行参数中每个运行参数的运行数据的至少一个波动时刻;然后根据所述每个运行参数的运行数据的至少一个波动时刻,确定所述多个运行参数中任意两个运行参数的波动关联性;接着将所述多个运行参数中具有波动关联性的运行参数连接以形成关系网络;最后根据所述关系网络,基于快速模块度优化算法,对所述每个运行参数的运行数据进行聚类。可以不依赖专家知识和工艺流程信息对数据自动化划分,提高了监控系统信息的有效性和准确性。
所述化工装饰异常运行数据的聚类装置包括处理器和存储器,上述波动时刻确定单元、波动关联性确定单元、波动路径确定单元以及聚类单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来对异常运行数据进行聚类。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述化工装置异常运行数据的聚类方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述化工装置异常运行数据的聚类方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
确定第一时间段内多个运行参数中每个运行参数的运行数据的至少一个波动时刻;根据所述每个运行参数的运行数据的至少一个波动时刻,确定所述多个运行参数中任意两个运行参数的波动关联性;将所述多个运行参数中具有波动关联性的运行参数连接以形成关系网络;根据所述关系网络,基于快速模块度优化算法,对所述每个运行参数的运行数据进行聚类。
优选地,所述确定第一时间段内多个运行参数中每个运行参数的运行数据的至少一个波动时刻包括:确定第一时间段内所述每个运行参数的运行数据的标准差和均值;针对每个运行参数,确定大于所述均值与预设倍数的标准差之和的运行数据的运行时刻作为所述至少一个波动时刻。
优选地,所述根据所述每个运行参数的至少一个波动时刻,确定所述多个运行参数中任意两个运行参数的波动关联性包括:根据所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数以及所述第二运行参数的波动时刻的数量,得到隶属度;根据所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和以及所述第一运行参数的波动时刻的数量,得到置信度;根据所述隶属度和所述置信度判断所述波动关联性。
优选地,所述根据所述隶属度和所述置信度判断所述波动关联性还包括:在所述置信度大于置信度阈值且所述隶属度大于隶属度阈值时,确定所述第二运行参数和所述第一运行参数具有波动关联性;在所述置信度小于等于置信度阈值和/或所述隶属度小于等于隶属度阈值时,确定所述第二运行参数和所述第一运行参数不具有波动关联性。
优选地,所述根据所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数以及所述第二运行参数的波动时刻的数量,得到隶属度包括:使用所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数除以所述第二运行参数的波动时刻的数量以得到隶属度。
优选地,所述根据所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和以及所述第一运行参数的波动时刻的数量,得到置信度包括:使用所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和除以所述第一运行参数的波动时刻的数量以得到置信度。
优选地,快速模块度优化算法中的模块度通过以下公式计算:
Figure BDA0002507790750000151
其中m为所述关系网络中的总连接数,Aij表示运行参数i和j之间是否有连接,如果有连接则Aij=1,如果没有连接则Aij=0,ki和kj为运行参数i和j的连接数,Ci和Cj为运行参数i和j所属的社区,当Ci=Cj时δ(Ci,Cj)为1,否则δ(Ci,Cj)为0。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
确定第一时间段内多个运行参数中每个运行参数的运行数据的至少一个波动时刻;根据所述每个运行参数的运行数据的至少一个波动时刻,确定所述多个运行参数中任意两个运行参数的波动关联性;将所述多个运行参数中具有波动关联性的运行参数连接以形成关系网络;根据所述关系网络,基于快速模块度优化算法,对所述每个运行参数的运行数据进行聚类。
优选地,所述确定第一时间段内多个运行参数中每个运行参数的运行数据的至少一个波动时刻包括:确定第一时间段内所述每个运行参数的运行数据的标准差和均值;针对每个运行参数,确定大于所述均值与预设倍数的标准差之和的运行数据的运行时刻作为所述至少一个波动时刻。
优选地,所述根据所述每个运行参数的至少一个波动时刻,确定所述多个运行参数中任意两个运行参数的波动关联性包括:根据所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数以及所述第二运行参数的波动时刻的数量,得到隶属度;根据所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和以及所述第一运行参数的波动时刻的数量,得到置信度;根据所述隶属度和所述置信度判断所述波动关联性。
优选地,所述根据所述隶属度和所述置信度判断所述波动关联性还包括:在所述置信度大于置信度阈值且所述隶属度大于隶属度阈值时,确定所述第二运行参数和所述第一运行参数具有波动关联性;在所述置信度小于等于置信度阈值和/或所述隶属度小于等于隶属度阈值时,确定所述第二运行参数和所述第一运行参数不具有波动关联性。
优选地,所述根据所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数以及所述第二运行参数的波动时刻的数量,得到隶属度包括:使用所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数除以所述第二运行参数的波动时刻的数量以得到隶属度。
优选地,所述根据所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和以及所述第一运行参数的波动时刻的数量,得到置信度包括:使用所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和除以所述第一运行参数的波动时刻的数量以得到置信度。
优选地,快速模块度优化算法中的模块度通过以下公式计算:
Figure BDA0002507790750000171
其中m为所述关系网络中的总连接数,Aij表示运行参数i和j之间是否有连接,如果有连接则Aij=1,如果没有连接则Aij=0,ki和kj为运行参数i和j的连接数,Ci和Cj为运行参数i和j所属的社区,当Ci=Cj时δ(Ci,Cj)为1,否则δ(Ci,Cj)为0。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (16)

1.一种化工装置异常运行数据的聚类方法,其特征在于,该方法包括:
确定第一时间段内多个运行参数中每个运行参数的运行数据的至少一个波动时刻;
根据所述每个运行参数的运行数据的至少一个波动时刻,确定所述多个运行参数中任意两个运行参数的波动关联性;
将所述多个运行参数中具有波动关联性的运行参数连接以形成关系网络;
根据所述关系网络,基于快速模块度优化算法,对所述每个运行参数的运行数据进行聚类。
2.根据权利要求1所述的化工装置异常运行数据的聚类方法,其特征在于,所述确定第一时间段内多个运行参数中每个运行参数的运行数据的至少一个波动时刻包括:
确定第一时间段内所述每个运行参数的运行数据的标准差和均值;
针对每个运行参数,确定大于所述均值与预设倍数的标准差之和的运行数据的运行时刻作为所述至少一个波动时刻。
3.根据权利要求1所述的化工装置异常运行数据的聚类方法,其特征在于,所述根据所述每个运行参数的至少一个波动时刻,确定所述多个运行参数中任意两个运行参数的波动关联性包括:
根据所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数以及所述第二运行参数的波动时刻的数量,得到隶属度;
根据所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和以及所述第一运行参数的波动时刻的数量,得到置信度;
根据所述隶属度和所述置信度判断所述波动关联性。
4.根据权利要求3所述的化工装置异常运行数据的聚类方法,其特征在于,所述根据所述隶属度和所述置信度判断所述波动关联性还包括:
在所述置信度大于置信度阈值且所述隶属度大于隶属度阈值时,确定所述第二运行参数和所述第一运行参数具有波动关联性;
在所述置信度小于等于置信度阈值和/或所述隶属度小于等于隶属度阈值时,确定所述第二运行参数和所述第一运行参数不具有波动关联性。
5.根据权利要求3所述的化工装置异常运行数据的聚类方法,其特征在于,所述根据所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数以及所述第二运行参数的波动时刻的数量,得到隶属度包括:
使用所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数除以所述第二运行参数的波动时刻的数量以得到隶属度。
6.根据权利要求3所述的化工装置异常运行数据的聚类方法,其特征在于,所述根据所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和以及所述第一运行参数的波动时刻的数量,得到置信度包括:
使用所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和除以所述第一运行参数的波动时刻的数量以得到置信度。
7.根据权利要求1所述的化工装置异常运行数据的聚类方法,其特征在于,快速模块度优化算法中的模块度通过以下公式计算:
Figure FDA0002507790740000031
其中m为所述关系网络中的总连接数,Aij表示运行参数i和j之间是否有连接,如果有连接则Aij=1,如果没有连接则Aij=0,ki和kj为运行参数i和j的连接数,Ci和Cj为运行参数i和j所属的社区,当Ci=Cj时δ(Ci,Cj)为1,否则δ(Ci,Cj)为0。
8.一种化工装置异常运行数据的聚类装置,其特征在于,该装置包括:
波动时刻确定单元、波动关联性确定单元、波动路径确定单元以及聚类单元,其中,
所述波动时刻确定单元用于确定第一时间段内多个运行参数中每个运行参数的运行数据的至少一个波动时刻;
所述波动关联性确定单元用于根据所述每个运行参数的运行数据的至少一个波动时刻,确定所述多个运行参数中任意两个运行参数的波动关联性;
所述波动路径确定单元用于将所述多个运行参数中具有波动关联性的运行参数连接以形成关系网络;
所述聚类单元用于根据所述关系网络,基于快速模块度优化算法,对所述每个运行参数的运行数据进行聚类。
9.根据权利要求8所述的化工装置异常运行数据的聚类装置,其特征在于,所述波动时刻确定单元还用于:
确定第一时间段内所述每个运行参数的运行数据的标准差和均值;
针对每个运行参数,确定大于所述均值与预设倍数的标准差之和的运行数据的运行时刻作为所述至少一个波动时刻。
10.根据权利要求8所述的化工装置异常运行数据的聚类装置,其特征在于,所述波动关联性确定单元还用于:
根据所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数以及所述第二运行参数的波动时刻的数量,得到隶属度;
根据所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和以及所述第一运行参数的波动时刻的数量,得到置信度;
根据所述隶属度和所述置信度判断所述波动关联性。
11.根据权利要求10所述的化工装置异常运行数据的聚类装置,其特征在于,所述波动关联性确定单元还用于:
在所述置信度大于置信度阈值且所述隶属度大于隶属度阈值时,确定所述第二运行参数和所述第一运行参数具有波动关联性;
在所述置信度小于等于置信度阈值和/或所述隶属度小于等于隶属度阈值时,确定所述第二运行参数和所述第一运行参数不具有波动关联性。
12.根据权利要求10所述的化工装置异常运行数据的聚类装置,其特征在于,所述波动关联性确定单元还用于:
使用所述第一运行参数在所述第二运行参数的每个波动时刻之后的预设时间内也具有波动时刻的次数除以所述第二运行参数的波动时刻的数量以得到隶属度。
13.根据权利要求10所述的化工装置异常运行数据的聚类装置,其特征在于,所述波动关联性确定单元还用于:
使用所述第二运行参数在所述第一运行参数的每个波动时刻之前的预设时间内具有的波动时刻的数量之和除以所述第一运行参数的波动时刻的数量以得到置信度。
14.根据权利要求8所述的化工装置异常运行数据的聚类装置,其特征在于,快速模块度优化算法中的模块度通过以下公式计算:
Figure FDA0002507790740000051
其中m为所述关系网络中的总连接数,Aij表示运行参数i和j之间是否有连接,如果有连接则Aij=1,如果没有连接则Aij=0,ki和kj为运行参数i和j的连接数,Ci和Cj为运行参数i和j所属的社区,当Ci=Cj时δ(Ci,Cj)为1,否则δ(Ci,Cj)为0。
15.一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行权利要求1-7中任意一项权利要求所述的化工装置异常运行数据的聚类方法。
16.一种处理器,其特征在于,用于运行程序,其中,所述程序被运行时用于执行:如权利要求1-7中任意一项权利要求所述的化工装置异常运行数据的聚类方法。
CN202010451649.0A 2020-05-25 2020-05-25 异常运行数据的聚类方法、装置、存储介质及处理器 Pending CN113722403A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010451649.0A CN113722403A (zh) 2020-05-25 2020-05-25 异常运行数据的聚类方法、装置、存储介质及处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010451649.0A CN113722403A (zh) 2020-05-25 2020-05-25 异常运行数据的聚类方法、装置、存储介质及处理器

Publications (1)

Publication Number Publication Date
CN113722403A true CN113722403A (zh) 2021-11-30

Family

ID=78671736

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010451649.0A Pending CN113722403A (zh) 2020-05-25 2020-05-25 异常运行数据的聚类方法、装置、存储介质及处理器

Country Status (1)

Country Link
CN (1) CN113722403A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170082665A1 (en) * 2015-09-23 2017-03-23 International Business Machines Corporation Detecting Non-Technical Losses in Electrical Networks Based on Multi-Layered Statistical Techniques from Smart Meter Data
CN106600115A (zh) * 2016-11-28 2017-04-26 湖北华中电力科技开发有限责任公司 一种企业信息系统运维智能分析方法
CN108647808A (zh) * 2018-04-11 2018-10-12 济南大学 一种生产参数优化预测方法、装置、设备及存储介质
CN109272599A (zh) * 2018-09-03 2019-01-25 深圳市智物联网络有限公司 一种数据处理方法及相关设备
CN109996269A (zh) * 2017-12-30 2019-07-09 中国移动通信集团湖北有限公司 一种无线通信网络异常原因确定方法、装置、设备及介质
CN110457184A (zh) * 2018-05-07 2019-11-15 中国石油化工股份有限公司 基于时序波动关联的化工异常因果分析与图形展示方法
US20190372832A1 (en) * 2018-05-31 2019-12-05 Beijing Baidu Netcom Science Technology Co., Ltd. Method, apparatus and storage medium for diagnosing failure based on a service monitoring indicator

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170082665A1 (en) * 2015-09-23 2017-03-23 International Business Machines Corporation Detecting Non-Technical Losses in Electrical Networks Based on Multi-Layered Statistical Techniques from Smart Meter Data
CN106600115A (zh) * 2016-11-28 2017-04-26 湖北华中电力科技开发有限责任公司 一种企业信息系统运维智能分析方法
CN109996269A (zh) * 2017-12-30 2019-07-09 中国移动通信集团湖北有限公司 一种无线通信网络异常原因确定方法、装置、设备及介质
CN108647808A (zh) * 2018-04-11 2018-10-12 济南大学 一种生产参数优化预测方法、装置、设备及存储介质
CN110457184A (zh) * 2018-05-07 2019-11-15 中国石油化工股份有限公司 基于时序波动关联的化工异常因果分析与图形展示方法
US20190372832A1 (en) * 2018-05-31 2019-12-05 Beijing Baidu Netcom Science Technology Co., Ltd. Method, apparatus and storage medium for diagnosing failure based on a service monitoring indicator
CN109272599A (zh) * 2018-09-03 2019-01-25 深圳市智物联网络有限公司 一种数据处理方法及相关设备

Similar Documents

Publication Publication Date Title
CN113098723B (zh) 一种故障根因定位方法、装置、存储介质及设备
CN110209560B (zh) 数据异常检测方法及检测装置
CN110399268B (zh) 一种异常数据检测的方法、装置及设备
CN106529731A (zh) 一种区域电网光伏电站集群划分方法
CN110377519B (zh) 大数据系统的性能容量测试方法、装置、设备及存储介质
CN114595210A (zh) 一种多维数据的异常检测方法、装置及电子设备
CN104517020A (zh) 用于因果效应分析的特征提取方法和装置
CN115687038B (zh) 一种基于大数据的硬盘故障预测系统及方法
US20230034061A1 (en) Method for managing proper operation of base station and system applying the method
CN106951360B (zh) 数据统计完整度计算方法和系统
CN117371861B (zh) 基于数字化的家政服务质量智能分析方法及系统
CN114153646A (zh) 一种运维故障处置方法、装置及存储介质、处理器
CN112749035B (zh) 异常检测方法、装置及计算机可读介质
CN114154864A (zh) 针对电力微气象监测数据的质量评估方法及处理器
CN115660774B (zh) 一种基于区块链的物资供应链体系信用评价方法
CN116826961A (zh) 电网智能调度和运维系统、方法及存储介质
CN113722403A (zh) 异常运行数据的聚类方法、装置、存储介质及处理器
CN114398235B (zh) 基于融合学习和假设检验的内存回收趋势预警装置及方法
CN112579847A (zh) 生产数据的处理方法和装置、存储介质及电子设备
CN116030955A (zh) 基于物联网的医疗设备状态监测方法及相关装置
CN116070958A (zh) 归因分析方法、装置、电子设备和存储介质
CN111311086B (zh) 一种容量监控方法、装置及计算机可读存储介质
CN113516302A (zh) 业务风险分析方法、装置、设备及存储介质
CN111858530A (zh) 一种基于海量日志的实时关联分析方法及系统
CN113723723B (zh) 运行参数波动路径提取方法、装置、存储介质及处理器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination