发明内容
本发明的目的在于提供一种符合工业现场设备运行状态监测需求的数据质量动态检测和保障方法,能够结合设备状态的变化规律,对数据质量进行动态的检测和保障,提高了设备监测诊断的可靠性。
解决本发明的技术方案是这样解决的:一种设备运行状态数据质量动态检测和保障方法,流程如下:
1).通过采集硬件得到的数据接受质量实时监测,不合格的数据重新采集;
2).合格数据和多次采集均不合格的数据经过预处理,进入数据库;
3).数据库管理程序进行数据质量自动检测,质量好的真实数据提交监测诊断;
4).不确定的检测结果由数据质量管理员人工确认;
5).人工确认的伪数据和真实数据作为样本,动态更新数据质量实时监测参数和自动检测规则;
6).新的实时监测参数和自动检测规则对后续数据的质量进行判断,得出伪数据或真实数据,重复上述过程。
其改进之处在于:
a)、数据质量实时监测:在设备数据采集硬件中设置质量监测模块,对测量得到的数据计算其质量监测参数值,评价是否合格;合格数据进入后续传输存储流程,不合格要求重新采集,如果累计多次不合格,则放弃质量实时监测要求,数据进入后续流程。
b)、数据质量自动检测:在对数据进行分析之前,由数据库管理程序根据自动检测规则,判断数据是否违背了历史数据表现出的关联性,不违背则为“真实数据”,如果违背,则认为该数据有可能未正确对应于设备状态。
本发明提供的设备运行状态数据质量动态检测和保障方法,与实际的监测诊断流程相结合,采用了数据采集硬件实时监测、数据库管理程序自动检测以及数据质量管理人员最终确认的三层数据质量保障机制,为设备数据的使用者提供满足进一步诊断分析要求的高质量数据,提高对设备状态判断的可靠性,奠定离线和在线监测大规模、自动化推广应用的基础。
具体实施方式
为了更清楚的阐述本发明,以下结合实施例对本发明作进一步的详细说明。
参照图1所示,本发明涉及的设备运行状态数据质量动态检测和保障方法,包括如下步骤:
一种设备运行状态数据质量动态检测和保障方法,流程如下:
1).通过采集硬件得到的数据接受质量实时监测,不合格的数据重新采集;
2).合格数据和多次采集均不合格的数据经过预处理,进入数据库;
3).数据库管理程序进行数据质量自动检测,质量好的真实数据提交监测诊断;
4).不确定的检测结果由数据质量管理员人工确认;
5).人工确认的伪数据和真实数据作为样本,动态更新数据质量实时监测参数和自动检测规则;
6).新的实时监测参数和自动检测规则对后续数据的质量进行判断,得出伪数据或真实数据,重复上述过程;
其中:a)、数据质量实时监测:在设备数据采集硬件中设置质量监测模块,对测量得到的数据计算其质量监测参数值,评价是否合格,合格数据进入后续传输存储流程,不合格要求重新采集,如果累计多次不合格,则放弃质量实时监测要求,数据进入后续流程;
b)、数据质量自动检测:在对数据进行分析之前,由数据库管理程序根据自动检测规则,判断数据是否违背了历史数据表现出的关联性,不违背则为“真实数据”,如果违背,则认为该数据有可能未正确对应于设备状态。
在实现数据质量实时监测的过程中,根据数据质量问题的特点,选择当前时间范围内的“真实数据”和“伪数据”为样本,以
作为适应度函数,式中xi为样本中“伪数据”计算得到的参数值,μ和σ是“真实数据”参数值计算得到的均值和标准差;
采用遗传编程方法,自动构造数据质量实时监测参数,新数据不断产生,样本集不断变化,实时监测参数随之动态更新;
在实现数据质量自动检测的过程中,针对监测诊断最常用的振动数据,将其频谱图划分为内部能量相差较小,带间能量相差较大的频带,计算各频带能量,进行归一化处理,构造成频带能量向量E={e1,e2,Λ,en},以相邻J散度计算式
其中i是按采样时间排列得到的数据序号,数据i-1与数据i之间相差一个监测周期,Ei和Ei-1是相同频带划分方式得到的频带能量向量;
量化相邻采样时间数据的频谱分布结构变化剧烈程度,判断数据是否对应于设备的状态,并以此作为数据质量自动检测的规则。
对于大量分散分布的中小型机电设备,离线监测的主要手段是设备点检方式,即点检人员持便携式数据采集器,按计划巡检设备,收集设备运行状态数据,然后与计算机联机回收数据至点检数据库,利用分析软件进行监测诊断分析。
图2所示的是一套典型的网络化设备状态点检监测系统,点检工作站向数据采集器下达点检计划;点检人员按计划操作数据采集器,获取设备运行状态数据;分厂或车间的点检工作站负责回收数据,并将其上传至数据库服务器,进行统一管理;其它客户端通过网络下载使用设备状态信息,通过数据分析诊断工具了解设备状态。在实施过程中,由于数据采集器操作受人为因素影响较大,数据传递环节较多,因此数据质量问题突出。本发明以这一系统为实施例,实施设备运行状态数据质量动态检测和保障方法。
以每一个数据采集位置的历史数据作为样本,构造数据质量监测参数,将其作为对应采集位置的动态属性,随点检计划下达到数据采集器中。点检人员在该采集位置采集数据之后,数据采集器计算数据质量监测参数,如果判断数据不合格,立即提醒点检人员重新采集,如果连续采集数据均不合格,则保存数据,继续其它位置的数据采集。
数据回收上传进入数据库服务器后,数据库管理程序对数据质量进行自动检测,识别脱离设备状态发展变化趋势的数据,交给数据质量管理员。数据质量管理员判断数据中是否包含故障特征,如果不包含则确认为“伪数据”。
经过以上过程,数据被标识为“真实数据”和“伪数据”,客户端程序只下载分析“真实数据”,提高了监测诊断效率;而“伪数据”和“真实数据”一齐作为样本,动态构造新的质量监测参数和自动监测规则。
参照图3、4所示,本发明涉及的数据质量评价问题与常规的分类问题不同,常规的分类问题假设在状态I和状态II时,由样本计算的特征参数v服从正态分布,其概率密度函数分布参见图3,如果表达式
(μ和σ是由分类样本计算得到的均值与方差)值越大,则表明使用特征参数ν分类时,状态I和状态II之间的类间距相对于状态I和状态II的类内距越大,分类效果越好。而对于数据质量评价问题,设备在连续变化的某一段时间范围内,真实数据所计算的特征参数仍然服从正态分布,伪数据由于影响因素较多,其分布未知,此时特征参数的选择应当满足真实数据的区间尽可能的被压缩,而伪数据尽可能的远离该区间,其概率密度函数分布参见图4,由此确定表达式
(式中xi为样本中“伪数据”计算得到的参数值,μ和σ是“真实数据”参数值计算得到的均值和标准差)为判断参数识别伪数据效果好坏的依据。fit(v)值越大,伪数据与真实数据的类间距就越大,真实数据本身的分散程度就越小,v对伪数据的辨识能力也就越强。
本发明使用遗传编程动态构造数据质量实时监测参数,其构造过程是从一组可能存在潜在解集的参数表达式群体开始的,从中挑选出适合求解问题,即适应度较大的表达式个体,对其进行复制、杂交和变异的遗传操作,形成新的一代群体,对新群体循环执行这一过程,使其像自然进化的种群后生代比前代更加适应于环境一样,更加适应于问题求解,最终得到问题的近似最优解。本发明以 为适应度函数;从振动烈度、不平稳性、复杂度、无量纲指标以及过零率五个方面提取数据特征,作为参数表达式的构造基本单位;以每个监测位置的“真实数据”和“伪数据”为样本,进行数据质量监测参数的构造。
以工业现场中某减速机点检监测得到的“真实数据”和“伪数据”为样本,构造得到质量监测参数v=(峭度指标-脉冲指标)2,对数据质量评价的效果如图5所示,图中“真实数据”与“伪数据”被明显的区分开来,该参数适应度函数fit(v)=3.5895,因此“伪数据”被排除到“真实数据”计算得到的区间[μ-3.5895σ,μ+3.5895σ]之外,而且该参数计算量小,满足数据质量的实时监测要求。
设备在连续运行的情况下,其状态是前后联系的,任何变化都有一个发展的过程,如果某一数据违背了历史数据所表现出的关联性,并且无法用设备故障进行解释,则认为该数据未正确对应于设备状态。本发明针对监测诊断中最常用的振动数据,在频域中建立量化数据频谱分布结构变化剧烈程度的指标,以此作为数据质量自动检测的规则。
将设备振动数据的频谱图按频率大小均分为m段,计算各段能量,然后把能量相近的邻近频段合并,得到n各大小不等频带,其特征为频带内能量相差较小,频带间能量相差较大。计算各频带能量,并进行归一化处理,组成向量E={e1,e2,Λ,en},按照相邻J散度计算式
(i是按采样时间排列得到的数据序号,数据i-1与数据i之间相差一个采集周期,Ei和Ei-1是相同频带划分方式得到的频带能量向量)进行计算,得到的相邻J散度JE(i)量化表达数据i与数据i-1之间频谱分布结构的变化剧烈程度。根据测量位置的历史数据统计确定包含变工况情况下的相邻J散度正常变化边界值Jb,即可逐个对数据进行质量的自动检测。
参照图6所示,将JE(i)逐个与Jb比较,小于Jb的认为是真实数据,如果JE(i)大于Jb且JE(i+1)也大于Jb,则标记第i组数据违背了历史数据所表现出的关联性,同时忽略这一组数据,用上一组真实数据和Ei+1计算新的JE(i+1),继续进行比较识别,直到检测完所有的数据。经过这样的逐个识别过程,就可以找到所有脱离设备历史发展变化趋势的数据,使剩余数据保持相对平稳的变化,较好的对应于设备的实际状态。
在工业现场中,设备的状态和数据质量的表现形式不断的发生变化,“真实数据”和“伪数据”样本集随之变化,由样本集计算确定的数据质量实时监测参数和自动检测规则得到动态调整,使二者能够有效的发挥作用,满足网络化设备状态点检监测系统的数据质量问题解决需要。