CN109977106B - 一种基于熵权法的压力容器结构化数据质量评估方法 - Google Patents

一种基于熵权法的压力容器结构化数据质量评估方法 Download PDF

Info

Publication number
CN109977106B
CN109977106B CN201910275748.5A CN201910275748A CN109977106B CN 109977106 B CN109977106 B CN 109977106B CN 201910275748 A CN201910275748 A CN 201910275748A CN 109977106 B CN109977106 B CN 109977106B
Authority
CN
China
Prior art keywords
analysis
data
type
accuracy
date
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910275748.5A
Other languages
English (en)
Other versions
CN109977106A (zh
Inventor
张莉君
曾钦达
潘健鸿
杨静
邱梦华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Special Equipment Inspection and Research Institute
Original Assignee
Fujian Special Equipment Inspection and Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Special Equipment Inspection and Research Institute filed Critical Fujian Special Equipment Inspection and Research Institute
Priority to CN201910275748.5A priority Critical patent/CN109977106B/zh
Publication of CN109977106A publication Critical patent/CN109977106A/zh
Application granted granted Critical
Publication of CN109977106B publication Critical patent/CN109977106B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • General Factory Administration (AREA)

Abstract

本发明提供一种基于熵权法的压力容器结构化数据质量评估方法,所述方法通过自动化分析各地区提交的固定式压力容器结构数据,通过压力容数据的日期型准确性、数值型准确性、数据范围准确性、依从性要求字段、记录完备性5个分析类型维度的数据集合进行加权分析后得到各分析类型分析维度的基本数据分值,然后用熵权法对计算获得每个分析类型的最终指标综合分值来各地区的压力容器数据汇聚上报的质量。本发明评估后符合要求数据可应用于压力容器安全形势分析评估。

Description

一种基于熵权法的压力容器结构化数据质量评估方法
技术领域
本发明涉及,特别是一种基于熵权法的压力容器结构化数据质量评估方法。
背景技术
目前我国压力容器基础数据已经通过专用接口进行汇聚,但是由于各地信息系统建设没有统一标准,结构化数据定义没有统一规范等问题,各地区数据汇聚后由于各地结构化数据质量参差不齐,导致数据可利用性不高,利用数据进行压力容器安全形势分析时由于数据质量不佳导致数据失真。
现有技术中公开有“一种基于区间熵权法的用户用电设备能效评估方法”,申请号为: 201410332102.3申请日为:2014-07-11的中国专利,该发明提供一种基于区间熵权法的用户用电设备能效评估方法,包括以下步骤:建立用户用电设备能效评估指标系统;通过区间熵权法确定指标权重;对用户用电设备能效进行综合评估。该发明提供的基于区间熵权法的用户用电设备能效评估方法,针对各指标具有系统不确定性的度量特性,运用区间数来代替传统数据,采用区间熵权法,引入熵权反映评估指标体系中指标数据所蕴含的信息量,确定各指标的权重,并利用各个指标权重对所有指标进行加权,从而得到用户用电设备评估的较为客观结果。该专利是针对用户用电设备的能效进行评估与本专利的技术方案并不相同。
发明内容
为克服上述问题,本发明的目的是提供一种基于熵权法的压力容器结构化数据质量评估方法,可用于分析各地区提交特种设备压力容器数据质量评估,评估后符合要求数据可应用于特种设备压力容器安全形势分析评估。
本发明采用以下方案实现一种基于熵权法的压力容器结构化数据质量评估方法,所述方法通过自动化分析各地区提交的固定式压力容器结构数据,通过压力容数据的日期型准确性、数值型准确性、数据范围准确性、依从性要求字段、记录完备性5个分析类型维度的数据集合进行加权分析后得到各分析类型分析维度的基本数据分值,然后用熵权法对计算获得每个分析类型的最终指标综合分值来各地区的压力容器数据汇聚上报的质量。
进一步的,所述方法具体包括如下步骤:
步骤S1、设定压力容器数据的分析类型,所述分析类型分为日期型准确性、数值型准确性、数据范围准确性、依从性要求、以及记录完备性;
步骤S2、从压力容器数据中获得每个分析类型对应的分析字段,并获取分析类型下的各个分析字段中数据符合要求的数值和分析字段的个数值;
步骤S3、对各地区采集的压力容器数据样本进行汇聚,设定理论应达到符合要求的数值,设定每个分析类型的标准值为100,则通过公式:数据符合要求的数值/理论应达到符合要求的数值*(分析类型的标准值100/分析字段的个数值)得到各地区数据样本中对应的每个分析类型的标准化分数;
步骤S4、设定有i个地区压力容器数据样本,j为分析类型,K为标准化分数,则各地区数据样本中对应的每个分析类型的标准化分数为Kij;则各地区数据样本中对应的每个分析类型的变量权重为Yij=Kij/∑Kij
步骤S5、使用熵权法得到各地区数据样本中对应的每个分析类型的指标权重wj
步骤S6、设定指标综合分数为S,则各地区数据样本中对应的每个分析类型的指标综合得分为Sij=wj×Kij
步骤S7、根据指标综合得分能得出各地区的压力容器数据汇聚上报的质量。
进一步的,所述日期型准确性对应的分析字段:检验日期,下次检验日期/延期检验日期,使用登记日期,制造日期,最新检验日期;即日期型准确性对应的分析字段的个数值为5;所述数值型准确性对应的分析字段:设备状态,设备所在区域,设计压力,容器内径,容器容积,容器高,设计温度;即日数值型准确性对应的分析字段的个数值为7;所述数据范围准确性对应的分析字段:特种设备使用状态,设备使用场所,设备注册状态,安全状况等级,工作介质,检验类型;即数据范围准确性对应的分析字段的个数值为6;所述依从性要求对应的分析字段:设备种类,设备类别,设备品种,区域代码,统一社会信用代码,使用证号,检验结论,安全状况等级与检验结论的对照,安全状况登记与下检日期的对照;即依从性要求对应的分析字段的个数值为9;所述记录完备性对应的分析字段:识别码是否完备,设备所在是否完备,检验日期是否完备,设备状态是否完备,下检日期是否完备,制造时间是否完备;即记录完备性对应的分析字段的个数值为6。
进一步的,所述步骤5进一步具体为:先计算指标信息熵、然后计算信息熵冗余度最后得到指标权重;所述指标信息熵为Ej=-(1/ln(m))Σ(Yij×ln(Yij)),其中m为地区数据样本个数,Yij为变量权重;所述信息熵冗余度为dj=1-Ej;所述指标权重wj=dj/Σdj
进一步的,将指标综合得分设定为:优,则大于等于90分;良,则大于等于80分小于90分;中,则大于等于60分小于80分;差,则小于60分。
本发明的有益效果在于:本发明通过压力容数据的日期型准确性、数值型准确性、数据范围准确性、依从性要求字段、数据值完备性、记录完备性5个分析类型维度的数据集合进行加权分析后得到各分析类型分析维度的基本数据分值,然后用熵权法对计算获得每个分析类型的最终指标综合分值来各地区的压力容器数据汇聚上报的质量,该方法可用于分析各地区提交压力容器数据质量评估,对各地区压力容器基础数据收集具有指导作用,同时评估后符合要求数据可应用于压力容器安全形势分析评估。
附图说明
图1是本发明的方法流程示意图。
具体实施方式
下面结合附图对本发明做进一步说明。
请参阅图1所示,本发明的一种基于熵权法的压力容器结构化数据质量评估方法,所述方法通过自动化分析各地区提交的固定式压力容器结构数据,通过压力容数据的日期型准确性、数值型准确性、数据范围准确性、依从性要求字段、记录完备性5个分析类型维度的数据集合进行加权分析后得到各分析类型分析维度的基本数据分值,然后用熵权法对计算获得每个分析类型的最终指标综合分值来各地区的压力容器数据汇聚上报的质量。
下面结合一具体实施例对本发明作进一步说明:
本发明的一种基于熵权法的压力容器结构化数据质量评估方法,所述方法具体包括如下步骤:
步骤S1、设定压力容器数据的分析类型,所述分析类型分为日期型准确性、数值型准确性、数据范围准确性、依从性要求、以及记录完备性;
步骤S2、从压力容器数据中获得每个分析类型对应的分析字段,并获取分析类型下的各个分析字段中数据符合要求的数值和分析字段的个数值;其中,所述日期型准确性对应的分析字段:检验日期,下次检验日期/延期检验日期,使用登记日期,制造日期,最新检验日期;即日期型准确性对应的分析字段的个数值为5;所述数值型准确性对应的分析字段:设备状态,设备所在区域,设计压力,容器内径,容器容积,容器高,设计温度;即日数值型准确性对应的分析字段的个数值为7;所述数据范围准确性对应的分析字段:特种设备使用状态,设备使用场所,设备注册状态,安全状况等级,工作介质,检验类型;即数据范围准确性对应的分析字段的个数值为6;所述依从性要求对应的分析字段:设备种类,设备类别,设备品种,区域代码,统一社会信用代码,使用证号,检验结论,安全状况等级与检验结论的对照,安全状况登记与下检日期的对照;即依从性要求对应的分析字段的个数值为9;所述记录完备性对应的分析字段:识别码是否完备,设备所在是否完备,检验日期是否完备,设备状态是否完备,下检日期是否完备,制造时间是否完备;即记录完备性对应的分析字段的个数值为6。
步骤S3、对各地区采集的压力容器数据样本进行汇聚,设定理论应达到符合要求的数值,设定每个分析类型的标准值为100,则通过公式:数据符合要求的数值/理论应达到符合要求的数值*(分析类型的标准值100/分析字段的个数值)得到各地区数据样本中对应的每个分析类型的标准化分数;理论应达到符合要求的数值是设定得到,此处的理论应达到符合要求的数值设置为10000;
例如:地区1汇聚数据分析:
Figure BDA0002019903080000051
Figure BDA0002019903080000061
Figure BDA0002019903080000071
Figure 2
Figure BDA0002019903080000091
步骤S4、设定有i个地区压力容器数据样本,j为分析类型,K为标准化分数,则各地区数据样本中对应的每个分析类型的标准化分数为Kij;则各地区数据样本中对应的每个分析类型的变量权重为Yij=Kij/∑Kij;例如输入4个地区的压力容器数据样本,
Figure BDA0002019903080000092
Figure BDA0002019903080000101
这样如得到地区1的日期型准确性变量权重为Y11=83.77/309.01
日期型准确性 数值型准确性 数据范围准确性 依从性要求字段 数据值完备性
地区1 0.27109155 0.287906292 0.24154195 0.302844281 0.232089333
地区2 0.260703537 0.207007569 0.264610733 0.185553509 0.271583897
地区3 0.211805443 0.269890742 0.267089947 0.239656231 0.262533059
地区4 0.256399469 0.235195397 0.22675737 0.271945979 0.233793711
步骤S5、使用熵权法得到各地区数据样本中对应的每个分析类型的指标权重wj;所述步骤5进一步具体为:先计算指标信息熵、然后计算信息熵冗余度最后得到指标权重;所述指标信息熵为Ej=-(1/ln(m))Σ(Yij×ln(Yij)),其中m为地区数据样本个数,Yij为变量权重;ln为对数运算符;该示例中地区压力容器数据样本个数为4,得到下表数据。
Figure BDA0002019903080000102
所述信息熵冗余度为dj=1-Ej
Figure BDA0002019903080000103
所述指标权重wj=dj/Σdj
Figure BDA0002019903080000104
步骤S6、设定指标综合分数为S,则各地区数据样本中对应的每个分析类型的指标综合得分为Sij=wj×Kij
Figure BDA0002019903080000111
步骤S7、根据指标综合得分能得出各地区的压力容器数据汇聚上报的质量。
另外,将指标综合得分设定为:优,则大于等于90分;良,则大于等于80分小于90分;中,则大于等于60分小于80分;差,则小于60分。
总之,本发明通过压力容数据的日期型准确性、数值型准确性、数据范围准确性、依从性要求字段、数据值完备性、记录完备性5个分析类型维度的数据集合进行加权分析后得到各分析类型分析维度的基本数据分值,然后用熵权法对计算获得每个分析类型的最终指标综合分值来各地区的压力容器数据汇聚上报的质量,该方法可用于分析各地区提交压力容器数据质量评估,对各地区压力容器基础数据收集具有指导作用,同时评估后符合要求数据可应用于压力容器安全形势分析评估。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (2)

1.一种基于熵权法的压力容器结构化数据质量评估方法,其特征在于:所述方法通过自动化分析各地区提交的固定式压力容器结构数据,通过压力容数据的日期型准确性、数值型准确性、数据范围准确性、依从性要求字段、记录完备性5个分析类型维度的数据集合进行加权分析后得到各分析类型分析维度的基本数据分值,然后用熵权法对计算获得每个分析类型的最终指标综合分值来各地区的压力容器数据汇聚上报的质量;所述方法具体包括如下步骤:
步骤S1、设定压力容器数据的分析类型,所述分析类型分为日期型准确性、数值型准确性、数据范围准确性、依从性要求、以及记录完备性;
步骤S2、从压力容器数据中获得每个分析类型对应的分析字段,并获取分析类型下的各个分析字段中数据符合要求的数值和分析字段的个数值;
步骤S3、对各地区采集的压力容器数据样本进行汇聚,设定理论应达到符合要求的数值,设定每个分析类型的标准值为100,则通过公式:数据符合要求的数值/理论应达到符合要求的数值*(分析类型的标准值100/分析字段的个数值)得到各地区数据样本中对应的每个分析类型的标准化分数;
步骤S4、设定有i个地区压力容器数据样本,j为分析类型,K为标准化分数,则各地区数据样本中对应的每个分析类型的标准化分数为
Figure DEST_PATH_IMAGE002
;则各地区数据样本中对应的每个分析类型的变量权重为
Figure DEST_PATH_IMAGE004
步骤S5、使用熵权法得到各地区数据样本中对应的每个分析类型的指标权重
Figure DEST_PATH_IMAGE006
步骤S6、设定指标综合分数为S,则各地区数据样本中对应的每个分析类型的指标综合得分为
Figure DEST_PATH_IMAGE008
步骤S7、根据指标综合得分能得出各地区的压力容器数据汇聚上报的质量;
所述日期型准确性对应的分析字段:检验日期,下次检验日期/延期检验日期,使用登记日期,制造日期,最新检验日期;即日期型准确性对应的分析字段的个数值为5;所述数值型准确性对应的分析字段:设备状态,设备所在区域,设计压力,容器内径,容器容积,容器高,设计温度;即数值型准确性对应的分析字段的个数值为7;所述数据范围准确性对应的分析字段:特种设备使用状态,设备使用场所,设备注册状态,安全状况等级,工作介质,检验类型;即数据范围准确性对应的分析字段的个数值为6;所述依从性要求对应的分析字段:设备种类,设备类别,设备品种,区域代码,统一社会信用代码,使用证号,检验结论,安全状况等级与检验结论的对照,安全状况登记与下检日期的对照;即依从性要求对应的分析字段的个数值为9;所述记录完备性对应的分析字段:识别码是否完备,设备所在是否完备,检验日期是否完备,设备状态是否完备,下检日期是否完备,制造时间是否完备;即记录完备性对应的分析字段的个数值为6;
所述步骤S5进一步具体为:先计算指标信息熵、然后计算信息熵冗余度最后得到指标权重;所述指标信息熵为
Figure DEST_PATH_IMAGE010
,其中m为地区数据样本个数,
Figure DEST_PATH_IMAGE012
为变量权重;所述信息熵冗余度为
Figure DEST_PATH_IMAGE014
;所述指标权重
Figure DEST_PATH_IMAGE016
2.根据权利要求1所述的一种基于熵权法的压力容器结构化数据质量评估方法,其特征在于:将指标综合得分设定为:优,则大于等于90分;良,则大于等于80分小于90 分;中,则大于等于60分小于80分;差,则小于60分。
CN201910275748.5A 2019-04-08 2019-04-08 一种基于熵权法的压力容器结构化数据质量评估方法 Active CN109977106B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910275748.5A CN109977106B (zh) 2019-04-08 2019-04-08 一种基于熵权法的压力容器结构化数据质量评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910275748.5A CN109977106B (zh) 2019-04-08 2019-04-08 一种基于熵权法的压力容器结构化数据质量评估方法

Publications (2)

Publication Number Publication Date
CN109977106A CN109977106A (zh) 2019-07-05
CN109977106B true CN109977106B (zh) 2021-05-28

Family

ID=67083289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910275748.5A Active CN109977106B (zh) 2019-04-08 2019-04-08 一种基于熵权法的压力容器结构化数据质量评估方法

Country Status (1)

Country Link
CN (1) CN109977106B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722577A (zh) * 2012-06-05 2012-10-10 中兴通讯股份有限公司 指标动态权重的确定方法及装置
CN106503206A (zh) * 2016-10-26 2017-03-15 国家电网公司 一种基于熵权法的通用数据质量评估方法
CN107967571A (zh) * 2017-12-18 2018-04-27 青岛科技大学 基于熵权法的指标体系生成方法
CN109359796A (zh) * 2018-08-17 2019-02-19 浙江华云信息科技有限公司 一种基于多评估指标的电能表生产厂商评价方法
CN109409628A (zh) * 2018-08-17 2019-03-01 国网浙江省电力有限公司 基于计量大数据聚类模型的采集终端生产厂商评价方法
CN208666826U (zh) * 2018-08-21 2019-03-29 福建省特种设备检验研究院 配合大数据电梯维护的手推式电梯乘运质量综合分析装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10089355B2 (en) * 2014-09-01 2018-10-02 Mapquest, Inc. Computerized systems and methods for partitioning data for information retrieval
CN107221343B (zh) * 2017-05-19 2020-05-19 北京市农林科学院 一种数据质量的评估方法及评估系统
CN108229784A (zh) * 2017-11-09 2018-06-29 中国电力科学研究院有限公司 一种智能配电网的多维数据质量评价方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722577A (zh) * 2012-06-05 2012-10-10 中兴通讯股份有限公司 指标动态权重的确定方法及装置
CN106503206A (zh) * 2016-10-26 2017-03-15 国家电网公司 一种基于熵权法的通用数据质量评估方法
CN107967571A (zh) * 2017-12-18 2018-04-27 青岛科技大学 基于熵权法的指标体系生成方法
CN109359796A (zh) * 2018-08-17 2019-02-19 浙江华云信息科技有限公司 一种基于多评估指标的电能表生产厂商评价方法
CN109409628A (zh) * 2018-08-17 2019-03-01 国网浙江省电力有限公司 基于计量大数据聚类模型的采集终端生产厂商评价方法
CN208666826U (zh) * 2018-08-21 2019-03-29 福建省特种设备检验研究院 配合大数据电梯维护的手推式电梯乘运质量综合分析装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于熵权和层次分析法的数据质量评估研究;杨栋枢 等;《现代电子技术》;20131115;39-42 *

Also Published As

Publication number Publication date
CN109977106A (zh) 2019-07-05

Similar Documents

Publication Publication Date Title
CN110634080B (zh) 异常用电检测方法、装置、设备及计算机可读存储介质
CN110084418B (zh) 一种突发大气污染事故应急监测的监测点优化布设方法
CN110263827B (zh) 基于交易规律识别的异常交易检测方法及装置
CN107016068A (zh) 知识图谱构建方法及装置
CN105741196A (zh) 一种基于四个维度进行数据质量监测及评价方法
CN105373894A (zh) 基于稽查数据的电力营销业务诊断模型的建立方法及系统
CN116109195B (zh) 一种基于图卷积神经网络的绩效评估方法及系统
CN110827169B (zh) 一种基于分级指标的分布式电网业务监控方法
Eudey et al. Biostatistics and bioaerosols
CN113128567A (zh) 一种基于用电量数据的异常用电行为识别方法
CN103902798B (zh) 数据预处理方法
CN113111063A (zh) 一种应用于多数据源的医疗患者主索引发现方法
CN111340516A (zh) 基于信息熵与变异系数融合算法的满意度评价系统及方法
CN114912739A (zh) 环境与变电站运维费用关联模型的构建及应用方法
CN111931992A (zh) 一种电力负荷预测指标选取方法及装置
CN109977106B (zh) 一种基于熵权法的压力容器结构化数据质量评估方法
CN114295162A (zh) 一种基于数据采集的环境监测系统
CN117371861A (zh) 基于数字化的家政服务质量智能分析方法及系统
CN113159535A (zh) 一种基于熵权法的软件服务绩效评价方法
CN112434886A (zh) 一种预测客户抵押贷款违约概率的方法
CN116167659B (zh) 一种碳市场碳排放数据质量评价方法
CN112734233A (zh) 确认app推广渠道的新增客户质量的方法及装置
CN112632469A (zh) 业务交易数据的异常检测方法、装置及计算机设备
CN116776224A (zh) 一种基于gra和聚类云模型的变压器油纸绝缘状态评估方法
CN108921397B (zh) 基于全生命周期数据的复杂装备的健康评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant