CN109977106A - 一种基于熵权法的压力容器结构化数据质量评估方法 - Google Patents
一种基于熵权法的压力容器结构化数据质量评估方法 Download PDFInfo
- Publication number
- CN109977106A CN109977106A CN201910275748.5A CN201910275748A CN109977106A CN 109977106 A CN109977106 A CN 109977106A CN 201910275748 A CN201910275748 A CN 201910275748A CN 109977106 A CN109977106 A CN 109977106A
- Authority
- CN
- China
- Prior art keywords
- analysis
- data
- type
- pressure vessel
- date
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- General Factory Administration (AREA)
Abstract
本发明提供一种基于熵权法的压力容器结构化数据质量评估方法,所述方法通过自动化分析各地区提交的固定式压力容器结构数据,通过压力容数据的日期型准确性、数值型准确性、数据范围准确性、依从性要求字段、记录完备性5个分析类型维度的数据集合进行加权分析后得到各分析类型分析维度的基本数据分值,然后用熵权法对计算获得每个分析类型的最终指标综合分值来各地区的压力容器数据汇聚上报的质量。本发明评估后符合要求数据可应用于压力容器安全形势分析评估。
Description
技术领域
本发明涉及,特别是一种基于熵权法的压力容器结构化数据质量评估方法。
背景技术
目前我国压力容器基础数据已经通过专用接口进行汇聚,但是由于各地信息系统建设没有统一标准,结构化数据定义没有统一规范等问题,各地区数据汇聚后由于各地结构化数据质量参差不齐,导致数据可利用性不高,利用数据进行压力容器安全形势分析时由于数据质量不佳导致数据失真。
现有技术中公开有“一种基于区间熵权法的用户用电设备能效评估方法”,申请号为: 201410332102.3申请日为:2014-07-11的中国专利,该发明提供一种基于区间熵权法的用户用电设备能效评估方法,包括以下步骤:建立用户用电设备能效评估指标系统;通过区间熵权法确定指标权重;对用户用电设备能效进行综合评估。该发明提供的基于区间熵权法的用户用电设备能效评估方法,针对各指标具有系统不确定性的度量特性,运用区间数来代替传统数据,采用区间熵权法,引入熵权反映评估指标体系中指标数据所蕴含的信息量,确定各指标的权重,并利用各个指标权重对所有指标进行加权,从而得到用户用电设备评估的较为客观结果。该专利是针对用户用电设备的能效进行评估与本专利的技术方案并不相同。
发明内容
为克服上述问题,本发明的目的是提供一种基于熵权法的压力容器结构化数据质量评估方法,可用于分析各地区提交特种设备压力容器数据质量评估,评估后符合要求数据可应用于特种设备压力容器安全形势分析评估。
本发明采用以下方案实现一种基于熵权法的压力容器结构化数据质量评估方法,所述方法通过自动化分析各地区提交的固定式压力容器结构数据,通过压力容数据的日期型准确性、数值型准确性、数据范围准确性、依从性要求字段、记录完备性5个分析类型维度的数据集合进行加权分析后得到各分析类型分析维度的基本数据分值,然后用熵权法对计算获得每个分析类型的最终指标综合分值来各地区的压力容器数据汇聚上报的质量。
进一步的,所述方法具体包括如下步骤:
步骤S1、设定压力容器数据的分析类型,所述分析类型分为日期型准确性、数值型准确性、数据范围准确性、依从性要求、以及记录完备性;
步骤S2、从压力容器数据中获得每个分析类型对应的分析字段,并获取分析类型下的各个分析字段中数据符合要求的数值和分析字段的个数值;
步骤S3、对各地区采集的压力容器数据样本进行汇聚,设定理论应达到符合要求的数值,设定每个分析类型的标准值为100,则通过公式:数据符合要求的数值/理论应达到符合要求的数值*(分析类型的标准值100/分析字段的个数值)得到各地区数据样本中对应的每个分析类型的标准化分数;
步骤S4、设定有i个地区压力容器数据样本,j为分析类型,K为标准化分数,则各地区数据样本中对应的每个分析类型的标准化分数为Kij;则各地区数据样本中对应的每个分析类型的变量权重为Yij=Kij/∑Kij;
步骤S5、使用熵权法得到各地区数据样本中对应的每个分析类型的指标权重wj;
步骤S6、设定指标综合分数为S,则各地区数据样本中对应的每个分析类型的指标综合得分为Sij=wj×Kij;
步骤S7、根据指标综合得分能得出各地区的压力容器数据汇聚上报的质量。
进一步的,所述日期型准确性对应的分析字段:检验日期,下次检验日期/延期检验日期,使用登记日期,制造日期,最新检验日期;即日期型准确性对应的分析字段的个数值为5;所述数值型准确性对应的分析字段:设备状态,设备所在区域,设计压力,容器内径,容器容积,容器高,设计温度;即日数值型准确性对应的分析字段的个数值为7;所述数据范围准确性对应的分析字段:特种设备使用状态,设备使用场所,设备注册状态,安全状况等级,工作介质,检验类型;即数据范围准确性对应的分析字段的个数值为6;所述依从性要求对应的分析字段:设备种类,设备类别,设备品种,区域代码,统一社会信用代码,使用证号,检验结论,安全状况等级与检验结论的对照,安全状况登记与下检日期的对照;即依从性要求对应的分析字段的个数值为9;所述记录完备性对应的分析字段:识别码是否完备,设备所在是否完备,检验日期是否完备,设备状态是否完备,下检日期是否完备,制造时间是否完备;即记录完备性对应的分析字段的个数值为6。
进一步的,所述步骤5进一步具体为:先计算指标信息熵、然后计算信息熵冗余度最后得到指标权重;所述指标信息熵为Ej=-(1/ln(m))Σ(Yij×ln(Yij)),其中m为地区数据样本个数,Yij为变量权重;所述信息熵冗余度为dj=1-Ej;所述指标权重wj=dj/Σdj。
进一步的,将指标综合得分设定为:优,则大于等于90分;良,则大于等于80分小于90分;中,则大于等于60分小于80分;差,则小于60分。
本发明的有益效果在于:本发明通过压力容数据的日期型准确性、数值型准确性、数据范围准确性、依从性要求字段、数据值完备性、记录完备性5个分析类型维度的数据集合进行加权分析后得到各分析类型分析维度的基本数据分值,然后用熵权法对计算获得每个分析类型的最终指标综合分值来各地区的压力容器数据汇聚上报的质量,该方法可用于分析各地区提交压力容器数据质量评估,对各地区压力容器基础数据收集具有指导作用,同时评估后符合要求数据可应用于压力容器安全形势分析评估。
附图说明
图1是本发明的方法流程示意图。
具体实施方式
下面结合附图对本发明做进一步说明。
请参阅图1所示,本发明的一种基于熵权法的压力容器结构化数据质量评估方法,所述方法通过自动化分析各地区提交的固定式压力容器结构数据,通过压力容数据的日期型准确性、数值型准确性、数据范围准确性、依从性要求字段、记录完备性5个分析类型维度的数据集合进行加权分析后得到各分析类型分析维度的基本数据分值,然后用熵权法对计算获得每个分析类型的最终指标综合分值来各地区的压力容器数据汇聚上报的质量。
下面结合一具体实施例对本发明作进一步说明:
本发明的一种基于熵权法的压力容器结构化数据质量评估方法,所述方法具体包括如下步骤:
步骤S1、设定压力容器数据的分析类型,所述分析类型分为日期型准确性、数值型准确性、数据范围准确性、依从性要求、以及记录完备性;
步骤S2、从压力容器数据中获得每个分析类型对应的分析字段,并获取分析类型下的各个分析字段中数据符合要求的数值和分析字段的个数值;其中,所述日期型准确性对应的分析字段:检验日期,下次检验日期/延期检验日期,使用登记日期,制造日期,最新检验日期;即日期型准确性对应的分析字段的个数值为5;所述数值型准确性对应的分析字段:设备状态,设备所在区域,设计压力,容器内径,容器容积,容器高,设计温度;即日数值型准确性对应的分析字段的个数值为7;所述数据范围准确性对应的分析字段:特种设备使用状态,设备使用场所,设备注册状态,安全状况等级,工作介质,检验类型;即数据范围准确性对应的分析字段的个数值为6;所述依从性要求对应的分析字段:设备种类,设备类别,设备品种,区域代码,统一社会信用代码,使用证号,检验结论,安全状况等级与检验结论的对照,安全状况登记与下检日期的对照;即依从性要求对应的分析字段的个数值为9;所述记录完备性对应的分析字段:识别码是否完备,设备所在是否完备,检验日期是否完备,设备状态是否完备,下检日期是否完备,制造时间是否完备;即记录完备性对应的分析字段的个数值为6。
步骤S3、对各地区采集的压力容器数据样本进行汇聚,设定理论应达到符合要求的数值,设定每个分析类型的标准值为100,则通过公式:数据符合要求的数值/理论应达到符合要求的数值*(分析类型的标准值100/分析字段的个数值)得到各地区数据样本中对应的每个分析类型的标准化分数;理论应达到符合要求的数值是设定得到,此处的理论应达到符合要求的数值设置为10000;
例如:地区1汇聚数据分析:
步骤S4、设定有i个地区压力容器数据样本,j为分析类型,K为标准化分数,则各地区数据样本中对应的每个分析类型的标准化分数为Kij;则各地区数据样本中对应的每个分析类型的变量权重为Yij=Kij/∑Kij;例如输入4个地区的压力容器数据样本,
这样如得到地区1的日期型准确性变量权重为Y11=83.77/309.01
日期型准确性 | 数值型准确性 | 数据范围准确性 | 依从性要求字段 | 数据值完备性 | |
地区1 | 0.27109155 | 0.287906292 | 0.24154195 | 0.302844281 | 0.232089333 |
地区2 | 0.260703537 | 0.207007569 | 0.264610733 | 0.185553509 | 0.271583897 |
地区3 | 0.211805443 | 0.269890742 | 0.267089947 | 0.239656231 | 0.262533059 |
地区4 | 0.256399469 | 0.235195397 | 0.22675737 | 0.271945979 | 0.233793711 |
步骤S5、使用熵权法得到各地区数据样本中对应的每个分析类型的指标权重wj;所述步骤5进一步具体为:先计算指标信息熵、然后计算信息熵冗余度最后得到指标权重;所述指标信息熵为Ej=-(1/ln(m))Σ(Yij×ln(Yij)),其中m为地区数据样本个数,Yij为变量权重;ln为对数运算符;该示例中地区压力容器数据样本个数为4,得到下表数据。
所述信息熵冗余度为dj=1-Ej;
所述指标权重wj=dj/Σdj。
步骤S6、设定指标综合分数为S,则各地区数据样本中对应的每个分析类型的指标综合得分为Sij=wj×Kij;
步骤S7、根据指标综合得分能得出各地区的压力容器数据汇聚上报的质量。
另外,将指标综合得分设定为:优,则大于等于90分;良,则大于等于80分小于90分;中,则大于等于60分小于80分;差,则小于60分。
总之,本发明通过压力容数据的日期型准确性、数值型准确性、数据范围准确性、依从性要求字段、数据值完备性、记录完备性5个分析类型维度的数据集合进行加权分析后得到各分析类型分析维度的基本数据分值,然后用熵权法对计算获得每个分析类型的最终指标综合分值来各地区的压力容器数据汇聚上报的质量,该方法可用于分析各地区提交压力容器数据质量评估,对各地区压力容器基础数据收集具有指导作用,同时评估后符合要求数据可应用于压力容器安全形势分析评估。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (5)
1.一种基于熵权法的压力容器结构化数据质量评估方法,其特征在于:所述方法通过自动化分析各地区提交的固定式压力容器结构数据,通过压力容数据的日期型准确性、数值型准确性、数据范围准确性、依从性要求字段、记录完备性5个分析类型维度的数据集合进行加权分析后得到各分析类型分析维度的基本数据分值,然后用熵权法对计算获得每个分析类型的最终指标综合分值来各地区的压力容器数据汇聚上报的质量。
2.根据权利要求1所述的一种基于熵权法的压力容器结构化数据质量评估方法,其特征在于:所述方法具体包括如下步骤:
步骤S1、设定压力容器数据的分析类型,所述分析类型分为日期型准确性、数值型准确性、数据范围准确性、依从性要求、以及记录完备性;
步骤S2、从压力容器数据中获得每个分析类型对应的分析字段,并获取分析类型下的各个分析字段中数据符合要求的数值和分析字段的个数值;
步骤S3、对各地区采集的压力容器数据样本进行汇聚,设定理论应达到符合要求的数值,设定每个分析类型的标准值为100,则通过公式:数据符合要求的数值/理论应达到符合要求的数值*(分析类型的标准值100/分析字段的个数值)得到各地区数据样本中对应的每个分析类型的标准化分数;
步骤S4、设定有i个地区压力容器数据样本,j为分析类型,K为标准化分数,则各地区数据样本中对应的每个分析类型的标准化分数为Kij;则各地区数据样本中对应的每个分析类型的变量权重为Yij=Kij/∑Kij;
步骤S5、使用熵权法得到各地区数据样本中对应的每个分析类型的指标权重wj;
步骤S6、设定指标综合分数为S,则各地区数据样本中对应的每个分析类型的指标综合得分为Sij=wj×Kij;
步骤S7、根据指标综合得分能得出各地区的压力容器数据汇聚上报的质量。
3.根据权利要求2所述的一种基于熵权法的压力容器结构化数据质量评估方法,其特征在于:所述日期型准确性对应的分析字段:检验日期,下次检验日期/延期检验日期,使用登记日期,制造日期,最新检验日期;即日期型准确性对应的分析字段的个数值为5;所述数值型准确性对应的分析字段:设备状态,设备所在区域,设计压力,容器内径,容器容积,容器高,设计温度;即日数值型准确性对应的分析字段的个数值为7;所述数据范围准确性对应的分析字段:特种设备使用状态,设备使用场所,设备注册状态,安全状况等级,工作介质,检验类型;即数据范围准确性对应的分析字段的个数值为6;所述依从性要求对应的分析字段:设备种类,设备类别,设备品种,区域代码,统一社会信用代码,使用证号,检验结论,安全状况等级与检验结论的对照,安全状况登记与下检日期的对照;即依从性要求对应的分析字段的个数值为9;所述记录完备性对应的分析字段:识别码是否完备,设备所在是否完备,检验日期是否完备,设备状态是否完备,下检日期是否完备,制造时间是否完备;即记录完备性对应的分析字段的个数值为6。
4.根据权利要求2所述的一种基于熵权法的压力容器结构化数据质量评估方法,其特征在于:所述步骤5进一步具体为:先计算指标信息熵、然后计算信息熵冗余度最后得到指标权重;所述指标信息熵为Ej=-(1/ln(m))Σ(Yij×ln(Yij)),其中m为地区数据样本个数,Yij为变量权重;所述信息熵冗余度为dj=1-Ej;所述指标权重wj=dj/Σdj。
5.根据权利要求2所述的一种基于熵权法的压力容器结构化数据质量评估方法,其特征在于:将指标综合得分设定为:优,则大于等于90分;良,则大于等于80分小于90分;中,则大于等于60分小于80分;差,则小于60分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910275748.5A CN109977106B (zh) | 2019-04-08 | 2019-04-08 | 一种基于熵权法的压力容器结构化数据质量评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910275748.5A CN109977106B (zh) | 2019-04-08 | 2019-04-08 | 一种基于熵权法的压力容器结构化数据质量评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109977106A true CN109977106A (zh) | 2019-07-05 |
CN109977106B CN109977106B (zh) | 2021-05-28 |
Family
ID=67083289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910275748.5A Active CN109977106B (zh) | 2019-04-08 | 2019-04-08 | 一种基于熵权法的压力容器结构化数据质量评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109977106B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722577A (zh) * | 2012-06-05 | 2012-10-10 | 中兴通讯股份有限公司 | 指标动态权重的确定方法及装置 |
US20160062998A1 (en) * | 2014-09-01 | 2016-03-03 | Mapquest, Inc. | Computerized systems and methods for partitioning data for information retrieval |
CN106503206A (zh) * | 2016-10-26 | 2017-03-15 | 国家电网公司 | 一种基于熵权法的通用数据质量评估方法 |
CN107221343A (zh) * | 2017-05-19 | 2017-09-29 | 北京市农林科学院 | 一种数据质量的评估方法及评估系统 |
CN107967571A (zh) * | 2017-12-18 | 2018-04-27 | 青岛科技大学 | 基于熵权法的指标体系生成方法 |
CN108229784A (zh) * | 2017-11-09 | 2018-06-29 | 中国电力科学研究院有限公司 | 一种智能配电网的多维数据质量评价方法及系统 |
CN109359796A (zh) * | 2018-08-17 | 2019-02-19 | 浙江华云信息科技有限公司 | 一种基于多评估指标的电能表生产厂商评价方法 |
CN109409628A (zh) * | 2018-08-17 | 2019-03-01 | 国网浙江省电力有限公司 | 基于计量大数据聚类模型的采集终端生产厂商评价方法 |
CN208666826U (zh) * | 2018-08-21 | 2019-03-29 | 福建省特种设备检验研究院 | 配合大数据电梯维护的手推式电梯乘运质量综合分析装置 |
-
2019
- 2019-04-08 CN CN201910275748.5A patent/CN109977106B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722577A (zh) * | 2012-06-05 | 2012-10-10 | 中兴通讯股份有限公司 | 指标动态权重的确定方法及装置 |
US20160062998A1 (en) * | 2014-09-01 | 2016-03-03 | Mapquest, Inc. | Computerized systems and methods for partitioning data for information retrieval |
CN106503206A (zh) * | 2016-10-26 | 2017-03-15 | 国家电网公司 | 一种基于熵权法的通用数据质量评估方法 |
CN107221343A (zh) * | 2017-05-19 | 2017-09-29 | 北京市农林科学院 | 一种数据质量的评估方法及评估系统 |
CN108229784A (zh) * | 2017-11-09 | 2018-06-29 | 中国电力科学研究院有限公司 | 一种智能配电网的多维数据质量评价方法及系统 |
CN107967571A (zh) * | 2017-12-18 | 2018-04-27 | 青岛科技大学 | 基于熵权法的指标体系生成方法 |
CN109359796A (zh) * | 2018-08-17 | 2019-02-19 | 浙江华云信息科技有限公司 | 一种基于多评估指标的电能表生产厂商评价方法 |
CN109409628A (zh) * | 2018-08-17 | 2019-03-01 | 国网浙江省电力有限公司 | 基于计量大数据聚类模型的采集终端生产厂商评价方法 |
CN208666826U (zh) * | 2018-08-21 | 2019-03-29 | 福建省特种设备检验研究院 | 配合大数据电梯维护的手推式电梯乘运质量综合分析装置 |
Non-Patent Citations (1)
Title |
---|
杨栋枢 等: "基于熵权和层次分析法的数据质量评估研究", 《现代电子技术》 * |
Also Published As
Publication number | Publication date |
---|---|
CN109977106B (zh) | 2021-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101738991B (zh) | 检测产品品质超规与评估产品实际测量值的方法 | |
CN114168906B (zh) | 一种基于云计算的测绘地理信息数据采集系统 | |
CN111242793B (zh) | 医保数据异常的检测方法和装置 | |
CN110502277A (zh) | 一种基于bp神经网络的代码坏味检测方法 | |
CN107679734A (zh) | 一种用于无标签数据分类预测的方法和系统 | |
CN115080379A (zh) | 一种多维度评估软件测试有效性的方法 | |
CN111612241A (zh) | 智能船舶路径规划功能实现性的综合评价方法 | |
CN110930057A (zh) | 基于lof算法的配电变压器检验结果可信度的量化评判方法 | |
WO2022213600A1 (zh) | 基于lstm-cnn的核电站蒸发器涡流信号类型识别方法 | |
Baran et al. | Statistical post‐processing of heat index ensemble forecasts: Is there a royal road? | |
van Wieringen et al. | A comparison of methods for the evaluation of binary measurement systems | |
Liu et al. | Fault diagnosis of subway indoor air quality based on local fisher discriminant analysis | |
CN111914424B (zh) | 一种基于短期测风资料的设计风速取值方法及系统 | |
de Mast et al. | Modeling and evaluating repeatability and reproducibility of ordinal classifications | |
CN101592692B (zh) | 测量机台的评估方法 | |
CN108734393A (zh) | 房源信息的匹配方法、用户设备、存储介质及装置 | |
CN109977106A (zh) | 一种基于熵权法的压力容器结构化数据质量评估方法 | |
CN102982231B (zh) | 软件可信度的定量计算方法 | |
Cheung et al. | Methodology to assess “no-touch” building audit software using simulated utility data | |
Chen et al. | The effect of linear regression modeling approaches on determining facility wide energy savings | |
Kazianka et al. | Assessing the discriminatory power of loss given default models | |
CN111063226A (zh) | 一种电力仿真培训评分方法、系统及存储介质 | |
CN112559308B (zh) | 一种基于统计模型的根告警分析方法 | |
CN111045951B (zh) | 基于无线电业务模型实现无线电应用软件质量测试效果分析处理的方法 | |
CN117933832B (zh) | 航天器地面等效性试验的指标权重评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |