CN105741196A - 一种基于四个维度进行数据质量监测及评价方法 - Google Patents
一种基于四个维度进行数据质量监测及评价方法 Download PDFInfo
- Publication number
- CN105741196A CN105741196A CN201610115562.XA CN201610115562A CN105741196A CN 105741196 A CN105741196 A CN 105741196A CN 201610115562 A CN201610115562 A CN 201610115562A CN 105741196 A CN105741196 A CN 105741196A
- Authority
- CN
- China
- Prior art keywords
- index
- score
- data
- monitoring
- jurisdiction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G06F19/32—
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于四个维度数据质量监测及评价方法,其特征在于,步骤为:首先将数据质量管理体系中所有可监控、可计算的数据指标在指标源中统一编码管理,为每个指标做出明确的定义等。其次将数据传输、整合、分析过程中所有需要监测的指标及对于应用情况的监控指标都纳入监测指标集,并针对上传的业务数据进行基础校验,生成监测报告。然后基于监测报告,参考评估规则,生成评估报告。最后基于评估报告,参考指标考核办法,对机构、区县按不同时间维度分别对各指标进行考核,生成指标级、维度级以及接入平台级别的考核报告。本发明提供的方法能够对各接入平台数据进行全面而完整的科学评估,从而整体提升数据质量。
Description
技术领域
本发明涉及一种对数据质量进行检测及评价的方法。
背景技术
作为所有上层系统应用的基础,数据质量的好坏将直接影响到各类应用功能的使用效果。但是由于各接入平台建设水平参差不齐,上传数据的质和量都存在不同程度的差异,严重影响了数据在上层系统中的应用效果。
发明内容
本发明的目的是将提供一种对数据质量进行检测及评价的方法。
为了达到上述目的,本发明的技术方案是提供了一种基于四个维度进行数据质量监测及评价方法,其特征在于,包括以下步骤:
步骤1、将数据质量管理体系中所有可监控、可计算的数据指标在指标源中统一编码管理,从而形成监测指标,将所有监测指标分为完整性、一致性、规范性和及时性四个维度进行监测,其中:
完整性是为了监测当前数据质量管理体系是否将业务日期内的数据完整上传,为了便于数据质量问题追溯,将完整性监测进一步细分为关联性和业务约束性两类;
一致性是为了监测当前数据质量管理体系上传的统计指标是否与明细报告汇总值相符;
规范性是为了监测当前数据质量管理体系上传的数据是否满足接口中定义的数据规范性要求;
及时性是为了监测当前数据质量管理体系上传的数据是否在业务数据产生后及时上传;
步骤2、计算隶属于关联性的各监测指标的关联率,计算隶属于业务约束性的各监测指标的约束符合率,计算隶属于一致性的各监测指标的明细数据统计结果与业务运营一致率,计算隶属于规范性的各监测指标的规范率,计算隶属于及时性的各监测指标的平均差异天数;
步骤3、分别为关联率、约束符合率、明细数据统计结果与业务运营一致率、规范率、平均差异天数设定不同的等分区间,等分区间对应的最高分值为MAX,根据该得分区间计算分别隶属于关联性、业务约束性、一致性、规范性及及时性的各监测指标的得分;
步骤4、将一致性得分的满分设定为A,计算得到隶属于一致性的N1个监测指标的得分的总和sum1,则将单指标体系得分1的权重,即单指标体系权重1,设为a;
计算得到隶属于关联性的N21个监测指标的得分的总和sum21,计算得到隶属于业务约束性的N22个监测指标的得分的总和sum22,则 将单指标体系得分2的权重,即单指标体系权重2,设为b;
计算得到隶属于规范性的N3个监测指标的得分的总和sum3,则 将单指标体系得分3的权重,即单指标体系权重3,设为c;
计算得到隶属于及时性的N4个监测指标的得分的总和sum4,则 将单指标体系得分4的权重,即单指标体系权重4,设为d;
步骤5、计算得到当前数据质量管理体系的评价得分P,将当前数据质量管理体系的上次评价得分记为P-1,则有:
优选地,在所述步骤5中,所述平滑系数初始化为120%。
优选地,在所述步骤5之后,还包括:
步骤6、设目标区域内有n家机构运行了数据质量管理体系,通过所述步骤1至步骤5分别计算每家机构的数据质量管理体系的评价得分,其中,第i家机构的数据质量管理体系的评价得分为Pi,则目标区域的数据质量评价得分为PD,则有
本发明提出了一种基于四个维度的数据质量监测及评价体系,该体系采用分级量化的方法,向不同的接入平台提供技术支撑和管理措施,从数据一致性、完整性、规范性、及时性四个维度全面监测及提高数据上传质量。
附图说明
图1为本发明的原理示意图。
具体实施方式
为使本发明更明显易懂,兹以优选实施例作详细说明如下。
若将本发明提供的一种基于四个维度进行数据质量监测及评价方法应用在医院所使用的医疗数据管理系统中,则包括如下步骤:
步骤A:如图1所示,本发明以目前区县内所有医院的医疗数据管理系统的数据为基础,将所涉及的所有可监控、可计算的数据指标纳入指标源中统一编码管理,针对上传的业务数据进行基础校验,生成监测报告。同时由于步骤B评估考核方式不同,将所有指标分为完整性、一致性、规范性和及时性四个维度进行监测。
其中,完整性是为了监测各区县平台/机构是否将业务日期内的数据完整上传,为了便于数据质量问题追溯,将完整性监测进一步细分为关联性监测和业务约束性监测两类;一致性是为了监测各区县平台/机构上传的统计指标是否与明细报告汇总值相符;规范性是为了监测各区县平台/机构上传的数据是否满足接口中定义的数据规范性要求;及时性是为了监测各区县平台/机构上传的数据是否在业务数据产生后及时上传。
步骤B:按照考核要求,对区县平台/机构按不同时间维度(周/月/季/年)分别对步骤A中各监测指标进行评估,生成评估报告。各类指标评估办法如下:
表1监测指标评估办法
其中,表1中提到的指标编码10001、10301、20001、31001、40001,分别代表的监测标准如下:
指标10001:挂号表中的患者唯一标识(就诊卡)是否能与患者信息表关联。
指标10301:已出院患者是否具有出院小结。
指标20001:挂号表中统计出的门诊人次与业务量统计表中填报值是否一致。
指标31001:修改标志(XGBZ)编码符合率。
指标40001:业务量统计表(TB_STAT_YWL_Report)上传及时性。
步骤C:基于步骤B对各指标的评估结果,按照考核要求,对各区县/机构按不同时间维度(周/月/季/年)分别对各指标进行考核,单指标满分为10分。各类指标考核办法如表2所示。
表2评估指标考核办法
其中,各指标评分阈值(a/b/c)不同,由市级平台数据质量专管员根据管理要求在系统中进行配置。
步骤D:对步骤C考核指标体系、机构及区县平台进行分数评定。
指标体系分数评定如表3所示。
表3指标体系分数评定
指标体系 | 满分分值 | 权重 |
一致性 | 100 | a |
完整性 | 一致性得分 | b |
规范性 | 一致性得分 | c |
及时性 | 一致性得分 | d |
机构 | 100 | 100% |
其中,一致性指标体系满分设为100分,其他指标体系满分分值设为该机构当期一致性指标体系的实际得分。
计算得到隶属于一致性的N1个监测指标的得分的总和sum1,则 将单指标体系得分1的权重,即单指标体系权重1,设为a。
计算得到隶属于关联性的N21个监测指标的得分的总和sum21,计算得到隶属于业务约束性的N22个监测指标的得分的总和sum22,则 将单指标体系得分2的权重,即单指标体系权重2,设为b。
计算得到隶属于规范性的N3个监测指标的得分的总和sum3,则 将单指标体系得分3的权重,即单指标体系权重3,设为c。
计算得到隶属于及时性的N4个监测指标的得分的总和sum4,则 将单指标体系得分4的权重,即单指标体系权重4,设为d。
机构分数评定:为保障错误的历史数据得到及时有效的清洗,当前数据质量管理体系的评价得分P由上期当前数据质量管理体系的评价得分P-1及四类指标体系得分综合计算得出:
注:
1.各指标体系权重值不同,由市级平台数据质量专管员根据管理要求在系统中进行配置;
2.平滑系数:在浮动满分值的基础上,用于控制综合得分,防止无限下跌,初始化设定为120%;
3.当大于1时,记为1。
区县分数评定:区县分数由计算当期该区县参与考核的机构得分平均数得出,设目标区县内有n家机构运行了数据质量管理体系,通过上述步骤分别计算每家机构的数据质量管理体系的评价得分,其中,第i家机构的数据质量管理体系的评价得分为Pi,则目标区域的数据质量评价得分为PD,则有
通过本发明上述步骤,从数据上传的完整性、一致性、规范性和及时性四个维度对数据质量进行了综合评估,从而达到了进一步夯实数据基础,整体提升数据质量的目的。
Claims (3)
1.一种基于四个维度进行数据质量监测及评价方法,其特征在于,包括以下步骤:
步骤1、将数据质量管理体系中所有可监控、可计算的数据指标在指标源中统一编码管理,从而形成监测指标,将所有监测指标分为完整性、一致性、规范性和及时性四个维度进行监测,其中:
完整性是为了监测当前数据质量管理体系是否将业务日期内的数据完整上传,为了便于数据质量问题追溯,将完整性监测进一步细分为关联性和业务约束性两类;
一致性是为了监测当前数据质量管理体系上传的统计指标是否与明细报告汇总值相符;
规范性是为了监测当前数据质量管理体系上传的数据是否满足接口中定义的数据规范性要求;
及时性是为了监测当前数据质量管理体系上传的数据是否在业务数据产生后及时上传;
步骤2、计算隶属于关联性的各监测指标的关联率,计算隶属于业务约束性的各监测指标的约束符合率,计算隶属于一致性的各监测指标的明细数据统计结果与业务运营一致率,计算隶属于规范性的各监测指标的规范率,计算隶属于及时性的各监测指标的平均差异天数;
步骤3、分别为关联率、约束符合率、明细数据统计结果与业务运营一致率、规范率、平均差异天数设定不同的等分区间,等分区间对应的最高分值为MAX,根据该得分区间计算分别隶属于关联性、业务约束性、一致性、规范性及及时性的各监测指标的得分;
步骤4、将一致性得分的满分设定为A,计算得到隶属于一致性的N1个监测指标的得分的总和sum1,则将单指标体系得分1的权重,即单指标体系权重1,设为a;
计算得到隶属于关联性的N21个监测指标的得分的总和sum21,计算得到隶属于业务约束性的N22个监测指标的得分的总和sum22,则 将单指标体系得分2的权重,即单指标体系权重2,设为b;
计算得到隶属于规范性的N3个监测指标的得分的总和sum3,则 将单指标体系得分3的权重,即单指标体系权重3,设为c;
计算得到隶属于及时性的N4个监测指标的得分的总和sum4,则 将单指标体系得分4的权重,即单指标体系权重4,设为d;
步骤5、计算得到当前数据质量管理体系的评价得分P,将当前数据质量管理体系的上次评价得分记为P-1,则有:
2.如权利要求1所述的一种基于四个维度进行数据质量监测及评价方法,其特征在于,在所述步骤5中,所述平滑系数初始化为120%。
3.如权利要求1所述的一种基于四个维度进行数据质量监测及评价方法,其特征在于,在所述步骤5之后,还包括:
步骤6、设目标区域内有n家机构运行了数据质量管理体系,通过所述步骤1至步骤5分别计算每家机构的数据质量管理体系的评价得分,其中,第i家机构的数据质量管理体系的评价得分为Pi,则目标区域的数据质量评价得分为PD,则有
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610115562.XA CN105741196A (zh) | 2016-03-01 | 2016-03-01 | 一种基于四个维度进行数据质量监测及评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610115562.XA CN105741196A (zh) | 2016-03-01 | 2016-03-01 | 一种基于四个维度进行数据质量监测及评价方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105741196A true CN105741196A (zh) | 2016-07-06 |
Family
ID=56249530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610115562.XA Pending CN105741196A (zh) | 2016-03-01 | 2016-03-01 | 一种基于四个维度进行数据质量监测及评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105741196A (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106383984A (zh) * | 2016-08-30 | 2017-02-08 | 南京邮电大学 | 基于mmtd的大数据数据质量有效性评价方法 |
CN106874483A (zh) * | 2017-02-20 | 2017-06-20 | 山东鲁能软件技术有限公司 | 一种基于大数据技术的图形化的数据质量评测的装置及方法 |
CN107730115A (zh) * | 2017-10-17 | 2018-02-23 | 云南大学 | 一种基于ahp的多源位置轨迹数据的质量评估方法 |
CN107808259A (zh) * | 2017-11-22 | 2018-03-16 | 广州拓息信息技术有限公司 | 一种基于明细数据的运营状态在线监测方法 |
CN108334636A (zh) * | 2018-03-02 | 2018-07-27 | 成都康赛信息技术有限公司 | 数据质量评估方法 |
CN109460918A (zh) * | 2018-11-09 | 2019-03-12 | 深圳互联先锋科技有限公司 | 一种运维工作评价方法及系统 |
CN109508874A (zh) * | 2018-10-30 | 2019-03-22 | 平安医疗健康管理股份有限公司 | 系统质量分析方法、装置、服务器及存储介质 |
CN110136789A (zh) * | 2019-05-14 | 2019-08-16 | 浪潮软件集团有限公司 | 一种基于电子病历应用的数据治理质量检测方法 |
CN110263229A (zh) * | 2019-06-27 | 2019-09-20 | 北京中油瑞飞信息技术有限责任公司 | 一种基于数据湖的数据治理方法及装置 |
CN110648756A (zh) * | 2019-09-11 | 2020-01-03 | 北京亚信数据有限公司 | 一种确定医疗数据质量的方法、装置及计算设备 |
CN110837970A (zh) * | 2019-11-11 | 2020-02-25 | 重庆亚德科技股份有限公司 | 一种区域卫生平台质控方法和系统 |
CN111143623A (zh) * | 2019-12-31 | 2020-05-12 | 科技谷(厦门)信息技术有限公司 | 一种大数据环境下的数据质量监控方法 |
CN111582628A (zh) * | 2020-03-24 | 2020-08-25 | 网宿科技股份有限公司 | 质量评估方法及装置 |
CN111832865A (zh) * | 2019-04-23 | 2020-10-27 | 广州数鹏通科技有限公司 | 平台信息传播质量的检测方法、装置、计算机设备 |
CN111930794A (zh) * | 2020-06-30 | 2020-11-13 | 中经网数据有限公司 | 统计指标编码规范化管理系统及方法 |
CN112001562A (zh) * | 2020-09-02 | 2020-11-27 | 中国灌溉排水发展中心 | 一种灌溉用水数据校验方法及装置 |
CN115292302A (zh) * | 2022-10-08 | 2022-11-04 | 北京天健源达科技股份有限公司 | 数据质量分值的确定方法及系统 |
CN115310865A (zh) * | 2022-09-21 | 2022-11-08 | 中检科(北京)化妆品技术有限公司 | 基于化妆品检测技术的产品全质量生命周期质量管控平台 |
CN117390009A (zh) * | 2023-12-12 | 2024-01-12 | 浪潮软件科技有限公司 | 一种动态配置的数据质量评价方法及装置 |
-
2016
- 2016-03-01 CN CN201610115562.XA patent/CN105741196A/zh active Pending
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106383984A (zh) * | 2016-08-30 | 2017-02-08 | 南京邮电大学 | 基于mmtd的大数据数据质量有效性评价方法 |
CN106874483A (zh) * | 2017-02-20 | 2017-06-20 | 山东鲁能软件技术有限公司 | 一种基于大数据技术的图形化的数据质量评测的装置及方法 |
CN107730115A (zh) * | 2017-10-17 | 2018-02-23 | 云南大学 | 一种基于ahp的多源位置轨迹数据的质量评估方法 |
CN107808259A (zh) * | 2017-11-22 | 2018-03-16 | 广州拓息信息技术有限公司 | 一种基于明细数据的运营状态在线监测方法 |
CN108334636A (zh) * | 2018-03-02 | 2018-07-27 | 成都康赛信息技术有限公司 | 数据质量评估方法 |
CN109508874A (zh) * | 2018-10-30 | 2019-03-22 | 平安医疗健康管理股份有限公司 | 系统质量分析方法、装置、服务器及存储介质 |
CN109460918A (zh) * | 2018-11-09 | 2019-03-12 | 深圳互联先锋科技有限公司 | 一种运维工作评价方法及系统 |
CN111832865A (zh) * | 2019-04-23 | 2020-10-27 | 广州数鹏通科技有限公司 | 平台信息传播质量的检测方法、装置、计算机设备 |
CN110136789A (zh) * | 2019-05-14 | 2019-08-16 | 浪潮软件集团有限公司 | 一种基于电子病历应用的数据治理质量检测方法 |
CN110263229A (zh) * | 2019-06-27 | 2019-09-20 | 北京中油瑞飞信息技术有限责任公司 | 一种基于数据湖的数据治理方法及装置 |
CN110648756A (zh) * | 2019-09-11 | 2020-01-03 | 北京亚信数据有限公司 | 一种确定医疗数据质量的方法、装置及计算设备 |
CN110837970A (zh) * | 2019-11-11 | 2020-02-25 | 重庆亚德科技股份有限公司 | 一种区域卫生平台质控方法和系统 |
CN111143623A (zh) * | 2019-12-31 | 2020-05-12 | 科技谷(厦门)信息技术有限公司 | 一种大数据环境下的数据质量监控方法 |
CN111582628A (zh) * | 2020-03-24 | 2020-08-25 | 网宿科技股份有限公司 | 质量评估方法及装置 |
CN111582628B (zh) * | 2020-03-24 | 2024-04-09 | 网宿科技股份有限公司 | 质量评估方法及装置 |
CN111930794A (zh) * | 2020-06-30 | 2020-11-13 | 中经网数据有限公司 | 统计指标编码规范化管理系统及方法 |
CN112001562A (zh) * | 2020-09-02 | 2020-11-27 | 中国灌溉排水发展中心 | 一种灌溉用水数据校验方法及装置 |
CN115310865A (zh) * | 2022-09-21 | 2022-11-08 | 中检科(北京)化妆品技术有限公司 | 基于化妆品检测技术的产品全质量生命周期质量管控平台 |
CN115292302A (zh) * | 2022-10-08 | 2022-11-04 | 北京天健源达科技股份有限公司 | 数据质量分值的确定方法及系统 |
CN115292302B (zh) * | 2022-10-08 | 2023-02-17 | 北京天健源达科技股份有限公司 | 数据质量分值的确定方法及系统 |
CN117390009A (zh) * | 2023-12-12 | 2024-01-12 | 浪潮软件科技有限公司 | 一种动态配置的数据质量评价方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105741196A (zh) | 一种基于四个维度进行数据质量监测及评价方法 | |
Freedman et al. | A solution to the ecological inference problem | |
CN104766259A (zh) | 一种基于单病种模型的医疗临床质量监测与评价系统 | |
US20150220868A1 (en) | Evaluating Data Quality of Clinical Trials | |
Woodall et al. | The use of control charts in healthcare | |
CN111695836B (zh) | 临床试验在线运行管控集成系统 | |
US20140207477A1 (en) | Hospital composite quality scoring and rating methodology | |
CN103440421A (zh) | 医学数据处理方法和系统 | |
Kaufman | The national dropout data collection system: Assessing consistency | |
CN116644869B (zh) | 一种实时数据分析与公共卫生事件预测系统 | |
Dimitrijevska-Markoski | The impact of performance measurement and performance information use on municipal and county performance | |
Ashwell et al. | Problems measuring community health status at a local level: Papua New Guinea's health information system | |
Williams et al. | A state wide validation and utilisation study of the Queensland emergency nursing workforce tool | |
Millard et al. | Measuring and modelling surgical bed usage. | |
CN108630320A (zh) | 一种基于医保大数据测算疾病患病率的方法 | |
Webster et al. | Estimating the Time Involved in Managing the'Unoccupied Bed:'A Time and Motion Study | |
Potancok et al. | How to measure benefits of non-standard healthcare systems | |
CN102222269A (zh) | 一种高速公路机电设施养护评价的模糊分层评价方法 | |
CN112163964A (zh) | 风险预测方法、装置、电子设备及存储介质 | |
Kang et al. | RTLS and EHR enabled workflow modeling in the emergency department | |
De Santis et al. | An optimal non-uniform piecewise constant approximation for the patient arrival rate for a more efficient representation of the Emergency Departments arrival process | |
Mullet et al. | Descriptive epidemiology of local public health systems | |
Tsan et al. | Quality indicators in the Department of Veterans Affairs nursing home care units: a preliminary assessment | |
CN108776935A (zh) | 一种适用于医疗系统的审核平台 | |
Zuniga et al. | Multi-criteria assessment of county public health capability disparities |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160706 |