CN111881136A

CN111881136A - 一种实现医疗行业增量数据治理的方法

Info

Publication number: CN111881136A
Application number: CN202010742436.3A
Authority: CN
Inventors: 马良; 刘芳; 陈超
Original assignee: Shandong Health Medical Big Data Co ltd
Current assignee: Shandong Health Medical Big Data Co ltd
Priority date: 2020-07-29
Filing date: 2020-07-29
Publication date: 2020-11-03

Abstract

本发明特别涉及一种实现医疗行业增量数据治理的方法。该实现医疗行业增量数据治理的方法，利用全量数据治理的SQL脚本，利用识别出的增量主键在全量数据治理的SQL脚本中添加过滤条件，提取出医疗行业系统中产生的增量业务数据；利用配置信息表维护增量主键数据的业务识别，实现业务分析和代码处理流程的解耦合，从而将贴源库中各医疗行业系统中产生的增量业务数据进行快速数据治理，并入归一库。该实现医疗行业增量数据治理的方法，充分利用全量数据治理所形成的SQL脚本而无需再次对增量数据进行业务治理分析，极大的减轻了数据治理的复杂度，同时将增量数据的个性化业务分析放入配置信息表DG_INCRE_CONFIG中，实现了个性业务分析与代码处理流程的解耦合。

Description

一种实现医疗行业增量数据治理的方法

技术领域

本发明涉及数据治理技术领域，特别涉及一种实现医疗行业增量数据治理的方法。

背景技术

医疗行业的业务系统众多，主要涉及HIS(Hospital Information System，医院信息系统)、LIS(Laboratory Information Management System，实验室(检验科)信息系统)、RIS(Radiation Information System，放射科信息系统)、PACS(Picture Archiving andCommunication Systems，影像归档和通信系统)、EMR(Electronic Medical Record，电子病历系统)体检，手术麻醉等等。并且这些系统的HIT厂商众多，每个HIT厂商的设计各有不同，这就导致各个医疗系统下的业务数据存储方式多种多样。

数据治理是按照平台既有标准对采集数据合理化处理，对数据的获取、处理、使用进行监管。医疗行业的业务数据复杂多样，把各医疗数据经过汇聚、治理到输出标准数据是一项复杂而繁重的工作，因而目前业内并没有形成统一的数据治理方案。

通常，截止到某个时间节点医疗系统数据库中的现存数据被称为全量数据。

而医疗系统随着业务的进行对数据进行增加，更新和删除操作所产生的数据则被称为增量数据，即包括新增数据、更新数据、删除数据三种。

标准数据是指对全量数据和增量数据进行数据治理，形成的结构统一、值域规范的数据。

数据治理的目的就是对这些采集来的业务数据进行统一治理形成结构相同，数据规范的标准数据。全量数据治理是对静态的数据进行分步处理，最终可实现标准数据的输出。但医疗的业务系统会实时产生新的业务数据(如新的患者就诊)，如何把这些新生成的业务数据识别出来，快速治理并入库是数据治理中一直探索的最佳实践。

为了对纷繁冗杂的医疗行业数据实现科学、统一的数据治理，本发明提出了一种实现医疗行业增量数据治理的方法。

发明内容

本发明为了弥补现有技术的缺陷，提供了一种简单高效的实现医疗行业增量数据治理的方法。

本发明是通过如下技术方案实现的：

一种实现医疗行业增量数据治理的方法，其特征在于：利用全量数据治理的SQL脚本，利用识别出的增量主键在全量数据治理的SQL脚本中添加过滤条件，提取出医疗行业系统中产生的增量业务数据；将个性化的增量业务分析逻辑放入增量配置信息表中，利用配置信息表维护增量主键数据的业务识别，实现业务分析和代码处理流程的解耦合，从而将贴源库中各医疗行业系统中产生的增量业务数据进行快速数据治理，并入归一库。

包括以下步骤：

第一步，利用配置信息表维护增量主键数据的业务识别；

第二步，组装SQL脚本，获取映射到归一库目标表涉及到的所有来源表的下次最大采集时间；

第三步，组装并执行识别增量主键数据的SQL脚本，获取增量主键数据；

第四步，删除目标表中增量主键为删除标识的数据；

第五步，组装并执行增量SQL脚本，实现增量数据进入归一库；

第六步，更新最大采集时间数据为下次最大采集时间。

所述第一步中，记录映射到归一库目标表涉及到的所有来源表的配置信息，并将所有配置信息存入配置信息表DG_INCRE_CONF中；所述第六步中，更新配置信息表 DG_INCRE_CONF中的最大更新时间。

所述配置信息包括：

增量主键字段，即来源表向目标表映射时，形成目标表主键的字段；

增量识别字段，即来源表向目标表映射时，识别来源表增量数据的字段；

最大采集时间，即上次取增量数据时来源表中的增量识别字段所对应的数据最大时间；

下次最大采集时间，即下次取增量数据时来源表中的增量识别字段所对应的数据最大时间。

所述第二步中，根据配置信息组装SQL脚本，计算本次执行增量时所有来源表的增量识别字段所对应的最大采集时间，并将执行结果更新到下次最大采集时间列。

所述第三步中，首先根据配置信息表组装识别增量主键数据的SQL脚本，然后根据医疗机构名称和目标表名称查询并执行识别增量主键数据的SQL脚本，查找来源库表分别大于等于各自上次最大采集时间的增量主键记录，存入增量主键数据表 DG_INCRE_PK_DATA中。

所述识别增量主键数据的SQL脚本的组装模板为：

SELECT增量主键字段，增量标识FROM来源表名WHERE增量识别字段>最大采集时间。

所述第四步中，取出DG_INCRE_PK_DATA表中增量标识为删除的主键数据，在目标表中进行删除操作。

所述第五步中，对目标表的全量SQL脚本添加过滤条件，利用增量主键数据表 DG_INCRE_PK_DATA中的主键数据形成增量SQL脚本；执行增量SQL脚本，增量数据根据有则更新，无则插入的原则进入归一库。

本发明的有益效果是：该实现医疗行业增量数据治理的方法，充分利用全量数据治理所形成的SQL脚本而无需再次对增量数据进行业务治理分析，极大的减轻了数据治理的复杂度，同时将增量数据的个性化业务分析放入配置信息表DG_INCRE_CONFIG中，实现了个性业务分析与代码处理流程的解耦合。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

附图1为医疗行业数据治理流程示意图。

附图2为本发明医疗行业增量数据治理逻辑处理流程示意图。

具体实施方式

为了使本技术领域的人员更好的理解本发明中的技术方案，下面将结合本发明实施例，对本发明实施例中的技术方案进行清楚，完整的描述。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

该实现医疗行业增量数据治理的方法，利用全量数据治理的SQL脚本，利用识别出的增量主键在全量数据治理的SQL脚本中添加过滤条件，提取出医疗行业系统中产生的增量业务数据；将个性化的增量业务分析逻辑放入增量配置信息表中，利用配置信息表维护增量主键数据的业务识别，实现业务分析和代码处理流程的解耦合，从而将贴源库中各医疗行业系统中产生的增量业务数据进行快速数据治理，并入归一库。

包括以下步骤：

第一步，利用配置信息表维护增量主键数据的业务识别；

第四步，删除目标表中增量主键为删除标识的数据；

第六步，更新最大采集时间数据为下次最大采集时间。

所述配置信息包括：

增量主键字段，即来源表向目标表映射时，形成目标表主键的字段，如住院号字段；

增量识别字段，即来源表向目标表映射时，识别来源表增量数据的字段，一般为业务时间字段，如住院日期；

表1配置信息表DG_INCRE_CONF

表2最大采集时间组装SQL表

所述识别增量主键数据的SQL脚本的组装模板为：

表3识别增量主键数据的SQL表

表4增量主键数据表DG_INCRE_PK_DATA

表5全量和增量守脚本示意表

表6全量和增量脚本示意表

以上所述的实施例，只是本发明具体实施方式的一种，本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。

Claims

1.一种实现医疗行业增量数据治理的方法，其特征在于：利用全量数据治理的SQL脚本，利用识别出的增量主键在全量数据治理的SQL脚本中添加过滤条件，提取出医疗行业系统中产生的增量业务数据；将个性化的增量业务分析逻辑放入增量配置信息表中，利用配置信息表维护增量主键数据的业务识别，实现业务分析和代码处理流程的解耦合，从而将贴源库中各医疗行业系统中产生的增量业务数据进行快速数据治理，并入归一库。

2.根据权利要求1所述的实现医疗行业增量数据治理的方法，其特征在于：包括以下步骤：

第一步，利用配置信息表维护增量主键数据的业务识别；

第四步，删除目标表中增量主键为删除标识的数据；

第六步，更新最大采集时间数据为下次最大采集时间。

3.根据权利要求2所述的实现医疗行业增量数据治理的方法，其特征在于：所述第一步中，记录映射到归一库目标表涉及到的所有来源表的配置信息，并将所有配置信息存入配置信息表DG_INCRE_CONF中；所述第六步中，更新配置信息表DG_INCRE_CONF中的最大更新时间。

4.根据权利要求3所述的实现医疗行业增量数据治理的方法，其特征在于：所述配置信息包括：

5.根据权利要求2、3或4所述的实现医疗行业增量数据治理的方法，其特征在于：所述第二步中，根据配置信息组装SQL脚本，计算本次执行增量时所有来源表的增量识别字段所对应的最大采集时间，并将执行结果更新到下次最大采集时间列。

6.根据权利要求5所述的实现医疗行业增量数据治理的方法，其特征在于：所述第三步中，首先根据配置信息表组装识别增量主键数据的SQL脚本，然后根据医疗机构名称和目标表名称查询并执行识别增量主键数据的SQL脚本，查找来源库表分别大于等于各自上次最大采集时间的增量主键记录，存入增量主键数据表DG_INCRE_PK_DATA中。

7.根据权利要求6所述的实现医疗行业增量数据治理的方法，其特征在于：所述识别增量主键数据的SQL脚本的组装模板为：

8.根据权利要求6所述的实现医疗行业增量数据治理的方法，其特征在于：所述第四步中，取出DG_INCRE_PK_DATA表中增量标识为删除的主键数据，在目标表中进行删除操作。

9.根据权利要求6或8所述的实现医疗行业增量数据治理的方法，其特征在于：所述第五步中，对目标表的全量SQL脚本添加过滤条件，利用增量主键数据表DG_INCRE_PK_DATA中的主键数据形成增量SQL脚本；执行增量SQL脚本，增量数据根据有则更新，无则插入的原则进入归一库。