CN110853715A - 医疗数据可视化的处理方法、系统、存储介质及电子设备 - Google Patents
医疗数据可视化的处理方法、系统、存储介质及电子设备 Download PDFInfo
- Publication number
- CN110853715A CN110853715A CN201910899880.3A CN201910899880A CN110853715A CN 110853715 A CN110853715 A CN 110853715A CN 201910899880 A CN201910899880 A CN 201910899880A CN 110853715 A CN110853715 A CN 110853715A
- Authority
- CN
- China
- Prior art keywords
- data
- medical data
- medical
- cleaning
- identification information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013079 data visualisation Methods 0.000 title claims abstract description 21
- 238000003860 storage Methods 0.000 title claims abstract description 16
- 238000003672 processing method Methods 0.000 title claims abstract description 9
- 238000004140 cleaning Methods 0.000 claims abstract description 84
- 230000002776 aggregation Effects 0.000 claims abstract description 58
- 238000004220 aggregation Methods 0.000 claims abstract description 58
- 238000003745 diagnosis Methods 0.000 claims abstract description 33
- 230000004931 aggregating effect Effects 0.000 claims abstract description 23
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000004590 computer program Methods 0.000 claims description 18
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 5
- 239000003814 drug Substances 0.000 description 8
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 229940079593 drug Drugs 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000008030 elimination Effects 0.000 description 4
- 238000003379 elimination reaction Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2379—Updates performed during online database operations; commit processing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供了医疗数据可视化的处理方法、系统、存储介质及电子设备,其方法包括:获取医疗机构的医疗数据,根据主键唯一标识进行去同;获取数据标识信息,根据数据标识信息对同一诊疗事件的医疗数据进行聚合,生成预设维度的聚合表,数据标识信息包括医疗机构代码和就诊流水号;根据数据清洗配置主表对聚合表中的字段进行清洗,得到标化之后的医疗数据表;从医疗数据表中提取最细粒度的指标数据生成事实数据表;将事实数据表中相同维度不同指标的数据进行聚合,形成页面展示数据。本发明将不同医疗机构的医疗数据按照统一的方式进行梳理,然后按照用户要求的维度进行展示,便于用户全方位地了解不同维度的医疗机构的情况。
Description
技术领域
本发明涉及医疗数据处理领域,尤指医疗数据可视化的处理方法、系统、存储介质及电子设备。
背景技术
由于医院业务量十分庞大,对业务的统计也变得十分的困难,准确的记录业务产出的费用、进行各种医疗数据分析是十分重要的,大到一个月的收入分析,例如各种费用类型所占的比例、各个科室的业务情况,小到每天各个单位的工作量,例如医生处方量、收费员收费量、发药员发药次数的统计分析等,都是医疗数据的重要分析对象。
但是,现有的医疗数据,不同的医院或者医疗机构都分别存放,存储格式各异,数据内容各不相同,更重要的是互不分享,卫生管理机构如果需要查看当地的卫生健康数据,则要到每个医院进行调查分析,工作量十分庞大,并且因为数据源差异很大,同时由于数据各自独立,分析维度难以统一,数据内容也各不相同,很难实现统一的数据展示,可读性较差,不利于监管者对数据进行全局掌握。
发明内容
本发明的目的是提供医疗数据可视化的处理方法、系统、存储介质及电子设备,实现将不同医疗机构的医疗数据按照统一的方式进行梳理,然后按照用户要求的维度进行展示,便于用户全方位地了解不同维度的医疗机构的情况。
本发明提供的技术方案如下:
本发明提供医疗数据可视化的处理方法,包括:
获取医疗机构的医疗数据,根据所述医疗数据中的主键唯一标识进行去同得到核心库医疗数据;
获取所述核心库医疗数据的数据标识信息,根据所述数据标识信息对同一诊疗事件的医疗数据进行聚合,根据多个诊疗事件的医疗数据生成预设维度的聚合表,所述数据标识信息包括医疗机构代码和就诊流水号;
根据数据清洗配置主表对所述聚合表中的字段进行清洗,得到标化之后的医疗数据表;
从所述医疗数据表中提取最细粒度的指标数据生成事实数据表;
将事实数据表中相同维度不同指标的数据进行聚合,形成页面展示数据。
进一步的,获取医疗机构的医疗数据,根据所述医疗数据中的主键唯一标识进行去同得到核心库医疗数据具体包括:
获取医疗机构的医疗数据接入到缓存库中,识别所述医疗数据中每一条数据的主键唯一标识;
根据主键唯一标识将缓存库中的医疗数据与核心库中的医疗数据进行匹配;
若某一条医疗数据对应的主键唯一标识相同且数据类型相同,则删除核心库中所述主键唯一标识对应的医疗数据,将缓存库中所述主键唯一标识对应的医疗数据插入到核心库中得到核心库医疗数据。
进一步的,获取所述核心库医疗数据的数据标识信息,根据所述数据标识信息对同一诊疗事件的医疗数据进行聚合,根据多个诊疗事件的医疗数据生成预设维度的聚合表,所述数据标识信息包括医疗机构代码和就诊流水号具体包括:
根据任意一个数据标识信息从所述核心库医疗数据的各个数据表中选取属于同一诊疗事件的目标医疗数据;
将多个数据标识信息对应的目标医疗数据中预设维度的数据进行聚合,生成预设维度的聚合表。
进一步的,根据数据清洗配置主表对所述聚合表中的字段进行清洗,得到标化之后的医疗数据表具体包括:
根据数据清洗配置主表识别所述聚合表中的待清洗字段;
根据所述数据清洗配置主表中的清洗规则对所述待清洗字段进行清洗,得到标化之后的医疗数据表,所述清洗规则包括清洗顺序以及清洗后的字段。
本发明还提供医疗数据可视化的处理系统,包括:
去同模块,获取医疗机构的医疗数据,根据所述医疗数据中的主键唯一标识进行去同得到核心库医疗数据;
聚合模块,获取所述核心库医疗数据的数据标识信息,根据所述数据标识信息对所述去同模块处理之后的同一诊疗事件的医疗数据进行聚合,根据多个诊疗事件的医疗数据生成预设维度的聚合表;
清洗模块,根据数据清洗配置主表对所述聚合模块得到的所述聚合表中的字段进行清洗,得到标化之后的医疗数据表;
提取模块,从所述清洗模块得到的所述医疗数据表中提取最细粒度的指标数据生成事实数据表;
处理模块,将所述提取模块得到的事实数据表中相同维度不同指标数据进行聚合,形成页面展示数据。
进一步的,所述去同模块具体包括:
获取单元,获取医疗机构的医疗数据接入到缓存库中;
识别单元,识别所述获取单元获取的所述医疗数据中每一条数据的主键唯一标识;
匹配单元,根据所述识别单元识别的主键唯一标识将缓存库中的医疗数据与核心库中的医疗数据进行匹配;
去同单元,若所述匹配单元得到某一条医疗数据对应的主键唯一标识相同且数据类型相同,则删除核心库中所述主键唯一标识对应的医疗数据,将缓存库中所述主键唯一标识对应的医疗数据插入到核心库中获取所述核心库医疗数据的数据标识信息,根据所述数据标识信息。
进一步的,所述聚合模块具体包括:
选取单元,根据任意一个数据标识信息从所述医疗数据的各个数据表中选取属于同一诊疗事件的目标医疗数据;
聚合单元,将所述选取单元选取的多个数据标识信息对应的目标医疗数据中预设维度的数据进行聚合,生成预设维度的聚合表。
进一步的,所述清洗模块具体包括:
分析单元,根据数据清洗配置主表识别所述聚合表中的待清洗字段;
清洗单元,根据所述数据清洗配置主表中的清洗规则对所述分析单元得到的所述待清洗字段进行清洗,得到标化之后的医疗数据表,所述清洗规则包括清洗顺序以及清洗后的字段。
本发明还提供一种存储介质,该存储介质上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现上述的方法。
本发明还提供一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现上述的方法。
通过本发明提供的医疗数据可视化的处理方法、系统、存储介质及电子设备,将不同医疗机构的医疗数据按照统一的方式进行梳理,然后按照用户要求的维度进行展示,便于用户全方位地了解不同维度的医疗机构的情况.
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对医疗数据可视化的处理方法、系统、存储介质及电子设备的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种医疗数据可视化的处理方法的一个实施例的流程图;
图2是本发明一种医疗数据可视化的处理方法的另一个实施例的流程图;
图3是本发明一种医疗数据可视化的处理方法的另一个实施例的流程图;
图4是本发明一种医疗数据可视化的处理系统的一个实施例的结构示意图;
图5是本发明一种医疗数据可视化的处理系统的另一个实施例的结构示意图。
具体实施方式
为了能够更加清楚地说明本发明实施例或现有技术中的技术方案,下面将对照说明书附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并且获得其他的实施方式。
为了使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
本发明的一个实施例,如图1所示,医疗数据可视化的处理方法,包括:
S100获取医疗机构的医疗数据,根据所述医疗数据中的主键唯一标识进行去同得到核心库医疗数据;
S200获取所述核心库医疗数据的数据标识信息,根据所述数据标识信息对同一诊疗事件的医疗数据进行聚合,根据多个诊疗事件的医疗数据生成预设维度的聚合表,所述数据标识信息包括医疗机构代码和就诊流水号;
S300根据数据清洗配置主表对所述聚合表中的字段进行清洗,得到标化之后的医疗数据表;
S400从所述医疗数据表中提取最细粒度的指标数据生成事实数据表;
S500将事实数据表中相同维度不同指标的数据进行聚合,形成页面展示数据。
具体的,本实施例中,首先系统从各个平台获取各个省市的医疗机构的医疗数据,其中各个医疗机构的医疗数据自身已经进行了初步的整理,例如医疗数据包括门诊记录表、门诊收费明细表、处方明细表等,为了便于区分,每个数据表都有属于自己唯一的主键唯一标识,用于识别数据表的种类等信息,另外每个数据表中都包含若干的就诊数据。由于就诊数据的每一条数据都是根据用户的每一次就诊产生的,因此每次用户就诊时系统为用户此次就诊分配一个唯一的就诊流水号,并且各个医疗机构都分配有唯一的医疗机构代码,之后基于同一就诊事件所产生的所有就诊数据都与该医疗机构代码和就诊流水号进行关联,并且根据医疗机构代码和就诊流水号生成数据标识信息。该医疗机构代码和就诊流水号可以是各个医疗机构在自身的医疗机构代码之外按照各自的规则进行分配的,也可以是基于自身的医疗机构代码编码分配。
由于是从多个平台获取各个医疗机构的医疗数据,因此可能出现相同重复的医疗数据,因此基于医疗数据中各个数据标准的主键唯一标识进行去同。之后根据数据标识信息将属于同一诊疗事件但是属于获取的不同的数据表中的医疗数据进行聚合,根据多个诊疗事件的医疗数据生成预设维度的聚合表。其中,预设维度为用户自身进行设置,例如门诊费用聚合大宽表等。
但是,由于各个医疗机构的部门构架不同,各自的规则也不同,因此系统设置有数据清洗配置主表,其中包含清洗顺序、清洗规则、清洗后字段等,清洗后字段可以是系统自身制定的统一的标准,也可以是直接获取的权威机构制定发布的标准。
因此,根据数据清洗配置主表对聚合表中的字段进行清洗,得到标化之后的医疗数据表,医疗数据表中的每个数据都按照统一的标准进行标注,便于后续识别。然后,从各个医疗数据表中提取最细粒度的指标数据生成事实数据表,例如,对于时间指标,最细粒度的单位为一天,对于就诊对象的指标,最细粒度为某个医疗机构的某个科室的某个医生,对应的指标数据为一天内某个医生的接诊人数、医疗费用、处方用药等。
最后,将事实数据表中相同维度不同指标的数据进行聚合,形成页面展示数据。其中维度为用户想要进行查看的数据对象,例如年、季、月、日、省行政区划、市行政区划、区县行政区划、医疗机构、科室、医生等。因此,根据维度对事实数据表中的指标数据进行聚合,例如,当对应的维度为某月份某个医疗机构时,想要查询对应的药品支出费用,则聚合该月份内每一天中该医疗机构中每个科室中每个医生的药品支出费用,从而得到相应的页面展示数据。
本发明获取不同医疗机构的医疗数据,对其中重复的数据进行去同,然后按照设置的数据清洗配置表对医疗数据进行清洗标化,进行标准化、统一化,然后用户要求的维度进行统计聚合,便于用户全方位地了解不同维度的医疗机构的情况。
本发明的另一个实施例,是上述的实施例的优化实施例,如图2所示,本实施例与上述的实施例相比,主要改进在于,S100获取医疗机构的医疗数据,根据所述医疗数据中的主键唯一标识进行去同得到核心库医疗数据具体包括:
S110获取医疗机构的医疗数据接入到缓存库中,识别所述医疗数据中每一条数据的主键唯一标识;
S120根据主键唯一标识将缓存库中的医疗数据与核心库中的医疗数据进行匹配;
S130若某一条医疗数据对应的主键唯一标识相同且数据类型相同,则删除核心库中所述主键唯一标识对应的医疗数据,将缓存库中所述主键唯一标识对应的医疗数据插入到核心库中得到核心库医疗数据。
具体的,本实施例中,由于是从多个医疗机构获取各个医疗机构的医疗数据,而同一医疗机构的数据可能被多个平台获取,因此可能出现相同重复的医疗数据。另外还可能存在挂号表中的业务时间被更改导致数据重复出现,而更改之后的数据在时间轴上是前面更改的数据的。获取医疗机构的医疗数据,并先暂时将医疗数据接入到缓存库中,识别医疗数据中每个数据表的主键唯一标识,将该数据表的主键唯一标识与核心库中存储的数据表的主键唯一标识进行匹配,如果匹配主键唯一标识相同且数据类型相同,则删除核心库中对应的数据表,将缓存库中对应的数据表去同后插入到核心库中得到核心库医疗数据。其中,因匹配主键唯一标识相同且数据类型相同意味着该条医疗数据的数据表所有的信息相同,为同一个数据表,而具有相同就诊主键唯一标识的但数据类型不相同的则不进行删除,其中数据类型指医疗数据对应的类型,例如费用支出、药品清单等。
本发明首先将获取的医疗数据放入到缓存库中,然后将其与存储在核心库中的数据进行匹配,如果重复则将核心库中的数据删除,将缓存库中对应的医疗数据去同后插入到核心库中,从而确保核心库中的数据相互之间不重复,并且为最新的数据。
本发明的另一个实施例,是上述的实施例的优化实施例,如图3所示,本实施例与上述的实施例相比,主要改进在于,S200获取所述核心库医疗数据的数据标识信息,根据所述数据标识信息对同一诊疗事件的医疗数据进行聚合,根据多个诊疗事件的医疗数据生成预设维度的聚合表,所述数据标识信息包括医疗机构代码和就诊流水号具体包括:
S210根据任意一个数据标识信息从所述核心库医疗数据的各个数据表中选取属于同一诊疗事件的目标医疗数据;
S220将多个数据标识信息对应的目标医疗数据中预设维度的数据进行聚合,生成预设维度的聚合表;
S300根据数据清洗配置主表对所述聚合表中的字段进行清洗,得到标化之后的医疗数据表具体包括:
S310根据数据清洗配置主表识别所述聚合表中的待清洗字段;
S320根据所述数据清洗配置主表中的清洗规则对所述待清洗字段进行清洗,得到标化之后的医疗数据表,所述清洗规则包括清洗顺序以及清洗后的字段。
具体的,本实施例中,根据数据标识信息将属于同一诊疗事件但是属于获取的不同的统计表中的医疗数据进行聚合,例如门诊就诊记录表、处方明细表、门诊收费明细表、检验检查表等全部都进行聚合,然后根据多个诊疗事件的医疗数据生成预设维度的聚合表。该预设维度为用户想要进行可视化查看的维度,例如门诊费用聚合大宽表,通过数据标识信息与处方明细表、收费明细表关联整合成,里面整合了本次门诊所产生的费用、开方医生等信息。
但是,由于各个医疗机构的部门构架不同,各自的规则也不同,例如对于同样的疾病A,第一家医疗机构对应的代码可能是001,第二家对应的代码可能是002。对此此类情形,系统设置有数据清洗配置主表,其中包含清洗顺序、清洗规则、清洗后字段等,例如上述的疾病A的代码对应的清洗后字段为000,则所有涉及到疾病A的医疗数据的代码更改为000。清洗后字段可以是系统自身制定的统一的标准,也可以是直接获取的权威机构制定发布的标准。因此,根据数据清洗配置主表对聚合表中的字段进行清洗,得到标化之后的医疗数据表,医疗数据表中的每个数据都按照统一的标准进行标注,便于后续识别。
本申请按照设置的数据清洗配置表对医疗数据进行清洗标化,进行标准化、统一化,然后用户要求的维度进行统计聚合,便于用户全方位地了解不同维度的医疗机构的情况。
本发明的一个实施例,如图4所示,医疗数据可视化的处理系统100,包括:
去同模块110,获取医疗机构的医疗数据,根据所述医疗数据中的主键唯一标识进行去同;
聚合模块120,根据主键唯一标识对所述去同模块110处理之后的同一诊疗事件的医疗数据进行聚合,根据多个诊疗事件的医疗数据生成预设维度的聚合表;
清洗模块130,根据数据清洗配置主表对所述聚合模块120得到的所述聚合表中的字段进行清洗,得到标化之后的医疗数据表;
提取模块140,从所述清洗模块130得到的所述医疗数据表中提取最细粒度的指标数据生成事实数据表;
处理模块150,将所述提取模块140得到的事实数据表中相同维度不同指标数据进行聚合,形成页面展示数据。
具体的,本实施例中,首先系统从各个平台获取各个省市的医疗机构的医疗数据,其中各个医疗机构的医疗数据自身已经进行了初步的整理,例如医疗数据包括门诊记录表、门诊收费明细表、处方明细表等,为了便于区分,每个数据表都有属于自己唯一的主键唯一标识,用于识别数据表的种类等信息,另外每个数据表中都包含若干的就诊数据。由于就诊数据的每一条数据都是根据用户的每一次就诊产生的,因此每次用户就诊时系统为用户此次就诊分配一个唯一的就诊流水号,并且各个医疗机构都分配有唯一的医疗机构代码,之后基于同一就诊事件所产生的所有就诊数据都与该医疗机构代码和就诊流水号进行关联,并且根据医疗机构代码和就诊流水号生成数据标识信息。该医疗机构代码和就诊流水号可以是各个医疗机构在自身的医疗机构代码之外按照各自的规则进行分配的,也可以是基于自身的医疗机构代码编码分配。
由于是从多个平台获取各个医疗机构的医疗数据,因此可能出现相同重复的医疗数据,因此基于医疗数据中各个数据标准的主键唯一标识进行去同。之后根据数据标识信息将属于同一诊疗事件但是属于获取的不同的数据表中的医疗数据进行聚合,根据多个诊疗事件的医疗数据生成预设维度的聚合表。其中,预设维度为用户自身进行设置,例如门诊费用聚合大宽表等。
但是,由于各个医疗机构的部门构架不同,各自的规则也不同,因此系统设置有数据清洗配置主表,其中包含清洗顺序、清洗规则、清洗后字段等,清洗后字段可以是系统自身制定的统一的标准,也可以是直接获取的权威机构制定发布的标准。
因此,根据数据清洗配置主表对聚合表中的字段进行清洗,得到标化之后的医疗数据表,医疗数据表中的每个数据都按照统一的标准进行标注,便于后续识别。然后,从各个医疗数据表中提取最细粒度的指标数据生成事实数据表,例如,对于时间指标,最细粒度的单位为一天,对于就诊对象的指标,最细粒度为某个医疗机构的某个科室的某个医生,对应的指标数据为一天内某个医生的接诊人数、医疗费用、处方用药等。
最后,将事实数据表中相同维度不同指标的数据进行聚合,形成页面展示数据。其中维度为用户想要进行查看的数据对象,例如年、季、月、日、省行政区划、市行政区划、区县行政区划、医疗机构、科室、医生等。因此,根据维度对事实数据表中的指标数据进行聚合,例如,当对应的维度为某月份某个医疗机构时,想要查询对应的药品支出费用,则聚合该月份内每一天中该医疗机构中每个科室中每个医生的药品支出费用,从而得到相应的页面展示数据。
本发明获取不同医疗机构的医疗数据,对其中重复的数据进行去同,然后按照设置的数据清洗配置表对医疗数据进行清洗标化,进行标准化、统一化,然后用户要求的维度进行统计聚合,便于用户全方位地了解不同维度的医疗机构的情况。
本发明的另一个实施例,是上述的实施例的优化实施例,如图5所示,本实施例与上述的实施例相比,主要改进在于,S100获取医疗机构的医疗数据,根据所述医疗数据中的主键唯一标识进行去同具体包括:
所述去同模块110具体包括:
获取单元111,获取医疗机构的医疗数据接入到缓存库中;
识别单元,识别所述获取单元111获取的所述医疗数据中每一条数据的主键唯一标识;
匹配单元113,根据所述识别单元识别的主键唯一标识将缓存库中的医疗数据与核心库中的医疗数据进行匹配;
去同单元114,若所述匹配单元113得到某一条医疗数据对应的主键唯一标识相同且数据类型相同,则删除核心库中所述主键唯一标识对应的医疗数据,将缓存库中所述主键唯一标识对应的医疗数据插入到核心库中;
具体的,本实施例中,由于是从多个医疗机构获取各个医疗机构的医疗数据,而同一医疗机构的数据可能被多个平台获取,因此可能出现相同重复的医疗数据。另外还可能存在挂号表中的业务时间被更改导致数据重复出现,而更改之后的数据在时间轴上是前面更改的数据的。获取医疗机构的医疗数据,并先暂时将医疗数据接入到缓存库中,识别医疗数据中每个数据表的主键唯一标识,将该数据表的主键唯一标识与核心库中存储的数据表的主键唯一标识进行匹配,如果匹配主键唯一标识相同且数据类型相同,则删除核心库中对应的数据表,将缓存库中对应的数据表去同后插入到核心库中得到核心库医疗数据。其中,因匹配主键唯一标识相同且数据类型相同意味着该条医疗数据的数据表所有的信息相同,为同一个数据表,而具有相同就诊主键唯一标识的但数据类型不相同的则不进行删除,其中数据类型指医疗数据对应的类型,例如费用支出、药品清单等。
本发明首先将获取的医疗数据放入到缓存库中,然后将其与存储在核心库中的数据进行匹配,如果重复则将核心库中的数据删除,将缓存库中对应的医疗数据去同后插入到核心库中,从而确保核心库中的数据相互之间不重复,并且为最新的数据。
所述聚合模块120具体包括:
选取单元121,根据任意一个主键唯一标识从所述医疗数据的各个数据表中选取属于同一诊疗事件的目标医疗数据;
聚合单元122,将所述选取单元121选取的多个主键唯一标识对应的目标医疗数据中预设维度的数据进行聚合,生成预设维度的聚合表;
所述清洗模块130具体包括:
分析单元131,根据数据清洗配置主表识别所述聚合表中的待清洗字段;
清洗单元132,根据所述数据清洗配置主表中的清洗规则对所述分析单元131得到的所述待清洗字段进行清洗,得到标化之后的医疗数据表,所述清洗规则包括清洗顺序以及清洗后的字段。
具体的,本实施例中,根据数据标识信息将属于同一诊疗事件但是属于获取的不同的统计表中的医疗数据进行聚合,例如门诊就诊记录表、处方明细表、门诊收费明细表、检验检查表等全部都进行聚合,然后根据多个诊疗事件的医疗数据生成预设维度的聚合表。该预设维度为用户想要进行可视化查看的维度,例如门诊费用聚合大宽表,通过数据标识信息与处方明细表、收费明细表关联整合成,里面整合了本次门诊所产生的费用、开方医生等信息。
但是,由于各个医疗机构的部门构架不同,各自的规则也不同,例如对于同样的疾病A,第一家医疗机构对应的代码可能是001,第二家对应的代码可能是002。对此此类情形,系统设置有数据清洗配置主表,其中包含清洗顺序、清洗规则、清洗后字段等,例如上述的疾病A的代码对应的清洗后字段为000,则所有涉及到疾病A的医疗数据的代码更改为000。清洗后字段可以是系统自身制定的统一的标准,也可以是直接获取的权威机构制定发布的标准。因此,根据数据清洗配置主表对聚合表中的字段进行清洗,得到标化之后的医疗数据表,医疗数据表中的每个数据都按照统一的标准进行标注,便于后续识别。
本申请按照设置的数据清洗配置表对医疗数据进行清洗标化,进行标准化、统一化,然后用户要求的维度进行统计聚合,便于用户全方位地了解不同维度的医疗机构的情况。
本发明的一个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一实施例中的所有方法步骤或部分方法步骤。
本发明实现上述第一实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
本发明的一个实施例还提供一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一实施例中的所有方法步骤或部分方法步骤。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.医疗数据可视化的处理方法,其特征在于,包括:
获取医疗机构的医疗数据,根据所述医疗数据中的主键唯一标识进行去同得到核心库医疗数据;
获取所述核心库医疗数据的数据标识信息,根据所述数据标识信息对同一诊疗事件的医疗数据进行聚合,根据多个诊疗事件的医疗数据生成预设维度的聚合表,所述数据标识信息包括医疗机构代码和就诊流水号;
根据数据清洗配置主表对所述聚合表中的字段进行清洗,得到标化之后的医疗数据表;
从所述医疗数据表中提取最细粒度的指标数据生成事实数据表;
将事实数据表中相同维度不同指标的数据进行聚合,形成页面展示数据。
2.根据权利要求1所述的医疗数据可视化的处理方法,其特征在于,获取医疗机构的医疗数据,根据所述医疗数据中的主键唯一标识进行去同得到核心库医疗数据具体包括:
获取医疗机构的医疗数据接入到缓存库中,识别所述医疗数据中每一条数据的主键唯一标识;
根据主键唯一标识将缓存库中的医疗数据与核心库中的医疗数据进行匹配;
若某一条医疗数据对应的主键唯一标识相同且数据类型相同,则删除核心库中所述主键唯一标识对应的医疗数据,将缓存库中所述主键唯一标识对应的医疗数据插入到核心库中得到核心库医疗数据。
3.根据权利要求1所述的医疗数据可视化的处理方法,其特征在于,获取所述核心库医疗数据的数据标识信息,根据所述数据标识信息对同一诊疗事件的医疗数据进行聚合,根据多个诊疗事件的医疗数据生成预设维度的聚合表,所述数据标识信息包括医疗机构代码和就诊流水号具体包括:
根据任意一个数据标识信息从所述核心库医疗数据的各个数据表中选取属于同一诊疗事件的目标医疗数据;
将多个数据标识信息对应的目标医疗数据中预设维度的数据进行聚合,生成预设维度的聚合表。
4.根据权利要求1所述的医疗数据可视化的处理方法,其特征在于,根据数据清洗配置主表对所述聚合表中的字段进行清洗,得到标化之后的医疗数据表具体包括:
根据数据清洗配置主表识别所述聚合表中的待清洗字段;
根据所述数据清洗配置主表中的清洗规则对所述待清洗字段进行清洗,得到标化之后的医疗数据表,所述清洗规则包括清洗顺序以及清洗后的字段。
5.医疗数据可视化的处理系统,其特征在于,包括:
去同模块,获取医疗机构的医疗数据,根据所述医疗数据中的主键唯一标识进行去同得到核心库医疗数据;
聚合模块,获取所述核心库医疗数据的数据标识信息,根据所述数据标识信息对所述去同模块处理之后的同一诊疗事件的医疗数据进行聚合,根据多个诊疗事件的医疗数据生成预设维度的聚合表;
清洗模块,根据数据清洗配置主表对所述聚合模块得到的所述聚合表中的字段进行清洗,得到标化之后的医疗数据表;
提取模块,从所述清洗模块得到的所述医疗数据表中提取最细粒度的指标数据生成事实数据表;
处理模块,将所述提取模块得到的事实数据表中相同维度不同指标数据进行聚合,形成页面展示数据。
6.根据权利要求5所述的医疗数据可视化的处理系统,其特征在于,所述去同模块具体包括:
获取单元,获取医疗机构的医疗数据接入到缓存库中;
识别单元,识别所述获取单元获取的所述医疗数据中每一条数据的主键唯一标识;
匹配单元,根据所述识别单元识别的主键唯一标识将缓存库中的医疗数据与核心库中的医疗数据进行匹配;
去同单元,若所述匹配单元得到某一条医疗数据对应的主键唯一标识相同且数据类型相同,则删除核心库中所述主键唯一标识对应的医疗数据,将缓存库中所述主键唯一标识对应的医疗数据插入到核心库中获取所述核心库医疗数据的数据标识信息,根据所述数据标识信息。
7.根据权利要求5所述的医疗数据可视化的处理系统,其特征在于,所述聚合模块具体包括:
选取单元,根据任意一个数据标识信息从所述医疗数据的各个数据表中选取属于同一诊疗事件的目标医疗数据;
聚合单元,将所述选取单元选取的多个数据标识信息对应的目标医疗数据中预设维度的数据进行聚合,生成预设维度的聚合表。
8.根据权利要求5所述的医疗数据可视化的处理系统,其特征在于,所述清洗模块具体包括:
分析单元,根据数据清洗配置主表识别所述聚合表中的待清洗字段;
清洗单元,根据所述数据清洗配置主表中的清洗规则对所述分析单元得到的所述待清洗字段进行清洗,得到标化之后的医疗数据表,所述清洗规则包括清洗顺序以及清洗后的字段。
9.一种存储介质,该存储介质上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至4任一项所述的方法。
10.一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1至4任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910899880.3A CN110853715A (zh) | 2019-09-23 | 2019-09-23 | 医疗数据可视化的处理方法、系统、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910899880.3A CN110853715A (zh) | 2019-09-23 | 2019-09-23 | 医疗数据可视化的处理方法、系统、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110853715A true CN110853715A (zh) | 2020-02-28 |
Family
ID=69596065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910899880.3A Pending CN110853715A (zh) | 2019-09-23 | 2019-09-23 | 医疗数据可视化的处理方法、系统、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110853715A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111444292A (zh) * | 2020-04-14 | 2020-07-24 | 恩亿科(北京)数据科技有限公司 | 快消品数据处理方法、装置、电子设备及存储介质 |
CN111581182A (zh) * | 2020-04-21 | 2020-08-25 | 北京龙云科技有限公司 | 一种数据清洗方法和装置 |
CN112000841A (zh) * | 2020-07-29 | 2020-11-27 | 北京达佳互联信息技术有限公司 | 电子标签数据的处理方法、装置、电子设备及存储介质 |
CN112035120A (zh) * | 2020-08-31 | 2020-12-04 | 平安医疗健康管理股份有限公司 | 基于医疗数据的逻辑代码获取方法、装置以及计算机设备 |
CN112286912A (zh) * | 2020-08-12 | 2021-01-29 | 上海柯林布瑞信息技术有限公司 | 医疗数据质量核查方法及装置、终端、存储介质 |
WO2021238425A1 (zh) * | 2020-05-29 | 2021-12-02 | 京东方科技集团股份有限公司 | 健康数据管理方法、设备及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101197876A (zh) * | 2006-12-06 | 2008-06-11 | 中兴通讯股份有限公司 | 一种对消息类业务数据进行多维分析的方法和系统 |
US20120060216A1 (en) * | 2010-09-01 | 2012-03-08 | Apixio, Inc. | Medical information navigation engine (mine) system |
CN108170826A (zh) * | 2018-01-08 | 2018-06-15 | 北京国信宏数科技有限责任公司 | 一种基于互联网大数据的宏观经济分析方法及系统 |
CN109522344A (zh) * | 2018-10-30 | 2019-03-26 | 平安医疗健康管理股份有限公司 | 一种基于数据可视化的数据处理方法及设备 |
CN109559808A (zh) * | 2018-11-07 | 2019-04-02 | 平安医疗健康管理股份有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN109584975A (zh) * | 2018-11-21 | 2019-04-05 | 金色熊猫有限公司 | 医疗数据标准化处理方法及装置 |
-
2019
- 2019-09-23 CN CN201910899880.3A patent/CN110853715A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101197876A (zh) * | 2006-12-06 | 2008-06-11 | 中兴通讯股份有限公司 | 一种对消息类业务数据进行多维分析的方法和系统 |
US20120060216A1 (en) * | 2010-09-01 | 2012-03-08 | Apixio, Inc. | Medical information navigation engine (mine) system |
CN108170826A (zh) * | 2018-01-08 | 2018-06-15 | 北京国信宏数科技有限责任公司 | 一种基于互联网大数据的宏观经济分析方法及系统 |
CN109522344A (zh) * | 2018-10-30 | 2019-03-26 | 平安医疗健康管理股份有限公司 | 一种基于数据可视化的数据处理方法及设备 |
CN109559808A (zh) * | 2018-11-07 | 2019-04-02 | 平安医疗健康管理股份有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN109584975A (zh) * | 2018-11-21 | 2019-04-05 | 金色熊猫有限公司 | 医疗数据标准化处理方法及装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111444292A (zh) * | 2020-04-14 | 2020-07-24 | 恩亿科(北京)数据科技有限公司 | 快消品数据处理方法、装置、电子设备及存储介质 |
CN111444292B (zh) * | 2020-04-14 | 2023-11-03 | 恩亿科(北京)数据科技有限公司 | 快消品数据处理方法、装置、电子设备及存储介质 |
CN111581182A (zh) * | 2020-04-21 | 2020-08-25 | 北京龙云科技有限公司 | 一种数据清洗方法和装置 |
WO2021238425A1 (zh) * | 2020-05-29 | 2021-12-02 | 京东方科技集团股份有限公司 | 健康数据管理方法、设备及系统 |
CN112000841A (zh) * | 2020-07-29 | 2020-11-27 | 北京达佳互联信息技术有限公司 | 电子标签数据的处理方法、装置、电子设备及存储介质 |
CN112000841B (zh) * | 2020-07-29 | 2023-09-26 | 北京达佳互联信息技术有限公司 | 电子标签数据的处理方法、装置、电子设备及存储介质 |
CN112286912A (zh) * | 2020-08-12 | 2021-01-29 | 上海柯林布瑞信息技术有限公司 | 医疗数据质量核查方法及装置、终端、存储介质 |
CN112035120A (zh) * | 2020-08-31 | 2020-12-04 | 平安医疗健康管理股份有限公司 | 基于医疗数据的逻辑代码获取方法、装置以及计算机设备 |
CN112035120B (zh) * | 2020-08-31 | 2022-09-20 | 深圳平安医疗健康科技服务有限公司 | 基于医疗数据的逻辑代码获取方法、装置以及计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110853715A (zh) | 医疗数据可视化的处理方法、系统、存储介质及电子设备 | |
CN109920506B (zh) | 医疗统计报告生成方法、装置、设备及存储介质 | |
US11080423B1 (en) | System for simulating a de-identified healthcare data set and creating simulated personal data while retaining profile of authentic data | |
CN109448811B (zh) | 处方审核改进方法、装置、电子设备及存储介质 | |
US20040078587A1 (en) | Method, system, computer product and encoding format for creating anonymity in collecting patient data | |
CN111143422A (zh) | 数据检索方法、数据检索装置、存储介质及电子设备 | |
CN113948168A (zh) | 医疗数据评价实际应用系统及医疗数据评价实际应用方法 | |
CN114462885A (zh) | 一种基于业务信息的数据排行方法及装置、介质、设备 | |
CN112488845B (zh) | 一种投保客户的筛选方法、装置、电子设备及存储介质 | |
CN113065947A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN113871025A (zh) | 一种皮肤科临床专病数据库建设方法和系统 | |
JP2015052847A (ja) | 電子レセプトデータ変換システム及び電子レセプトデータ変換プログラム | |
CN112819305A (zh) | 业务指标分析方法、装置、设备及存储介质 | |
JP4488833B2 (ja) | 診療情報分析システム | |
CN111046038A (zh) | 时序数据存储的方法及终端设备 | |
JP4250285B2 (ja) | 疾病別診療報酬明細書分析システム | |
CN108388610B (zh) | 数据etl处理方法及装置 | |
CN114692204A (zh) | 数据查询方法、装置、设备及存储介质 | |
Clause et al. | Conforming to HIPAA regulations and compilation of research data | |
De Georgia et al. | Neurocritical Care Informatics: Translating Raw Data into Bedside Action | |
CN110008264B (zh) | 成本核算系统的数据采集方法和装置 | |
JP2000200314A (ja) | デ―タ処理方法、医療デ―タ管理方法及びシステム、記録媒体 | |
CN113282218A (zh) | 多维报表生成方法、装置、设备及存储介质 | |
CN113283677A (zh) | 指标数据处理方法、装置、设备及存储介质 | |
CN110739035A (zh) | 一种医疗机构的患者病历管理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200228 |