一种为医疗机构双向转诊提供数据支撑的方法及系统
技术领域
本发明属于医疗数据技术领域,尤其涉及一种为医疗机构双向转诊提供数据支撑的方法及系统。
背景技术
当前,人们越来越多的关注民生,其中医疗卫生一直是热点问题。看病难、看病贵一直是大家热议的话题。与此同时,国家也一直对医疗进行改革,颁布和实施一些新的政策。医疗行业也开始迅猛发展,数据越来越趋于高度集中化,大规模区域医疗信息系统和大型医疗数据中心将逐步建立,数据总量可达TB(Terabyte,万亿字节)级。
然而,现有区域医疗信息系统和医疗数据中心,只是针对医院或者社康中心单方面的数据进行统计分析,没有根据医院门诊数据以及社康中心数据进行有关双向转诊统计分析,从而没有提供与医院和社康双向转诊相关的数据支撑,没有通过分析医院门诊及其属下社康的医疗数据探查双向转诊的业务依据,比如,未能同时分析在医院和社康所需的平均费用,未能从经济层面减轻患者的负担,对于同一种疾病,未能同时分析在医院和社康所需候诊时间和诊疗时间,从而导致患者看病难、看病贵。
发明内容
本发明实施例的目的在于提供种一种综合分析医院门诊和社康中心数据的为医疗机构双向转诊提供数据支撑的方法和系统,旨在解决现有的区域医疗信息系统和医疗数据中心,没有提供与医院和社康双向转诊相关的数据支撑,没有通过分析医院门诊及其属下社康的医疗数据探查双向转诊的业务依据的问题。
本发明提供了一种为医疗机构双向转诊提供数据支撑的方法,包括:
获取医院门诊数据和社康中心数据;
对所述医院门诊数据和社康中心数据进行集成,将集成后的医院门诊数据和社康中心数据以文件的形式保存至分布式文件系统HDFS中;
通过Hive对保存至分布式文件系统HDFS中的数据按业务主题分类加载;
根据加载的数据,进行有关双向转诊的计算分析,展示计算分析结果。
本发明的另一目的在于提供一种为医疗机构双向转诊提供数据支撑的系统,所述系统包括:
获取单元、数据集成单元、转换加载单元、分析展示单元;
所述获取单元,用于获取医院门诊数据和社康中心数据;
所述数据集成单元,用于对所述医院门诊数据和社康中心数据进行集成,将集成后的医院门诊数据和社康中心数据以文件的形式保存至分布式文件系统HDFS中;
所述转换加载单元,用于通过Hive按业务主题分类加载保存至分布式文件系统HDFS中的数据;
所述分析展示单元,用于根据加载的数据,进行有关双向转诊的计算分析,并展示计算分析结果。
在本发明实施例中,通过获取医院门诊数据和社康中心数据,对所述医院门诊数据和社康中心数据进行集成,将集成后的数据以文件的形式保存至分布式文件系统HDFS中,通过Hive对保存至分布式文件系统HDFS中的数据按业务主题分类加载,根据加载的数据,进行有关双向转诊的计算分析,展示计算分析结果,这样实现了提供与医院和社康双向转诊相关的数据支撑,通过分析医院门诊及其属下社康的医疗数据探查双向转诊的业务依据,方便医院和社康做转诊决策,从而合理利用医院和社康资源以及降低患者负担。
附图说明
图1是本发明实施例提供的为医疗机构双向转诊提供数据支撑的方法的所适用的系统框图;
图2是本发明实施例提供的为医疗机构双向转诊提供数据支撑的方法的实现流程图;
图3是本发明实施例提供的What-if计算分析方法实现流程图;
图4是本发明实施例提供的为医疗机构双向转诊提供数据支撑的系统结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示出了本发明实施例提供的为医疗机构双向转诊提供数据支撑的方法所适用的系统框图,为了便于说明,仅示出了与本实施例相关的部分。通过ETL(Extraction Transformation Loading,提取、转换、加载)中的工具Sqoop对获取的医院门诊数据进行集成,将集成后的数据保存至Hadoop中的分布式文件系统HDFS(Hadoop Distributed File System,Hadoop分布式文件系统)中。数据仓库工具Hive建立数据仓库对数据进行分类,将分类后的数据分区保存至分布式文件系统HDFS(Hadoop Distributed File System,Hadoop分布式文件系统)中,QlickView Sever用于加载分布式文件系统HDFS中的数据,进行有关双向转诊的统计分析。
图2示出了本发明实施例一提供的一种为医疗机构双向转诊提供数据支撑的方法的实现流程,详述如下:
步骤201、获取医院门诊数据和社康中心数据。
所述医院门诊数据和社康中心数据包括医院门诊和社康中心的各种数据,包括:医院科室信息、医务人员信息、日均就诊人数、就诊等候时间、常见病种、药品种类、医疗费用、医务人员工作负荷等等。
步骤202、对所述医院门诊数据和社康中心数据进行集成,将集成后的医院门诊数据和社康中心数据以文件的形式保存至分布式文件系统HDFS中。
优选的,获取医院门诊数据和社康中心数据之后,利用Hadoop大数据处理框架,通过分布式ETL(Extraction Transformation Loading,提取、转换、加载)工具Sqoop或者通过直接编辑Map Reduce(映射规约)对所述数据进行集成,将集成后的医院门诊数据和社康中心数据以文件的形式保存至分布式文件系统HDFS中,同时设置所述文件副本的个数,保存集成后的医院门诊数据和社康中心数据文件的多个副本,保证数据安全性、可靠性以及高可用性。
进一步的,所述医院门诊数据和社康中心数据进行集成,将集成后的医院门诊数据和社康中心数据以文件的形式保存至分布式文件系统HDFS(HadoopDistributed File System,Hadoop分布式文件系统)中,包括对医院门诊数据和社康中心数据进行分类,将分类后的医院门诊数据和社康中心数据分区保存至分布式文件系统HDFS中。通过数据仓库工具Hive建立数据仓库,所述数据仓库对医院门诊数据和社康中心数据进行分类,将所述分类后的医院门诊数据和社康中心数据分区保存至分布式文件系统HDFS中,比如可以按照医疗机构、就诊日期、病种类型等等进行分区存储,提升查询速度。同时对数据仓库中的数据模型进行宽表化处理,实现数据粗粒度的分布式数据运算,以优化分布式处理和查询。
步骤203、通过Hive对保存至分布式文件系统HDFS中的数据按业务主题分类加载。
优选的,通过数据仓库中工具Hive查询服务把数据按业务主题分类加载到QlickView Sever内存中,比如按日均就诊人次、常见病种类数量、医院门诊患者人数、社康中心患者人数等业务主题进行加载,并以图表方式展现出来,提升查询速度。加载前需要初始化报表分析程序,计算需要加载数据的内存使用需求。
步骤204、根据加载的数据,进行有关双向转诊的计算分析,展示计算分析结果。
具体的,对已经按业务主题分类加载的数据进行分析计算,得出与医院门诊和社康中心相关联的影响双向转诊的第一类因子变量,所述与医院门诊和社康中心相关联的影响双向转诊的第一类因子变量,包括:日均就诊人次、常见病种类数量、医院门诊和社康中心患者费用负担差异、常见疾病平均诊断时间、医院门诊和社康中心候诊时间差异等等。比如通过对已按医院门诊患者人数、医院门诊患者费用、社康中心患者人数、社康中心患者费用加载的数据进行分析计算,分别得到医院门诊患者平均费用负担以及社康中心患者平均费用负担,将其相减就能得到医院门诊和社康患者费用负担差异。
得出与医院门诊和社康中心相关联的影响双向转诊的第一类因子变量后,使用What-if如果-怎样方式进行有关双向转诊的计算分析。这样进行统计分析后,就得到与双向转诊相关的依据数据,为医院和门诊双向转诊提供了数据支撑和依据。同时可以将分析结果以图表的形式展示出来,便于查看。
为了更加详细的描述步骤上述通过What-if如果-怎样分析方法对记载的数据进行分析,本发明实施例二结合附图3,对此作进一步的描述,详述如下:
步骤310、加载分析计算引擎。
所述计算引擎为QlickView Sever的计算引擎。
步骤302、建立交叉分析模型,所述交叉分析模型为自变量与因变量的映射关系,所述自变量包括:所述的与医院门诊和社康中心相关联的影响双向转诊的第一类因子变量、以及预设第二类因子变量,所述预设第二类因子变量包分诊率和天数,,所述因变量为与所述自变量进行映射的目标变量。
具体的,交叉分析模型为自变量与因变量的映射关系,自变量包括,上述的第一类因子变量和预设的第二类因子变量,预设的第二类因子变量包括但不限于:分诊率和天数。分诊率指医院门诊向社康中心转诊病人人数占医院门诊总病人人数的百分率或者为社康中心向医院门诊转诊病人人数占社康中心总病人人数的百分率,天数是指需要统计分析的时间,分诊率和天数都可以可根据需要进行设定。所述因子变量进行映射的目标变量包括:节省患者的费用、节省候诊的时间、节省医生工作量、增加服务医生人数等等。所述映射为函数映射,比如,节省患者费用(元)=分诊率*日均就诊(人次)*常见病种数量(种)*医院和社康患者负担差异(元/人次)*天数;节省候诊时间(小时)=(分诊率*日均就诊(人次)*常见病种数量(种)*医院和社康候诊时间差异(分钟/人次)*天数)/60;节省医生工作量(天)=分诊率*日均就诊(人次)*常见病种数量(种)*常见疾病平均诊断时间(分钟/人次)*天数;增加服务医生(人)=节省医生工作量(天)/天数,其中*表示相乘。当然所述自变量变量和因变量即目标变量不限于上述列举,可以根据需求进行增加或删除。
步骤303、所述分析计算引擎通过调整交叉分析模型的因子变量的值进行计算分析,得到目标变量的值。
具体的,可以通过调整因子变量的参数值,计算分析目标变量的值。表1为通过调整因子变量分诊率参数值,分析目标变量的变化。表1中分诊率是指医院门诊转到到社康中心的分诊率,日均就诊人次是指医院平均每天就诊人次,医院和社康患者负担差异是指平均每人在医院花费与平均每人在社康花费的差值,常见疾病平均诊断时间,是指常见疾病在医院和社康平均就诊时间,医院和社康候诊时间差异是指平均每人在医院就诊时间比平均每人在社康就诊时间差异,节省医生工作量是指节省医院医生的工作天数,增加服务医生数量,是指由于医院分诊一部分病人给社康社康需要增加的医生人数。比如,需要统计医院门诊转到到社康中心的分诊率为80%时一年即365天,目标变量的值节省患者费用(元)=分诊率*日均就诊(人次)*常见病种数量(种)*医院和社康患者负担差异(元/人次)*天数=80%*300*5*20*365=8760000(元)。表1只列举了通过改变医院到社康的分诊率来分析目标变量的,实际中还可以通过改变其他因子变量来分析目标变量,而且因子变量和目标变量不限于表1,还可以根据需要添加。同时也可以分析改变社康到医院的分诊率,来分析目标变量的变化,等等。通过分析后就为转诊决策提供了数据支撑和依据,可以根据分析结果决定是否转诊,以及可以转多少病人等等。
表1通过调整因子变量分诊率参数值分析目标变量的变化
实施例二通过What-if如果-怎样分析方法综合分析医院和社康数据,为医院和社康双向转诊提供了数据支撑,方便医院社康做出转诊决定。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。
附图4为本发明实施例三提供的一种为医疗机构双向转诊提供数据支撑的系统的结构框图,所述系统能实现实施例所述的方法,所述系统包括:获取单元41、数据集成单元42、转换加载单元43、分析展示单元44。
所述获取单元41,用于获取医院门诊数据和社康中心数据。所述医院门诊数据和社康中心数据包括医院门诊和社康中心的各种数据,包括:医院科室信息、医务人员信息、日均就诊人数、就诊等候时间、常见病种、药品种类、医疗费用、医务人员工作负荷等等。
所述数据集成单元42,用于对所述医院门诊数据和社康中心数据进行集成,将集成后的医院门诊数据和社康中心数据以文件的形式保存至分布式文件系统HDFS中。具体的,获取医院门诊数据和社康中心数据之后,数据集成单元42通过分布式ETL工具Sqoop或者通过直接编辑Map Reduce对所述数据进行集成,将集成后的数据以文件的形式保存至HDFS文件系统中。
所述转换加载单元43,用于通过Hive按业务主题分类加载保存至分布式文件系统HDFS中的数据。优选的,转换加载单元43,
通过数据仓库中工具Hive查询服务把数据按业务主题分类加载到QlickView Sever内存中,比如按日均就诊人次、常见病种类数量、医院门诊患者人数、社康中心患者人数等业务主题进行加载,并以图表方式展现出来,提升查询速度。加载前需要初始化报表分析程序,计算需要加载数据的内存使用需求。
所述分析展示单元44,用于根据加载的数据,进行有关双向转诊的计算分析,展示计算分析结果。具体的,分析展示单元44通过加载分析计算引擎,根据加载的数据进行有关转诊的统计分析。所述分析展示单元44包括第一分析计算单元441、第二分析计算单元442;
所述第一分析计算单元441,用于对已经按业务主题分类加载的数据进行分析计算,得出与医院门诊和社康中心相关联的影响双向转诊的第一类因子变量,所述的与医院门诊和社康中心相关联的影响双向转诊的第一类因子变量,包括:日均就诊人次、常见病种类数量、医院门诊和社康中心患者费用负担差异、常见疾病平均诊断时间、医院门诊和社康候诊时间差异。
所述第二分析计算单元442,用于通过What-if如果-怎样方式进行有关双向转诊的计算分析。
所述第二分析计算单元442包括:加载单元4421,用于加载分析计算引擎;
创建单元4422,用于建立交叉分析模型,所述交叉分析模型为自变量与因变量的映射关系,所述自变量包括:所述的与医院门诊和社康中心相关联的影响双向转诊的第一类因子变量、以及预设第二类因子变量,所述预设第二类因子变量包分诊率和天数,所述因变量为与所述自变量进行映射的目标变量,目标变量包括:节省患者的费用、节省候诊的时间、节省医生工作量、增加服务医生人数。所述映射为函数映射。
计算子单元4423,用于通过计算分析引擎调整所述交叉分析模型的自变量的值进行计算分析,得到所述因变量的值。
可以通过调整自变量的参数值,计算分析目标变量的变化。所述自变量和目标变量不限于上述列举的,可以根据需要增加或删除。这样通过What if分析方法综合分析医院和社康数据,为医院和社康双向转诊提供了数据支撑,方便医院社康做出转诊决定。
进一步的,所述数据集成单元42还用于设置集成后医院门诊数据和社康中心数据文件副本的个数,保存多个副本文件,保证数据安全性、可靠性以及高可用性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。