CN115050442A - 基于挖掘聚类算法的病种数据上报方法、装置及存储介质 - Google Patents

基于挖掘聚类算法的病种数据上报方法、装置及存储介质 Download PDF

Info

Publication number
CN115050442A
CN115050442A CN202210984760.5A CN202210984760A CN115050442A CN 115050442 A CN115050442 A CN 115050442A CN 202210984760 A CN202210984760 A CN 202210984760A CN 115050442 A CN115050442 A CN 115050442A
Authority
CN
China
Prior art keywords
data
disease
quality
disease category
clustering algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210984760.5A
Other languages
English (en)
Other versions
CN115050442B (zh
Inventor
舒振峰
刘洋
杨政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Compass Medical Technology Co ltd
Original Assignee
Shenzhen Compass Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Compass Medical Technology Co ltd filed Critical Shenzhen Compass Medical Technology Co ltd
Priority to CN202210984760.5A priority Critical patent/CN115050442B/zh
Publication of CN115050442A publication Critical patent/CN115050442A/zh
Application granted granted Critical
Publication of CN115050442B publication Critical patent/CN115050442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof

Abstract

本发明涉及数据处理技术领域,公开了一种基于挖掘聚类算法的病种数据上报方法、装置及存储介质,所述方法包括:提取当前医疗数据的目标病历报告数据和病例诊断数据;通过目标聚类算法集合根据预设数据标准对目标病历报告数据和病例诊断数据进行预处理;根据预设病种规则和质量数据校验规则对完整标准术语报告数据和完整标准术语诊断数据进行数据分析;通过目标数据上报策略根据预设病种数据接收规则对待上报病种数据进行上报;通过上述方式,根据目标聚类算法集合进行预处理,然后根据预设病种规则和质量数据校验规则进行数据分析,再将待上报病种数据进行上报,从而能够得到满足卫健要求的病种数据,进而提高上报病种数据的准确性。

Description

基于挖掘聚类算法的病种数据上报方法、装置及存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及基于挖掘聚类算法的病种数据上报方法、装置及存储介质。
背景技术
随着卫生健康组织对单病种质量管理与控制的重视,使得各医疗机构需将单病种质量管理与控制作为医疗质量管理制度的重要组成部分,具体是利用信息化手段统计、分析、反馈单病种相关质量监测信息,并指定专人负责信息上报等日常工作,确保及时、准确、完整地向卫生健康组织报送相关数据信息,但是需要上报的单病种数据高达五十多种,且对于不同级别的医疗机构还有具体工作日的要求,即需要在规定时间内将全部单病虫数据进行上传,但是目前医疗机构的相关人员在填报数据的过程中会出现医学知识模糊,不能进行内容文字的质量要求进行规范性的填写,并在筛选上报数据、核查数据等方面会出现失误,使得最终得到的病种数据无法满足卫健要求,造成上报病种数据的准确性较低。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种基于挖掘聚类算法的病种数据上报方法、装置及存储介质,旨在解决现有技术得到的病种数据无法满足卫健要求以及上报病种数据的准确性较低技术问题。
为实现上述目的,本发明提供了一种基于挖掘聚类算法的病种数据上报方法,所述基于挖掘聚类算法的病种数据上报方法包括以下步骤:
获取目标机构的当前医疗数据,提取所述当前医疗数据的目标病历报告数据和病例诊断数据;
通过目标聚类算法集合根据预设数据标准对所述目标病历报告数据和所述病例诊断数据进行预处理,得到完整标准术语报告数据和完整标准术语诊断数据;
根据预设病种规则和质量数据校验规则对所述完整标准术语报告数据和所述完整标准术语诊断数据进行数据分析,得到待上报病种数据;
通过目标数据上报策略根据预设病种数据接收规则对所述待上报病种数据进行上报。
可选地,所述获取目标机构的当前医疗数据,提取所述当前医疗数据的目标病历报告数据和病例诊断数据,包括:
获取目标机构的当前医疗数据,根据所述当前医疗数据得到对应的数据类型;
根据所述数据类型在数据提取工具集合中选取目标数据提取工具;
通过所述目标数据提取工具根据预设数据挖掘算法对所述当前医疗数据进行数据挖掘,得到当前医疗数据的目标病历报告数据和病例诊断数据。
可选地,所述通过目标聚类算法集合根据预设数据标准对所述目标病历报告数据和所述病例诊断数据进行预处理,得到完整标准术语报告数据和完整标准术语诊断数据,包括:
根据所述目标聚类算法集合得到模糊C均值聚类算法、Kmeans聚类算法以及Canopy聚类算法;
通过所述模糊C均值聚类算法对所述目标病历报告数据和所述病例诊断数据进行推理,得到深度补充报告数据和深度补充诊断数据;
将所述深度补充报告数据补充至所述目标病历报告数据,得到完整报告数据,以及将所述深度补充诊断数据补充至所述病例诊断数据,得到完整诊断数据;
根据所述预设数据标准得到病种质量术语标准和质量分析细则标准;
通过所述Canopy聚类算法根据所述质量分析细则标准分别对所述完整报告数据和所述完整诊断数据进行分析,得到完整质量报告数据和完整质量诊断数据;
通过所述Kmeans聚类算法根据所述病种质量术语标准分别对所述完整质量报告数据和所述完整质量诊断数据进行话术转换,得到完整标准术语报告数据和完整标准术语诊断数据。
可选地,所述根据预设病种规则和质量数据校验规则对所述完整标准术语报告数据和所述完整标准术语诊断数据进行数据分析,得到待上报病种数据,包括:
通过DBSCAN聚类算法对所述完整标准术语报告数据和所述完整标准术语诊断数据进行分类处理,得到若干类别报告病种数据和若干类别诊断病种数据,得到若干类别报告病种数据和若干类别诊断病种数据;
对所述若干类别报告病种数据和所述若干类别诊断病种数据进行数据融合,得到当前融合病种数据;
根据所述预设病种规则和质量数据校验规则对所述当前融合病种数据进行数据分析,得到待上报病种数据。
可选地,所述根据所述预设病种规则和质量数据校验规则对所述当前融合病种数据进行数据分析,得到待上报病种数据,包括:
根据所述预设病种规则对所述当前融合病种数据进行质量分析,得到对应的若干病种质量数据;
分别统计若干病种质量数据的指标数量;
根据预设指标评分规则和所述指标数量设置所述若干病种质量数据的质量分数;
根据预设质量分数范围和所述质量分数对所述若干病种质量数据进行筛选,得到当前质量病种数据;
通过隐含狄利克雷分配算法根据所述质量数据校验规则对所述当前质量病种数据进行校验;
在校验通过时,将所述当前质量病种数据作为待上报病种数据。
可选地,所述通过隐含狄利克雷分配算法根据所述质量数据校验规则对所述当前质量病种数据进行校验之后,还包括:
在校验失败时,通过层次聚类算法对所述当前质量病种数据进行层次分解,得到若干层质量数据;
采用自顶向下顺序根据所述预设病种规则依次对所述若干层质量数据对应的病种数据进行质量分析,得到当前若干病种质量数据;
分别统计所述当前若干病种质量数据的指标数量,并继续执行根据预设指标评分规则和所述指标数量设置所述当前若干病种质量数据的质量分数的步骤。
可选地,所述通过目标数据上报策略根据预设病种数据接收规则对所述待上报病种数据进行上报,包括:
根据预设病种数据接收规则得到待接收病种数据类型和待接收病种数据位置;
将所述待接收病种数据类型与所述待上报病种数据对应的数据类型进行匹配;
通过目标数据上报策略根据匹配结果将所述待上报病种数据上报至所述待接收病种数据位置。
此外,为实现上述目的,本发明还提出一种基于挖掘聚类算法的病种数据上报装置,所述基于挖掘聚类算法的病种数据上报装置包括:
获取模块,用于获取目标机构的当前医疗数据,提取所述当前医疗数据的目标病历报告数据和病例诊断数据;
处理模块,用于通过目标聚类算法集合根据预设数据标准对所述目标病历报告数据和所述病例诊断数据进行预处理,得到完整标准术语报告数据和完整标准术语诊断数据;
分析模块,用于根据预设病种规则和质量数据校验规则对所述完整标准术语报告数据和所述完整标准术语诊断数据进行数据分析,得到待上报病种数据;
上报模块,用于通过目标数据上报策略根据预设病种数据接收规则对所述待上报病种数据进行上报。
此外,为实现上述目的,本发明还提出一种基于挖掘聚类算法的病种数据上报设备,所述基于挖掘聚类算法的病种数据上报设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于挖掘聚类算法的病种数据上报程序,所述基于挖掘聚类算法的病种数据上报程序配置为实现如上文所述的基于挖掘聚类算法的病种数据上报方法。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有基于挖掘聚类算法的病种数据上报程序,所述基于挖掘聚类算法的病种数据上报程序被处理器执行时实现如上文所述的基于挖掘聚类算法的病种数据上报方法。
本发明提出的基于挖掘聚类算法的病种数据上报方法,通过获取目标机构的当前医疗数据,提取所述当前医疗数据的目标病历报告数据和病例诊断数据;通过目标聚类算法集合根据预设数据标准对所述目标病历报告数据和所述病例诊断数据进行预处理,得到完整标准术语报告数据和完整标准术语诊断数据;根据预设病种规则和质量数据校验规则对所述完整标准术语报告数据和所述完整标准术语诊断数据进行数据分析,得到待上报病种数据;通过目标数据上报策略根据预设病种数据接收规则对所述待上报病种数据进行上报;根据目标聚类算法集合进行预处理,然后根据预设病种规则和质量数据校验规则进行数据分析,再将待上报病种数据进行上报,从而能够得到满足卫健要求的病种数据,进而提高上报病种数据的准确性。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的基于挖掘聚类算法的病种数据上报设备的结构示意图;
图2为本发明基于挖掘聚类算法的病种数据上报方法第一实施例的流程示意图;
图3为本发明基于挖掘聚类算法的病种数据上报方法第二实施例的流程示意图;
图4为本发明基于挖掘聚类算法的病种数据上报装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的基于挖掘聚类算法的病种数据上报设备结构示意图。
如图1所示,该基于挖掘聚类算法的病种数据上报设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(Random Access Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-VolatileMemory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对基于挖掘聚类算法的病种数据上报设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于挖掘聚类算法的病种数据上报程序。
在图1所示的基于挖掘聚类算法的病种数据上报设备中,网络接口1004主要用于与网络一体化平台工作站进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明基于挖掘聚类算法的病种数据上报设备中的处理器1001、存储器1005可以设置在基于挖掘聚类算法的病种数据上报设备中,所述基于挖掘聚类算法的病种数据上报设备通过处理器1001调用存储器1005中存储的基于挖掘聚类算法的病种数据上报程序,并执行本发明实施例提供的基于挖掘聚类算法的病种数据上报方法。
基于上述硬件结构,提出本发明基于挖掘聚类算法的病种数据上报方法实施例。
参照图2,图2为本发明基于挖掘聚类算法的病种数据上报方法第一实施例的流程示意图。
在第一实施例中,所述基于挖掘聚类算法的病种数据上报方法包括以下步骤:
步骤S10,获取目标机构的当前医疗数据,提取所述当前医疗数据的目标病历报告数据和病例诊断数据。
需要说明的是,本实施例的执行主体为基于挖掘聚类算法的病种数据上报设备,还可为其他可实现相同或相似功能的设备,例如病种数据处理系统等,本实施例对此不作限制,在本实施例中,以病种数据处理系统为例进行说明。
应当理解的是,目标机构指的是具有医疗资格的机构,例如,医院、重点康复护理中心等,在本实施例中以医院为例进行说明,当前医疗数据指的是不同医院的各个部门的各个科室对患者进行治疗的数据,目标病历报告数据指的是医生或者护士根据患者实际病情记录在病历报告中的数据,该目标病历报告数据包括但不限于HIS、LIS、PACS、手麻等报告数据,病历诊断数据指的是根据患者病情进行诊断的数据,该病历诊断数据包括但不限于急诊、重症、护理、病案等诊断数据。
进一步地,步骤S10,包括:获取目标机构的当前医疗数据,根据所述当前医疗数据得到对应的数据类型;根据所述数据类型在数据提取工具集合中选取目标数据提取工具;通过所述目标数据提取工具根据预设数据挖掘算法对所述当前医疗数据进行数据挖掘,得到当前医疗数据的目标病历报告数据和病例诊断数据。
可以理解的是,目标数据提取工具指的是最适合挖掘目标病历报告数据和病例诊断数据的工具,具体是根据当前医疗数据所属的数据类型在数据提取工具集合中选取目标数据提取工具,该目标数据提取工具可以为数据ETL工具,然后通过目标数据提取工具根据预设数据挖掘算法在当前医疗数据挖掘出潜在有用、隐含的目标病历报告数据和病例诊断数据。
步骤S20,通过目标聚类算法集合根据预设数据标准对所述目标病历报告数据和所述病例诊断数据进行预处理,得到完整标准术语报告数据和完整标准术语诊断数据。
可以理解的是,完整标准术语报告数据指的是经过补充后的符合单病种质量标准术语的报告数据,同样,完整标准术语诊断数据指的是经过补充后的符合单病种质量标准术语的诊断数据,具体是通过目标聚类算法集合根据预设数据标准对目标病历报告数据和病例诊断数据进行预处理,该预处理包括数据推理、数据补充、数据分析以及话术转换。
进一步地,步骤S20,包括:根据所述目标聚类算法集合得到模糊C均值聚类算法、Kmeans聚类算法以及Canopy聚类算法;通过所述模糊C均值聚类算法对所述目标病历报告数据和所述病例诊断数据进行推理,得到深度补充报告数据和深度补充诊断数据;将所述深度补充报告数据补充至所述目标病历报告数据,得到完整报告数据,以及将所述深度补充诊断数据补充至所述病例诊断数据,得到完整诊断数据;根据所述预设数据标准得到病种质量术语标准和质量分析细则标准;通过所述Canopy聚类算法根据所述质量分析细则标准分别对所述完整报告数据和所述完整诊断数据进行分析,得到完整质量报告数据和完整质量诊断数据;通过所述Kmeans聚类算法根据所述病种质量术语标准分别对所述完整质量报告数据和所述完整质量诊断数据进行话术转换,得到完整标准术语报告数据和完整标准术语诊断数据。
应当理解的是,目标聚类算法集合包括模糊C均值聚类算法、Kmeans聚类算法以及Canopy聚类算法,具体是通过模糊C均值聚类算法通过目标病历报告数据和病例诊断数据推理出深度补充报告数据和深度补充诊断数据,例如,对于患者A,通过医生的专业知识的诊断,记录的目标病历报告数据只有一个,病例诊断数据有两个,经过病情的进一步推理可以得到两个病例诊断数据,以及三个病例诊断数据,此时与原数据之间的差别数据即为深度补充报告数据和深度补充诊断数据,然后分别将深度补充报告数据和深度补充诊断数据进行补充,再通过Canopy聚类算法根据质量分析细则标准对完整报告数据和完整诊断数据进行分析,最后通过Kmeans聚类算法对完整质量报告数据和完整质量诊断数据进行话术转换,得到完整标准术语报告数据和完整标准术语诊断数据,此时的完整标准术语报告数据和完整标准术语诊断数据是完整且符合病种质量术语标准的数据,具体是通过Kmeans聚类算法计算完整质量报告数据、完整质量诊断数据与病种质量术语标准的相关系数,使用的计算公式为:
Figure 951077DEST_PATH_IMAGE001
其中,D为方差,
Figure 474372DEST_PATH_IMAGE002
Figure 421469DEST_PATH_IMAGE003
分别为完整质量报告数据X和完整质量诊断数据Y的标准差,
Figure 626185DEST_PATH_IMAGE004
为完整质量报告数据X和完整质量诊断数据Y的协方差,记为
Figure 513501DEST_PATH_IMAGE005
Figure 307013DEST_PATH_IMAGE006
为完整质量报告数据X和完整质量诊断数据Y的协方差和标准差的商。
需要说明的是,相关系数的取值范围为[-1,1],相关系数的绝对值越大,则表明完整质量报告数据X和完整质量诊断数据Y的相关度越高,当相关系数为0时,表明完整质量报告数据X和完整质量诊断数据Y无关系,当完整质量报告数据X增大(减小),完整质量诊断数据Y减小(增大)时,完整质量报告数据X和完整质量诊断数据Y为负相关,相关次数范围为[-1,0],当完整质量报告数据X增大(减小),完整质量诊断数据Y增大(减小)时,完整质量报告数据X和完整质量诊断数据Y为正相关,相关次数范围为[0,1]。
步骤S30,根据预设病种规则和质量数据校验规则对所述完整标准术语报告数据和所述完整标准术语诊断数据进行数据分析,得到待上报病种数据。
应当理解的是,待上报病种数据指的是用于上报的高质量的单病种数据,质量数据校验规则指的是校验完整标准术语报告数据和完整标准术语诊断数据的质量的规则,预设病种规则指的是对病种数据进行评分的规则,具体是根据预设病种规则和质量数据校验规则分析出待上报病种数据。
步骤S40,通过目标数据上报策略根据预设病种数据接收规则对所述待上报病种数据进行上报。
可以理解的是,目标数据上报策略指的是将待上报病种数据进行上报的策略,该目标数据上报策略可以为并行级数据上报策略,预设病种数据接收规则指的是接收病种数据的规则,在上报时需要遵循预设病种数据接收规则。
进一步地,步骤S40,包括:根据预设病种数据接收规则得到待接收病种数据类型和待接收病种数据位置;将所述待接收病种数据类型与所述待上报病种数据对应的数据类型进行匹配;通过目标数据上报策略根据匹配结果将所述待上报病种数据上报至所述待接收病种数据位置。
应当理解的是,待接收病种数据类型指的是接收病种数据的类型,该待接收病种数据类型包括但不限于单病种数据类型和多病种数据类型,待接收病种数据位置指的是接收病种数据的位置,在得到待上报病种数据后,将待接收病种数据类型与待上报病种数据对应的数据类型进行匹配,在匹配结果为匹配成功时,找到与待接收病种数据类型对应的病种数据存放的位置,即为待接收病种数据位置,然后通过目标数据上报策略将待上报病种数据上报至待接收病种数据位置。
可以理解的是,通过本实施例的方式可以实现以下技术效果:检查目标机构的各个系统之间录入的医疗数据,再针对各种规则进行医学知识聚类运算,在结果运算中反向匹配标准医学知识内容进行上报运算,结果内容根据相关质量要求医学语言要点整理出内容进行再次反哺算法特征进行结果输出,在数据集内容上加入医学类内容结果运算,数据矢量诊断当前机构的数据集是否达标,进行运算达标语言录入结果,进行不同类型的数据关联性填充,并在填充结果按照病种卫健要求进行数据监测,监测后内容再次判断数据内容合理性及真实性,进行聚类算法给出混合结论,进行填充上报。
本实施例通过获取目标机构的当前医疗数据,提取所述当前医疗数据的目标病历报告数据和病例诊断数据;通过目标聚类算法集合根据预设数据标准对所述目标病历报告数据和所述病例诊断数据进行预处理,得到完整标准术语报告数据和完整标准术语诊断数据;根据预设病种规则和质量数据校验规则对所述完整标准术语报告数据和所述完整标准术语诊断数据进行数据分析,得到待上报病种数据;通过目标数据上报策略根据预设病种数据接收规则对所述待上报病种数据进行上报;根据目标聚类算法集合进行预处理,然后根据预设病种规则和质量数据校验规则进行数据分析,再将待上报病种数据进行上报,从而能够得到满足卫健要求的病种数据,进而提高上报病种数据的准确性。
在一实施例中,如图3所述,基于第一实施例提出本发明基于挖掘聚类算法的病种数据上报方法第二实施例,所述步骤S30,包括:
步骤S301,通过DBSCAN聚类算法对所述完整标准术语报告数据和所述完整标准术语诊断数据进行分类处理,得到若干类别报告病种数据和若干类别诊断病种数据。
应当理解的是,在得到完整标准术语报告数据和所述完整标准术语诊断数据后,分别提取出完整标准术语报告数据中的报告病种数据,以及完整标准术语诊断数据中的诊断病种数据,然后通过DBSCAN聚类算法分别对报告病种数据和诊断病种数据进行分类、聚类处理,以得到若干类别报告病种数据和若干类别诊断病种数据,例如,病种报告数据a类、病种报告数据b类,诊断病种数据a类、诊断病种数据b类。
步骤S302,对所述若干类别报告病种数据和所述若干类别诊断病种数据进行数据融合,得到当前融合病种数据。
可以理解的是,为了得到整体的病种数据,采用数据融合的方式将若干类别报告病种数据和若干类别诊断病种数据进行数据融合,以得到当前融合病种数据。
步骤S303,根据所述预设病种规则和质量数据校验规则对所述当前融合病种数据进行数据分析,得到待上报病种数据。
进一步地,步骤S303,包括:根据所述预设病种规则对所述当前融合病种数据进行质量分析,得到对应的若干病种质量数据;分别统计若干病种质量数据的指标数量;根据预设指标评分规则和所述指标数量设置所述若干病种质量数据的质量分数;根据预设质量分数范围和所述质量分数对所述若干病种质量数据进行筛选,得到当前质量病种数据;通过隐含狄利克雷分配算法根据所述质量数据校验规则对所述当前质量病种数据进行校验;在校验通过时,将所述当前质量病种数据作为待上报病种数据。
可以理解的是,若干病种质量数据指的是当前融合病种数据的质量数据,该若干病种质量数据可以通过列表的形式呈现,在得到若干病种质量数据的指标数量后,通过预设指标评分规则根据指标数量设置若干病种质量数据的质量分数,病种质量数据的指标数量越多,设置的质量分数越高,例如,病种质量数据m的指标数量有c个,设置的质量分数为p1,病种质量数据n的指标数量有d个,设置的质量分数为p2,此时c>d,则p1>p2。
应当理解的是,在设置若干病种质量数据的质量分数后,根据预设质量分数范围在若干病种质量数据筛选出当前质量病种数据,然后由质量数据校验规则进一步进行质量校验,校验通过的当前质量病种数据的均是高质量单病种数据,此时的当前质量病种数据可以作为待上报病种数据。
进一步地,所述通过隐含狄利克雷分配算法根据所述质量数据校验规则对所述当前质量病种数据进行校验之后,还包括:在校验失败时,通过层次聚类算法对所述当前质量病种数据进行层次分解,得到若干层质量数据;采用自顶向下顺序根据所述预设病种规则依次对所述若干层质量数据对应的病种数据进行质量分析,得到当前若干病种质量数据;分别统计所述当前若干病种质量数据的指标数量,并继续执行根据预设指标评分规则和所述指标数量设置所述当前若干病种质量数据的质量分数的步骤。
应当理解的是,在校验失败时,表明当前质量病种数据不合格,此时需要通过层次聚类算法对当前质量病种数据进行层次分解,然后采用自顶向下顺序根据预设病种规则依次对各层的质量数据再次进行质量分析,然后根据预设指标评分规则和指标数量设置当前若干病种质量数据的质量分数,继续根据预设质量分数范围在若干病种质量数据筛选出质量病种数据,直至根据质量数据校验规则的校验结果为校验通过。
本实施例通过DBSCAN聚类算法对所述完整标准术语报告数据和所述完整标准术语诊断数据进行分类处理,得到若干类别报告病种数据和若干类别诊断病种数据;对所述若干类别报告病种数据和所述若干类别诊断病种数据进行数据融合,得到当前融合病种数据;根据所述预设病种规则和质量数据校验规则对所述当前融合病种数据进行数据分析,得到待上报病种数据;通过上述方式,通过DBSCAN聚类算法对完整标准术语报告数据和完整标准术语诊断数据进行分类处理,然后将若干类别报告病种数据和若干类别诊断病种数据融合为当前融合病种数据,最后根据预设病种规则和质量数据校验规则进行数据分析,从而能够得到满足卫健要求的待上报病种数据。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有基于挖掘聚类算法的病种数据上报程序,所述基于挖掘聚类算法的病种数据上报程序被处理器执行时实现如上文所述的基于挖掘聚类算法的病种数据上报方法的步骤。
由于本存储介质采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
此外,参照图4,本发明实施例还提出一种基于挖掘聚类算法的病种数据上报装置,所述基于挖掘聚类算法的病种数据上报装置包括:
获取模块10,用于获取目标机构的当前医疗数据,提取所述当前医疗数据的目标病历报告数据和病例诊断数据。
处理模块20,用于通过目标聚类算法集合根据预设数据标准对所述目标病历报告数据和所述病例诊断数据进行预处理,得到完整标准术语报告数据和完整标准术语诊断数据。
分析模块30,用于根据预设病种规则和质量数据校验规则对所述完整标准术语报告数据和所述完整标准术语诊断数据进行数据分析,得到待上报病种数据。
上报模块40,用于通过目标数据上报策略根据预设病种数据接收规则对所述待上报病种数据进行上报。
本实施例通过获取目标机构的当前医疗数据,提取所述当前医疗数据的目标病历报告数据和病例诊断数据;通过目标聚类算法集合根据预设数据标准对所述目标病历报告数据和所述病例诊断数据进行预处理,得到完整标准术语报告数据和完整标准术语诊断数据;根据预设病种规则和质量数据校验规则对所述完整标准术语报告数据和所述完整标准术语诊断数据进行数据分析,得到待上报病种数据;通过目标数据上报策略根据预设病种数据接收规则对所述待上报病种数据进行上报;根据目标聚类算法集合进行预处理,然后根据预设病种规则和质量数据校验规则进行数据分析,再将待上报病种数据进行上报,从而能够得到满足卫健要求的病种数据,进而提高上报病种数据的准确性。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于挖掘聚类算法的病种数据上报方法,此处不再赘述。
在一实施例中,所述获取模块10,还用于获取目标机构的当前医疗数据,根据所述当前医疗数据得到对应的数据类型;根据所述数据类型在数据提取工具集合中选取目标数据提取工具;通过所述目标数据提取工具根据预设数据挖掘算法对所述当前医疗数据进行数据挖掘,得到当前医疗数据的目标病历报告数据和病例诊断数据。
在一实施例中,所述处理模块20,还用于根据所述目标聚类算法集合得到模糊C均值聚类算法、Kmeans聚类算法以及Canopy聚类算法;通过所述模糊C均值聚类算法对所述目标病历报告数据和所述病例诊断数据进行推理,得到深度补充报告数据和深度补充诊断数据;将所述深度补充报告数据补充至所述目标病历报告数据,得到完整报告数据,以及将所述深度补充诊断数据补充至所述病例诊断数据,得到完整诊断数据;根据所述预设数据标准得到病种质量术语标准和质量分析细则标准;通过所述Canopy聚类算法根据所述质量分析细则标准分别对所述完整报告数据和所述完整诊断数据进行分析,得到完整质量报告数据和完整质量诊断数据;通过所述Kmeans聚类算法根据所述病种质量术语标准分别对所述完整质量报告数据和所述完整质量诊断数据进行话术转换,得到完整标准术语报告数据和完整标准术语诊断数据。
在一实施例中,所述分析模块30,还用于通过DBSCAN聚类算法对所述完整标准术语报告数据和所述完整标准术语诊断数据进行分类处理,得到若干类别报告病种数据和若干类别诊断病种数据,得到若干类别报告病种数据和若干类别诊断病种数据;对所述若干类别报告病种数据和所述若干类别诊断病种数据进行数据融合,得到当前融合病种数据;根据所述预设病种规则和质量数据校验规则对所述当前融合病种数据进行数据分析,得到待上报病种数据。
在一实施例中,所述分析模块30,还用于根据所述预设病种规则对所述当前融合病种数据进行质量分析,得到对应的若干病种质量数据;分别统计若干病种质量数据的指标数量;根据预设指标评分规则和所述指标数量设置所述若干病种质量数据的质量分数;根据预设质量分数范围和所述质量分数对所述若干病种质量数据进行筛选,得到当前质量病种数据;通过隐含狄利克雷分配算法根据所述质量数据校验规则对所述当前质量病种数据进行校验;在校验通过时,将所述当前质量病种数据作为待上报病种数据。
在一实施例中,所述分析模块30,还用于在校验失败时,通过层次聚类算法对所述当前质量病种数据进行层次分解,得到若干层质量数据;采用自顶向下顺序根据所述预设病种规则依次对所述若干层质量数据对应的病种数据进行质量分析,得到当前若干病种质量数据;分别统计所述当前若干病种质量数据的指标数量,并继续执行根据预设指标评分规则和所述指标数量设置所述当前若干病种质量数据的质量分数的步骤。
在一实施例中,所述上报模块40,还用于根据预设病种数据接收规则得到待接收病种数据类型和待接收病种数据位置;将所述待接收病种数据类型与所述待上报病种数据对应的数据类型进行匹配;通过目标数据上报策略根据匹配结果将所述待上报病种数据上报至所述待接收病种数据位置。
本发明所述基于挖掘聚类算法的病种数据上报装置的其他实施例或具有实现方法可参照上述各方法实施例,此处不在赘余。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,一体化平台工作站,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于挖掘聚类算法的病种数据上报方法,其特征在于,所述基于挖掘聚类算法的病种数据上报方法包括以下步骤:
获取目标机构的当前医疗数据,提取所述当前医疗数据的目标病历报告数据和病例诊断数据;
通过目标聚类算法集合根据预设数据标准对所述目标病历报告数据和所述病例诊断数据进行预处理,得到完整标准术语报告数据和完整标准术语诊断数据;
根据预设病种规则和质量数据校验规则对所述完整标准术语报告数据和所述完整标准术语诊断数据进行数据分析,得到待上报病种数据;
通过目标数据上报策略根据预设病种数据接收规则对所述待上报病种数据进行上报。
2.如权利要求1所述的基于挖掘聚类算法的病种数据上报方法,其特征在于,所述获取目标机构的当前医疗数据,提取所述当前医疗数据的目标病历报告数据和病例诊断数据,包括:
获取目标机构的当前医疗数据,根据所述当前医疗数据得到对应的数据类型;
根据所述数据类型在数据提取工具集合中选取目标数据提取工具;
通过所述目标数据提取工具根据预设数据挖掘算法对所述当前医疗数据进行数据挖掘,得到当前医疗数据的目标病历报告数据和病例诊断数据。
3.如权利要求1所述的基于挖掘聚类算法的病种数据上报方法,其特征在于,所述通过目标聚类算法集合根据预设数据标准对所述目标病历报告数据和所述病例诊断数据进行预处理,得到完整标准术语报告数据和完整标准术语诊断数据,包括:
根据所述目标聚类算法集合得到模糊C均值聚类算法、Kmeans聚类算法以及Canopy聚类算法;
通过所述模糊C均值聚类算法对所述目标病历报告数据和所述病例诊断数据进行推理,得到深度补充报告数据和深度补充诊断数据;
将所述深度补充报告数据补充至所述目标病历报告数据,得到完整报告数据,以及将所述深度补充诊断数据补充至所述病例诊断数据,得到完整诊断数据;
根据所述预设数据标准得到病种质量术语标准和质量分析细则标准;
通过所述Canopy聚类算法根据所述质量分析细则标准分别对所述完整报告数据和所述完整诊断数据进行分析,得到完整质量报告数据和完整质量诊断数据;
通过所述Kmeans聚类算法根据所述病种质量术语标准分别对所述完整质量报告数据和所述完整质量诊断数据进行话术转换,得到完整标准术语报告数据和完整标准术语诊断数据。
4.如权利要求1所述的基于挖掘聚类算法的病种数据上报方法,其特征在于,所述根据预设病种规则和质量数据校验规则对所述完整标准术语报告数据和所述完整标准术语诊断数据进行数据分析,得到待上报病种数据,包括:
通过DBSCAN聚类算法对所述完整标准术语报告数据和所述完整标准术语诊断数据进行分类处理,得到若干类别报告病种数据和若干类别诊断病种数据,得到若干类别报告病种数据和若干类别诊断病种数据;
对所述若干类别报告病种数据和所述若干类别诊断病种数据进行数据融合,得到当前融合病种数据;
根据所述预设病种规则和质量数据校验规则对所述当前融合病种数据进行数据分析,得到待上报病种数据。
5.如权利要求4所述的基于挖掘聚类算法的病种数据上报方法,其特征在于,所述根据所述预设病种规则和质量数据校验规则对所述当前融合病种数据进行数据分析,得到待上报病种数据,包括:
根据所述预设病种规则对所述当前融合病种数据进行质量分析,得到对应的若干病种质量数据;
分别统计若干病种质量数据的指标数量;
根据预设指标评分规则和所述指标数量设置所述若干病种质量数据的质量分数;
根据预设质量分数范围和所述质量分数对所述若干病种质量数据进行筛选,得到当前质量病种数据;
通过隐含狄利克雷分配算法根据所述质量数据校验规则对所述当前质量病种数据进行校验;
在校验通过时,将所述当前质量病种数据作为待上报病种数据。
6.如权利要求5所述的基于挖掘聚类算法的病种数据上报方法,其特征在于,所述通过隐含狄利克雷分配算法根据所述质量数据校验规则对所述当前质量病种数据进行校验之后,还包括:
在校验失败时,通过层次聚类算法对所述当前质量病种数据进行层次分解,得到若干层质量数据;
采用自顶向下顺序根据所述预设病种规则依次对所述若干层质量数据对应的病种数据进行质量分析,得到当前若干病种质量数据;
分别统计所述当前若干病种质量数据的指标数量,并继续执行根据预设指标评分规则和所述指标数量设置所述当前若干病种质量数据的质量分数的步骤。
7.如权利要求1至6中任一项所述的基于挖掘聚类算法的病种数据上报方法,其特征在于,所述通过目标数据上报策略根据预设病种数据接收规则对所述待上报病种数据进行上报,包括:
根据预设病种数据接收规则得到待接收病种数据类型和待接收病种数据位置;
将所述待接收病种数据类型与所述待上报病种数据对应的数据类型进行匹配;
通过目标数据上报策略根据匹配结果将所述待上报病种数据上报至所述待接收病种数据位置。
8.一种基于挖掘聚类算法的病种数据上报装置,其特征在于,所述基于挖掘聚类算法的病种数据上报装置包括:
获取模块,用于获取目标机构的当前医疗数据,提取所述当前医疗数据的目标病历报告数据和病例诊断数据;
处理模块,用于通过目标聚类算法集合根据预设数据标准对所述目标病历报告数据和所述病例诊断数据进行预处理,得到完整标准术语报告数据和完整标准术语诊断数据;
分析模块,用于根据预设病种规则和质量数据校验规则对所述完整标准术语报告数据和所述完整标准术语诊断数据进行数据分析,得到待上报病种数据;
上报模块,用于通过目标数据上报策略根据预设病种数据接收规则对所述待上报病种数据进行上报。
9.一种基于挖掘聚类算法的病种数据上报设备,其特征在于,所述基于挖掘聚类算法的病种数据上报设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于挖掘聚类算法的病种数据上报程序,所述基于挖掘聚类算法的病种数据上报程序配置有实现如权利要求1至7中任一项所述的基于挖掘聚类算法的病种数据上报方法。
10.一种存储介质,其特征在于,所述存储介质上存储有基于挖掘聚类算法的病种数据上报程序,所述基于挖掘聚类算法的病种数据上报程序被处理器执行时实现如权利要求1至7中任一项所述的基于挖掘聚类算法的病种数据上报方法。
CN202210984760.5A 2022-08-17 2022-08-17 基于挖掘聚类算法的病种数据上报方法、装置及存储介质 Active CN115050442B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210984760.5A CN115050442B (zh) 2022-08-17 2022-08-17 基于挖掘聚类算法的病种数据上报方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210984760.5A CN115050442B (zh) 2022-08-17 2022-08-17 基于挖掘聚类算法的病种数据上报方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN115050442A true CN115050442A (zh) 2022-09-13
CN115050442B CN115050442B (zh) 2022-10-25

Family

ID=83168330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210984760.5A Active CN115050442B (zh) 2022-08-17 2022-08-17 基于挖掘聚类算法的病种数据上报方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN115050442B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117275752A (zh) * 2023-11-20 2023-12-22 中国人民解放军总医院 基于机器学习的病例聚类分析方法及系统
CN117542536A (zh) * 2024-01-10 2024-02-09 中国人民解放军海军青岛特勤疗养中心 一种基于体检数据的智能护理方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104766259A (zh) * 2015-03-31 2015-07-08 华据医疗评估信息技术(北京)有限公司 一种基于单病种模型的医疗临床质量监测与评价系统
CN110136836A (zh) * 2019-03-27 2019-08-16 周凡 一种基于体检报告聚类分析的疾病预测方法
AU2021102129A4 (en) * 2021-04-22 2021-06-24 Affiliated Central Hospital of Shenyang Medical College Automatic labeling method of emphysema in CT image based on image report
CN114117053A (zh) * 2021-12-09 2022-03-01 深圳云知声信息技术有限公司 病种分类模型训练方法、装置、存储介质及电子装置
WO2022045874A1 (en) * 2020-08-26 2022-03-03 Mimos Berhad A system and method to generate statistical and analytical report
CN114220550A (zh) * 2021-12-16 2022-03-22 云知声智能科技股份有限公司 一种单病种上报通用方法、装置、电子设备和存储介质
CN114550859A (zh) * 2021-12-31 2022-05-27 医渡云(北京)技术有限公司 单病种质量监测方法、系统、设备及存储介质
CN114783581A (zh) * 2022-06-22 2022-07-22 北京惠每云科技有限公司 一种单病种数据的上报方法及上报装置
CN114882965A (zh) * 2022-05-26 2022-08-09 智业软件股份有限公司 一种单病种数据上报方法、终端设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104766259A (zh) * 2015-03-31 2015-07-08 华据医疗评估信息技术(北京)有限公司 一种基于单病种模型的医疗临床质量监测与评价系统
CN110136836A (zh) * 2019-03-27 2019-08-16 周凡 一种基于体检报告聚类分析的疾病预测方法
WO2022045874A1 (en) * 2020-08-26 2022-03-03 Mimos Berhad A system and method to generate statistical and analytical report
AU2021102129A4 (en) * 2021-04-22 2021-06-24 Affiliated Central Hospital of Shenyang Medical College Automatic labeling method of emphysema in CT image based on image report
CN114117053A (zh) * 2021-12-09 2022-03-01 深圳云知声信息技术有限公司 病种分类模型训练方法、装置、存储介质及电子装置
CN114220550A (zh) * 2021-12-16 2022-03-22 云知声智能科技股份有限公司 一种单病种上报通用方法、装置、电子设备和存储介质
CN114550859A (zh) * 2021-12-31 2022-05-27 医渡云(北京)技术有限公司 单病种质量监测方法、系统、设备及存储介质
CN114882965A (zh) * 2022-05-26 2022-08-09 智业软件股份有限公司 一种单病种数据上报方法、终端设备及存储介质
CN114783581A (zh) * 2022-06-22 2022-07-22 北京惠每云科技有限公司 一种单病种数据的上报方法及上报装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郑静等: "深圳市智慧医疗监管系统设计与实现", 《中国数字医学》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117275752A (zh) * 2023-11-20 2023-12-22 中国人民解放军总医院 基于机器学习的病例聚类分析方法及系统
CN117275752B (zh) * 2023-11-20 2024-03-22 中国人民解放军总医院 基于机器学习的病例聚类分析方法及系统
CN117542536A (zh) * 2024-01-10 2024-02-09 中国人民解放军海军青岛特勤疗养中心 一种基于体检数据的智能护理方法及系统
CN117542536B (zh) * 2024-01-10 2024-04-12 中国人民解放军海军青岛特勤疗养中心 一种基于体检数据的智能护理方法及系统

Also Published As

Publication number Publication date
CN115050442B (zh) 2022-10-25

Similar Documents

Publication Publication Date Title
Martins et al. Data mining for cardiovascular disease prediction
CN115050442B (zh) 基于挖掘聚类算法的病种数据上报方法、装置及存储介质
US20110093293A1 (en) Method and system for performing clinical data mining
Padula et al. Machine learning methods in health economics and outcomes research—the PALISADE checklist: a good practices report of an ISPOR task force
US11791048B2 (en) Machine-learning-based healthcare system
CN113779954A (zh) 相似文本的推荐方法、装置和电子设备
Kaur et al. Critical Review on Data Mining in Healthcare Sector
CN112561714B (zh) 基于nlp技术的核保风险预测方法、装置及相关设备
Selvan et al. An Image Processing Approach for Detection of Prenatal Heart Disease
Saturi Review on Machine Learning Techniques for Medical Data Classification and Disease Diagnosis
Baiju et al. Diabetes Retinopathy Prediction Using Multi-model Hyper Tuned Machine Learning
Falissard et al. A deep artificial neural network based model for underlying cause of death prediction from death certificates
Mandava MDensNet201-IDRSRNet: Efficient cardiovascular disease prediction system using hybrid deep learning
Baron Artificial Intelligence in the Clinical Laboratory: An Overview with Frequently Asked Questions
Gancheva et al. X-Ray Images Analytics Algorithm based on Machine Learning
CN111079420B (zh) 文本识别方法、装置、计算机可读介质及电子设备
EP3920190A1 (en) Bias detection in sensor signals
Junior et al. A study of the influence of textual features in learning medical prior authorization
Ogundokun et al. PCA-based feature extraction for classification of heart disease
Monteiro et al. A cognitive approach to digital health based on deep learning focused on classification and recognition of white blood cells
Singh Identification of Mental Disorder based on Changes in Personal Behaviour using Machine Learning
González et al. A Recommendation System for Electronic Health Records in the Context of the HOPE Project
Selvi et al. Deep Learning: Healthcare
Sasirekha et al. Identification and Classification of Leukemia Using Machine Learning Approaches
Chahid et al. Data Preprocessing For Machine Learning Applications in Healthcare: A Review

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant