CN116070096A - 通过大数据分析帮助医院搭建患者画像的方法及系统 - Google Patents

通过大数据分析帮助医院搭建患者画像的方法及系统 Download PDF

Info

Publication number
CN116070096A
CN116070096A CN202310147826.XA CN202310147826A CN116070096A CN 116070096 A CN116070096 A CN 116070096A CN 202310147826 A CN202310147826 A CN 202310147826A CN 116070096 A CN116070096 A CN 116070096A
Authority
CN
China
Prior art keywords
data
patient
portrait
information
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310147826.XA
Other languages
English (en)
Inventor
李乐乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yitu Hangzhou Technology Co ltd
Original Assignee
Yitu Hangzhou Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yitu Hangzhou Technology Co ltd filed Critical Yitu Hangzhou Technology Co ltd
Priority to CN202310147826.XA priority Critical patent/CN116070096A/zh
Publication of CN116070096A publication Critical patent/CN116070096A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及大数据分析技术领域,且公开了通过大数据分析帮助医院搭建患者画像的方法及系统,包括数据采集单元、数据处理单元、画像单元、接口单元以及应用单元,所述数据采集单元采集患者的数据信息并发送给数据处理单元,所述数据处理单元接收采集单元的数据信息并进行数据处理,且将处理后的数据发送给画像单元,所述画像单元接收数据处理单元的数据信息并搭建患者画像,所述接口单元将画像单元与医院内或者外界的系统进行连接,并将患者画像进行发送;能够快速地生成患者画像,生成患者画像时可以将数据中存在的错误进行清洗,保证数据的准确性,且采用朴素叶贝斯公式进行画像生成,最终所生成的画像更加准确。

Description

通过大数据分析帮助医院搭建患者画像的方法及系统
技术领域
本发明涉及大数据分析技术领域,更具体地涉及通过大数据分析帮助医院搭建患者画像的方法及系统。
背景技术
患者的画像,就是患者的个性化信息标签,把患者的基本医疗信息等抽象的数据,建造出的一个个性化、标签化的用户模型,而这些个性化标签是系统通过对用户的个性化信息分析、挖掘而得出的高度精炼的特征标识;
医院是以患者为中心的,而患者画像能够反映患者共同特征,通过数据挖掘分析构建精准的患者画像,可以辅助医生快速、准确地了解患者情况,从而为患者制定针对性的用药方案和治疗方案,提供优质医疗服务,因此采用医院患者画像既能避免医疗事故、减轻医生负荷,又能改善医患关系,但是传统的患者画像在搭建时存在以下问题:
患者画像在进行数据采集时,所采集的数据一般为患者在医院内的治疗数据,因此其所采集的数据不够全面,最终生成患者画像后,无法快速对患者自身进行诊断,且采集后的数据在进行传输时会产生数据错误,如产生空缺值或者异常值等,而无法对错误及时进行解决,搭建画像时会出现错误,进而影响画像的搭建;
患者画像在进行搭建时,常采用关键词与其值进行表示时,由于医疗领域下的关键词较多,进行描述画像时会导致向量过长,因此在进行更新以及画像的维护上费时费力,且搭建后的画像,无法在不同的系统或者医院内进行使用,因此当患者转院时,无法快速进行数据传输,进而会影响患者的治疗进度。
发明内容
为了克服现有技术的上述缺陷,本发明的实施条例提供通过大数据分析帮助医院搭建患者画像的方法及系统,以解决背景技术中所提出的技术问题。
为实现上述目的,本发明提供如下技术方案:通过大数据分析帮助医院搭建患者画像的方法,包括以下步骤:
步骤S1、数据采集单元采集患者自身的数据信息以及患者与所在医院的治疗信息,将采集后的数据发送给数据处理单元;
步骤S2、数据处理单元接收数据采集单元内的数据,并对接收的数据进行数据清洗以及数据储存,数据清理解决数据内的空缺值、异常值以及错误值,将清洗后的数据发送给画像单元;
步骤S3、画像单元将接收数据,并分别存入到基础属性组与医学领域属性组内,采用朴素叶贝斯公式
Figure BDA0004089710520000021
进行计算,生成患者画像;
步骤S4、画像单元将患者画像通过接口单元给应用单元,应用单元内的医疗模块、科研模块以及预警模块对患者画像进行使用。
在一个优选的实施方式中,包括数据采集单元、数据处理单元、画像单元、接口单元以及应用单元,所述数据采集单元采集患者的数据信息并发送给数据处理单元,所述数据处理单元接收采集单元的数据信息并进行数据处理,且将处理后的数据发送给画像单元,所述画像单元接收数据处理单元的数据信息并搭建患者画像,所述接口单元将画像单元与医院内或者外界的系统进行连接,并将患者画像进行发送,所述应用单元接收患者画像信息并对患者画像进行处理。
在一个优选的实施方式中,所述数据采集单元包括采集模块与集成模块,所述采集模块所采集的数据信息为患者个人信息、医生与患者的交谈记录、医嘱信息、医学影像、医院检查数值信息以及医生的观察说明,所述采集模块所采集的数据信息发送给集成模块,所述集成模块接收采集模块的数据并采用虚拟法进行数据集成,将集成后的数据发送给数据处理单元。
在一个优选的实施方式中,所述数据处理单元包括数据清洗模块以及数据储存模块,所述数据清洗模块包括空缺值处理组、异常值处理组以及重复值处理组,空缺值处理组采用判定树归纳法进行补充,判定树归纳法获得编码数据的公式为Gain(A)=I(s1,...,sm)-E(A),式中I为给定样本数据的期望信息,其计算公式为
Figure BDA0004089710520000031
式中s为数据样本,pi为其发生的概率,m为数据样本的数量,式中E(A)为树枝的分支,其计算公式为
Figure BDA0004089710520000032
式中A为数据属性,v为数据属性所具有的不同值,smj为数据样本在数据属性上所具有的值。
在一个优选的实施方式中,所述异常值处理组基于距离的孤立点进行异常值检测,数据整体集合中不大N部分与对象O之间的距离大于d,此时对象O为一个一个孤立点,对象O在d为半径的范围内超过最大对象树木M,此时便存在异常,异常点通过管理人员手动进行修改,所述重复值处理组检测两组数据的相似度超过阈值Q时,此时将一组数据进行删除,阈值Q的初始值为70%,且阈值Q的具体值可由管理人员进行重新设定,所述数据清洗模块将进行处理数据的初始数据保存在数据储存模块内,且数据储存模块的保存周期为三十天。
在一个优选的实施方式中,所述画像单元包括基础属性组、医学领域属性组以及画像生成模块,基础属性组包括患者的性别、年龄、职业以及所在地域,医学领域属性组包括医院信息、科室信息、患者的疾病信息、医嘱信息、治疗方案以及医生评价信息,采用二元组user=<Demographics,Medical〉表示用户画像,Demographics对应基础属性组,Medical对应医学领域属性组。
在一个优选的实施方式中,Demographics=<ID,Sex,Occuption,Address,Age,IsMarried>,ID为用户注册的ID,Sex=<male,female>,Occuption=〈农业、矿业、建筑业、零售业、餐饮业、金融业、地产业、信息业、其他>,Age=<60,70,80,90,00,10〉六个等级,IsMarried=<0,1,2>,0为未婚,1为已婚,2为离异。
在一个优选的实施方式中,Medical采用二元组〈Topic,Tag〉进行表示,Topic为医疗领域的主题向量,其权重由Topic向量上的维度大小表示,Tag为用户的标签向量,其权重由Tag向量上的维度大小表示,Topic共有六个大类,分别对应医院信息、科室信息、患者的疾病信息、医嘱信息、治疗方案以及医生评价信息。
在一个优选的实施方式中,所述基础属性组与医学领域属性内的信息发送给画像生成模块,所述画像生成模块采用朴素叶贝斯公式进行计算,其计算公式为
Figure BDA0004089710520000041
式中C为医学领域条件,W为关键词,P为在特定医学领域条件下关键字W的出现概率,N(W∈C)为领域中含有w的个数,N(DOC∈C)为领域中文本的个数。
在一个优选的实施方式中,所述接口单元包括Web CUI、WebService以及Web API,所述应用单元包括医疗模块、科研模块以及预警模块,所述医疗模块用于将患者画像进行医疗使用,所述科研模块用于将患者画像进行医学科研研究,所述预警模块根据患者画像信息对患者自身进行预警。
本发明的技术效果和优点:
1、本发明通过设有数据采集单元、数据处理单元、画像单元、接口单元以及应用单元,能够快速地生成患者画像,生成患者画像时可以将数据中存在的错误进行清洗,保证数据的准确性,且采用朴素叶贝斯公式进行画像生成,最终所生成的画像更加准确;
2、本发明的空缺值处理组采用判定树归纳法对空缺值进行补充,采用判定树归纳法进行空缺值的填充,准确度较高,并且可以识别较为重要的字段,因此进行填充后的数据与原数据在方向上不会发生改变;异常值处理组基于距离的孤立点进行异常值检测,以对不同类型的数据进行检测,从而适合本申请进行使用,且在检测时更加高效,重复值处理组将相同或者相似的数据进行删除,从而提高后续处理的速度;
3、本发明采用六个大分类来描述患者画像的医学领域标签与权重,便于进行患者画像的扩展,并且每个主体向量上的维度能够精确描述患者对此分类上的倾向程度,从而能够根据患者画像进行快速的诊断,采用朴素叶贝斯公式进行计算进行画像的生成,患者画像更加精确;
4、本发明的接口单元包括Web CUI、WebService以及Web API,从而能够与不同的系统进行连接,可以在不同的医院内进行使用,并且当患者所患疾病具有科研价值时,可以发送到科研机构进行研究,当患者画像显示患者此时有病情加重的风险时,此时预警,提醒患者进行治疗,防止病情加重。
附图说明
图1为本发明的整体组成结构示意图。
图2为本发明的数据清洗模块组成示意图。
图3为本发明的整体流程示意图。
具体实施方式
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,另外,在以下的实施方式中记载的各结构的形态只不过是例示,本发明所涉及的通过大数据分析帮助医院搭建患者画像的方法及系统并不限定于在以下的实施方式中记载的各结构,在本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施方式都属于本发明保护的范围。
参照图3,本发明提供了通过大数据分析帮助医院搭建患者画像的方法,包括以下步骤:
步骤S1、数据采集单元采集患者自身的数据信息以及患者与所在医院的治疗信息,将采集后的数据发送给数据处理单元;
步骤S2、数据处理单元接收数据采集单元内的数据,并对接收的数据进行数据清洗以及数据储存,数据清理解决数据内的空缺值、异常值以及错误值,将清洗后的数据发送给画像单元;
步骤S3、画像单元将接收数据,并分别存入到基础属性组与医学领域属性组内,采用朴素叶贝斯公式
Figure BDA0004089710520000061
进行计算,生成患者画像;
步骤S4、画像单元将患者画像通过接口单元给应用单元,应用单元内的医疗模块、科研模块以及预警模块对患者画像进行使用。
参照图1,通过大数据分析帮助医院搭建患者画像的系统,包括数据采集单元、数据处理单元、画像单元、接口单元以及应用单元,所述数据采集单元采集患者的数据信息并发送给数据处理单元,所述数据处理单元接收采集单元的数据信息并进行数据处理,且将处理后的数据发送给画像单元,所述画像单元接收数据处理单元的数据信息并搭建患者画像,所述接口单元将画像单元与医院内或者外界的系统进行连接,并将患者画像进行发送,所述应用单元接收患者画像信息并对患者画像进行处理。
本申请实施例中,设有数据采集单元、数据处理单元、画像单元、接口单元以及应用单元,能够快速地生成患者画像,生成患者画像时可以将数据中存在的错误进行清洗,保证数据的准确性,且采用朴素叶贝斯公式进行画像生成,最终所生成的画像更加准确,并且所生成的画像在应用单元内进行使用,可供给不同的单位进行使用,其在使用时更具有实用性。
进一步的,所述数据采集单元包括采集模块与集成模块,所述采集模块所采集的数据信息为患者个人信息、医生与患者的交谈记录、医嘱信息、医学影像、医院检查数值信息以及医生的观察说明,所述采集模块所采集的数据信息发送给集成模块,所述集成模块接收采集模块的数据并采用虚拟法进行数据集成,将集成后的数据发送给数据处理单元。
本申请实施例中,采集患者个人信息、医生与患者的交谈记录、医嘱信息、医学影像、医院检查数值信息以及医生的观察说明数据,从而可以对患者进行更好的判断,进而提高治疗的成功率,而所采集的数据,其具有语音数据、文字数据以及数值数据,因此其所包含的数据种类较多,因此其为多源异构数据,采用传统的数据仓库进行集成时,无法进行快速的更新以及处理,而医院内的数据需要及时更新,因此采用虚拟法的方式,将所采集的数据通过中间层与数据处理单元之间进行连接,中间层可以屏蔽数据源的异构性以及分布性,并能提供统一标准的接口,数据采集后,可以快速进行更新。
参照图2,所述数据处理单元包括数据清洗模块以及数据储存模块,所述数据清洗模块包括空缺值处理组、异常值处理组以及重复值处理组,空缺值处理组采用判定树归纳法进行补充,判定树归纳法获得编码数据的公式为Gain(A)=I(s1,...,sm)-E(A),式中I为给定样本数据的期望信息,其计算公式为
Figure BDA0004089710520000071
式中s为数据样本,pi为其发生的概率,m为数据样本的数量,式中E(A)为树枝的分支,其计算公式为
Figure BDA0004089710520000072
式中A为数据属性,v为数据属性所具有的不同值,smj为数据样本在数据属性上所具有的值;当数据被进行集成后,数据被发送时,无法保证数据的完全性,数据会难免出现丢失、异常或者重复等情况,当数据出现丢失时,此时会出现空缺值,而将空缺值进行忽略或者采用其余值进行替换,最终的数据会发生变化,而在进行医疗诊断时,数据产生变化会造成诊断错误,本申请采用判定树归纳法进行空缺值的填充,准确度较高,并且可以识别较为重要的字段,因此进行填充后的数据与原数据在方向上不会发生改变。
进一步的,所述异常值处理组基于距离的孤立点进行异常值检测,数据整体集合中不大N部分与对象O之间的距离大于d,此时对象O为一个一个孤立点,对象O在d为半径的范围内超过最大对象树木M,此时便存在异常,异常点通过管理人员手动进行修改,所述重复值处理组检测两组数据的相似度超过阈值Q时,此时将一组数据进行删除,阈值Q的初始值为70%,且阈值Q的具体值可由管理人员进行重新设定,所述数据清洗模块将进行处理数据的初始数据保存在数据储存模块内,且数据储存模块的保存周期为三十天。
本申请实施例中,传统采用统计的方法进行异常点检测,而统计法进行检测时,仅能针对单属性进行检测,而本申请所采集的数据为异构性数据,且所含有的数据类型较多,因此统计法进行检测时准确度不足,采用本申请的距离与孤立点进行检测,其依据在距离的基础上,从而可以对不同类型的数据进行检测,从而适合本申请进行使用,且在检测时更加高效,重复值处理组将相同或者相似的数据进行删除,从而提高后续处理的速度,且数据清洗模块进行数据的初始数据在数据储存模块内进保存,当数据清洗模块对数据的处理出现问题时,此时可以在数据储存模块调取原始数据,并进行手动输入,能够及时进行调节。
进一步的,所述画像单元包括基础属性组、医学领域属性组以及画像生成模块,基础属性组包括患者的性别、年龄、职业以及所在地域,医学领域属性组包括医院信息、科室信息、患者的疾病信息、医嘱信息、治疗方案以及医生评价信息,采用二元组user=<Demographics,Medical〉表示用户画像,Demographics对应基础属性组,Medical对应医学领域属性组,画像单元包括基础属性组、医学领域属性组,基础属性组内包括患者的基础信息,因此医院可以了解患者的基本信息,从而选择合适的治疗方案,如年纪在三十岁的患者与五十岁的患者之间,所采取的方案不同,而对其地域信息进行采集,如患者在潮湿地区,其发病原因与干燥地区不同,从而提高对患者进行诊断的准确程度。
进一步的,Demographics=<ID,Sex,Occuption,Address,Age,IsMarried>,ID为用户注册的ID,Sex=<male,female>,Occuption=〈农业、矿业、建筑业、零售业、餐饮业、金融业、地产业、信息业、其他>,Age=<60,70,80,90,00,10〉六个等级,IsMarried=<0,1,2>,0为未婚,1为已婚,2为离异,基础属性组即Demographics中,含有多种信息,用户注册的ID可以与用户进行绑定,从而避免别人进行假冒,在职业上,能够涵盖现在的大部分行业,其还有其他选择进行手动职业编辑,因此能够对患者各个不同方面的信息进行了解,使得患者画像更加准确。
进一步的,Medical采用二元组〈Topic,Tag〉进行表示,Topic为医疗领域的主题向量,其权重由Topic向量上的维度大小表示,Tag为用户的标签向量,其权重由Tag向量上的维度大小表示,Topic共有六个大类,分别对应医院信息、科室信息、患者的疾病信息、医嘱信息、治疗方案以及医生评价信息,传统的方式进行空间向量模型处理时,采用关键词与其值进行表示时,由于医疗领域下的关键词较多,进行描述画像时会导致向量过长,因此在进行更新以及画像的维护上费时费力,并且会造成数据稀疏,不利于进行相似度计算,而本申请采用六个大分类来描述患者画像的医学领域标签与权重,便于进行患者画像的扩展,并且每个主体向量上的维度能够精确描述患者对此分类上的倾向程度,从而能够根据患者画像进行快速的诊断。
进一步的,所述基础属性组与医学领域属性内的信息发送给画像生成模块,所述画像生成模块采用朴素叶贝斯公式进行计算,其计算公式为
Figure BDA0004089710520000091
式中C为医学领域条件,W为关键词,P为在特定医学领域条件下关键字W的出现概率,N(W∈C)为领域中含有w的个数,N(DOC∈C)为领域中文本的个数,采用朴素叶贝斯公式进行计算进行画像的生成,其计算时的结果更加准确,且医学领域内的信息能够与患者之间更加匹配,从而最终生成的患者画像更加符合患者自身,便于医院将患者的画像进行统一且精确的管理。
进一步的,所述接口单元包括Web CUI、WebService以及Web API,所述应用单元包括医疗模块、科研模块以及预警模块,所述医疗模块用于将患者画像进行医疗使用,所述科研模块用于将患者画像进行医学科研研究,所述预警模块根据患者画像信息对患者自身进行预警,接口单元包括Web CUI、WebService以及Web API,从而能够与不同的系统进行连接,因此患者画像进行搭建后,可以在不同的医院内进行使用,因此当患者需要进行转院治疗时,将患者画像直接进行发送即可,当患者所患疾病具有科研价值时,可以发送到科研机构进行研究,当患者画像显示患者此时有病情加重的风险时,此时预警,提醒患者进行治疗,防止病情加重。
上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行计算机指令或计算机程序时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以为通用计算机、专用计算机、计算机网络或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。可用介质可以是磁性介质、光介质或者半导体介质。半导体介质可以是固态硬盘。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其他的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.通过大数据分析帮助医院搭建患者画像的方法,其特征在于:包括以下步骤:
步骤S1、数据采集单元采集患者自身的数据信息以及患者与所在医院的治疗信息,将采集后的数据发送给数据处理单元;
步骤S2、数据处理单元接收数据采集单元内的数据,并对接收的数据进行数据清洗以及数据储存,数据清理解决数据内的空缺值、异常值以及错误值,将清洗后的数据发送给画像单元;
步骤S3、画像单元将接收数据,并分别存入到基础属性组与医学领域属性组内,采用朴素叶贝斯公式
Figure FDA0004089710510000011
进行计算,生成患者画像;
步骤S4、画像单元将患者画像通过接口单元给应用单元,应用单元内的医疗模块、科研模块以及预警模块对患者画像进行使用。
2.通过大数据分析帮助医院搭建患者画像的系统,其特征在于:包括数据采集单元、数据处理单元、画像单元、接口单元以及应用单元,所述数据采集单元采集患者的数据信息并发送给数据处理单元,所述数据处理单元接收采集单元的数据信息并进行数据处理,且将处理后的数据发送给画像单元,所述画像单元接收数据处理单元的数据信息并搭建患者画像,所述接口单元将画像单元与医院内或者外界的系统进行连接,并将患者画像进行发送,所述应用单元接收患者画像信息并对患者画像进行处理。
3.根据权利要求2所述的通过大数据分析帮助医院搭建患者画像的系统,其特征在于:所述数据采集单元包括采集模块与集成模块,所述采集模块所采集的数据信息为患者个人信息、医生与患者的交谈记录、医嘱信息、医学影像、医院检查数值信息以及医生的观察说明,所述采集模块所采集的数据信息发送给集成模块,所述集成模块接收采集模块的数据并采用虚拟法进行数据集成,将集成后的数据发送给数据处理单元。
4.根据权利要求2所述的通过大数据分析帮助医院搭建患者画像的系统,其特征在于:所述数据处理单元包括数据清洗模块以及数据储存模块,所述数据清洗模块包括空缺值处理组、异常值处理组以及重复值处理组,空缺值处理组采用判定树归纳法进行补充,判定树归纳法获得编码数据的公式为Gain(A)=I(s1,...,sm)-E(A),式中I为给定样本数据的期望信息,其计算公式为
Figure FDA0004089710510000021
式中s为数据样本,pi为其发生的概率,m为数据样本的数量,式中E(A)为树枝的分支,其计算公式为
Figure FDA0004089710510000022
式中A为数据属性,v为数据属性所具有的不同值,smj为数据样本在数据属性上所具有的值。
5.根据权利要求4所述的通过大数据分析帮助医院搭建患者画像的系统,其特征在于:所述异常值处理组基于距离的孤立点进行异常值检测,数据整体集合中不大N部分与对象O之间的距离大于d,此时对象O为一个一个孤立点,对象O在d为半径的范围内超过最大对象树木M,此时便存在异常,异常点通过管理人员手动进行修改,所述重复值处理组检测两组数据的相似度超过阈值Q时,此时将一组数据进行删除,阈值Q的初始值为70%,且阈值Q的具体值可由管理人员进行重新设定,所述数据清洗模块将进行处理数据的初始数据保存在数据储存模块内,且数据储存模块的保存周期为三十天。
6.根据权利要求2所述的通过大数据分析帮助医院搭建患者画像的系统,其特征在于:所述画像单元包括基础属性组、医学领域属性组以及画像生成模块,基础属性组包括患者的性别、年龄、职业以及所在地域,医学领域属性组包括医院信息、科室信息、患者的疾病信息、医嘱信息、治疗方案以及医生评价信息,采用二元组user=<Demographics,Medical〉表示用户画像,Demographics对应基础属性组,Medical对应医学领域属性组。
7.根据权利要求6所述的通过大数据分析帮助医院搭建患者画像的系统,其特征在于:Demographics=<ID,Sex,Occuption,Address,Age,IsMarried>,ID为用户注册的ID,Sex=<male,female>,Occuption=〈农业、矿业、建筑业、零售业、餐饮业、金融业、地产业、信息业、其他>,Age=<60,70,80,90,00,10〉六个等级,IsMarried=<0,1,2>,0为未婚,1为已婚,2为离异。
8.根据权利要求6所述的通过大数据分析帮助医院搭建患者画像的系统,其特征在于:Medical采用二元组〈Topic,Tag〉进行表示,Topic为医疗领域的主题向量,其权重由Topic向量上的维度大小表示,Tag为用户的标签向量,其权重由Tag向量上的维度大小表示,Topic共有六个大类,分别对应医院信息、科室信息、患者的疾病信息、医嘱信息、治疗方案以及医生评价信息。
9.根据权利要求8所述的通过大数据分析帮助医院搭建患者画像的系统,其特征在于:所述基础属性组与医学领域属性内的信息发送给画像生成模块,所述画像生成模块采用朴素叶贝斯公式进行计算,其计算公式为
Figure FDA0004089710510000031
式中C为医学领域条件,W为关键词,P为在特定医学领域条件下关键字W的出现概率,N(W∈C)为领域中含有w的个数,N(DOC∈C)为领域中文本的个数。
10.根据权利要求2所述的通过大数据分析帮助医院搭建患者画像的系统,其特征在于:所述接口单元包括Web CUI、WebService以及Web API,所述应用单元包括医疗模块、科研模块以及预警模块,所述医疗模块用于将患者画像进行医疗使用,所述科研模块用于将患者画像进行医学科研研究,所述预警模块根据患者画像信息对患者自身进行预警。
CN202310147826.XA 2023-02-22 2023-02-22 通过大数据分析帮助医院搭建患者画像的方法及系统 Pending CN116070096A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310147826.XA CN116070096A (zh) 2023-02-22 2023-02-22 通过大数据分析帮助医院搭建患者画像的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310147826.XA CN116070096A (zh) 2023-02-22 2023-02-22 通过大数据分析帮助医院搭建患者画像的方法及系统

Publications (1)

Publication Number Publication Date
CN116070096A true CN116070096A (zh) 2023-05-05

Family

ID=86176775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310147826.XA Pending CN116070096A (zh) 2023-02-22 2023-02-22 通过大数据分析帮助医院搭建患者画像的方法及系统

Country Status (1)

Country Link
CN (1) CN116070096A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116777307A (zh) * 2023-08-21 2023-09-19 河北省儿童医院(河北省第五人民医院、河北省儿科研究所) 一种基于大数据的医院医生综合分析评价方法
CN117438023A (zh) * 2023-10-31 2024-01-23 灌云县南岗镇卫生院 基于大数据的医院信息管理方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116777307A (zh) * 2023-08-21 2023-09-19 河北省儿童医院(河北省第五人民医院、河北省儿科研究所) 一种基于大数据的医院医生综合分析评价方法
CN116777307B (zh) * 2023-08-21 2023-11-07 河北省儿童医院(河北省第五人民医院、河北省儿科研究所) 一种基于大数据的医院医生综合分析评价方法
CN117438023A (zh) * 2023-10-31 2024-01-23 灌云县南岗镇卫生院 基于大数据的医院信息管理方法及系统
CN117438023B (zh) * 2023-10-31 2024-04-26 灌云县南岗镇卫生院 基于大数据的医院信息管理方法及系统

Similar Documents

Publication Publication Date Title
US11669792B2 (en) Medical scan triaging system and methods for use therewith
CN101911078B (zh) 匹配类似患者病例
CN116070096A (zh) 通过大数据分析帮助医院搭建患者画像的方法及系统
CN111492437A (zh) 支持医学决策的方法和系统
CN111584021A (zh) 病案信息校验方法、装置、电子设备及存储介质
US20220037019A1 (en) Medical scan artifact detection system and methods for use therewith
CN107145715B (zh) 一种基于推举算法的临床医学智能判别装置
CN113223734A (zh) 基于算法、医学影像和大数据的疾病诊断和大健康管理平台
CN116959715A (zh) 一种基于时序演进过程解释的疾病预后预测系统
US20220005566A1 (en) Medical scan labeling system with ontology-based autocomplete and methods for use therewith
US8548841B1 (en) Supply expense analysis
Shyamala et al. Machine Learning Algorithms for Healthcare Data Analytics
US20230215523A1 (en) Artificial intelligence-based medical coding and diagnosis
US20230041051A1 (en) Methods and systems for predicting and preventing frequent patient readmission
Nagarajan et al. Adopting Streaming Analytics for Healthcare and Retail Domains
Payal et al. Integrating Natural language processing (NLP) and Machine learning Techniques for Healthcare Industries
CN115458109A (zh) 一种基于卷积神经网络的医疗辅助诊断方法及系统
CN115295175A (zh) 一种基于im的线上医患服务签订协议的系统及方法
Sharma Remote Healthcare and Telemedicine

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination