CN114882967A - 基于大数据的患者信息存储系统 - Google Patents

基于大数据的患者信息存储系统 Download PDF

Info

Publication number
CN114882967A
CN114882967A CN202210600230.6A CN202210600230A CN114882967A CN 114882967 A CN114882967 A CN 114882967A CN 202210600230 A CN202210600230 A CN 202210600230A CN 114882967 A CN114882967 A CN 114882967A
Authority
CN
China
Prior art keywords
patient
information
data
patient information
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210600230.6A
Other languages
English (en)
Inventor
潘恒杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202210600230.6A priority Critical patent/CN114882967A/zh
Publication of CN114882967A publication Critical patent/CN114882967A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules

Abstract

本发明公开了基于大数据的患者信息存储系统,包括患者信息存储模块、患者信息整合模块和安全管理模块,所述患者信息存储模块用于存储各医疗机构的患者信息,所述患者信息整合模块用于将各医疗机构的患者信息进行整合联通,所述安全管理模块用于对系统存储的患者信息进行安全保护,所述患者信息整合模块和安全管理模块均与患者信息存储模块网络连接,患者信息存储模块包括患者信息存储数据库、医疗信息获取模块、回访信息采集模块和信息数据标准化模块,所述信息数据标准化模块与患者新存储数据库网络连接,患者信息整合模块包括哈希值组生成单元、匹配识别单元和信息分析模块,本发明,具有提高信息存储效率和安全性的特点。

Description

基于大数据的患者信息存储系统
技术领域
本发明涉及医疗系统技术领域,具体为基于大数据的患者信息存储系统。
背景技术
随着医疗诊疗体系覆盖率和电子化程度的不断提高,大量的医学数据也随之产生,这些医疗数据在实际场景中,大多是由不同的医疗机构产生,存储在各自的系统中。由于各医疗机构间电子病历系统的不同以及不同医疗机构间数据交流意愿、数据安全隐私等方方面面的问题,医疗数据往往局限在各自医疗体系内,很难有效整合。病人的就诊,很多时候也是分散在多家医疗机构的,这就造成了患者的重复诊疗问题,以及全流程诊疗过程分析的困难。而且,很多患者在身体问题痊愈后,或可能因为某些疾病的特殊性,在治疗出院后因为生活的变化而产生的心理问题,这是医生所无法预料的,却可能因此给患者带来比身理疾病更大的痛苦,虽然目前也会进行术后回访,但回访后的信息存储并不能快速方便地查看,或是作为依据阶段性地观察患者信息变化。因此,设计提高信息存储效率和安全性的基于大数据的患者信息存储系统是很有必要的。
发明内容
本发明的目的在于提供基于大数据的患者信息存储系统,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:基于大数据的患者信息存储系统,包括患者信息存储模块、患者信息整合模块和安全管理模块,其特征在于:所述患者信息存储模块用于存储各医疗机构的患者信息,所述患者信息整合模块用于将各医疗机构的患者信息进行整合联通,所述安全管理模块用于对系统存储的患者信息进行安全保护,所述患者信息整合模块和安全管理模块均与患者信息存储模块网络连接。
根据上述技术方案,所述患者信息存储模块包括患者信息存储数据库、医疗信息获取模块、回访信息采集模块和信息数据标准化模块,所述患者信息存储数据库用于保存各医疗机构经过数据化处理的患者信息,所述医疗信息获取模块用于从各医疗机构获取患者的基本信息和治疗信息,所述回访信息采集模块用于定期采集患者诊疗后的生活和心理因疾病治疗造成的状态变化信息,所述信息数据标准化模块用于将获取和采集到的数据信息标准化处理,所述信息数据标准化模块与患者新存储数据库网络连接。
根据上述技术方案,所述患者信息整合模块包括哈希值组生成单元、匹配识别单元和信息分析模块,所述哈希值组生成单元用于将患者信息转化为对应哈希值,并进行分组,所述匹配识别单元用于对分散在各个医疗机构的数据,依据患者身份进行信息识别,所述信息分析模块用于对回访信息进行分析处理,所述匹配识别单元与哈希值组生成单元网络连接,所述信息分析模块与回访信息采集模块网络连接。
根据上述技术方案,所述患者信息安全管理模块包括数据加密子模块、权限设置子模块和访问监测子模块,所述数据加密子模块用于对所有患者信息进行数据加密,所述权限设置子模块用于对患者信息访问修改调用进行权限设置,所述访问监测子模块用于对系统内的患者信息访问操作进行安全监测,所述权限设置子模块与数据加密子模块网络连接,所述访问监测子模块与权限设置子模块网络连接。
根据上述技术方案,所述患者信息存储模块的运行方法主要包括以下步骤:
步骤S1:建立患者信息存储数据库,将各医疗机构的患者信息在经过标准化处理后存储至数据库中;
步骤S2:各医疗机构将所有患者基本信息和诊疗信息上传至数据库中;
步骤S3:各医疗机构对部分特殊疾病患者进行定期回访调查,记录其在治疗后是否存在因患病而导致的生活状态变化和心理问题,患者亦可自主向医疗机构上报以上问题,系统以规定格式和患者信息一并存储至数据库中;
步骤S4:对各医疗机构上传至数据库的患者信息进行数据文件备份,对备份的数据库进行数据抽取、校验和清洗,对于获取到的非结构化数据,采用自然语言处理的方式进行结构化的数据转化;
步骤S5:将经过标准化处理后的患者信息存储至数据库中。
根据上述技术方案,所述患者信息整合模块的运行方法主要包括以下步骤:
步骤A1:系统依据患者身份信息的特点,将不同的身份信息采取不同的哈希算法进行处理,在患者信息分别转换为对应哈希值之后,系统会为这些哈希值进行分组;
步骤A2:匹配识别单元在接收到匹配申请后,用本地存储的非对称加密私钥来解密同步的申请数据,并根据混杂方案还原患者哈希值组,对于每组哈希值分别与本地存储患者哈希值组进行相似度计算,由每部分匹配结果的权重组合来进行相同患者判定;
步骤A3:信息分析模块对于回访患者信息定期分析,并根据具体问题与其他部门联通为患者提供一站式医疗服务。
根据上述技术方案,所述步骤A1进一步包括以下步骤:
步骤A11:对于一个患者P而言,其身份识别信息由[Pi,Pj,…,Pz]组成;
步骤A12:对于可唯一识别患者且有差异敏感性的标识Pi,采取标准的SHA256哈希算法加密,生成哈希值SHA256(Pi);
步骤A13:对于允许模糊输入的部分Pj,采用SimHash算法来进行加密,生成哈希值SimHash(Pj);
步骤A14:对于每个要匹配的患者,系统会生成一组随机患者数据[P′i,P′j,…,P′k],将随机生成患者的部分数据与要匹配患者的部分哈希值进行交换混杂;
步骤A15:将所有数据使用非对称加密公钥进行加密,同步至数据库中。
根据上述技术方案,所述步骤A2进一步包括以下步骤:
步骤A211:由本地存储私钥解密混杂方案及数据,根据混杂方案还原原始数据的哈希值组;
步骤A22:将新的患者哈希值组[Ci,Cj,…,Cz]与本地存储的患者哈希值组[Pi,Pj,…,Pz]中每一项分别计算相似度;
步骤A23:对于使用SHA256处理的可完全识别患者的信息,直接进行哈希值的比较,依据相同与否,相似度取值1或0;
步骤A24:对使用SimHash处理的信息,进行字符串相似度计算,并排序,按照计算结果排序,对比结果排名前两位的数据库患者数据进行权重计算;
步骤A25:具体相似度计算公式为:
Figure BDA0003666741620000041
式中,L为该文本的编辑距离,Max(X,Y)为X和Y两个字符串之间的最大长度;
步骤A26:对于相似度计算筛选出的数据结果,按照预先制定的权重占比方案计算权重总和;
步骤A27:设置权重匹配阈值Z0,计算出权重和的患者与阈值作比较,若权重和高于阈值,则认为匹配成功,否则匹配失败;
步骤A28:对于唯一性标识,即可唯一识别患者的信息,权重设置为1;对于匹配性标识,设置其权重值总和为1,同时为避免因某一项缺失而导致匹配和过小无法匹配,每一项的权重值应小于0.5;
步骤A29:具体权重计算公式为:
Figure BDA0003666741620000051
式中,NZ为匹配到的正确信息数量,NJ为未匹配到的正确信息数量,Nc为被匹配到的样本中,匹配错误的数量,K为信息数量与具体权重的转换系数,为(0,1)间的常数值。
根据上述技术方案,所述步骤A3进一步包括以下步骤:
步骤A31:各医疗机构工作人员定期查看患者的回访信息,同时记录每一次的问题解决;
步骤A32:对于治疗结束后的患者因疾病产生的生活困难问题,工作人员可与社会部门进行患者信息共享,由社会部门人员为患者提供帮助;
步骤A33:对于治疗结束后的患者因疾病产生的心理状态问题,工作人员可与心理医疗机构进行患者信息共享,进一步对患者的心理问题进行治疗。
根据上述技术方案,所述安全管理模块的运行方法主要包括以下步骤:
步骤B1:数据加密子模块采取非对称加密和属性基加密对患者数据信息加密处理;
步骤B2:权限设置子模块根据患者信息保密程度和患者自我意愿,对各部门通过系统进行患者信息互通过程进行权限设置;
步骤B3:对于每一次的患者信息查看、调取,访问监测子模块记录具体访问信息,对访问人员的操作实时监测,在出现违规操作时及时反馈,同时当患者信息出现泄漏时可根据监测数据追溯出泄露信息人员。
与现有技术相比,本发明所达到的有益效果是:本发明通过设置患者信息存储模块、患者信息整合模块和安全管理模块,对各机构患者信息进行加密存储,将患者信息转化为对应哈希值,并进行分组,再将每组哈希值分别与本地存储患者哈希值组进行相似度计算,由每部分匹配结果的权重组合来进行相同患者判定,实现数据整合过程中的患者信息保密和数据传输安全,同时记录患者的回访信息,为患者提供疾病以外的生活帮助和心理治疗,实现患者的全方面治愈。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明的系统模块组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供技术方案:基于大数据的患者信息存储系统,包括患者信息存储模块、患者信息整合模块和安全管理模块,患者信息存储模块用于存储各医疗机构的患者信息,患者信息整合模块用于将各医疗机构的患者信息进行整合联通,安全管理模块用于对系统存储的患者信息进行安全保护,患者信息整合模块和安全管理模块均与患者信息存储模块网络连接,通过设置患者信息存储模块、患者信息整合模块和安全管理模块,对各机构患者信息进行加密存储,将患者信息转化为对应哈希值,并进行分组,再将每组哈希值分别与本地存储患者哈希值组进行相似度计算,由每部分匹配结果的权重组合来进行相同患者判定,实现数据整合过程中的患者信息保密和数据传输安全,同时记录患者的回访信息,为患者提供疾病以外的生活帮助和心理治疗,实现患者的全方面治愈。
患者信息存储模块包括患者信息存储数据库、医疗信息获取模块、回访信息采集模块和信息数据标准化模块,患者信息存储数据库用于保存各医疗机构经过数据化处理的患者信息,医疗信息获取模块用于从各医疗机构获取患者的基本信息和治疗信息,回访信息采集模块用于定期采集患者诊疗后的生活和心理因疾病治疗造成的状态变化信息,信息数据标准化模块用于将获取和采集到的数据信息标准化处理,信息数据标准化模块与患者新存储数据库网络连接。
患者信息整合模块包括哈希值组生成单元、匹配识别单元和信息分析模块,哈希值组生成单元用于将患者信息转化为对应哈希值,并进行分组,由于不同的数据很难得到相同的哈希值,保证的哈希值跟原始数据的一一对应,可用哈希值作为原始数据的身份替代。哈希值的输入敏感性,又可作为完整性校验的工具。由于不论原始数据量的大小,所生成的哈希值是定长的,在一致性校验的场景中可以大大减少数据量,匹配识别单元用于对分散在各个医疗机构的数据,依据患者身份进行信息识别,信息分析模块用于对回访信息进行分析处理,匹配识别单元与哈希值组生成单元网络连接,信息分析模块与回访信息采集模块网络连接。
患者信息安全管理模块包括数据加密子模块、权限设置子模块和访问监测子模块,数据加密子模块用于对所有患者信息进行数据加密,权限设置子模块用于对患者信息访问修改调用进行权限设置,访问监测子模块用于对系统内的患者信息访问操作进行安全监测,权限设置子模块与数据加密子模块网络连接,访问监测子模块与权限设置子模块网络连接。
患者信息存储模块的运行方法主要包括以下步骤:
步骤S1:建立患者信息存储数据库,将各医疗机构的患者信息在经过标准化处理后存储至数据库中;
步骤S2:各医疗机构将所有患者基本信息和诊疗信息上传至数据库中,基本信息包括患者的姓名、身份证号等直接指向患者的身份信息,诊疗信息包括患者的门诊记录、检查结果、化验记录、症状描述等诊断依据以及患者的性别,以及患者该次医疗行为的诊疗医生、诊断结果与治疗结果;
步骤S3:各医疗机构对部分特殊疾病患者进行定期回访调查,记录其在治疗后是否存在因患病而导致的生活状态变化和心理问题,患者亦可自主向医疗机构上报以上问题,系统以规定格式和患者信息一并存储至数据库中;
步骤S4:对各医疗机构上传至数据库的患者信息进行数据文件备份,对备份的数据库进行数据抽取、校验和清洗,对于获取到的非结构化数据,采用自然语言处理的方式进行结构化的数据转化,由于多家医疗机构间数据的差异性较大,在数据接入对齐系统前,需进行数据标准化处理,基于统一术语规范,将不同机构中的异构的患者信息数据(文本、就诊信息等)转化为结构化的数据消除各医院接入系统数据的异质性问题,为后续数据对齐提供保证;
步骤S5:将经过标准化处理后的患者信息存储至数据库中,方便后续的数据分析和各医疗机构间的信息调用查看。
患者信息整合模块的运行方法主要包括以下步骤:
步骤A1:系统依据患者身份信息的特点,将不同的身份信息采取不同的哈希算法进行处理,哈希值可由原始数据快速计算得出,而不可能从哈希值反推回原始数据,且原始数据与哈希值是一一对应的,即正向快速、逆向困难、难以冲突,因此可用哈希值作为患者身份信息的标识,在患者信息分别转换为对应哈希值之后,系统会为这些哈希值进行分组;
步骤A2:匹配识别单元在接收到匹配申请后,用本地存储的非对称加密私钥来解密同步的申请数据,并根据混杂方案还原患者哈希值组,对于每组哈希值分别与本地存储患者哈希值组进行相似度计算,由每部分匹配结果的权重组合来进行相同患者判定,对于分散在各个医疗机构的数据,需依据患者身份识别信息,将相同患者在各机构的就诊记录进行匹配关联。患者身份匹配除使用固有的患者唯一标识(如身份证号)外,还应考虑到患者部分身份信息缺失的情况,在满足医疗需求、提升覆盖面的情况下尽可能保证匹配的准确性。同时,还应避免患者身份信息的暴露,保证隐私性需求;
步骤A3:信息分析模块对于回访患者信息定期分析,并根据具体问题与其他部门联通为患者提供一站式医疗服务。
步骤A1进一步包括以下步骤:
步骤A11:对于一个患者P而言,其身份识别信息由[Pi,Pj,…,Pz]组成;
步骤A12:对于可唯一识别患者且有差异敏感性的标识Pi,采取标准的SHA256哈希算法加密,生成哈希值SHA256(Pi);
步骤A13:对于允许模糊输入的部分Pj,采用SimHash算法来进行加密,生成哈希值SimHash(Pj),SimHash的相似性与原文本相似性一致,可用于之后文本相似度的比较;
步骤A14:对于每个要匹配的患者,系统会生成一组随机患者数据[P′i,P′j,…,P′k],将随机生成患者的部分数据与要匹配患者的部分哈希值进行交换混杂;
步骤A15:将所有数据使用非对称加密公钥进行加密,同步至数据库中。
步骤A2进一步包括以下步骤:
步骤A211:由本地存储私钥解密混杂方案及数据,根据混杂方案还原原始数据的哈希值组;
步骤A22:将新的患者哈希值组[Ci,Cj,…,Cz]与本地存储的患者哈希值组[Pi,Pj,…,Pz]中每一项分别计算相似度;
步骤A23:对于使用SHA256处理的可完全识别患者的信息,直接进行哈希值的比较,依据相同与否,相似度取值1或0,取值为1即为匹配成功,取值为0则匹配失败;
步骤A24:对使用SimHash处理的信息,进行字符串相似度计算,并排序,按照计算结果排序,对比结果排名前两位的数据库患者数据进行权重计算;
步骤A25:具体相似度计算公式为:
Figure BDA0003666741620000101
式中,L为该文本的编辑距离,即两个字符串之间,由一个转成另一个所需的最少编辑操作次数,Max(X,Y)为X和Y两个字符串之间的最大长度,编辑距离越小,字符串越相似;
步骤A26:对于相似度计算筛选出的数据结果,按照预先制定的权重占比方案计算权重总和;
步骤A27:设置权重匹配阈值Z0,计算出权重和的患者与阈值作比较,若权重和高于阈值,则认为匹配成功,否则匹配失败;
步骤A28:对于唯一性标识,即可唯一识别患者的信息,权重设置为1;对于匹配性标识,设置其权重值总和为1,同时为避免因某一项缺失而导致匹配和过小无法匹配,每一项的权重值应小于0.5,对唯一性标识赋予高权重,对辅助信息赋予较低权重,进行过哈希生成与权重赋予后,每个患者在系统内即对应一组有权重差别的哈希值,这一哈希值组即为患者的身份标识,用于进行患者匹配;
步骤A29:具体权重计算公式为:
Figure BDA0003666741620000102
式中,NZ为匹配到的正确信息数量,NJ为未匹配到的正确信息数量,Nc为被匹配到的样本中,匹配错误的数量,K为信息数量与具体权重的转换系数,为(0,1)间的常数值。
步骤A3进一步包括以下步骤:
步骤A31:各医疗机构工作人员定期查看患者的回访信息,同时记录每一次的问题解决;
步骤A32:对于治疗结束后的患者因疾病产生的生活困难问题,工作人员可与社会部门进行患者信息共享,由社会部门人员为患者提供帮助;
步骤A33:对于治疗结束后的患者因疾病产生的心理状态问题,工作人员可与心理医疗机构进行患者信息共享,进一步对患者的心理问题进行治疗,将患者问题不仅仅局限于医疗机构内的治疗,以扩大至社会范围内的生活和心理问题,更好地为患者提供帮助,尽可能达到全方面治愈的可能。
安全管理模块的运行方法主要包括以下步骤:
步骤B1:数据加密子模块采取非对称加密和属性基加密对患者数据信息加密处理,在非对称加密中,由于公钥公开,任何人都可以获得接收者的公钥,并对消息使用此公钥进行加密,只有接收者才可用自己本地存有的私钥对加密的消息进行解密;属性基加密可使数据拥有者通过设定策略决定拥有哪些属性的人能够访问这份密文,对数据实现了粒度可以细化到属性级别的加密访问控制;
步骤B2:权限设置子模块根据患者信息保密程度和患者自我意愿,对各部门通过系统进行患者信息互通过程进行权限设置,医疗数据天然具有隐私性、安全性的需求,而多医疗机构间的数据信息共享与医疗数据的隐私性有一定的矛盾,因此对患者信息、匹配结果、分析处理结果、数据分布状况均进行权限和加密设置,同时减少数据量的同步,以提高效率,减少数据暴露风险;
步骤B3:对于每一次的患者信息查看、调取,访问监测子模块记录具体访问信息,对访问人员的操作实时监测,在出现违规操作时及时反馈,同时当患者信息出现泄漏时可根据监测数据追溯出泄露信息人员,在减少信息泄漏机会的同时,也可及时对违规操作或造成信息泄漏的人员进行排查确认,可在第一时间进行责任追究。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.基于大数据的患者信息存储系统,包括患者信息存储模块、患者信息整合模块和安全管理模块,其特征在于:所述患者信息存储模块用于存储各医疗机构的患者信息,所述患者信息整合模块用于将各医疗机构的患者信息进行整合联通,所述安全管理模块用于对系统存储的患者信息进行安全保护,所述患者信息整合模块和安全管理模块均与患者信息存储模块网络连接。
2.根据权利要求1所述的基于大数据的患者信息存储系统,其特征在于:所述患者信息存储模块包括患者信息存储数据库、医疗信息获取模块、回访信息采集模块和信息数据标准化模块,所述患者信息存储数据库用于保存各医疗机构经过数据化处理的患者信息,所述医疗信息获取模块用于从各医疗机构获取患者的基本信息和治疗信息,所述回访信息采集模块用于定期采集患者诊疗后的生活和心理因疾病治疗造成的状态变化信息,所述信息数据标准化模块用于将获取和采集到的数据信息标准化处理,所述信息数据标准化模块与患者新存储数据库网络连接。
3.根据权利要求2所述的基于大数据的患者信息存储系统,其特征在于:所述患者信息整合模块包括哈希值组生成单元、匹配识别单元和信息分析模块,所述哈希值组生成单元用于将患者信息转化为对应哈希值,并进行分组,所述匹配识别单元用于对分散在各个医疗机构的数据,依据患者身份进行信息识别,所述信息分析模块用于对回访信息进行分析处理,所述匹配识别单元与哈希值组生成单元网络连接,所述信息分析模块与回访信息采集模块网络连接。
4.根据权利要求3所述的基于大数据的患者信息存储系统,其特征在于:所述患者信息安全管理模块包括数据加密子模块、权限设置子模块和访问监测子模块,所述数据加密子模块用于对所有患者信息进行数据加密,所述权限设置子模块用于对患者信息访问修改调用进行权限设置,所述访问监测子模块用于对系统内的患者信息访问操作进行安全监测,所述权限设置子模块与数据加密子模块网络连接,所述访问监测子模块与权限设置子模块网络连接。
5.根据权利要求4所述的基于大数据的患者信息存储系统,其特征在于:所述患者信息存储模块的运行方法主要包括以下步骤:
步骤S1:建立患者信息存储数据库,将各医疗机构的患者信息在经过标准化处理后存储至数据库中;
步骤S2:各医疗机构将所有患者基本信息和诊疗信息上传至数据库中;
步骤S3:各医疗机构对部分特殊疾病患者进行定期回访调查,记录其在治疗后是否存在因患病而导致的生活状态变化和心理问题,患者亦可自主向医疗机构上报以上问题,系统以规定格式和患者信息一并存储至数据库中;
步骤S4:对各医疗机构上传至数据库的患者信息进行数据文件备份,对备份的数据库进行数据抽取、校验和清洗,对于获取到的非结构化数据,采用自然语言处理的方式进行结构化的数据转化;
步骤S5:将经过标准化处理后的患者信息存储至数据库中。
6.根据权利要求5所述的基于大数据的患者信息存储系统,其特征在于:所述患者信息整合模块的运行方法主要包括以下步骤:
步骤A1:系统依据患者身份信息的特点,将不同的身份信息采取不同的哈希算法进行处理,在患者信息分别转换为对应哈希值之后,系统会为这些哈希值进行分组;
步骤A2:匹配识别单元在接收到匹配申请后,用本地存储的非对称加密私钥来解密同步的申请数据,并根据混杂方案还原患者哈希值组,对于每组哈希值分别与本地存储患者哈希值组进行相似度计算,由每部分匹配结果的权重组合来进行相同患者判定;
步骤A3:信息分析模块对于回访患者信息定期分析,并根据具体问题与其他部门联通为患者提供一站式医疗服务。
7.根据权利要求6所述的基于大数据的患者信息存储系统,其特征在于:所述步骤A1进一步包括以下步骤:
步骤A11:对于一个患者P而言,其身份识别信息由[Pi,Pj,…,Pz]组成;
步骤A12:对于可唯一识别患者且有差异敏感性的标识Pi,采取标准的SHA256哈希算法加密,生成哈希值SHA256(Pi);
步骤A13:对于允许模糊输入的部分Pj,采用SimHash算法来进行加密,生成哈希值SimHash(Pj);
步骤A14:对于每个要匹配的患者,系统会生成一组随机患者数据[P′i,P′j,…,P′z],将随机生成患者的部分数据与要匹配患者的部分哈希值进行交换混杂;
步骤A15:将所有数据使用非对称加密公钥进行加密,同步至数据库中。
8.根据权利要求7所述的基于大数据的患者信息存储系统,其特征在于:所述步骤A2进一步包括以下步骤:
步骤A211:由本地存储私钥解密混杂方案及数据,根据混杂方案还原原始数据的哈希值组;
步骤A22:将新的患者哈希值组[Ci,Cj,…,Cz]与本地存储的患者哈希值组[Pi,Pj,…,Pz]中每一项分别计算相似度;
步骤A23:对于使用SHA256处理的可完全识别患者的信息,直接进行哈希值的比较,依据相同与否,相似度取值1或0;
步骤A24:对使用SimHash处理的信息,进行字符串相似度计算,并排序,按照计算结果排序,对比结果排名前两位的数据库患者数据进行权重计算;
步骤A25:具体相似度计算公式为:
Figure FDA0003666741610000041
式中,L为该文本的编辑距离,Max(X,Y)为X和Y两个字符串之间的最大长度;
步骤A26:对于相似度计算筛选出的数据结果,按照预先制定的权重占比方案计算权重总和;
步骤A27:设置权重匹配阈值Z0,计算出权重和的患者与阈值作比较,若权重和高于阈值,则认为匹配成功,否则匹配失败;
步骤A28:对于唯一性标识,即可唯一识别患者的信息,权重设置为1;对于匹配性标识,设置其权重值总和为1,同时为避免因某一项缺失而导致匹配和过小无法匹配,每一项的权重值应小于0.5;
步骤A29:具体权重计算公式为:
Figure FDA0003666741610000042
式中,NZ为匹配到的正确信息数量,NJ为未匹配到的正确信息数量,Nc为被匹配到的样本中,匹配错误的数量,K为信息数量与具体权重的转换系数,为(0,1)间的常数值。
9.根据权利要求8所述的基于大数据的患者信息存储系统,其特征在于:所述步骤A3进一步包括以下步骤:
步骤A31:各医疗机构工作人员定期查看患者的回访信息,同时记录每一次的问题解决;
步骤A32:对于治疗结束后的患者因疾病产生的生活困难问题,工作人员可与社会部门进行患者信息共享,由社会部门人员为患者提供帮助;
步骤A33:对于治疗结束后的患者因疾病产生的心理状态问题,工作人员可与心理医疗机构进行患者信息共享,进一步对患者的心理问题进行治疗。
10.根据权利要求9所述的基于大数据的患者信息存储系统,其特征在于:所述安全管理模块的运行方法主要包括以下步骤:
步骤B1:数据加密子模块采取非对称加密和属性基加密对患者数据信息加密处理;
步骤B2:权限设置子模块根据患者信息保密程度和患者自我意愿,对各部门通过系统进行患者信息互通过程进行权限设置;
步骤B3:对于每一次的患者信息查看、调取,访问监测子模块记录具体访问信息,对访问人员的操作实时监测,在出现违规操作时及时反馈,同时当患者信息出现泄漏时可根据监测数据追溯出泄露信息人员。
CN202210600230.6A 2022-05-27 2022-05-27 基于大数据的患者信息存储系统 Pending CN114882967A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210600230.6A CN114882967A (zh) 2022-05-27 2022-05-27 基于大数据的患者信息存储系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210600230.6A CN114882967A (zh) 2022-05-27 2022-05-27 基于大数据的患者信息存储系统

Publications (1)

Publication Number Publication Date
CN114882967A true CN114882967A (zh) 2022-08-09

Family

ID=82679610

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210600230.6A Pending CN114882967A (zh) 2022-05-27 2022-05-27 基于大数据的患者信息存储系统

Country Status (1)

Country Link
CN (1) CN114882967A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115394388A (zh) * 2022-08-22 2022-11-25 山东水发紫光大数据有限责任公司 医疗大数据采集方法、装置、设备及存储介质
CN116665913A (zh) * 2023-07-13 2023-08-29 之江实验室 一种跨机构的患者匹配系统和方法
CN116820352A (zh) * 2023-08-23 2023-09-29 湖南奔普智能科技有限公司 一种具有数据容灾功能的病区自助结算系统
CN117291750A (zh) * 2023-11-27 2023-12-26 平利县女娲茗鼎农业科技有限公司 基于区块链的兽医用废弃物溯源管理方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115394388A (zh) * 2022-08-22 2022-11-25 山东水发紫光大数据有限责任公司 医疗大数据采集方法、装置、设备及存储介质
CN115394388B (zh) * 2022-08-22 2023-11-14 山东水发紫光大数据有限责任公司 医疗大数据采集方法、装置、设备及存储介质
CN116665913A (zh) * 2023-07-13 2023-08-29 之江实验室 一种跨机构的患者匹配系统和方法
CN116665913B (zh) * 2023-07-13 2023-10-13 之江实验室 一种跨机构的患者匹配系统和方法
CN116820352A (zh) * 2023-08-23 2023-09-29 湖南奔普智能科技有限公司 一种具有数据容灾功能的病区自助结算系统
CN116820352B (zh) * 2023-08-23 2023-11-10 湖南奔普智能科技有限公司 一种具有数据容灾功能的病区自助结算系统
CN117291750A (zh) * 2023-11-27 2023-12-26 平利县女娲茗鼎农业科技有限公司 基于区块链的兽医用废弃物溯源管理方法及系统
CN117291750B (zh) * 2023-11-27 2024-02-06 平利县女娲茗鼎农业科技有限公司 基于区块链的兽医用废弃物溯源管理方法及系统

Similar Documents

Publication Publication Date Title
CN114882967A (zh) 基于大数据的患者信息存储系统
US6397224B1 (en) Anonymously linking a plurality of data records
CN113643821B (zh) 一种多中心知识图谱联合决策支持方法与系统
JP5923307B2 (ja) 分散化された自律的医療環境におけるアサーションベースレコードリンケージ
CN104680076B (zh) 用于使受保护健康信息匿名化和聚集的系统
CN108877920A (zh) 诊疗数据管理方法及系统
CN108986873A (zh) 一种可追溯的诊疗数据处理方法及系统
CN111460040A (zh) 一种基于医疗区块链的数据管理系统
CN111370087A (zh) 一种基于区块链的居民健康档案管理系统
CN111370118A (zh) 跨医疗机构的诊疗安全分析方法、装置和计算机设备
CN113851200A (zh) 基于区块链的医疗数据共享方法及装置
CN104919450B (zh) 用于令多站点性能测量匿名并且用于控制对匿名数据的动作以及重新识别的方法和系统
WO2021062310A1 (en) Utilizing a user's health data stored over a health care network for disease prevention
CN116488890A (zh) 一种基于医共体平台的信息共享方法及系统
US20210005293A1 (en) System and method for providing access of a user's health information to third parties
US20130262146A1 (en) System For Use In A Network And For Storing Data Imported From One Or More Distinct Devices, Associated Method
CN113838547A (zh) 基于智能终端的智慧医疗服务管理系统
CN110689950A (zh) 一种居民健康卡办理方法及系统
Christen et al. Secure health data linkage and geocoding: Current approaches and research directions
Singh et al. Intelligent Cryptography Approach on Identity Based Encryption (IBE) for Secured Distributed EHR Data Storage in Cloud Computing
CN117592555B (zh) 一种面向多源异构医疗数据的联邦学习方法及系统
Park Security and privacy model of an electronic medical record system
US20190392925A1 (en) Self-aware data storage, retrieval, and notification
CN116628088A (zh) 企业经营数据管理方法、装置、计算机设备及存储介质
CN117592555A (zh) 一种面向多源异构医疗数据的联邦学习方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination