CN113591154B - 诊疗数据去标识化方法、装置及查询系统 - Google Patents
诊疗数据去标识化方法、装置及查询系统 Download PDFInfo
- Publication number
- CN113591154B CN113591154B CN202111168142.5A CN202111168142A CN113591154B CN 113591154 B CN113591154 B CN 113591154B CN 202111168142 A CN202111168142 A CN 202111168142A CN 113591154 B CN113591154 B CN 113591154B
- Authority
- CN
- China
- Prior art keywords
- data
- diagnosis
- treatment data
- treatment
- random noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6227—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种诊疗数据去标识化方法、装置及查询系统,所述诊疗数据去标识化方法包括:根据预先调取的诊疗数据构建诊疗数据查询数据库;根据差分隐私算法,对所述诊疗数据查询数据库的数据表的敏感属性字段添加随机噪声;根据添加的随机噪声,对所述敏感属性字段去标识处理;对所述数据表的标识符字段进行加密处理;根据去标识处理和加密处理的数据表更新所述诊疗数据查询数据库。本申请既满足诊疗数据的差分隐私保护的隐秘性要求,同时保证了数据库中发布数据的可靠性,可以有效帮助临床科研工作者查询和收集以往病例、大数据分析及评估,为促进医疗数据统计的自动化,消除信息孤岛,提供决策支持建立打下良好基础。
Description
技术领域
本发明涉及医疗数据处理技术领域,特别涉及一种诊疗数据去标识化方法、装置及查询系统。
背景技术
医疗大数据安全成为大数据时代医院管理的一大难题,各种数据泄漏事件时有发生。目前医疗大数据安全保护通常采用对患者检查重要信息进行匿名、脱敏等处理方式。但有目的的攻击者,仍可通过几个复合的已知条件查询,来定位锁定对象。如果脱敏字段太多,则又会失去科研价值。比如对性别、年龄、地区、检查部位、疾病字段进行直接脱敏处理,那么就无法对“肺部疾病在各地区、各年龄段、不同性别的发病率”的课题进行研究。
基于此,在医疗数据的挖掘过程有效保护敏感信息及个人隐私,是医疗行业数据挖掘研究亟待解决的问题。
发明内容
本发明实施例中提供一种诊疗数据去标识化方法、装置及查询系统,用以至少解决医疗数据挖掘过程中敏感信息及个人隐私的保护问题。
第一方面,本发明提供一种诊疗数据去标识化方法,所述诊疗数据去标识化方法包括:
根据预先调取的诊疗数据构建诊疗数据查询数据库;
根据差分隐私算法,对所述诊疗数据查询数据库的数据表的敏感属性字段添加随机噪声;
根据添加的随机噪声,对所述敏感属性字段去标识处理;
对所述数据表的标识符字段进行加密处理;
根据去标识处理和加密处理的数据表更新所述诊疗数据查询数据库。
可选地,所述对所述敏感属性字段的原始诊疗数据添加随机噪声包括:
对不同数据类型的敏感属性字段的原始诊疗数据采用不同噪声机制添加随机噪声。
可选地,所述对不同数据类型的敏感属性字段的原始诊疗数据采用不同噪声机制添加随机噪声包括:
对于数值类型的敏感属性字段的原始诊疗数据采用拉普拉斯机制添加随机噪声,对于非数值类型的敏感属性字段的原始诊疗数据采用指数机制添加随机噪声。
可选地,在所述敏感属性字段的原始诊疗数据为年龄数据时,所述对于数值类型的敏感属性字段的原始诊疗数据采用拉普拉斯机制添加随机噪声包括:
将年龄数据的集合分为多个年龄段;
分别统计每个年龄段的人数总量;
根据每个年龄段的人数总量,采用拉普拉斯机制对每个年龄段添加随机噪声;
如果每个年龄段添加随机噪声后的伪数据与每个年龄段的原始诊疗数据相符合时,对所述年龄数据的集合生成伪数据集;否则,根据预设的比例关系,在不同年龄段生成伪数据集。
可选地,所述诊疗数据去标识化方法还包括:
根据所述敏感属性字段的原始诊疗数据和所述敏感属性字段的伪数据的直方图分布,调整所述差分隐私算法的隐私保护预算参数;所述伪数据由原始诊疗数据添加随机噪声构成。
可选地,所述对所述数据表的标识符字段进行加密处理包括:
根据数据加密标准DES加密算法和Base64编码,对所述数据表的标识符字段进行加密处理;
可选地,所述根据预先调取的诊疗数据构建诊疗数据查询数据库之前包括:
从医院信息系统HIS、放射信息管理系统RIS和医学影像存档与通讯系统PACS中调取诊疗数据。
可选地,所述诊疗数据去标识化方法还包括:
获取医学数字成像和通信DICOM文件;
读取所述DICOM文件的数据元素集合,将所述数据元素集合中的敏感性数据和标识数据设置为空值;
将设置为空值的DICOM文件替换到文件存储服务器。
第二方面,本发明还提供一种诊疗数据去标识化装置,所述诊疗数据去标识化装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;
所述计算机程序被所述处理器执行时实现如上任一项所述的诊疗数据去标识化方法的步骤。
第三方面,本发明又提供一种诊疗数据查询系统,所述诊疗数据查询系统包括如上所述的诊疗数据去标识化装置、诊疗数据查询数据库、医院信息系统HIS、放射信息管理系统RIS和医学影像存档与通讯系统PACS。
应用本申请的技术方案,可以根据疾病影响学特点和临床诊疗信息,结合患者HIS、RIS、PACS多个数据库的诊疗信息,构建诊疗数据查询数据库,并采用差分隐私算法与加密算法相结合的方式,对患者隐私数据去标识化,以更新该诊疗数据查询数据库,从而可以根据更新的诊疗数据查询数据库建立临床影像查询诊疗系统,本申请既满足差分隐私保护模型中的隐秘性要求,同时保证了数据库中发布数据的可靠性,以帮助临床科研工作者查询和收集以往病例、大数据分析及评估,为促进医疗数据统计的自动化,消除信息孤岛,提供决策支持建立打下良好基础。
附图说明
图1是根据本发明实施例的一种诊疗数据去标识化方法的流程图;
图2是根据本发明实施例的基于差分隐私直方图发布实现效果检验示意图;
图3是根据本发明实施例的诊疗数据查询流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步详细描述,应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
实施例一
本发明实施例提供一种诊疗数据去标识化方法,所述诊疗数据去标识化方法包括:
S101,根据预先调取的诊疗数据构建诊疗数据查询数据库;诊疗数据包括患者基本信息和与患者基本信息对应的诊断信息、影像学信息等;
S102,根据差分隐私算法,对所述诊疗数据查询数据库的数据表的敏感属性字段添加随机噪声;
S103,根据添加的随机噪声,对所述敏感属性字段去标识处理;
S104,对所述数据表的标识符字段进行加密处理;其中,敏感属性为隐私数据的属性集包括:患者性别、年龄、教育程度、地区、检查设备类型、疾病等;标识符为能唯一标识单一个体的属性集,如患者姓名、病人号字段;
S105,根据去标识处理和加密处理的数据表更新所述诊疗数据查询数据库。
本发明实施例可以根据疾病影响学特点和临床诊疗信息,结合患者HIS、RIS、PACS多个数据库的诊疗信息,构建诊疗数据查询数据库,并采用差分隐私算法与加密算法相结合的方式,对患者隐私数据去标识化,以更新该诊疗数据查询数据库,从而可以根据更新的诊疗数据查询数据库建立临床影像查询诊疗系统,本发明实施例既满足差分隐私保护模型中的隐秘性要求,同时保证了数据库中发布数据的可靠性,以帮助临床科研工作者查询和收集以往病例、大数据分析及评估,为促进医疗数据统计的自动化,消除信息孤岛,提供决策支持建立打下良好基础。
在本发明的一个实施方式中,在根据预先调取的诊疗数据构建诊疗数据查询数据库之前,可以从医院信息系统HIS、放射信息管理系统RIS和医学影像存档与通讯系统PACS中调取诊疗数据。
详细地,通过对医院放射科管理需求分析和HIS、RIS、PACS系统中数据的分析,利用SQL Server提供的数据库平台建立诊疗数据查询数据库。从HIS系统中调取包括患者姓名、性别、年龄、住院号、医嘱等患者基本信息;可以从RIS、PACS系统中按患者住院号调取患者的检验与检查结果,方便研究者在分析整理数据时直接调取患者的诊疗信息。患者基本信息:患者的ID号、姓名、性别、年龄、出生地、婚育情况等;临床诊断(诊断信息):门诊诊断、入院诊断、出院诊断及病理诊断;影像学信息:主要成像技术与方法、病变影像学表现及诊断与印象。在本实施方式中,诊疗数据查询数据库可以是临床影像查询诊疗系统数据库。
原始数据库结构如下所示,大致分以下几个类别:
(1)显示标识符:能唯一标识单一个体的属性集,如表中患者姓名、病人号字段。
(2)敏感属性:包含隐私数据的属性集:患者性别、年龄、教育程度、地区、检查设备类型、疾病等。
(3)非敏感属性:除了上述类别的属性集。
在本发明实施例中,差分隐私算法通过在统计结果中加入适量噪音以确保修改数据集中一条个体记录不会对统计结果造成显著影响,从而满足了隐私保护的要求。
假设D1和D2为相邻数据集,S为在随机函数A所有可能的输出,Pr为A(D1)获得某个值的概率,那么只要算法满足下面公式则可以说此算法满足ε-差分隐私的标准。
Pr[A(D1)∈S]≤e∈×Pr[A(D2)∈S]
其中,概率Pr[•] 表示隐私被泄漏的风险,由算法A(D)的随机性控制;ε为隐私保护预算参数,用于调节平衡数据隐私安全性和数据可靠性,通过加入随机噪声的方式来实现隐私保护,即ε越小,加入的噪声越大,隐私保护程度越高,同理ε越大,加入的噪声越小,隐私保护安全性越弱。
可选地,对不同数据类型的敏感属性字段的原始诊疗数据采用不同噪声机制添加随机噪声。
例如,对于数值类型的敏感属性字段的原始诊疗数据采用拉普拉斯机制添加随机噪声,对于非数值类型的敏感属性字段的原始诊疗数据采用指数机制添加随机噪声。
拉普拉斯机制对数值型数据(连续数据)进行处理,比如患者年龄,对得到数值结果加入随机噪声即可实现差分隐私。指数机制处理非数值型(离散数据)数据,返回的不是确定性的结果,而是以一定概率值返回结果,输出是一组离散数据,可以由打分函数确定,得分高的输出概率高,得分低的输出概率低。
具体地对表中患者年龄、检查日期等数值类型敏感属性分别添加拉普拉斯噪声,对数据表中性别、教育程度、地区、检查设备类型、疾病等属性分别添加指数噪声,得到噪声结果,替换到数据表中。
在本发明的一个实施方式中,采用基于差分隐私直方图发布技术实现效果检验,添加噪声的大小通过不断调整ε参数,使得伪数据与真实数据的直方图分布越接近越好。如图2所示,左侧为真实数据,右侧为伪数据。也就是说,可以根据所述敏感属性字段的原始诊疗数据和所述敏感属性字段的伪数据的直方图分布,调整所述差分隐私算法的隐私保护预算参数;所述伪数据由原始诊疗数据添加随机噪声构成。
由于,每个医院的患者总人数信息一般很容易被攻击者获取,假设攻击者在知晓该信息的前提下,如果简单地对每个年龄段的人数加噪声,然后发布数据结果将会很大几率与实际患者总人数不匹配,为了避免这个问题,提高合成数据的可信度,在一些实施方式中,采用了以下算法。
在所述敏感属性字段的原始诊疗数据为年龄数据时,所述对于数值类型的敏感属性字段的原始诊疗数据采用拉普拉斯机制添加随机噪声包括:
将年龄数据的集合分为多个年龄段;
分别统计每个年龄段的人数总量;
根据每个年龄段的人数总量,采用拉普拉斯机制对每个年龄段添加随机噪声;
如果每个年龄段添加随机噪声后的伪数据与每个年龄段的原始诊疗数据相符合时,对所述年龄数据的集合生成伪数据集;否则,根据预设的比例关系,在不同年龄段生成伪数据集。
详细地,输入:数据集D,计数查询函数f,隐私预算参数ε,将D按年龄段分类为D=D1+ D2+ D3+…Dk)
分别统计每个年龄段Di的人数总量f(Di) ,使用拉普拉斯机制加噪声
输出:合成数据集(伪数据集)D',由A(Di) 个年龄段范围内的人数总量组成,D'=D' 1+ D' 2+ D' 3+…D' k;
否则:
For i=1 to k
根据比例
在不同年龄段内生成合成数据D'。
例如,如果不相同,则按照比例进行调整,比如加噪声前总和为10,加噪声后总和为12,那么按照加噪声后的数值在总和中的比例进行手动调整,直至加噪声前后总和相等。
在本发明的一个实施方式中,所述对所述数据表的标识符字段进行加密处理包括:
根据数据加密标准DES加密算法和Base64编码,对所述数据表的标识符字段进行加密处理;
DES对称加密是一种比较传统的加密方式,具有极高安全性。Base64是一种基于64个可打印字符来表示二进制数据的表示方法。将这两个方法相结合,满足对患者姓名、检查号、影像号等唯一标识的敏感属性的加密需求。
在本发明的一个实施方式中,所述诊疗数据去标识化方法还可包括:
获取医学数字成像和通信DICOM文件;
读取所述DICOM文件的数据元素集合,将所述数据元素集合中的敏感性数据和标识数据设置为空值;
将设置为空值的DICOM文件替换到文件存储服务器。
其中,可以从不同成像装置获得的图像,如CT、MRI等,转换成DICOM文件,替换到文件存储服务器中。
DICOM标准文件中包含了图像像素数据和各类相关信息,例如病人信息、检查信息、成像设备、图像信息等内容,如果只对数据库字段隐私保护,而不对DICOM文件本身这些信息进行匿名化处理,在临床浏览,图像导出等操作中仍然存在患者信息泄露问题,因此有必要对DICOM文件存在的患者信息进行匿名保护处理。如下表所示,对读取DICOM文件的数据元素集合,更改里面的病人信息内容,把能够表示显示标识符的属性内容置为空值。
如图3所示,基于以上构建的诊疗数据查询数据库,数据分析者可以使用PACS客户端浏览影像,可以基于多条件组合查询、模糊查询等多种类型查询方式,灵活满足医生各种各样的查询需求。输入检索信息查询诊疗数据查询数据库,并检索出相应的DICOM图像,查询后的患者信息是包含噪音的结果,其中带有显示标识符的属性已经屏蔽掉,保护了患者的隐私信息,又不影响对相关检查检索的分析效果,满足临床及科研、教学使用需求。PACS客户端具有导出DICOM图像功能,导出的图像经过匿名化保护后,去除了隐私信息,即使用第三方软件打开,也不会泄露患者信息。
实施例二
本发明实施例提供一种诊疗数据去标识化装置,所述诊疗数据去标识化装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;
所述计算机程序被所述处理器执行时实现如实施例一中任一项所述的诊疗数据去标识化方法的步骤。
实施例三
本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有诊疗数据去标识化程序,所述诊疗数据去标识化程序被处理器执行时,实现如实施例一中任一项所述的诊疗数据去标识化方法的步骤。
实施例四
本发明实施例提供一种诊疗数据查询系统,所述诊疗数据查询系统包括实施例二中诊疗数据去标识化装置、诊疗数据查询数据库、医院信息系统HIS、放射信息管理系统RIS和医学影像存档与通讯系统PACS。
实施例二至实施例四在具体实现过程中,可以参阅实施例一,具有相应的技术效果。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (8)
1.一种诊疗数据去标识化方法,其特征在于,所述诊疗数据去标识化方法包括:
根据预先调取的诊疗数据构建诊疗数据查询数据库;
根据差分隐私算法,对所述诊疗数据查询数据库的数据表的敏感属性字段添加随机噪声;并根据所述敏感属性字段的原始诊疗数据和所述敏感属性字段的伪数据的直方图分布,调整所述差分隐私算法的隐私保护预算参数;所述伪数据由原始诊疗数据添加随机噪声构成;
根据添加的随机噪声,对所述敏感属性字段去标识处理;
对所述数据表的标识符字段进行加密处理;
根据去标识处理和加密处理的数据表更新所述诊疗数据查询数据库。
2.根据权利要求1所述的诊疗数据去标识化方法,其特征在于,所述对所述敏感属性字段的原始诊疗数据添加随机噪声包括:
对不同数据类型的敏感属性字段的原始诊疗数据采用不同噪声机制添加随机噪声。
3.根据权利要求2所述的诊疗数据去标识化方法,其特征在于,所述对不同数据类型的敏感属性字段的原始诊疗数据采用不同噪声机制添加随机噪声包括:
对于数值类型的敏感属性字段的原始诊疗数据采用拉普拉斯机制添加随机噪声,对于非数值类型的敏感属性字段的原始诊疗数据采用指数机制添加随机噪声。
4.根据权利要求3所述的诊疗数据去标识化方法,其特征在于,在所述敏感属性字段的原始诊疗数据为年龄数据时,所述对于数值类型的敏感属性字段的原始诊疗数据采用拉普拉斯机制添加随机噪声包括:
将年龄数据的集合分为多个年龄段;
分别统计每个年龄段的人数总量;
根据每个年龄段的人数总量,采用拉普拉斯机制对每个年龄段添加随机噪声;
如果每个年龄段添加随机噪声后的伪数据与每个年龄段的原始诊疗数据相符合时,对所述年龄数据的集合生成伪数据集;否则,根据预设的比例关系,在不同年龄段生成伪数据集。
5.根据权利要求1所述的诊疗数据去标识化方法,其特征在于,所述对所述数据表的标识符字段进行加密处理包括:
根据数据加密标准DES加密算法和Base64编码,对所述数据表的标识符字段进行加密处理;
所述根据预先调取的诊疗数据构建诊疗数据查询数据库之前包括:
从医院信息系统HIS、放射信息管理系统RIS和医学影像存档与通讯系统PACS中调取诊疗数据。
6.根据权利要求1-5中任意一项所述的诊疗数据去标识化方法,其特征在于,所述诊疗数据去标识化方法还包括:
获取DICOM文件;
读取所述DICOM文件的数据元素集合,将所述数据元素集合中的敏感性数据和标识数据设置为空值;
将设置为空值的DICOM文件替换到文件存储服务器。
7.一种诊疗数据去标识化装置,其特征在于,所述诊疗数据去标识化装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;
所述计算机程序被所述处理器执行时实现如权利要求1-6中任一项所述的诊疗数据去标识化方法的步骤。
8.一种诊疗数据查询系统,其特征在于,所述诊疗数据查询系统包括如权利要求7所述的诊疗数据去标识化装置、诊疗数据查询数据库、医院信息系统HIS、放射信息管理系统RIS和医学影像存档与通讯系统PACS。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111168142.5A CN113591154B (zh) | 2021-10-08 | 2021-10-08 | 诊疗数据去标识化方法、装置及查询系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111168142.5A CN113591154B (zh) | 2021-10-08 | 2021-10-08 | 诊疗数据去标识化方法、装置及查询系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113591154A CN113591154A (zh) | 2021-11-02 |
CN113591154B true CN113591154B (zh) | 2022-02-15 |
Family
ID=78242828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111168142.5A Active CN113591154B (zh) | 2021-10-08 | 2021-10-08 | 诊疗数据去标识化方法、装置及查询系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113591154B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101295332A (zh) * | 2008-04-30 | 2008-10-29 | 深圳市蓝韵实业有限公司 | 一种dicom文件病人信息匿名化处理方法 |
CN110727957A (zh) * | 2019-10-15 | 2020-01-24 | 电子科技大学 | 一种基于采样的差分隐私保护方法和系统 |
CN111339091A (zh) * | 2020-02-23 | 2020-06-26 | 兰州理工大学 | 基于非均匀四叉树的位置大数据差分隐私划分发布方法 |
CN112395630A (zh) * | 2020-11-26 | 2021-02-23 | 平安普惠企业管理有限公司 | 基于信息安全的数据加密方法、装置、终端设备及介质 |
CN113254967A (zh) * | 2021-06-04 | 2021-08-13 | 王兆河 | 一种医疗数字影像云系统的标准化方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10229282B2 (en) * | 2016-06-12 | 2019-03-12 | Apple Inc. | Efficient implementation for differential privacy using cryptographic functions |
US10223547B2 (en) * | 2016-10-11 | 2019-03-05 | Palo Alto Research Center Incorporated | Method for differentially private aggregation in a star topology under a realistic adversarial model |
CN110851860A (zh) * | 2019-10-23 | 2020-02-28 | 国网天津市电力公司电力科学研究院 | 一种基于匿名化隐私技术的用电数据脱敏算法模型构建方法 |
CN111079174A (zh) * | 2019-11-21 | 2020-04-28 | 中国电力科学研究院有限公司 | 基于匿名化及差分隐私技术的用电数据脱敏方法及系统 |
CN111951918B (zh) * | 2020-08-20 | 2022-09-06 | 福建师范大学 | 一种物联网医疗系统中增强数据隐私性的数据聚类方法 |
CN112307078B (zh) * | 2020-09-29 | 2022-04-15 | 安徽工业大学 | 基于滑动窗口的数据流差分隐私直方图发布方法 |
-
2021
- 2021-10-08 CN CN202111168142.5A patent/CN113591154B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101295332A (zh) * | 2008-04-30 | 2008-10-29 | 深圳市蓝韵实业有限公司 | 一种dicom文件病人信息匿名化处理方法 |
CN110727957A (zh) * | 2019-10-15 | 2020-01-24 | 电子科技大学 | 一种基于采样的差分隐私保护方法和系统 |
CN111339091A (zh) * | 2020-02-23 | 2020-06-26 | 兰州理工大学 | 基于非均匀四叉树的位置大数据差分隐私划分发布方法 |
CN112395630A (zh) * | 2020-11-26 | 2021-02-23 | 平安普惠企业管理有限公司 | 基于信息安全的数据加密方法、装置、终端设备及介质 |
CN113254967A (zh) * | 2021-06-04 | 2021-08-13 | 王兆河 | 一种医疗数字影像云系统的标准化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113591154A (zh) | 2021-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11748517B2 (en) | Smart de-identification using date jittering | |
US8037052B2 (en) | Systems and methods for free text searching of electronic medical record data | |
US7519591B2 (en) | Systems and methods for encryption-based de-identification of protected health information | |
US20040199781A1 (en) | Data source privacy screening systems and methods | |
JP5008003B2 (ja) | 患者の再識別のためのシステムおよび方法 | |
Tamersoy et al. | Anonymization of longitudinal electronic medical records | |
Lv et al. | The security of medical data on internet based on differential privacy technology | |
US20050256740A1 (en) | Data record matching algorithms for longitudinal patient level databases | |
US20040215981A1 (en) | Method, system and computer product for securing patient identity | |
Noumeir et al. | Pseudonymization of radiology data for research purposes | |
Loukides et al. | Utility-aware anonymization of diagnosis codes | |
EP3671751A1 (en) | Systems and methods for implementing a secure database for storing a patient operational longitudinal record | |
US20220391537A1 (en) | System for protecting and anonymizing personal data | |
Lin | A reversible data transform algorithm using integer transform for privacy-preserving data mining | |
Dimopoulou et al. | Mobile anonymization and pseudonymization of structured health data for research | |
CN113591154B (zh) | 诊疗数据去标识化方法、装置及查询系统 | |
Jefferson et al. | The challenges of assembling, maintaining and making available large data sets of clinical data for research | |
US20230162825A1 (en) | Health data platform and associated methods | |
Muradova | Security of personal medical data for the Redis concept | |
US20240070323A1 (en) | Method and system for modelling re-identification attacker's contextualized background knowledge | |
CN117874144B (zh) | 基于区块链的医疗数据共享方法、装置、设备及存储介质 | |
Abrar et al. | Privacy-preserving data collection for 1: M dataset | |
CN115691731A (zh) | 用于提供匿名患者数据集的方法和系统 | |
JP2022147342A (ja) | 秘密情報管理プログラム、秘密情報管理方法、データ登録装置、および秘密情報管理システム | |
WO2020212611A1 (en) | Method and system for transmitting combined parts of distributed data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |