CN109243584A - 基于内容唯一性的医疗影像脱敏数据的管理方法及系统 - Google Patents

基于内容唯一性的医疗影像脱敏数据的管理方法及系统 Download PDF

Info

Publication number
CN109243584A
CN109243584A CN201810746034.3A CN201810746034A CN109243584A CN 109243584 A CN109243584 A CN 109243584A CN 201810746034 A CN201810746034 A CN 201810746034A CN 109243584 A CN109243584 A CN 109243584A
Authority
CN
China
Prior art keywords
data
desensitization
sha256
cryptographic hash
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810746034.3A
Other languages
English (en)
Other versions
CN109243584B (zh
Inventor
王进祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI UNIVERSAL MEDICAL IMAGING DIAGNOSIS CENTER Co.,Ltd.
Original Assignee
Jingjing Information Technology (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingjing Information Technology (shanghai) Co Ltd filed Critical Jingjing Information Technology (shanghai) Co Ltd
Priority to CN201810746034.3A priority Critical patent/CN109243584B/zh
Publication of CN109243584A publication Critical patent/CN109243584A/zh
Application granted granted Critical
Publication of CN109243584B publication Critical patent/CN109243584B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS

Landscapes

  • Health & Medical Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明公开一种基于内容唯一性的医疗影像脱敏数据的管理方法,应用于医疗系统中影像脱敏数据的管理,其特征在于,至少包括以下步骤:获取医疗影像脱敏的源数据以及脱敏数据DICOM,并分别计算两数据的SHA256哈希值,并对应对两者的唯一标识并存储至数据库;删除所述源数据和脱敏数据DICOM的标签数据,单独计算两者所述影像数据的SHA256哈希值,比较所述删除标签后的源数据和删除标签后的脱敏数据计算出的SHA256哈希值,并在两哈希值相同时将其作为所述源数据与脱敏数据对应的准确标识并存储至数据库;依据所数据库所存储的各SHA256值查询相对应的源数据。

Description

基于内容唯一性的医疗影像脱敏数据的管理方法及系统
技术领域
本发明涉及数据管理技术领域,尤其涉及一种基于内容唯一性的医疗影像脱敏数据的管理方法及系统。
背景技术
随着医疗领域的数字化发展,医疗影像数据往往通过DICOM(Digital Imagingand Communications in Medicine)标准格式进行交流传输,在临床与科研活动中,会对从临床获得的医疗影像数据先进行脱敏,将与病人和伦理有关的标签从DICOM数据中删除,再提供给科研人员使用。反之,在必要情况下,也有从科研使用的脱敏数据反向找回相应原始数据,以查询病人等敏感信息的需求。因此,目前的主流脱敏数据管理方法是,基于影像数据的各种ID,如检查ID,影像序列ID等,或者多个非敏感信息ID(敏感ID包括病人ID等)的某种组合,来管理原始影像数据和脱敏数据之间的一一映射关系。目前主流的方法是从原始的DICOM影像数据和脱敏数据中,选择共有的一个或多个相关ID组合,来做映射关系,其缺点在于如果脱敏数据的标签或者ID有改动,则会失去这些ID信息,就不能再恢复原始数据与脱敏数据的对应关系了。因此本着严谨的科学态度,为了解决现有技术中存在的技术问题,提供一种基于内容唯一性的医疗影像脱敏数据的管理的方案。
发明内容
本发明目的是提供一种基于内容唯一性的医疗影像脱敏数据的管理方法及系统,利用原始数据与脱敏数据内容哈希值的唯一性,更高效的完全保证脱敏数据与原始数据的一一映射关系。
本发明解决技术问题采用如下技术方案:
一种基于内容唯一性的医疗影像脱敏数据的管理方法,应用于医疗系统中影像脱敏数据的管理,至少包括以下步骤:
获取医疗影像脱敏的源数据以及脱敏数据DICOM,并分别计算两数据的SHA256哈希值,并对应对两者的唯一标识并存储至数据库;
删除所述源数据和脱敏数据DICOM的标签数据,单独计算两者所述影像数据的SHA256哈希值,比较所述删除标签后的源数据和删除标签后的脱敏数据计算出的SHA256哈希值,并在两哈希值相同时将其作为所述源数据与脱敏数据对应的准确标识并存储至数据库;
依据所数据库所存储的各SHA256值查询相对应的源数据。
其中,所述的数据库中存储的所述源数据实际存储位置与所述DICOM数据的SHA256值对应。
其中,所述的方法可配合IPFS系统。
本发明还提供一种基于内容唯一性的医疗影像脱敏数据的管理系统,应用于医疗系统中影像脱敏数据的管理,其特征在于,至少包括以下模块:
数据库,用于存储数据;
唯一标识获取模块,用于获取医疗影像脱敏的源数据以及脱敏数据DICOM,并分别计算两数据的SHA256哈希值,并对应对两者的唯一标识并存储至数据库;
准确标识获取模块,用于删除所述源数据和脱敏数据DICOM的标签数据,单独计算两者所述影像数据的SHA256哈希值,比较所述删除标签后的源数据和删除标签后的脱敏数据计算出的SHA256哈希值,并在两哈希值相同时将其作为所述源数据与脱敏数据对应的准确标识并存储至数据库;
源数据查询模块,用于依据所数据库所存储的各SHA256值查询相对应的源数据。
本发明还提供一种基于内容唯一性的医疗影像脱敏数据的管理系统,包括网络、存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如所述方法的步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述的计算机程序被处理器执行时实现如所述方法的步骤。
本发明具有如下有益效果:
由于本发明利用原始数据与脱敏数据内容哈希值的唯一性来管理脱敏数据,基于内容唯一性的方法则可以保证除非影像数据内容本身被修改,否则无论DICOM的标签如何修改,都能保证脱敏数据与原始数据的对应关系,因此能更高效的完全保证脱敏数据与原始数据的一一映射关系;另外本发明还可以同时配合IPFS(InterPlanetary File System)系统,可以避免数据的重复保存,大大节省存储成本。
附图说明
图1为本发明的基于内容唯一性的医疗影像脱敏数据的管理方法的流程简图。
具体实施方式
下面结合实施例及附图对本发明的技术方案作进一步阐述。
参考图1所示,本发明为一种基于内容唯一性的医疗影像脱敏数据的管理方法,应用于医疗系统中影像脱敏数据的管理,至少包括以下步骤:
获取医疗影像脱敏的源数据以及脱敏数据DICOM,并分别计算两数据的SHA256哈希值,并对应对两者的唯一标识并存储至数据库;即在该步骤中,分别计算源数据和脱敏数据DICOM的SHA256哈希值,作为两者的唯一标识,因为源数据和脱敏数据的DICOM标签不完全相同,因此两者的SHA256值不会相同;
删除所述源数据和脱敏数据DICOM的标签数据,单独计算两者所述影像数据的SHA256哈希值,比较所述删除标签后的源数据和删除标签后的脱敏数据计算出的SHA256哈希值,并在两哈希值相同时将其作为所述源数据与脱敏数据对应的准确标识并存储至数据库;在该步骤中,结合图1所示,即将源数据DICOM数据的标签数据全部删除,单独计算影像数据的SHA256哈希值,对于源数据和脱敏数据,其所计算出的SHA256值应该是相同的,所以可以作为将源数据和脱敏数据一一对应起来的准确标识。
依据所数据库所存储的各SHA256值查询相对应的源数据。在数据库中记录源数据DICOM的SHA256值、脱敏数据的SHA256值以及删除标签后的数据SHA256值,由于源数据DICOM和脱敏DICOM各自删除标签后的内容即为影像部分数据,因此获得的SHA256的值相同,可作为源数据和脱敏数据之间的对应关系。记录脱敏数据的SHA256是为了加查询速度,也可以通过直接计算脱敏数据删除DICOM标签后的SHA256值来反向查询对应的源数据。尤其如果脱敏数据的DICOM标签被改动,导致其对应的SHA256没有在数据库中记录过时,直接计算无标签DICOM的SHA256值并反向查询,则依然能找到相对应的源数据。这是现有脱敏系统无法实现的。所述的数据库中存储的所述源数据实际存储位置与所述DICOM数据的SHA256值对应。所述的方法可配合IPFS系统实现。
另外,在本发明方法的实施例中,均是基于已有的开源软件组件实施,可以使用Go,JavaScript,Python,C++,Java等语言均可,也可以两两组合实现,本实施例中,使用JavaScript+Java来实现,因为此内容属于现有技术的内容,对于原理在此不再进行赘述。
采用本发明的方法,在PACS系统中同样通过DICOM的SHA256值来查找实际的存储位置,对于相同的DICOM数据,其SHA256值也相同,因此可以避免重复保存多个不需要的副本。
在本发明的方案中,本发明还提供一种基于内容唯一性的医疗影像脱敏数据的管理系统,应用于医疗系统中影像脱敏数据的管理,至少包括以下模块:
数据库,用于存储数据;
唯一标识获取模块,用于获取医疗影像脱敏的源数据以及脱敏数据DICOM,并分别计算两数据的SHA256哈希值,并对应对两者的唯一标识并存储至数据库;
准确标识获取模块,用于删除所述源数据和脱敏数据DICOM的标签数据,单独计算两者所述影像数据的SHA256哈希值,比较所述删除标签后的源数据和删除标签后的脱敏数据计算出的SHA256哈希值,并在两哈希值相同时将其作为所述源数据与脱敏数据对应的准确标识并存储至数据库;
源数据查询模块,用于依据所数据库所存储的各SHA256值查询相对应的源数据。
对于本发明的数据库存储部分,可以采用传统PACS或者其他存储方式,配合存有DICOM内容唯一哈希值与存储路径对应关系的数据库,一样可以达到类似IPFS的效果,但是在自动备份和任务调度上会与IPFS有所区别,有关具体的内容可参考现有技术的内容。
本系统对应于上述方法,因此有关具体的处理过程在此不再赘述。
本发明还提供一种基于内容唯一性的医疗影像脱敏数据的管理系统,包括网络、存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如所述方法的步骤。所述处理器可为中央处理单元(Central Processing Unit,CPU)等硬件组件,所述存储器可为硬盘、内存、插接硬盘、智能存储卡,安全数字卡闪存等存储器件等,所述的计算机程序包括计算机程序代码,可源代码形式,对象代码、可执行文件或者某些中间形式等等。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述的计算机程序被处理器执行时实现如所述方法的步骤。所述的程序可采用Go,JavaScript,Python,C++,Java等语言实现均可,也可以两两组合实现。
综上所述,本发明利用基于医疗影像数据内容的哈希编码,来实现原始数据和脱敏数据之间的一一映射关系,以达到从脱敏数据反向找到原始数据的目的,且利用数据内容哈希值的唯一性和IPFS存储系统,减少重复数据的存储,降低存储成本。在实际操作中,由于影像数据往往较大,虽然标签的内容很容易被改变,但影像部分的内容一般不会修改,所以临床和科研活动中,保存多份重复副本的意义不大,但是又很难避免。而基于内容唯一性的管理方法,通过对唯一哈希值的比较,可以完美解决数据的重复保存问题。
以上实施例的先后顺序仅为便于描述,不代表实施例的优劣。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.一种基于内容唯一性的医疗影像脱敏数据的管理方法,应用于医疗系统中影像脱敏数据的管理,其特征在于,至少包括以下步骤:
获取医疗影像脱敏的源数据以及脱敏数据DICOM,并分别计算两数据的SHA256哈希值,并对应对两者的唯一标识并存储至数据库;
删除所述源数据和脱敏数据DICOM的标签数据,单独计算两者所述影像数据的SHA256哈希值,比较所述删除标签后的源数据和删除标签后的脱敏数据计算出的SHA256哈希值,并在两哈希值相同时将其作为所述源数据与脱敏数据对应的准确标识并存储至数据库;
依据所数据库所存储的各SHA256值查询相对应的源数据。
2.根据权利要求1所述的基于内容唯一性的医疗影像脱敏数据的管理方法,其特征在于,所述的数据库中存储的所述源数据实际存储位置与所述DICOM数据的SHA256值对应。
3.根据权利要求1所述的基于内容唯一性的医疗影像脱敏数据的管理方法,其特征在于,所述的方法可配合IPFS系统。
4.一种基于内容唯一性的医疗影像脱敏数据的管理系统,应用于医疗系统中影像脱敏数据的管理,其特征在于,至少包括以下模块:
数据库,用于存储数据;
唯一标识获取模块,用于获取医疗影像脱敏的源数据以及脱敏数据DICOM,并分别计算两数据的SHA256哈希值,并对应对两者的唯一标识并存储至数据库;
准确标识获取模块,用于删除所述源数据和脱敏数据DICOM的标签数据,单独计算两者所述影像数据的SHA256哈希值,比较所述删除标签后的源数据和删除标签后的脱敏数据计算出的SHA256哈希值,并在两哈希值相同时将其作为所述源数据与脱敏数据对应的准确标识并存储至数据库;
源数据查询模块,用于依据所数据库所存储的各SHA256值查询相对应的源数据。
5.一种基于内容唯一性的医疗影像脱敏数据的管理系统,包括网络、存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1所述方法的步骤。
6.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述的计算机程序被处理器执行时实现如权利要求1所述方法的步骤。
CN201810746034.3A 2018-07-09 2018-07-09 基于内容唯一性的医疗影像脱敏数据的管理方法及系统 Active CN109243584B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810746034.3A CN109243584B (zh) 2018-07-09 2018-07-09 基于内容唯一性的医疗影像脱敏数据的管理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810746034.3A CN109243584B (zh) 2018-07-09 2018-07-09 基于内容唯一性的医疗影像脱敏数据的管理方法及系统

Publications (2)

Publication Number Publication Date
CN109243584A true CN109243584A (zh) 2019-01-18
CN109243584B CN109243584B (zh) 2020-07-07

Family

ID=65071845

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810746034.3A Active CN109243584B (zh) 2018-07-09 2018-07-09 基于内容唯一性的医疗影像脱敏数据的管理方法及系统

Country Status (1)

Country Link
CN (1) CN109243584B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109871714A (zh) * 2019-02-21 2019-06-11 湖南智远数通科技股份有限公司 一种实现不可逆脱敏的数据比对方法及装置
CN111028922A (zh) * 2019-12-13 2020-04-17 北京推想科技有限公司 医学影像数据的标准化方法、装置、服务器设备及介质
CN111105856A (zh) * 2019-12-24 2020-05-05 中电数据服务有限公司 一种医疗数据脱敏、关联系统及方法
CN111625845A (zh) * 2020-04-17 2020-09-04 沈阳派客动力科技有限公司 大数据的安全管理方法、装置和设备
CN113254998A (zh) * 2021-06-04 2021-08-13 王兆河 一种数字影像及影像检查报告数据的脱敏处理方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101398869A (zh) * 2008-10-07 2009-04-01 深圳市蓝韵实业有限公司 一种海量数据存储方法
US20130325805A1 (en) * 2012-06-02 2013-12-05 Dmitriy Tochilnik System and method for tagging and securely archiving patient radiological information
CN105912840A (zh) * 2016-03-31 2016-08-31 蓝网科技股份有限公司 影像数据查询处理方法、装置和系统
CN107391944A (zh) * 2017-07-27 2017-11-24 北京太云科技有限公司 一种基于区块链的电子病历共享系统
CN107491663A (zh) * 2017-10-12 2017-12-19 上海联影医疗科技有限公司 一种管理医学影像数据方法、系统及装置
CN108154914A (zh) * 2018-01-25 2018-06-12 北京雅森科技发展有限公司 一种准确匿名化存储和检索医疗图像的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101398869A (zh) * 2008-10-07 2009-04-01 深圳市蓝韵实业有限公司 一种海量数据存储方法
US20130325805A1 (en) * 2012-06-02 2013-12-05 Dmitriy Tochilnik System and method for tagging and securely archiving patient radiological information
CN105912840A (zh) * 2016-03-31 2016-08-31 蓝网科技股份有限公司 影像数据查询处理方法、装置和系统
CN107391944A (zh) * 2017-07-27 2017-11-24 北京太云科技有限公司 一种基于区块链的电子病历共享系统
CN107491663A (zh) * 2017-10-12 2017-12-19 上海联影医疗科技有限公司 一种管理医学影像数据方法、系统及装置
CN108154914A (zh) * 2018-01-25 2018-06-12 北京雅森科技发展有限公司 一种准确匿名化存储和检索医疗图像的方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109871714A (zh) * 2019-02-21 2019-06-11 湖南智远数通科技股份有限公司 一种实现不可逆脱敏的数据比对方法及装置
CN111028922A (zh) * 2019-12-13 2020-04-17 北京推想科技有限公司 医学影像数据的标准化方法、装置、服务器设备及介质
CN111105856A (zh) * 2019-12-24 2020-05-05 中电数据服务有限公司 一种医疗数据脱敏、关联系统及方法
CN111625845A (zh) * 2020-04-17 2020-09-04 沈阳派客动力科技有限公司 大数据的安全管理方法、装置和设备
CN113254998A (zh) * 2021-06-04 2021-08-13 王兆河 一种数字影像及影像检查报告数据的脱敏处理方法

Also Published As

Publication number Publication date
CN109243584B (zh) 2020-07-07

Similar Documents

Publication Publication Date Title
CN109243584A (zh) 基于内容唯一性的医疗影像脱敏数据的管理方法及系统
US20210397746A1 (en) Systems and methods for processing electronic images across regions
US9230132B2 (en) Anonymization for data having a relational part and sequential part
CA2779181C (en) System for updating an associative memory
US8650045B2 (en) Electronic health record sharing using hybrid architecture
US8332359B2 (en) Extended system for accessing electronic documents with revision history in non-compatible repositories
CN104636409B (zh) 促进搜索结果的显示的方法、设备和产生搜索结果的方法
CN104933173B (zh) 一种用于异构多数据源的数据处理方法、装置和服务器
CN109542966B (zh) 数据融合方法、装置、电子设备及计算机可读介质
CN105144080A (zh) 用于元数据管理的系统
WO2013123831A1 (en) Intelligent data archiving
US8239390B2 (en) Filtered remote journal
US20130275369A1 (en) Data record collapse and split functionality
US11531656B1 (en) Duplicate determination in a graph
US20140379635A1 (en) System and Methods of Data Migration Between Storage Devices
CN106934591A (zh) 工作流路径提取方法及系统
US20170140032A1 (en) Method & apparatus for asynchroinzed de-serialization of e-r model in a huge data trunk
Hachem et al. Managing derived data in the Gaea scientific DBMS
US20090106331A1 (en) Dynamic two-stage clinical data archiving and retrieval solution
CN109614411B (zh) 数据存储方法、设备和存储介质
US8819175B2 (en) Medical-information management system and medical-information management method
Erickson et al. DEWEY: the DICOM-enabled workflow engine system
US20160078173A1 (en) Method for editing data and associated data processing system or data processing system assembly
US20140365516A1 (en) Optimization of join queries for related data
US20150220548A1 (en) Searching for and retrieving files from a database using metadata defining accesses to files that do not modify the accessed file

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room J1839, 1st floor, 1185 Huyi Highway, Jiading District, Shanghai 201800

Applicant after: Research Territory Information Technology (Shanghai) Co., Ltd.

Address before: Room J1839, 1st floor, 1185 Huyi Highway, Jiading District, Shanghai 201800

Applicant before: Jingjing information technology (Shanghai) Co., Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200706

Address after: Room 101-305 and 5 floors of B1, 1st, 2nd and 3rd floors of Building No. 8, 406 Guilin Road, Xuhui District, Shanghai, 2003

Patentee after: SHANGHAI UNIVERSAL MEDICAL IMAGING DIAGNOSIS CENTER Co.,Ltd.

Address before: Room J1839, 1st floor, 1185 Huyi Highway, Jiading District, Shanghai 201800

Patentee before: Research Territory Information Technology (Shanghai) Co.,Ltd.

TR01 Transfer of patent right