CN111382151A - 一种基于数据脱敏的ct医疗图像清洗方法 - Google Patents
一种基于数据脱敏的ct医疗图像清洗方法 Download PDFInfo
- Publication number
- CN111382151A CN111382151A CN202010206503.XA CN202010206503A CN111382151A CN 111382151 A CN111382151 A CN 111382151A CN 202010206503 A CN202010206503 A CN 202010206503A CN 111382151 A CN111382151 A CN 111382151A
- Authority
- CN
- China
- Prior art keywords
- data
- medical image
- desensitization
- cleaning
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000586 desensitisation Methods 0.000 title claims abstract description 54
- 238000004140 cleaning Methods 0.000 title claims abstract description 36
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000012552 review Methods 0.000 claims abstract description 5
- 238000012216 screening Methods 0.000 claims description 6
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000010410 layer Substances 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 210000000232 gallbladder Anatomy 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000001370 mediastinum Anatomy 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 210000004872 soft tissue Anatomy 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/20—ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Bioethics (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
本发明为一种基于数据脱敏的CT医疗图像清洗方法。一种基于数据脱敏的CT医疗图像清洗方法,包括:S10:对CT医疗图像的原始数据进行伦理批件人工审核;S20:采用基于遮掩和替换的脱敏策略,将标签下涉及患者个人隐私的数据进行格式化替换或由*代替;S30:将经过CT医疗图像脱敏后的数据应用清洗程序进行清洗;S40:在步骤S20中如果出现信息Patient ID重复的数据,需要提示人工审核重复数据信息是否脱敏并剔除未脱敏数据;S50:将清洗后的正常数据进行归类输出,人工溯源到原始数据逐一审核确认。本发明的CT医疗图像清洗方法准确有效,可以快速准确对CT医疗图像进行数据脱敏操作,并完成数据清洗工作;对患者隐私进行了保护,同时也节省了大量的人力和时间成本。
Description
技术领域
本发明属于医疗图像处理技术领域,具体涉及一种基于数据脱敏的CT医疗图像清洗方法。
背景技术
人工智能的发展对数据集提出了强烈的需求,推动了医学数据的大规模开发。由于不同机构、组织自发的数据采集和信息录入缺乏可比性,数据采集过程中容易引入不唯一、不完整、不正确的不可用数据。为了保证对患者隐私的保护及数据质量,有必要在数据录用前对数据先进行数据脱敏处理再对脱敏后的数据进行预筛选或预评价,其中的关键步骤分别是使用特定的脱敏策略对数据中患者的隐私数据进行脱敏和使用数据清洗技术剔除不可用数据。由于医学数据的形式极其丰富,数据脱敏及数据清洗技术需要针对不同数据类型和不同问题进行开发。
CT可以更好地显示由软组织构成的器官,如脑、脊髓、纵隔、肺、肝、胆、胰以及盆部器官等,并在良好的解剖图像背景上显示出病变的影像。CT诊断由于它的特殊诊断价值,已广泛应用于临床。但是,现有技术中对CT医疗图像的数据脱敏及数据清洗技术,实现了隐私保护的同时,弱化了数据的使用价值。
有鉴于此,本发明提出一种新的基于数据脱敏的CT医疗图像清洗方法。
发明内容
本发明的目的在于提供一种基于数据脱敏的CT医疗图像清洗方法,主要目的在于对患者的CT医疗图像进行隐私保护的同时,提高CT医疗图像的可用性。
为了实现上述目的,所采用的技术方案为:
一种基于数据脱敏的CT医疗图像清洗方法,包括以下步骤:
S10:对CT医疗图像的原始数据进行伦理批件人工审核,筛除未经伦理批准的数据,以确保数据来源的合规性;
S20 CT医疗图像脱敏:采用基于遮掩和替换的脱敏策略,将标签下涉及患者个人隐私的数据进行格式化替换或由*代替的方法进行脱敏处理;
S30:将经过CT医疗图像脱敏后的数据应用清洗程序进行清洗,以确认数据真实唯一可用,排除无法读取、不完整的数据、无使用价值的数据和重复数据;
S40脱敏的检查:在步骤S20中如果出现信息Patient ID重复的数据,需要提示人工审核重复数据信息是否脱敏并剔除未脱敏数据;
S50:将清洗后的正常数据进行归类输出,人工溯源到原始数据逐一审核确认。
进一步的,所述的CT医疗图像是基于DICOM标准的CT医学图像。
进一步的,所述的步骤S40中,需要提示人工审核重复数据信息是否脱敏的数据包括原始图像、头文件、附加信息中涉及患者隐私的任何信息或字段。
与现有技术相比,本发明的有益之处在于:
本发明提供的技术方案中,通过人工溯源的方式将经脱敏和清洗后的数据与原始数据一一核对确认问题,发现人工溯源一致性为100%,这说明依照上述步骤进行数据脱敏和清洗的方法准确有效,即可以快速准确对CT医疗图像进行数据脱敏操作,并完成数据清洗工作;对患者隐私进行了保护,同时也节省了大量的人力和时间成本,解决了实现了隐私保护的同时,弱化了数据使用价值的技术问题。
附图说明
图1是本发明实施例1的一种基于数据脱敏的CT医疗图像清洗方法的流程图;
图2是实施例1提供的CT医疗图像原始数据图;
图3是实施例1采用一种基于数据脱敏的CT医疗图像清洗方法处理后,采用替换和遮掩方法的脱敏结果图。
具体实施方式
为了进一步阐述本发明一种基于数据脱敏的CT医疗图像清洗方法,达到预期发明目的,以下结合较佳实施例,对依据本发明提出的一种基于数据脱敏的CT医疗图像清洗方法,其具体实施方式、结构、特征及其功效,详细说明如后。在下述说明中,不同的“一实施例”或“实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
在详细阐述本发明一种基于数据脱敏的CT医疗图像清洗方法之前,有必要对本发明中提及的相关方法做进一步说明,以达到更好的效果。
本发明是关于一种基于数据脱敏的CT医疗图像清洗方法,涉及医疗图像处理技术领域,主要目的在对患者的CT医疗图像进行隐私保护的同时,提高CT医疗图像的可用性。技术方案的重点为:
(1)数据脱敏:通过格式化替换和遮掩等脱敏策略,将基于DICOM标准协议的CT图像中PatientTag等标签下涉及患者个人隐私的数据,对其部分或整体采用格式化替换或由*代替的方法进行脱敏处理。
(2)数据清洗和检查:再对脱敏后的CT医疗图像进行数据清洗工作。在针对DICOM文件头的数据清洗过程中,主要是读取患者数据确定数据是否完成脱敏,是否合规。读取检查和序列的识别码确定图像的唯一性,通过图像的标识码判定图像是否连续完整,此外,通过读取层厚、层间距等信息基本可以确定图像的质量并加以筛选。
(3)本方案中通过人工溯源的方式将经脱敏和清洗后的数据与原始数据一一核对确认问题,发现人工溯源一致性为100%。
这说明依照上述步骤进行数据脱敏和清洗的方法准确有效,即可以快速准确对CT医疗图像进行数据脱敏操作,并完成数据清洗工作;对患者隐私进行了保护,同时也节省了大量的人力和时间成本;还便于后期的数据再利用,提高了数据的使用价值。
数据清洗说明:
数据清洗首先应设立清洗目标,明确数据的完整性、有效性和正确性如何体现。在医学影像领域,数据清洗的常见目标包括以下几点:①对图像的可读性、唯一性进行筛选,去除不完整、不唯一的图像;②对质量差的或者不满足临床诊断要求的图像进行剔除,比如全黑图像或者层间距过大或过小的图像;③对患者隐私信息进行提取和检查,确保图像的合规性。
在了解了本发明中提及的相关材料之后,下面将结合具体的实施例,结合图1的流程图所示,对本发明一种基于数据脱敏的CT医疗图像清洗方法做进一步的详细介绍:
实施例1.
图1是本发明提供的基于数据脱敏的CT医疗图像清洗方法流程图,具体操作步骤如下:
S10:对CT医疗图像的原始数据进行伦理批件人工审核,筛除未经伦理批准的数据,以确保数据来源的合规性。图2是本实施例提供的CT医疗图像原始数据图。
S20 CT医疗图像脱敏:CT医疗图像是基于DICOM标准的CT医学图像。采用基于遮掩和替换的脱敏策略,即直接将PatientTag等标签下涉及患者个人隐私的数据进行格式化替换(姓名、性别等)、或由*代替的方法进行脱敏处理。并对脱敏后的数据进行保存。
在CT等医学影像领域,由于行业管理的规范性不足以及不同的医师操作习惯不同,导致最终的DICOM数据格式不统一。因此会出现不完整、不唯一、不合要求的数据,数据质量参差不齐。这些问题在数据清洗中应及时被发现并加以矫正。
图3是本实施例采用一种基于数据脱敏的CT医疗图像清洗方法处理后,采用替换和遮掩方法的脱敏结果图。
S30:将经过CT医疗图像脱敏后的数据应用清洗程序进行清洗,以确认数据真实唯一可用,排除无法读取、不完整的数据、无使用价值的数据和重复数据。
S40脱敏的检查:在步骤S20中如果出现信息Patient ID重复的数据,需要提示人工审核重复数据信息是否脱敏(包括原始图像、头文件、附加信息中涉及患者隐私的任何信息或字段),并剔除未脱敏数据。
S50:将清洗后的正常数据进行归类输出,人工溯源到原始数据逐一审核确认。
本发明的实施例提供的技术方案中,通过人工溯源的方式将经脱敏和清洗后的数据与原始数据一一核对确认问题,发现人工溯源一致性为100%,这说明依照上述步骤进行数据脱敏和清洗的方法准确有效,即可以快速准确对CT医疗图像进行数据脱敏操作,并完成数据清洗工作;对患者隐私进行了保护,同时也节省了大量的人力和时间成本,解决了实现了隐私保护的同时,弱化了数据使用价值的技术问题。
以上所述,仅是本发明实施例的较佳实施例而已,并非对本发明实施例作任何形式上的限制,依据本发明实施例的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明实施例技术方案的范围内。
Claims (3)
1.一种基于数据脱敏的CT医疗图像清洗方法,其特征在于,包括以下步骤:
S10:对CT医疗图像的原始数据进行伦理批件人工审核,筛除未经伦理批准的数据;
S20 CT医疗图像脱敏:采用基于遮掩和替换的脱敏策略,将标签下涉及患者个人隐私的数据进行格式化替换或由*代替的方法进行脱敏处理;
S30:将经过CT医疗图像脱敏后的数据应用清洗程序进行清洗,排除无法读取、不完整的数据、无使用价值的数据和重复数据;
S40脱敏的检查:在步骤S20中如果出现信息PatientID重复的数据,需要提示人工审核重复数据信息是否脱敏并剔除未脱敏数据;
S50:将清洗后的正常数据进行归类输出,人工溯源到原始数据逐一审核确认。
2.根据权利要求1所述的CT医疗图像清洗方法,其特征在于,
所述的CT医疗图像是基于DICOM标准的CT医学图像。
3.根据权利要求1所述的CT医疗图像清洗方法,其特征在于,
所述的步骤S40中,需要提示人工审核重复数据信息是否脱敏的数据包括原始图像、头文件、附加信息中涉及患者隐私的任何信息或字段。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010206503.XA CN111382151A (zh) | 2020-03-23 | 2020-03-23 | 一种基于数据脱敏的ct医疗图像清洗方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010206503.XA CN111382151A (zh) | 2020-03-23 | 2020-03-23 | 一种基于数据脱敏的ct医疗图像清洗方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111382151A true CN111382151A (zh) | 2020-07-07 |
Family
ID=71220015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010206503.XA Pending CN111382151A (zh) | 2020-03-23 | 2020-03-23 | 一种基于数据脱敏的ct医疗图像清洗方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111382151A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112116973A (zh) * | 2020-09-17 | 2020-12-22 | 山东健康医疗大数据有限公司 | 一种对个人健康医疗数据的系统化脱敏方法 |
CN113536370A (zh) * | 2021-07-06 | 2021-10-22 | 上海上讯信息技术股份有限公司 | 一种用于医疗影像文件数据脱敏的方法及系统 |
CN113779630A (zh) * | 2021-09-09 | 2021-12-10 | 新疆大学 | 一种基于dicom的ct医疗图像可逆脱敏方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107239666A (zh) * | 2017-06-09 | 2017-10-10 | 孟群 | 一种对医疗影像数据进行脱敏处理的方法及系统 |
CN109830303A (zh) * | 2019-02-01 | 2019-05-31 | 上海众恒信息产业股份有限公司 | 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法 |
-
2020
- 2020-03-23 CN CN202010206503.XA patent/CN111382151A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107239666A (zh) * | 2017-06-09 | 2017-10-10 | 孟群 | 一种对医疗影像数据进行脱敏处理的方法及系统 |
CN109830303A (zh) * | 2019-02-01 | 2019-05-31 | 上海众恒信息产业股份有限公司 | 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法 |
Non-Patent Citations (1)
Title |
---|
郝烨等: "\"数据清洗技术在DICOM格式医学图像质控中的应用\"" * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112116973A (zh) * | 2020-09-17 | 2020-12-22 | 山东健康医疗大数据有限公司 | 一种对个人健康医疗数据的系统化脱敏方法 |
CN113536370A (zh) * | 2021-07-06 | 2021-10-22 | 上海上讯信息技术股份有限公司 | 一种用于医疗影像文件数据脱敏的方法及系统 |
CN113779630A (zh) * | 2021-09-09 | 2021-12-10 | 新疆大学 | 一种基于dicom的ct医疗图像可逆脱敏方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111382151A (zh) | 一种基于数据脱敏的ct医疗图像清洗方法 | |
Segal et al. | Regional, circuit and network heterogeneity of brain abnormalities in psychiatric disorders | |
DE102011080260B4 (de) | Verfahren und Anordnung zur rechnergestützten Darstellung bzw. Auswertung von medizinischen Untersuchungsdaten | |
Brough et al. | The basics of disaster victim identification | |
DE102006000713A1 (de) | Medizinisches Bildbetrachtungsmanagement- und Statussystem | |
Chepkoech et al. | Effects of change in FreeSurfer version on classification accuracy of patients with Alzheimer's disease and mild cognitive impairment | |
WO2019037264A1 (zh) | 区域医疗检查影像在线处理系统及方法 | |
Hofmann et al. | Machine learning approaches along the radiology value chain–Rethinking value propositions | |
CN112562816A (zh) | 肿瘤影像报告诊断结果与病理结果对应与评价系统及方法 | |
Wiseman et al. | Longitudinal multi-centre brain imaging studies: guidelines and practical tips for accurate and reproducible imaging endpoints and data sharing | |
Paul et al. | Subcortical hyperintensities impact cognitive function among a select subset of healthy elderly | |
CN111370098A (zh) | 一种基于边缘侧计算和服务装置的病理诊断系统及方法 | |
CN111816284B (zh) | 医疗测试数据的批量生成方法、装置、设备及存储介质 | |
US20220139512A1 (en) | Mapping pathology and radiology entities | |
CN116486984A (zh) | 一种基于医学影像和在先诊断报告的转诊系统 | |
US11830594B2 (en) | Method and apparatus for template based treatment outcome generation | |
Ringl et al. | Intracranial hematomas at a glance: advanced visualization for fast and easy detection | |
Gordon et al. | A true screening environment for review of interval breast cancers: pilot study to reduce bias | |
CN113674827A (zh) | 电子病历的生成方法、装置、电子设备及计算机可读介质 | |
CN110781516A (zh) | 一种图像去隐私标注方法 | |
Piper et al. | MRI reporting by radiographers: the construction of an objective structured examination | |
CN113889227A (zh) | 一种基于dicom的医学图像脱敏及清洗方法 | |
Cao et al. | LNAS: A clinically applicable deep-learning system for mediastinal enlarged lymph nodes segmentation and station mapping without regard to the pathogenesis using unenhanced CT images | |
Müller et al. | Logo and text removal for medical image retrieval | |
Bey et al. | Lesion aware automated processing pipeline for multimodal neuroimaging stroke data and The Virtual Brain (TVB) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200707 |
|
RJ01 | Rejection of invention patent application after publication |