CN114896622A - 一种医疗数据安全云存储方法 - Google Patents
一种医疗数据安全云存储方法 Download PDFInfo
- Publication number
- CN114896622A CN114896622A CN202210385797.6A CN202210385797A CN114896622A CN 114896622 A CN114896622 A CN 114896622A CN 202210385797 A CN202210385797 A CN 202210385797A CN 114896622 A CN114896622 A CN 114896622A
- Authority
- CN
- China
- Prior art keywords
- data
- cloud storage
- medical
- user
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 30
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000013500 data storage Methods 0.000 claims abstract description 14
- 238000000586 desensitisation Methods 0.000 claims abstract description 8
- 238000012797 qualification Methods 0.000 claims abstract description 8
- 238000012795 verification Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 8
- 238000011161 development Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
- G06F21/16—Program or content traceability, e.g. by watermarking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/04—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
- H04L63/0428—Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Technology Law (AREA)
- Storage Device Security (AREA)
Abstract
本发明公开了一种医疗数据安全云存储方法,包括:获取用户提交的数据存储请求,验证用户的数据存储资格;资格通过后,获取用户提交的加密请求数据包;对用户提交的加密数据包进行解密;根据解密后的请求数据包获取对象数据的类型信息;根据所述对象数据的类型信息分别对不同类型的对象数据进行预处理;对预处理后的对象数据进行隐私化处理为不同类型的加密预上传数据包;为各个加密预上传数据包分别选择目标云存储节点,将加密预上传数据包发送至云存储服务器,并存储至相应的目标云存储节点中。本发明通过数据脱敏处理、数据水印处理等一系列密码学技术将医疗数据进行隐私化处理,将处理后的数据进行云上存储会大大加强医疗数据存储的安全性。
Description
技术领域
本发明涉及数据安全、医疗云、数据隐私领域,尤其涉及一种医疗数据安全云存储方法。
背景技术
伴随着互联网技术的兴起以及互联网医疗的快速发展,医大数据开始逐渐浮现在大家的视野中。同时,在政策和市场需求的驱动下,医疗大数据的类型以及规模正以前所未有的速度扩张,当前处于景气上升期。
健康医疗大数据是国家重要的基础性战略资源,国内医疗大数据目前尚未形成统一共享的体系,最主要的问题是出于医院及相关部门对医疗大数据隐私内容及保护数据库安全考虑。
为充分挖掘医疗数据价值,建设适应卫生改革与发展需求的信息化体系,提高医疗卫生服务与管理水平。国家卫生计生委指导下,组建了以国有资本为主体的三大健康医疗大数据集团公司,承担国家健康医疗大数据中心、区域中心、应用发展中心和产业园建设等国家试点工程任务。同时建设一个国家数据中心,七个区域中心。
由国家队构建医疗数据中心,解决了政策法规的障碍,也一定程度解决了数据托管方的信任背书问题,使得医疗数据集中存储成为可能。但这并不意味着数据可以充分流通共享,仍然需要解决安全隐私问题。数据想要流通的上云是一种很好的解决方式,但数据隐私性是医疗大数据的最重要特点。个体的患病情况、诊断结果、基因数据等医疗健康数据的泄露会对个人产生负面影响,且涉及侵犯公民权益。集中的巨大量信息泄露会导致极大风险,如人群的基因信息可能被用来制作精准生物武器,严重威胁国家安全。
目前,大数据、云计算是已经普及并成为IT行业的主流技术。国内外都已经进入了大数据、云计算的研究热潮,同时大数据、云计算技术也逐渐成熟,大规模区域医疗信息系统和大型数据中心的建立也在同时进行。而云计算是大数据成长的驱动力,与此同时,由于医药医疗大数据越来越多,对云计算的需求日益增长,所以二者是相辅相成的。随着医疗数据的急剧增长,如何充分利用这些数据,运用大数据、云计算技术,搭建合理先进的数据云服务平台,为广大患者、医务人员、科研人员提供服务和协助,必将成为未来信息化工作的重要方向。
发明内容
基于背景技术存在的技术问题,本发明提出了一种医疗数据安全云存储方法。
本发明采用的技术方案是:
一种医疗数据安全云存储方法,其特征在于,包括以下步骤:
(1)获取用户提交的数据存储请求,验证用户的数据存储资格;
(2)资格通过后,获取用户提交的加密请求数据包;
(3)对用户提交的加密数据包进行解密;
(4)根据解密后的请求数据包获取对象数据的类型信息;
(5)根据所述对象数据的类型信息分别对不同类型的对象数据进行预处理;
(6)对预处理后的对象数据进行隐私化处理为不同类型的加密预上传数据包;
(7)为各个加密预上传数据包分别选择目标云存储节点,将加密预上传数据包发送至云存储服务器,并存储至相应的目标云存储节点中。
进一步地,所述的一种医疗数据安全云存储方法,其特征在于,所述用户提交数据存储请求的载体为移动端或者PC端,所述移动端或者PC端安装有隐私模块。
进一步地,所述的一种医疗数据安全云存储方法,其特征在于,所述对象数据的类型信息包括结构化数据、非结构化数据,所述结构化数据包括EMPI患者基本信息检索目录、业务系统RDBMS关系型数据、web服务产生的数据;所述非结构化数据包括各类文本、图片、视频数据。
进一步地,所述的一种医疗数据安全云存储方法,其特征在于,所述对象数据的预处理包括结构化数据预处理、非结构化数据预处理,所述结构化数据预处理为:通过ETL工具转换为统一数据格式,同时进行数据的清洗、去重操作,然后直接划分数据库;所述非结构化数据预处理为分类划分数据库,规模较小的文本类数据划分在文档数据库当中,图片、视频数据通过非结构化数据采集引擎,划分在云服务器当中。
进一步地,所述的一种医疗数据安全云存储方法,其特征在于,所述隐私化处理包括数据脱敏处理、数据水印处理、属性基加密处理、查分隐私处理。
本发明的优点是:
本发明通过数据脱敏处理、数据水印处理、属性基加密处理、查分隐私处理等一系列密码学技术将医疗数据进行隐私化处理,将处理后的数据进行云上存储会大大加强医疗数据存储的安全性。
附图说明
图1为本发明的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
实施例。
如图1所示,一种医疗数据安全云存储方法,包括以下步骤:
(1)获取用户提交的数据存储请求,验证用户的数据存储资格;
(2)资格通过后,获取用户提交的加密请求数据包;
(3)对用户提交的加密数据包进行解密;
(4)根据解密后的请求数据包获取对象数据的类型信息;
(5)根据所述对象数据的类型信息分别对不同类型的对象数据进行预处理;
(6)对预处理后的对象数据进行隐私化处理为不同类型的加密预上传数据包;
(7)为各个加密预上传数据包分别选择目标云存储节点,将加密预上传数据包发送至云存储服务器,并存储至相应的目标云存储节点中。
用户提交数据存储请求的载体为移动端或者PC端,所述移动端或者PC端安装有隐私模块。
对象数据的类型信息包括结构化数据、非结构化数据,所述结构化数据包括EMPI患者基本信息检索目录、业务系统RDBMS关系型数据、web服务产生的数据;所述非结构化数据包括各类文本、图片、视频数据。
对象数据的预处理包括结构化数据预处理、非结构化数据预处理,所述结构化数据预处理为:通过ETL工具转换为统一数据格式,同时进行数据的清洗、去重操作,然后直接划分数据库;所述非结构化数据预处理为分类划分数据库,规模较小的文本类数据划分在文档数据库当中,图片、视频数据通过非结构化数据采集引擎,划分在云服务器当中。
隐私化处理包括数据脱敏处理、数据水印处理、属性基加密处理、查分隐私处理。
本发明以云数据平台为承载,以隐私保护模块为核心,解决数量巨大、结构多样的医疗数据上云安全问题在PC端、移动端安装隐私模块,对医疗机构将数据进行云端存储的上云时的安全与调取数据时的安全分别进行保护。
本发明解决了数据传输到云端的安全性问题,对于调取云上隐私保护的数据,即根据需求通过移动端或者PC端安装的隐私模块对数据进行还原处理,涉及多种密码学技术,可以适应不同场景的需求。通过本地服务端将隐私化的数据进行还原,得到原始的医疗数据。
以下是本发明涉及到的名词解释:
ETL工具:
医疗数据大多散落在各个系统,碎片化、低质量、孤立分散、类型多样、标准不一,医疗数据中心想要从中采集医疗数据并上传云端需要确保收集的数据是优质的、形成标准的,这样不仅节省存储资源,同时可以提高后续数据的利用效率,更大的发挥数据的价值。
本发明提供具备功能完善的ETL工具,支持多种数据格式转换、复杂数据类型的抽取融合等。可应用于数据中心对接采集各种业务系统数据等场景。
数据脱敏处理:
医院系统中存储着大量对整个医疗产业链,如医药公司、键诊中心、广告、中介、保险等行业具有重要价值的患者隐私信息。黑产人员想方设法窃取这些信息以求获利。医疗数据上不得不考虑隐私数据的安全保障问题。
针对敏感的隐私数据需要以特定的形式进行变形,实现敏感隐私数据的保护,让敏感数据可以正常使用而不被非法利用,从而增强数据的安全性。我们提供了多种数据脱敏算法,如置换、混淆、K-匿名、差分隐私等,以解决不同场景下的数据脱敏需求。
数据水印处理:
数据水印主要有图像、文本、关系型数据集合三种。数据水印主要目的除了防伪,还具备数据防泄漏以及数据泄露后进行溯源追责的效果。针对数据水印的操作主要有添加和提取两个步骤。针对不同的数据类型,水印的操作方式有所差别,但都能够有效将水印添加到数据中。
医疗数据中有大量的图像数据,这些数据就需要大量的数据水印添加操作。医疗数据中心中的水印信息会包含数据的来源和操作信息,万一数据泄露,通过数据水印可以最大限度还原数据泄露的整个过程。
属性基加密处理:
基于属性加密(ABE),又称模糊的基于身份的加密,是目前被看作最具有前景的支持细粒度访问的加密原语。与传统加密算法一样,属性基加密会给用户生成用户的私钥,用户使用自己的私钥解密密文获取明文。与传统方法不同的是,属性基加密将属性集合与策略嵌入到了用户私钥与密文中,这样一来,私钥与密文输入解密算法进行解密的过程,实际上就是属性集合与策略相匹配的过程,倘若能够匹配成功,则算法顺利完成解密操作,用户可成功恢复出明文数据。倘若匹配失败,则用户无法恢复明文,解密失败。
CP-ABE(密文策略属性基加密系统)由于策略嵌入密文中,这就意味着,数据拥有者可以通过设定策略去决定拥有哪些属性的人能够访问这份密文,也就相当于对这份数据做了一个粒度可以细化到属性级别的加密访问控制。
CP-ABE的应用场景一般是公有云上的数据加密存储与细粒度共享,而KP-ABE的应用场景则更加偏向于付费视频网站、日志加密管理等等。
用户想要在一个统计数据库里面保护用户的隐私,那么理想的隐私定义是这样的:访问一个统计数据库而不能够泄露在这个数据库中关于个人的信息。也就是说统计数据库应该提供一个统计值,但是对于个人的信息不应该被查询到。
差分隐私处理:
差分隐私(Differential privacy),是对通过算法保护个人隐私的数学定义。当个人信息用于创建数据产品时通过某种方法可以消除特定的个人隐私信息。差分隐私技术是一种用于在统计数据库中形式化隐私的一种框架,用来防止去匿名化的技术。
我们退而求其次,用一种隐私保护比较弱,但是很实用的方法来定义隐私:一个人隐私泄露的风险不应该因为这个人的信息加入统计数据库而增加。
当用户(也可能是潜藏的攻击者)向数据提供者提交一个查询请求时,如果数据提供者直接发布准确的查询结果,则可能导致隐私泄漏,因为用户可能会通过查询结果来反推出隐私信息。为了避免这一问题,差分隐私系统要求从数据库中提炼出一个中间件,用特别设计的随机算法对中间件注入适量的噪音,得到一个带噪中间件;再由带噪中间件推导出一个带噪的查询结果,并返回给用户。这样,即使攻击者能够从带噪的结果反推得到带噪中间件,他也不可能准确推断出无噪中间件,更不可能对原数据库进行推理,从而达到了保护隐私的目的。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (5)
1.一种医疗数据安全云存储方法,其特征在于,包括以下步骤:
(1)获取用户提交的数据存储请求,验证用户的数据存储资格;
(2)资格通过后,获取用户提交的加密请求数据包;
(3)对用户提交的加密数据包进行解密;
(4)根据解密后的请求数据包获取对象数据的类型信息;
(5)根据所述对象数据的类型信息分别对不同类型的对象数据进行预处理;
(6)对预处理后的对象数据进行隐私化处理为不同类型的加密预上传数据包;
(7)为各个加密预上传数据包分别选择目标云存储节点,将加密预上传数据包发送至云存储服务器,并存储至相应的目标云存储节点中。
2.根据权利要求1所述的一种医疗数据安全云存储方法,其特征在于,所述用户提交数据存储请求的载体为移动端或者PC端,所述移动端或者PC端安装有隐私模块。
3.根据权利要求1所述的一种医疗数据安全云存储方法,其特征在于,所述对象数据的类型信息包括结构化数据、非结构化数据,所述结构化数据包括EMPI患者基本信息检索目录、业务系统RDBMS关系型数据、web服务产生的数据;所述非结构化数据包括各类文本、图片、视频数据。
4.根据权利要求3所述的一种医疗数据安全云存储方法,其特征在于,所述对象数据的预处理包括结构化数据预处理、非结构化数据预处理,所述结构化数据预处理为:通过ETL工具转换为统一数据格式,同时进行数据的清洗、去重操作,然后直接划分数据库;所述非结构化数据预处理为分类划分数据库,规模较小的文本类数据划分在文档数据库当中,图片、视频数据通过非结构化数据采集引擎,划分在云服务器当中。
5.根据权利要求1所述的一种医疗数据安全云存储方法,其特征在于,所述隐私化处理包括数据脱敏处理、数据水印处理、属性基加密处理、查分隐私处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210385797.6A CN114896622A (zh) | 2022-04-13 | 2022-04-13 | 一种医疗数据安全云存储方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210385797.6A CN114896622A (zh) | 2022-04-13 | 2022-04-13 | 一种医疗数据安全云存储方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114896622A true CN114896622A (zh) | 2022-08-12 |
Family
ID=82717493
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210385797.6A Pending CN114896622A (zh) | 2022-04-13 | 2022-04-13 | 一种医疗数据安全云存储方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114896622A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116486981A (zh) * | 2023-06-15 | 2023-07-25 | 北京中科江南信息技术股份有限公司 | 健康数据的存储方法、健康数据的读取方法和装置 |
CN116522415A (zh) * | 2023-04-23 | 2023-08-01 | 杭州前云数据技术有限公司 | 一种实现医疗大数据安全存储及共享的系统 |
-
2022
- 2022-04-13 CN CN202210385797.6A patent/CN114896622A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116522415A (zh) * | 2023-04-23 | 2023-08-01 | 杭州前云数据技术有限公司 | 一种实现医疗大数据安全存储及共享的系统 |
CN116522415B (zh) * | 2023-04-23 | 2023-11-07 | 杭州前云数据技术有限公司 | 一种实现医疗大数据安全存储及共享的系统 |
CN116486981A (zh) * | 2023-06-15 | 2023-07-25 | 北京中科江南信息技术股份有限公司 | 健康数据的存储方法、健康数据的读取方法和装置 |
CN116486981B (zh) * | 2023-06-15 | 2023-10-03 | 北京中科江南信息技术股份有限公司 | 健康数据的存储方法、健康数据的读取方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cheng et al. | Secure $ k $ k-NN query on encrypted cloud data with multiple keys | |
CN108830601B (zh) | 基于区块链的智慧城市信息安全使用方法及系统 | |
CN106203146B (zh) | 一种大数据安全管理系统 | |
Zhu et al. | Secure k-NN computation on encrypted cloud data without sharing key with query users | |
Shankar et al. | Optimal key based homomorphic encryption for color image security aid of ant lion optimization algorithm | |
Wang et al. | Image copyright protection based on blockchain and zero-watermark | |
CN114896622A (zh) | 一种医疗数据安全云存储方法 | |
CN110474893A (zh) | 一种异构跨信任域密态数据安全分享方法及系统 | |
Li et al. | Color image encryption based on joint permutation and diffusion | |
Liang et al. | Privacy-preserving inter-database operations | |
CN106131225A (zh) | 用于医疗病例信息访问的安全系统 | |
Njorbuenwu et al. | A survey on the impacts of quantum computers on information security | |
CN109165526A (zh) | 一种大数据安全与隐私保护方法、装置及存储介质 | |
CN106326666A (zh) | 一种健康档案信息管理服务系统 | |
Anand et al. | A hybrid optimization-based medical data hiding scheme for industrial internet of things security | |
Hindistan et al. | A hybrid approach with gan and dp for privacy preservation of iiot data | |
Zhang et al. | Nano: Cryptographic enforcement of readability and editability governance in blockchain databases | |
William et al. | Secure Authentication Protocols For Internet Of Things (Iot) Devices | |
Wang et al. | Medical image encryption based on biometric keys and lower–upper decomposition with partial pivoting | |
Ping et al. | A novel medical image encryption based on cellular automata with ROI position embedded | |
Pawar et al. | Privacy preserving model-based authentication and data security in cloud computing | |
Yang et al. | Mu-teir: Traceable encrypted image retrieval in the multi-user setting | |
Li et al. | 3D medical images security via light-field imaging | |
Shankar et al. | An optimal lightweight cryptographic hash function for secure image transmission in wireless sensor networks | |
Saxena et al. | Fuzzy Elgamal Technique for Securing Data Over Cloud |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |