CN116959657B - 一种医疗大数据安全管理系统 - Google Patents
一种医疗大数据安全管理系统 Download PDFInfo
- Publication number
- CN116959657B CN116959657B CN202311202590.1A CN202311202590A CN116959657B CN 116959657 B CN116959657 B CN 116959657B CN 202311202590 A CN202311202590 A CN 202311202590A CN 116959657 B CN116959657 B CN 116959657B
- Authority
- CN
- China
- Prior art keywords
- key
- medical
- medical information
- data
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000011159 matrix material Substances 0.000 claims abstract description 59
- 230000014509 gene expression Effects 0.000 claims description 9
- 125000004122 cyclic group Chemical group 0.000 claims description 6
- 238000007726 management method Methods 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 10
- 238000003745 diagnosis Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 241001391944 Commicarpus scandens Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6227—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2107—File encryption
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioethics (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及数据加密领域,具体涉及一种医疗大数据安全管理系统。该系统包括:信息明文模块、密钥模块以及加密算法模块,获取医疗数据;获取医疗信息属性;根据医疗信息属性字符串之间的关系特征获取医疗信息属性之间的匹配系数,进一步,获取医疗信息属性之间的类同度;通过类同度构建患者信息数据矩阵,获取初始密钥矩阵;获取初始密钥的密钥列之间的差距系数;获取新密钥列;构建密钥矩阵;根据密钥矩阵利用加密算法对医疗数据进行加密;从而完成对医疗大数据的安全管理,增加了加密算法的不规律性,提高密钥的安全性。
Description
技术领域
本发明涉及数据加密领域,具体涉及一种医疗大数据安全管理系统。
背景技术
随着信息技术的高速发展,医院对患者医疗数据的记录方式,从纸质存储转移到电子存储上。这些医疗数据包括患者的健康记录、诊断报告、医疗影像、基因组数据等患者信息,规模庞大,而且具有很高的敏感性。一旦医疗数据发生泄露,会导致患者的个人隐私泄露、不仅对医院造成负面影响、还会被不法分子利用进行一些犯罪活动,危及生命财产安全。故需要对医疗数据进行脱敏操作,数据脱敏的最好方法就是进行数据的加密。数据加密是通过运用一些函数将原始数据明文转化为密文的技术。
AES算法作为一种加密算法,具有安全性、加解密速度快等特点。但由于医疗数据包括病例、图像、实时检测数据等,在使用AES对在对数据进行加密时,患者的医疗数据之间具有很强的相关性,直接采用AES加密算法可能会有一定安全隐患。因此本发明根据医疗数据之间的差异来计算AES-128加密算法的子密钥,对AES-128加密算法进行改进。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种医疗大数据安全管理系统,所采用的技术方案具体如下:
本发明提出了一种医疗大数据安全管理系统,所述系统包括:
信息明文模块,获取医疗数据;获取医疗信息属性;
密钥模块,根据医疗信息属性的字符信息获取不同医疗信息属性各字符串之间的匹配因子;根据不同医疗信息属性各字符串之间的匹配因子获取医疗信息属性之间的匹配系数;根据医疗信息属性的字符特征获取医疗信息属性各字符串之间的类同因子;根据医疗信息属性各字符串之间的类同因子获取医疗信息属性之间的类同度;将各医疗信息属性对应的所述类同度最小的医疗信息属性记为各医疗信息属性的类同信息属性;根据各医疗信息属性及类同信息属性获取患者信息数据矩阵;根据患者信息数据矩阵各元素所属医疗信息属性对应的最小类同度构建类同度矩阵;根据患者信息数据矩阵与类同度矩阵获取初始密钥矩阵;根据初始密钥矩阵的密钥列之间的距离关系获取密钥列之间的差距系数;根据密钥列之间的差距系数获取各新密钥列;结合各新密钥列构建密钥矩阵;
加密算法模块,根据密钥矩阵利用加密算法对医疗数据进行加密,完成对医疗大数据的安全管理。
进一步的,所述根据医疗信息属性的字符信息获取不同医疗信息属性各字符串之间的匹配因子,表达式为:
;
式中,Sim( )表示不同医疗信息属性各字符串之间的匹配因子,wj表示第j个医疗信息属性产生的字符串,wi[k]表示第i个医疗信息属性字符串的前k个字符。
进一步的,所述匹配系数为两个医疗信息属性所有字符串之间匹配因子的和值。
进一步的,所述根据医疗信息属性的字符特征获取医疗信息属性各字符串之间的类同因子,具体为:
获取两个医疗信息属性的数据字符串,在任一医疗信息属性的字符串中连续取l个字符,其中,l为字符串长度,l大于等于2;将长度为l的字符串在另一个医疗信息属性字符串中出现的次数作为医疗信息属性各字符串之间的类同因子。
进一步的,所述根据医疗信息属性各字符串之间的类同因子获取医疗信息属性之间的类同度,具体为:
计算两个医疗信息属性所有字符串之间的类同因子与所述类同因子对应字符串长度的乘积的均值向上取整的值;将所述均值向上取整的值与两个医疗信息属性之间的匹配系数的乘积作为两个医疗信息属性之间的类同度。
进一步的,所述根据各医疗信息属性及类同信息属性获取患者信息数据矩阵,具体为:
将各医疗信息属性作为一组,类同信息属性作为另一组;分别在每组中平均抽取16个数据,分别按照从上到小从左到右的顺序,构成两个患者信息数据矩阵。
进一步的,所述根据患者信息数据矩阵与类同度矩阵获取初始密钥,表达式为:
;
;
式中,K0[p,q]表示初始密钥K0在第p行第q列的值,M1[p,q]、M2[p,q]分别表示数据矩阵M1、M2在第p行第q列的值,SM1[p,q]和SM2[p,q]表示类同度矩阵SM1、SM2在第p行第q列的值,P表示循环向右移动距离,Q表示循环向左移动距离,%表示取余符号,8表示8比特,>>>和<<<表示循环向右、向左移动,表示异或操作。
进一步的,所述根据初始密钥矩阵的密钥列之间的距离关系获取密钥列之间的差距系数,具体为:
任选初始密钥中的两个密钥列;计算两个密钥列所有行对应两个字符串之间的莱文斯坦距离均值。
进一步的,所述根据密钥列之间的差距系数获取各新密钥列,具体为:
选取差距系数最大的两个密钥列;对列数序号大的密钥列数据进行字循环、字节替换、轮常量异或操作,记为操作列;将另一个密钥列与所述操作列进行异或操作获取新密钥列;以此类推,获取各新密钥列。
进一步的,所述结合各新密钥列构建密钥矩阵,包括:
将各新密钥列作为密钥矩阵的各列,获取密钥矩阵。
本发明至少具有如下有益效果:
本发明提出了一种医疗大数据安全管理系统。通过对患者的医疗信息数据进行分析,得到不同医疗诊断属性之间的匹配系数,构建医疗诊断属性之间的类同度;可以有效的反映出医疗诊断属性信息之间的关联情况。通过对医疗诊断属性之间的类同分析,选取类同度最小的部分构建数据数组,利用数据数组构建数据矩阵,通过类同度与数据矩阵构建初始密钥矩阵,有效降低密钥列之间的相关性,提高密钥的安全性。
进一步,计算密钥矩阵中密钥列之间的差距系数,选取差距系数最大的两个密钥列,计算得到新的密钥列,新的密钥列可以有效的降低原始AES计算密钥列的与前密钥列之间的规律问题,提高医疗数据的安全性和保密性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种医疗大数据安全管理系统框图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种医疗大数据安全管理系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种医疗大数据安全管理系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种医疗大数据安全管理系统框图,该系统包括:信息明文模块101、密钥模块102、加密算法模块103。
信息明文模块101,从医院数据库管理系统中获取医疗数据,并对获取的数据进行预处理。
随着信息技术的发展,医院的医疗数据基本都已采用电子技术进行存储。医疗数据包括患者的基本信息、患者的诊断信息、诊断医生信息等,具有很高的私密性。这些医疗数据会在患者进入医院治疗时产生,并且存储到医院的数据管理库中,方便医生进行诊断查询。
从医院的数据库管理系统中获取医疗数据,并对获取的数据进行数据清洗,需要说明的是,数据清洗方法实施者可根据实际情况自行选取,本实施例中选用正则表达式对数据进行清洗。至此得到医疗数据。
密钥模块102,根据医疗信息数据构建初始密钥。
每个患者的身体状况是互不相同的,哪怕是同一种病,所产生的医疗信息也是不相同的,故每一个患者的医疗信息都具有不相同的属性。但是每位患者医疗信息的不同属性之间有一定的相关联性,例如身份证号和年龄、性别有关联性,通过识别身份证号就可以识别出年龄、性别等信息。如果直接使用这些具有相关联性的数据进行计算AES加密算法时,一旦被人找处不同属性数据之间的相关联性,就很容易被找到密钥的破解方向,降低了密钥的安全性。故本实施例通过医疗信息中属性相关联性最小的数据进行加密。
首先将医疗信息数据的属性记为w1,w2,…,;其中,a1代表医疗数据拥有的属性个数。在计算机中,相同字符转化为二进制比特流的数据相同的。通过对患者不同医疗信息属性的数据进行比较分析,得到匹配因子,表达式为:
;
式中,Sim( )表示不同医疗信息属性各字符串之间的匹配因子,wj表示第j个医疗信息属性产生的字符串,wi[k]表示第i个医疗信息属性字符串的前k个字符。如果在wj中可以找到与k个连续的字符与wi[k]字符串相同,那么医疗信息属性之间的匹配因子就为1,否则为0。例如wi=abcdefg,wj=defgabcr,当k=3时,wi[3]=abc,显然字符串wj中包含abc,故,这时wi与wj两种医疗信息属性字符串之间的匹配因子为1。
进一步的,依次对第i个医疗信息属性的字符串取前k个字符(每次增加1个字符),获取医疗信息属性之间的匹配系数,表达式如下:
;
式中,vij表示第i个与第j个医疗信息属性之间的匹配系数,wj表示第j个医疗信息属性产生的字符串,B表示第i个与第j个医疗信息属性字符串长度中的较小的值,wi[k]表示在第i个医疗信息属性的字符串取前k个字符。
当两个医疗信息属性数据内容有相同部分时,会造成医疗信息属性字符串之间的的匹配因子增多,进而造成不同医疗信息属性之间匹配系数增大。
计算机内部的信息是以0和1的形式进行存储和处理的,因此在比特流中,两组不同的医疗信息属性可能在二进制数据上具有高度相似性。数据加密是基于比特流数据进行的,在对数据进行加密及使用计算机内部的比特流数据时,需要谨慎对待敏感信息的保护,通过对不同比特数据的分析,可以计算得到不同医疗信息属性之间的类同度,表达式如下:
;
式中,Vij表示第i个与第j个医疗信息属性之间类同度,D表示字符串取得的最大长度,经验值为16,l表示取得字符串长度,wi(l)表示第i个医疗信息属性的二进制数据上取得l个连续的字符,CH( )表示医疗信息属性之间类同因子,计算的方式为:统计wi(l)字符串在wj中的数量。例如,wi=1101,wj=101011101,取l=3时,wi(l)可以取110、101;当wi1(3)=110时,CH1()的值为1;当wi2(3)=101时,CH2( )的值为3;故CH(wi(3),wj)=4。表示向上取整函数。
当两个医疗信息属性数据与其二进制数据具有高度相似时,会造成医疗信息属性之间的类同因子增大与匹配系数增大,导致两个医疗信息属性之间的类同度增大。
医疗信息属性之间类同度越大的代表两个医疗信息属性之间数据越相似,在对数据进行加密时,本实施例中采用数据之间联系比较少的数据进行加密。由上述的计算可知,一共得到了[a1×(a1-1)]/2个类同度。将类同度作为两个医疗信息属性的连接,只保留拥有最小的类同度的医疗信息属性数据。
将各医疗信息属性对应的类同度最小的医疗信息属性,记为各医疗信息属性的类同信息属性。将各医疗信息属性作为一组,将各医疗信息属性的类同信息属性作为另一组,按照8个比特为一个字节,计算每组所含字节数量,平均抽取16个字节,128bit的数据,并将其按照从上到下从左到右的顺序,构成两个4×4的患者信息数据矩阵M1、M2。
对于患者信息数据矩阵M1,M2不同位置的数据,将得到患者信息数据矩阵各元素所属医疗信息属性对应的最小类同度构建类同度矩阵SM1,SM2。通过数据矩阵与类同度矩阵构建数据矩阵K0;
;
;
式中,K0[p,q]表示初始密钥K0在第p行第q列的值,M1[p,q]、M2[p,q]表示数据矩阵M1、M2在第p行第q列的值,SM1[p,q]和SM2[p,q]表示类同度矩阵SM1、SM2在第p行第q列的值,P表示循环向右移动距离,Q表示循环向左移动距离;%表示取余符号,8表示8比特,因在本发明实施例中按照8比特为一个字节,所以对8进行取余;>>>和<<<表示循环向右、向左移动,例如10111100,循环右移一位的数据是01011110,循环左移同理;表示异或操作,即相同为0,不同为1。
计算得到的数据矩阵便是初始密钥矩阵K0,数据的每一列,便是加密算法的密钥列W。
至此,得到初始密钥K0=[W0,W1,W2,W3]。
传统的AES-128加密算法的密钥列是通过密钥列Wi-1和密钥列Wi-4计算得到的。需要说明的是,由于已经计算出初始密钥K0=[W0,W1,W2,W3],需要根据初始密钥计算新的密钥列,故i的取值大于等于4。由此传统的AES-128加密算法在对密钥列计算时具有规律性,容易被破解。本实施例考虑通过对密钥列之间的差异进行分析,将规律性计算变为无规律性计算,得到新的密钥列,可以有效去除密钥计算的规律性。
首先计算两个密钥列之间的差距系数,表达式为:
;
式中,Qxy表示第x列和第y列两个密钥列之间的差距系数,E表示密钥行数,在此为3,Wx[r]、Wy[r]分别表示第x列、第y列中第r个位置的值,LD()表示差距因子,表示两个字符串之间的莱文斯坦距离。需要说明的是,莱文斯坦距离为现有公知技术,本实施例中不做详细说明。
当两个字符串的差异性越大,代表两个字符串的差距因子LD(*)越大,造成密钥列之间的差距系数Qij越大。
当两个密钥列之间的差距系数越大,意味着它们之间的关联性越小。差距系数可以用来衡量密钥列之间的差异程度。通过选取差距系数最大的两列作为计算新的密钥列的计算项,以减小密钥列之间的关联性,计算公式如下:
;
式中,表示通过计算得到新密钥列,/>与/>是两个最不相关的密钥列,其中/>,T(*)是对密钥列数据进行字循环(向上移一位)、字节替换、轮常量异或,将进行T(*)操作后的密钥列记为操作列。
将新得到的密钥列W加入到密钥矩阵中,重复上面的操作,直到计算出44列的密钥矩阵。其中[W0,W1,W2,W3]为初始密钥,[W4,W5,W6,W7]为第一轮密钥,以此类推,共得到10轮密钥C。这10轮密钥C是计算AES-128加密算法的子密钥。
加密算法模块103,对医疗数据进行加密操作,完成对医疗数据安全管理。
通过本实施例上述模块得到子密钥对AES-128加密算法原来的子秘钥进行替换,完成医疗大数据的加密。需要说明的是,AES-128加密算法为现有公知技术,本实施例中不再赘述。
综上所述,根据本发明实施例上述系统可实现对医疗大数据的安全管理,避免加密过程中密钥列之间相关性导致的数据安全性降低。本发明实施例提出了一种医疗大数据安全管理系统。通过对患者的医疗信息数据进行分析,得到不同医疗诊断属性之间的匹配系数,构建医疗诊断属性之间的类同度;可以有效的反映出医疗诊断属性信息之间的关联情况。通过对医疗诊断属性之间的类同分析,选取类同度最小的部分构建数据数组,利用数据数组构建数据矩阵,通过类同度与数据矩阵构建初始密钥矩阵,有效降低密钥列之间的相关性,提高密钥的安全性。
进一步,计算密钥矩阵中密钥列之间的差距系数,选取差距系数最大的两个密钥列,计算得到新的密钥列,新的密钥列可以有效的降低原始AES计算密钥列的与前密钥列之间的规律问题,提高医疗数据的安全性和保密性。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种医疗大数据安全管理系统,其特征在于,所述系统包括:
信息明文模块,获取医疗数据;获取医疗信息属性;
密钥模块,根据医疗信息属性的字符信息获取不同医疗信息属性各字符串之间的匹配因子;根据不同医疗信息属性各字符串之间的匹配因子获取医疗信息属性之间的匹配系数;根据医疗信息属性的字符特征获取医疗信息属性各字符串之间的类同因子;根据医疗信息属性各字符串之间的类同因子获取医疗信息属性之间的类同度;将各医疗信息属性对应的所述类同度最小的医疗信息属性记为各医疗信息属性的类同信息属性;根据各医疗信息属性及类同信息属性获取患者信息数据矩阵;根据患者信息数据矩阵各元素所属医疗信息属性对应的最小类同度构建类同度矩阵;根据患者信息数据矩阵与类同度矩阵获取初始密钥矩阵;根据初始密钥矩阵的密钥列之间的距离关系获取密钥列之间的差距系数;根据密钥列之间的差距系数获取各新密钥列;结合各新密钥列构建密钥矩阵;
加密算法模块,根据密钥矩阵利用加密算法对医疗数据进行加密,完成对医疗大数据的安全管理。
2.根据权利要求1所述的一种医疗大数据安全管理系统,其特征在于,所述根据医疗信息属性的字符信息获取不同医疗信息属性各字符串之间的匹配因子,表达式为:
;
式中,Sim( )表示不同医疗信息属性各字符串之间的匹配因子,wj表示第j个医疗信息属性产生的字符串,wi[k]表示第i个医疗信息属性字符串的前k个字符。
3.根据权利要求1所述的一种医疗大数据安全管理系统,其特征在于,所述匹配系数为两个医疗信息属性所有字符串之间匹配因子的和值。
4.根据权利要求1所述的一种医疗大数据安全管理系统,其特征在于,所述根据医疗信息属性的字符特征获取医疗信息属性各字符串之间的类同因子,具体为:
获取两个医疗信息属性的数据字符串,在任一医疗信息属性的字符串中连续取l个字符,其中,l为字符串长度,l大于等于2;将长度为l的字符串在另一个医疗信息属性字符串中出现的次数作为医疗信息属性各字符串之间的类同因子。
5.根据权利要求1所述的一种医疗大数据安全管理系统,其特征在于,所述根据医疗信息属性各字符串之间的类同因子获取医疗信息属性之间的类同度,具体为:
计算两个医疗信息属性所有字符串之间的类同因子与所述类同因子对应字符串长度的乘积的均值向上取整的值;将所述均值向上取整的值与两个医疗信息属性之间的匹配系数的乘积作为两个医疗信息属性之间的类同度。
6.根据权利要求1所述的一种医疗大数据安全管理系统,其特征在于,所述根据各医疗信息属性及类同信息属性获取患者信息数据矩阵,具体为:
将各医疗信息属性作为一组,类同信息属性作为另一组;分别在每组中平均抽取16个数据,分别按照从上到小从左到右的顺序,构成两个患者信息数据矩阵。
7.根据权利要求1所述的一种医疗大数据安全管理系统,其特征在于,所述根据患者信息数据矩阵与类同度矩阵获取初始密钥,表达式为:
;
;
式中,K0[p,q]表示初始密钥K0在第p行第q列的值,M1[p,q]、M2[p,q]分别表示数据矩阵M1、M2在第p行第q列的值,SM1[p,q]和SM2[p,q]表示类同度矩阵SM1、SM2在第p行第q列的值,P表示循环向右移动距离,Q表示循环向左移动距离,%表示取余符号,8表示8比特,>>>和<<<表示循环向右、向左移动,表示异或操作。
8.根据权利要求1所述的一种医疗大数据安全管理系统,其特征在于,所述根据初始密钥矩阵的密钥列之间的距离关系获取密钥列之间的差距系数,具体为:
任选初始密钥中的两个密钥列;计算两个密钥列所有行对应两个字符串之间的莱文斯坦距离均值。
9.根据权利要求1所述的一种医疗大数据安全管理系统,其特征在于,所述根据密钥列之间的差距系数获取各新密钥列,具体为:
选取差距系数最大的两个密钥列;对列数序号大的密钥列数据进行字循环、字节替换、轮常量异或操作,记为操作列;将另一个密钥列与所述操作列进行异或操作获取新密钥列;以此类推,获取各新密钥列。
10.根据权利要求9所述的一种医疗大数据安全管理系统,其特征在于,所述结合各新密钥列构建密钥矩阵,包括:
将各新密钥列作为密钥矩阵的各列,获取密钥矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311202590.1A CN116959657B (zh) | 2023-09-18 | 2023-09-18 | 一种医疗大数据安全管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311202590.1A CN116959657B (zh) | 2023-09-18 | 2023-09-18 | 一种医疗大数据安全管理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116959657A CN116959657A (zh) | 2023-10-27 |
CN116959657B true CN116959657B (zh) | 2023-12-12 |
Family
ID=88442747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311202590.1A Active CN116959657B (zh) | 2023-09-18 | 2023-09-18 | 一种医疗大数据安全管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116959657B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117592090B (zh) * | 2024-01-19 | 2024-05-17 | 中国人民解放军海军青岛特勤疗养中心 | 一种护理体检数据智能分析及管理方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108256348A (zh) * | 2017-11-30 | 2018-07-06 | 深圳大学 | 一种密文搜索结果验证方法及其系统 |
WO2018204698A1 (en) * | 2017-05-04 | 2018-11-08 | Arterys Inc. | Medical imaging, efficient sharing and secure handling of medical imaging information |
WO2018213875A1 (en) * | 2017-05-22 | 2018-11-29 | Commonwealth Scientific And Industrial Research Organisation | Asymmetric cryptography and authentication |
CN109104404A (zh) * | 2018-06-20 | 2018-12-28 | 广州中国科学院软件应用技术研究所 | 一种动态加密的医疗大数据系统及方法 |
CN109462714A (zh) * | 2018-10-30 | 2019-03-12 | 成都优图有真像信息技术有限公司 | 云存储开销小的加密图像多位平面可逆数据隐藏方法 |
CN113643817A (zh) * | 2021-06-25 | 2021-11-12 | 合肥工业大学 | 考虑隐性反馈和人机交互的医疗案例知识推荐方法及系统 |
CN115242518A (zh) * | 2022-07-25 | 2022-10-25 | 深圳万海思数字医疗有限公司 | 混合云环境下医疗健康数据保护系统与方法 |
CN116153452A (zh) * | 2023-04-18 | 2023-05-23 | 济南科汛智能科技有限公司 | 基于人工智能的医疗电子病历存储系统 |
CN116346311A (zh) * | 2023-03-08 | 2023-06-27 | 天津理工大学 | 一种适用于资源受限医疗设备的数据加密方法及计算机设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020095604A1 (en) * | 2001-01-18 | 2002-07-18 | Hausler Jean-Philippe D. | Encryption system and method |
WO2019103913A1 (en) * | 2017-11-22 | 2019-05-31 | Arterys Inc. | Systems and methods for longitudinally tracking fully de-identified medical studies |
-
2023
- 2023-09-18 CN CN202311202590.1A patent/CN116959657B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018204698A1 (en) * | 2017-05-04 | 2018-11-08 | Arterys Inc. | Medical imaging, efficient sharing and secure handling of medical imaging information |
WO2018213875A1 (en) * | 2017-05-22 | 2018-11-29 | Commonwealth Scientific And Industrial Research Organisation | Asymmetric cryptography and authentication |
CN108256348A (zh) * | 2017-11-30 | 2018-07-06 | 深圳大学 | 一种密文搜索结果验证方法及其系统 |
CN109104404A (zh) * | 2018-06-20 | 2018-12-28 | 广州中国科学院软件应用技术研究所 | 一种动态加密的医疗大数据系统及方法 |
CN109462714A (zh) * | 2018-10-30 | 2019-03-12 | 成都优图有真像信息技术有限公司 | 云存储开销小的加密图像多位平面可逆数据隐藏方法 |
CN113643817A (zh) * | 2021-06-25 | 2021-11-12 | 合肥工业大学 | 考虑隐性反馈和人机交互的医疗案例知识推荐方法及系统 |
CN115242518A (zh) * | 2022-07-25 | 2022-10-25 | 深圳万海思数字医疗有限公司 | 混合云环境下医疗健康数据保护系统与方法 |
CN116346311A (zh) * | 2023-03-08 | 2023-06-27 | 天津理工大学 | 一种适用于资源受限医疗设备的数据加密方法及计算机设备 |
CN116153452A (zh) * | 2023-04-18 | 2023-05-23 | 济南科汛智能科技有限公司 | 基于人工智能的医疗电子病历存储系统 |
Non-Patent Citations (1)
Title |
---|
基于改进 AES 算法的医院信息系统数据加密;赵粹芹;信息技术(第7期);133-138 * |
Also Published As
Publication number | Publication date |
---|---|
CN116959657A (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Stadler et al. | Synthetic data–anonymisation groundhog day | |
Liang et al. | Efficient and secure decision tree classification for cloud-assisted online diagnosis services | |
CN116959657B (zh) | 一种医疗大数据安全管理系统 | |
CN113434626A (zh) | 一种多中心医学诊断知识图谱表示学习方法及系统 | |
JP2000315999A (ja) | 暗号鍵生成方法 | |
US20220293222A1 (en) | Methods for enabling secured and personalised genomic sequence analysis | |
Janani et al. | A secure medical image transmission scheme aided by quantum representation | |
Dugan et al. | A survey of secure multiparty computation protocols for privacy preserving genetic tests | |
Sakr et al. | Cancelable ECG biometric based on combination of deep transfer learning with DNA and amino acid approaches for human authentication | |
Mahdi et al. | Privacy-preserving string search on encrypted genomic data using a generalized suffix tree | |
Shalaby et al. | Enhanced Arnold’s cat map-AES encryption technique for medical images | |
Banerjee et al. | A robust bio-signal steganography with lost-data recovery architecture using deep learning | |
CN116595587B (zh) | 一种基于保密业务的文档隐写方法及文档管理方法 | |
CN111967048B (zh) | 面向基因组数据相似度的高效匹配及隐私保护方法、系统 | |
Al-Shargabi et al. | Multi-round encryption for COVID-19 data using the DNA key. | |
Akkasaligar et al. | Medical image encryption with integrity using DNA and chaotic map | |
Janet et al. | End-to-end encryption and prediction of medical insurance cost | |
Bhalerao et al. | Reversible ecg data hiding: Analysis and comparison of ann, regression svm and random forest regression | |
Jati et al. | An efficient secure ECG compression based on 2D-SPIHT and SIT algorithm | |
CN115879126A (zh) | 基于安全云存储的医疗信息共享方法、电子设备及存储介质 | |
Patel et al. | LEAF: A Federated Learning-Aware Privacy-Preserving Framework for Healthcare Ecosystem | |
Liu et al. | Secure medical data on cloud storage via DNA homomorphic encryption technique | |
Salama et al. | Secure biometric systems based on bio-signals and DNA encryption of optical spectrograms | |
Dugan et al. | Privacy-preserving evaluation techniques and their application in genetic tests | |
Ragavan et al. | Evaluation of cryptographic key generation performance using evolutionary algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |