CN111951918A - 一种物联网医疗系统中增强数据隐私性的数据聚类方法 - Google Patents
一种物联网医疗系统中增强数据隐私性的数据聚类方法 Download PDFInfo
- Publication number
- CN111951918A CN111951918A CN202010841749.4A CN202010841749A CN111951918A CN 111951918 A CN111951918 A CN 111951918A CN 202010841749 A CN202010841749 A CN 202010841749A CN 111951918 A CN111951918 A CN 111951918A
- Authority
- CN
- China
- Prior art keywords
- data
- user
- users
- cluster
- cloud platform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000002708 enhancing effect Effects 0.000 title claims abstract description 16
- 238000007405 data analysis Methods 0.000 claims abstract description 60
- 239000013598 vector Substances 0.000 claims description 26
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000003064 k means clustering Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000012517 data analytics Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Y—INFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
- G16Y20/00—Information sensed or collected by the things
- G16Y20/40—Information sensed or collected by the things relating to personal data, e.g. biometric data, records or preferences
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16Y—INFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
- G16Y40/00—IoT characterised by the purpose of the information processing
- G16Y40/50—Safety; Security of things, users, data or systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Primary Health Care (AREA)
- Computer Security & Cryptography (AREA)
- Epidemiology (AREA)
- Bioethics (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开一种物联网医疗系统中增强数据隐私性的数据聚类方法,包括步骤:S1、用户初始化处理自己的健康数据,数据分析端接收所有用户提交的处理后的数据。S2、数据分析端通过计算来自不同用户的健康数据与初始化的聚类中心的欧式距离并进行比较,将每个用户分配到他们最近的聚类。S3、数据分析端通过第三方云平台计算并统计同一聚类中用户的的私有数据,以确定新的聚类中心。本发明在物联网医疗系统中,综合引入第三方云平台、同态加密,实现了保护用户数据隐私的聚类。
Description
技术领域
本发明涉及物联网医疗数据聚类领域,尤其涉及一种物联网医疗系统中增强数据隐私性的数据聚类方法。
背景技术
随着信息技术的迅速发展,物联网(IoT)作为代表技术,通过特定的传感器将任何对象连接到网络,然后通过信息交换实现智能识别,智能定位和智能监控。物联网的进步推动了智能应用的多样化,例如智能城市,现代医疗系统和智能电网。特别是对于医疗保健系统,越来越多的使用IoT来设计医疗保健系统的代理机构,因为IoT技术可以有效地集成基础架构资源并向医疗保健系统的用户提供信息。此外,医疗保健系统的管理者可以通过无线传感器网络(WSN)获得大量的实时数据,以提供实时服务。
近年来,k-means聚类算法的研究十分火热,k-means算法的隐私保护被认为是最重要的问题之一。良好的隐私保护机制也被应用到k-means聚类算法中。这种模式可以直接降低使用k-means算法时泄露私人信息的风险,并出现了一些相关的研究成果,Vaidya等开始了对k均值聚类算法中隐私保护的研究。对应的的工作是垂直分组数据,同时降低通信成本并确保实现合理的数据隐私保护,保留了Jha等在计算集群中心的步骤中,考虑了隐私保护而提出的了两种隐私保护方案:一种基于遗忘多项式评估,另一种基于同态加密。但是,对应的的方案没有考虑k-means算法中其他关键步骤的隐私信息泄漏。Bunn等中提出了一种两方k均值聚类协议,该协议无需使用中间值即可计算聚类结果。该协议避免了聚类过程中中间值的泄漏。Blum等首次将差分隐私机制引入隐私保护算法,该算法通过向集群中心添加噪声来降低隐私泄露的风险。但是,初始中心点选择的随机性直接影响k-均值聚类的结果。因此,Yang等人提出了一种改进的差分隐私(IDP)k-means算法。改善初始聚类中心的随机选择。同样,熊等提出了一种算法PADC,该算法通过在聚类过程中检测离群值来减少由初始中心随机选择引起的离群值影响。除了基于同态加密和差分隐私的隐私保护k-means聚类算法之外,还讨论了一种在基于区块链的新型数据隐私保护方案,该方案利用了区块链基础架构来消除单点故障。邢等提出了一种相互隐私保护方案,以防止泄露私人信息并有效地抵制共谋攻击。
以上所有工作都有不适用于时效系统。因此,越来越多的学者开始关注时间复杂度低的隐私保护聚类策略。Yu等在中提出了多方k均值聚类方案的隐私保护,这是将并行计算的概念首次应用到聚类过程中,并且其方案中的时间复杂性比以前的工作要好。苗等提出了一种通过双云平台实现来降低通信成本的基于事实发现的轻量级隐私保护框架L-PPTD和L2-PPTD。
现有的隐私保护k-means聚类方案不能在保护聚类中心的隐私的同时保护用户的隐私。而且,大多数方法不能抵抗共谋攻击或具有高时间复杂性。
因此,结合云计算和同态加密的特点,设计出在物联网医疗系统中能够以较低时间复杂性抵御抗共谋攻击且具有保护隐私特点的聚类方案是一个关键问题和挑战,成为本技术领域人员亟待解决的技术课题。
发明内容
本发明的目的在于提供一种物联网医疗系统中增强数据隐私性的数据聚类方法,能够有效保护用户和聚类中心的隐私性,且具有较低的时间复杂度。
本发明采用的技术方案是:
一种物联网医疗系统中增强数据隐私性的数据聚类方法,其包括步骤:
S1、数据分析端接收所有用户的敏感健康数据;
S2、数据分析端通过计算来自不同用户的健康数据与初始化的聚类中心的欧式距离并进行比较,将每个用户分配到对应的最近的聚类;
S3、数据分析端通过第三方云平台计算并统计同一聚类中用户的的私有数据,以确定新的聚类中心。
进一步地,步骤S2在保证参与者隐私的情况下分析者进行聚类的过程为:
S21、数据分析端计算满足(1)式的Cj′-Cj′′的值,然后将Cj′-Cj′′发送给用户;
(Cj′-Cj′′)T(Cj-Cj′)=0,|Cj′-Cj′′|≠0 (1)
其中Cj、Cj′为不同初始化聚类的聚类中心;Cj′-Cj′′为计算不同聚类中心的欧氏距离;
S22、用户在接收到数据分析端发来的Cj′-Cj′′后,根据(2)式计算混淆后的健康数据;
a(i,j,j′)=ai+t(i,j,j′)(Cj′-Cj′′) (2)
其中,ai为用户原始健康数据,t(i,j,j′)是用于干扰Cj′-Cj′′的值并防止ai泄漏的随机数;
S23、用户将混淆后的数据上传至数据分析端,然后数据分析端根据(3)式、(4)式,计算用户与不同聚类中心的欧式距离:
Dij=(a(i,j,j′)-Cj)T(a(i,j,j′)-Cj) (3)
Dij'=(a(i,j,j′)-Cj′)T(a(i,j,j′)-Cj′) (4)
其中,Cj、Cj′分别为不同的聚类中心,Dij表示用户与聚类中心Cj的欧式距离,Dij′表示用户与聚类中心Cj′的欧式距离(望发明人确认下是否正确);
S24、数据分析端根据(5)式计算不同欧式距离之间的差异值Dis;
Dis=Dij-Dij′ (5);
S25、基于差异值Dis判定用户的聚类关系;当差异值小于0,用户更靠近聚类Cj;当差异值大于0,用户更靠近聚类Cj′;
S26、遍历所有聚类后,数据分析端可以找出与用户健康数据之间欧氏距离最近的聚类中心。
进一步地,所述步骤S3在保证聚类中心数据隐私情况下新的聚类中心计算的具体过程为:
S31、数据分析端随机生成一个公、私钥对,该公钥将发布给所有用户和第三方云平台,而私钥仅由数据分析端保存;同时数据分析端将与第三方云平台共享有关用户和聚类的关系表,
S32、每位用户生成一个q维度的随机向量ρi,该向量用于再次混淆每位用户的私有数据,那么被混淆的数据ai′表示为:
ai′=ai-ρi (6)
然后用户将混淆后的数据上传至第三方云平台;
S33、第三方云平台使用公钥对所有混淆数据进行加密得到密文,且密文由第三方云平台临时保存;
S34、第三方云平台安全地将安全参数r、v下发给用户;
S35、用户收到安全参数之后计算获得加密数据的随机向量Y,并对随机向量Y进行切片后将切片发送给其他用户,用户ai使用其他用户的切片的随机数据组成的新随机数据ρ′:加密数据的随机向量Y的计算公式如下:
Y=E(pk,r*ρ+v) (10)
其中,r的值根据关系表取常数0或1;v是一个q维向量;
S36、每位用户将混淆的随机数据发送到第三方云平台,平台计算出同一聚类中的用户生成的随机数据的总和;
S37、结合第一阶段加密的混淆健康数据,第三方云平台对同一聚类中所有用户的数据总和进行加密;然后第三方云平台将加密数据发送给数据分析端,数据分析端通过私钥及同态加密性质解密密文;
S38、数据分析端通过接收到数据计算新的聚类中心;
S39、重复S34至S38,直到遍历所有聚类。
其中,j表示不同聚类中心的数量;|ci|表示第i个聚类中心中参与者的数量;r1 k的值根据关系表取常数0或1;∑为累积求和运算;
进一步地,S36中聚类中的随机数据之和表示为:
进一步地,S37中结合加密的混淆数据第三方云平台对同一聚类中所有用户的数据总和进行加密,表达式如下:
本发明的有益效果在于:(1)在数据分析端将用户分配至对应聚类中心时,保证用户的私有健康数据和聚类中心的特征信息不被泄露。(2)数据分析端在计算新的聚类中心时,新聚类中心的隐私数据不被泄露给任何一个在该聚类中的用户。(3)通过引入第三方云平台降低了系统的时间复杂度。(4)可以抵抗共谋攻击。
附图说明
以下结合附图和具体实施方式对本发明做进一步详细说明;
图1为本发明实施例的一种增强数据隐私性的数据聚类方法的流程图;
图2为本发明的架构原理示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图对本申请实施例中的技术方案进行清楚、完整地描述。本发明最关键的构思在于:在物联网医疗系统中,综合引入第三方云平台、同态加密,实现了保护用户数据隐私的聚类。
如图1或图2所示,本发明公开了一种物联网医疗系统中增强数据隐私性的数据聚类方法,所定义的网络模型如下:在物联网医疗系统模型中,每位用户ai都将维护一组关于自身健康情况的数据ai(如:血压、心率等),用来了解自身的健康状况;数据分析端A可以通过对不同用户的健康情况数据进行相关性分析,根据分析结果对用户进行分类;第三方云平台PT用于降低系统时间复杂度,提高计算能力;Cj表示共有k个不同的聚类中心。
如图2所示,物联网医疗系统中增强数据隐私性的数据聚类方法,包括步骤:
S1、用户初始化处理自己的健康数据,数据分析端A接收所有用户提交的处理后的数据。
S2、数据分析端通A过计算来自不同用户ai的健康数据与初始化的聚类中心的欧式距离并进行比较,将每个用户分配到他们最近的聚类。所述步骤S2具体包括:
S21、数据分析端A计算满足(1)式的Cj′-Cj′′的值,然后将Cj′-Cj′′发送给用户ai。其中Cj、Cj′为不同初始化聚类的聚类中心,Cj′-Cj′′为计算不同聚类中心的欧氏距离。
(Cj′-Cj′′)T(Cj-Cj′)=0,|Cj′-Cj′′|≠0 (1)
S22、用户ai在接收到数据分析端A发来的Cj′-Cj′′后,计算混淆后的健康数据。
a(i,j,j′)=ai+t(i,j,j′)(Cj′-Cj′′) (2)
其中,ai为用户原始健康数据,t(i,j,j′)是用于干扰Cj′-Cj′′的值并防止ai泄漏的随机数。
S23、用户ai将a(i,j,j′)上传至数据分析端A,然后数据分析端A根据根据(3)式、(4)式,计算用户与不同聚类中心的欧式距离:
Dij=(a(i,j,j′)-Cj)T(a(i,j,j′)-Cj) (3)
Dij′=(a(i,j,j′)-Cj′)T(a(i,j,j′)-Cj′) (4)
其中,Cj,Cj′为不同的聚类中心。
S24、数据分析端A根据(5)式计算不同欧式距离之间的差异值。Dis=Dij-Dij′ (5)
S25、Dis<0,用户ai更靠近聚类Cj;Dis>0,用户更靠近聚类Cj′。
S26、遍历所有聚类后,数据分析端可A以找出与用户ai健康数据之间欧氏距离最近的聚类中心。
S3、数据分析端通A过第三方云平台PT计算并统计同一聚类中用户的私有数据,以确定新的聚类中心。所述步骤S3具体包括:
S31、数据分析端A随机生成一个公、私钥对(pk,pr)。该公钥将发布给所有用户和第三方云平台PT,而私钥仅由数据分析端A保存。同时数据分析端A将与第三方云平台PT共享有关用户和聚类信息的关系表,如表1所示:
表1
S32、用户ai生成一个q维的随机向量ρi,该向量用于再次混淆用户的私有数据。那么被混淆的数据ai′可以表示为(6):
ai′=ai-ρi (6)
然后用户ai将混淆后的数据上传至第三方云平台PT。
S33、第三方云平台PT使用公钥对所有混淆数据进行加密,并且密文E(ai′),并且密文由第三方云平台PT临时保存
其中,j表示不同聚类中心的数量;|ci|表示第i个聚类中心中参与者的数量;r1 k的值根据关系表取常数0或1;∑为累积求和运算;
S35、在用户ai收到r和v之后,计算r*ρ+v的值,获得加密后的随机向量如(10)式所示:
Y=E(pk,r*ρ+v) (10)
r的值根据关系表取常数0或1;v是一个q维向量;ρ为一个q维度的随机向量;E(·)为加密操作;pk为公钥;
并且用户ai应与其他用户共享自己的一部分。假设密文Y随机分为m个部分,其余选择m-1个发送给其他用户。其中m个部分满足1<m<n且所有用户完成数据切片,并将切片发送给其他用户。完成后,用户ai使用其他用户的切片的随机数据组成的新随机数据ρ′。
S36、所有用户分别将ρ′发送到第三方云平台PT。平台PT可以计算出同一聚类中的用户生成的随机数据的总和。聚类中的随机数据之和可以表示为:
S37、结合第一阶段加密的混淆数据,第三方云平台PT可以对同一聚类中所有用户的数据总和进行加密,如下。
S39、重复S34至S38,直到遍历所有聚类。
综上所述,本发明具有以下有益效果:
(1)在数据分析端将用户分配至对应聚类中心时,保证用户的私有健康数据和聚类中心的特征信息不被泄露。
数据分析端无法获得用户所生成的用于混淆健康数据的随机数,所以数据分析端无法通过现有的知识无法计算、还原出每位用户的健康数据。
第三方云平台除了关于用户和聚类的关系表之外,它仅知道混淆后需要加密数据的明文、密文和经过处理的随机混淆向量。由于私有密钥仅由数据分析端知道,因此第三方云平台无法解密密文,也无法获得原始随机向量的任何信息。由于用于加密的数据是通过用户生成的随机向量混淆后的数据,因此第三方云平台无法计算出用户原始数据。
(2)数据分析端在计算新的聚类中心时,新聚类中心的隐私数据不被泄露给任何一个在该聚类中的用户。
对于用户来说,除了用户本身的隐私健康数据和自行生成的随机向量外,每位用户还知道其他用户分发的密文切片。可以计算从其他用户接收到的数据切片和自身保存的部分数据切片的总和。但是,基于这些值,每位用户也都无法计算出有关其他用户的隐私健康数据以及其他用户所属的聚类中心的任何信息。
(3)可以抵抗共谋攻击。
数据分析端与用户之间的共谋:假设系统中有n个用户,有n-1个用户与数据分析端共谋以推断剩余参与者ai的信息。尽管数据分析端知道用户与n-1个参与者的集群,私有信息之间的关系表,但它无法推断ai的信息,因为数据分析端只能接收同一集群中所有用户混淆数据的加密结果,无法推断出更多信息。
用户之间的共谋:如果有n-1个用户共谋,则它仍无法推断出有关集群中心的任何信息,因为共谋中的n-1个用户,不知道其余用户所在的聚类。
(4)通过引入第三方云平台提高了整个系统的计算能力,同时降低了系统的时间复杂度。
显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
Claims (8)
1.一种物联网医疗系统中增强数据隐私性的数据聚类方法,其特征在于:其包括步骤:
S1、数据分析端接收所有用户的敏感健康数据;
S2、数据分析端通过计算来自不同用户的健康数据与初始化的聚类中心的欧式距离并进行比较,将每个用户分配到对应的最近的聚类;
S3、数据分析端通过第三方云平台计算并统计同一聚类中用户的的私有数据,以确定新的聚类中心。
2.根据权利要求1所述的物联网医疗系统中增强数据隐私性的数据聚类方法,其特征在于:步骤S2在保证参与者隐私的情况下分析者进行聚类的过程为:
S21、数据分析端计算满足(1)式的Cj′-Cj′′的值,然后将Cj′-Cj′′发送给用户;
(Cj′-Cj′′)T(Cj-Cj′)=0,|Cj′-Cj′′|≠0 (1)
其中Cj、Cj'为不同初始化聚类的聚类中心;Cj′-Cj′′为计算不同聚类中心的欧氏距离;
S22、用户在接收到数据分析端发来的Cj′-Cj′′后,根据(2)式计算混淆后的健康数据;
a(i,j,j′)=ai+t(i,j,j′)(Cj′-Cj′′) (2)
其中,ai为用户原始健康数据,t(i,j,j′)是用于干扰Cj′-Cj′′的值并防止ai泄漏的随机数;
S23、用户将混淆后的数据上传至数据分析端,然后数据分析端根据(3)式、(4)式,计算用户与不同聚类中心的欧式距离:
Dij=(a(i,j,j′)-Cj)T(a(i,j,j′)-Cj) (3)
Dij'=(a(i,j,j′)-Cj′)T(a(i,j,j′)-Cj′) (4)
其中,Cj、Cj'分别为不同的聚类中心,Dij表示用户与聚类中心Cj的欧式距离,Dij'表示用户与聚类中心Cj'的欧式距离;
S24、数据分析端根据(5)式计算不同欧式距离之间的差异值Dis;
Dis=Dij-Dij' (5);
S25、基于差异值Dis判定用户的聚类关系;当差异值小于0,用户更靠近聚类Cj;当差异值大于0,用户更靠近聚类Cj';
S26、遍历所有聚类后,数据分析端可以找出与用户健康数据之间欧氏距离最近的聚类中心。
3.根据权利要求1所述的一种物联网医疗系统中增强数据隐私性的数据聚类方法,其特征在于:所述步骤S3在保证聚类中心数据隐私情况下新的聚类中心计算的具体过程为:
S31、数据分析端随机生成一个公、私钥对,该公钥将发布给所有用户和第三方云平台,而私钥仅由数据分析端保存;同时数据分析端将与第三方云平台共享有关用户和聚类的关系表,
S32、每位用户生成一个q维度的随机向量ρi,该向量用于再次混淆每位用户的私有数据,那么被混淆的数据ai'表示为:
ai'=ai-ρi (6)
然后用户将混淆后的数据上传至第三方云平台;
S33、第三方云平台使用公钥对所有混淆数据进行加密得到密文,且密文由第三方云平台临时保存;
S34、第三方云平台安全地将安全参数r、v下发给用户;
S35、用户收到安全参数之后计算r*ρ+v的值,获得加密数据Y,随后对加密数据Y进行切片并将切片发送给其他用户;加密数据Y的计算如下式
Y=E(pk,r*ρ+v) (10)
其中,r的值根据关系表取常数0或1;v是一个q维向量;ρ为一个q维度的随机向量;E(·)为加密操作;pk为公钥;
S36、每位用户将混淆的随机数据发送到第三方云平台,平台计算出同一聚类中的用户生成的随机数据的总和;
S37、结合第一阶段加密的混淆健康数据,第三方云平台对同一聚类中所有用户的数据总和进行加密;然后第三方云平台将加密数据发送给数据分析端,数据分析端通过私钥及同态加密性质解密密文;
S38、数据分析端通过接收到数据计算新的聚类中心;
S39、重复S34至S38,直到遍历所有聚类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010841749.4A CN111951918B (zh) | 2020-08-20 | 2020-08-20 | 一种物联网医疗系统中增强数据隐私性的数据聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010841749.4A CN111951918B (zh) | 2020-08-20 | 2020-08-20 | 一种物联网医疗系统中增强数据隐私性的数据聚类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111951918A true CN111951918A (zh) | 2020-11-17 |
CN111951918B CN111951918B (zh) | 2022-09-06 |
Family
ID=73358572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010841749.4A Active CN111951918B (zh) | 2020-08-20 | 2020-08-20 | 一种物联网医疗系统中增强数据隐私性的数据聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111951918B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113591154A (zh) * | 2021-10-08 | 2021-11-02 | 青岛美迪康数字工程有限公司 | 诊疗数据去标识化方法、装置及查询系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102469145A (zh) * | 2010-11-19 | 2012-05-23 | 岑澔 | 一种基于云计算的体质健康管理系统 |
CN104680076A (zh) * | 2013-11-27 | 2015-06-03 | 埃森哲环球服务有限公司 | 用于使受保护健康信息匿名化和聚集的系统 |
CN106650205A (zh) * | 2016-09-28 | 2017-05-10 | 西安电子科技大学 | 一种高效隐私保护的云医疗数据监护系统及监护方法 |
CN109584978A (zh) * | 2018-10-26 | 2019-04-05 | 西安邮电大学 | 基于签名聚合医疗健康监控网络模型信息处理方法及系统 |
EP3505042A1 (en) * | 2017-12-28 | 2019-07-03 | Ethicon LLC | Communication hub and storage device for storing parameters and status of a surgical device to be shared with cloud based analytics systems |
CA3042660A1 (en) * | 2018-05-11 | 2019-11-11 | Michigan Health Information Network Shared Services | Systems and methods for managing data privacy |
EP3579241A1 (en) * | 2018-06-08 | 2019-12-11 | Siemens Healthcare GmbH | Method of managing medical records |
-
2020
- 2020-08-20 CN CN202010841749.4A patent/CN111951918B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102469145A (zh) * | 2010-11-19 | 2012-05-23 | 岑澔 | 一种基于云计算的体质健康管理系统 |
CN104680076A (zh) * | 2013-11-27 | 2015-06-03 | 埃森哲环球服务有限公司 | 用于使受保护健康信息匿名化和聚集的系统 |
CN106650205A (zh) * | 2016-09-28 | 2017-05-10 | 西安电子科技大学 | 一种高效隐私保护的云医疗数据监护系统及监护方法 |
EP3505042A1 (en) * | 2017-12-28 | 2019-07-03 | Ethicon LLC | Communication hub and storage device for storing parameters and status of a surgical device to be shared with cloud based analytics systems |
CA3042660A1 (en) * | 2018-05-11 | 2019-11-11 | Michigan Health Information Network Shared Services | Systems and methods for managing data privacy |
EP3579241A1 (en) * | 2018-06-08 | 2019-12-11 | Siemens Healthcare GmbH | Method of managing medical records |
CN109584978A (zh) * | 2018-10-26 | 2019-04-05 | 西安邮电大学 | 基于签名聚合医疗健康监控网络模型信息处理方法及系统 |
Non-Patent Citations (1)
Title |
---|
XUANCHENG GUO ETC: ""A Data Clustering Strategy for Enhancing Mutual Privacy in Healthcare System of IoT"", 《IEEE》, 23 October 2019 (2019-10-23), pages 521 - 525 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113591154A (zh) * | 2021-10-08 | 2021-11-02 | 青岛美迪康数字工程有限公司 | 诊疗数据去标识化方法、装置及查询系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111951918B (zh) | 2022-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jung et al. | Collusion-tolerable privacy-preserving sum and product calculation without secure channel | |
US8880867B2 (en) | Fault-tolerant privacy-preserving statistics | |
CN111586000B (zh) | 一种全代理同态重加密传输系统及其运行机制 | |
CN109474928B (zh) | 在移动群智感知系统中实现高效隐私保护的真值发现方法 | |
CN115442050B (zh) | 一种基于sm9算法的隐私保护的联邦学习方法 | |
CN114465708B (zh) | 隐私数据处理方法及装置、系统、电子设备、存储介质 | |
Patel et al. | Privacy preserving distributed k-means clustering in malicious model using zero knowledge proof | |
Lyu et al. | Privacy-preserving aggregation of smart metering via transformation and encryption | |
CN111585990A (zh) | 基于安全求和的移动群智感知隐私保护真值发现方法 | |
Gao et al. | Location privacy-preserving truth discovery in mobile crowd sensing | |
CN111951918B (zh) | 一种物联网医疗系统中增强数据隐私性的数据聚类方法 | |
Ranbaduge et al. | Secure multi-party summation protocols: Are they secure enough under collusion? | |
Mansouri et al. | Learning from failures: Secure and fault-tolerant aggregation for federated learning | |
Barletta et al. | Privacy preserving smart grid communications by verifiable secret key sharing | |
Yan et al. | Privacy-preserving and customization-supported data aggregation in mobile crowdsensing | |
Zhou et al. | Toward Scalable and Privacy-preserving Deep Neural Network via Algorithmic-Cryptographic Co-design | |
CN114564730A (zh) | 基于对称加密的联邦分组统计量计算方法、设备及介质 | |
CN114640436A (zh) | 一种基于隐私保护的分组统计参数计算方法、装置 | |
Lu et al. | Robust and verifiable privacy federated learning | |
Huang et al. | EFMVFL: an efficient and flexible multi-party vertical federated learning without a third party | |
CN113554182A (zh) | 一种横向联邦学习系统中拜占庭节点的检测方法及系统 | |
CN114900283B (zh) | 基于多方安全计算的深度学习用户梯度聚合方法 | |
CN115065492B (zh) | 一种电力时序数据通信的安全聚合方法及系统 | |
CN114866312B (zh) | 一种保护数据隐私的共有数据确定方法及装置 | |
CN113949501A (zh) | 一种基于半同态加密的横向分布式pca降维方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |