CN111951918B - 一种物联网医疗系统中增强数据隐私性的数据聚类方法 - Google Patents

一种物联网医疗系统中增强数据隐私性的数据聚类方法 Download PDF

Info

Publication number
CN111951918B
CN111951918B CN202010841749.4A CN202010841749A CN111951918B CN 111951918 B CN111951918 B CN 111951918B CN 202010841749 A CN202010841749 A CN 202010841749A CN 111951918 B CN111951918 B CN 111951918B
Authority
CN
China
Prior art keywords
data
user
users
cluster
analysis end
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010841749.4A
Other languages
English (en)
Other versions
CN111951918A (zh
Inventor
林晖
刘文新
汪晓丁
妙秦阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Normal University
Original Assignee
Fujian Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Normal University filed Critical Fujian Normal University
Priority to CN202010841749.4A priority Critical patent/CN111951918B/zh
Publication of CN111951918A publication Critical patent/CN111951918A/zh
Application granted granted Critical
Publication of CN111951918B publication Critical patent/CN111951918B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16YINFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
    • G16Y20/00Information sensed or collected by the things
    • G16Y20/40Information sensed or collected by the things relating to personal data, e.g. biometric data, records or preferences
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16YINFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
    • G16Y40/00IoT characterised by the purpose of the information processing
    • G16Y40/50Safety; Security of things, users, data or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Computing Systems (AREA)
  • Epidemiology (AREA)
  • Bioethics (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种物联网医疗系统中增强数据隐私性的数据聚类方法,包括步骤:S1、用户初始化处理自己的健康数据,数据分析端接收所有用户提交的处理后的数据。S2、数据分析端通过计算来自不同用户的健康数据与初始化的聚类中心的欧式距离并进行比较,将每个用户分配到他们最近的聚类。S3、数据分析端通过第三方云平台计算并统计同一聚类中用户的的私有数据,以确定新的聚类中心。本发明在物联网医疗系统中,综合引入第三方云平台、同态加密,实现了保护用户数据隐私的聚类。

Description

一种物联网医疗系统中增强数据隐私性的数据聚类方法
技术领域
本发明涉及物联网医疗数据聚类领域,尤其涉及一种物联网医疗系统中增强数据隐私性的数据聚类方法。
背景技术
随着信息技术的迅速发展,物联网(IoT)作为代表技术,通过特定的传感器将任何对象连接到网络,然后通过信息交换实现智能识别,智能定位和智能监控。物联网的进步推动了智能应用的多样化,例如智能城市,现代医疗系统和智能电网。特别是对于医疗保健系统,越来越多的使用IoT来设计医疗保健系统的代理机构,因为IoT技术可以有效地集成基础架构资源并向医疗保健系统的用户提供信息。此外,医疗保健系统的管理者可以通过无线传感器网络(WSN)获得大量的实时数据,以提供实时服务。
近年来,k-means聚类算法的研究十分火热,k-means算法的隐私保护被认为是最重要的问题之一。良好的隐私保护机制也被应用到k-means聚类算法中。这种模式可以直接降低使用k-means算法时泄露私人信息的风险,并出现了一些相关的研究成果,Vaidya等开始了对k均值聚类算法中隐私保护的研究。对应的的工作是垂直分组数据,同时降低通信成本并确保实现合理的数据隐私保护,保留了Jha等在计算集群中心的步骤中,考虑了隐私保护而提出的了两种隐私保护方案:一种基于遗忘多项式评估,另一种基于同态加密。但是,对应的的方案没有考虑k-means算法中其他关键步骤的隐私信息泄漏。Bunn等中提出了一种两方k均值聚类协议,该协议无需使用中间值即可计算聚类结果。该协议避免了聚类过程中中间值的泄漏。Blum等首次将差分隐私机制引入隐私保护算法,该算法通过向集群中心添加噪声来降低隐私泄露的风险。但是,初始中心点选择的随机性直接影响k-均值聚类的结果。因此,Yang等人提出了一种改进的差分隐私(IDP)k-means算法。改善初始聚类中心的随机选择。同样,熊等提出了一种算法PADC,该算法通过在聚类过程中检测离群值来减少由初始中心随机选择引起的离群值影响。除了基于同态加密和差分隐私的隐私保护k-means聚类算法之外,还讨论了一种在基于区块链的新型数据隐私保护方案,该方案利用了区块链基础架构来消除单点故障。邢等提出了一种相互隐私保护方案,以防止泄露私人信息并有效地抵制共谋攻击。
以上所有工作都有不适用于时效系统。因此,越来越多的学者开始关注时间复杂度低的隐私保护聚类策略。Yu等在中提出了多方k均值聚类方案的隐私保护,这是将并行计算的概念首次应用到聚类过程中,并且其方案中的时间复杂性比以前的工作要好。苗等提出了一种通过双云平台实现来降低通信成本的基于事实发现的轻量级隐私保护框架L-PPTD和L2-PPTD。
现有的隐私保护k-means聚类方案不能在保护聚类中心的隐私的同时保护用户的隐私。而且,大多数方法不能抵抗共谋攻击或具有高时间复杂性。
因此,结合云计算和同态加密的特点,设计出在物联网医疗系统中能够以较低时间复杂性抵御抗共谋攻击且具有保护隐私特点的聚类方案是一个关键问题和挑战,成为本技术领域人员亟待解决的技术课题。
发明内容
本发明的目的在于提供一种物联网医疗系统中增强数据隐私性的数据聚类方法,能够有效保护用户和聚类中心的隐私性,且具有较低的时间复杂度。
本发明采用的技术方案是:
一种物联网医疗系统中增强数据隐私性的数据聚类方法,其包括步骤:
S1、数据分析端接收所有用户的敏感健康数据;
S2、数据分析端通过计算来自不同用户的健康数据与初始化的聚类中心的欧式距离并进行比较,将每个用户分配到对应的最近的聚类;
S3、数据分析端通过第三方云平台计算并统计同一聚类中用户的的私有数据,以确定新的聚类中心。
进一步地,步骤S2在保证参与者隐私的情况下分析者进行聚类的过程为:
S21、数据分析端计算满足(1)式的Cj′-Cj′′的值,然后将Cj′-Cj′′发送给用户;
(Cj′-Cj′′)T(Cj-Cj′)=0,|Cj′-Cj′′|≠0 (1)
其中Cj、Cj′为不同初始化聚类的聚类中心;Cj′-Cj′′为计算不同聚类中心的欧氏距离;
S22、用户在接收到数据分析端发来的Cj′-Cj′′后,根据(2)式计算混淆后的健康数据;
a(i,j,j′)=ai+t(i,j,j′)(Cj′-Cj′′) (2)
其中,ai为用户原始健康数据,t(i,j,j′)是用于干扰Cj′-Cj′′的值并防止ai泄漏的随机数;
S23、用户将混淆后的数据上传至数据分析端,然后数据分析端根据(3)式、(4)式,计算用户与不同聚类中心的欧式距离:
Dij=(a(i,j,j′)-Cj)T(a(i,j,j′)-Cj) (3)
Dij'=(a(i,j,j′)-Cj′)T(a(i,j,j′)-Cj′) (4)
其中,Cj、Cj′分别为不同的聚类中心,Dij表示用户与聚类中心Cj的欧式距离,Dij′表示用户与聚类中心Cj′的欧式距离(望发明人确认下是否正确);
S24、数据分析端根据(5)式计算不同欧式距离之间的差异值Dis;
Dis=Dij-Dij′ (5);
S25、基于差异值Dis判定用户的聚类关系;当差异值小于0,用户更靠近聚类Cj;当差异值大于0,用户更靠近聚类Cj′
S26、遍历所有聚类后,数据分析端可以找出与用户健康数据之间欧氏距离最近的聚类中心。
进一步地,所述步骤S3在保证聚类中心数据隐私情况下新的聚类中心计算的具体过程为:
S31、数据分析端随机生成一个公、私钥对,该公钥将发布给所有用户和第三方云平台,而私钥仅由数据分析端保存;同时数据分析端将与第三方云平台共享有关用户和聚类的关系表,
S32、每位用户生成一个q维度的随机向量ρi,该向量用于再次混淆每位用户的私有数据,那么被混淆的数据ai′表示为:
ai′=aii (6)
然后用户将混淆后的数据上传至第三方云平台;
S33、第三方云平台使用公钥对所有混淆数据进行加密得到密文,且密文由第三方云平台临时保存;
S34、第三方云平台安全地将安全参数r、v下发给用户;
S35、用户收到安全参数之后计算获得加密数据的随机向量Y,并对随机向量Y进行切片后将切片发送给其他用户,用户ai使用其他用户的切片的随机数据组成的新随机数据ρ′:加密数据的随机向量Y的计算公式如下:
Y=E(pk,r*ρ+v) (10)
其中,r的值根据关系表取常数0或1;v是一个q维向量;
S36、每位用户将混淆的随机数据发送到第三方云平台,平台计算出同一聚类中的用户生成的随机数据的总和;
S37、结合第一阶段加密的混淆健康数据,第三方云平台对同一聚类中所有用户的数据总和进行加密;然后第三方云平台将加密数据发送给数据分析端,数据分析端通过私钥及同态加密性质解密密文;
S38、数据分析端通过接收到数据计算新的聚类中心;
S39、重复S34至S38,直到遍历所有聚类。
进一步地,S34中安全参数
Figure BDA0002641687390000041
Figure BDA0002641687390000042
r的值根据关系表取常数0或1;
其中,
Figure BDA0002641687390000043
满足(7)式:
Figure BDA0002641687390000044
其中,|ci|表示第i个聚类中心中参与者的数量;
Figure BDA0002641687390000045
的值根据关系表取常数0或1;Π为累积乘法运算;
其他参数
Figure BDA0002641687390000046
满足(8)式:
Figure BDA0002641687390000047
其中,j表示不同聚类中心的数量;|ci|表示第i个聚类中心中参与者的数量;r1 k的值根据关系表取常数0或1;∑为累积求和运算;
v是一个q维向量,
Figure BDA0002641687390000048
满足(9)式:
Figure BDA0002641687390000049
其中,j表示不同聚类中心的数量;|ci|表示第i个聚类中心中参与者的数量;
Figure BDA00026416873900000410
为一个q维向量;∑为累积求和运算。
进一步地,S35中对随机向量Y进行切片方法为:设密文Y随机分为m个部分,其余选择m-1个发送给其他用户;其中m个部分满足1<m<n且
Figure BDA00026416873900000411
望发明人上述各个参数的含义。
进一步地,S36中聚类中的随机数据之和表示为:
Figure BDA00026416873900000412
其中ρj,l′表示第j个聚类中的第l个用户的新组成数据,其中1≤l≤n,1≤j≤k;
Figure BDA00026416873900000413
代表从其他用户接收的切片以及自己保存的切片。
进一步地,S37中结合加密的混淆数据第三方云平台对同一聚类中所有用户的数据总和进行加密,表达式如下:
Figure BDA0002641687390000051
然后第三方云平台将加密数据
Figure BDA0002641687390000052
发送给数据分析端,数据分析A通过私钥pr及同态加密性质解密密文。
进一步地,S38、中新的聚类中心Ct表示为
Figure BDA0002641687390000053
本发明的有益效果在于:(1)在数据分析端将用户分配至对应聚类中心时,保证用户的私有健康数据和聚类中心的特征信息不被泄露。(2)数据分析端在计算新的聚类中心时,新聚类中心的隐私数据不被泄露给任何一个在该聚类中的用户。(3)通过引入第三方云平台降低了系统的时间复杂度。(4)可以抵抗共谋攻击。
附图说明
以下结合附图和具体实施方式对本发明做进一步详细说明;
图1为本发明实施例的一种增强数据隐私性的数据聚类方法的流程图;
图2为本发明的架构原理示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图对本申请实施例中的技术方案进行清楚、完整地描述。本发明最关键的构思在于:在物联网医疗系统中,综合引入第三方云平台、同态加密,实现了保护用户数据隐私的聚类。
如图1或图2所示,本发明公开了一种物联网医疗系统中增强数据隐私性的数据聚类方法,所定义的网络模型如下:在物联网医疗系统模型中,每位用户ai都将维护一组关于自身健康情况的数据ai(如:血压、心率等),用来了解自身的健康状况;数据分析端A可以通过对不同用户的健康情况数据进行相关性分析,根据分析结果对用户进行分类;第三方云平台PT用于降低系统时间复杂度,提高计算能力;Cj表示共有k个不同的聚类中心。
如图2所示,物联网医疗系统中增强数据隐私性的数据聚类方法,包括步骤:
S1、用户初始化处理自己的健康数据,数据分析端A接收所有用户提交的处理后的数据。
S2、数据分析端通A过计算来自不同用户ai的健康数据与初始化的聚类中心的欧式距离并进行比较,将每个用户分配到他们最近的聚类。所述步骤S2具体包括:
S21、数据分析端A计算满足(1)式的Cj′-Cj′′的值,然后将Cj′-Cj′′发送给用户ai。其中Cj、Cj′为不同初始化聚类的聚类中心,Cj′-Cj为计算不同聚类中心的欧氏距离。
(Cj′-Cj′′)T(Cj-Cj′)=0,|Cj′-Cj′′|≠0 (1)
S22、用户ai在接收到数据分析端A发来的Cj′-Cj′′后,计算混淆后的健康数据。
a(i,j,j′)=ai+t(i,j,j′)(Cj′-Cj′′) (2)
其中,ai为用户原始健康数据,t(i,j,j′)是用于干扰Cj′-Cj′′的值并防止ai泄漏的随机数。
S23、用户ai将a(i,j,j′)上传至数据分析端A,然后数据分析端A根据根据(3)式、(4)式,计算用户与不同聚类中心的欧式距离:
Dij=(a(i,j,j′)-Cj)T(a(i,j,j′)-Cj) (3)
Dij′=(a(i,j,j′)-Cj′)T(a(i,j,j′)-Cj′) (4)
其中,Cj,Cj′为不同的聚类中心。
S24、数据分析端A根据(5)式计算不同欧式距离之间的差异值。Dis=Dij-Dij′ (5)
S25、Dis<0,用户ai更靠近聚类Cj;Dis>0,用户更靠近聚类Cj′
S26、遍历所有聚类后,数据分析端可A以找出与用户ai健康数据之间欧氏距离最近的聚类中心。
S3、数据分析端通A过第三方云平台PT计算并统计同一聚类中用户的私有数据,以确定新的聚类中心。所述步骤S3具体包括:
S31、数据分析端A随机生成一个公、私钥对(pk,pr)。该公钥将发布给所有用户和第三方云平台PT,而私钥仅由数据分析端A保存。同时数据分析端A将与第三方云平台PT共享有关用户和聚类信息的关系表,如表1所示:
表1
Figure BDA0002641687390000061
Figure BDA0002641687390000071
其中
Figure BDA0002641687390000072
表示第j聚类中的第i个用户。
S32、用户ai生成一个q维的随机向量ρi,该向量用于再次混淆用户的私有数据。那么被混淆的数据ai′可以表示为(6):
ai′=aii (6)
然后用户ai将混淆后的数据上传至第三方云平台PT
S33、第三方云平台PT使用公钥对所有混淆数据进行加密,并且密文E(ai′),并且密文由第三方云平台PT临时保存
S34、第三方云平台PT安全地将参数
Figure BDA0002641687390000073
Figure BDA0002641687390000074
发送给用户ai。r的值可以根据关系表取常数0或1。
其中,
Figure BDA0002641687390000075
满足(7)式:
Figure BDA0002641687390000076
其中,|ci|表示第i个聚类中心中参与者的数量;
Figure BDA0002641687390000077
的值根据关系表取常数0或1;∏为累积乘法运算;
其他参数
Figure BDA0002641687390000078
满足(8)式:
Figure BDA0002641687390000079
其中,j表示不同聚类中心的数量;|ci|表示第i个聚类中心中参与者的数量;r1 k的值根据关系表取常数0或1;∑为累积求和运算;
v是一个q维向量,
Figure BDA00026416873900000710
满足(9)式:
Figure BDA00026416873900000711
其中,j表示不同聚类中心的数量;|ci|表示第i个聚类中心中参与者的数量;
Figure BDA00026416873900000712
为一个q维向量;∑为累积求和运算。
S35、在用户ai收到r和v之后,计算r*ρ+v的值,获得加密后的随机向量如(10)式所示:
Y=E(pk,r*ρ+v) (10)
r的值根据关系表取常数0或1;v是一个q维向量;ρ为一个q维度的随机向量;E(·)为加密操作;pk为公钥;
并且用户ai应与其他用户共享自己的一部分。假设密文Y随机分为m个部分,其余选择m-1个发送给其他用户。其中m个部分满足1<m<n且
Figure BDA0002641687390000081
所有用户完成数据切片,并将切片发送给其他用户。完成后,用户ai使用其他用户的切片的随机数据组成的新随机数据ρ′。
S36、所有用户分别将ρ′发送到第三方云平台PT。平台PT可以计算出同一聚类中的用户生成的随机数据的总和。聚类中的随机数据之和可以表示为:
Figure BDA0002641687390000082
其中ρj,l′表示第j个聚类中的第l个用户的新组成数据,其中1≤l≤n,1≤j≤k。
Figure BDA0002641687390000083
代表从其他用户接收的切片,以及自己保存的切片。
S37、结合第一阶段加密的混淆数据,第三方云平台PT可以对同一聚类中所有用户的数据总和进行加密,如下。
Figure BDA0002641687390000084
然后第三方云平台PT将加密数据
Figure BDA0002641687390000085
发送给数据分析端A,数据分析端A通过私钥pr及同态加密性质解密密文。
S38、数据分析端通过接收到数据计算新的聚类中心,则新的聚类中心Ct表示为
Figure BDA0002641687390000086
S39、重复S34至S38,直到遍历所有聚类。
综上所述,本发明具有以下有益效果:
(1)在数据分析端将用户分配至对应聚类中心时,保证用户的私有健康数据和聚类中心的特征信息不被泄露。
数据分析端无法获得用户所生成的用于混淆健康数据的随机数,所以数据分析端无法通过现有的知识无法计算、还原出每位用户的健康数据。
第三方云平台除了关于用户和聚类的关系表之外,它仅知道混淆后需要加密数据的明文、密文和经过处理的随机混淆向量。由于私有密钥仅由数据分析端知道,因此第三方云平台无法解密密文,也无法获得原始随机向量的任何信息。由于用于加密的数据是通过用户生成的随机向量混淆后的数据,因此第三方云平台无法计算出用户原始数据。
(2)数据分析端在计算新的聚类中心时,新聚类中心的隐私数据不被泄露给任何一个在该聚类中的用户。
对于用户来说,除了用户本身的隐私健康数据和自行生成的随机向量外,每位用户还知道其他用户分发的密文切片。可以计算从其他用户接收到的数据切片和自身保存的部分数据切片的总和。但是,基于这些值,每位用户也都无法计算出有关其他用户的隐私健康数据以及其他用户所属的聚类中心的任何信息。
(3)可以抵抗共谋攻击。
数据分析端与用户之间的共谋:假设系统中有n个用户,有n-1个用户与数据分析端共谋以推断剩余参与者ai的信息。尽管数据分析端知道用户与n-1个参与者的集群,私有信息之间的关系表,但它无法推断ai的信息,因为数据分析端只能接收同一集群中所有用户混淆数据的加密结果,无法推断出更多信息。
用户之间的共谋:如果有n-1个用户共谋,则它仍无法推断出有关集群中心的任何信息,因为共谋中的n-1个用户,不知道其余用户所在的聚类。
(4)通过引入第三方云平台提高了整个系统的计算能力,同时降低了系统的时间复杂度。
显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

Claims (2)

1.一种物联网医疗系统中增强数据隐私性的数据聚类方法,其特征在于:其包括步骤:
S1、数据分析端接收所有用户的敏感健康数据;
S2、数据分析端通过计算来自不同用户的健康数据与初始化的聚类中心的欧式距离并进行比较,将每个用户分配到对应的最近的聚类;步骤S2在保证参与者隐私的情况下分析者进行聚类的过程为:
S21、数据分析端计算满足(1)式的Cj′-Cj′′的值,然后将Cj′-Cj′′发送给用户;
(Cj′-Cj′′)T(Cj-Cj′)=0,|Cj′-Cj′′|≠0 (1)
其中Cj、Cj'为不同初始化聚类的聚类中心;Cj′-Cj′′为计算不同聚类中心的欧氏距离;
S22、用户在接收到数据分析端发来的Cj′-Cj′′后,根据(2)式计算混淆后的健康数据;
a(i,j,j′)=ai+t(i,j,j′)(Cj′-Cj′′) (2)
其中,ai为用户原始健康数据,t(i,j,j′)是用于干扰Cj′-Cj′′的值并防止ai泄漏的随机数;
S23、用户将混淆后的数据上传至数据分析端,然后数据分析端根据(3)式、(4)式,计算用户与不同聚类中心的欧式距离:
Dij=(a(i,j,j′)-Cj)T(a(i,j,j′)-Cj) (3)
Dij'=(a(i,j,j′)-Cj′)T(a(i,j,j′)-Cj′) (4)
其中,Cj、Cj'分别为不同的聚类中心,Dij表示用户与聚类中心Cj的欧式距离,Dij'表示用户与聚类中心Cj'的欧式距离;
S24、数据分析端根据(5)式计算不同欧式距离之间的差异值Dis;
Dis=Dij-Dij' (5);
S25、基于差异值Dis判定用户的聚类关系;当差异值小于0,用户更靠近聚类Cj;当差异值大于0,用户更靠近聚类Cj'
S26、遍历所有聚类后,数据分析端可以找出与用户健康数据之间欧氏距离最近的聚类中心;
S3、数据分析端通过第三方云平台计算并统计同一聚类中用户的的私有数据,以确定新的聚类中心;步骤S3在保证聚类中心数据隐私情况下新的聚类中心计算的具体过程为:
S31、数据分析端随机生成一个公、私钥对,该公钥将发布给所有用户和第三方云平台,而私钥仅由数据分析端保存;同时数据分析端将与第三方云平台共享有关用户和聚类的关系表,
S32、每位用户生成一个q维度的随机向量ρi,该向量用于再次混淆每位用户的私有数据,那么被混淆的数据ai'表示为:
ai'=aii (6)
然后用户将混淆后的数据上传至第三方云平台;
S33、第三方云平台使用公钥对所有混淆数据进行加密得到密文,且密文由第三方云平台临时保存;
S34、第三方云平台安全地将安全参数r、v下发给用户;设定S34中安全参数
Figure FDA0003757621820000021
Figure FDA0003757621820000022
其中Rj是一个集合,r是其中的元素,r的值根据关系表取常数0或1;
其中,
Figure FDA0003757621820000023
满足(7)式:
Figure FDA0003757621820000024
其中,|ci|表示第i个聚类中心中参与者的数量;
Figure FDA0003757621820000025
的值根据关系表取常数0或1;П为累积乘法运算;
其他参数
Figure FDA0003757621820000026
满足(8)式:
Figure FDA0003757621820000027
其中,j表示不同聚类中心的数量;|ci|表示第i个聚类中心中参与者的数量;
Figure FDA0003757621820000028
的值根据关系表取常数0或1;∑为累积求和运算;
v是一个q维向量,
Figure FDA0003757621820000029
满足(9)式:
Figure FDA00037576218200000210
其中,j表示不同聚类中心的数量;|ci|表示第i个聚类中心中参与者的数量;
Figure FDA00037576218200000211
为一个q维向量;∑为累积求和运算;
S35、用户收到安全参数之后计算r*ρ+v的值,获得加密数据Y,将加密数据Y随机分为m个部分,其余选择m-1个发送给其他用户,其中m个部分满足1<m<n且
Figure FDA00037576218200000212
加密数据Y的计算如下式
Y=E(pk,r*ρ+v) (10)
其中,r的值根据关系表取常数0或1;v是一个q维向量;ρ为一个q维度的随机向量;E(·)为加密操作;pk为公钥;
S36、每位用户将混淆的随机数据发送到第三方云平台,平台计算出同一聚类中的用户生成的随机数据的总和;S36中聚类中的随机数据之和表示为:
Figure FDA0003757621820000031
S37、结合第一阶段加密的混淆健康数据,第三方云平台对同一聚类中所有用户的数据总和进行加密;然后第三方云平台将加密数据发送给数据分析端,数据分析端通过私钥及同态加密性质解密密文;S37中结合加密的混淆数据第三方云平台对同一聚类中所有用户的数据总和进行加密,表达式如下:
Figure FDA0003757621820000032
然后第三方云平台将加密数据
Figure FDA0003757621820000033
发送给数据分析端,数据分析A通过私钥pr及同态加密性质解密密文;
S38、数据分析端通过接收到数据计算新的聚类中心;
S39、重复S34至S38,直到遍历所有聚类。
2.根据权利要求1所述的一种物联网医疗系统中增强数据隐私性的数据聚类方法,其特征在于:S38、中新的聚类中心Ct表示为
Figure FDA0003757621820000034
CN202010841749.4A 2020-08-20 2020-08-20 一种物联网医疗系统中增强数据隐私性的数据聚类方法 Active CN111951918B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010841749.4A CN111951918B (zh) 2020-08-20 2020-08-20 一种物联网医疗系统中增强数据隐私性的数据聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010841749.4A CN111951918B (zh) 2020-08-20 2020-08-20 一种物联网医疗系统中增强数据隐私性的数据聚类方法

Publications (2)

Publication Number Publication Date
CN111951918A CN111951918A (zh) 2020-11-17
CN111951918B true CN111951918B (zh) 2022-09-06

Family

ID=73358572

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010841749.4A Active CN111951918B (zh) 2020-08-20 2020-08-20 一种物联网医疗系统中增强数据隐私性的数据聚类方法

Country Status (1)

Country Link
CN (1) CN111951918B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113591154B (zh) * 2021-10-08 2022-02-15 青岛美迪康数字工程有限公司 诊疗数据去标识化方法、装置及查询系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102469145A (zh) * 2010-11-19 2012-05-23 岑澔 一种基于云计算的体质健康管理系统
CN104680076A (zh) * 2013-11-27 2015-06-03 埃森哲环球服务有限公司 用于使受保护健康信息匿名化和聚集的系统
CN106650205A (zh) * 2016-09-28 2017-05-10 西安电子科技大学 一种高效隐私保护的云医疗数据监护系统及监护方法
CN109584978A (zh) * 2018-10-26 2019-04-05 西安邮电大学 基于签名聚合医疗健康监控网络模型信息处理方法及系统
EP3505042A1 (en) * 2017-12-28 2019-07-03 Ethicon LLC Communication hub and storage device for storing parameters and status of a surgical device to be shared with cloud based analytics systems
CA3042660A1 (en) * 2018-05-11 2019-11-11 Michigan Health Information Network Shared Services Systems and methods for managing data privacy
EP3579241A1 (en) * 2018-06-08 2019-12-11 Siemens Healthcare GmbH Method of managing medical records

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102469145A (zh) * 2010-11-19 2012-05-23 岑澔 一种基于云计算的体质健康管理系统
CN104680076A (zh) * 2013-11-27 2015-06-03 埃森哲环球服务有限公司 用于使受保护健康信息匿名化和聚集的系统
CN106650205A (zh) * 2016-09-28 2017-05-10 西安电子科技大学 一种高效隐私保护的云医疗数据监护系统及监护方法
EP3505042A1 (en) * 2017-12-28 2019-07-03 Ethicon LLC Communication hub and storage device for storing parameters and status of a surgical device to be shared with cloud based analytics systems
CA3042660A1 (en) * 2018-05-11 2019-11-11 Michigan Health Information Network Shared Services Systems and methods for managing data privacy
EP3579241A1 (en) * 2018-06-08 2019-12-11 Siemens Healthcare GmbH Method of managing medical records
CN109584978A (zh) * 2018-10-26 2019-04-05 西安邮电大学 基于签名聚合医疗健康监控网络模型信息处理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Xuancheng Guo etc."A Data Clustering Strategy for Enhancing Mutual Privacy in Healthcare System of IoT".《IEEE》.2019,521-525页. *

Also Published As

Publication number Publication date
CN111951918A (zh) 2020-11-17

Similar Documents

Publication Publication Date Title
WO2021227241A1 (zh) 智能电网中抗密钥泄露的加密数据聚合的统计分析方法
CN110536259B (zh) 一种基于雾计算的轻量级隐私保护数据多级聚合方法
US8880867B2 (en) Fault-tolerant privacy-preserving statistics
CN109474928B (zh) 在移动群智感知系统中实现高效隐私保护的真值发现方法
CN110233730A (zh) 一种基于k均值聚类的隐私信息保护方法
Patel et al. Privacy preserving distributed k-means clustering in malicious model using zero knowledge proof
Gao et al. Location privacy-preserving truth discovery in mobile crowd sensing
Lyu et al. Privacy-preserving aggregation of smart metering via transformation and encryption
CN111951918B (zh) 一种物联网医疗系统中增强数据隐私性的数据聚类方法
CN111581648B (zh) 在不规则用户中保留隐私的联邦学习的方法
Tang et al. Achieve privacy-preserving truth discovery in crowdsensing systems
Barletta et al. Privacy preserving smart grid communications by verifiable secret key sharing
CN114465708B (zh) 隐私数据处理方法及装置、系统、电子设备、存储介质
Ranbaduge et al. Secure multi-party summation protocols: Are they secure enough under collusion?
Yan et al. Privacy-preserving and customization-supported data aggregation in mobile crowdsensing
CN114640436A (zh) 一种基于隐私保护的分组统计参数计算方法、装置
CN106211149A (zh) 基于主成分分析的信道互易性增强方法
Huang et al. EFMVFL: an efficient and flexible multi-party vertical federated learning without a third party
CN108880782A (zh) 一种云计算平台下最小值的保密计算方法
CN113949501A (zh) 一种基于半同态加密的横向分布式pca降维方法
CN114900283A (zh) 基于多方安全计算的深度学习用户梯度聚合方法
Yang et al. INAKA: Improved authenticated key agreement protocol based on newhope
Bose et al. A Fully Decentralized Homomorphic Federated Learning Framework
Guo et al. A data clustering strategy for enhancing mutual privacy in healthcare system of iot
He et al. PMDA: privacy-preserving multi-functional data aggregation without TTP in smart grid

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant