CN113468553B - 一种面向工业大数据的隐私保护分析系统及方法 - Google Patents

一种面向工业大数据的隐私保护分析系统及方法 Download PDF

Info

Publication number
CN113468553B
CN113468553B CN202110612991.9A CN202110612991A CN113468553B CN 113468553 B CN113468553 B CN 113468553B CN 202110612991 A CN202110612991 A CN 202110612991A CN 113468553 B CN113468553 B CN 113468553B
Authority
CN
China
Prior art keywords
matching
cloud server
mcs
acs
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110612991.9A
Other languages
English (en)
Other versions
CN113468553A (zh
Inventor
张明武
张依梦
刘白
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei University of Technology
Original Assignee
Hubei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Technology filed Critical Hubei University of Technology
Priority to CN202110612991.9A priority Critical patent/CN113468553B/zh
Publication of CN113468553A publication Critical patent/CN113468553A/zh
Application granted granted Critical
Publication of CN113468553B publication Critical patent/CN113468553B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0861Generation of secret information including derivation or calculation of cryptographic keys or passwords
    • H04L9/0869Generation of secret information including derivation or calculation of cryptographic keys or passwords involving random numbers or seeds

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Abstract

本发明公布了一种面向工业大数据的隐私保护分析系统及方法,系统由询问用户QU、匹配云服务器MCS和辅助云服务器ACS三个角色组成。本发明具体分析社交推荐中用户享受信息匹配服务时的数据隐私保护问题,通过将信息匹配过程外包给云服务器,并利用HRES同态重加密算法和OU同态加密算法来实现安全的外包云计算。本发明选择基于马氏距离分类技术进行信息匹配提高了匹配准确度,同时外包云计算也为用户减少了计算和通信上的开销。

Description

一种面向工业大数据的隐私保护分析系统及方法
技术领域
本发明属于工业大数据的数据分析领域,具体涉及面向工业大数据的隐私保护分析方法。特别地,考虑在不泄露信息的前提下,针对用户的特征需求,为其提供匹配度高的好友的方法。
背景技术
目前,随着工业大数据中的信息多样化以及云计算技术的普及,对用户信息的隐私保护研究愈发重要,例如工业大数据中的社交领域。由于社交网络的复杂性,用户个人信息的暴露可能被恶意利用而对用户造成困扰。同时,移动智能设备是当代热门通信工具之一,用户倾向于利用个人的智能设备进行网上交友,希望通过输入个人的兴趣爱好等特征信息,来被推荐与自己兴趣爱好相似度较高的好友群。已存在的交友App具备为用户提供各种匹配或推荐的服务,但是未考虑到用户的隐私安全问题。另外,在基于相似度的信息匹配问题中,用户各特征间的联系通常需要考虑在内。基于以上,如何为用户提供相似度较高的好友匹配服务,且保证其数据隐私,同时考虑用户的计算和通信开销,是本发明关注的重点问题。
发明内容
本发明定位于工业大数据中的社交推荐领域,考虑到用户信息不被泄露,同时提高信息匹配度,提供了一种工业大数据中的隐私保护分析系统及方法,具体涉及一种社交推荐中隐私保护的用户信息匹配系统及方法。
为提高用户信息匹配度,本发明考虑基于相似度计算来完成信息匹配过程。由于马氏距离计算中引入协方差矩阵,考虑到特征向量中各维特征间的联系,本发明基于马氏距离分类进行用户信息匹配。
本发明的系统所采用的技术方案是:一种面向工业大数据的隐私保护分析系统,包括询问用户QU、匹配云服务器MCS和辅助云服务器ACS;
所述询问用户QU是拥有智能设备的用户,与匹配云服务器MCS直接交互,即提供想要匹配的好友特征信息或自己的特征信息(特征向量)给匹配云服务器MCS,希望匹配到兴趣爱好相似度高于预设值的好友群;
所述匹配云服务器MCS是指拥有匹配模型(即分类模型)的云服务器,接收询问用户QU的匹配请求,对于询问用户QU提供的特征向量(特征信息),根据匹配模型计算得到相似度最高的一类好友;
所述辅助云服务器ACS是指提供辅助计算的云服务器,只与所述匹配云服务器MCS进行交互,辅助所述匹配云服务器MCS计算得到匹配结果;
所述信息匹配,是指基于马氏距离分类的信息匹配计算,具体指基于已有的匹配模型计算得到马氏距离,将用户的待匹配特征向量归于马氏距离最小值所对应的一类好友中。
本发明的方法所采用的技术方案是:一种面向工业大数据的隐私保护分析方法,根据已收集的真实d维用户特征向量集DB,将其分为K个不同类别的特征数据集DB=(DB1,DB2,…,DBK),其类标签记为T=(T1,T2,…,TK),分别计算DBi的协方差矩阵Si和均值向量μi,(Sii)即为匹配模型;且其对应的类标签为Ti,i=1,2,…,K;j=1,2,…,d,给定用户的d维待匹配特征向量(即待分类特征向量)X=(x1,x2,...,xd),计算X与DBi间的马氏距离MDi,比较K个马氏距离,最小马氏距离值MD(min)对应的类标签T(min)即为匹配结果,即为用户推荐类标签为T(min)的好友群;
所述方法具体包括以下步骤:
步骤1:系统初始化;
具体实现包括以下子步骤:
步骤1.1:询问用户QU发送注册请求给可信方TP,发送IDQU给可信方TP;可信方TP计算HQU,并根据系统安全参数为询问用户QU生成一对OU加密算法公私钥对(pkQU,skQU),将skQU发送给询问用户QU,公开pkQU;其中,IDQU表示QU的身份、HQU是利用QU的身份生成的独一无二的哈希值,可以防止QU在步骤2中发送的请求时身份被伪造;
步骤1.2:根据系统安全参数,可信方TP生成HRES的相关参数(N0,p0,q0,g0),将(N0,g0,N,HQU)发送给匹配云服务器MCS,将(N0,g0)发送给辅助云服务器ACS;其中,N0=p0q0,p0、q0是两个大素数,G是
Figure BDA0003096733540000031
的二次剩余循环群,g0是群G的最大阶,N是TP在计算HQU时选的随机数。为了步骤3中MCS对QU身份的验证。
步骤1.3:匹配云服务器MCS和辅助云服务器ACS共同执行下述算法1,生成各自的HRES公私钥对(pkMCS,skMCS)、(pkACS,skACS)以及主公钥pk′;
所述算法1:匹配云服务器MCS输入:随机数
Figure BDA0003096733540000032
辅助云服务器ACS输入:随机数
Figure BDA0003096733540000033
然后执行下述步骤:
(1)匹配云服务器MCS计算
Figure BDA0003096733540000034
将y1发送给辅助云服务器ACS;
(2)辅助云服务器ACS计算
Figure BDA0003096733540000035
将y2发送给匹配云服务器MCS;
(3)匹配云服务器MCS计算
Figure BDA0003096733540000036
(4)辅助云服务器ACS计算
Figure BDA0003096733540000037
(5)匹配云服务器MCS得到公私钥对(pkMCS=ga,skMCS=a),辅助云服务器ACS得到公私钥对(pkACS=gb,skACS=b),共同得到主公钥pk′,并公开pk′;
步骤1.4:匹配云服务器MCS根据匹配模型(Sii),预计算逆矩阵
Figure BDA0003096733540000038
步骤2:询问用户QU将自己的特征信息X发送给匹配云服务器MCS,请求匹配;
步骤3:匹配云服务器MCS根据自己的匹配模型(Sii),计算用户的特征信息X与匹配模型间的K个马氏距离,比较该K个马氏距离,得到最小马氏距离对应的类标签T(min),即为用户计算的匹配结果,表示为用户推荐T(min)类别的好友;
步骤4:匹配结果返回。
本发明方法与现有的技术相比有如下的优点和有益效果:
本发明分析工业大数据中用户的隐私保护问题,提供了一种社交推荐中隐私保护的用户信息匹配方案,在确保用户信息不泄露的情况下,为其提供好友匹配服务,推荐相似度较高的好友群。方案中用户具有低的计算和通信开销,且实用性高。用户QU将提供想匹配的特征信息或自己的特征信息,发送给拥有匹配模型的MCS。MCS与ACS在确保QU的特征信息以及匹配模型不泄露的情况下共同计算得到加密的匹配结果,且匹配结果仅能由QU解密所得。现有的信息匹配方案中,主要涉及两个问题,一是信息匹配过程中未考虑用户的隐私安全问题;二是在考虑基于相似度的信息匹配过程中,未考虑到用户数据各特征间的联系,匹配度相对较低。本发明考虑马氏距离的计算特性,设计基于马氏距离分类的用户信息匹配方案。结合同态加密算法,具体实现包括隐私保护的马氏距离计算以及密文上的马氏距离比较。
本发明中,敌手通过窃听QU与MCS以及MCS与ACS间的通信信道,无法获取任何有关QU的请求以及MCS的匹配模型的信息;QU和ACS根据自己所得信息也无法推断出匹配模型相关信息;MCS和ACS仅能获得加密的匹配结果。因此,方案具有较高的安全性。同时,结合云计算技术,主要的信息匹配过程由MCS和ACS完成,降低了用户的计算开销和通信开销。
附图说明
图1:本发明实施例的系统原理图;
图2:本发明实施例的系统初始化流程图;
图3:本发明实施例的用户匹配请求流程图;
图4:本发明实施例的隐私保护的信息匹配计算流程图;
图5:本发明实施例的匹配信息返回流程图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种面向工业大数据的隐私保护分析系统,包括询问用户QU、匹配云服务器MCS和辅助云服务器ACS;
询问用户QU是拥有智能设备的用户,与匹配云服务器MCS直接交互,即提供想要匹配的好友特征信息或自己的特征信息(特征向量)给匹配云服务器MCS,希望匹配到兴趣爱好相似度较高的好友群;
匹配云服务器MCS是指拥有匹配模型(即分类模型)的云服务器,接收询问用户QU的匹配请求,对于询问用户QU提供的特征向量,根据匹配模型计算得到相似度最高的一类好友;
辅助云服务器ACS是指提供辅助计算的云服务器,只与匹配云服务器MCS进行交互,辅助匹配云服务器MCS计算得到匹配结果;
信息匹配,是指基于马氏距离分类的信息匹配计算,具体指基于已有的匹配模型计算得到马氏距离,将用户的待匹配特征向量归于马氏距离最小值所对应的一类好友中。
为提高用户信息匹配度,本发明考虑基于相似度计算来完成信息匹配过程。由于马氏距离计算中引入协方差矩阵,考虑到特征向量中各维特征间的联系,本发明基于马氏距离分类进行用户信息匹配。
社交推荐中隐私保护的用户信息匹配方法即归结于基于马氏距离的用户信息分类方案。具体描述如下:假设MCS拥有匹配(分类)模型(Sii)(i=1,2,...,K),其中Si是由大量服从高斯分布的真实样本集DBi计算的d行d列协方差矩阵,μi是由DBi所得的d维均值向量,Ti是DBi的类标签。存在请求用户QU拥有d维待匹配(待分类)特征向量X=(x1,x2,...,xd)。基于马氏距离的用户信息分类方案即对于QU输入的特征向量X,计算X和(Sii)间的马氏距离MDi(计算公式如式(1)),并且比较该K个马氏距离得到马氏距离最小值MD(min),最小值所对应的类标签即为QU所匹配的类别,记为T(min)
为方便计算,本方案转化为计算马氏距离平方值
Figure BDA0003096733540000051
(如式(2))。
Figure BDA0003096733540000052
Figure BDA0003096733540000053
请见图2-图5,本发明提供的一种面向工业大数据的隐私保护分析方法,具体包括以下步骤:
步骤1:系统初始化;
请见图2,本实施例具体实现包括以下子步骤:
步骤1.1:询问用户QU发送注册请求给可信方TP,发送IDQU给可信方TP;可信方TP计算HQU,并根据系统安全参数为询问用户QU生成一对OU加密算法公私钥对(pkQU,skQU),将skQU发送给询问用户QU,公开pkQU;其中,IDQU表示QU的身份、HQU是利用QU的身份生成的独一无二的哈希值,可以防止QU在步骤2中发送的请求时身份被伪造;
步骤1.2:根据系统安全参数,可信方TP生成HRES的相关参数(N0,p0,q0,g0),将(N0,g0,N,HQU)发送给匹配云服务器MCS,将(N0,g0)发送给辅助云服务器ACS;其中,N0=p0q0,p0、q0是两个大素数,G是
Figure BDA0003096733540000061
的二次剩余循环群,g0是群G的最大阶,N是TP在计算HQU时选的随机数。为了步骤3中MCS对QU身份的验证;
步骤1.3:匹配云服务器MCS和辅助云服务器ACS共同执行下述算法1,生成各自的HRES公私钥对(pkMCS,skMCS)、(pkACS,skACS)以及主公钥pk′;
算法1:匹配云服务器MCS输入:随机数
Figure BDA0003096733540000062
辅助云服务器ACS输入:随机数
Figure BDA0003096733540000063
然后执行下述步骤:
(1)匹配云服务器MCS计算
Figure BDA0003096733540000064
将y1发送给辅助云服务器ACS;
(2)辅助云服务器ACS计算
Figure BDA0003096733540000065
将y2发送给匹配云服务器MCS;
(3)匹配云服务器MCS计算
Figure BDA0003096733540000066
(4)辅助云服务器ACS计算
Figure BDA0003096733540000067
(5)匹配云服务器MCS得到公私钥对(pkMCS=ga,skMCS=a),辅助云服务器ACS得到公私钥对(pkACS=gb,skACS=b),共同得到主公钥pk′,并公开pk′;
步骤1.4:匹配云服务器MCS根据匹配模型(Sii),预计算逆矩阵
Figure BDA0003096733540000068
步骤2:询问用户QU将自己的特征信息X发送给匹配云服务器MCS,请求匹配;
请见图3,本实施例步骤2的具体实现包括以下子步骤:
步骤2.1:询问用户QU输入特征信息X,并用pk′加密得到
Figure BDA0003096733540000071
步骤2.2:将
Figure BDA0003096733540000072
发送给匹配云服务器MCS,请求匹配。
步骤3:匹配云服务器MCS根据自己的匹配模型(Sii),计算用户的特征信息X与匹配模型间的K个马氏距离,比较该K个马氏距离,得到最小马氏距离对应的类标签T(min),即为用户计算的匹配结果,表示为用户推荐T(min)类别的好友;
请见图4,本实施例具体实现包括以下子步骤:
步骤3.1:根据询问用户QU发送的ID′QU计算H′QU并判断
Figure BDA0003096733540000073
若相等,则进行步骤3.2;反之终止请求服务;H′QU=H(H(ID′QU)||N),HQU=H(H(IDQU)||N),HQU是TP根据QU发送给它的IDQU而计算得到的哈希值,H′QU是MCS根据QU发送给它的ID′QU而计算得到的哈希值,主要是为了验证QU发送给MCS的身份有没有被篡改;
步骤3.2:匹配云服务器MCS根据自己的匹配模型(Sii),计算用户的特征信息X与匹配模型间的K个马氏距离;
步骤3.2的具体实现包括以下子步骤:
步骤3.2.1:由匹配模型(Sii),计算
Figure BDA0003096733540000074
并用pk′进行加密得
Figure BDA0003096733540000075
其中,μi是匹配模型中Si对应的样本集的样本均值向量,而μij和μjk是第i类样本均值向量中的任意两维均值,aijk
Figure BDA0003096733540000076
中对应的第i行第i列的元素,
Figure BDA0003096733540000077
是矩阵Si的逆矩阵;
由询问用户QU发送的
Figure BDA0003096733540000078
以及HRES算法的同态性,计算
Figure BDA0003096733540000081
Figure BDA0003096733540000082
步骤3.2.2:匹配云服务器MCS和辅助云服务器ACS共同执行下述算法2,计算
Figure BDA0003096733540000083
Figure BDA0003096733540000084
算法2:匹配云服务器MCS输入:
Figure BDA0003096733540000085
辅助云服务器ACS输入(pkACS,skACS);然后执行下述步骤:
(1)匹配云服务器MCS选择d个随机数
Figure BDA0003096733540000086
计算
Figure BDA0003096733540000087
Figure BDA0003096733540000088
Figure BDA0003096733540000089
Figure BDA00030967335400000810
Figure BDA00030967335400000811
Figure BDA00030967335400000812
Figure BDA00030967335400000813
其中,
Figure BDA00030967335400000814
表示范围{0,1,…,N0-1}内的任意一个整数;ri是加密xi时在范围[1,N0/4]内任意选的随机整数;zi是在加密bi时选择的随机数,和ri一样。
(2)匹配云服务器MCS利用skMCS
Figure BDA00030967335400000815
进行第一层解密得到
Figure BDA00030967335400000816
并将
Figure BDA00030967335400000817
发送给辅助云服务器ACS;
Figure BDA00030967335400000818
Figure BDA00030967335400000819
Figure BDA00030967335400000820
(3)辅助云服务器ACS利用skACS
Figure BDA00030967335400000821
进行第二层解密得到x′i=xi+bi
Figure BDA00030967335400000822
Figure BDA00030967335400000823
Figure BDA00030967335400000824
Figure BDA00030967335400000825
上述公式中计算
Figure BDA0003096733540000091
Figure BDA0003096733540000092
是ACS的解密过程,最终计算的m是解密得到的明文,即m=xi+bi;而L是一个函数,该函数是HERS算法中已定义好的函数,即
Figure BDA0003096733540000093
(4)对于j,k=1,2,…,d,辅助云服务器ACS计算xjk=x′j*x′kmodN0,并用pk′加密xjk得到
Figure BDA0003096733540000094
Figure BDA0003096733540000095
发送给匹配云服务器MCS;
Figure BDA0003096733540000096
步骤3.2.3:由HRES的同态性,匹配云服务器MCS计算
Figure BDA0003096733540000097
K表示类别数;
步骤3.2.4:匹配云服务器MCS用公钥pkQU加密类标签Ti得到[T1],[T2],…,[TK]。
步骤3.3:比较该K个马氏距离,得到最小马氏距离对应的类标签T(min)
具体实现包括以下子步骤:
步骤3.3.1:MCS随机选择一个重排函数f重排
Figure BDA0003096733540000098
和[T],得到
Figure BDA0003096733540000099
Figure BDA00030967335400000910
其中,
Figure BDA00030967335400000911
步骤3.3.2:对于l=1:K,重复下述步骤(1)和步骤(2);
(1)匹配云服务器MCS选择
Figure BDA00030967335400000912
Figure BDA00030967335400000913
重新记为
Figure BDA00030967335400000914
[Ti]和[Tj],并执行下述算法3;
算法3:匹配云服务器MCS输入
Figure BDA00030967335400000915
[Ti]、[Tj],(pkMCS,skMCS);辅助云服务器ACS输入(pkACS,skACS);然后执行下述步骤:
1)匹配云服务器MCS计算:
Figure BDA00030967335400000916
[Tij]=[Ti]*[Tj]N′-1=[Ti-Tj];
2)匹配云服务器MCS利用skMCS
Figure BDA00030967335400000917
进行第一层解密得到
Figure BDA00030967335400000918
并发送给辅助云服务器ACS;
3)辅助云服务器ACS利用密钥skACS
Figure BDA00030967335400000919
进行第二层解密得到解密结果
Figure BDA0003096733540000101
并判断解密结果;
Figure BDA0003096733540000102
Figure BDA0003096733540000103
令ω=0;
Figure BDA0003096733540000104
Figure BDA0003096733540000105
令ω=1;
4)辅助云服务器ACS进行如下计算:
Figure BDA0003096733540000106
[ωTij]=[Tij]ω
其中,
Figure BDA0003096733540000107
表示在K个类别中,待匹配数据X与匹配模型中μi计算得到的马氏距离平方,而i,j则表示K个马氏距离平方中的任意两个值的下标,Ti表示匹配模型(Sii)对应的类标签。
5)辅助云服务器ACS对[ωTij]进行更新操作,即计算:
[ωT′ij]=[ωTij]*[0];
并将
Figure BDA0003096733540000108
和[ωT′ij]发送给匹配云服务器MCS;
6)匹配云服务器MCS计算:
Figure BDA0003096733540000109
[T*]=[ωT′ij]*[Tj]=[ωT′ij+Tj];
(2)执行一轮算法3后,匹配云服务器MCS得到
Figure BDA00030967335400001010
和[T*],令l=l+1,并重新记:
Figure BDA00030967335400001011
[Tl]=[T*];
输出
Figure BDA00030967335400001012
Figure BDA00030967335400001013
间较小值的密文
Figure BDA00030967335400001014
以及对应类标签[T*];
步骤3.3.3:执行K-1轮后,匹配云服务器MCS得到最小值马氏距离平方值
Figure BDA00030967335400001015
与对应的类标签密文[T(min)];其中,
Figure BDA00030967335400001016
表示K个马氏距离平方值
Figure BDA00030967335400001017
中的最小值,T(min)是最小值所对应的类标签,[T(min)]是利用QU的公钥加密Tmin后的密文形式。
步骤4:匹配结果返回;
请见图5,本实施例具体实现包括以下子步骤:
步骤4.1:匹配云服务器MCS将[T(min)]发送给询问用户QU;
步骤4.2:询问用户QU利用密钥skQU解密[T(min)]得到T(min),即得到匹配结果T(min)
T(min)=[L([T(min)]p′-1modp′2)/L(g′p′-1modp′2)]modp′。
本发明设计了一种社交推荐中隐私保护的用户信息匹配方案。方案由询问用户QU、匹配云服务器MCS和辅助云服务器ACS三个角色组成。QU是指拥有智能设备的用户,与MCS直接交互,提供想要匹配的好友特征信息或自己的特征信息(特征向量)给MCS,希望匹配到兴趣爱好相似度较高的好友群;MCS是指拥有匹配模型(即分类模型)的云服务器,它接收QU的匹配请求,对于QU提供的特征向量,根据匹配模型计算得到相似度最高的一类好友;ACS是指提供辅助计算的云服务器,只与MCS进行交互,辅助MCS计算得到匹配结果。值得注意的是,所涉及的三方均是半诚实的,且MCS和ACS是不共谋的两个云服务器。所述的信息匹配是指基于马氏距离分类的信息匹配计算,具体指基于已有的匹配模型计算得到马氏距离,并将用户的待匹配特征向量归于马氏距离最小值所对应的一类好友中。本发明考虑马氏距离计算中引入协方差矩阵的特性,利用马氏距离分类提高了信息匹配度,同时保证了用户特征信息和匹配模型的隐私安全;另外,用户拥有较低的计算和通信开销,增加了方案的实用性。
本发明提出一种工业大数据中的隐私保护分析方法,具体分析社交推荐中用户享受信息匹配服务时的数据隐私保护问题,通过将信息匹配过程外包给云服务器,并利用HRES同态重加密算法和RSA非对称加密算法来实现安全的外包云计算。方案选择基于马氏距离分类技术进行信息匹配提高了匹配准确度,同时外包云计算也为用户减少了计算和通信上的开销。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (7)

1.一种面向工业大数据的隐私保护分析系统,其特征在于:包括询问用户QU、匹配云服务器MCS和辅助云服务器ACS;
所述询问用户QU是拥有智能设备的用户,与匹配云服务器MCS直接交互,即提供想要匹配的好友特征信息或自己的特征信息给匹配云服务器MCS,用于匹配到兴趣爱好相似度高于预设值的好友群;
所述匹配云服务器MCS是指拥有匹配模型的云服务器,接收询问用户QU的匹配请求,对于询问用户QU提供的特征信息,根据匹配模型计算得到相似度最高的一类好友;
所述辅助云服务器ACS是指提供辅助计算的云服务器,只与所述匹配云服务器MCS进行交互,辅助所述匹配云服务器MCS计算得到匹配结果;
上述匹配计算的过程,是指基于马氏距离分类的信息匹配计算,具体指基于已有的匹配模型计算得到马氏距离,将用户的待匹配特征信息归于马氏距离最小值所对应的一类好友中。
2.一种面向工业大数据的隐私保护分析方法,其特征在于:根据已收集的真实d维用户特征信息集DB,将其分为K个不同类别的特征数据集DB=(DB1,DB2,…,DBK),其类标签记为T=(T1,T2,…,TK),分别计算DBi的协方差矩阵Si和均值向量μi,(Sii)即为匹配模型;且其对应的类标签为Ti,i=1,2,…,K;给定用户的d维待匹配特征信息X=(x1,x2,…,xd),计算X与DBi间的马氏距离MDi,比较K个马氏距离,最小马氏距离值MD(min)对应的类标签T(min)即为匹配结果,即为用户推荐类标签为T(min)的好友群;
所述方法具体包括以下步骤:
步骤1:系统初始化;
具体实现包括以下子步骤:
步骤1.1:询问用户QU发送注册请求给可信方TP,发送IDQU给可信方TP;可信方TP计算HQU,并根据系统安全参数为询问用户QU生成一对OU加密算法公私钥对(pkQU,skQU),将skQU发送给询问用户QU,公开pkQU;其中,IDQU表示QU的身份、HQU是利用QU的身份生成的独一无二的哈希值;
步骤1.2:根据系统安全参数,可信方TP生成HRES的相关参数(N0,p0,q0,g0),将(N0,g0,N,HQU)发送给匹配云服务器MCS,将(N0,g0)发送给辅助云服务器ACS;其中,N0=p0q0,p0、q0是两个大素数,G是
Figure FDA0003623999130000021
的二次剩余循环群,g0是群G的最大阶,N是TP在计算HQU时选的随机数;
步骤1.3:匹配云服务器MCS和辅助云服务器ACS共同执行下述算法1,生成各自的HRES公私钥对(pkMCS,skMCS)、(pkACS,skACS)以及主公钥pk′;
所述算法1:匹配云服务器MCS输入:随机数
Figure FDA0003623999130000022
辅助云服务器ACS输入:随机数
Figure FDA0003623999130000023
然后执行下述步骤:
(1)匹配云服务器MCS计算
Figure FDA0003623999130000024
将y1发送给辅助云服务器ACS;
(2)辅助云服务器ACS计算
Figure FDA0003623999130000025
将y2发送给匹配云服务器MCS;
(3)匹配云服务器MCS计算
Figure FDA0003623999130000026
(4)辅助云服务器ACS计算
Figure FDA0003623999130000027
(5)匹配云服务器MCS得到公私钥对(pkMCS=ga,skMCS=a),辅助云服务器ACS得到公私钥对(pkACS=gb,skACS=b),共同得到主公钥pk′,并公开pk′;
步骤1.4:匹配云服务器MCS根据匹配模型(Sii),预计算逆矩阵
Figure FDA0003623999130000028
步骤2:询问用户QU将自己的特征信息X发送给匹配云服务器MCS,请求匹配;
步骤3:匹配云服务器MCS根据自己的匹配模型(Sii),计算用户的特征信息X与匹配模型间的K个马氏距离,比较该K个马氏距离,得到最小马氏距离对应的类标签T(min),即为用户计算的匹配结果,表示为用户推荐T(min)类别的好友;
步骤4:匹配结果返回。
3.根据权利要求2所述的面向工业大数据的隐私保护分析方法,其特征在于,步骤2的具体实现包括以下子步骤:
步骤2.1:询问用户QU输入特征信息X,并用pk′加密得到 [[x1]]pk′,[[x2]]pk′,…,[[xd]]pk′
步骤2.2:将<[[x1]]pk′,[[x2]]pk′,…,[[xd]]pk′,ID′QU>发送给匹配云服务器MCS,请求匹配;其中,ID′QU为询问用户发送给TP的IDQU
4.根据权利要求2所述的面向工业大数据的隐私保护分析方法,其特征在于,步骤3的具体实现包括以下子步骤:
步骤3.1:根据询问用户QU发送的ID′QU计算H′QU并判断
Figure FDA0003623999130000031
若相等,则进行步骤3.2;反之终止请求服务;H′QU=H(H(ID′QU)||N),HQU=H(H(IDQU)||N),HQU是TP根据QU发送给它的IDQU而计算得到的哈希值,H′QU是MCS根据QU发送给它的ID′QU而计算得到的哈希值,主要是为了验证QU发送给MCS的身份有没有被篡改;
步骤3.2:匹配云服务器MCS根据自己的匹配模型(Sii),计算用户的特征信息X与匹配模型间的K个马氏距离;
步骤3.3:比较该K个马氏距离,得到最小马氏距离对应的类标签T(min)
5.根据权利要求4所述的面向工业大数据的隐私保护分析方法,其特征在于,步骤3.2的具体实现包括以下子步骤:
步骤3.2.1:由匹配模型(Sii),计算
Figure FDA0003623999130000032
并用pk′进行加密得
Figure FDA0003623999130000033
其中,μi是匹配模型中Si对应的样本集的样本均值向量,而μij和μjk是第i类样本均值向量中的任意两维均值,aijk
Figure FDA0003623999130000034
中对应的第i行第i列的元素,
Figure FDA0003623999130000035
是矩阵Si的逆矩阵;
由询问用户QU发送的<[[x1]]pk′,[[x2]]pk′,…,[[xd]]pk′>以及HRES的同态性,计算[[μijaijkxk]]pk′
Figure FDA0003623999130000036
步骤3.2.2:匹配云服务器MCS和辅助云服务器ACS共同执行下述算法2,计算[[xjxk]]pk′和[[aijkxjxk]]pk′,j,k=1,2,…,d;
所述算法2:匹配云服务器MCS输入:[[xi]]pk′,(pkMCS,skMCS),i=1,2,…,d;辅助云服务器ACS输入(pkACS,skACS);然后执行下述步骤:
(1)匹配云服务器MCS选择d个随机数
Figure FDA0003623999130000041
计算[[xi′]]pk′=[[xi]]pk′*[[bi]]pk′=[[xi+bi]]pk′
Figure FDA0003623999130000042
Figure FDA0003623999130000043
Figure FDA0003623999130000044
Figure FDA0003623999130000045
Figure FDA0003623999130000046
Figure FDA0003623999130000047
其中,
Figure FDA0003623999130000048
表示范围{0,1,…,N0-1}内的任意一个整数;ri是加密xi时在范围[1,N0/4]内任意选的随机整数;zi是在加密bi时在范围[1,N0/4]内任意选择的随机数;
(2)匹配云服务器MCS利用skMCS对[[xi′]]pk′进行第一层解密得到
Figure FDA0003623999130000049
并将
Figure FDA00036239991300000410
发送给辅助云服务器ACS;
Figure FDA00036239991300000411
Figure FDA00036239991300000412
Figure FDA00036239991300000413
(3)辅助云服务器ACS利用skACS
Figure FDA00036239991300000414
进行第二层解密得到xi′=xi+bi
Figure FDA00036239991300000415
Figure FDA00036239991300000416
Figure FDA00036239991300000417
Figure FDA00036239991300000418
上述公式中计算
Figure FDA00036239991300000419
Figure FDA00036239991300000420
是ACS的解密过程,最终计算的m是解密得到的明文,即m=xi+bi;而L是一个函数,该函数是HRES中已定义好的函数,即
Figure FDA0003623999130000052
(4)对于j,k=1,2,…,d,辅助云服务器ACS计算xjk=x′j*x′kmodN0,并用pk′加密xjk得到[[xjk]]pk′,将[[xjk]]pk′发送给匹配云服务器MCS;
Figure FDA0003623999130000053
步骤3.2.3:由HRES的同态性,匹配云服务器MCS计算
Figure FDA0003623999130000054
K表示类别数;
步骤3.2.4:匹配云服务器MCS用公钥pkQU加密类标签Ti得到[T1],[T2],…,[TK]。
6.根据权利要求5所述的面向工业大数据的隐私保护分析方法,其特征在于,步骤3.3的具体实现包括以下子步骤:
步骤3.3.1:MCS随机选择一个重排函数f重排[[MD2]]pk′和[T],得到
Figure FDA0003623999130000055
Figure FDA0003623999130000056
其中,
Figure FDA0003623999130000057
[T]={[T1],[T2],…,[TK]};
步骤3.3.2:对于l=1:K,重复下述步骤(1)和步骤(2);
(1)匹配云服务器MCS选择
Figure FDA0003623999130000058
Figure FDA0003623999130000059
重新记为
Figure FDA00036239991300000510
[Ti]和[Tj],并执行下述算法3;
所述算法3:匹配云服务器MCS输入
Figure FDA00036239991300000511
[Ti]、[Tj],(pkMCS,skMCS);辅助云服务器ACS输入(pkACS,skACS);然后执行下述步骤:
1)匹配云服务器MCS计算:
Figure FDA00036239991300000512
[Tij]=[Ti]*[Tj]N′-1=[Ti-Tj];
2)匹配云服务器MCS利用skMCS
Figure FDA00036239991300000513
进行第一层解密得到
Figure FDA00036239991300000514
并发送给辅助云服务器ACS;
3)辅助云服务器ACS利用密钥skACS
Figure FDA00036239991300000515
进行第二层解密得到解密结果
Figure FDA00036239991300000516
并判断解密结果;
Figure FDA0003623999130000061
Figure FDA0003623999130000062
令ω=0;
Figure FDA0003623999130000063
Figure FDA0003623999130000064
令ω=1;
4)辅助云服务器ACS进行如下计算:
Figure FDA0003623999130000065
[ωTij]=[Tij]ω
其中,
Figure FDA0003623999130000066
表示在K个类别中,待匹配数据X与匹配模型中μi计算得到的马氏距离平方,而i,j则表示K个马氏距离平方中的任意两个值的下标,Ti表示匹配模型(Sii)对应的类标签;
5)辅助云服务器ACS对[ωTij]进行更新操作,即计算:
[ωTij′]=[ωTij]*[0];
并将
Figure FDA0003623999130000067
和[ωTij′]发送给匹配云服务器MCS;
6)匹配云服务器MCS计算:
Figure FDA0003623999130000068
[T*]=[ωTij′]*[Tj]=[ωTij′+Tj];
(2)执行一轮算法3后,匹配云服务器MCS得到
Figure FDA0003623999130000069
和[T*],令l=l+1,并重新记:
Figure FDA00036239991300000610
输出
Figure FDA00036239991300000611
Figure FDA00036239991300000612
间较小值的密文
Figure FDA00036239991300000613
以及对应类标签[T*];
步骤3.3.3:执行K-1轮后,匹配云服务器MCS得到最小值马氏距离平方值
Figure FDA00036239991300000614
与对应的类标签密文[T(min)];其中,
Figure FDA00036239991300000615
表示K个马氏距离平方值
Figure FDA00036239991300000616
中的最小值,T(min)是最小值所对应的类标签,[T(min)]是利用QU的公钥加密Tmin后的密文形式。
7.根据权利要求2-6任意一项所述的面向工业大数据的隐私保护分析方法,其特征在于,步骤4的具体实现包括以下子步骤:
步骤4.1:匹配云服务器MCS将[T(min)]发送给询问用户QU;
步骤4.2:询问用户QU利用密钥skQU解密[T(min)]得到T(min),即得到匹配结果T(min)
CN202110612991.9A 2021-06-02 2021-06-02 一种面向工业大数据的隐私保护分析系统及方法 Active CN113468553B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110612991.9A CN113468553B (zh) 2021-06-02 2021-06-02 一种面向工业大数据的隐私保护分析系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110612991.9A CN113468553B (zh) 2021-06-02 2021-06-02 一种面向工业大数据的隐私保护分析系统及方法

Publications (2)

Publication Number Publication Date
CN113468553A CN113468553A (zh) 2021-10-01
CN113468553B true CN113468553B (zh) 2022-07-19

Family

ID=77872148

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110612991.9A Active CN113468553B (zh) 2021-06-02 2021-06-02 一种面向工业大数据的隐私保护分析系统及方法

Country Status (1)

Country Link
CN (1) CN113468553B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116980972A (zh) * 2022-04-22 2023-10-31 华为技术有限公司 数据传输方法及相关装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105378790A (zh) * 2013-03-15 2016-03-02 索库里公司 使用社交联网数据的风险评估
CN105721485A (zh) * 2016-03-04 2016-06-29 安徽大学 外包云环境下面向多数据拥有者的安全最近邻查询方法
CN107071039A (zh) * 2017-04-24 2017-08-18 深圳至上移动科技有限公司 一种私有数据云存储系统及私有数据云存储方法
CN107085616A (zh) * 2017-05-31 2017-08-22 东南大学 Lbsn中一种基于多维属性挖掘的虚假评论可疑地点检测方法
CN107347096A (zh) * 2017-07-07 2017-11-14 安徽大学 一种基于云服务器的位置隐私保护方法
CN108400970A (zh) * 2018-01-20 2018-08-14 西安电子科技大学 云环境中相似数据消息锁定加密去重方法、云存储系统
CN109688143A (zh) * 2018-12-28 2019-04-26 西安电子科技大学 一种面向云环境中隐私保护的聚类数据挖掘方法
CN110233730A (zh) * 2019-05-22 2019-09-13 暨南大学 一种基于k均值聚类的隐私信息保护方法
CN111262698A (zh) * 2020-02-10 2020-06-09 金陵科技学院 一种基于sm3/4的身份认证与隐私匹配系统及方法
CN111931067A (zh) * 2020-09-14 2020-11-13 北京百度网讯科技有限公司 兴趣点推荐方法、装置、设备和介质
CN112463394A (zh) * 2020-12-17 2021-03-09 王万金 基于大数据和云计算的数据筛选方法及云服务器
CN112487481A (zh) * 2020-12-09 2021-03-12 重庆邮电大学 一种具有隐私保护的可验证多方k-means联邦学习方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180053273A1 (en) * 2016-08-17 2018-02-22 Brian Beal System for storing and safekeeping a document
US10430609B2 (en) * 2016-09-23 2019-10-01 International Business Machines Corporation Low privacy risk and high clarity social media support system

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105378790A (zh) * 2013-03-15 2016-03-02 索库里公司 使用社交联网数据的风险评估
CN105721485A (zh) * 2016-03-04 2016-06-29 安徽大学 外包云环境下面向多数据拥有者的安全最近邻查询方法
CN107071039A (zh) * 2017-04-24 2017-08-18 深圳至上移动科技有限公司 一种私有数据云存储系统及私有数据云存储方法
CN107085616A (zh) * 2017-05-31 2017-08-22 东南大学 Lbsn中一种基于多维属性挖掘的虚假评论可疑地点检测方法
CN107347096A (zh) * 2017-07-07 2017-11-14 安徽大学 一种基于云服务器的位置隐私保护方法
CN108400970A (zh) * 2018-01-20 2018-08-14 西安电子科技大学 云环境中相似数据消息锁定加密去重方法、云存储系统
CN109688143A (zh) * 2018-12-28 2019-04-26 西安电子科技大学 一种面向云环境中隐私保护的聚类数据挖掘方法
CN110233730A (zh) * 2019-05-22 2019-09-13 暨南大学 一种基于k均值聚类的隐私信息保护方法
CN111262698A (zh) * 2020-02-10 2020-06-09 金陵科技学院 一种基于sm3/4的身份认证与隐私匹配系统及方法
CN111931067A (zh) * 2020-09-14 2020-11-13 北京百度网讯科技有限公司 兴趣点推荐方法、装置、设备和介质
CN112487481A (zh) * 2020-12-09 2021-03-12 重庆邮电大学 一种具有隐私保护的可验证多方k-means联邦学习方法
CN112463394A (zh) * 2020-12-17 2021-03-09 王万金 基于大数据和云计算的数据筛选方法及云服务器

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
云计算环境中支持隐私保护的数字版权保护方案;黄勤龙等;《通信学报》;20140225(第02期);全文 *
群智感知中基于云辅助的隐私信息保护机制;吴云鹏等;《计算机工程与设计》;20200516(第05期);全文 *
适合云服务环境的实数全同态加密方案;王嵘冰等;《信息网络安全》;20181110(第11期);全文 *
高效可验证的隐私保护推荐系统;宋春芝等;《华东师范大学学报(自然科学版)》;20180325(第02期);全文 *

Also Published As

Publication number Publication date
CN113468553A (zh) 2021-10-01

Similar Documents

Publication Publication Date Title
Zhou et al. PassBio: Privacy-preserving user-centric biometric authentication
US8474025B2 (en) Methods and apparatus for credential validation
CN109495490B (zh) 一种基于区块链的统一身份认证方法
CN104219245B (zh) 面向基于位置服务的用户隐私保护系统及方法
CN106411533A (zh) 双向隐私保护的在线指纹认证系统及方法
CN106789042A (zh) Ibc域内的用户访问pki域内的资源的认证密钥协商方法
CN103826220B (zh) 基于矩阵变换算法的隐私匹配方法
CN105376064B (zh) 一种匿名消息认证系统及其消息签名方法
CN112052466B (zh) 基于多方安全计算协议的支持向量机用户数据预测方法
CN110224816B (zh) 基于密钥卡和序列号的抗量子计算应用系统以及近距离节能通信方法和计算机设备
CN116049897B (zh) 基于线性同态哈希和签密的可验证隐私保护联邦学习方法
CN111416712B (zh) 基于多个移动设备的量子保密通信身份认证系统及方法
Tian et al. Pribioauth: Privacy-preserving biometric-based remote user authentication
CN113468553B (zh) 一种面向工业大数据的隐私保护分析系统及方法
Rao et al. A novel quantum identity authentication protocol without entanglement and preserving pre-shared key information
Zhao et al. SGBoost: An efficient and privacy-preserving vertical federated tree boosting framework
Tian et al. Leakage-resilient biometric-based remote user authentication with fuzzy extractors
JP5799635B2 (ja) 暗号データ検索システム、装置、方法及びプログラム
CN115150060A (zh) 一种基于安全多方聚类方法的数据隐私性保护方法
Tian et al. Privacy-preserving biometric-based remote user authentication
CN115459975A (zh) 一种基于Chebyshev多项式的工业边缘设备无证书接入认证方法
Zhang et al. Traceable dynamic public auditing with identity privacy preserving for cloud storage
CN105025008A (zh) 农资物联网中基于二维码及非对称加密的访问认证方法
Abidin et al. An efficient entity authentication protocol with enhanced security and privacy properties
CN111262698A (zh) 一种基于sm3/4的身份认证与隐私匹配系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant