CN111046423B - 一种敏感数据采集的方法 - Google Patents

一种敏感数据采集的方法 Download PDF

Info

Publication number
CN111046423B
CN111046423B CN201911257598.1A CN201911257598A CN111046423B CN 111046423 B CN111046423 B CN 111046423B CN 201911257598 A CN201911257598 A CN 201911257598A CN 111046423 B CN111046423 B CN 111046423B
Authority
CN
China
Prior art keywords
data
client
group
disturbance
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911257598.1A
Other languages
English (en)
Other versions
CN111046423A (zh
Inventor
张美跃
范章华
程少锋
周业
俞传情
周定云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hengruitong Fujian Information Technology Co ltd
Original Assignee
Hengruitong Fujian Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hengruitong Fujian Information Technology Co ltd filed Critical Hengruitong Fujian Information Technology Co ltd
Priority to CN201911257598.1A priority Critical patent/CN111046423B/zh
Publication of CN111046423A publication Critical patent/CN111046423A/zh
Application granted granted Critical
Publication of CN111046423B publication Critical patent/CN111046423B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Storage Device Security (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供的一种敏感数据采集的方法,通过客户端创建扰动群组或加入扰动群组,成员客户端使用群主客户端的公钥PKj对个人数据进行加密,并将加密后的数据以预设的消息格式通过所述服务端转发至群主客户端,所述群主客户端接收所述扰动群组内所有成员客户端发送的用户数据,并通过与所述群主客户端的公钥PKj相适配的私钥SKj进行解密,得到解密后的原始数据集,并对所述解密后的原始数据集进行扰动处理,得到扰动后数据集,并发送至服务器,可避免第三方服务器的介入,提高个人数据采集的安全性,可在满足数据可用性的同时,抵抗内部恶意用户和不可信服务器的攻击,保护数据的隐私安全,并确保用户的隐私不被泄露。

Description

一种敏感数据采集的方法
技术领域
本发明涉及信息安全技术领域,特别涉及一种敏感数据采集的方法。
背景技术
近几年来,随着具有采集功能的智能终端和无线通讯技术的日益普及,各种基于数据采集的服务正迅猛发展(如医疗数据采集或者个人资产采集),现已经覆盖人们生活的方方面面。
在数据采集的过程中,用户上传的数据中蕴含了个人的敏感信息,如医疗费用、疾病信息、健康状况、兴趣爱好、宗教信仰和家庭住址等。如果用户直接上传包含敏感属性的数据,而不采取适当的数据保护机制,将可能造成个人的隐私泄露;而且对采集数据的不当应用也可能导致个人的隐私泄露。而且提供的数据越准确,服务器获取的数据质量越高,但用户的隐私泄露的风险越高。因此,在数据采集中一方面我们要对敏感数据提供一定的保护,另一方面需要满足数据可用性。
一方面,在现有的数据采集机制中,用户往往是将个人数据直接上传给服务器,然后由服务器对数据进行处理,而服务器往往是不受信任的,服务提供商有可能为了个人的利益而泄露用户的个人隐私数据;另一方面,现有的数据采集方法中大都是采取数据加噪的方法,然而所加噪音没有考虑属性之间的关系,而且对多维数据不适用。在数据采集中,数据的属性往往是多维的,而协方差在处理多维数据中起到至关重要的作用,它可以保持数据属性之间的线性关系。而且通过协方差产生的噪音项与敏感属性和公开属性有关,保证了数据之间的内在联系,可以减少样本误差,保证数据的可用性。
发明内容
(一)要解决的技术问题
为了解决现有技术的上述问题,本发明提供一种敏感数据采集的方法,能够提高敏感数据采集的安全性。
(二)技术方案
为了达到上述目的,本发明采用的主要技术方案包括:
一种敏感数据采集的方法,包括步骤:
S1、服务端判断客户端发送的指令信息是否为创建指令,若是,则创建一扰动群组Gj,并选定所述客户端为所述扰动群组的群主客户端,否则,选定所述客户端为成员客户端,并将所述成员客户端分配至相应的扰动群组,且所述创建指令包括群主客户端的公钥PKj,其中j表示扰动群组的序号;
S2、成员客户端从所述服务端获取相应的扰动群组中群主客户端的公钥PKj,并通过所述群主客户端的公钥PKj对个人数据进行加密,并将加密后的数据以预设的消息格式通过所述服务端转发至群主客户端;
S3、所述群主客户端接收所述扰动群组内所有成员客户端发送的用户数据,并通过与所述群主客户端的公钥PKj相适配的私钥SKj进行解密,得到解密后的原始数据集,并对所述解密后的原始数据集进行扰动处理,得到扰动后数据集,并发送至服务器。
(三)有益效果
本发明的有益效果在于:通过客户端创建扰动群组或加入扰动群组,成员客户端使用群主客户端的公钥PKj对个人数据进行加密,并将加密后的数据以预设的消息格式通过所述服务端转发至群主客户端,所述群主客户端接收所述扰动群组内所有成员客户端发送的用户数据,并通过与所述群主客户端的公钥PKj相适配的私钥SKj进行解密,得到解密后的原始数据集,并对所述解密后的原始数据集进行扰动处理,得到扰动后数据集,并发送至服务器,可避免第三方服务器的介入,提高个人数据采集的安全性,可在满足数据可用性的同时,抵抗内部恶意用户和不可信服务器的攻击,保护数据的隐私安全,并确保用户的隐私不被泄露。
附图说明
图1为本发明实施例的敏感数据采集的方法流程图;
图2为本发明实施例的敏感数据采集的方法的模型图;
图3为本发明实施例的敏感数据采集的方法的过程示意图。
具体实施方式
为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。
实施例一
请参照图1,一种敏感数据采集的方法,包括步骤:
S0、服务端为第i个客户端生成相应的假名IDi',其中i的取值范围为1至m,m表示客户端的总数量。
S1、服务端判断客户端发送的指令信息是否为创建指令,若是,则创建一扰动群组Gj,并选定所述客户端为所述扰动群组的群主客户端,否则,选定所述客户端为成员客户端,并将所述成员客户端分配至相应的扰动群组,且所述创建指令包括群主客户端的公钥PKj,其中j表示扰动群组的序号;
所述的将所述成员客户端分配至相应的扰动群组具体为:
以假名将所述成员客户端分配至相应的扰动群组。
所述指令信息为创建指令或加入指令;
所述创建指令还包括用户上限Tj
S2、成员客户端从所述服务端获取相应的扰动群组中群主客户端的公钥PKj,并通过所述群主客户端的公钥PKj对个人数据进行加密,并将加密后的数据以预设的消息格式通过所述服务端转发至群主客户端;
所述的预设的消息格式具体为:
{IDi',EPKj(ai1,…,ain,bi1,…,bin)};
其中,(ai1,…ain)表示所述个人数据中的n个敏感属性数据,(bi1,…bin) 表示所述个人数据中的n个公开属性数据。
S3、所述群主客户端接收所述扰动群组内所有成员客户端发送的用户数据,并通过与所述群主客户端的公钥PKj相适配的私钥SKj进行解密,得到解密后的原始数据集,并对所述解密后的原始数据集进行扰动处理,得到扰动后数据集,并发送至服务器。
所述解密后的原始数据集Qj=(U,V),其中
Figure BDA0002310714280000041
步骤S3中所述的对所述解密后的原始数据集进行扰动处理,得到扰动后数据集包括:
S31、对解密后的原始数据集Qj=(U,V)中的U与V进行回归运算,计算参数
Figure BDA0002310714280000042
Figure BDA0002310714280000043
其中,U表示所述个人数据中的敏感属性数据,V表示所述个人数据中的公开属性数据,
Figure BDA0002310714280000044
表示协方差,
Figure BDA0002310714280000045
表示所述个人数据中的敏感属性数据U的均值,
Figure BDA0002310714280000046
表示所述个人数据中的公开属性数据V的均值;
S32、计算回归残差的协方差
Figure BDA0002310714280000047
Figure BDA0002310714280000048
S33、生成扰动噪音e,且所述扰动噪音e服从
Figure BDA0002310714280000049
正态分布;
S34、判断噪音e是否满足以下两个等式:S(e)=0和
Figure BDA00023107142800000410
若不满足则返回步骤S33,其中,S(e)为标准差;
S35、通过标准正态分布产生随机矩阵D,D与U或S进行回归,并计算回归残差的协方差AHH
S36、计算一个新噪音C,
Figure BDA0002310714280000051
S37、判断噪音C是否满足以下两个等式:S(C)=0和
Figure BDA0002310714280000052
若不满足,则返回步骤S36;
S38、计算得到扰动后数据集Qj′=(Y,V)。
实施例二
请参照图2和3,本实施例和实施例一的区别在于,本发明将结合具体的应用场景进一步说明本发明上述敏感数据采集的方法是如何实现的:
S0、服务端为第i个客户端生成相应的假名IDi',其中i的取值范围为1至m,m表示客户端的总数量。
S1、服务端判断客户端发送的指令信息是否为创建指令,若是,则创建一扰动群组Gj,并选定所述客户端为所述扰动群组的群主客户端,否则,选定所述客户端为成员客户端,并将所述成员客户端分配至相应的扰动群组,且所述创建指令包括群主客户端的公钥PKj,其中j表示扰动群组的序号;
所述的将所述成员客户端分配至相应的扰动群组具体为:
以假名将所述成员客户端分配至相应的扰动群组。
所述指令信息为创建指令或加入指令;
所述创建指令还包括用户上限Tj
S2、成员客户端从所述服务端获取相应的扰动群组中群主客户端的公钥PKj,并通过所述群主客户端的公钥PKj对个人数据进行加密,并将加密后的数据以预设的消息格式通过所述服务端转发至群主客户端;
所述的预设的消息格式具体为:
{IDi',EPKj(ai1,…,ain,bi1,…,bin)};
其中,(ai1,…ain)表示所述个人数据中的n个敏感属性数据,(bi1,…bin) 表示所述个人数据中的n个公开属性数据,所述公开属性也称为非敏感属性,如年龄、籍贯、性别等;敏感属性即包含隐私数据的属性(也称为隐私属性),如电话号码、家庭地址、疾病信息等。
S3、所述群主客户端接收所述扰动群组内所有成员客户端发送的用户数据,并通过与所述群主客户端的公钥PKj相适配的私钥SKj进行解密,得到解密后的原始数据集,并对所述解密后的原始数据集进行扰动处理,得到扰动后数据集,并发送至服务器。
所述解密后的原始数据集Qj=(U,V),其中
Figure BDA0002310714280000061
步骤S3中所述的对所述解密后的原始数据集进行扰动处理,得到扰动后数据集包括:
S31、对解密后的原始数据集Qj=(U,V)中的U与V进行回归运算,计算参数
Figure BDA0002310714280000062
Figure BDA0002310714280000063
其中,U表示所述个人数据中的敏感属性数据,V表示所述个人数据中的公开属性数据,
Figure BDA0002310714280000064
表示协方差,
Figure BDA0002310714280000065
表示所述个人数据中的敏感属性数据U的均值,
Figure BDA0002310714280000066
表示所述个人数据中的公开属性数据V的均值;
S32、计算回归残差的协方差
Figure BDA0002310714280000067
Figure BDA0002310714280000068
S33、生成扰动噪音e,且所述扰动噪音e服从
Figure BDA0002310714280000069
正态分布;
S34、判断噪音e是否满足以下两个等式:S(e)=0和
Figure BDA00023107142800000610
若不满足则返回步骤S33,其中,S(e)为标准差;
S35、通过标准正态分布产生随机矩阵D,D与U或S进行回归,并计算回归残差的协方差AHH
S36、计算一个新噪音C,
Figure BDA00023107142800000611
S37、判断噪音C是否满足以下两个等式:S(C)=0和
Figure BDA00023107142800000612
若不满足,则返回步骤S36;
S38、计算得到扰动后数据集Qj′=(Y,V)。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (1)

1.一种敏感数据采集的方法,其特征在于,包括步骤:
S1、服务端判断客户端发送的指令信息是否为创建指令,若是,则创建一扰动群组Gj,并选定所述客户端为所述扰动群组的群主客户端,否则,选定所述客户端为成员客户端,并将所述成员客户端分配至相应的扰动群组,且所述创建指令包括群主客户端的公钥PKj,其中j表示扰动群组的序号;
S2、成员客户端从所述服务端获取相应的扰动群组中群主客户端的公钥PKj,并通过所述群主客户端的公钥PKj对个人数据进行加密,并将加密后的数据以预设的消息格式通过所述服务端转发至群主客户端;
S3、所述群主客户端接收所述扰动群组内所有成员客户端发送的用户数据,并通过与所述群主客户端的公钥PKj相适配的私钥SKj进行解密,得到解密后的原始数据集,并对所述解密后的原始数据集进行扰动处理,得到扰动后数据集,并发送至服务器;
步骤S1之前还包括:
S0、服务端为第i个客户端生成相应的假名IDi',其中i的取值范围为1至m,m表示客户端的总数量;
所述的将所述成员客户端分配至相应的扰动群组具体为:
以假名将所述成员客户端分配至相应的扰动群组;
所述指令信息为创建指令或加入指令;
所述创建指令还包括用户上限Tj
所述的预设的消息格式具体为:
{IDi',EPKj(ai1,…,ain,bi1,…,bin)};
其中,(ai1,…ain)表示所述个人数据中第i个客户端用户的n个敏感属性数据,(bi1,…bin)表示所述个人数据中第i个客户端用户的n个公开属性数据;
所述解密后的原始数据集Qj=(U,V),其中
Figure FDA0003027043850000011
步骤S3中所述的对所述解密后的原始数据集进行扰动处理,得到扰动后数据集包括:
S31、对解密后的原始数据集Qj=(U,V)中的U与V进行回归运算,计算参数
Figure FDA0003027043850000021
Figure FDA0003027043850000022
其中,U表示所述个人数据中的敏感属性数据,V表示所述个人数据中的公开属性数据,
Figure FDA0003027043850000023
表示协方差,
Figure FDA0003027043850000024
表示所述个人数据中的敏感属性数据U的均值,
Figure FDA0003027043850000025
表示所述个人数据中的公开属性数据V的均值;
S32、计算回归残差的协方差
Figure FDA0003027043850000026
Figure FDA0003027043850000027
S33、生成扰动噪音e,且所述扰动噪音e服从
Figure FDA0003027043850000028
正态分布;
S34、判断噪音e是否满足以下两个等式:S(e)=0和
Figure FDA0003027043850000029
若不满足则返回步骤S33,其中,S(e)为标准差;
S35、通过标准正态分布产生随机矩阵D,D与U或V进行回归,并计算回归残差的协方差AHH
S36、计算一个新噪音C,
Figure FDA00030270438500000210
S37、判断噪音C是否满足以下两个等式:S(C)=0和
Figure FDA00030270438500000211
若不满足,则返回步骤S36;
S38、计算得到扰动后数据集Qj′=(Y,V)。
CN201911257598.1A 2019-12-10 2019-12-10 一种敏感数据采集的方法 Active CN111046423B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911257598.1A CN111046423B (zh) 2019-12-10 2019-12-10 一种敏感数据采集的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911257598.1A CN111046423B (zh) 2019-12-10 2019-12-10 一种敏感数据采集的方法

Publications (2)

Publication Number Publication Date
CN111046423A CN111046423A (zh) 2020-04-21
CN111046423B true CN111046423B (zh) 2021-06-18

Family

ID=70235406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911257598.1A Active CN111046423B (zh) 2019-12-10 2019-12-10 一种敏感数据采集的方法

Country Status (1)

Country Link
CN (1) CN111046423B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5541606A (en) * 1995-02-02 1996-07-30 Trimble Navigation Limited W-code enhanced cross correlation satellite positioning system receiver
WO2008124504A1 (en) * 2007-04-03 2008-10-16 Encryption Solutions, Inc. Multiple level security system and method for encrypting data within documents
CN104380690A (zh) * 2012-06-15 2015-02-25 阿尔卡特朗讯 用于推荐服务的隐私保护系统的架构
CN105007284A (zh) * 2015-08-12 2015-10-28 南京理工大学 多管理者群组共享数据中具有隐私保护的公开审计方法
CN107635227A (zh) * 2017-10-30 2018-01-26 中国联合网络通信集团有限公司 一种群组消息加密方法及装置
CN110474768A (zh) * 2019-08-22 2019-11-19 上海豆米科技有限公司 一种有群组解密权限控制的信息安全传递系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8417939B2 (en) * 2007-04-11 2013-04-09 The DIRECTV Goup, Inc. Method and apparatus for file sharing between a group of user devices with encryption-decryption information sent via satellite and the content sent separately

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5541606A (en) * 1995-02-02 1996-07-30 Trimble Navigation Limited W-code enhanced cross correlation satellite positioning system receiver
WO2008124504A1 (en) * 2007-04-03 2008-10-16 Encryption Solutions, Inc. Multiple level security system and method for encrypting data within documents
CN104380690A (zh) * 2012-06-15 2015-02-25 阿尔卡特朗讯 用于推荐服务的隐私保护系统的架构
CN105007284A (zh) * 2015-08-12 2015-10-28 南京理工大学 多管理者群组共享数据中具有隐私保护的公开审计方法
CN107635227A (zh) * 2017-10-30 2018-01-26 中国联合网络通信集团有限公司 一种群组消息加密方法及装置
CN110474768A (zh) * 2019-08-22 2019-11-19 上海豆米科技有限公司 一种有群组解密权限控制的信息安全传递系统及方法

Also Published As

Publication number Publication date
CN111046423A (zh) 2020-04-21

Similar Documents

Publication Publication Date Title
US11399079B2 (en) Zero-knowledge environment based networking engine
US11977659B2 (en) Data anonymization for service subscriber's privacy
US11921883B2 (en) Contact discovery service with privacy aspect
Beato et al. Scramble! your social network data
US8434128B2 (en) Flexible security requirements in an enterprise network
Xia et al. Mosaic: Quantifying privacy leakage in mobile networks
US20120215898A1 (en) Applications of a Network-Centric Information Distribution Platform on the Internet
EP3063691A2 (en) Dynamic de-identification and anonymity
WO2015066523A2 (en) Dynamic de-identification and anonymity
US11593510B1 (en) Systems and methods for securely sharing and processing data between parties
WO2020220755A1 (zh) 可靠的用户服务系统和方法
Beato et al. For some eyes only: protecting online information sharing
Ullah et al. Privacy in targeted advertising: A survey
TW200425700A (en) Policy-based connectivity
Peng et al. A blockchain‐based mobile crowdsensing scheme with enhanced privacy
Carminati et al. Trust and share: Trusted information sharing in online social networks
Karegar et al. Opportunities and challenges of CREDENTIAL: towards a metadata-privacy respecting identity provider
US11334680B1 (en) Systems and methods for securely sharing and processing data between parties
CN111046423B (zh) 一种敏感数据采集的方法
Elmisery et al. Privacy aware group based recommender system in multimedia services
GB2602178A (en) Computer-implemented method and system
Adams et al. Combining social authentication and untrusted clouds for private location sharing
US20240211627A1 (en) Contact discovery service with privacy aspect
Tsow et al. Privacy-aware architecture for sharing web histories
Jadliwala et al. Social puzzles: context-based access control in online social networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant