CN111046423B - 一种敏感数据采集的方法 - Google Patents
一种敏感数据采集的方法 Download PDFInfo
- Publication number
- CN111046423B CN111046423B CN201911257598.1A CN201911257598A CN111046423B CN 111046423 B CN111046423 B CN 111046423B CN 201911257598 A CN201911257598 A CN 201911257598A CN 111046423 B CN111046423 B CN 111046423B
- Authority
- CN
- China
- Prior art keywords
- data
- client
- group
- disturbance
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Storage Device Security (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供的一种敏感数据采集的方法,通过客户端创建扰动群组或加入扰动群组,成员客户端使用群主客户端的公钥PKj对个人数据进行加密,并将加密后的数据以预设的消息格式通过所述服务端转发至群主客户端,所述群主客户端接收所述扰动群组内所有成员客户端发送的用户数据,并通过与所述群主客户端的公钥PKj相适配的私钥SKj进行解密,得到解密后的原始数据集,并对所述解密后的原始数据集进行扰动处理,得到扰动后数据集,并发送至服务器,可避免第三方服务器的介入,提高个人数据采集的安全性,可在满足数据可用性的同时,抵抗内部恶意用户和不可信服务器的攻击,保护数据的隐私安全,并确保用户的隐私不被泄露。
Description
技术领域
本发明涉及信息安全技术领域,特别涉及一种敏感数据采集的方法。
背景技术
近几年来,随着具有采集功能的智能终端和无线通讯技术的日益普及,各种基于数据采集的服务正迅猛发展(如医疗数据采集或者个人资产采集),现已经覆盖人们生活的方方面面。
在数据采集的过程中,用户上传的数据中蕴含了个人的敏感信息,如医疗费用、疾病信息、健康状况、兴趣爱好、宗教信仰和家庭住址等。如果用户直接上传包含敏感属性的数据,而不采取适当的数据保护机制,将可能造成个人的隐私泄露;而且对采集数据的不当应用也可能导致个人的隐私泄露。而且提供的数据越准确,服务器获取的数据质量越高,但用户的隐私泄露的风险越高。因此,在数据采集中一方面我们要对敏感数据提供一定的保护,另一方面需要满足数据可用性。
一方面,在现有的数据采集机制中,用户往往是将个人数据直接上传给服务器,然后由服务器对数据进行处理,而服务器往往是不受信任的,服务提供商有可能为了个人的利益而泄露用户的个人隐私数据;另一方面,现有的数据采集方法中大都是采取数据加噪的方法,然而所加噪音没有考虑属性之间的关系,而且对多维数据不适用。在数据采集中,数据的属性往往是多维的,而协方差在处理多维数据中起到至关重要的作用,它可以保持数据属性之间的线性关系。而且通过协方差产生的噪音项与敏感属性和公开属性有关,保证了数据之间的内在联系,可以减少样本误差,保证数据的可用性。
发明内容
(一)要解决的技术问题
为了解决现有技术的上述问题,本发明提供一种敏感数据采集的方法,能够提高敏感数据采集的安全性。
(二)技术方案
为了达到上述目的,本发明采用的主要技术方案包括:
一种敏感数据采集的方法,包括步骤:
S1、服务端判断客户端发送的指令信息是否为创建指令,若是,则创建一扰动群组Gj,并选定所述客户端为所述扰动群组的群主客户端,否则,选定所述客户端为成员客户端,并将所述成员客户端分配至相应的扰动群组,且所述创建指令包括群主客户端的公钥PKj,其中j表示扰动群组的序号;
S2、成员客户端从所述服务端获取相应的扰动群组中群主客户端的公钥PKj,并通过所述群主客户端的公钥PKj对个人数据进行加密,并将加密后的数据以预设的消息格式通过所述服务端转发至群主客户端;
S3、所述群主客户端接收所述扰动群组内所有成员客户端发送的用户数据,并通过与所述群主客户端的公钥PKj相适配的私钥SKj进行解密,得到解密后的原始数据集,并对所述解密后的原始数据集进行扰动处理,得到扰动后数据集,并发送至服务器。
(三)有益效果
本发明的有益效果在于:通过客户端创建扰动群组或加入扰动群组,成员客户端使用群主客户端的公钥PKj对个人数据进行加密,并将加密后的数据以预设的消息格式通过所述服务端转发至群主客户端,所述群主客户端接收所述扰动群组内所有成员客户端发送的用户数据,并通过与所述群主客户端的公钥PKj相适配的私钥SKj进行解密,得到解密后的原始数据集,并对所述解密后的原始数据集进行扰动处理,得到扰动后数据集,并发送至服务器,可避免第三方服务器的介入,提高个人数据采集的安全性,可在满足数据可用性的同时,抵抗内部恶意用户和不可信服务器的攻击,保护数据的隐私安全,并确保用户的隐私不被泄露。
附图说明
图1为本发明实施例的敏感数据采集的方法流程图;
图2为本发明实施例的敏感数据采集的方法的模型图;
图3为本发明实施例的敏感数据采集的方法的过程示意图。
具体实施方式
为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。
实施例一
请参照图1,一种敏感数据采集的方法,包括步骤:
S0、服务端为第i个客户端生成相应的假名IDi',其中i的取值范围为1至m,m表示客户端的总数量。
S1、服务端判断客户端发送的指令信息是否为创建指令,若是,则创建一扰动群组Gj,并选定所述客户端为所述扰动群组的群主客户端,否则,选定所述客户端为成员客户端,并将所述成员客户端分配至相应的扰动群组,且所述创建指令包括群主客户端的公钥PKj,其中j表示扰动群组的序号;
所述的将所述成员客户端分配至相应的扰动群组具体为:
以假名将所述成员客户端分配至相应的扰动群组。
所述指令信息为创建指令或加入指令;
所述创建指令还包括用户上限Tj。
S2、成员客户端从所述服务端获取相应的扰动群组中群主客户端的公钥PKj,并通过所述群主客户端的公钥PKj对个人数据进行加密,并将加密后的数据以预设的消息格式通过所述服务端转发至群主客户端;
所述的预设的消息格式具体为:
{IDi',EPKj(ai1,…,ain,bi1,…,bin)};
其中,(ai1,…ain)表示所述个人数据中的n个敏感属性数据,(bi1,…bin) 表示所述个人数据中的n个公开属性数据。
S3、所述群主客户端接收所述扰动群组内所有成员客户端发送的用户数据,并通过与所述群主客户端的公钥PKj相适配的私钥SKj进行解密,得到解密后的原始数据集,并对所述解密后的原始数据集进行扰动处理,得到扰动后数据集,并发送至服务器。
所述解密后的原始数据集Qj=(U,V),其中
步骤S3中所述的对所述解密后的原始数据集进行扰动处理,得到扰动后数据集包括:
S35、通过标准正态分布产生随机矩阵D,D与U或S进行回归,并计算回归残差的协方差AHH;
S38、计算得到扰动后数据集Qj′=(Y,V)。
实施例二
请参照图2和3,本实施例和实施例一的区别在于,本发明将结合具体的应用场景进一步说明本发明上述敏感数据采集的方法是如何实现的:
S0、服务端为第i个客户端生成相应的假名IDi',其中i的取值范围为1至m,m表示客户端的总数量。
S1、服务端判断客户端发送的指令信息是否为创建指令,若是,则创建一扰动群组Gj,并选定所述客户端为所述扰动群组的群主客户端,否则,选定所述客户端为成员客户端,并将所述成员客户端分配至相应的扰动群组,且所述创建指令包括群主客户端的公钥PKj,其中j表示扰动群组的序号;
所述的将所述成员客户端分配至相应的扰动群组具体为:
以假名将所述成员客户端分配至相应的扰动群组。
所述指令信息为创建指令或加入指令;
所述创建指令还包括用户上限Tj。
S2、成员客户端从所述服务端获取相应的扰动群组中群主客户端的公钥PKj,并通过所述群主客户端的公钥PKj对个人数据进行加密,并将加密后的数据以预设的消息格式通过所述服务端转发至群主客户端;
所述的预设的消息格式具体为:
{IDi',EPKj(ai1,…,ain,bi1,…,bin)};
其中,(ai1,…ain)表示所述个人数据中的n个敏感属性数据,(bi1,…bin) 表示所述个人数据中的n个公开属性数据,所述公开属性也称为非敏感属性,如年龄、籍贯、性别等;敏感属性即包含隐私数据的属性(也称为隐私属性),如电话号码、家庭地址、疾病信息等。
S3、所述群主客户端接收所述扰动群组内所有成员客户端发送的用户数据,并通过与所述群主客户端的公钥PKj相适配的私钥SKj进行解密,得到解密后的原始数据集,并对所述解密后的原始数据集进行扰动处理,得到扰动后数据集,并发送至服务器。
所述解密后的原始数据集Qj=(U,V),其中
步骤S3中所述的对所述解密后的原始数据集进行扰动处理,得到扰动后数据集包括:
S35、通过标准正态分布产生随机矩阵D,D与U或S进行回归,并计算回归残差的协方差AHH;
S38、计算得到扰动后数据集Qj′=(Y,V)。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (1)
1.一种敏感数据采集的方法,其特征在于,包括步骤:
S1、服务端判断客户端发送的指令信息是否为创建指令,若是,则创建一扰动群组Gj,并选定所述客户端为所述扰动群组的群主客户端,否则,选定所述客户端为成员客户端,并将所述成员客户端分配至相应的扰动群组,且所述创建指令包括群主客户端的公钥PKj,其中j表示扰动群组的序号;
S2、成员客户端从所述服务端获取相应的扰动群组中群主客户端的公钥PKj,并通过所述群主客户端的公钥PKj对个人数据进行加密,并将加密后的数据以预设的消息格式通过所述服务端转发至群主客户端;
S3、所述群主客户端接收所述扰动群组内所有成员客户端发送的用户数据,并通过与所述群主客户端的公钥PKj相适配的私钥SKj进行解密,得到解密后的原始数据集,并对所述解密后的原始数据集进行扰动处理,得到扰动后数据集,并发送至服务器;
步骤S1之前还包括:
S0、服务端为第i个客户端生成相应的假名IDi',其中i的取值范围为1至m,m表示客户端的总数量;
所述的将所述成员客户端分配至相应的扰动群组具体为:
以假名将所述成员客户端分配至相应的扰动群组;
所述指令信息为创建指令或加入指令;
所述创建指令还包括用户上限Tj;
所述的预设的消息格式具体为:
{IDi',EPKj(ai1,…,ain,bi1,…,bin)};
其中,(ai1,…ain)表示所述个人数据中第i个客户端用户的n个敏感属性数据,(bi1,…bin)表示所述个人数据中第i个客户端用户的n个公开属性数据;
所述解密后的原始数据集Qj=(U,V),其中
步骤S3中所述的对所述解密后的原始数据集进行扰动处理,得到扰动后数据集包括:
S35、通过标准正态分布产生随机矩阵D,D与U或V进行回归,并计算回归残差的协方差AHH;
S38、计算得到扰动后数据集Qj′=(Y,V)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911257598.1A CN111046423B (zh) | 2019-12-10 | 2019-12-10 | 一种敏感数据采集的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911257598.1A CN111046423B (zh) | 2019-12-10 | 2019-12-10 | 一种敏感数据采集的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111046423A CN111046423A (zh) | 2020-04-21 |
CN111046423B true CN111046423B (zh) | 2021-06-18 |
Family
ID=70235406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911257598.1A Active CN111046423B (zh) | 2019-12-10 | 2019-12-10 | 一种敏感数据采集的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111046423B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5541606A (en) * | 1995-02-02 | 1996-07-30 | Trimble Navigation Limited | W-code enhanced cross correlation satellite positioning system receiver |
WO2008124504A1 (en) * | 2007-04-03 | 2008-10-16 | Encryption Solutions, Inc. | Multiple level security system and method for encrypting data within documents |
CN104380690A (zh) * | 2012-06-15 | 2015-02-25 | 阿尔卡特朗讯 | 用于推荐服务的隐私保护系统的架构 |
CN105007284A (zh) * | 2015-08-12 | 2015-10-28 | 南京理工大学 | 多管理者群组共享数据中具有隐私保护的公开审计方法 |
CN107635227A (zh) * | 2017-10-30 | 2018-01-26 | 中国联合网络通信集团有限公司 | 一种群组消息加密方法及装置 |
CN110474768A (zh) * | 2019-08-22 | 2019-11-19 | 上海豆米科技有限公司 | 一种有群组解密权限控制的信息安全传递系统及方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8417939B2 (en) * | 2007-04-11 | 2013-04-09 | The DIRECTV Goup, Inc. | Method and apparatus for file sharing between a group of user devices with encryption-decryption information sent via satellite and the content sent separately |
-
2019
- 2019-12-10 CN CN201911257598.1A patent/CN111046423B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5541606A (en) * | 1995-02-02 | 1996-07-30 | Trimble Navigation Limited | W-code enhanced cross correlation satellite positioning system receiver |
WO2008124504A1 (en) * | 2007-04-03 | 2008-10-16 | Encryption Solutions, Inc. | Multiple level security system and method for encrypting data within documents |
CN104380690A (zh) * | 2012-06-15 | 2015-02-25 | 阿尔卡特朗讯 | 用于推荐服务的隐私保护系统的架构 |
CN105007284A (zh) * | 2015-08-12 | 2015-10-28 | 南京理工大学 | 多管理者群组共享数据中具有隐私保护的公开审计方法 |
CN107635227A (zh) * | 2017-10-30 | 2018-01-26 | 中国联合网络通信集团有限公司 | 一种群组消息加密方法及装置 |
CN110474768A (zh) * | 2019-08-22 | 2019-11-19 | 上海豆米科技有限公司 | 一种有群组解密权限控制的信息安全传递系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111046423A (zh) | 2020-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11399079B2 (en) | Zero-knowledge environment based networking engine | |
US11977659B2 (en) | Data anonymization for service subscriber's privacy | |
US11921883B2 (en) | Contact discovery service with privacy aspect | |
Beato et al. | Scramble! your social network data | |
US8434128B2 (en) | Flexible security requirements in an enterprise network | |
Xia et al. | Mosaic: Quantifying privacy leakage in mobile networks | |
US20120215898A1 (en) | Applications of a Network-Centric Information Distribution Platform on the Internet | |
EP3063691A2 (en) | Dynamic de-identification and anonymity | |
WO2015066523A2 (en) | Dynamic de-identification and anonymity | |
US11593510B1 (en) | Systems and methods for securely sharing and processing data between parties | |
WO2020220755A1 (zh) | 可靠的用户服务系统和方法 | |
Beato et al. | For some eyes only: protecting online information sharing | |
Ullah et al. | Privacy in targeted advertising: A survey | |
TW200425700A (en) | Policy-based connectivity | |
Peng et al. | A blockchain‐based mobile crowdsensing scheme with enhanced privacy | |
Carminati et al. | Trust and share: Trusted information sharing in online social networks | |
Karegar et al. | Opportunities and challenges of CREDENTIAL: towards a metadata-privacy respecting identity provider | |
US11334680B1 (en) | Systems and methods for securely sharing and processing data between parties | |
CN111046423B (zh) | 一种敏感数据采集的方法 | |
Elmisery et al. | Privacy aware group based recommender system in multimedia services | |
GB2602178A (en) | Computer-implemented method and system | |
Adams et al. | Combining social authentication and untrusted clouds for private location sharing | |
US20240211627A1 (en) | Contact discovery service with privacy aspect | |
Tsow et al. | Privacy-aware architecture for sharing web histories | |
Jadliwala et al. | Social puzzles: context-based access control in online social networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |