CN102480481A - 一种提高产品用户数据安全性的方法及装置 - Google Patents

一种提高产品用户数据安全性的方法及装置 Download PDF

Info

Publication number
CN102480481A
CN102480481A CN2010105705710A CN201010570571A CN102480481A CN 102480481 A CN102480481 A CN 102480481A CN 2010105705710 A CN2010105705710 A CN 2010105705710A CN 201010570571 A CN201010570571 A CN 201010570571A CN 102480481 A CN102480481 A CN 102480481A
Authority
CN
China
Prior art keywords
data
product user
user data
product
replacement treatment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010105705710A
Other languages
English (en)
Other versions
CN102480481B (zh
Inventor
丘正元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201010570571.0A priority Critical patent/CN102480481B/zh
Publication of CN102480481A publication Critical patent/CN102480481A/zh
Application granted granted Critical
Publication of CN102480481B publication Critical patent/CN102480481B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Storage Device Security (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种提高产品用户数据安全性的方法,该方法包括:获取产品用户数据并对获取的产品用户数据进行分类规整;按照预先设置的策略对分类规整的产品用户数据中的用户敏感属性数据进行置换处理;隐藏置换处理后的产品用户数据中的用户主标识属性数据;发布经置换处理以及隐藏处理后的产品用户数据。本发明还公开了一种提高产品用户数据安全性的装置。应用本发明,可以降低用户隐私数据泄漏的风险、提高产品用户数据的安全性。

Description

一种提高产品用户数据安全性的方法及装置
技术领域
本发明涉及数据处理技术,特别涉及一种提高产品用户数据安全性的方法及装置。
背景技术
目前,随着互联网技术的飞速发展,网上交易、网络数据分析已经深入到人们的日常生活与工作中,但互联网技术在带给人们极大方便的同时,互联网络的隐私泄露问题也日益突出地显现出来,用户隐私泄露包括产品用户数据在传输过程中的泄露以及产品用户数据在收集产品用户数据的网络服务器上的泄露,对于产品用户数据在网络服务器上的泄漏问题,例如,应用或服务厂商为了应用业务的优化、推广以及开发新的业务应用需求,需要通过网络服务器收集各用户在网络通信中操作的数据,以便进行统计、运营分析,挖掘用户特征数据作为新业务、业务优化以及推广的参考和依据,同时,基于公众或第三方合作机构的需要,也需要将获取的产品用户数据进行发布,如果管理网络服务器的相关技术人员对这些收集的产品用户数据处理不当,例如,将获取的产品用户数据中包含的用户隐私数据向外发布,将造成用户隐私数据的泄露,使得基于产品用户数据收集、发布进行数据分析、统计的方法被很多互联网用户所非议。
现有技术中,发布的产品用户数据一般包括用户主标识属性数据、用户敏感属性数据以及普通数据,其中,用户主标识属性数据以及用户敏感属性数据为用户隐私数据,为了有效防止用户隐私数据在网络侧(网络服务器)的泄露,一般采用自动隐藏用户主标识属性数据的方法对产品用户数据进行处理,即将接收的产品用户数据中不涉及统计、分析特性的主标识属性数据直接去除或用编号代替,例如,在发布的有关人口统计的产品用户数据中,将“身份证号”或“姓名”隐藏或用编号代替;在有关QQ的产品用户数据中,则将QQ号码隐藏或用其它编号代替。这样,可在一定程度上使网络服务器管理人员或获取产品用户数据的他人(公众或第三方合作机构)无法确定产品用户数据对应的用户相关信息。也就是说,即使他人获取到该转换的产品用户数据,也无法确定该产品用户数据对应的QQ号码信息,从而保护了用户号码泄漏的风险,又不影响对用户登录次数的统计、分析。但这种隐藏用户主标识属性数据的方法还是存在泄露用户隐私的风险,例如,他人可以通过将数据集中的其它属性进行关联处理,根据获取的关联属性能够确定该产品用户数据对应的QQ号码信息。
因而,实际应用中,可以进一步对产品用户数据中的用户敏感属性数据进行处理,以降低用户隐私数据泄漏的风险。该方法预先设置敏感属性变换公式,通过敏感属性变换公式将产品用户数据中的用户敏感属性数据进行处理变换为公式对应的取值,从而降低了其泄漏的风险。但对于这种有规律的变换公式,如果他人获取或破解了敏感属性变换公式,则仍然可以获取用户敏感属性数据,通过关联处理,可以获取原始的用户其它隐私数据;此外,对一些非数值型的产品用户数据,敏感属性变换公式较难处理。
由上述可见,现有的产品用户数据,在网络侧服务器上进行发布的过程中,存在用户隐私数据泄漏的风险,降低了产品用户数据的安全性,影响了用户体验,使得基于产品用户数据收集、发布进行数据分析、统计的方法遭到了很多互联网用户的非议,不利于业务的扩展、优化以及新业务的推出。
发明内容
有鉴于此,本发明的主要目的在于提出一种提高产品用户数据安全性的方法,降低用户隐私数据泄漏的风险、提高产品用户数据的安全性。
本发明的另一目的在于提出一种提高产品用户数据安全性的装置,降低用户隐私数据泄漏的风险、提高产品用户数据的安全性。
为达到上述目的,本发明提供了一种提高产品用户数据安全性的方法,该方法包括:
获取产品用户数据并对获取的产品用户数据进行分类规整;
按照预先设置的策略对分类规整的产品用户数据中的用户敏感属性数据进行置换处理;
隐藏置换处理后的产品用户数据中的用户主标识属性数据;
发布经置换处理以及隐藏处理后的产品用户数据。
所述用户敏感属性数据包括:数值型产品用户数据以及非数值型产品用户数据。
所述按照预先设置的策略对分类规整的产品用户数据中的用户敏感属性数据进行置换处理具体包括:
预先设置用于置换处理的分布函数;
根据接收的数值型产品用户数据生成服从分布函数的随机数;
根据生成的随机数对数值型产品用户数据进行置换处理,输出处理后的数值型产品用户数据。
所述分布函数包括随机分布函数或正态分布函数。
所述根据生成的随机数对数值型产品用户数据进行置换处理具体包括:
将生成的随机数与数值型产品用户数据相加;或,
将数值型产品用户数据与生成的随机数相减。
所述按照预先设置的策略对分类规整的产品用户数据中的用户敏感属性数据进行置换处理具体包括:
预先设置服从[0,1]分布的分布函数以及分布阈值;
根据接收的非数值型产品用户数据生成服从预先设置的分布函数的随机数;
判断随机数是否小于分布阈值,如果是,将该非数值型产品用户数据取值随机置换为该非数值型产品用户数据包含的其他取值并输出,否则,直接输出接收的产品用户数据。
所述隐藏用户主标识属性数据具体包括:
将产品用户数据中的用户主标识属性数据映射为预先设置的映射关系对应的数值;或,
将用户主标识属性数据映射为不包含任何内容的空信息。
一种提高产品用户数据安全性的装置,该装置包括:分类规整单元、产品用户数据扰动器、用户主标识属性数据单元以及发布单元,其中,
分类规整单元,用于获取产品用户数据并对获取的产品用户数据进行分类规整,输出至产品用户数据扰动器;
产品用户数据扰动器,用于按照预先设置的策略对分类规整的产品用户数据中的用户敏感属性数据进行置换处理,输出至用户主标识属性数据单元;
用户主标识属性数据单元,用于将接收的产品用户数据中的用户主标识属性数据进行隐藏处理,输出至发布单元;
发布单元,用于将经置换以及隐藏处理的产品用户数据进行封装后发布。
所述产品用户数据扰动器包括:随机数生成模块、分布函数存储模块以及置换处理模块,其中,
分布函数存储模块,用于存储用于置换处理的分布函数;
随机数生成模块,用于接收产品用户数据,从分布函数存储模块读取预先设置的分布函数,生成服从分布函数的随机数,输出至置换处理模块;
置换处理模块,用于根据生成的随机数对接收的产品用户数据进行置换处理,输出处理后的产品用户数据。
所述产品用户数据扰动器包括:分布函数存储模块、随机数生成模块、比较模块以及置换处理模块,其中,
分布函数存储模块,存储用于置换处理的服从[0,1]分布的分布函数;
随机数生成模块,用于接收产品用户数据,从分布函数存储模块读取预先设置的分布函数,生成服从分布函数的随机数,输出至比较模块;
比较模块,用于判断随机数是否小于预先设置的分布阈值,如果是,向置换处理模块输出指示置换信息,否则,向置换处理模块输出指示不作置换信息;
置换处理模块,用于接收产品用户数据,根据接收的指示置换信息将该产品用户数据中的用户敏感属性数据取值随机置换为该用户敏感属性数据包含的其他取值并输出,以及,根据接收的指示不作置换信息将该产品用户数据输出。
由上述的技术方案可见,本发明提供的一种提高产品用户数据安全性的方法及装置,获取产品用户数据并对获取的产品用户数据进行分类规整;按照预先设置的策略对分类规整的产品用户数据中的用户敏感属性数据进行置换处理;隐藏置换处理后的产品用户数据中的用户主标识属性数据;发布经置换处理以及隐藏处理后的产品用户数据。这样,通过对用户敏感属性数据进行随机置换处理,使之按照一定的概率进行随机化、扭曲、扰动等处理,并同时对用户主标识属性数据进行隐藏处理,使他人不能从该随机置换处理的用户敏感属性数据推断出对应的原始用户敏感属性数据,从而不能根据用户敏感属性进行关联获取用户主标识属性数据,降低了产品用户数据泄漏的风险、提高了产品用户数据的安全性。
附图说明
图1为本发明实施例提高产品用户数据安全性的方法流程示意图。
图2为本发明实施例对数值型产品用户数据进行置换处理的方法流程示意图。
图3为本发明实施例对非数值型产品用户数据进行置换处理的方法流程示意图。
图4为本发明实施例提高产品用户数据安全性的装置结构示意图。
图5为本发明实施例产品用户数据扰动器第一结构示意图。
图6为本发明实施例产品用户数据扰动器第二结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明作进一步地详细描述。
本方案采用随机扰动技术和隐藏主标识属性相结合,共同完成产品用户数据的隐私保护,从而达到安全地公开发布数据的目的,并且确保所发布数据的可用性。
现有技术中的产品用户数据发布方法,网络服务器的管理人员能够根据数据集中的其它属性进行关联处理获取用户主标识属性数据,以及,根据获取或破解了的敏感属性变换公式,获取用户敏感属性数据,从而掌握用户的隐私信息,给用户日常生活和工作带来极大不便。本发明实施例中,对用户待发布的产品用户数据中的用户敏感属性数据进行随机置换处理,采用随机置换技术与隐藏用户主标识属性数据相结合的方法,即在发布各产品用户数据前,按照一定的概率对接收的各用户敏感属性数据进行随机化、扭曲、扰动等处理,然后,隐藏用户主标识属性数据后将经置换以及隐藏处理的产品用户数据发布。这样,即使网络服务器管理人员或他人获取经过随机置换处理的用户敏感属性数据,也不能从中推断出该随机置换处理的用户敏感属性数据对应的原始用户敏感属性数据;而对于产品用户数据中的普通数据,由于未进行任何处理,可以确保其统计、分析的可用性。
图1为本发明实施例提高产品用户数据安全性的方法流程示意图。参见图1,该流程包括:
步骤101,获取产品用户数据并对获取的产品用户数据进行分类规整;
在实际运营环境中,由于不同的产品用户数据一般分布在不同的环境中,例如,分布在不同的数据库、文件中等。因此,本步骤中,需要将各种待发布的产品用户数据按照用户主标识属性进行关联,从而形成包含用户主标识属性、用户敏感属性以及普通属性的规整数据集,其中,用户主标识属性对应用户主标识属性数据、用户敏感属性对应用户敏感属性数据、普通属性对应普通数据。本发明实施例中,用户敏感属性是指产品用户数据包含的用户属性中具有敏感性的属性,如年龄、收入等。普通属性是指发布方认为不敏感的属性,因而,对该普通属性对应的产品用户数据不需进行隐私处理。当然,如果发布方认为用户属性中除用户主标识属性外的所有属性都是敏感的,则可以将除用户主标识属性外的所有属性作为敏感属性来处理。
本步骤中,接收各用户上传的产品用户数据,对产品用户数据进行分类规整,例如,按照QQ号码进行分类规整,关于分类规整的方法,属于现有技术,具体可参见相关技术文献,在此不再赘述。
步骤102,按照预先设置的策略对分类规整的产品用户数据中的用户敏感属性数据进行置换处理;
本步骤中,产品用户数据包括用户主标识属性数据、用户敏感属性数据以及普通数据,用户敏感属性数据可以根据实际需要进行设定,例如,可以将产品用户数据中除用户主标识属性数据外的其它数据都设置为用户敏感属性数据。
预先设置的策略根据用户敏感属性数据类型的不同而有所不同。
用户敏感属性数据类型包括:数值型产品用户数据以及非数值型产品用户数据。
图2为本发明实施例对数值型产品用户数据进行置换处理的方法流程示意图。参见图2,该流程包括:
步骤201,预先设置用于置换处理的分布函数;
本步骤中,分布函数可以是随机分布函数,也可以是正态分布函数,还可以是其它类型的分布函数。
实际应用中,可以通过程序设计语言中的分布函数指令调用分布函数,例如,通过调用C语言的rand()函数,能导入产生预定范围内的均匀分布的随机数的随机分布函数,例如,预定范围可以为0到1。
对于正态分布函数,需要设置正态分布的期望值和方差值,其中,期望值对产品用户数据产生平移效果,对产品用户数据扰动影响较小;方差值则影响产品用户数据的扰动效果,可以通过计算原产品用户数据的方差,选择与原产品用户数据方差值等数量级的方差值作为正态分布的方差值,并使得设置的期望值和方差值能够保证扰动后的产品用户数据未超出产品用户数据类型的存储范围即可。
步骤202,根据接收的数值型产品用户数据生成服从分布函数的随机数;
步骤203,根据生成的随机数对数值型产品用户数据进行置换处理,输出处理后的数值型产品用户数据。
本步骤中,可以将生成的随机数与数值型产品用户数据相加得到的数据作为处理后的数值型产品用户数据,也可以将数值型产品用户数据与生成的随机数相减得到的数据作为处理后的数值型产品用户数据,当然,也可以是通过其他方式,例如,相其它线性相加方法,例如,将随机数的k(k为一个预先设置的固定系数)倍与数值型产品用户数据相加处理得到的数据作为处理后的数值型产品用户数据。这样,由于是随机置换处理,他人很难从随机置换处理的数据中还原其原始数据。
图3为本发明实施例对非数值型产品用户数据进行置换处理的方法流程示意图。参见图3,该流程包括:
步骤301,预先设置服从[0,1]分布的分布函数以及分布阈值;
本步骤中,非数值型产品用户数据包括:URL连接地址信息、用户从给定的多个选项中进行勾选的信息以及用户选择的播放模式等信息。
设置的分布阈值用于标识需要将整个非数值型产品用户数据进行置换的概率,可以根据实际需要进行设置,相对来说,如果分布阈值较大,则表明对非数值型产品用户数据进行置换的概率大,产品用户数据扰动较为充分,因而,产品用户数据不易被数据收集人掌握,但原始的产品用户数据失真较大,这样,对于将除用户主标识属性外的所有属性作为敏感属性来处理的产品用户数据来说,发布的产品用户数据可用性较低,整体数据的统计可靠性较低,反之,产品用户数据扰动较不充分,易被数据收集人掌握,但原始的产品用户数据失真小,发布的产品用户数据可用性较高,整体数据的统计可靠性较高。实际应用中,可以设置分布阈值为0.1~0.4,这样,可以较佳地结合产品用户数据的可用性以及扰动性。
步骤302,根据接收的非数值型产品用户数据生成服从预先设置的分布函数的随机数;
本步骤中,预先设置的分布函数根据输入的非数值型产品用户数据产生服从[0,1]分布的随机数。
步骤303,判断随机数是否小于分布阈值,如果是,执行步骤304,否则,执行步骤305;
步骤304,将该非数值型产品用户数据取值随机置换为该产品用户数据包含的其他取值;
本步骤中,以用户从给定的多个选项中进行勾选的信息为例,例如,选项包括A、B、C、D四个选项,用户勾选的信息为选项A,如果设置的分布阈值为0.4,生成的随机数为0.3,则可以按照均匀概率从选项B、C、D中随机选择一个,将选择的值替换掉非数值型产品用户数据原来的值。又例如,对于人口普查信息中的用户常住地信息,用户实际的常住地信息为甲小区,如前所述,如果设置的分布阈值为0.4,生成的随机数为0.3,则可以根据与甲小区并列的其他小区信息,如乙小区、丙小区以及丁小区等,随机或按照均匀概率将乙小区信息、丙小区信息或丁小区信息替换掉该用户实际的常住地甲小区信息,其他小区用户实际的常住地信息可按照相类似的方法处理。这样,对于收集的整体产品用户数据来说,只有比例为分布阈值(a)的非数值型产品用户数据被随机替换,剩余的比例(1-a)没有被替换,例如,如果a=0.2,则20%的非数值型产品用户数据被随机替换,80%的非数值型产品用户数据没有被替换,即保留了80%的真实数据,经过这种随机替换后,统计意义可以从80%的非数值型产品用户数据反映出来,20%的随机性不会在分布上对原始数据产生影响,只是在一定程度上减少了原始数据样本,但由于有20%的随机性在统计的数据中,使得数据收集人并不能确定该非数值型产品用户数据是否进行过置换处理,最多只能获知该非数值型产品用户数据进行过置换处理的概率为a,不能准确推断出非数值型产品用户数据项的真实值。因而,对于单个非数值型产品用户数据来说,并不能准确确定其真实值。
步骤305,输出处理后的产品用户数据。
本步骤中,如果对产品用户数据中的非数值型产品用户数据进行了置换,则将置换后的产品用户数据作为处理后的产品用户数据,如果未对非数值型产品用户数据进行置换,则将原产品用户数据作为处理后的产品用户数据。
预先设置的策略还可以是其它方式,例如,对于地理位置的产品用户数据,可以将小地理位置转换成大地理位置,举例来说,可以将深圳、广州这些城市的产品用户数据信息置换为广东的产品用户数据信息,从而隐藏的产品用户数据的细节信息;又例如,可以将产品用户数据转换成数据区间,举例来说,对于产品用户数据为年龄的情形,可以将其置换并映射成[1,10)、[10,20)等数据区间;对于产品用户数据为年收入的情形,可以将其置换并映射成3万以下、3万~5万、5万~10万、10万~50万以及50万以上等数据区间,此外,对于每年旅游次数、家庭支出、化妆品价格承受能力等产品用户数据,也可以参照上述方式进行处理。
步骤103,隐藏置换处理后的产品用户数据中的用户主标识属性数据;
本步骤中,隐藏用户主标识属性数据具体包括:将产品用户数据中的用户主标识属性数据映射为预先设置的映射关系对应的数值。例如,将用户主标识属性中的用户身份属性,如身份证号、姓名、QQ号码等用唯一的有序编号组进行替代,举例来说,用1、2、3、4、……的有序编号组分别替换用户身份属性。如果产品用户数据集中同一个用户主标识属性出现在多条记录或产品用户数据中,则该用户主标识属性对应的有序编号也相同。举例来说,如果用户主标识属性为身份证号,该身份证号在五个产品用户数据中出现,预先设置的映射关系为将该身份证号映射为34567,则用34567分别替换五个产品用户数据中出现的该身份证号。
当然,实际应用中,也可以将用户主标识属性数据映射为不包含任何内容的空信息。
步骤104,发布经置换处理以及隐藏处理后的产品用户数据。
本步骤中,由于发布的产品用户数据隐藏了用户主标识属性、并且对敏感属性进行了扰动处理,使得数据使用人无法从产品用户数据中经过置换处理的产品用户数据敏感属性中推断出其原始真实值,更无法通过关联的方法映射出数据的用户主标识属性,因而具有较强的隐私安全性,同时,由于产品用户数据敏感属性只是被扰动,其表现方式跟原始数据是一致的,因而又保持了数据的可用性。这样,可以向公众或第三方合作机构提供产品用户数据而不会泄露该用户的隐私。公众或第三方合作机构获取了整个数据集的所有产品用户数据后,可对其进行分析、挖掘等处理。
下面对将除用户主标识属性外的所有属性作为敏感属性来处理的产品用户数据的统计特性进行说明。
假设置换处理后的产品用户数据y和随机数r服从正态分布,随机数r的分布R是预选设定的,设其服从期望为μ1、方差为δ12的正态分布N(μ1,δ12);置换处理后的产品用户数据y为网络服务器收集的数据,通过数据分析检验,假设通过检验确定其分布服从均值为μ2、方差为δ22的正态分布N(μ2,δ22),则未经置换处理的产品用户数据x=y-r,也服从正态分布N(μ1-μ2,δ12+δ22)。因而,通过分析置换处理后的产品用户数据的统计、分布特性,可以获知未经置换处理的产品用户数据的统计、分布特性。
实际应用中,对于置换处理后的产品用户数据y分布状态不规则的情形,可以通过将随机数r设置为相对未经置换处理的产品用户数据的方差较小的均匀分布,例如,(-1,1)的均匀分布,这样,经过置换处理的产品用户数据的分布特性,相当于对未经置换处理的产品用户数据分布进行了平移,虽然每个产品用户数据点增加了随机性,但在分布上只是作了平移,统计、分布的形态依然保持不变。这样,在他人得到置换处理的产品用户数据后,不能确定该产品用户数据值是否就是其真实值(真实的产品用户数据),因而保护了用户在该数据项下的隐私;但对于整个用户群的产品用户数据来说,具有某种分布状态的随机变量中,单个产品用户数据值的不确定性并不影响整体分布的确定性,从而可以统计出整个群体上的概率分布状态。
图4为本发明实施例提高产品用户数据安全性的装置结构示意图。参见图4,该装置包括:分类规整单元、产品用户数据扰动器、用户主标识属性数据单元以及发布单元,其中,
分类规整单元,用于获取产品用户数据并对获取的产品用户数据进行分类规整,输出至产品用户数据扰动器;
产品用户数据扰动器,用于按照预先设置的策略对分类规整的产品用户数据中的用户敏感属性数据进行置换处理,输出至用户主标识属性数据单元;
用户主标识属性数据单元,用于将接收的产品用户数据中的用户主标识属性数据进行隐藏处理,输出至发布单元;
发布单元,用于将经置换以及隐藏处理的产品用户数据进行封装后发布。
图5为本发明实施例产品用户数据扰动器第一结构示意图。参见图5,该产品用户数据扰动器包括:随机数生成模块、分布函数存储模块以及置换处理模块,其中,
分布函数存储模块,用于存储用于置换处理的分布函数;
随机数生成模块,用于接收产品用户数据,从分布函数存储模块读取预先设置的分布函数,生成服从分布函数的随机数,输出至置换处理模块;
置换处理模块,用于根据生成的随机数对接收的产品用户数据中的用户敏感属性数据进行置换处理,输出处理后的产品用户数据。
图6为本发明实施例产品用户数据扰动器第二结构示意图。参见图6,该产品用户数据扰动器包括:分布函数存储模块、随机数生成模块、比较模块以及置换处理模块,其中,
分布函数存储模块,用于存储用于置换处理的服从[0,1]分布的分布函数;
随机数生成模块,用于接收产品用户数据,从分布函数存储模块读取预先设置的分布函数,生成服从分布函数的随机数,输出至比较模块;
比较模块,用于判断随机数是否小于预先设置的分布阈值,如果是,向置换处理模块输出指示置换信息,否则,向置换处理模块输出指示不作置换信息;
置换处理模块,用于接收产品用户数据,根据接收的指示置换信息将该产品用户数据中的用户敏感属性数据取值随机置换为该用户敏感属性数据包含的其他取值并输出,以及,根据接收的指示不作置换信息将该产品用户数据输出。
由上述可见,本发明实施例的提高产品用户数据安全性的方法及装置,获取产品用户数据并对获取的产品用户数据进行分类规整;按照预先设置的策略对分类规整的产品用户数据中的用户敏感属性数据进行置换处理;隐藏置换处理后的产品用户数据中的用户主标识属性数据;发布经置换处理以及隐藏处理后的产品用户数据。这样,由于对用户敏感属性数据进行随机置换处理,使之按照一定的概率进行随机化、扭曲、扰动等处理,并同时对用户主标识属性数据进行隐藏处理。因而,即使网络服务器管理人员获取经过随机置换及隐藏处理的产品用户数据,也不能从中推断出该随机置换处理的用户敏感属性数据对应的原始用户敏感属性数据,从而不能根据用户敏感属性进行关联获取用户主标识属性数据,降低了产品用户数据泄漏的风险、提高了产品用户数据的安全性;而且,可以使得置换处理后的各产品用户数据在整体上具有有效的统计、分析意义,可以以较高的可靠性反映原始产品用户数据的统计分布。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换以及改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种提高产品用户数据安全性的方法,其特征在于,该方法包括:
获取产品用户数据并对获取的产品用户数据进行分类规整;
按照预先设置的策略对分类规整的产品用户数据中的用户敏感属性数据进行置换处理;
隐藏置换处理后的产品用户数据中的用户主标识属性数据;
发布经置换处理以及隐藏处理后的产品用户数据。
2.如权利要求1所述的方法,其特征在于,所述用户敏感属性数据包括:数值型产品用户数据以及非数值型产品用户数据。
3.如权利要求2所述的方法,其特征在于,所述按照预先设置的策略对分类规整的产品用户数据中的用户敏感属性数据进行置换处理具体包括:
预先设置用于置换处理的分布函数;
根据接收的数值型产品用户数据生成服从分布函数的随机数;
根据生成的随机数对数值型产品用户数据进行置换处理,输出处理后的数值型产品用户数据。
4.如权利要求3所述的方法,其特征在于,所述分布函数包括随机分布函数或正态分布函数。
5.如权利要求3所述的方法,其特征在于,所述根据生成的随机数对数值型产品用户数据进行置换处理具体包括:
将生成的随机数与数值型产品用户数据相加;或,
将数值型产品用户数据与生成的随机数相减。
6.如权利要求2所述的方法,其特征在于,所述按照预先设置的策略对分类规整的产品用户数据中的用户敏感属性数据进行置换处理具体包括:
预先设置服从[0,1]分布的分布函数以及分布阈值;
根据接收的非数值型产品用户数据生成服从预先设置的分布函数的随机数;
判断随机数是否小于分布阈值,如果是,将该非数值型产品用户数据取值随机置换为该非数值型产品用户数据包含的其他取值并输出,否则,直接输出接收的产品用户数据。
7.如权利要求1至6任一项所述的方法,其特征在于,所述隐藏用户主标识属性数据具体包括:
将产品用户数据中的用户主标识属性数据映射为预先设置的映射关系对应的数值;或,
将用户主标识属性数据映射为不包含任何内容的空信息。
8.一种提高产品用户数据安全性的装置,其特征在于,该装置包括:分类规整单元、产品用户数据扰动器、用户主标识属性数据单元以及发布单元,其中,
分类规整单元,用于获取产品用户数据并对获取的产品用户数据进行分类规整,输出至产品用户数据扰动器;
产品用户数据扰动器,用于按照预先设置的策略对分类规整的产品用户数据中的用户敏感属性数据进行置换处理,输出至用户主标识属性数据单元;
用户主标识属性数据单元,用于将接收的产品用户数据中的用户主标识属性数据进行隐藏处理,输出至发布单元;
发布单元,用于将经置换以及隐藏处理的产品用户数据进行封装后发布。
9.如权利要求8所述的装置,其特征在于,所述产品用户数据扰动器包括:随机数生成模块、分布函数存储模块以及置换处理模块,其中,
分布函数存储模块,用于存储用于置换处理的分布函数;
随机数生成模块,用于接收产品用户数据,从分布函数存储模块读取预先设置的分布函数,生成服从分布函数的随机数,输出至置换处理模块;
置换处理模块,用于根据生成的随机数对接收的产品用户数据进行置换处理,输出处理后的产品用户数据。
10.如权利要求8所述的装置,其特征在于,所述产品用户数据扰动器包括:分布函数存储模块、随机数生成模块、比较模块以及置换处理模块,其中,
分布函数存储模块,存储用于置换处理的服从[0,1]分布的分布函数;
随机数生成模块,用于接收产品用户数据,从分布函数存储模块读取预先设置的分布函数,生成服从分布函数的随机数,输出至比较模块;
比较模块,用于判断随机数是否小于预先设置的分布阈值,如果是,向置换处理模块输出指示置换信息,否则,向置换处理模块输出指示不作置换信息;
置换处理模块,用于接收产品用户数据,根据接收的指示置换信息将该产品用户数据中的用户敏感属性数据取值随机置换为该用户敏感属性数据包含的其他取值并输出,以及,根据接收的指示不作置换信息将该产品用户数据输出。
CN201010570571.0A 2010-11-26 2010-11-26 一种提高产品用户数据安全性的方法及装置 Active CN102480481B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010570571.0A CN102480481B (zh) 2010-11-26 2010-11-26 一种提高产品用户数据安全性的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010570571.0A CN102480481B (zh) 2010-11-26 2010-11-26 一种提高产品用户数据安全性的方法及装置

Publications (2)

Publication Number Publication Date
CN102480481A true CN102480481A (zh) 2012-05-30
CN102480481B CN102480481B (zh) 2015-01-07

Family

ID=46092963

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010570571.0A Active CN102480481B (zh) 2010-11-26 2010-11-26 一种提高产品用户数据安全性的方法及装置

Country Status (1)

Country Link
CN (1) CN102480481B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103067918A (zh) * 2012-12-25 2013-04-24 华为技术有限公司 一种通信网络中隐私数据匿名化方法、装置及系统
CN103544442A (zh) * 2013-10-10 2014-01-29 南京邮电大学 一种用于电子健康档案数据的个人隐私保护方法和装置
CN104966032A (zh) * 2015-07-22 2015-10-07 浙江大学 一种云端数据库中敏感信息随机化拟态方法
CN105991563A (zh) * 2015-02-05 2016-10-05 阿里巴巴集团控股有限公司 一种保护敏感数据安全的方法、装置及三方服务系统
CN106134142A (zh) * 2013-02-08 2016-11-16 汤姆逊许可公司 对抗大数据的推断攻击的隐私
CN107301350A (zh) * 2017-05-24 2017-10-27 国信优易数据有限公司 一种数据处理方法和系统
CN107483532A (zh) * 2017-06-28 2017-12-15 武汉斗鱼网络科技有限公司 一种行为数据的上传方法、资源服务器及存储介质
CN107480549A (zh) * 2017-06-28 2017-12-15 银江股份有限公司 一种面向数据共享的敏感信息脱敏方法及系统
CN108352103A (zh) * 2015-09-07 2018-07-31 诺基亚技术有限公司 隐私保护监测
CN109659030A (zh) * 2017-10-11 2019-04-19 联想(新加坡)私人有限公司 用于确定用户风险的装置、方法及设备可读介质
CN110197078A (zh) * 2018-04-28 2019-09-03 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机可读介质及电子设备
CN111008897A (zh) * 2019-12-23 2020-04-14 集奥聚合(北京)人工智能科技有限公司 一种基于雷达技术的银行卡拒件导流方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090132419A1 (en) * 2007-11-15 2009-05-21 Garland Grammer Obfuscating sensitive data while preserving data usability
CN101561854A (zh) * 2009-05-22 2009-10-21 江苏大学 一种序列模式挖掘隐私数据保护方法
CN101834872A (zh) * 2010-05-19 2010-09-15 天津大学 基于度优先的K-Anonymity匿名算法的数据处理方法
CN101866405A (zh) * 2010-06-23 2010-10-20 江苏大学 一种关联规则挖掘中隐私数据的保护方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090132419A1 (en) * 2007-11-15 2009-05-21 Garland Grammer Obfuscating sensitive data while preserving data usability
CN101561854A (zh) * 2009-05-22 2009-10-21 江苏大学 一种序列模式挖掘隐私数据保护方法
CN101834872A (zh) * 2010-05-19 2010-09-15 天津大学 基于度优先的K-Anonymity匿名算法的数据处理方法
CN101866405A (zh) * 2010-06-23 2010-10-20 江苏大学 一种关联规则挖掘中隐私数据的保护方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马廷淮等: ""基于隐私保护的数据挖掘"", 《计算机工程》, vol. 34, no. 9, 31 May 2008 (2008-05-31) *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103067918B (zh) * 2012-12-25 2017-04-12 华为技术有限公司 一种通信网络中隐私数据匿名化方法、装置及系统
CN103067918A (zh) * 2012-12-25 2013-04-24 华为技术有限公司 一种通信网络中隐私数据匿名化方法、装置及系统
CN106134142A (zh) * 2013-02-08 2016-11-16 汤姆逊许可公司 对抗大数据的推断攻击的隐私
CN103544442A (zh) * 2013-10-10 2014-01-29 南京邮电大学 一种用于电子健康档案数据的个人隐私保护方法和装置
CN105991563A (zh) * 2015-02-05 2016-10-05 阿里巴巴集团控股有限公司 一种保护敏感数据安全的方法、装置及三方服务系统
CN104966032A (zh) * 2015-07-22 2015-10-07 浙江大学 一种云端数据库中敏感信息随机化拟态方法
CN104966032B (zh) * 2015-07-22 2017-11-17 浙江大学 一种云端数据库中敏感信息随机化拟态方法
CN108352103A (zh) * 2015-09-07 2018-07-31 诺基亚技术有限公司 隐私保护监测
CN107301350A (zh) * 2017-05-24 2017-10-27 国信优易数据有限公司 一种数据处理方法和系统
CN107301350B (zh) * 2017-05-24 2020-07-14 国信优易数据有限公司 一种数据处理方法和系统
CN107483532A (zh) * 2017-06-28 2017-12-15 武汉斗鱼网络科技有限公司 一种行为数据的上传方法、资源服务器及存储介质
CN107480549B (zh) * 2017-06-28 2019-08-02 银江股份有限公司 一种面向数据共享的敏感信息脱敏方法及系统
CN107480549A (zh) * 2017-06-28 2017-12-15 银江股份有限公司 一种面向数据共享的敏感信息脱敏方法及系统
CN109659030A (zh) * 2017-10-11 2019-04-19 联想(新加坡)私人有限公司 用于确定用户风险的装置、方法及设备可读介质
CN110197078A (zh) * 2018-04-28 2019-09-03 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机可读介质及电子设备
CN110197078B (zh) * 2018-04-28 2023-01-24 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机可读介质及电子设备
CN111008897A (zh) * 2019-12-23 2020-04-14 集奥聚合(北京)人工智能科技有限公司 一种基于雷达技术的银行卡拒件导流方法
CN111008897B (zh) * 2019-12-23 2023-08-25 集奥聚合(北京)人工智能科技有限公司 一种基于雷达技术的银行卡拒件导流方法

Also Published As

Publication number Publication date
CN102480481B (zh) 2015-01-07

Similar Documents

Publication Publication Date Title
CN102480481A (zh) 一种提高产品用户数据安全性的方法及装置
CN103164416B (zh) 一种用户关系的识别方法及设备
US7200607B2 (en) Data analysis system for creating a comparative profile report
CN110100429A (zh) 实时检测并防止欺诈和滥用
US8255392B2 (en) Real time data collection system and method
CN108429718A (zh) 账号识别方法及装置
CN110321194A (zh) 员工职位信息可视化方法、装置、设备及存储介质
CN101853438A (zh) 一种电能表产品测试信息管理系统
CN102148712A (zh) 基于云计算的服务管理系统
CN103189885A (zh) 服务器、信息管理方法、信息管理程序以及记录该程序的计算机可读取的记录介质
CN106101098B (zh) 一种信息资产识别方法及装置
CN107977855B (zh) 一种管理用户信息的方法及装置
CN102184196A (zh) 一种信访综合管理信息系统
CN111708897A (zh) 目标信息确定方法、装置和设备
CN104166581B (zh) 一种面向增量制造设备的虚拟化方法
CN112862584A (zh) 一种基于大数据技术将财务成本、收入分摊到户的方法及系统
CN104657130A (zh) 一种对业务支撑系统进行分层分级的方法
CN104199828B (zh) 一种基于事务日志数据的社会网络构建方法
CN109598485A (zh) 一种突发事件报事方法及装置
CN109840688A (zh) 一种电力移动终端安全评估方法及装置
CN109213913A (zh) 一种农地承包经营权流转数据库管理系统
CN112950046B (zh) 一种电力市场关键机组与机组群的识别方法
CN108197494B (zh) 一种通过文化云平台进行用户管理的方法及装置
Neubauer et al. Development of a Processoriented Framework for Security Assessment of Cyber Physical Systems
Korres An Approach on Spatial Integration and Diffusion Process.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant