CN108920495B

CN108920495B - 一种基于大数据的增值服务方法及系统

Info

Publication number: CN108920495B
Application number: CN201810500959.XA
Authority: CN
Inventors: 李首峰; 李莉莉; 孙立宏; 陈放
Original assignee: Guozhengtong Technology Co ltd
Current assignee: Guozhengtong Technology Co ltd
Priority date: 2018-05-23
Filing date: 2018-05-23
Publication date: 2020-08-11
Anticipated expiration: 2038-05-23
Also published as: CN108920495A

Abstract

本发明提供一种基于大数据的增值服务方法及系统，该方法包括：获取用户信息；对所述用户信息进行去隐私处理，得到去隐私后的用户信息；对所述去隐私后的用户信息进行分类；对所述去隐私后的用户信息进行评价，得到对应的评价分数；根据所述评价分数和分类，为用户推荐相应的增值服务。通过去隐私处理用户信息，保护了用户隐私，防止用户个人隐私信息泄露；通过对用户信息分类和分数评价，总结归纳用户的行为偏好，进一步为用户推荐相应的增值服务，为用户提供便利。

Description

一种基于大数据的增值服务方法及系统

技术领域

本发明涉及大数据安全领域，特别涉及一种基于大数据的增值服务方法及系统。

背景技术

大数据商业应用深挖用户个人信息潜在价值。大数据在商业领域的典型应用体现为通过对用户行为的精准分析，提升用户体验，增强用户黏性，开展个性化营销。区分个体变得十分重要，对一定规模的关联信息的聚合分析可以还原并预测用户生活全貌，为个性化业务提供数据支撑。互联网通过后向收费模式，将个人信息转化为商业链的价值节点之一。技术发展为挖掘用户个人信息潜在价值提供条件。获取和存储成本的降低，使大规模信息的聚集变成可能。数据挖掘和数据分析技术，为用户个人信息二次开发提供了机会和条件，信息的潜在价值得到释放。大数据商业价值的挖掘,用户的精准定位,大数据中蕴藏的巨大商业价值被逐步挖掘出来,但是同时也带来了巨大的挑战——个人隐私信息的保护。个人信息与个人行为(比如位置信息、消费行为、网络访问行为)等，这些都是人的隐私，也是我们所关注的一类敏感信息，在大数据价值挖掘的基础上如何保护用户的隐私信息，对用户隐私信息脱敏，根据用户信息判断并分级，进而提供增值服务是当前急需解决的课题。

发明内容

本发明的目的是通过以下技术方案实现的。

一种基于大数据的增值服务方法，包括下列步骤：

获取用户信息；

对用户信息进行去隐私处理，得到去隐私后的用户信息；

对去隐私后的用户信息进行分类；

对去隐私后的用户信息进行评价，得到对应的评价分数；

根据评价分数和分类，为用户推荐相应的增值服务。

优选地，用户信息包括：注册信息、消费信息、快递信息。

优选地，去隐私处理用到基于K-anonymity的RSA算法，算法包括以下步骤：

获取多个用户信息数据样本，每个数据样本为一个特征向量；

将部分类别的数据隐匿；

P(q→q')表示q可以推出q'的概率，P(q'→q)表示q'可以推出q的概率，P(q→q')与P(q'→q)的概率随着λ的增大而增大，改变λ的值调节相对差的方差；

其中，B(q')表示相对偏差，var(R(q'))表示相对差的方差，supp_D(q)表示属性组合q中包含的值在数据集D中占的比例，q与q'相差η个属性，η≤λ，k≤|q|-η，P(AttrSets^η+k,q')表示η+k个属性被匿名为相对应属性集q'的概率，i表示正整数，λ是每条用户信息中被匿名属性的个数，q∈D,q'∈D′,q为QI的任意属性集，q'为q的对应匿名属性组合，QI表示准标识符，q与q'是QI的子集|q|＝|q'|≤m。

优选地，将去隐私后的用户信息作为FCM聚类算法的输入，将去隐私后的用户信息分类；

把去隐私后的用户信息数据特征向量分为c个模糊组，求得每组的聚类中心；

将数据归一化，使得一个数据集的隶属度和为1；

隶属度u_ij为：

其中，i表示集合中第i个模糊组，i＝1,…,c；c_i表示第i个聚类中心；k为正整数；j表示第j个数据点，j＝1,…n；q'_j表示第j个匿名属性组合；m表示加权指数；u_ij表示第j个数据点属于第i类的隶属度。

优选地，对去隐私后的分类用户信息按照预先设定的评分标准进行评价，去隐私后的用户信息得到相应的评价分数。

一种基于大数据的增值服务系统，系统包括：

获取模块，获取用户信息；

去隐私模块，对用户信息进行去隐私处理，得到去隐私后的用户信息；

分类模块，对去隐私后的用户信息进行分类；

评价模块，对去隐私后的用户信息进行评价，得到对应的评价分数；

推荐模块，根据评价分数和分类，为用户推荐相应的增值服务。

优选地，在获取模块中，用户信息包括：注册信息、消费信息、快递信息。

优选地，在去隐私模块中，去隐私处理用到基于K-anonymity的RSA算法，算法包括以下步骤：

将部分类别的数据隐匿；

优选地，在分类模块中，将去隐私后的用户信息作为FCM聚类算法的输入，将去隐私后的用户信息分类；

将数据归一化，使得一个数据集的隶属度和为1；

隶属度u_ij为：

优选地，在评价模块中，对去隐私后的分类用户信息按照预先设定的评分标准进行评价，去隐私后的用户信息得到相应的评价分数。

本发明的优点在于：

本发明提供了一种基于大数据的增值服务方法及系统，通过去隐私处理用户信息，保护了用户隐私，防止用户个人隐私信息泄露；通过对用户信息分类和分数评价，总结归纳用户的行为偏好，进一步为用户推荐相应的增值服务。

附图说明

通过阅读下文具体实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出具体实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

附图1示出了根据本发明实施方式的一种增值服务方法流程图；

附图2示出了根据本发明实施方式的一种增值服务系统结构图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反，提供这些实施方式是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

根据本发明的实施方式，提出一种基于大数据的增值服务方法及系统。一种基于大数据的增值服务方法，如图1所示，包括下列步骤：

获取用户信息；

对用户信息进行去隐私处理，得到去隐私后的用户信息；

对去隐私后的用户信息进行分类；

对去隐私后的用户信息进行评价，得到对应的评价分数；

根据评价分数和分类，为用户推荐相应的增值服务。

其中，用户信息包括：注册信息、消费信息、快递信息。

其中，去隐私处理用到基于K-anonymity的RSA算法，算法包括以下步骤：

将部分类别的数据隐匿；

其中，将去隐私后的用户信息作为FCM聚类算法的输入，将去隐私后的用户信息分类；

将数据归一化，使得一个数据集的隶属度和为1；

隶属度u_ij为：

其中，对去隐私后的分类用户信息按照预先设定的评分标准进行评价，去隐私后的用户信息得到相应的评价分数。

一种基于大数据的增值服务系统，如图2所示，系统包括：

获取模块，获取用户信息；

分类模块，对去隐私后的用户信息进行分类；

在获取模块中，用户信息包括：注册信息、消费信息、快递信息。

在去隐私模块中，去隐私处理用到基于K-anonymity的RSA算法，算法包括以下步骤：

将部分类别的数据隐匿；

在分类模块中，将去隐私后的用户信息作为FCM聚类算法的输入，将去隐私后的用户信息分类；

将数据归一化，使得一个数据集的隶属度和为1；

隶属度u_ij为：

在评价模块中，对去隐私后的分类用户信息按照预先设定的评分标准进行评价，去隐私后的用户信息得到相应的评价分数。

用户在平台注册信息，注册信息包括姓名、手机号、出生日期等。用户在平台浏览信息时，浏览的商品信息会保留在后台服务器中，用户的消费信息保存在后台服务器并更精准的反映用户的偏好和需求；用户购买的商品需邮寄时，须填写快递信息，包括用户的昵称、手机号、地址信息等。用户的相关信息：姓名、手机号、出生日期、浏览信息、消费信息、昵称、地址信息等，对用户的相关信息进行去隐私处理，用到K-anonymity的RSA算法。随后用FCM聚类算法对去隐私后的用户信息进行分类，将分类后的用户信息按照预先设定的评分标准进行评价，每个用户都有相应的评价分数。按照分数，对不同分数的用户推荐相应的增值服务。

以上，仅为本发明示例性的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。