CN108920495B - 一种基于大数据的增值服务方法及系统 - Google Patents
一种基于大数据的增值服务方法及系统 Download PDFInfo
- Publication number
- CN108920495B CN108920495B CN201810500959.XA CN201810500959A CN108920495B CN 108920495 B CN108920495 B CN 108920495B CN 201810500959 A CN201810500959 A CN 201810500959A CN 108920495 B CN108920495 B CN 108920495B
- Authority
- CN
- China
- Prior art keywords
- user information
- privacy
- information
- data
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于大数据的增值服务方法及系统,该方法包括:获取用户信息;对所述用户信息进行去隐私处理,得到去隐私后的用户信息;对所述去隐私后的用户信息进行分类;对所述去隐私后的用户信息进行评价,得到对应的评价分数;根据所述评价分数和分类,为用户推荐相应的增值服务。通过去隐私处理用户信息,保护了用户隐私,防止用户个人隐私信息泄露;通过对用户信息分类和分数评价,总结归纳用户的行为偏好,进一步为用户推荐相应的增值服务,为用户提供便利。
Description
技术领域
本发明涉及大数据安全领域,特别涉及一种基于大数据的增值服务方法及系统。
背景技术
大数据商业应用深挖用户个人信息潜在价值。大数据在商业领域的典型应用体现为通过对用户行为的精准分析,提升用户体验,增强用户黏性,开展个性化营销。区分个体变得十分重要,对一定规模的关联信息的聚合分析可以还原并预测用户生活全貌,为个性化业务提供数据支撑。互联网通过后向收费模式,将个人信息转化为商业链的价值节点之一。技术发展为挖掘用户个人信息潜在价值提供条件。获取和存储成本的降低,使大规模信息的聚集变成可能。数据挖掘和数据分析技术,为用户个人信息二次开发提供了机会和条件,信息的潜在价值得到释放。大数据商业价值的挖掘,用户的精准定位,大数据中蕴藏的巨大商业价值被逐步挖掘出来,但是同时也带来了巨大的挑战——个人隐私信息的保护。个人信息与个人行为(比如位置信息、消费行为、网络访问行为)等,这些都是人的隐私,也是我们所关注的一类敏感信息,在大数据价值挖掘的基础上如何保护用户的隐私信息,对用户隐私信息脱敏,根据用户信息判断并分级,进而提供增值服务是当前急需解决的课题。
发明内容
本发明的目的是通过以下技术方案实现的。
一种基于大数据的增值服务方法,包括下列步骤:
获取用户信息;
对用户信息进行去隐私处理,得到去隐私后的用户信息;
对去隐私后的用户信息进行分类;
对去隐私后的用户信息进行评价,得到对应的评价分数;
根据评价分数和分类,为用户推荐相应的增值服务。
优选地,用户信息包括:注册信息、消费信息、快递信息。
优选地,去隐私处理用到基于K-anonymity的RSA算法,算法包括以下步骤:
获取多个用户信息数据样本,每个数据样本为一个特征向量;
将部分类别的数据隐匿;
P(q→q')表示q可以推出q'的概率,P(q'→q)表示q'可以推出q的概率,P(q→q')与P(q'→q)的概率随着λ的增大而增大,改变λ的值调节相对差的方差;
其中,B(q')表示相对偏差,var(R(q'))表示相对差的方差,suppD(q)表示属性组合q中包含的值在数据集D中占的比例,q与q'相差η个属性,η≤λ,k≤|q|-η,P(AttrSetsη+k,q')表示η+k个属性被匿名为相对应属性集q'的概率,i表示正整数,λ是每条用户信息中被匿名属性的个数,q∈D,q'∈D′,q为QI的任意属性集,q'为q的对应匿名属性组合,QI表示准标识符,q与q'是QI的子集|q|=|q'|≤m。
优选地,将去隐私后的用户信息作为FCM聚类算法的输入,将去隐私后的用户信息分类;
把去隐私后的用户信息数据特征向量分为c个模糊组,求得每组的聚类中心;
将数据归一化,使得一个数据集的隶属度和为1;
隶属度uij为:
其中,i表示集合中第i个模糊组,i=1,…,c;ci表示第i个聚类中心;k为正整数;j表示第j个数据点,j=1,…n;q'j表示第j个匿名属性组合;m表示加权指数;uij表示第j个数据点属于第i类的隶属度。
优选地,对去隐私后的分类用户信息按照预先设定的评分标准进行评价,去隐私后的用户信息得到相应的评价分数。
一种基于大数据的增值服务系统,系统包括:
获取模块,获取用户信息;
去隐私模块,对用户信息进行去隐私处理,得到去隐私后的用户信息;
分类模块,对去隐私后的用户信息进行分类;
评价模块,对去隐私后的用户信息进行评价,得到对应的评价分数;
推荐模块,根据评价分数和分类,为用户推荐相应的增值服务。
优选地,在获取模块中,用户信息包括:注册信息、消费信息、快递信息。
优选地,在去隐私模块中,去隐私处理用到基于K-anonymity的RSA算法,算法包括以下步骤:
获取多个用户信息数据样本,每个数据样本为一个特征向量;
将部分类别的数据隐匿;
P(q→q')表示q可以推出q'的概率,P(q'→q)表示q'可以推出q的概率,P(q→q')与P(q'→q)的概率随着λ的增大而增大,改变λ的值调节相对差的方差;
其中,B(q')表示相对偏差,var(R(q'))表示相对差的方差,suppD(q)表示属性组合q中包含的值在数据集D中占的比例,q与q'相差η个属性,η≤λ,k≤|q|-η,P(AttrSetsη+k,q')表示η+k个属性被匿名为相对应属性集q'的概率,i表示正整数,λ是每条用户信息中被匿名属性的个数,q∈D,q'∈D′,q为QI的任意属性集,q'为q的对应匿名属性组合,QI表示准标识符,q与q'是QI的子集|q|=|q'|≤m。
优选地,在分类模块中,将去隐私后的用户信息作为FCM聚类算法的输入,将去隐私后的用户信息分类;
把去隐私后的用户信息数据特征向量分为c个模糊组,求得每组的聚类中心;
将数据归一化,使得一个数据集的隶属度和为1;
隶属度uij为:
其中,i表示集合中第i个模糊组,i=1,…,c;ci表示第i个聚类中心;k为正整数;j表示第j个数据点,j=1,…n;q'j表示第j个匿名属性组合;m表示加权指数;uij表示第j个数据点属于第i类的隶属度。
优选地,在评价模块中,对去隐私后的分类用户信息按照预先设定的评分标准进行评价,去隐私后的用户信息得到相应的评价分数。
本发明的优点在于:
本发明提供了一种基于大数据的增值服务方法及系统,通过去隐私处理用户信息,保护了用户隐私,防止用户个人隐私信息泄露;通过对用户信息分类和分数评价,总结归纳用户的行为偏好,进一步为用户推荐相应的增值服务。
附图说明
通过阅读下文具体实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出具体实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
附图1示出了根据本发明实施方式的一种增值服务方法流程图;
附图2示出了根据本发明实施方式的一种增值服务系统结构图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
根据本发明的实施方式,提出一种基于大数据的增值服务方法及系统。一种基于大数据的增值服务方法,如图1所示,包括下列步骤:
获取用户信息;
对用户信息进行去隐私处理,得到去隐私后的用户信息;
对去隐私后的用户信息进行分类;
对去隐私后的用户信息进行评价,得到对应的评价分数;
根据评价分数和分类,为用户推荐相应的增值服务。
其中,用户信息包括:注册信息、消费信息、快递信息。
其中,去隐私处理用到基于K-anonymity的RSA算法,算法包括以下步骤:
获取多个用户信息数据样本,每个数据样本为一个特征向量;
将部分类别的数据隐匿;
P(q→q')表示q可以推出q'的概率,P(q'→q)表示q'可以推出q的概率,P(q→q')与P(q'→q)的概率随着λ的增大而增大,改变λ的值调节相对差的方差;
其中,B(q')表示相对偏差,var(R(q'))表示相对差的方差,suppD(q)表示属性组合q中包含的值在数据集D中占的比例,q与q'相差η个属性,η≤λ,k≤|q|-η,P(AttrSetsη+k,q')表示η+k个属性被匿名为相对应属性集q'的概率,i表示正整数,λ是每条用户信息中被匿名属性的个数,q∈D,q'∈D′,q为QI的任意属性集,q'为q的对应匿名属性组合,QI表示准标识符,q与q'是QI的子集|q|=|q'|≤m。
其中,将去隐私后的用户信息作为FCM聚类算法的输入,将去隐私后的用户信息分类;
把去隐私后的用户信息数据特征向量分为c个模糊组,求得每组的聚类中心;
将数据归一化,使得一个数据集的隶属度和为1;
隶属度uij为:
其中,i表示集合中第i个模糊组,i=1,…,c;ci表示第i个聚类中心;k为正整数;j表示第j个数据点,j=1,…n;q'j表示第j个匿名属性组合;m表示加权指数;uij表示第j个数据点属于第i类的隶属度。
其中,对去隐私后的分类用户信息按照预先设定的评分标准进行评价,去隐私后的用户信息得到相应的评价分数。
一种基于大数据的增值服务系统,如图2所示,系统包括:
获取模块,获取用户信息;
去隐私模块,对用户信息进行去隐私处理,得到去隐私后的用户信息;
分类模块,对去隐私后的用户信息进行分类;
评价模块,对去隐私后的用户信息进行评价,得到对应的评价分数;
推荐模块,根据评价分数和分类,为用户推荐相应的增值服务。
在获取模块中,用户信息包括:注册信息、消费信息、快递信息。
在去隐私模块中,去隐私处理用到基于K-anonymity的RSA算法,算法包括以下步骤:
获取多个用户信息数据样本,每个数据样本为一个特征向量;
将部分类别的数据隐匿;
P(q→q')表示q可以推出q'的概率,P(q'→q)表示q'可以推出q的概率,P(q→q')与P(q'→q)的概率随着λ的增大而增大,改变λ的值调节相对差的方差;
其中,B(q')表示相对偏差,var(R(q'))表示相对差的方差,suppD(q)表示属性组合q中包含的值在数据集D中占的比例,q与q'相差η个属性,η≤λ,k≤|q|-η,P(AttrSetsη+k,q')表示η+k个属性被匿名为相对应属性集q'的概率,i表示正整数,λ是每条用户信息中被匿名属性的个数,q∈D,q'∈D′,q为QI的任意属性集,q'为q的对应匿名属性组合,QI表示准标识符,q与q'是QI的子集|q|=|q'|≤m。
在分类模块中,将去隐私后的用户信息作为FCM聚类算法的输入,将去隐私后的用户信息分类;
把去隐私后的用户信息数据特征向量分为c个模糊组,求得每组的聚类中心;
将数据归一化,使得一个数据集的隶属度和为1;
隶属度uij为:
其中,i表示集合中第i个模糊组,i=1,…,c;ci表示第i个聚类中心;k为正整数;j表示第j个数据点,j=1,…n;q'j表示第j个匿名属性组合;m表示加权指数;uij表示第j个数据点属于第i类的隶属度。
在评价模块中,对去隐私后的分类用户信息按照预先设定的评分标准进行评价,去隐私后的用户信息得到相应的评价分数。
用户在平台注册信息,注册信息包括姓名、手机号、出生日期等。用户在平台浏览信息时,浏览的商品信息会保留在后台服务器中,用户的消费信息保存在后台服务器并更精准的反映用户的偏好和需求;用户购买的商品需邮寄时,须填写快递信息,包括用户的昵称、手机号、地址信息等。用户的相关信息:姓名、手机号、出生日期、浏览信息、消费信息、昵称、地址信息等,对用户的相关信息进行去隐私处理,用到K-anonymity的RSA算法。随后用FCM聚类算法对去隐私后的用户信息进行分类,将分类后的用户信息按照预先设定的评分标准进行评价,每个用户都有相应的评价分数。按照分数,对不同分数的用户推荐相应的增值服务。
以上,仅为本发明示例性的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种基于大数据的增值服务方法,其特征在于,包括下列步骤:
获取用户信息;
对所述用户信息进行去隐私处理,得到去隐私后的用户信息;
对所述去隐私后的用户信息进行分类;
对所述去隐私后的用户信息进行评价,得到对应的评价分数;
根据所述评价分数和分类,为用户推荐相应的增值服务;
其中,所述去隐私处理用到基于K-anonymity的RSA算法,所述算法包括以下步骤:
获取多个用户信息数据样本,每个数据样本为一个特征向量;
将部分类别的数据隐匿;
P(q→q')表示q可以推出q'的概率,P(q'→q)表示q'可以推出q的概率,P(q→q')与P(q'→q)的概率随着λ的增大而增大,改变λ的值调节相对差的方差;
其中,B(q')表示相对偏差,var(R(q'))表示相对差的方差,suppD(q)表示属性组合q中包含的值在数据集D中占的比例,q与q'相差η个属性,η≤λ,k≤|q|-η,P(AttrSetsη+k,q')表示η+k个属性被匿名为相对应属性集q'的概率,i表示正整数,λ是每条用户信息中被匿名属性的个数,q∈D,q'∈D′,q为QI的任意属性集,q'为q的对应匿名属性组合,QI表示准标识符,q与q'是QI的子集|q|=|q'|≤m。
2.如权利要求1所述的增值服务方法,其特征在于,所述用户信息包括:注册信息、消费信息、地址信息、快递信息。
4.如权利要求1所述的增值服务方法,其特征在于,对所述去隐私后的分类用户信息按照预先设定的评分标准进行评价,所述去隐私后的用户信息得到相应的评价分数。
5.一种基于大数据的增值服务系统,其特征在于,所述系统包括:
获取模块,获取用户信息;
去隐私模块,对所述用户信息进行去隐私处理,得到去隐私后的用户信息;
分类模块,对所述去隐私后的用户信息进行分类;
评价模块,对所述去隐私后的用户信息进行评价,得到对应的评价分数;
推荐模块,根据所述评价分数和分类,为用户推荐相应的增值服务;
其中,在所述去隐私模块中,所述去隐私处理用到基于K-anonymity的RSA算法,所述算法包括以下步骤:
获取多个用户信息数据样本,每个数据样本为一个特征向量;
将部分类别的数据隐匿;
P(q→q')表示q可以推出q'的概率,P(q'→q)表示q'可以推出q的概率,P(q→q')与P(q'→q)的概率随着λ的增大而增大,改变λ的值调节相对差的方差;
其中,B(q')表示相对偏差,var(R(q'))表示相对差的方差,suppD(q)表示属性组合q中包含的值在数据集D中占的比例,q与q'相差η个属性,η≤λ,k≤|q|-η,P(AttrSetsη+k,q')表示η+k个属性被匿名为相对应属性集q'的概率,i表示正整数,λ是每条用户信息中被匿名属性的个数,q∈D,q'∈D′,q为QI的任意属性集,q'为q的对应匿名属性组合,QI表示准标识符,q与q'是QI的子集|q|=|q'|≤m。
6.如权利要求5所述的系统,其特征在于,在所述获取模块中,所述用户信息包括:注册信息、消费信息、地址信息、快递信息。
8.如权利要求5所述的系统,其特征在于,在所述评价模块中,对所述去隐私后的分类用户信息按照预先设定的评分标准进行评价,所述去隐私后的用户信息得到相应的评价分数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810500959.XA CN108920495B (zh) | 2018-05-23 | 2018-05-23 | 一种基于大数据的增值服务方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810500959.XA CN108920495B (zh) | 2018-05-23 | 2018-05-23 | 一种基于大数据的增值服务方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108920495A CN108920495A (zh) | 2018-11-30 |
CN108920495B true CN108920495B (zh) | 2020-08-11 |
Family
ID=64402762
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810500959.XA Active CN108920495B (zh) | 2018-05-23 | 2018-05-23 | 一种基于大数据的增值服务方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108920495B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105138664A (zh) * | 2015-09-02 | 2015-12-09 | 中国地质大学(武汉) | 一种隐私保护的大数据推荐方法及系统 |
CN107392049A (zh) * | 2017-07-26 | 2017-11-24 | 安徽大学 | 一种基于差分隐私保护的推荐方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160140671A1 (en) * | 2014-11-17 | 2016-05-19 | Jin Hong | System and Method for Dynamically Generating A Content Correlated Service Based Mobile Social Network |
-
2018
- 2018-05-23 CN CN201810500959.XA patent/CN108920495B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105138664A (zh) * | 2015-09-02 | 2015-12-09 | 中国地质大学(武汉) | 一种隐私保护的大数据推荐方法及系统 |
CN107392049A (zh) * | 2017-07-26 | 2017-11-24 | 安徽大学 | 一种基于差分隐私保护的推荐方法 |
Non-Patent Citations (1)
Title |
---|
面向快递信息的个性化隐私保护研究;刘建昆等;《河北大学学报(自然科学版)》;20170331;第294-301页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108920495A (zh) | 2018-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106503006B (zh) | 应用App中子应用的排序方法及装置 | |
Zamani et al. | Situational context for ranking in personal search | |
US8341169B2 (en) | Open profile content identification | |
CN112148987B (zh) | 基于目标对象活跃度的消息推送方法及相关设备 | |
Ge et al. | Cost-aware collaborative filtering for travel tour recommendations | |
WO2018040069A1 (zh) | 信息推荐系统及方法 | |
Zhao et al. | Mining user attributes using large-scale app lists of smartphones | |
CN106844407B (zh) | 基于数据集相关性的标签网络产生方法和系统 | |
CN106682686A (zh) | 一种基于手机上网行为的用户性别预测方法 | |
CN110322281B (zh) | 相似用户的挖掘方法及装置 | |
CN107943910B (zh) | 一种基于组合算法的个性化图书推荐方法 | |
Riederer et al. | " I don't have a photograph, but you can have my footprints." Revealing the Demographics of Location Data | |
CN110852785A (zh) | 用户分级方法、装置及计算机可读存储介质 | |
Wang et al. | Gender prediction based on data streams of smartphone applications | |
Zhao et al. | Demographic attributes prediction through app usage behaviors on smartphones | |
CN115204881A (zh) | 一种数据处理方法、装置、设备及存储介质 | |
Brunsdon et al. | Predicting participation in higher education: A comparative evaluation of the performance of geodemographic classifications | |
CN108920495B (zh) | 一种基于大数据的增值服务方法及系统 | |
CN114625973B (zh) | 一种匿名信息跨域推荐方法、装置、电子设备及存储介质 | |
Zhao et al. | Investigating smartphone user differences in their application usage behaviors: an empirical study | |
Nazi et al. | The TagAdvisor: Luring the lurkers to review web items | |
Guo et al. | Prediction of Purchase Intention among E-Commerce Platform Users Based on Big Data Analysis. | |
d’Aloisio et al. | Enhancing fairness in classification tasks with multiple variables: a data-and model-agnostic approach | |
CN112434126B (zh) | 一种信息处理方法、装置、设备和存储介质 | |
Keerthi Chandra et al. | Collective embedding with feature importance: A unified approach for spatiotemporal network embedding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: 100029 Third Floor of Yansha Shengshi Building, 23 North Third Ring Road, Xicheng District, Beijing Patentee after: GUOZHENGTONG TECHNOLOGY Co.,Ltd. Address before: 100195 Haidian District, Beijing, 18 apricot Road, No. 1 West Tower, four floor. Patentee before: GUOZHENGTONG TECHNOLOGY Co.,Ltd. |