CN107862056A - 关联数据的推荐系统中基于编码的匿名推荐方法 - Google Patents
关联数据的推荐系统中基于编码的匿名推荐方法 Download PDFInfo
- Publication number
- CN107862056A CN107862056A CN201711099907.8A CN201711099907A CN107862056A CN 107862056 A CN107862056 A CN 107862056A CN 201711099907 A CN201711099907 A CN 201711099907A CN 107862056 A CN107862056 A CN 107862056A
- Authority
- CN
- China
- Prior art keywords
- project
- code
- coding
- user
- good friend
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000008569 process Effects 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- 230000010354 integration Effects 0.000 claims description 3
- 230000007774 longterm Effects 0.000 abstract description 12
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- 238000006116 polymerization reaction Methods 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 241000283074 Equus asinus Species 0.000 description 1
- 206010068052 Mosaicism Diseases 0.000 description 1
- 241000256856 Vespidae Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 210000003765 sex chromosome Anatomy 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种关联数据的推荐系统中基于编码的匿名推荐方法,其允许用户添加长期和短期好友构建好友圈,以兼顾用户的长期和短期兴趣;并在圈内构建个性化项目编码,并生成用户特征码发给推荐中心,由推荐中心基于特征码进行运算得到合成推荐。本发明的目的是充分考虑用户间的关联关系以及个人的兴趣爱好,以好友圈的形式将数据局部化以有效规避大数据量问题,允许好友重叠以解决局部的项目多样性问题,以用户特征码形式实现在保护用户隐私信息的同时获得有效、准确的推荐列表。
Description
技术领域
本发明涉及数据安全技术领域,具体涉及一种关联数据的推荐系统中基于编码的匿名推荐方法。
背景技术
近年来,推荐系统被广泛应用到很多领域,例如电子商务、社交网络,个性化阅读与广告,基于位置的服务和移动推荐等。推荐系统的本质就是根据收集的数据信息分析,用来预测一个给定的用户是否会喜欢一个特定的项目,可知要达到好的推荐效果一定是来自于丰富而准确的数据信息(用户信息,偏好信息和项目信息等)。基于关联数据的推荐系统可以将来自于多种不同数据源的数据关联起来,对用户数据信息进行更深入的分析与模式挖掘,能够实现对用户的跨领域语义推荐,增强用户在信息查询等多方面的体验,并能够有效的解决基于传统推荐系统的推荐技术难以解决的问题,正逐渐成为人们关注的热点之一。
关联数据可以视为语义网的一种实现方式,它通过发布和链接网上的结构化数据使得来自不同领域的数据相互关联。简单地说,关联数据可以在不同来源的数据之间建立连接,便于更好的使用。然而,数据的相互关联增强了攻击者的背景知识,会带来更为严重的隐私问题,受到了社会和公众的日益重视。隐私保护是互联网中长期存在的问题,关联数据由于需要利用用户的多领域来源数据,包括历史行为信息、用户的人口统计属性信息甚至用户的社交网络信息而面临严峻的隐私保护问题。用户的隐私泄露给恶意用户会形成针对系统的攻击。一个不能很好保护用户隐私的系统会让用户缺少安全感,不愿提供更多个人信息,造成无法提供有效推荐。目前,如何在保护用户隐私的同时能利用关联数据获得有效推荐就成了基于关联数据的推荐系统发展的主要瓶颈。
传统的隐私保护技术主要采用准标识符的泛化、扰乱或桶化等简单的匿名处理方法,但匿名处理后的数据经过篡改后无法获得准确推荐,大大降低了数据的利用价值。而且在实际应用中,现存的匿名技术由于计算量大无法适用于基于关联数据的推荐环境中。相比较传统数据的隐私保护技术而言,基于关联数据的推荐系统中的隐私问题更具挑战性,主要体现在以下几个方面:
(1)常用的泛化匿名技术计算量大,适合离线处理,而基于关联数据的推荐系统是一种应用于网络环境中的推荐系统,可以进行频繁的数据互动与更新,数据是动态更新的,只能在线处理;
(2)基于关联数据的推荐系统要求推荐能动态响应用户的需求需要收集精确数据,但常用的泛化匿名技术通常采用泛化、扰乱等篡改数据的手段,无法获得有效推荐;
(3)多维数据的交叉利用:据调查数据显示,基于社交、朋友的推荐往往更受欢迎,推荐成功率更高;但用户之间的关联信息会增强攻击者的背景知识,导致隐私信息泄露风险更高;
(4)如何融合用户的长期兴趣和短期兴趣:用户的兴趣可以分为长期兴趣和短期兴趣。短期兴趣随着时间的推移动态发生变化,比如一女用户突然关注婴儿用品,那很可能该用户怀孕或已经有生宝宝了,而推荐系统依然推荐她平时喜好的服饰肯定不能很好的符合用户需求。而是应该根据用户短期的动态兴趣的变化及时推荐孕婴日用品,反而会给用户带来惊喜体验感。因此,如何在保证不伤害用户长期兴趣的前提下充分满足用户的短期兴趣是研究的难点。
发明内容
本发明所要解决的是现存的匿名技术由于计算量大无法适用于基于关联数据的推荐环境中的问题,提供一种关联数据的推荐系统中基于编码的匿名推荐方法。
为解决上述问题,本发明是通过以下技术方案实现的:
关联数据的推荐系统中基于编码的匿名推荐方法,具体包括步骤如下:
步骤1.被推荐用户通过自动添加好友来构建好友圈;
步骤2.好友圈内的被推荐用户及其所有好友将自己所关注的项目的编码构成项目编码,并在项目编码之前添加好友圈编号和更新版本号后,形成编码库;
步骤3.好友圈内的所有好友根据项目编码的顺序对照自己所关注的项目生成相应的好友编码,并在好友编码之前添加好友圈编号及更新版本号后,形成好友特征码,发送给推荐中心;同时,被推荐用户也根据该朋友圈的项目编码的顺序对照自己所关注的项目生成相应的用户编码,并在用户编码之前添加好友圈编号和更新版本号后,形成用户特征码,发送给推荐中心;
步骤4.推荐中心将被推荐用户的用户特征码与对应好友圈的所有好友的好友特征码进行比较,选出与用户特征码的相似度排在前k位的好友特征码;并以被推荐用户特征码为参考码,将k个选出的好友特征码进行按位或运算后得到推荐编码;并由推荐中心将推荐编码发给被推荐用户;其中k为设定值;
步骤5.被推荐用户收到推荐编码后,结合项目编码进行解码,得到推荐的项目信息。
上述方法中,被推荐用户属于1个以上的好友圈。
上述步骤1中,被推荐用户通过不同方式分别添加社交好友和陌生好友来构建好友圈;对于添加社交好友,被推荐用户直接通过社交数据查找用户名添加;对于添加陌生好友,通过推荐中心根据用户标签推荐,被推荐用户有选择性地添加。
上述步骤2中,项目编码的构建过程如下:
项目编码的构建由被推荐用户发起,被推荐用户将自己所关注的项目的编码添加到项目编码中,并转发给好友圈中任一个社交好友H1;
社交好友H1将自己所关注且被推荐用户未关注过的项目的编码添加到项目编码中,并转发给下一个社交好友H2;社交好友H2将自己所关注且之前好友和被推荐用户未关注过的项目的编码添加到项目编码中,并继续转发给下一个社交好友H3,依次类推,直到所有社交好友均已经将自己所关注且之前好友和被推荐用户未关注过的项目的编码添加到项目编码中;
最后一个社交好友Hn选择转发给任一陌生好友L1,陌生好友L1将自己所关注且之前好友和被推荐用户未关注过的项目的编码添加到项目编码中,并继续转发给下一个陌生好友L2;陌生好友L2将自己所关注且之前好友和被推荐用户未关注过的项目的编码添加到项目编码中,并继续转发给下一个陌生好友L3,依次类推,直到所有陌生好友均已经将自己所关注且之前好友和被推荐用户未关注过的项目的编码添加到项目编码中;
最后一个陌生好友Lm将项目编码中项目的编码打乱后生成最终的项目编码;
其中n为好友圈中社交好友的个数,m为好友圈中陌生好友的个数。
上述步骤2中,项目的编码以随机顺序添加到项目编码中。
上述步骤2中,项目编码采用主动和/或定期更新方式:当好友圈中的好友关注了项目编码里面没有的项目时,则将新增项目的编码主动更新到当前项目编码并发布;如果超过设定时间周期项目编码没有更新过时,则对当前项目编码进行周期顺序打乱更新并发布。
上述步骤4中,采用海明距离比较好友编码与用户编码的相似度;海明距离越高,则说明好友编码与用户编码的相似度越低;反之,则说明好友编码与用户编码的相似度越高。
针对如何在关联数据的背景下进行匿名有效推荐的问题,本发明提出采用基于特征码的匿名策略来实现动态数据更新并保护用户隐私。该策略允许用户添加长期和短期好友构建好友圈,以兼顾用户的长期和短期兴趣;并在圈内构建个性化项目编码,并生成用户特征码(自己关注的项目信息,代表兴趣爱好,通过编码的方式实现用户数据隐私保护)发给推荐中心,由推荐中心基于特征码进行运算得到合成推荐(合成推荐保护被推荐好友的隐私)。本发明的目的是充分考虑用户间的关联关系以及个人的兴趣爱好,以好友圈的形式将数据局部化以有效规避大数据量问题,以用户特征码在保护用户隐私信息的同时能获得有效、准确的推荐列表。
与现有技术相比,本发明具有如下特点:
(1)两种类型的好友兼顾用户长期和短期兴趣:用户基于社交网络数据,可通过用户名查找指定用户(如亲人,社交网络中的朋友等,用户名通过社交关系获得)添加长期好友;为兼顾多样性和用户的短期兴趣,用户可提供关键字向推荐中心申请临时好友,推荐中心返回推荐好友时给出推荐理由(同为孕妈,都是新加入用户,有多个共同好友等),用户可根据推荐解释有选择的添加好友。因为好友的添加直接影响到推荐的精度。所以用户选择时可以根据自己更愿意看到什么样的同类人正在关注什么能有效提高推荐的精准性。
(2)采用个性化项目编码的方式局部化数据以规避大数据量问题而又不失多样性。项目编码的构建只考虑好友圈内的用户所关注项目,大大降低数据的维度。但如果只考虑圈内的项目难免会存在多样性问题,本策略中以允许好友圈中存在交叉重叠的方式将项目多样性从局部有效的扩展到全局。
(3)采用特征码的形式实现隐私保护:每个好友圈可主动根据所关注的项目构建个性化项目编码,编码定期更新以添加用户动态关注的项目。每个用户根据项目编码构建自己的特征码发给推荐中心以获得推荐。特征码包括好友圈标识,更新版本号,该用户所关注的项目编码。其中好友圈标识用于推荐中心快速定位本圈好友并进行推荐,更新版本号用于过滤过期的推荐信息,用户所关注的项目编码用于分析该用户的兴趣爱好并进行关联推荐。由于推荐中心并不知道好友圈的项目编码,所以就算拿到特征码也无法获知用户所关注的项目(比如所购买的商品等),达到隐私保护的目的。
(4)采用合谋推荐的形式防止恶意用户攻击:推荐中心进行推荐时,首先根据好友圈标识找到同圈的其他好友,通常同圈好友连续存放,以方便查找,并根据特征码的相似度选择相似度较高的k(k≥2)个编码聚合成推荐编码并发给用户,以防止恶意用户能猜出被推荐好友的项目列表,泄露隐私。
附图说明
图1为关联数据的推荐系统中基于编码的匿名推荐方法。
具体实施方式
本发明根据所适用的推荐系统的不同,其用户所关注(也即推荐)的项目也会有所不同。假如是商品交易类的推荐系统,所关注的项目(推荐)为购买的商品,如淘宝、京东、亚马逊或美团等等;假如是旅游类的推荐系统,所关注的项目(推荐)为旅游景点,如百度旅行、蚂蜂窝、穷游网或驴妈妈等等;假如是求职类的推荐系统,所关注的项目(推荐)为工作,如智联招聘、51job或中华英才网等等;假如是文献类的推荐系统,所关注的项目(推荐)为文章,如中国知网、百度学术或万方数据知识服务平台等等。
本实施例以交易类推荐系统为例,对本发明进行说明,参见图1,一种关联数据的推荐系统中基于编码的匿名推荐方法,具体包括步骤如下:
步骤1:构建好友圈,用户通过两种方式分别添加社交好友和陌生好友。好友的添加需双方同意。
方式一,添加社交好友,以社交数据为背景,通过用户名查找社交网络中亲戚朋友并添加为好友(长期兴趣)
方式二,添加陌生好友,为保证推荐系统的多样性,由推荐系统根据用户标签信息为用户推荐好友,并解释推荐理由,用户可有选择性的添加(短期兴趣)。好友添加需要双方验证。
为兼顾用户的长期兴趣与短期兴趣,本发明基于社交网络数据设计了一种适合于实时推荐机制的好友机制来构建好友圈,用户可以根据社交网络信息添加长期好友,也可以根据推荐中心添加临时好友。
添加长期社交好友:为保证用户的长期兴趣以及增加好友之间的信任度,本发明的好友机制利用社交网络的数据交叉来构建好友圈,增加购买成功率,并能有效避免用户冷启动问题。用户添加好友时通过已知的用户名查找,(通常是基于社交网络中的亲戚或朋友,信任度高,),双方确认后添加。
添加临时兴趣好友:为保证好友数量同时兼顾用户的临时兴趣,比如婚庆喜事,孕妇等临时性事件,用户可提供关键字通过推荐中心获取带标签的推荐,推荐中心给出推荐理由,由用户自行选择是否添加,以保证用户能添加自己侧重或关注的兴趣点。用户对此兴趣点不再关注时,可主动解除好友关系,并申请添加其他好友。
朋友的朋友之间的信任值是可传递的。好友之间的信任关系分为两种:H信任等级,基于社交建立起来的亲戚朋友关系,信任度高;L信任等级,基于推荐建立起来的具有某种相似性的临时好友关系,信任度低。每个用户可以属于多个好友圈,但针对每个好友圈的特征码均不一样,因为特征码与所在圈的编码以及项目编码有关,而项目编码又与好友圈内的用户所购买的项目有关,且顺序随机,实现多重隐私保护。
步骤2:构建个性化的编码库。编码库依次由好友圈编号+更新版本号+项目编码组成,如表1所示:
好友圈编号 | 更新版本号 | 项目编码:项目1,项目2,……,项目n |
1 | 1 | 11111111111111 |
表1编码库格式
根据好友圈所有用户关注的项目信息构建项目编码,项目编码的项目顺序随机,以保证项目编码个性化,并采用主动定期更新模式。为便于推荐识别和周期更新,项目编码前还添加有好友圈编号和更新版本号。好友圈的编码可由推荐中心统一分发,更新版本号根据更新周期递增。
项目编码的构建:由被推荐用户发起,用户将自己所购买的项目的编码以随机顺序添加到项目编码,并转发给好友圈中具有H信任等级的任一用户a,该用户a将自己所购买的项目,且之前用户没有购买过的项目以随机顺序输入项目编码并标记为项目编码已登记,发给任一H信任等级的用户b,用户b在此基础上添加自己购买的项目,如存在重复的则不再做修改,添加非重复的项目进项目编码,并优先选择未登记过的H信任等级的好友继续转发(此选择策略为保证隐私,因为亲戚朋友中不存在恶意用户,而对于推荐的临时好友则不可知,但该策略可以保证临时好友在获得项目编码时已经添加了不止一个用户的所购项目信息,使其无法区分库中项目是属于哪一位用户的,以达到隐私保护的目的),如H信任等级的好友均已登记,则选择任一未登记的L信任等级好友转发。以此类推,直到圈内所有的用户都已进行项目编码登记。最后一位用户将项目编码中项目再次打乱后生成项目编码。
数据积累与增量更新。项目编码采用主动定期更新方式,主动更新:当用户购买了项目编码里面没有的项目则主动更新项目编码库并发布;周期更新:如果超过一个时间周期没有更新过,为防止恶意用户泄露,进行周期顺序打乱并更新发布。周期时间长短可根据圈内用户的隐私要求的高低来确定。当用户购买了项目编码中没有的项目则主动添加到项目编码中,并打乱已有项目顺序,更新版本号,重新生成项目编码并发布给好友。但是,随着时间的积累,项目编码会随着用户数据的更新变得越来越大。本发明通过一个阈值N来控制项目编码的大小。当项目编码的大小超过N时,对圈内所有用户的某一时间点之间的项目信息进行丢弃,直到项目编码的尺寸小于N/2(为避免更新抖动,即刚更新过很短时间内又需要更新,造成过多的无用信息)。
步骤3:生成用户特征码。根据好友圈编码库生成用户特征码(如在多个好友圈则生成多个特征码)发送给推荐中心。
项目编码构建完成后,每个用户存储项目编码,并根据编码的顺序对照自己所购买的项目生成特征码。特征码依次由好友圈编号+更新版本号+用户编码组成。用户特征码的好友圈编号和更新版本号照抄编码库的好友圈编号和更新版本号。用户特征码的用户编码部分,对照自己所购买的项目,已购买的项目对应位置为1,未购买的项目对应位置为0即可,同一好友圈内的特征码长度一致,不同好友圈内的特征码长度可以不一样,如表2所示:
好友圈编号 | 更新版本 | 项目库:项目1,项目2,……,项目n |
1 | 1 | 00011001100001 |
表2好友特征码和用户特征码格式
步骤4:匿名合谋推荐。推荐中心根据用户特征码所对应好友圈以及所在好友圈的其他用户特征码进行比较,找到相似度较高的top-k特征码,进行聚合后推荐给用户,推荐项目数量至少不会少于n个(n可以用户指定或默认)。由于推荐中心没有项目编码信息,无法识别用户的项目信息,实现精确而匿名的推荐目的。
每个用户根据圈内的项目编码生成自己的特征码提交给推荐中心,推荐中心无法识别用户购买了什么项目,但可以根据特征码完成圈内合谋推荐,实现精确推荐的同时保证隐私安全。
匿名合谋推荐主要由推荐中心根据用户的特征码找到圈内相似度较高的top-k圈内特征码进行聚合得到推荐编码。由于推荐过程推荐中心不知道项目编码库信息,所以无法将编码与项目信息关联起来,从而实现了匿名推荐。但推荐信息返回给用户时,为避免被推荐好友的隐私泄露,采取合谋聚合的方法,一方面保护隐私,另一方面提高推荐的多样性。为避免过期推荐,当推荐中心发现同一好友圈内有更高更新版本号的特征码时即对过期特征码进行丢弃。
(1)用户选择。推荐中心根据特征码所对应的好友圈编码以及更新版本号信息识别具有同一好友圈的同一更新版本的好友,并将用户项目编码与该好友圈内的项目编码进行相似度比较,本发明采用海明距离进行编码的相似度比较,也就是特征码中对应位上编码不同的位数即为码距,又称海明距离。海明距离越高,说明所购买项目不同的越多,也就是兴趣爱好差的越远。本策略中以被推荐用户特征码作为参照编码,选择与之相距的海明距离最低的top-k编码进行下一步的聚合推荐,也就是反过来最为相似的k个用户(称为候选编码)。k的设置可根据隐私安全强度来设置,k小于当前拥有的好友数。
(2)数据聚合。选择好k个用户编码之后,以被推荐用户的项目编码作为参照码,将其他k个用户的编码进行或运算,也就是在k个编码中的对应位,对应位上只要有一个用户为1,则聚合结果为1,否则聚合结果为0;并将参照码中为1的位,在聚合结果中均置为0,其他不变,最后得到推荐编码。由推荐中心将推荐编码发给被推荐用户。
(3)推荐解码。用户收到推荐编码后,对照项目编码,解码获得推荐列表。
步骤5:解码获得推荐。用户收到推荐编码后结合项目编码进行解码,得到推荐的项目信息。
至此,整个数据匿名推荐过程已完成。我们可以看到在推荐过程中,对于用户的项目信息未做任何修改,因此可以获得较高精度的推荐,但同时又通过特征码形式实现了用户数据的匿名,使推荐系统无法识别某个编码对应于某个项目信息,因此用户隐私数据得到很好的保护。推荐中心并不知道自己推荐了什么项目,各用户购买了什么项目,整个过程都是匿名的。但用户数据又是真实的,因此保证了推荐的精确性。此外,该推荐系统具有很好的推荐成功率和推荐多样性,原因一是该系统中交叉利用了社交网络数据,一方面增强用户之间的信任度,另一方面提高推荐到关注的转化成功率;原因二是推荐系统中允许用户存在于多个好友圈,使得推荐项目的多样性可以扩展到整个系统,不再局限于圈内的局部用户,解决了局部多样性问题。本发明对于在多维数据交叉等复杂领域中存在的隐私与推荐之间的难题—实现保护用户隐私安全的同时提供精确推荐的问题提供了一种较为巧妙的实现方法。
为帮助理解,下面中给出一个编码聚合实例,对于特征码为011000100的用户,当k=3时,由以下候选编码聚合后可得到如表3所示的推荐编码:
表3特征码聚合计算的实例
需要说明的是,尽管以上本发明所述的实施例是说明性的,但这并非是对本发明的限制,因此本发明并不局限于上述具体实施方式中。在不脱离本发明原理的情况下,凡是本领域技术人员在本发明的启示下获得的其它实施方式,均视为在本发明的保护之内。
Claims (8)
1.关联数据的推荐系统中基于编码的匿名推荐方法,其特征是,具体包括步骤如下:
步骤1.被推荐用户通过自动添加好友来构建好友圈;
步骤2.好友圈内的被推荐用户及其所有好友将自己所关注的项目的编码构成项目编码,并在项目编码之前添加好友圈编号和更新版本号后,形成编码库;
步骤3.好友圈内的所有好友根据项目编码的顺序对照自己所关注的项目生成相应的好友编码,并在好友编码之前添加好友圈编号及更新版本号后,形成好友特征码,发送给推荐中心;同时,被推荐用户也根据该朋友圈的项目编码的顺序对照自己所关注的项目生成相应的用户编码,并在用户编码之前添加好友圈编号和更新版本号后,形成用户特征码,发送给推荐中心;
步骤4.推荐中心将被推荐用户的用户特征码与对应好友圈的所有好友的好友特征码进行比较,选出与用户特征码的相似度排在前k位的好友特征码;并以被推荐用户特征码为参考码,将k个选出的好友特征码进行按位或运算后得到推荐编码;并由推荐中心将推荐编码发给被推荐用户;其中k为设定值;
步骤5.被推荐用户收到推荐编码后,结合项目编码进行解码,得到推荐的项目信息。
2.根据权利要求1所述的关联数据的推荐系统中基于编码的匿名推荐方法,其特征是,被推荐用户属于1个以上的好友圈。
3.根据权利要求1所述的关联数据的推荐系统中基于编码的匿名推荐方法,其特征是,步骤1中,被推荐用户通过不同方式分别添加社交好友和陌生好友来构建好友圈;对于添加社交好友,被推荐用户直接通过社交数据查找用户名添加;对于添加陌生好友,通过推荐中心根据用户标签推荐,被推荐用户有选择性地添加。
4.根据权利要求3所述的关联数据的推荐系统中基于编码的匿名推荐方法,其特征是,步骤2中,项目编码的构建过程如下:
项目编码的构建由被推荐用户发起,被推荐用户将自己所关注的项目的编码添加到项目编码中,并转发给好友圈中任一个社交好友H1;
社交好友H1将自己所关注且被推荐用户未关注过的项目的编码添加到项目编码中,并转发给下一个社交好友H2;社交好友H2将自己所关注且之前好友和被推荐用户未关注过的项目的编码添加到项目编码中,并继续转发给下一个社交好友H3,依次类推,直到所有社交好友均已经将自己所关注且之前好友和被推荐用户未关注过的项目的编码添加到项目编码中;
最后一个社交好友Hn选择转发给任一陌生好友L1,陌生好友L1将自己所关注且之前好友和被推荐用户未关注过的项目的编码添加到项目编码中,并继续转发给下一个陌生好友L2;陌生好友L2将自己所关注且之前好友和被推荐用户未关注过的项目的编码添加到项目编码中,并继续转发给下一个陌生好友L3,依次类推,直到所有陌生好友均已经将自己所关注且之前好友和被推荐用户未关注过的项目的编码添加到项目编码中;
最后一个陌生好友Lm将项目编码中项目的编码打乱后生成最终的项目编码;
其中n为好友圈中社交好友的个数,m为好友圈中陌生好友的个数。
5.根据权利要求1或4所述的关联数据的推荐系统中基于编码的匿名推荐方法,其特征是,步骤2中,项目的编码以随机顺序添加到项目编码中。
6.根据权利要求1所述的关联数据的推荐系统中基于编码的匿名推荐方法,其特征是,步骤2中,项目编码采用主动和/或定期更新方式:当好友圈中的好友关注了项目编码里面没有的项目时,则将新增项目的编码主动更新到当前项目编码并发布;如果超过设定时间周期项目编码没有更新过时,则对当前项目编码进行周期顺序打乱更新并发布。
7.根据权利要求1所述的关联数据的推荐系统中基于编码的匿名推荐方法,其特征是,步骤4中,采用海明距离比较好友编码与用户编码的相似度;海明距离越高,则说明好友编码与用户编码的相似度越低;反之,则说明好友编码与用户编码的相似度越高。
8.根据权利要求1所述的关联数据的推荐系统中基于编码的匿名推荐方法,其特征是,k≥2。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711099907.8A CN107862056B (zh) | 2017-11-09 | 2017-11-09 | 关联数据的推荐系统中基于编码的匿名推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711099907.8A CN107862056B (zh) | 2017-11-09 | 2017-11-09 | 关联数据的推荐系统中基于编码的匿名推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107862056A true CN107862056A (zh) | 2018-03-30 |
CN107862056B CN107862056B (zh) | 2021-09-24 |
Family
ID=61701524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711099907.8A Active CN107862056B (zh) | 2017-11-09 | 2017-11-09 | 关联数据的推荐系统中基于编码的匿名推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107862056B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110505145A (zh) * | 2019-08-16 | 2019-11-26 | 上海掌门科技有限公司 | 一种通讯录添加方法及终端 |
CN112948683A (zh) * | 2021-03-16 | 2021-06-11 | 山西大学 | 一种社交信息动态融合的社会化推荐方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080294584A1 (en) * | 1994-11-29 | 2008-11-27 | Pinpoint Incorporated | Customized electronic newspapers and advertisements |
CN102801657A (zh) * | 2012-09-03 | 2012-11-28 | 鲁赤兵 | 一种复合型微博系统和方法 |
CN103971060A (zh) * | 2014-05-09 | 2014-08-06 | 广西师范大学 | 移动电子商务实时推荐中的p2p隐私管理方法 |
CN104572797A (zh) * | 2014-05-12 | 2015-04-29 | 深圳市智搜信息技术有限公司 | 基于主题模型的个性化服务推荐系统和方法 |
CN105740366A (zh) * | 2016-01-26 | 2016-07-06 | 哈尔滨工业大学深圳研究生院 | 微博用户兴趣推理方法及装置 |
-
2017
- 2017-11-09 CN CN201711099907.8A patent/CN107862056B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080294584A1 (en) * | 1994-11-29 | 2008-11-27 | Pinpoint Incorporated | Customized electronic newspapers and advertisements |
CN102801657A (zh) * | 2012-09-03 | 2012-11-28 | 鲁赤兵 | 一种复合型微博系统和方法 |
CN103971060A (zh) * | 2014-05-09 | 2014-08-06 | 广西师范大学 | 移动电子商务实时推荐中的p2p隐私管理方法 |
CN104572797A (zh) * | 2014-05-12 | 2015-04-29 | 深圳市智搜信息技术有限公司 | 基于主题模型的个性化服务推荐系统和方法 |
CN105740366A (zh) * | 2016-01-26 | 2016-07-06 | 哈尔滨工业大学深圳研究生院 | 微博用户兴趣推理方法及装置 |
Non-Patent Citations (1)
Title |
---|
王利娥 等: "移动商务推荐系统中的一种基于P2P的隐私保护策略", 《计算机科学》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110505145A (zh) * | 2019-08-16 | 2019-11-26 | 上海掌门科技有限公司 | 一种通讯录添加方法及终端 |
CN110505145B (zh) * | 2019-08-16 | 2021-08-10 | 上海掌门科技有限公司 | 一种通讯录添加方法及终端 |
CN112948683A (zh) * | 2021-03-16 | 2021-06-11 | 山西大学 | 一种社交信息动态融合的社会化推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107862056B (zh) | 2021-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Soloveitchik | Rupture and Reconstruction: The Transformation of Modern Orthodoxy | |
Xu et al. | Information security in big data: privacy and data mining | |
US8984647B2 (en) | Systems, methods, and computer readable media for security in profile utilizing systems | |
US9348916B2 (en) | Method and system for providing search services for a social media ecosystem | |
CN106202331A (zh) | 分层次隐私保护的推荐系统及基于该推荐系统的作业方法 | |
CN107634897B (zh) | 群推荐方法和装置 | |
US9619780B2 (en) | Information exchange in the social network environment | |
CN106254314B (zh) | 一种位置查询服务信息保护方法及系统 | |
CN106530047A (zh) | 一种新型互联网购物系统 | |
US20100030811A1 (en) | System and method for managing customer address information in electronic commerce using the internet | |
CN107862056A (zh) | 关联数据的推荐系统中基于编码的匿名推荐方法 | |
CN101216829A (zh) | 内容搜索系统、设备及其方法 | |
CN103678624A (zh) | 搜索方法、搜索服务器、搜索请求执行方法及终端 | |
CN116777476A (zh) | 基于公钥可搜索加密的药品可信溯源方法 | |
JP2006236165A (ja) | 口コミ情報共有装置 | |
CN106961386A (zh) | 一种签到服务中的位置隐私保护方法 | |
CN108319659B (zh) | 一种基于加密图像快速搜索的社交发现方法 | |
Zhang et al. | LPPS‐AGC: Location Privacy Protection Strategy Based on Alt‐Geohash Coding in Location‐Based Services | |
Zichichi et al. | Towards decentralized complex queries over distributed ledgers: a data marketplace use-case | |
CN111488352A (zh) | 基于业务数据区块链的积分兑换方法及装置 | |
Chan et al. | Reputation-based trust evaluation mechanism for decentralized environments and its applications based on smart contracts | |
Piao et al. | A novel scheme on service recommendation for mobile users based on location privacy protection | |
Zhu | Research on multi‐source mobile commerce service recommendation model of data fusion based on tree network | |
CN111488343A (zh) | 基于业务数据区块链的电商数据上链方法及装置 | |
Jaafor et al. | Privacy threats from social networking service aggregators |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |