CN105554704B - 推荐系统中基于假轨迹的位置隐私保护方法 - Google Patents

推荐系统中基于假轨迹的位置隐私保护方法 Download PDF

Info

Publication number
CN105554704B
CN105554704B CN201510968954.6A CN201510968954A CN105554704B CN 105554704 B CN105554704 B CN 105554704B CN 201510968954 A CN201510968954 A CN 201510968954A CN 105554704 B CN105554704 B CN 105554704B
Authority
CN
China
Prior art keywords
user
track
semantic
node
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510968954.6A
Other languages
English (en)
Other versions
CN105554704A (zh
Inventor
朱晓妍
赵木鱼
池浩田
张澍扬
裴庆祺
王勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201510968954.6A priority Critical patent/CN105554704B/zh
Publication of CN105554704A publication Critical patent/CN105554704A/zh
Application granted granted Critical
Publication of CN105554704B publication Critical patent/CN105554704B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity

Abstract

本发明公开了一种用于推荐系统的基于假轨迹的位置隐私保护方法。其技术方案是:1.建立由用户、公共位置数据库、推荐服务运营商构成的通信系统框架;2.用户缓存真实位置轨迹,并转换成对应的语义轨迹;3.用户对公共位置数据库中位置数据的语义类别建立位置类别层次树,并根据位置数据的相似度进行聚类;4.用户利用维特比算法生成假轨迹;5.用户将假轨迹上传推荐服务运营商,保护用户位置隐私。本发明将用户真实位置的语义类别作为维特比算法的输入生成假轨迹,计算中不涉及用户的真实位置,使服务运营商难以推测用户的位置,在保护用户位置隐私的同时提高推荐系统的服务质量,可用于用户兴趣推荐的移动社交网络。

Description

推荐系统中基于假轨迹的位置隐私保护方法
技术领域
本发明属于无线网络技术领域,涉及位置隐私的保护,用于用户兴趣推荐的移动社交网络。
背景技术
社交网络,是随着Email、BBS、博客、微博等Internet的应用而自然发展起来的反映社会交往群体的一种形态,是提供一个在人群中分享兴趣、爱好、状态和活动等信息的在线平台。随着智能手机、车载移动终端等多种移动设备的普及,以及传感网技术的应用,使用移动终端设备来访问社交网络越来越流行,移动社交网络逐渐成为主流。根据尼尔森在2013年2月发布的最新报告显示,目前全球超过一半社交网络用户通过手机等移动设备来访问社交网络。在移动社交网络的所有应用中,基于位置服务(LBS)的应用非常流行。无论是传统的天气预报提示、GPS导航信息,还是Twitter、Facebook、Foursquare、微信等应用都得到了广泛的关注和发展。利用基于位置的推荐服务的移动社交网络,用户可以更加准确、高效地同具有相同兴趣爱好的人或物发生联系,建立起自己的社交网络圈,从而更好地融入周围环境。
然而,在用户享受移动社交网络便利时,其隐私也可能已经暴露给了不可信的第三方。例如,用户希望上传自己的历史位置轨迹和当前所在位置给推荐服务运营商来获取推荐服务,在这种场景下,用户如果完全上传自己真实的位置信息,可能会泄露当前的位置信息,即位置隐私,以及由位置推出的其它相关敏感信息,包括健康状况、社会地位,家庭和工作住址等;而如果用户使用GPS导航软件,则会连续不断地将自己的位置信息发送给服务运营商,这样,除了泄漏上述的隐私以外,还会泄漏用户在某段时间的移动轨迹,日程安排等信息。因此,用户需要面临一个选择:一方面,用户需要向服务运营商提供更加精确的位置才能获取高质量的基于位置的推荐服务;另一方面,精确的位置信息又会泄漏用户的隐私。正是因为这些顾虑,使得很多潜在用户对使用基于位置推荐服务的移动社交网络望而却步。
无论是政府、工业界还是学术界,都对这一问题给予了极大关注。例如欧洲委员会通过了《隐私与电子通信法》,对电子通信处理个人数据时的隐私保护问题给出了明确的法律规定;运营商方面,全球最大的移动通信运营商之一沃达丰也制订了一套隐私管理业务条例;而在学术界,这一问题也得到了广泛的研究。
目前常见的一些位置隐私保护方案主要有基于位置匿名的方法和基于混淆的方法。
在基于位置匿名的方法中,用户的真实位置由于被隐藏在若干个位置中而无法被区分。在这类方法中,k-匿名是一种广泛采用的隐私程度衡量标准。当用户的位置被隐藏在k个位置中且每个位置被认为是真实位置的概率都相等时,便达到了k-匿名。传统的集中式位置匿名方法需要依赖可信第三方将邻近的k个用户在服务请求中提供的位置进行混合后再向服务提供商发出请求以达到k-匿名。然而,由于可信第三方掌握全部用户的位置信息,一旦被黑客攻击,系统中全部用户的隐私将被泄露。为了消除对可信第三方的依赖,Kido等人首次提出了分布式的位置匿名方法,通过用户自己产生虚假用户来达到k-匿名,以消除对可信第三方的依赖。然而由于服务运营商掌握大量边信息而用户的信息则有限,这种信息的不平衡导致用户很难自己产生对服务运营商具有足够隐藏性的虚假用户信息。因此用户自己选择虚假用户的方法很难真正地达到k-匿名的隐私保护程度。
基于混淆的方法是通过位置偏移、位置量化等技术来进行位置模糊,从而用不精确的位置来向服务运营商请求服务。但位置信息的不精确会导致推荐服务质量的降低,对位置的模糊处理的程度必须适应服务质量的要求,当服务质量要求较高时,位置的模糊程度受到限制,便得位置信息不能受到足够的保护。
综上所述,采用上述两种方法仍然会导致位置在一定程度上的泄露,并且获得的服务质量也有一定的限制。
此外,在上述两类方法中,k-匿名是通过将用户的真实位置隐匿在一些虚假位置中达到位置隐私保护,通过位置偏移的基于混淆的方式是对原本的位置在地域上作一定的偏离或是将位置进行泛化,从而使服务器或攻击者不能确定用户的真实位置。然而,目前的k-匿名和基于混淆的隐私保护基本上未考虑位置数据的语义属性,产生的假位置在语义上可能与真实位置完全无关。因此,将上述两种位置隐私保护技术应用于位置推荐系统中会导致服务质量的降低。
发明内容
本发明的目的在于针对上述已有技术的不足,提出一种推荐系统中假位置的位置隐私保护方法,以实现在保护用户位置隐私的同时提高推荐系统的服务质量。
本发明的思路是:通过用户产生与真实位置地理上不同但是语义上相似的假轨迹,用户在向服务运营商请求位置服务时,只需上传生成的假轨迹,其技术方案包括如下:为实现上述目的,本发明包括如下步骤:
(1)建立一个由用户U、公共位置数据集C、推荐服务运营商Se构成的通信系统框架,其中:
用户U,用于通过3G或4G蜂窝网或WiFi与公共位置数据集C和服务运营商Se进行通信;
公共位置数据集C,用于存储从社交网站上下载的其他用户的签到位置、轨迹以及与其他用户身份相关的数据信息;
推荐服务运营商Se,用于接收用户U的请求并为其提供相关的位置推荐服务;
(2)用户U获取当前所在位置L,并根据地图上标注的L的语义位置,提取出具体的与经营类别相关的位置类型,即为位置L的语义属性;
(3)用户U生成位置轨迹,并转换成对应的语义轨迹:
(3a)用户U缓存1到T时间内的位置数据,将这些位置数据按照发生的时间先后生成一条轨迹TR={L1,L2,L3,…,Li,Li+1,…,Ln},Li是t∈{1,2,…,T}时间的位置数据,i∈{1,2,…,n}是正整数,n是用户自定义的整型参数,其代表轨迹中位置点的个数,T是缓存时间的最大值,T=24小时;
(3b)轨迹TR中所有位置的语义属性构成序列O={o1,o2,o3,…,oi,oi+1,…,on},该序列O即是位置轨迹TR对应的语义轨迹,oi表示位置Li的语义属性,1<i<n;
(4)根据位置的语义属性,用户对公共位置数据集C中的位置进行聚类:
(4a)用户U对公共位置数据集C中的位置数据进行处理,即删除所有与其他用户的身份直接关联的信息,只保留数据集中的位置标识,位置的经纬度值和语义类别;
(4b)用户U根据公共位置数据集C中位置数据的语义类别建立位置类别层次树,其中位置类别层次树是一种树形结构,它的根节点表示为位置,中间节点及叶子节点为位置数据的语义类别;
(4c)用户U计算位置类别层次树中语义类别间的距离D,并根据距离D计算语义类别间的相似度;
(4d)用户U计算公共位置数据集C中所有位置与用户的物理位置Li之间的相似度;
(4e)将TR={L1,L2,L3,…,Li,Li+1,…,Ln}作为聚类质心点,利用k-means聚类算法对公共位置数据集C中的位置进行聚类,输出n个语义类S={S1,S2,…,Si,Si+1,…,Sn};
(4f)从语义类S={S1,S2,…,Si,Si+1,…,Sn}中除去轨迹TR={L1,L2,L3,…,Li,Li+1,…,Ln},实现对公共位置数据集C中位置数据的聚类S′=S-TR={S′1,S′2,…,S′i,S′i+1,…,S′n},其中S′i是第i个类;
(5)用户U输入聚类S′和语义轨迹O,利用维特比算法生成假轨迹FL={FL1,FL2,…,FLi,FLi+1,…,FLn},然后保存此假轨迹FL;
(6)当用户U请求推荐服务时,用户U将假轨迹FL上传到推荐服务运营商Se中,保护用户的真实轨迹。
本发明具有如下优点
1)本发明中引入了位置相似度的概念,并且通过使用位置数据的语义类别的相似度来度量位置之间的相似度,降低了计算复杂度;
2)本发明由于删除了公共位置数据库C中与其他用户身份直接相关的数据信息,保证了其他用户的身份的安全性;
3)本发明由于生成假轨迹时考虑位置数据的语义属性,在实现保护用户位置隐私的同时提高了推荐系统的服务质量。
附图说明
图1是本发明的原理图;
图2是本发明的实现流程图;
图3是用本发明构建的通信系统框架;
图4是本发明中构建的位置类别层次树。
具体实施方案
参照图1,本发明的核心思想是用户提取真实轨迹TR中每个位置的语义属性,形成语义序列O={o1,o2,o3,…,oi,oi+1,…,on},然后根据语义序列O对公共位置数据库中的位置按照其相应语义属性进行分类,形成语义类S={S1,S2,…,Si,Si+1,…,Sn},为保护用户位置的隐私,从语义类S中除去真实轨迹TR中的位置,形成聚类S′=S-TR。在已知聚类S′和语义类O前提下生成假轨迹FL={FL1,FL2,…,FLi,FLi+1,…,FLn}的过程可建模为隐马尔科夫模型,其中O={o1,o2,o3,…,oi,oi+1,…,on}作为隐马尔科夫模型中的可观察序列,S′中的位置序列作为隐马尔科夫模型中的隐藏序列,用户采用维特比算法计算假轨迹FL={FL1,FL2,…,FLi,FLi+1,…,FLn},当用户需要向推荐系统服务器请求服务时,用户提交假轨迹FL给推荐服务运营商,保护自己的位置隐私,
参照图2,本发明的实现步骤如下:
步骤1,建立通信系统框架。
参照图3,本步骤建立的通信系统包括:用户U、公共位置数据库C、推荐系统服务运营商Se。其中用户U与公共位置数据库C和推荐服务运营商Se均通过3G或4G蜂窝网或WiFi进行无线连接。
所述用户U,包含GPS模块、应用模块和缓存模块三个功能模块;该GPS模块用于获得并向应用模块提供用户的地理位置信息,该应用模块用于为用户请求和接收位置服务,该缓存模块用于存储和管理用户的假轨迹;
所述公共位置数据库C,是从社交网站上下载的其他用户的签到位置、轨迹以及与其他用户身份相关的数据信息;
所述推荐服务运营商Se,包含数据库K和应用模块两个功能模块;该数据库K用于存储服务数据,该应用模块接收用户位置服务请求并为用户返回位置推荐数据。由于推荐系统服务运营商掌握用户在服务请求消息中提供的位置、服务需求信息,并可能出于商业目的将用户隐私信息出卖给广告公司或者可能被黑客攻击,从而导致用户隐私泄露,因此服务运营商是不完全可信的,在本发明中推荐系统服务运营商Se是主要的攻击者。
步骤2,用户U提取真实轨迹中每个位置的语义属性,形成语义轨迹。
(2a)用户U缓存从GPS模块中接收到的1到T时间段内的位置数据{L1,L2,L3,…,Ln},并将这些位置数据按照发生的时间先后生成一条轨迹TR={L1,L2,L3,…,Li,Li+1,…,Ln},其中Li表示轨迹TR中的第i个位置,1<i<n,n是用户自定义的整型参数,其代表轨迹中位置点的个数,T是缓存时间的最大值,T=24小时;
(2b)用户U提取真实轨迹TR={L1,L2,L3,…,Li,Li+1,…,Ln}中每个位置的语义属性,构成语义序列O={o1,o2,o3,…,oi,oi+1,…,on},该序列O即是位置轨迹TR对应的语义轨迹,位置的语义属性指的是与经营类别相关的位置类型,其中oi代表轨迹轨迹TR中位置Li对应的语义属性。
步骤3,用户U根据公共位置数据库C中位置数据的语义属性构建位置类别层次树。
参照图4,本步骤的具体实现如下:
(3a)用户U对公共位置数据集C中的位置数据进行处理,即删除所有与其他用户的身份直接关联的信息,只保留数据集中的位置标识,位置的经纬度值与语义类别;
(3b)用户U对公共位置数据集C中位置数据的语义类别进行统计,构建成位置类别层次树;
位置类别层次树是一种树形结构,它的根节点表示为位置,中间节点及叶子节点为位置数据的语义类别,位置类别层次树的层数取决于公共位置数据集C中位置的语义类别的精确程度,其第二层节点为公共位置数据集C中位置数据的最大的语义类别,上一层节点对应的语义类别是下一层节点的抽象类别,位置类别层次树的层级越往下,节点代表的类别越小。
步骤4,用户U对公共位置数据库C中的位置数据按照位置语义的相似性进行k-means聚类。
常用的聚类方法有基于划分方法的k-means聚类算法、基于层次方法的凝聚和分裂层次聚类算法、基于神经网络的SOM聚类算法和基于模型的聚类算法。本发明中对公共位置数据库C中的位置数据的聚类是采用基于划分方法的k-means聚类算法,具体实现如下:
(4a)用户U将真实轨迹TR中的n个位置存入到公共位置数据库C中,处理后表示为位置数据库C′;
(4b)用户U计算位置数据库C′中任意两位置的语义类别间的距离,将位置数据库C′中任意两位置的语义类别分别映射到位置类别层次树中的两个节点A和B中,节点A和B间的距离即为两位置的语义类别间的距离,可通过以下步骤计算节点A和B间的距离;
(4b1)用户U输入位置数据库C′中两个节点A和B,迭代计算A和B节点间的距离D(A,B),其中D(A,B)的初始值为0,若输入的A和B为同一节点,则距离D(A,B)=0,否则,执行步骤(4b2);
(4b2)根据A节点与B节点的关系,计算两节点之间的距离D(A,B):
若A.level=B.level,则将A.parent和B.parent分别赋给A和B,此时A和B的距离为D(A,B)=D(A,B)+A.childNum+B.childNum;
若A.level<B.level,则将A.parent赋给A,然后计算A和B的距离D(A,B)=D(A,B)+A.childNum;
若A.level>B.level,则将B.parent赋给B,计算A和B的距离D(A,B)=D(A,B)+B.childNum;
其中,A.level表示节点A在位置类别层次树中的层级,B.level表示节点B在位置类别层次树中的层级,A.parent代表A节点的父节点,B.parent代表B节点的父节点,A.childNum代表的是A节点的孩子节点个数,B.childNum表示B节点的孩子节点个数;
(4b3)重复执行步骤(4b2),直到满足A=B,此时计算得到的D(A,B)为A和B的距离;
(4c)用户U根据计算出的A和B节点之间的距离D(A,B)计算节点A和B在位置类别层次树中的相似度:
sim(A,B)=1/(1+D(A,B)),
其中sim(A,B)是节点A和B之间的相似度。
从而实现了对公共位置数据库C中语义类别间相似度计算和公共位置数据集C中所有位置与用户的物理位置Li之间的相似度的计算。
(4d)将TR={L1,L2,L3,…,Li,Li+1,…,Ln}作为聚类质心点,利用k-means聚类算法对公共位置数据集C中的位置进行聚类,输出n个语义类S={S1,S2,…,Si,Si+1,…,Sn};
(4e)从语义类S={S1,S2,…,Si,Si+1,…,Sn}中除去轨迹TR={L1,L2,L3,…,Li,Li+1,…,Ln},实现对公共位置数据集C中位置数据的聚类S′=S-TR={S′1,S′2,…,S′i,S′i+1,…,S′n},其中S′i是第i个类。
步骤5,用户U生成假轨迹FL={FL1,FL2,…,FLi,FLi+1,…,FLn}。
(5a)用户U输入聚类S′和语义轨迹O,利用维特比算法生成假轨迹FL={FL1,FL2,…,FLi,FLi+1,…,FLn};
在已知聚类S′和语义轨迹O时,计算假轨迹FL的过程可建模为隐马尔可夫模型,其中聚类S′和语义轨迹O是已知序列,假轨迹FL是隐含序列,隐马尔可夫模型中计算隐含序列的方法有前向算法、维特比算法和前向-后向算法,本发明中利用维特比算法;
为了利用维特比算法计算假轨迹FL,需计算模型中聚类S′中相邻类间的转移矩阵L、发射矩阵E和初始数组I;聚类S′中相邻类间的转移矩阵L可通过步骤(5a1)计算,发射矩阵E通过步骤(5a2)计算,初始数组I通过步骤(5a3)计算:
(5a1)用户U计算聚类S′中两个相邻类中的位置之间的转移矩阵L:
其中,lij是前一个类中第i个位置转移到后面一个类中第j个位置的概率,要求∑ilij=1,1<i<m,1<j<n′,m是类S′i中的位置数据的个数,n′是类S′j中的位置数据的个数,lij可通过下式计算
其中l′j是类S′j中的位置数据,li是类S′i中的位置数据,oj是用户U的真实轨迹TR中的第j个位置的语义属性,oi是第i个位置的语义属性,c′j是位置l′j的语义类别,ci是位置li的语义类别,ε是归一化因子,是一个正整数;
(5a2)用户U计算发射矩阵E:
其中,eij是输出位置li后观察到的语义属性为oj的概率,可通过下式计算:
eij=pr(oj|li)=sim(oj,li)/α,
其中1<i<q,1<j<n,其中sim(oj,li)是位置li的语义属性与oj的相似度,α是归一化因子,是一个正整数,q是聚类S′中的位置数的最大值;
(5a3)用户U计算初始数组I={I11,I21,I31,…,Ii1,…,Im′1}T,Ii1是初始时刻输出第i个位置的概率,其通过下式计算:
Ii1=pr(o1|li)=sim(o1,li)/η,
其中o1初始时刻的语义属性,η是归一化因子,是一个正整数,{·}T表示矩阵的转置,m′是类S′1中的位置数;
(5b)用户U将步骤(5a1)计算出的转移矩阵L、步骤(5a2)计算的发射矩阵E和步骤(5a3)计算出的初始数组I输入到维特比算法中,生成假轨迹FL={FL1,FL2,…,FLi,FLi+1,…,FLn}。
步骤6,用户U将生成的假轨迹FL进行缓存,当需要向推荐服务运营商Se请求服务时用户将缓存的假轨迹上传到推荐服务运营商Se上;
在基于位置的推荐系统中推荐服务运营商Se是从用户上传的位置数据的语义属性中提取用户的兴趣信息,然后根据提取的用户兴趣向用户推荐用户可能感兴趣的服务。本发明中用户生成的假轨迹与用户的真实轨迹是地理上不同但是语义属性相似的,所以推荐服务运营商Se可从用户上传的假轨迹中提取与真实轨迹相同的用户兴趣信息,由于用户未向推荐服务运营商Se泄露自己的真实轨迹,从而保护了自己的位置隐私。
本发明的优点可通过以下分析进一步说明
1.实验运行工具
本实验中的算法用Java程序编写,运行设备为2.5GHz的双核CPU,内存为2G的计算机。
2.实验内容与结果
本实验选定FourSquare注册用户在美国旧金山的位置签到数据进行实验,各种语义类别的签到位置数如下:食品类中签到位置有4109个,商店&服务类别中签到位置有1697个,商店&服务类中的签到位置有1607个,居民区类中签到位置数有566个,娱乐场所类中签到位置有874个,户外&休闲娱乐类中有520个签到位置。实验选定用户ID为1的用户的一天内的签到位置数据作为真实位置,如表1所示;
表1 用户的真实位置及语义类别
表1中位置标识栏中从上至下是对真实位置按照时间先后排序,语义类别栏中是对应真实位置的语义属性。
本实验的仿真结果如表2,表2中位置标识栏中从上至下依次是对表1中相应位置的真实位置生成的假位置,例如表1中位置Jane Warner Plaza生成假位置Fireside Bar,语义类别栏中是对应假位置的语义属性。
表2 生成的假位置
对比表1与表2可以看出,生成的用户假位置与对应的真实位置有相同的语义属性,但是地理上不相同,推荐服务运营商Se可以从假位置中获取与真实位置同样的关于用户的位置语义属性和兴趣信息,但是不泄露用户的真实位置。因此本发明在实现保护用户位置隐私的同时提高了推荐系统的服务质量。

Claims (3)

1.推荐系统中基于假轨迹的位置隐私保护方法,包括:
(1)建立一个由用户U、公共位置数据集C、推荐服务运营商Se构成的通信系统框架,其中:
用户U,用于通过3G或4G蜂窝网或WiFi与公共位置数据集C和服务运营商Se进行通信;
公共位置数据集C,用于存储从社交网站上下载的其他用户的签到位置、轨迹以及与其他用户身份相关的数据信息;
推荐服务运营商Se,用于接收用户U的请求并为其提供相关的位置推荐服务;
(2)用户U获取当前所在位置L,并根据地图上标注的L的语义位置,提取出具体的与经营类别相关的位置类型,即为位置L的语义属性;
(3)用户U生成位置轨迹,并转换成对应的语义轨迹:
(3a)用户U缓存1到T时间内的位置数据,将这些位置数据按照发生的时间先后生成一条轨迹TR={L1,L2,L3,…,Li,Li+1,…,Ln},Li是t∈{1,2,…,T}时间的位置数据,i∈{1,2,…,n}是正整数,n是用户自定义的整型参数,其代表轨迹中位置点的个数,T是缓存时间的最大值,T=24小时;
(3b)轨迹TR中所有位置的语义属性构成序列O={o1,o2,o3,…,oi,oi+1,…,on},该序列O即是位置轨迹TR对应的语义轨迹,oi表示位置Li的语义属性,1<i<n;
(4)根据位置的语义属性,用户对公共位置数据集C中的位置进行聚类:
(4a)用户U对公共位置数据集C中的位置数据进行处理,即删除所有与其他用户的身份直接关联的信息,只保留数据集中的位置标识,位置的经纬度值和语义类别;
(4b)用户U根据公共位置数据集C中位置数据的语义类别建立位置类别层次树,其中位置类别层次树是一种树形结构,它的根节点表示为位置,中间节点及叶子节点为位置数据的语义类别;
(4c)用户U计算位置类别层次树中语义类别间的距离D,并根据距离D计算语义类别间的相似度;
(4d)用户U计算公共位置数据集C中所有位置与用户的物理位置Li之间的相似度;
(4e)将TR={L1,L2,L3,…,Li,Li+1,…,Ln}作为聚类质心点,利用k-means聚类算法对公共位置数据集C中的位置进行聚类,输出n个语义类S={S1,S2,…,Si,Si+1,…,Sn};
(4f)从语义类S={S1,S2,…,Si,Si+1,…,Sn}中除去轨迹TR={L1,L2,L3,…,Li,Li+1,…,Ln},实现对公共位置数据集C中位置数据的聚类S′=S-TR={S′1,S′2,…,S′i,S′i+1,…,S′n},其中S′i是第i个类;
(5)用户U输入聚类S′和语义轨迹O,利用维特比算法生成假轨迹FL={FL1,FL2,…,FLi,FLi+1,…,FLn},然后保存此假轨迹FL;
(6)当用户U请求推荐服务时,用户U将假轨迹FL上传到推荐服务运营商Se中,保护用户的真实轨迹。
2.根据权利要求1所述的方法,其中步骤(4c)中计算位置类别层次树中节点之间的距离和相似度,按如下步骤操作:
(4c1)用户U输入公共位置数据集C中两个节点A和B,迭代计算A和B节点间的距离D(A,B),其中D(A,B)的初始值为0,若输入的A和B为同一节点,则距离D(A,B)=0,否则,执行步骤(4c2);
(4c2)根据A节点与B节点的关系,计算两节点之间的距离D(A,B):
若A.level=B.level,则将A.parent和B.parent分别赋给A和B,此时A和B的距离为D(A,B)=D(A,B)+A.childNum+B.childNum;
若A.level<B.level,则将A.parent赋给A,然后计算A和B的距离D(A,B)=D(A,B)+A.childNum;
若A.level>B.level,则将B.parent赋给B,计算A和B的距离D(A,B)=D(A,B)+B.childNum;
其中,A.level表示节点A在位置类别层次树中的层级,B.level表示节点B在位置类别层次树中的层级,A.parent代表A节点的父节点,B.parent代表B节点的父节点,A.childNum代表的是A节点的孩子节点个数,B.childNum表示B节点的孩子节点个数;
(4c3)重复执行步骤(4c2),直到满足A=B,此时计算得到的D(A,B)为A和B的距离;
(4c4)用户U根据计算出的A和B节点之间的距离D(A,B)计算节点A和B在位置类别层次树中的相似度:
sim(A,B)=1/(1+D(A,B)),
其中sim(A,B)是节点A和B之间的相似度。
3.根据权利要求1所述的方法,其中步骤(5)中用户U利用维特比算法生成假轨迹FL,按如下步骤操作:
(5a)用户U计算聚类S′中两个相邻类S′i和S′i+1中的位置之间的转移矩阵L:
其中,lij是前一个类中第i个位置转移到后面一个类中第j个位置的概率,要求∑ilij=1,1<i<m,1<j<n′,m是类S′i中的位置数据的个数,n′是类S′j中的位置数据的个数,lij可通过下式计算
其中D(l′j,li)为l′j与li之间的距离,l′j是类S′j中的位置数据,li是类S′i中的位置数据,oj是用户U的真实轨迹TR中的第j个位置的语义属性,oi是第i个位置的语义属性,c′j是位置l′j的语义类别,ci是位置li的语义类别,ε是归一化因子,是一个正整数;
(5b)用户U计算发射矩阵E:
其中,eij是输出位置li后观察到的语义属性为oj的概率,可通过下式计算:
eij=pr(oj|li)=sim(oj,li)/α,
其中1<i<q,1<j<n,其中sim(oj,li)是位置li的语义属性与oj的相似度,α是归一化因子,是一个正整数,q是聚类S′中的位置数的最大值;
(5c)用户U计算初始数组I={I11,I21,I31,…,Ii1,…,Im′1}T,Ii1是初始时刻输出第i个位置的概率,可通过下式计算:
Ii1=pr(o1|li)=sim(o1,li)/η,
其中o1初始时刻的语义属性,η是归一化因子,是一个正整数,{·}T表示矩阵的转置,m′是类S′1中的位置数;
(5d)用户U将步骤(5a)计算出的转移矩阵L、步骤(5b)计算的发射矩阵E和步骤(5c)计算出的初始数组I输入到维特比算法中,生成假轨迹FL={FL1,FL2,…,FLi,FLi+1,…,FLn}。
CN201510968954.6A 2015-12-21 2015-12-21 推荐系统中基于假轨迹的位置隐私保护方法 Active CN105554704B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510968954.6A CN105554704B (zh) 2015-12-21 2015-12-21 推荐系统中基于假轨迹的位置隐私保护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510968954.6A CN105554704B (zh) 2015-12-21 2015-12-21 推荐系统中基于假轨迹的位置隐私保护方法

Publications (2)

Publication Number Publication Date
CN105554704A CN105554704A (zh) 2016-05-04
CN105554704B true CN105554704B (zh) 2018-12-21

Family

ID=55833593

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510968954.6A Active CN105554704B (zh) 2015-12-21 2015-12-21 推荐系统中基于假轨迹的位置隐私保护方法

Country Status (1)

Country Link
CN (1) CN105554704B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529336B (zh) * 2016-11-16 2019-08-13 西安电子科技大学 一种基于时空关联性的假轨迹隐私保护方法
CN108268519B (zh) * 2016-12-30 2022-05-24 阿里巴巴集团控股有限公司 一种推荐网络对象的方法和装置
CN107145504B (zh) * 2017-03-21 2020-02-21 南京邮电大学 一种用户移动轨迹相似度比较的隐私保护方法
CN107480550B (zh) * 2017-07-04 2020-05-26 东华大学 一种基于角度划分和位置语义的轨迹隐私保护算法
CN107368751A (zh) * 2017-07-24 2017-11-21 湖南大学 一种基于背景信息的位置隐私保护方法
CN107767281B (zh) * 2017-10-23 2020-11-06 湖南科技学院 一种基于移动社交网络二度人脉的交友匹配隐私保护方法及系统
CN107659892A (zh) * 2017-11-01 2018-02-02 中原智慧城市设计研究院有限公司 一种基于用户位置隐私保护的室内定位方法
CN108540936B (zh) * 2017-12-18 2020-08-04 西安电子科技大学 基于预测的隐私保护方法
CN108566373B (zh) * 2018-03-06 2020-06-12 清华大学 保护用户隐私的位置信息发布系统
CN108513262A (zh) * 2018-03-06 2018-09-07 同济大学 基于合成似真路径的位置隐私保护方法
CN108882152B (zh) * 2018-07-03 2020-12-22 安徽工业大学 一种基于路径选择上报的用户隐私保护方法
CN108966131A (zh) * 2018-07-23 2018-12-07 广州都市圈网络科技有限公司 基于室内定位的融合楼层推断方法
CN110177356B (zh) * 2019-05-31 2021-11-05 长安大学 一种基于信任模型的车载命名数据网络转发方法
CN112465070B (zh) * 2020-12-16 2021-08-17 电子科技大学 一种基于语义相似度的轨迹聚类方法
CN115221256A (zh) * 2021-04-20 2022-10-21 花瓣云科技有限公司 一种数据处理方法、系统及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103281672A (zh) * 2013-06-08 2013-09-04 南京大学 一种移动终端进行位置隐私保护的方法
CN104703138A (zh) * 2015-03-19 2015-06-10 福建师范大学 一种保护位置隐私的方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2856778B1 (en) * 2012-05-30 2018-10-03 Nokia Solutions and Networks Oy System and method for mobile localization using fake location updates

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103281672A (zh) * 2013-06-08 2013-09-04 南京大学 一种移动终端进行位置隐私保护的方法
CN104703138A (zh) * 2015-03-19 2015-06-10 福建师范大学 一种保护位置隐私的方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Privacy through fake yet semantically real traces;BINDSCHAEDLER V, SHOKRI R;《Computer Science》;20150527;全文 *
位置服务中一种基于假轨迹的轨迹隐私保护方法;王家波,赵泽茂,李林;《技术研究》;20140312;全文 *

Also Published As

Publication number Publication date
CN105554704A (zh) 2016-05-04

Similar Documents

Publication Publication Date Title
CN105554704B (zh) 推荐系统中基于假轨迹的位置隐私保护方法
Yu et al. Personalized travel package with multi-point-of-interest recommendation based on crowdsourced user footprints
Shao et al. Extraction and analysis of city's tourism districts based on social media data
Kaiser et al. Advances in crowd analysis for urban applications through urban event detection
US20200008008A1 (en) Travel Recommendations on Online Social Networks
Guo et al. The emergence of visual crowdsensing: Challenges and opportunities
Yin et al. Modeling location-based user rating profiles for personalized recommendation
Li et al. Multiple location profiling for users and relationships from social network and content
Zheng et al. Diagnosing New York city's noises with ubiquitous data
Zheng et al. Collaborative location and activity recommendations with gps history data
US20170046802A1 (en) Travel Itinerary Generation on Online Social Networks
CN104156897B (zh) 基于情景感知的室内导览系统
CN104254865A (zh) 凭经验的专家确定和问题路由系统和方法
US20140089343A1 (en) Methods and Systems for Monitoring and Controlling Social Network Communications Over a Network at a Secure Location
Gao et al. Mining human mobility in location-based social networks
CN104620272A (zh) 基于第三方社会评论来生成兴趣点简档
CN109376901A (zh) 一种基于去中心化矩阵分解的服务质量预测方法
Zhu et al. Social weather: A review of crowdsourcing‐assisted meteorological knowledge services through social cyberspace
Zhang et al. A context-awareness personalized tourist attraction recommendation algorithm
Shekhar et al. From GPS and virtual globes to spatial computing-2020
Zhu et al. Geoinformation harvesting from social media data: A community remote sensing approach
Luan et al. Collaborative tensor factorization and its application in POI recommendation
CN103399900A (zh) 基于位置服务的图片推荐方法
Hong Spatial analysis of location-based social networks in seoul, korea
CN109670084A (zh) 一种基于移动互联网所建立的五缘谱亲缘关系网络系统及建立方法和使用方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant