CN111259434A - 轨迹数据发布中针对个人偏好位置的隐私保护方法 - Google Patents

轨迹数据发布中针对个人偏好位置的隐私保护方法 Download PDF

Info

Publication number
CN111259434A
CN111259434A CN202010019237.XA CN202010019237A CN111259434A CN 111259434 A CN111259434 A CN 111259434A CN 202010019237 A CN202010019237 A CN 202010019237A CN 111259434 A CN111259434 A CN 111259434A
Authority
CN
China
Prior art keywords
track
loc
representing
tracks
personal preference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010019237.XA
Other languages
English (en)
Other versions
CN111259434B (zh
Inventor
李先贤
蔡冰
王利娥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi Normal University
Original Assignee
Guangxi Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi Normal University filed Critical Guangxi Normal University
Priority to CN202010019237.XA priority Critical patent/CN111259434B/zh
Publication of CN111259434A publication Critical patent/CN111259434A/zh
Application granted granted Critical
Publication of CN111259434B publication Critical patent/CN111259434B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Storage Device Security (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种轨迹数据发布中针对个人偏好位置的隐私保护方法,先对原始轨迹数据集中的所有轨迹,根据轨迹之间的距离和pt值以及对应的用户之间的好友关系程度,对轨迹进行聚类处理。再根据轨迹聚类的结果,找出尚未自己定义个人偏好位置的用户(目标用户)所在的簇,找出与目标用户最相似的前n个用户,将他们的个人偏好位置推荐给目标用户。最后对轨迹数据集中的所有个人偏好位置进行隐私保护处理。本发明既能进一步提高发布的轨迹数据的可用性,又能保证用户的隐私信息不被泄露。

Description

轨迹数据发布中针对个人偏好位置的隐私保护方法
技术领域
本发明涉及数据隐私保护技术领域,具体涉及一种轨迹数据发布中针对个人偏好位置的隐私保护方法。
背景技术
随着基于位置的服务的快速发展,出现了许多移动定位设备,如汽车导航、嵌入全球定位系统的手机、平板电脑、位置传感器等,导致了各种基于位置服务应用的出现。这些应用允许用户将位置以及查询内容发送给位置服务器,位置服务器将对应的查询结果返回给用户。这些应用被划分为两类:一类是基于用户提供实时位置在线应用;另一类是由位置服务提供商收集和分析移动数据或将轨迹数据发送给第三方的离线应用。这些应用为人们的生活带来了极大的便利,然而轨迹数据中往往包含了关系到用户个人偏好的隐私数据。
对于离线应用,轨迹数据发布之后,主要是用来进行数据挖掘与分析,可以用来优化交通网络与交通管理策略,分析用户的行为来支持商业决策等。在离线应用中,如果这类数据不经任何处理直接发布出来,攻击者能够根据用户部分位置的时空关联推测出用户的其他位置信息,导致用户隐私的泄露。因此,数据发布者发布数据时,一方面要确保发布的匿名数据不泄露个人的隐私信息;另一方面要保证发布的匿名数据具有高可用性,使得研究者仍然能够根据发布的匿名数据进行较准确的数据分析。所以,如何在满足用户隐私需求的同时提高匿名数据的可用性成为亟待解决的问题。
目前,在离线轨迹数据发布场景中,很多方法被提出来用于进行隐私保护。现有的轨迹数据发布的隐私保护方法有三类:1.基于聚类的方法,在关系数据库中使用k-匿名概念进行匿名。2.准标识符的方法,是假设攻击者知道一条轨迹的部分背景知识,来识别轨迹上剩余的移动点或敏感属性。3.差分隐私的方法,保证移动对象在差分隐私定义下被保护。然而,现有的这些方法大多考虑的是对整条轨迹数据进行保护,但是由于轨迹上包含的所有位置数据并不一定都涉及用户的个人偏好信息,因此不需要对整条轨迹上的位置都进行隐私保护处理,而只需要对涉及个人偏好信息的位置进行相应的隐私保护处理。对整条轨迹数据进行隐私保护的方法不仅会影响轨迹数据的可用性,而且存在算法效率低下的问题。
发明内容
本发明所要解决的是现有离线轨迹数据发布场景中所使用的隐私保护方法会影响轨迹数据的可用性和效率低下的问题,提供一种轨迹数据发布中针对个人偏好位置的隐私保护方法。
本发明是通过以下技术方案实现的:
轨迹数据发布中针对个人偏好位置的隐私保护方法,其具体包括步骤如下:
步骤1、对原始轨迹数据集中的所有轨迹,分别计算每两条轨迹的综合距离;
R(Ti,Tj)=(1-α)×dist(Ti,Tj)+α×[1-rel(Ti,Tj)]
Figure BDA0002360094920000021
Figure BDA0002360094920000022
其中,R(Ti,Tj)表示轨迹Ti和Tj的综合距离;dist(Ti,Tj)表示轨迹Ti和Tj的距离,disto(Ti,Tj)表示轨迹Ti和Tj的方向距离,dists(Ti,Tj)表示轨迹Ti和Tj的速度距离,distl(Ti,Tj)表示轨迹Ti和Tj的位置距离,
Figure BDA0002360094920000023
表示方向距离权重,
Figure BDA0002360094920000024
表示速度距离权重,
Figure BDA0002360094920000025
表示位置距离权重,
Figure BDA0002360094920000026
表示轨迹Ti和Tj所对应用户的好友关系程度,F(Ti)表示轨迹Ti所对应用户的好友集合,F(Tj)表示轨迹Tj所对应用户的好友集合,α表示轨迹Ti和Tj所对应用户成为好友关系程度所占的权重;
步骤2、基于原始轨迹数据集中每两条轨迹的综合距离,并利用k均值聚类算法对原始轨迹数据集中所有轨迹进行聚类,得到若干个轨迹簇;其中k为设定值;
步骤3、对于尚未自己定义个人偏好位置的用户即目标用户,先基于步骤2的聚类结果确定该目标用户所对应的轨迹所在的轨迹簇,再从该轨迹簇中找出与该目标用户所对应的轨迹综合距离最接近的n条轨迹,后将这n条轨迹所对应的用户的个人偏好位置作为拟推荐给目标用户的个人偏好位置;其中n为设定值;
步骤4、对步骤3所得到拟推荐给目标用户的个人偏好位置进行隐私保护后,推送给目标用户。
上述步骤1中,轨迹Ti和Tj的方向距离disto(Ti,Tj)为:
Figure BDA0002360094920000027
其中,pt表示轨迹Ti和Tj的公共时间戳,ol(Ti,Tj)表示轨迹Ti和Tj的公共时间戳的数目,stij表示轨迹Ti和Tj的公共时间段的开始时间,eij表示轨迹Ti和Tj的公共时间段的结束时间,
Figure BDA0002360094920000028
表示轨迹Ti的第r段的向量,
Figure BDA0002360094920000029
表示轨迹Tj的第r段的向量。
上述步骤1中,轨迹Ti和Tj的速度距离dists(Ti,Tj)为:
Figure BDA0002360094920000031
其中,pt表示轨迹Ti和Tj的公共时间戳,ol(Ti,Tj)表示轨迹Ti和Tj的公共时间戳的数目,stij表示轨迹Ti和Tj的公共时间段的开始时间,eij表示轨迹Ti和Tj的公共时间段的结束时间,
Figure BDA0002360094920000032
表示轨迹Ti的第r段的速度,
Figure BDA0002360094920000033
表示轨迹Tj的第r段的速度。
上述步骤1中,轨迹Ti和Tj的位置距离distl(Ti,Tj)为:
Figure BDA0002360094920000034
其中,pt表示轨迹Ti和Tj的公共时间戳,ol(Ti,Tj)表示轨迹Ti和Tj的公共时间戳的数目,stij表示轨迹Ti和Tj的公共时间段的开始时间,eij表示轨迹Ti和Tj的公共时间段的结束时间,δr表示轨迹Ti和Tj上的所有相同的两相邻时间戳位置组成的两个三角形面积的总和。
上述步骤2中,轨迹簇的个数为
Figure BDA0002360094920000035
其中
Figure BDA0002360094920000036
表示向下取整,|T|表示原始轨迹数据集中轨迹的数目,k表示给定的轨迹簇的大小。
上述步骤4的具体过程如下:
步骤4.1、根据攻击者掌控的关于原始轨迹数据集的位置记录计算攻击者拥有的知识集;
步骤4.2、对于知识集中的每一条知识q,在找出原始轨迹数据集中含有当前知识q的轨迹并放入轨迹列表中,并将该轨迹列表中所有轨迹所对应用户的个人偏好位置放入原始位置列表中;
步骤4.3、对于原始位置列表中的每一个个人偏好位置iocj,计算攻击者由知识q推测出当前个人偏好位置locj的概率P(q→locj):
Figure BDA0002360094920000037
其中,n(locj,q,T)表示轨迹列表中包含当前个人偏好位置locj的轨迹的数目,|N(q,T)|表示轨迹列表中所有轨迹的数目;
步骤4.4、比较攻击者由知识q推测出当前个人偏好位置locj的概率P(q→locj)与用户认为的能够忍受的隐私被泄露的概率Pr:如果P(q→locj)小于等于Pr,则对当前个人偏好位置locj不做处理;如果P(q→locj)大于Pr,则将当前个人偏好位置locj放入到不安全位置列表中;
步骤4.5、对于不安全位置列表中的每一个个人偏好位置locj′,如果轨迹列表中包含当前个人偏好位置locj′的轨迹只有一条的时候,则从该条轨迹上删除当前个人偏好位置locj′,否则,从轨迹列表中随机选择N(t,q→locj′)条包含当前个人偏好位置locj′的轨迹,并从这些轨迹上删除当前个人偏好位置locj′;其中N(t,q→locj)为设定值。
上述步骤4.5中,随机选择轨迹的条数N(t,q→locj′)为:
N(t,q→locj′)=S(q∪locj′,T)-S(q,T)*Pr
其中,S(q∪locj′,T)表示原始轨迹数据集中同时包含当前知识q和当前个人偏好位置locj′的轨迹的数目,S(q,T)表示原始轨迹数据集中包含当前知识q的轨迹的数目,Pr表示用户认为的能够忍受的隐私被泄露的概率。
与现有技术相比,针对轨迹数据上的个人偏好位置能够泄露用户的一些隐私信息的问题,本发明面向离线轨迹数据发布中的隐私保护策略,先对原始轨迹数据集中的每条轨迹,找出轨迹上涉及用户个人偏好的位置,再对这些位置进行相应的隐私保护处理,最后再发布轨迹数据。本发明既能进一步提高发布的轨迹数据的可用性,又能保证用户的隐私信息不被泄露。
附图说明
图1为轨迹数据发布中针对个人偏好位置的隐私保护方法的流程图。
图2为轨迹相似性聚类的结构示意图。
图3为个人偏好位置的隐私保护的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实例,对本发明进一步详细说明。
本发明先对原始轨迹数据集中的所有轨迹,根据轨迹之间的距离和pt值以及对应的用户之间的好友关系程度,对轨迹进行聚类处理。再根据轨迹聚类的结果,找出尚未自己定义个人偏好位置的用户(目标用户)所在的簇,找出与目标用户最相似的前n个用户,将他们的个人偏好位置推荐给目标用户。最后对轨迹数据集中的所有个人偏好位置进行隐私保护处理。
一种轨迹数据发布中针对个人偏好位置的隐私保护方法,如图1所示,其具体包括步骤如下:
步骤1:将所有用户的轨迹形成原始轨迹数据集T,在原始数据集中,每个轨迹对应一个用户。对原始轨迹数据集T中的所有用户对应的轨迹,分别计算每2个用户所对应轨迹的综合距离。
由于轨迹之间的相关性能够反应用户之间的社交关系,而两个用户如果是好友,好友的偏好会影响用户偏好的选择,因此本发明在对轨迹数据进行聚类的时候,我们不仅考虑了轨迹之间的距离,也考虑了轨迹对应的用户之间的好友关系程度,并允许用户自定义他们的个人偏好位置类型。
步骤1.1:轨迹之间距离计算
计算轨迹之间的距离时,我们考虑了轨迹间的方向距离、速度距离、位置距离。对于原始轨迹数据集中的每一对轨迹都需要计算他们之间的距离,以及其轨迹对应的用户之间的好友关系程度。
①计算两轨迹之间的方向距离disto(Ti,Tj):
Figure BDA0002360094920000051
其中,
Figure BDA0002360094920000052
Figure BDA0002360094920000053
0,pt表示两轨迹之间的公共时间戳,tmi表示第i条轨迹的第m个时间戳,ol(Ti,Tj)表示两条轨迹之间的公共时间戳的数目,stij、eij分别表示两条轨迹之间公共时间段的开始时间和结束时间,
Figure BDA0002360094920000054
表示第i条轨迹的第r段向量,
Figure BDA0002360094920000055
Figure BDA0002360094920000056
表示第i条轨迹的第r个位置。
Figure BDA0002360094920000057
表示第j条轨迹的第r段向量。arccos函数用于计算两个向量之间的角度。
Figure BDA0002360094920000058
表示计算两个段向量的点积。
②计算两轨迹之间的速度距离dists(Ti,Tj):
Figure BDA0002360094920000059
其中,
Figure BDA00023600949200000510
表示第i条轨迹的第r段的速度。
Figure BDA00023600949200000511
③计算两轨迹之间的位置距离distl(Ti,Tj):
Figure BDA00023600949200000512
其中,δr表示2条轨迹上每2个相同的相邻时间戳所组成的两个三角形面积的总和。如轨迹Ti的2个相邻时间戳ti-5和ti-6,与轨迹Tj的2个连续时间戳tj-5和tj-6这4个时间戳,其所组成的三角形为Δti-5ti-6tj-5和Δtj-5tj-6ti-6
④计算两轨迹之间的距离dist(Ti,Tj):
Figure BDA00023600949200000513
其中
Figure BDA00023600949200000514
分别表示轨迹之间的方向距离和速度距离所占的权重。
步骤1.2:用户间好友关系程度计算
在计算每对轨迹之间的距离时,计算其对应的用户之间的好友关系程度rel(Ti,Tj):
Figure BDA0002360094920000061
其中,F(Tn)表示轨迹Tn的用户的好友集合。
步骤1.3:基于用户友好关系的轨迹综合距离计算
两轨迹之间的综合距离R(Ti,Tj):
R(Ti,Tj)=(1-α)×dist(Ti,Tj)+α×[1-rel(Ti,Tj)]
其中,α表示两用户成为好友关系程度所占的权重。
步骤2:基于轨迹之间距离和用户间好友关系程度计算原始轨迹数据集中每两条轨迹的综合距离,并利用k均值聚类算法(k-means)对原始轨迹数据集的轨迹进行聚类,得到
Figure BDA0002360094920000062
个轨迹簇,其中|T|表示原始轨迹数据集中轨迹的数目,k是进行聚类时预先假设的每个轨迹簇的大小(即k-means中的k),
Figure BDA0002360094920000063
表示向下取整。
步骤3:对于尚未自己定义个人偏好位置的用户即目标用户,先基于步骤2的聚类结果确定该目标用户所对应的轨迹所在的轨迹簇,再从该轨迹簇中找出与该目标用户所对应的轨迹综合距离最接近的n条轨迹,后将这n条轨迹所对应的用户的个人偏好位置作为拟推荐给目标用户的个人偏好位置。如图2所示。
步骤3.1:对于没有定义个人偏好位置的用户即目标用户,根据上一步骤的轨迹聚类结果,找出该目标用户的轨迹TS′所在的轨迹簇。
步骤3.2:利用综合距离计算公式计算TS′与它所在的轨迹簇中的其他所有轨迹之间的综合距离;
步骤3.3:对步骤3.2所得的综合距离进行升序排序,选出n个综合距离最小值所对应的轨迹。由于n条最小距离轨迹对应n个用户,因此将这n个用户存放入一个列表。
步骤3.4:根据步骤3.3,找出列表中所有用户定义的个人偏好位置类型,并存入一个列表,再将该列表推荐给该目标用户。
步骤4:对步骤3所得到拟推荐给目标用户的个人偏好位置进行隐私保护后,推送给目标用户。
由于轨迹数据中往往包含了涉及用户个人偏好的隐私数据,如果数据发布者对数据不做任何处理直接发布,会造成用户个人偏好信息的泄露。攻击者可能掌握用户局部的轨迹信息,如果仅是删除或隐藏原始轨迹集中的身份信息,攻击者仍然能够以一定的概率推断出用户的其他涉及个人偏好的位置信息。
Figure BDA0002360094920000064
Figure BDA0002360094920000071
表1
根据表1发布的轨迹数据集,如果一个攻击者知道Marry的部分轨迹数据{a1,a2},根据发布的轨迹数据集,攻击者能够知道Marry的轨迹是t1,t2,t3,t4中的一条,所以攻击者能够推测涉及Marry的个人偏好位置b1的概率是
Figure BDA0002360094920000072
b2的概率是
Figure BDA0002360094920000073
b3的概率是
Figure BDA0002360094920000074
隐私保护的目标是:即使在攻击者知道部分真实位置记录的情况下,也无法以高于Pr的概率推测出攻击者尚未掌握的轨迹上的其他个人偏好位置信息,使最终发布的轨迹数据具有较高的数据利用率,同时能够保护用户个人的隐私信息不被泄露。其中Pr为用户认为的能够忍受的隐私被泄露的概率。
隐私保护的原理是:首先,生成攻击者拥有的知识集Q,q∈Q。接着,把q→locj(攻击者拥有的知识→个人偏好位置记录)记为L,根据L的概率进行分类,如果P(L)<Pr,则L是安全的;否则L是不安全的(对应的q也是不安全的)。最后,对不安全的L进行相应的匿名处理。如图3所示。
假设攻击者V掌控的关于T的位置记录为Av={a1,a2,a3},根据攻击者拥有的知识的定义,我们可以为T中的每条轨迹生成相应的知识q,如表2。
Figure BDA0002360094920000075
表2
1)轨迹的定义:
Ti={i,(t1,x1,y1),(t2,x2,y2),...,(tm,xm,ym)},其中i表示轨迹的唯一标识,(ti,xi,yi)表示在时间ti时所在的位置。
2)轨迹记录的定义:
轨迹记录是由n个位置信息按照时间顺序组成的长度为n的一条记录,Ti={i,(x1,y1),(x2,y2),...,(xm,ym)}表示一条轨迹记录。
3)攻击者拥有的知识的定义:
对于一条轨迹记录Ti={i,(x1,y1),(x2,y2),...,(xm,ym)}的知识为T′i={i,(x1,y1),(x2,y2),...,(xm,ym)},k<=m,
Figure BDA0002360094920000081
Figure BDA0002360094920000082
称T′i为Ti相对于攻击者V拥有的知识。即T′i是Ti的子轨迹,且仅由Av中的所有位置组成,Av表示攻击者掌控的位置。
隐私保护详细的实现步骤如下:
步骤4.1、对轨迹数据集T中的所有轨迹Ti,根据Av计算出攻击者拥有的知识集Q,其中
Figure BDA0002360094920000083
q是攻击者对每一条轨迹拥有的知识。
步骤4.2、对知识集Q中的每一个q,在T中找出包含q的轨迹并放入列表N(q,T)中,并将N(q,T)中所有轨迹的个人偏好位置放入Location列表中。对Location中的每一个位置locj,在N(q,T)中找出包含该位置的轨迹的数目n(locj,q,T)。
步骤4.3、对每一个locj,根据公式计算出攻击者由q推测出个人偏好位置locj的概率P(q→locj):
Figure BDA0002360094920000084
其中,n(locj,q,T)表示轨迹列表中包含当前个人偏好位置locj的轨迹的数目,|N(q,T)|表示轨迹列表中所有轨迹的数目。
步骤4.4、比较P(q→locj)与Pr的大小:如果P(q→locj)大于Pr,那么称由q推测locj是不安全的,将locj放入列表Location′,并转至步骤4.5;否则,由q推测locj是安全的,对个人偏好位置locj不做处理。
步骤4.5、对Location′中每一个位置locj′,如果N(q,T)中包含locj的轨迹数只有一条的时候,则直接从该轨迹上删除locj′;否则,我们需要根据公式计算需要删除的不安全的locj′的轨迹数N(t,q→locj′),从包含locj′的轨迹集中随机选择轨迹,对其上的locj′进行删除,使得攻击者由q推测出locj′的概率降低到Pr。需要删除的locj的轨迹数目N(t,q→locj′):
N(t,q→locj′)=S(q∪locj′,T)-S(q,T)*Pr
其中,S(q∪locj′,T)表示原始轨迹数据集中同时包含当前知识q和当前个人偏好位置locj′的轨迹的数目,S(q,T)表示原始轨迹数据集中包含当前知识q的轨迹的数目,Pr表示用户认为的能够忍受的隐私被泄露的概率。
需要说明的是,尽管以上本发明所述的实施例是说明性的,但这并非是对本发明的限制,因此本发明并不局限于上述具体实施方式中。在不脱离本发明原理的情况下,凡是本领域技术人员在本发明的启示下获得的其它实施方式,均视为在本发明的保护之内。

Claims (7)

1.轨迹数据发布中针对个人偏好位置的隐私保护方法,其特征是,其具体包括步骤如下:
步骤1、对原始轨迹数据集中的所有轨迹,分别计算每两条轨迹的综合距离;
R(Ti,Tj)=(1-α)×dist(Ti,Tj)+α×[1-rel(Ti,Tj)]
Figure FDA0002360094910000011
Figure FDA0002360094910000012
其中,R(Ti,Tj)表示轨迹Ti和Tj的综合距离;dist(Ti,Tj)表示轨迹Ti和Tj的距离,disto(Ti,Tj)表示轨迹Ti和Tj的方向距离,dists(Ti,Tj)表示轨迹Ti和Tj的速度距离,distl(Ti,Tj)表示轨迹Ti和Tj的位置距离,
Figure FDA0002360094910000013
表示方向距离权重,
Figure FDA0002360094910000014
表示速度距离权重,
Figure FDA0002360094910000015
表示位置距离权重,
Figure FDA0002360094910000016
rel(Ti,Tj)表示轨迹Ti和Tj所对应用户的好友关系程度,F(Ti)表示轨迹Ti所对应用户的好友集合,F(Tj)表示轨迹Tj所对应用户的好友集合,α表示轨迹Ti和Tj所对应用户成为好友关系程度所占的权重;
步骤2、基于原始轨迹数据集中每两条轨迹的综合距离,并利用k均值聚类算法对原始轨迹数据集中所有轨迹进行聚类,得到若干个轨迹簇;其中k为设定值;
步骤3、对于尚未自己定义个人偏好位置的用户即目标用户,先基于步骤2的聚类结果确定该目标用户所对应的轨迹所在的轨迹簇,再从该轨迹簇中找出与该目标用户所对应的轨迹综合距离最接近的n条轨迹,后将这n条轨迹所对应的用户的个人偏好位置作为拟推荐给目标用户的个人偏好位置;其中n为设定值;
步骤4、对步骤3所得到拟推荐给目标用户的个人偏好位置进行隐私保护后,推送给目标用户。
2.根据权利要求1所述的轨迹数据发布中针对个人偏好位置的隐私保护方法,其特征是,步骤1中,轨迹Ti和Tj的方向距离disto(Ti,Tj)为:
Figure FDA0002360094910000017
其中,pt表示轨迹Ti和Tj的公共时间戳,ol(Ti,Tj)表示轨迹Ti和Tj的公共时间戳的数目,stij表示轨迹Ti和Tj的公共时间段的开始时间,eij表示轨迹Ti和Tj的公共时间段的结束时间,
Figure FDA0002360094910000018
表示轨迹Ti的第r段的向量,
Figure FDA0002360094910000019
表示轨迹Tj的第r段的向量。
3.根据权利要求1所述的轨迹数据发布中针对个人偏好位置的隐私保护方法,步骤1中,轨迹Ti和Tj的速度距离dists(Ti,Tj)为:
Figure FDA0002360094910000021
其中,pt表示轨迹Ti和Tj的公共时间戳,ol(Ti,Tj)表示轨迹Ti和Tj的公共时间戳的数目,stij表示轨迹Ti和Tj的公共时间段的开始时间,eij表示轨迹Ti和Tj的公共时间段的结束时间,
Figure FDA0002360094910000022
表示轨迹Ti的第r段的速度,
Figure FDA0002360094910000023
表示轨迹Tj的第r段的速度。
4.根据权利要求1所述的轨迹数据发布中针对个人偏好位置的隐私保护方法,步骤1中,轨迹Ti和Tj的位置距离distl(Ti,Tj)为:
Figure FDA0002360094910000024
其中,pt表示轨迹Ti和Tj的公共时间戳,ol(Ti,Tj)表示轨迹Ti和Tj的公共时间戳的数目,stij表示轨迹Ti和Tj的公共时间段的开始时间,eij表示轨迹Ti和Tj的公共时间段的结束时间,δr表示轨迹Ti和Tj上的所有相同的两相邻时间戳位置组成的两个三角形面积的总和。
5.根据权利要求1所述的轨迹数据发布中针对个人偏好位置的隐私保护方法,步骤2中,轨迹簇的个数为
Figure FDA0002360094910000025
其中
Figure FDA0002360094910000026
表示向下取整,|T|表示原始轨迹数据集中轨迹的数目,k表示给定的轨迹簇的大小。
6.根据权利要求1所述的轨迹数据发布中针对个人偏好位置的隐私保护方法,步骤4的具体过程如下:
步骤4.1、根据攻击者掌控的关于原始轨迹数据集的位置记录计算攻击者拥有的知识集;
步骤4.2、对于知识集中的每一条知识q,在找出原始轨迹数据集中含有当前知识q的轨迹并放入轨迹列表中,并将该轨迹列表中所有轨迹所对应用户的个人偏好位置放入原始位置列表中;
步骤4.3、对于原始位置列表中的每一个个人偏好位置locj,计算攻击者由知识q推测出当前个人偏好位置locj的概率P(q→locj):
Figure FDA0002360094910000027
其中,n(locj,q,T)表示轨迹列表中包含当前个人偏好位置locj的轨迹的数目,|N(q,T)|表示轨迹列表中所有轨迹的数目;
步骤4.4、比较攻击者由知识q推测出当前个人偏好位置locj的概率P(q→locj)与用户认为的能够忍受的隐私被泄露的概率Pr:如果P(q→locj)小于等于Pr,则对当前个人偏好位置locj不做处理;如果P(q→locj)大于Pr,则将当前个人偏好位置locj放入到不安全位置列表中;
步骤4.5、对于不安全位置列表中的每一个个人偏好位置locj′,如果轨迹列表中包含当前个人偏好位置locj′的轨迹只有一条的时候,则从该条轨迹上删除当前个人偏好位置locj′,否则,从轨迹列表中随机选择N(t,q→locj′)条包含当前个人偏好位置locj′的轨迹,并从这些轨迹上删除当前个人偏好位置locj′;其中N(t,q→locj)为设定值。
7.根据权利要求6所述的轨迹数据发布中针对个人偏好位置的隐私保护方法,步骤4.5中,随机选择轨迹的条数N(t,q→locj′)为:
N(t,q→locj′)=S(q∪locj′,T)-S(q,T)*Pr
其中,S(q∪locj′,T)表示原始轨迹数据集中同时包含当前知识q和当前个人偏好位置locj′的轨迹的数目,S(q,T)表示原始轨迹数据集中包含当前知识q的轨迹的数目,Pr表示用户认为的能够忍受的隐私被泄露的概率。
CN202010019237.XA 2020-01-08 2020-01-08 轨迹数据发布中针对个人偏好位置的隐私保护方法 Active CN111259434B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010019237.XA CN111259434B (zh) 2020-01-08 2020-01-08 轨迹数据发布中针对个人偏好位置的隐私保护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010019237.XA CN111259434B (zh) 2020-01-08 2020-01-08 轨迹数据发布中针对个人偏好位置的隐私保护方法

Publications (2)

Publication Number Publication Date
CN111259434A true CN111259434A (zh) 2020-06-09
CN111259434B CN111259434B (zh) 2022-04-12

Family

ID=70946743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010019237.XA Active CN111259434B (zh) 2020-01-08 2020-01-08 轨迹数据发布中针对个人偏好位置的隐私保护方法

Country Status (1)

Country Link
CN (1) CN111259434B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257109A (zh) * 2020-10-30 2021-01-22 西安易朴通讯技术有限公司 数据处理方法及装置
CN115982752A (zh) * 2022-11-25 2023-04-18 哈尔滨理工大学 一种基于近似语义查询的k支配隐私保护方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914659A (zh) * 2014-03-12 2014-07-09 西安电子科技大学 基于频率的轨迹抑制数据发布隐私保护的系统及其方法
CN106295395A (zh) * 2016-07-27 2017-01-04 福建师范大学 基于图划分的不确定轨迹隐私保护方法
CN109165527A (zh) * 2018-08-28 2019-01-08 东北大学 支持个性化隐私的轨迹敏感数据保护方法
CN109766710A (zh) * 2018-12-06 2019-05-17 广西师范大学 关联社交网络数据的差分隐私保护方法
CN110134879A (zh) * 2019-03-06 2019-08-16 辽宁工业大学 一种基于差分隐私保护的兴趣点推荐算法
CN110162997A (zh) * 2019-04-25 2019-08-23 安徽师范大学 基于插值点的匿名隐私保护方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914659A (zh) * 2014-03-12 2014-07-09 西安电子科技大学 基于频率的轨迹抑制数据发布隐私保护的系统及其方法
CN106295395A (zh) * 2016-07-27 2017-01-04 福建师范大学 基于图划分的不确定轨迹隐私保护方法
CN109165527A (zh) * 2018-08-28 2019-01-08 东北大学 支持个性化隐私的轨迹敏感数据保护方法
CN109766710A (zh) * 2018-12-06 2019-05-17 广西师范大学 关联社交网络数据的差分隐私保护方法
CN110134879A (zh) * 2019-03-06 2019-08-16 辽宁工业大学 一种基于差分隐私保护的兴趣点推荐算法
CN110162997A (zh) * 2019-04-25 2019-08-23 安徽师范大学 基于插值点的匿名隐私保护方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
QIWEI LU 等: ""Personalized Privacy-Preserving Trajectory Data Publishing"", 《CHINESE JOURNAL OF ELECTRONICS》 *
SHENG GAO 等: ""Balancing trajectory privacy and data utility using a personalized anonymization model"", 《JOURNAL OF NETWORK AND COMPUTER APPLICATIONS》 *
刘磊 等: ""基于KNN的船舶轨迹分类算法"", 《大连海事大学报》 *
李凤华 等: ""高效的轨迹隐私保护方案"", 《通信学报》 *
胡兆玮 等: ""轨迹隐私保护技术研究进展分析"", 《计算机科学》 *
陈修圣: ""基于历史轨迹和好友关系的位置隐私保护"", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
陈艳君: ""面向海量轨迹数据的聚类算法研究"", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257109A (zh) * 2020-10-30 2021-01-22 西安易朴通讯技术有限公司 数据处理方法及装置
CN112257109B (zh) * 2020-10-30 2023-04-07 西安易朴通讯技术有限公司 数据处理方法及装置
CN115982752A (zh) * 2022-11-25 2023-04-18 哈尔滨理工大学 一种基于近似语义查询的k支配隐私保护方法
CN115982752B (zh) * 2022-11-25 2023-08-04 哈尔滨理工大学 一种基于近似语义查询的k支配隐私保护方法

Also Published As

Publication number Publication date
CN111259434B (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
AU2017399007B2 (en) Mobility gene for trajectory data
Zhang et al. On reliable task assignment for spatial crowdsourcing
Lu et al. Mining cluster-based temporal mobile sequential patterns in location-based service environments
Zhang et al. SpatialRecruiter: Maximizing sensing coverage in selecting workers for spatial crowdsourcing
CN111259434B (zh) 轨迹数据发布中针对个人偏好位置的隐私保护方法
CN105760780B (zh) 基于路网的轨迹数据隐私保护方法
US9635507B2 (en) Mobile device analytics
Li et al. A multi-dimensional context-aware recommendation approach based on improved random forest algorithm
WO2001090920A2 (en) Geographical comparison system and method
CN110162997B (zh) 基于插值点的匿名隐私保护方法
WO2018150228A1 (en) Mobility gene for visit data
US10146883B2 (en) Determining labels from similar geographic features
CN109327485B (zh) 一种位置信息的隐匿方法及位置服务器
US20210172759A1 (en) Map Matching and Trajectory Analysis
US20110167079A1 (en) Framework for track-based mobile applications
Andrade et al. Identifying points of interest and similar individuals from raw GPS data
Yu et al. Continuous trajectory similarity search with result diversification
WO2018151672A1 (en) Trajectory analysis through fusion of multiple data sources
CN110598122B (zh) 社交群体挖掘方法、装置、设备及存储介质
CN110929171A (zh) 一种基于场景和社交网络位置的兴趣点推荐方法
US20140004875A1 (en) Ascertaining presence regions for mobile telephony
Verma et al. GeoHash tag based mobility detection and prediction for traffic management
Bok et al. Recommending similar users using moving patterns in mobile social networks
Rivero-Rodriguez et al. Semantic labeling of places based on phone usage features using supervised learning
Cao et al. Mining spatio-temporal semantic trajectory for groups identification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant