CN109165527A - 支持个性化隐私的轨迹敏感数据保护方法 - Google Patents
支持个性化隐私的轨迹敏感数据保护方法 Download PDFInfo
- Publication number
- CN109165527A CN109165527A CN201810984952.XA CN201810984952A CN109165527A CN 109165527 A CN109165527 A CN 109165527A CN 201810984952 A CN201810984952 A CN 201810984952A CN 109165527 A CN109165527 A CN 109165527A
- Authority
- CN
- China
- Prior art keywords
- point
- sensitive
- sensitive position
- list
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Mobile Radio Communication Systems (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提供一种支持个性化隐私的轨迹敏感数据保护方法,涉及数据分析处理技术领域。该方法包括:提取原始数据集D中用户设定需要保护的敏感位置列表SPlist;采用Google Map API对用户设定的敏感位置列表SPlist中的任意敏感位置SPb进行反向地址解析,得到敏感序列SSb;根据类簇集合Clus构建假轨迹片段;以假轨迹片段T*替换原始数据集D中轨迹片段T,输出经过隐私保护的数据集D*。本发明提供的一种支持个性化隐私的轨迹敏感数据保护方法,充分考虑到移动对象的移动速度、采样点数量和路段相似性,还对敏感位置进行了语义聚类划分,并且对于敏感位置的替换是随机的,攻击者确定真实敏感位置的概率也相对低了很多,保证了敏感位置的安全性。
Description
技术领域
本发明涉及数据分析处理技术领域,具体涉及一种支持个性化隐私的轨迹敏感数据保护方法。
背景技术
近年来,随着定位技术的迅速发展,带有GPS接收器的移动设备越来越普及,基于位置的服务(LBS)使用越来越广泛,因此服务提供者每日将会获得大量的轨迹数据。对收集到的轨迹数据进行数据挖掘和分析在多个领域中都有很广泛的应用,例如城市规划、商业决策、旅游路径推荐等。然而轨迹数据包含个人敏感信息,攻击者通过对发布的轨迹数据进行分析,很可能会造成个人的兴趣爱好、行为模式等隐私泄露。目前对于数据发布上的轨迹隐私保护问题,大多基于传统的k-匿名方法对轨迹进行泛化,和构建假轨迹等。这些方法大多认为轨迹上的点的隐私需求是相同的,忽略了不同的用户的隐私需求往往是不同的,并且能够泄露敏感信息的往往是轨迹中的一些敏感位置,这些点通常含有语义信息,例如家、医院、学校、商场等。现有方法考虑了轨迹中敏感位置的保护,通过将敏感位置泛化成区域保证安全性,但发布出的轨迹不完全是原子轨迹,因此现有的隐私保护方法的可用性不高。
发明内容
针对现有技术存在的问题,本发明提供一种支持个性化隐私的轨迹敏感数据保护方法,考虑不同用户的不同隐私需求,解决了数据发布中用户轨迹中的敏感位置泄露的情况,根据敏感位置不同时段访问概率、用户访问数量和用户平均停留时长,考虑敏感位置的空间距离和语义相似性,确定两点间的混合距离,再基于l-多样性的原则对敏感位置进行聚类划分,将敏感位置进行替换,并根据移动对象的移动速度,采样点数量和采样间隔构建一条假轨迹片段,提高发布数据的可用性。
为了实现上述目的,一种支持个性化隐私的轨迹敏感数据保护方法,包括以下步骤:
步骤1:提取原始数据集D中用户设定需要保护的敏感位置列表SPlist;
所述原始数据集D={d1,...,do,...,dz},其中,do{ID,T,SPlist},ID为记录的标识,T为轨迹,SPlist为用户设定需要保护的敏感位置列表;所述用户设定需要保护的敏感位置列表SPlist={SP1,...,SPk},SPb=(ID’,lcore,add,sem),其中,ID’为敏感位置的标识符,lcore为敏感位置的核心地理位置,add为敏感位置的地址,sem为敏感位置的语义信息;所述敏感位置的语义信息其中,Δtavg为访问敏感位置用户的平均停留时长,N为访问敏感位置的用户数量,为访问敏感位置的用户列表,为一天内访问敏感位置的概率;所述一天内访问敏感位置的概率为q维向量,将一天24小时分为q段,其中,pa为第a时段移动对象进入敏感位置的概率,且1≤a≤q;
步骤2:采用Google Map API对用户设定的敏感位置列表SPlist中的任意敏感位置SPb进行反向地址解析,得到敏感序列SSb;
步骤3:根据语义的敏感位置进行聚类划分形成类簇集合Clus,具体步骤如下:
步骤3.1:初始化聚类划分所需的参数,包括隐私保护度l、用户设定需要保护的敏感位置列表SPlist中的中心点为SPcen、类簇集合Clus为空集、当前类簇数flag为0、类簇中心点的个数Ncen为0;
步骤3.2:判断类簇中心点的个数Ncen是否小于类簇集合要分的类数,若小于,则令中心点SPcen为距离当前中心点最远的点,继续步骤3.3,若不小于,则停止;
步骤3.3:令当前类簇集合Clusflag为当前类簇中心点SPcen以及与中心点SPcen混合距离最近的l-1个点;
步骤3.4:分别以当前类簇集合Clusflag中的点作为中心点,计算该点与其他l-1个点的混合距离之和,并以与其他l-1个点的混合距离之和最小的点替换当前类簇中心点SPcen为新的当前类簇中心点SPcen;
步骤3.5:更新当前类簇集合Clusflag为新的当前类簇中心点SPcen以及与新的中心点SPcen混合距离最近的l-1个点,返回步骤3.4,直至当前类簇中心点SPcen不再发生替换;
步骤3.6:将当前类簇集合Clusflag合并到类簇集合Clus中;
步骤3.7:令当前类簇数flag加1,类簇中心点的个数Ncen加1,返回步骤3.2;
步骤4:根据类簇集合Clus构建假轨迹片段,具体步骤如下:
步骤4.1:构建包含类簇集合Clus中所有元素的最小边界矩形MBR,并确定距离矩形MBR最近的两个路口点为假轨迹片段的起点Vs和假轨迹片段的终点Vf,初始化构建假轨迹片段所需的参数,包括采样间隔tinterval和采样点数量Num,设置当前采样点个数为0;
步骤4.2:在最小边界矩形MBR中,以设定替换点位置SPfake替换用户设定需要保护的敏感位置;
步骤4.3:构建从起点Vs到替换点位置SPfake之间的假轨迹片段,具体步骤如下:
步骤4.3.1:根据采样间隔tinterval和移动对象的速度Vrandom确定采样点的位置;
步骤4.3.2:判断采样点是否与替换点位置SPfake重合,若是,则输出当前采样点个数,继续步骤4.4,若否,则当前采样点个数加1,返回步骤4.3.1,确定下一采样点的位置;
步骤4.4:构建替换点位置SPfake到终点Vf之间的假轨迹片段,具体步骤如下:
步骤4.4.1:根据采样间隔tinterval和移动对象的速度Vrandom确定采样点的位置;
步骤4.4.2:判断采样点是否与终点Vf重合,若是,则则输出当前采样点个数,继续步骤4.5,若否,则当前采样点个数加1,返回步骤4.4.1,确定下一采样点的位置;
步骤4.5:判断当前采样点个数是否小于采样点数量Num,若是,则在替换点位置SPfake周围距离阈值θd范围内随机选取一点,返回步骤4.5,若否,则连接各个采样点,完成假轨迹片段的构建;
步骤5:以假轨迹片段T*替换原始数据集D中轨迹片段T,输出经过隐私保护的数据集D*。
进一步地,所述第a段时间移动对象(MOB)进入敏感位置的概率pa的计算公式如下:
其中,Num(a)为第a段时间访问某一地点的人数,N为一天内访问该地点的人数。
进一步地,所述计算两点间混合距离的公式如下:
其中,Distmix(SPi,SPj)为点SPi和点SPj间的混合距离,α和β为设定路网距离与语义相似度所占比重的参数且α+β=1,Dist(SPi,SPj)为点SPi和点SPj间的路网距离,maxDist为敏感位置之间的最大距离,sim(SPi,SPj)为点SPi和点SPj间的语义相似度,maxSim为敏感位置之间的最大语义相似度;所述点SPi和点SPj间的语义相似度sim(SPi,SPj)的计算公式如下:
其中,Δtavgi和Δtavgj分别为访问地点i和地点j用户的平均停留时长,Ni和Nj分别为访问地点i和地点j的用户数量,和分别为访问地点i和地点j的用户列表,和分别为一天内访问地点i和地点j的概率。
进一步地,所述步骤3中类簇集合要分的类数根据用户访问地点列表SP中地点的个数以及隐私保护度l确定。
进一步地,所述步骤4中移动对象的速度Vrandom在移动对象的最小速度Vmin和最大速度Vmax之间随机确定。
本发明的有益效果:
本发明提出一种支持个性化隐私的轨迹敏感数据保护方法,充分考虑到移动对象的移动速度、采样点数量和路段相似性,因此构建的假轨迹片段不易识别,即使攻击者发现了假轨迹片段,并且掌握隐私保护的方法,本发明还对敏感位置进行了语义聚类划分,每个类簇中至少含有l个语义存在差异的敏感位置,并且对于敏感位置的替换是随机的,攻击者确定真实敏感位置的概率也相对低了很多,保证了敏感位置的安全性。
附图说明
图1为本发明实施例中支持个性化隐私的轨迹敏感数据保护方法的流程图;
图2为本发明实施例中敏感位置访问概率曲线图;
图3为本发明实施例中假轨迹片段的起止点确定示意图;
图4为本发明实施例中最终构建的假轨迹片段示意图。
具体实施方式
为了使本发明的目的、技术方案及优势更加清晰,下面结合附图和具体实施例对本发明做进一步详细说明。此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
一种支持个性化隐私的轨迹敏感数据保护方法,流程如图1所示,具体方法如下所述:
步骤1:提取原始数据集D中用户设定需要保护的敏感位置列表SPlist。
本实施例中,采用微软亚洲研究院GeoLife收集的182个志愿者从2007年4月至2012年8月共17621条轨迹,轨迹总长度1292951公里,对原始数据集中的轨迹进行筛选,只选择BJ五环以内的轨迹数据。
所述原始数据集D={d1,...,do,...,dz},其中,do={ID,T,SPlist},ID为记录的标识,T为轨迹,SPlist为用户设定需要保护的敏感位置列表;所述用户设定需要保护的敏感位置列表SPlist={SP1,...,SPk},SPb=(ID’,lcore,add,sem),其中,ID’为敏感位置的标识符,lcore为敏感位置的核心地理位置,add为敏感位置的地址,sem为敏感位置的语义信息;所述敏感位置的语义信息其中,Δtavg为访问敏感位置用户的平均停留时长,N为访问敏感位置的用户数量,为访问敏感位置的用户列表,为一天内访问敏感位置的概率;所述一天内访问敏感位置的概率为q维向量,将一天24小时分为q段,其中,pa为第a时段移动对象进入敏感位置的概率,且1≤a≤q。
所述第a段时间移动对象(MOB)进入敏感位置的概率pa的计算公式如下:
其中,Num(a)为第a段时间访问某一地点的人数,N为一天内访问该地点的人数。
本实施例中,一天内敏感位置餐厅、公司、超市的访问概率曲线图如图2所示,现有技术常采用访问敏感位置的平均时刻作为语义相似度的衡量标准,而从图2中可以看出,公司和餐厅的语义相差很大,但平均访问时刻均为中午12时左右,所以平均时刻衡量敏感位置语义不准确,因此,通过采样分段衡量的方式,计算不同时段访问敏感位置的概率,衡量语义更准确。
步骤2:采用Google Map API对用户设定的敏感位置列表SPlist中的任意敏感位置SPb进行反向地址解析,得到敏感序列SSb。
本实施例中,采用的具体方法是,从轨迹T={ID”,(x1,y1,t1),...,(xn,yn,tn)}中找到一个在近似同一位置停留超过设定的时间阈值θt和距离阈值θd的连续轨迹片段{(xm,ym,tm),(xm+1,ym+1,tm+1),...,(xn,yn,tn)}标记为敏感序列SSb,其中,ID”为轨迹的标识符,(xc,yc,tc)为采样点lc在tc时刻移动对象(MOB)的地理坐标为(xc,yc)(1≤c≤n),且c满足Dist((xc,yc),(xc+1,yc+1))≤θd,|tn-tm|≥θt,Dist()为两点间的空间欧式距离。
本实施例中,设置时间阈值θt为20分钟,距离阈值θd为200米。
本实施例中,在收集的17621条轨迹中共提取到34780个停留点,再利用GoogleMap API对停留点进行反向地址解析,排除由于交通堵塞造成的停留,通过解析出的地址判断停留点对应的敏感位置。
步骤3:根据语义的敏感位置进行聚类划分形成类簇集合Clus,具体步骤如下:
步骤3.1:初始化聚类划分所需的参数,包括隐私保护度l、用户设定需要保护的敏感位置列表SPlist中的中心点为SPcen、类簇集合Clus为空集、当前类簇数flag为0、类簇中心点的个数Ncen为0。
本实施例中,设置隐私保护度l=4。
步骤3.2:判断类簇中心点的个数Ncen是否小于类簇集合要分的类数,若类簇中心点的个数Ncen小于类簇集合要分的类数,则令中心点SPcen为距离当前中心点最远的点,继续步骤3.3,若类簇中心点的个数Ncen不小于类簇集合要分的类数,则停止。
本实施例中,类簇集合要分的类数根据用户访问地点列表SP中地点的个数4000以及隐私保护度l=4确定为4。
步骤3.3:令当前类簇集合Clusflag为当前类簇中心点SPcen以及与中心点SPcen混合距离最近的l-1个点。
所述计算两点间混合距离的公式如下:
其中,Distmix(SPi,SPj)为点SPi和点SPj间的混合距离,α和β为设定路网距离与语义相似度所占比重的参数且α+β=1,Dist(SPi,SPj)为点SPi和点SPj间的路网距离,maxDist为敏感位置之间的最大距离,sim(SPi,SPj)为点SPi和点SPj间的语义相似度,maxSim为敏感位置之间的最大语义相似度;所述点SPi和点SPj间的语义相似度sim(SPi,SPj)的计算公式如下:
其中,Δtavgi和Δtavgj分别为访问地点i和地点j用户的平均停留时长,Ni和Nj分别为访问地点i和地点j的用户数量,和分别为访问地点i和地点j的用户列表,和分别为一天内访问地点i和地点j的概率。
本实施例中,参数α与β均设置为0.5。
步骤3.4:分别以当前类簇集合Clusflag中的点作为中心点,计算该点与其他l-1个点的混合距离之和,并以与其他l-1个点的混合距离之和最小的点替换当前类簇中心点SPcen为新的当前类簇中心点SPcen。
步骤3.5:更新当前类簇集合Clusflag为新的当前类簇中心点SPcen以及与新的中心点SPcen混合距离最近的l-1个点,返回步骤2.4,直至当前类簇中心点SPcen不再发生替换。
步骤3.6:将当前类簇集合Clusflag合并到类簇集合Clus中。
步骤3.7:令当前类簇数flag加1,类簇中心点的个数Ncen加1,返回步骤3.2。
步骤4:根据类簇集合Clus构建假轨迹片段,具体步骤如下:
步骤4.1:构建包含类簇集合Clus中所有元素的最小边界矩形MBR,并确定距离矩形MBR最近的两个路口点为假轨迹片段的起点Vs和假轨迹片段的终点Vf,初始化构建假轨迹片段所需的参数,包括采样间隔tinterval和采样点数量Num,设置当前采样点个数为0。
本实施例中,设置采样间隔tinterval=5s,采样点数量Num=7。
本实施例中,当隐私保护度l=4时,原始轨迹中,用户需要保护的敏感位置为医院A,经过步骤2对敏感位置进行聚类划分后,医院A与公园、公司和餐厅B构成一个类簇,通过构建该类簇的最小边界矩形MBR,距离该矩形的最近的两个采样点分别为假轨迹片段的起始采样点Vs和终止采样点Vf,如图3所示。
步骤4.2:在最小边界矩形MBR中,以设定替换点位置SPfake替换用户设定需要保护的敏感位置。
本实施例中,以替换点公司的位置SPfake替换用户设定需要保护的敏感位置医院。
步骤4.3:构建从起点Vs到替换点位置SPfake之间的假轨迹片段,具体步骤如下:
步骤4.3.1:根据采样间隔tinterval和移动对象的速度Vrandom确定采样点的位置。
所述移动对象的速度Vrandom在移动对象的最小速度Vmin和最大速度Vmax之间随机确定,且每次取值不一定相同。
步骤4.3.2:判断采样点是否与替换点位置SPfake重合,若是,则输出当前采样点个数,继续步骤4.4,若否,则当前采样点个数加1,返回步骤4.3.1,确定下一采样点的位置。
步骤4.4:构建替换点位置SPfake到终点Vf之间的假轨迹片段,具体步骤如下:
步骤4.4.1:根据采样间隔tinterval和移动对象的速度Vrandom确定采样点的位置。
步骤4.4.2:判断采样点是否与终点Vf重合,若是,则则输出当前采样点个数,继续步骤4.5,若否,则当前采样点个数加1,返回步骤4.4.1,确定下一采样点的位置。
步骤4.5:判断当前采样点个数是否小于采样点数量Num,若是,则在替换点位置SPfake周围距离阈值θd范围内随机选取一点,返回步骤4.5,若否,则连接各个采样点,完成假轨迹片段的构建。
本实施例中,随机选择类簇中的公司替换医院A,从起始点Vs沿公司方向构建假采样点,随机选取移动对象的移动速度Vrandom∈[Vmin,Vmax],根据采样时间间隔计算假轨迹上采样点的位置,同理从公司沿终止点Vf方向构建假采样点。为了保证采样点的数量一致,原始轨迹采样点数量为7个,因此,在假位置公司周围θd范围内随机选取三个采样点位置,更新采样时间产生一条新的假轨迹片段,构建好的假轨迹片段如图4所示。
步骤4:以假轨迹片段T*替换原始数据集D中轨迹片段T,输出经过隐私保护的数据集D*。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;因而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。
Claims (5)
1.一种支持个性化隐私的轨迹敏感数据保护方法,其特征在于,包括以下步骤:
步骤1:提取原始数据集D中用户设定需要保护的敏感位置列表SPlist;
所述原始数据集D={d1,...,do,...,dz},其中,do={ID,T,SPlist},ID为记录的标识,T为轨迹,SPlist为用户设定需要保护的敏感位置列表;所述用户设定需要保护的敏感位置列表SPlist={SP1,...,SPk},SPb=(ID’,lcore,add,sem),其中,ID’为敏感位置的标识符,lcore为敏感位置的核心地理位置,add为敏感位置的地址,sem为敏感位置的语义信息;所述敏感位置的语义信息其中,Δtavg为访问敏感位置用户的平均停留时长,N为访问敏感位置的用户数量,为访问敏感位置的用户列表,为一天内访问敏感位置的概率;所述一天内访问敏感位置的概率为q维向量,将一天24小时分为q段,其中,pa为第a时段移动对象进入敏感位置的概率,且1≤a≤q;
步骤2:采用Google Map API对用户设定的敏感位置列表SPlist中的任意敏感位置SPb进行反向地址解析,得到敏感序列SSb;
步骤3:根据语义的敏感位置进行聚类划分形成类簇集合Clus,具体步骤如下:
步骤3.1:初始化聚类划分所需的参数,包括隐私保护度l、用户设定需要保护的敏感位置列表SPlist中的中心点为SPcen、类簇集合Clus为空集、当前类簇数flag为0、类簇中心点的个数Ncen为0;
步骤3.2:判断类簇中心点的个数Ncen是否小于类簇集合要分的类数,若小于,则令中心点SPcen为距离当前中心点最远的点,继续步骤3.3,若不小于,则停止;
步骤3.3:令当前类簇集合Clusflag为当前类簇中心点SPcen以及与中心点SPcen混合距离最近的l-1个点;
步骤3.4:分别以当前类簇集合Clusflag中的点作为中心点,计算该点与其他l-1个点的混合距离之和,并以与其他l-1个点的混合距离之和最小的点替换当前类簇中心点SPcen为新的当前类簇中心点SPcen;
步骤3.5:更新当前类簇集合Clusflag为新的当前类簇中心点SPcen以及与新的中心点SPcen混合距离最近的l-1个点,返回步骤2.4,直至当前类簇中心点SPcen不再发生替换;
步骤3.6:将当前类簇集合Clusflag合并到类簇集合Clus中;
步骤3.7:令当前类簇数flag加1,类簇中心点的个数Ncen加1,返回步骤3.2;
步骤4:根据类簇集合Clus构建假轨迹片段,具体步骤如下:
步骤4.1:构建包含类簇集合Clus中所有元素的最小边界矩形MBR,并确定距离矩形MBR最近的两个路口点为假轨迹片段的起点Vs和假轨迹片段的终点Vf,初始化构建假轨迹片段所需的参数,包括采样间隔tinterval和采样点数量Num,设置当前采样点个数为0;
步骤4.2:在最小边界矩形MBR中,以设定替换点位置SPfake替换用户设定需要保护的敏感位置;
步骤4.3:构建从起点Vs到替换点位置SPfake之间的假轨迹片段,具体步骤如下:
步骤4.3.1:根据采样间隔tinterval和移动对象的速度Vrandom确定采样点的位置;
步骤4.3.2:判断采样点是否与替换点位置SPfake重合,若是,则输出当前采样点个数,继续步骤4.4,若否,则当前采样点个数加1,返回步骤4.3.1,确定下一采样点的位置;
步骤4.4:构建替换点位置SPfake到终点Vf之间的假轨迹片段,具体步骤如下:
步骤4.4.1:根据采样间隔tinterval和移动对象的速度Vrandom确定采样点的位置;
步骤4.4.2:判断采样点是否与终点Vf重合,若是,则则输出当前采样点个数,继续步骤4.5,若否,则当前采样点个数加1,返回步骤4.4.1,确定下一采样点的位置;
步骤4.5:判断当前采样点个数是否小于采样点数量Num,若是,则在替换点位置SPfake周围距离阈值θd范围内随机选取一点,返回步骤4.5,若否,则连接各个采样点,完成假轨迹片段的构建;
步骤5:以假轨迹片段T*替换原始数据集D中轨迹片段T,输出经过隐私保护的数据集D*。
2.根据权利要求1所述的支持个性化隐私的轨迹敏感数据保护方法,其特征在于,所述第a段时间移动对象(MOB)进入敏感位置的概率pa的计算公式如下:
其中,Num(a)为第a段时间访问某一地点的人数,N为一天内访问该地点的人数。
3.根据权利要求1所述的支持个性化隐私的轨迹敏感数据保护方法,其特征在于,所述计算两点间混合距离的公式如下:
其中,Distmix(SPi,SPj)为点SPi和点SPj间的混合距离,α和β为设定路网距离与语义相似度所占比重的参数且α+β=1,Dist(SPi,SPj)为点SPi和点SPj间的路网距离,maxDist为敏感位置之间的最大距离,sim(SPi,SPj)为点SPi和点SPj间的语义相似度,maxSim为敏感位置之间的最大语义相似度;所述点SPi和点SPj间的语义相似度sim(SPi,SPj)的计算公式如下:
其中,Δtavgi和Δtavgj分别为访问地点i和地点j用户的平均停留时长,Ni和Nj分别为访问地点i和地点j的用户数量,和分别为访问地点i和地点j的用户列表,和分别为一天内访问地点i和地点j的概率。
4.根据权利要求1所述的支持个性化隐私的轨迹敏感数据保护方法,其特征在于,所述步骤3中类簇集合要分的类数根据用户访问地点列表SP中地点的个数以及隐私保护度l确定。
5.根据权利要求1所述的支持个性化隐私的轨迹敏感数据保护方法,其特征在于,所述步骤4中移动对象的速度Vrandom在移动对象的最小速度Vmin和最大速度Vmax之间随机确定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810984952.XA CN109165527B (zh) | 2018-08-28 | 2018-08-28 | 支持个性化隐私的轨迹敏感数据保护方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810984952.XA CN109165527B (zh) | 2018-08-28 | 2018-08-28 | 支持个性化隐私的轨迹敏感数据保护方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109165527A true CN109165527A (zh) | 2019-01-08 |
CN109165527B CN109165527B (zh) | 2021-07-20 |
Family
ID=64896915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810984952.XA Active CN109165527B (zh) | 2018-08-28 | 2018-08-28 | 支持个性化隐私的轨迹敏感数据保护方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109165527B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109769212A (zh) * | 2019-01-22 | 2019-05-17 | 安徽师范大学 | 一种群智感知中基于切片的轨迹隐私保护方法 |
CN110602631A (zh) * | 2019-06-11 | 2019-12-20 | 东华大学 | Lbs中抵御推测攻击的位置数据的处理方法和处理装置 |
CN110688665A (zh) * | 2019-09-30 | 2020-01-14 | 西北大学 | 一种基于关节点综合重要度的位置敏感度判别方法 |
CN111259434A (zh) * | 2020-01-08 | 2020-06-09 | 广西师范大学 | 轨迹数据发布中针对个人偏好位置的隐私保护方法 |
CN111274475A (zh) * | 2020-01-16 | 2020-06-12 | 深圳市前海随手数据服务有限公司 | 轨迹特征的提取方法、装置、存储介质及终端 |
CN112347509A (zh) * | 2020-11-06 | 2021-02-09 | 浙江师范大学 | 基于隐私核心集和staircase机制的轨迹数据发布方法 |
CN112668040A (zh) * | 2020-12-14 | 2021-04-16 | 长安大学 | 一种基于语义的轨迹聚类隐私保护方法 |
CN112948872A (zh) * | 2021-02-02 | 2021-06-11 | 华南理工大学 | 一种基于分段聚类的路网轨迹语义隐私保护方法 |
CN113672975A (zh) * | 2021-08-03 | 2021-11-19 | 支付宝(杭州)信息技术有限公司 | 一种用户轨迹的隐私保护方法和装置 |
CN114021191A (zh) * | 2021-11-05 | 2022-02-08 | 江苏安泰信息科技发展有限公司 | 一种安全生产信息化敏感数据管理方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140181033A1 (en) * | 2012-12-21 | 2014-06-26 | Commvault Systems, Inc. | Systems and methods to track deleted files |
CN104680072A (zh) * | 2015-03-16 | 2015-06-03 | 福建师范大学 | 基于语义的个性化轨迹数据隐私保护方法 |
-
2018
- 2018-08-28 CN CN201810984952.XA patent/CN109165527B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140181033A1 (en) * | 2012-12-21 | 2014-06-26 | Commvault Systems, Inc. | Systems and methods to track deleted files |
CN104680072A (zh) * | 2015-03-16 | 2015-06-03 | 福建师范大学 | 基于语义的个性化轨迹数据隐私保护方法 |
Non-Patent Citations (1)
Title |
---|
孙琪: "基于位置服务的连续查询隐私保护研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109769212B (zh) * | 2019-01-22 | 2020-12-01 | 安徽师范大学 | 一种群智感知中基于切片的轨迹隐私保护方法 |
CN109769212A (zh) * | 2019-01-22 | 2019-05-17 | 安徽师范大学 | 一种群智感知中基于切片的轨迹隐私保护方法 |
CN110602631A (zh) * | 2019-06-11 | 2019-12-20 | 东华大学 | Lbs中抵御推测攻击的位置数据的处理方法和处理装置 |
CN110688665A (zh) * | 2019-09-30 | 2020-01-14 | 西北大学 | 一种基于关节点综合重要度的位置敏感度判别方法 |
CN110688665B (zh) * | 2019-09-30 | 2023-07-21 | 西北大学 | 一种基于关节点综合重要度的位置敏感度判别方法 |
CN111259434B (zh) * | 2020-01-08 | 2022-04-12 | 广西师范大学 | 轨迹数据发布中针对个人偏好位置的隐私保护方法 |
CN111259434A (zh) * | 2020-01-08 | 2020-06-09 | 广西师范大学 | 轨迹数据发布中针对个人偏好位置的隐私保护方法 |
CN111274475A (zh) * | 2020-01-16 | 2020-06-12 | 深圳市前海随手数据服务有限公司 | 轨迹特征的提取方法、装置、存储介质及终端 |
CN112347509A (zh) * | 2020-11-06 | 2021-02-09 | 浙江师范大学 | 基于隐私核心集和staircase机制的轨迹数据发布方法 |
CN112668040A (zh) * | 2020-12-14 | 2021-04-16 | 长安大学 | 一种基于语义的轨迹聚类隐私保护方法 |
CN112948872A (zh) * | 2021-02-02 | 2021-06-11 | 华南理工大学 | 一种基于分段聚类的路网轨迹语义隐私保护方法 |
CN112948872B (zh) * | 2021-02-02 | 2023-03-24 | 华南理工大学 | 一种基于分段聚类的路网轨迹语义隐私保护方法 |
CN113672975A (zh) * | 2021-08-03 | 2021-11-19 | 支付宝(杭州)信息技术有限公司 | 一种用户轨迹的隐私保护方法和装置 |
CN114021191A (zh) * | 2021-11-05 | 2022-02-08 | 江苏安泰信息科技发展有限公司 | 一种安全生产信息化敏感数据管理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109165527B (zh) | 2021-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109165527A (zh) | 支持个性化隐私的轨迹敏感数据保护方法 | |
Kim et al. | TOPTRAC: Topical trajectory pattern mining | |
Yuan et al. | Measuring similarity of mobile phone user trajectories–a Spatio-temporal Edit Distance method | |
US8838436B2 (en) | Labeling context slices to produce a storyline from mobile device data | |
CN103069849B (zh) | 用于安全共享的个人地图层的方法和装置 | |
CN107798557A (zh) | 电子装置、基于lbs数据的服务场所推荐方法及存储介质 | |
KR101779993B1 (ko) | 문맥 대응 관심 지점 검색 | |
KR101174216B1 (ko) | 지역기반의 검색어를 추천하는 시스템 및 그 방법 | |
WO2019184463A1 (zh) | 数据处理 | |
Wu et al. | Modified data-driven framework for housing market segmentation | |
CN106162544B (zh) | 一种地理围栏的生成方法和设备 | |
US20150248436A1 (en) | Methods, Circuits, Devices, Systems and Associated Computer Executable Code for Assessing a Presence Likelihood of a Subject at One or More Venues | |
CN106022934A (zh) | 一种基于移动轨迹模式的潜在好友发现方法及系统 | |
CN106878939A (zh) | 基于联系人信息来标注被访问的位置的方法和系统 | |
CN105760780A (zh) | 基于路网的轨迹数据隐私保护方法 | |
CN105243148A (zh) | 一种基于签到数据的时空轨迹相似性度量方法及系统 | |
Cao et al. | Revisitation in urban space vs. online: A comparison across pois, websites, and smartphone apps | |
CN104680072A (zh) | 基于语义的个性化轨迹数据隐私保护方法 | |
Sun et al. | Exploring the urban region-of-interest through the analysis of online map search queries | |
Xia et al. | Revealing urban dynamics by learning online and offline behaviours together | |
Hao et al. | A node localization algorithm based on Voronoi diagram and support vector machine for wireless sensor networks | |
CN113486927B (zh) | 一种基于先验概率的无监督轨迹访问地点标注方法 | |
Cai et al. | An efficient location recommendation scheme based on clustering and data fusion | |
Xiao et al. | Assessing polycentric urban development in Shanghai, China, with detailed passive mobile phone data | |
CN105912702A (zh) | 位置推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |