CN111914287A - 一种轨迹隐私保护的改进dtw度量方法、存储设备及设备 - Google Patents

一种轨迹隐私保护的改进dtw度量方法、存储设备及设备 Download PDF

Info

Publication number
CN111914287A
CN111914287A CN202010555042.7A CN202010555042A CN111914287A CN 111914287 A CN111914287 A CN 111914287A CN 202010555042 A CN202010555042 A CN 202010555042A CN 111914287 A CN111914287 A CN 111914287A
Authority
CN
China
Prior art keywords
point
distance
track
points
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010555042.7A
Other languages
English (en)
Other versions
CN111914287B (zh
Inventor
戴慧珺
虎文博
桂小林
腾晓宇
徐盼
郑蕙圆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202010555042.7A priority Critical patent/CN111914287B/zh
Publication of CN111914287A publication Critical patent/CN111914287A/zh
Application granted granted Critical
Publication of CN111914287B publication Critical patent/CN111914287B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)
  • Train Traffic Observation, Control, And Security (AREA)

Abstract

本发明公开了一种轨迹隐私保护的改进DTW度量方法、存储设备及设备,用Filter算法对原本的数据进行过滤,去除掉一些明显的漂移的点和一些明显错误的不符合实际情况的点;按照时间,经度,纬度的格式录入两条轨迹的数据;计算两条轨迹中各个点之间的实际距离;计算这两条轨迹的相似度的程度。本发明能够对用户的轨迹隐私保护程度进行量化,清晰反映用户隐私安全程度和隐私泄露程度。在基于位置的服务,智能交通,出行预测,数据挖掘等需要利用轨迹技术等领域也有较好的应用价值。

Description

一种轨迹隐私保护的改进DTW度量方法、存储设备及设备
技术领域
本发明属于位置信息服务下用户的轨迹隐私安全技术领域,具体涉及一种轨迹隐私保护的改进DTW度量方法、存储设备及设备。
背景技术
随着智能手机、卫星定位、跟踪检测、以及传感器等等技术的高速发展,我们的行为、轨迹等数据被大量的记录收集、分析、挖掘和利用,各种对这些轨迹数据进行应用的技术也越来越多。轨迹预测可以更好的规划出行路线;智能交通可以为决策部门提供交通和城市规划的改善建议;异常轨迹检测可以对犯罪案件和公共安全做出预警。连续的位置构成了轨迹数据,位置和轨迹和查询导航、社交娱乐以及其他生活服务相关联则使得用户行为特征、兴趣爱好和社会习惯等隐私信息更易被泄露和挖掘,函待更强的保护措施。现阶段已经有很多轨迹隐私保护和隐私增强方法取得了较为成功的应用效果,常用算法有假名、加噪、泛化和空间变换。轨迹泛化方法即轨迹的空间K匿名,其变形还包括m-不变性,l-多样性,p-敏感性;轨迹的混淆方法把移动区域分为混合区域和应用区域,在混合区内更名、模糊化并动态更换可增强假名更换的有效性。
国内外对轨迹隐私度量方法的研究主要包括与隐私保护算法相关联的特定度量和普适度量两类方法。与轨迹隐私保护算法相关联的特定度量方法特点是不同隐私保护算法有各自的风险评价体系,度量因算法而异。这类隐私度量方法局限性在于只对隐私信息泄露风险,隐私保护算法强度、开销或者数据损失、服务准确度下降等其中一方面进行度量,无法让使用者获得一个隐私风险客观指标。而普适度量主要针对隐私保护前后的轨迹距离,一般采用欧几里德距离来度量轨迹间的相似性和偏离程度。欧氏距离越小,轨迹间相似性越高;反之,相似性越低。缺点在于欧氏距离只能度量等长的轨迹且需要轨迹位置的时间点一一对应,度量过程中轨迹部分完全同步,不处于同步时间段的轨迹部分就会被截断并删除。现实生活中很多不等长且有局部时间偏移的轨迹在度量相似性时存在构造等长同步轨迹造成较大信息损失问题,因此以欧氏距离作为相似性标准的算法信息损失相对较高。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种轨迹隐私保护的改进DTW度量方法、存储设备及设备,基于改进DTW距离算法,来量化用户的轨迹隐私保护程度,对用户的隐私安全程度和隐私泄露程度作清晰反映,科学评估用户隐私泄露风险程。
本发明采用以下技术方案:
一种轨迹隐私保护的改进DTW度量方法,包括以下步骤:
S1、采用Filter算法对原始轨迹数据进行预处理,去除噪声点和离群点,得到两条输出轨迹;
S2、计算步骤S1得到的两个输出轨迹之间各个点的实际距离,放入距离矩阵D中;
S3、根据规整路径单向性,对距离矩阵D进行距离最短匹配,得到两条轨迹的DTW距离矩阵G并计算相似度;
S4、从相似度回溯求解输出集合中的点对得到最佳匹配路径和相应匹配点。
具体的,步骤S1具体为:
S101、接收阈值Threshold和轨迹,将轨迹定义为T,使用GPS定位的经纬度坐标表示输入轨迹Tin
S102、计算同一条轨迹Tin中的两个点pi(ti,xi,yi)和pi+1(ti+1,xi+1,yi+1)的时间间隔I=|ti-ti+1|;
S103、计算pi和pi+1两点之间的实际距离d;
S104、计算pi和pj两点之间的速度v,如果v≤Threshold,继续遍历轨迹上的点,并将pi加入到输出轨迹Tout中,否则移除后面的一个记录点pi+1
S105、根据遍历点集合返回输出轨迹Tout
具体的,步骤S104中,对轨迹Tin={p1(t1,x1,y1),p2(t2,x2,y2),p3(t3,x3,y3),...,pn(tn,xn,yn)}预处理时,设置坐标i,j;i表示当前考查的点,初始值为1,j表示当前考查点的下一个考察点,初始值为2;如果两点间速度v≤Threshold,将pi加入到输出轨迹Tout中,并且将j所指的点作为新的考查点,将坐标i指向它,j指向下一个点;否则,i不变,将j所指的点舍弃,并将j后移;当j后移后,两点间速度仍然≥Threshold,将i移到j当前位置,j向后移到到下一个位置,继续计算两点间速度;当i为n,则将i所指的点直接加入Tout,得到两点间的速度。
具体的,步骤S2具体为:
S201、对任意两条轨迹T1和T2,用实际距离d(i,j)表示T1和T2上的两不同点i和j;
S202、逐一计算距离矩阵D中i行j列元素的值,令D[i][j]=d(i,j)得到n行m列矩阵的DTW矩阵,每一个矩阵元素d(i,j)表示点i和j的对齐距离。
更进一步的,本发明的特点还在于,步骤S201中,实际距离d(i,j)为T1中每个点pi(ti,xi,yi)与T2中每个点pj(tj,xj,yj)的距离,1≤i≤n,1≤j≤m,表示如下:
Figure BDA0002543992200000041
C=sinyi×sinyj×cos(xi-xj)+cosyi×cosyj
其中,R为地球半径取6371千米。
具体的,步骤S3具体为:
S301、根据规整路径单向性,从距离矩阵D的左下角[1,1]出发,直到矩阵右上角的[n,m]结束,令初始距离g(0,0)=0;
S302、根据规则路径单向性计算每一步距离g(i,j),i,j代表横纵坐标,根据寻路结果,计算最小g(i,j)时,使用箭头标注最小值来源于g(i-1,j),g(i-1,j-1)或者g(i,j-1)作为最小值方向;
S303、根据寻路结果,以及箭头标注方向,递增i和j,当i=m,j=n,表示距离计算已达矩阵右上角,得到最小规整路径,以及计算来源和过程,此刻得到两条轨迹的DTW距离矩阵G。
更进一步的,本发明的特点还在于,步骤S302中,每一步距离g(i,j)为:
Figure BDA0002543992200000042
其中,d(i,j)为距离矩阵D中D[i][j]的值。
具体的,步骤S4具体为:
S401、从最终相似度值G[i][j]=g(i,j),i=m,j=n开始计算,定义变量p,q,从(m,n)出发,根据路径标注,寻找当前值的来源,得到g(p,q),将g(i,j)、g(p,q)等记录进集合,并将当前点换成(p,q);
S402、判断p,q点的值,判断p=1,或者q=1是否为0,表示已经返回下排第一行或左方第一列,当p=1,不断将q值-1,直到q=1,当q=1,将p值-1,直到p=1,并将g(p,q)记录进集合;如果p=1&q=1p+q=2表示已经回到起点(1,1),当p≠1&q≠1,根据箭头更新p,q点的值,逐步回溯,并将当前的点记录进集合;
S403、输出集合中的点对,得到最佳匹配路径。
本发明的另一技术方案是,一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据所述的方法中的任一方法。
本发明的另一技术方案是,一种计算设备,包括:
一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据所述的方法中的任一方法的指令。
与现有技术相比,本发明至少具有以下有益效果:
本发明可以提供一种改进DTW的轨迹隐私保护度量方案,能够对移动用户的轨迹隐私保护程度进行量化,清晰反映用户隐私安全程度和隐私泄露程度。在基于位置的服务(LBS),智能交通,出行预测,数据挖掘等需要利用轨迹技术等领域也有较好的应用价值。
进一步的,步骤S1中的Filter算法,在进行轨迹相似度计算之前先对轨迹以速度为阈值进行了一次过滤,去除掉一些漂移或者明显错误的记录点,并越过一些时间间隔点,体现了算法与现实的结合和准确性。
进一步的,步骤S2中距离计算公式利用经纬度来计算轨迹点之间的实际地理距离,而不是常规的欧式距离,使其具有真实意义。
进一步的,步骤S3中利用距离矩阵计算轨迹的相似度,不需要对不同的轨迹进行同步,大大减少了算法的时间复杂度,同时也增加了算法的通用性。
进一步的,步骤S4利用归整路径单向性,回溯求解了不同路径之间的最短匹配路径,体现了算法的可追溯性和完整性。
综上所述,本发明的改进DTW隐私度量方法,在DTW算法的基础上,增加了Filter算法对轨迹中可能存在的漂移和错误的点进行过滤,省去了轨迹同步,减少了时间复杂度,增加了算法的通用性。利用了经纬度计算公式计算两点之间的实际距离,使相似度的度量具有了实际的物理意义。所以,本发明方法与其他方法相比具有更好的准确性、通用性和更高的效率。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明度量方法过程示意图;
图2为两条进行比较的轨迹时序轴图;
图3为距离矩阵示意图,其中,(a)为2条轨迹的距离矩阵示意图,(b)的箭头是距离矩阵求解的前进方向;
图4为计算结果过程图,其中,(a)是DTW距离计算过程,(b)是计算结果过程,(c)回溯寻找规则路径过程;
图5为真实数据的计算结果图。
具体实施方式
本发明提供了一种轨迹隐私保护的改进DTW度量方法,采用Filter算法对原本的数据进行过滤,去除掉一些明显的漂移的点和一些明显错误的不符合实际情况的点;按照(时间,经度,纬度)的格式录入两条轨迹的数据;计算两条轨迹中各个点之间的实际距离放到距离矩阵D中;计算这两条轨迹的相似度的程度,得出最佳匹配路径。
请参阅图1,本发明一种轨迹隐私保护的改进DTW度量方法,包括以下步骤:
S1、对原始轨迹数据进行预处理,去除噪声点和离群点,得到输出轨迹;
采用Filter算法对原本的数据进行过滤,具体包括:
S101、接收阈值Threshold和轨迹,为了便于计算和比较,将轨迹定义为以下形式:
T={(t1,x1,y1),(t2,x2,y2),...,(tn,xn,yn)}
其中,n≥1,表示采样位置点时间序列,ti为pi的时间值,xi,yi表示第i时刻轨迹点的坐标,使用GPS定位的经纬度坐标来表示,输入轨迹表示为:
Tin={p1(t1,x1,y1),p2(t2,x2,y2),p3(t3,x3,y3),...,pn(tn,xn,yn)}
S102、计算同一条轨迹Tin中的两个点pi(ti,xi,yi)和pi+1(ti+1,xi+1,yi+1)的时间间隔I=|ti-ti+1|;
S103、计算pi和pi+1两点之间的实际距离d,其中d的定义为:
Figure BDA0002543992200000071
其中,R为地球半径取6371千米,d的单位和R保持一致为千米,C的计算方法如下:
C=sinyi×sinyi+1×cos(xi-xi+1)+cosyi×cosyi+1
S104、计算pi和pj两点之间的速度
Figure BDA0002543992200000072
如果v≤Threshold则继续遍历该轨迹的点,并将pi加入到输出轨迹Tout中,否则移除后面的一个记录点pi+1
对轨迹Tin={p1(t1,x1,y1),p2(t2,x2,y2),p3(t3,x3,y3),...,pn(tn,xn,yn)}预处理时,设置坐标i,j;i表示当前考查的点,j表示当前考查点的下一个考察点;i初始值设置为1,j初始值设置为2;如果两点间速度v≤Threshold则将pi加入到输出轨迹Tout中,并且将j所指的点作为新的考查点,将坐标i指向它,j指向下一个点;否则,i不变,将j所指的点舍弃,并将j后移;当j后移后,两点间速度仍然≥Threshold则将i移到j当前位置,j向后移到到下一个位置,继续计算两点间速度。当i为n,则将i所指的点直接加入Tout;由此得到两点间速度;
S105、根据遍历点集合返回输出轨迹Tout
S2、计算得到的两个输出轨迹之间的各个点实际距离,并放到距离矩阵D中;
S201、对任意两条轨迹T1和T2,如图2所示,xi,yi表示第i时刻轨迹点的经纬度坐标,
Figure BDA0002543992200000081
Figure BDA0002543992200000082
其中,T1中每个点pi(ti,xi,yi)(1≤i≤n)与T2中每个点pj(tj,xj,yj)(1≤j≤m)实际距离为d,该实际距离d(i,j)表示T1和T2上的两不同点i和j,
Figure BDA0002543992200000083
其中,R为地球半径取6371千米,C的计算方法如下:
C=sinyi×sinyj×cos(xi-xj)+cosyi×cosyj
S202、逐一计算距离矩阵D中i行j列元素的值,令D[i][j]=d(i,j)得到n行m列矩阵的DTW矩阵,每一个矩阵元素d(i,j)表示点i和j的对齐距离。
S3、对距离矩阵D进行距离最短的匹配,得到DTW距离,计算二者相似度;
S301、根据规整路径单向性,限定规整路径必须从矩阵左下角[1,1]出发,到达[n,m],方向只有三种,分别是从(i,j)到(i+1,j),或从(i,j)到(i+1,j+1),或从(i,j)到(i,j+1),如图3(b)所示。从距离矩阵的左下方第一个点开始进行规整路径寻找,即从距离矩阵D的左下角[1,1]出发,直到矩阵右上角的[n,m]结束,令初始距离g(0,0)=0:
S302、计算每一步距离g(i,j),i,j代表横纵坐标,根据规则路径单向性,计算方法如下:
Figure BDA0002543992200000091
其中,i和j递增,d(i,j)为距离矩阵D中D[i][j]的值;根据寻路结果,计算最小g(i,j)时,使用箭头标注最小值来源于g(i-1,j),g(i-1,j-1)或者g(i,j-1)作为最小值方向。
S303、根据寻路结果,以及箭头标注方向,递增i和j,直到路径规划计算到右上角时,如图4(b)所示,得到最小规整路径,以及计算来源和过程,此刻得到两条轨迹的DTW距离矩阵G,如图4(c)所示,矩阵值G[i][j]=g(i,j),当i=m,j=n,表示距离计算已达矩阵右上角如图4(c)所示;该值越大则两条轨迹的累计距离越大,相似程度也就越低。
S4、由相似度回溯求解最佳匹配路径和相应匹配点。
S401、从最终相似度值G[i][j]=g(i,j),i=m,j=n开始计算,定义变量p,q,从(m,n)出发,根据路径标注,寻找当前值的来源,得到g(p,q),将g(i,j)、g(p,q)等记录进集合,并将当前点换成(p,q);
S402、判断p,q点的值,判断p=1,或者q=1是否为0,表示已经返回下排第一行或左方第一列,当p=1,不断将q值-1,直到q=1,当q=1,不断将p值-1,直到p=1,并将g(p,q)记录进集合。如果p=1&q=1p+q=2表示已经回到起点(1,1),当p≠1&q≠1,根据箭头所示,更新p,q点的值,逐步回溯,并将当前的点记录进集合;
S403、输出集合中的点对,得到最佳匹配路径。
本发明针对位置服务中的隐私保护方法,基于改进DTW距离算法,来量化用户的轨迹隐私保护程度,避免构造同步的轨迹数据集,忽略同步过程带来的数据损失,科学评估轨迹隐私保护程度。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中的描述和所示的本发明实施例的组件可以通过各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
真实数据的实验基于微软研究院GeoLife GPS Trajectories行人真实的位置数据集,开发环境是MatlabR2019,记录和计算了1000名左右用户的轨迹和度量数据。实验结果表示度量值能够客观量化轨迹数据的相似程度以及关联程度。下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
S1、用Filter算法对原本的数据进行过滤,去除掉一些明显的漂移点和错误点;并去除一些间隔点,增强算法健壮性,按照(时间,经度,纬度)的格式录入两条轨迹的数据,轨迹数据T={(t1,x1,y1),(t2,x2,y2),...,(tn,xn,yn)},其中,n≥1,ti,xi,yi分别为pi的经纬度和时间值,考虑南北半球和且东经取正值,西经取负值;北纬取(90-纬度),南纬取(90+纬度)。图2为两条轨迹示意图,其中一条表示如下,根据Filter算法预处理轨迹点后可得有效数据
T1={(1,116.51172,39.92123),(2,116.51135,39.93883),…(11,116.50789,39.93128)}
S2、计算两条轨迹中T1和T2各个点之间的实际距离放到距离矩阵D中,计算方法如下:
计算T1中每个点pi(ti,xi,yi)与T2中每个点pj(tj,xj,yj)的实际距离d:
Figure BDA0002543992200000111
其中,R为地球半径取6371千米,C的计算方法如下:
C=sinyi×sinyj×cos(xi-xj)+cosyi×cosyj
D[i][j]即为d(i,j)。
S3、为模拟计算方便,DTW计算过程如图3(a)(b)(c)所示。从S2中的距离矩阵第一个点开始进行距离最短的匹配,得到这两条轨迹的DTW距离和规整路径,图3(a)为两条轨迹的距离矩阵示意图,表格下方和左方的数字代表两条轨迹上的数据点,表格中值为对应地理距离,为说明方便,数据经过简化处理具体计算方法如下:
S301、定义初始距离g0(0,0)=0。gk(i,j)=g0(0,0),g1(i,j),…,gk(in,jm),是DTW距离,其中,k表示步数,m和n分别为两条轨迹的对应点。d(i,j)为距离矩阵D中D[i][j]的值。
Figure BDA0002543992200000121
S302、g(1,1)取值为0+2d(1,1)=2×D[1][1]=4,将g1(1,1)值记录在表格D[1][1]上方,作为规则路径的起点,如图4(a)所示。
S303、从g1(1,1)出发开始遍历,继续求最短规整路径即DTW距离,g(2,1)=g1(1,1)+d(2,1)5,并将g(2,1)的值记录在D[2][1]上方。
同样的,g(1,2)=g(1,1)+d(1,2)=7,由于,则
Figure BDA0002543992200000122
最小值从g(2,1)到g(2,2)这个方向取得。
继续遍历表格,g(3,1)=g(2,1)+d(3,1)=5+5=10,g(1,3)=g(1,2)+d(1,3)=7+5=12,g(3,2)和g(2,3)计算方法如下:
Figure BDA0002543992200000123
Figure BDA0002543992200000124
g(3,2)=17,最小值从g(2,2)到g(3,2)方向取得,g(2,3)=11,最小值方向来自g(1,2),g(3,2)计算过程同上值为15,最小值方向来自g(2,3)。
S304、表格g(1,i)和g(j,1),即从左侧第一列和下方第一行开始,只有一个取值方向,来自该行或该列的前一个值g(1,i-1)和g(j-1,1)。表格其他单元格,在填充右上方g(i,j)值的时候,根据最小g(i,j)的计算结果,使用箭头标注出最小值来源的方向记录下最小值的方向。当整个矩阵计算到右上角,如图4(b)所示。
得到每个g(i,j)时,以及相应计算来源。右上角的g(m,n)则是两条轨迹的最短距离和相似程度,g(m,n)值越大则两条轨迹的相似程度越低。由图4(b)可知,计算结果得到两条轨迹相似度的度量结果g=26;
S401、从G[i][j]=26,i=4,j=6开始计算,定义变量p,q。从(4,6)出发,根据路径标注,寻找当前值的来源,得到g(p,q)=16,p,q=3,5,将g(i,j)、g(p,q)等于(4,6;3,5)等记录进集合,并将当前点换成(3,5)。
S402、判断p,q点的值,判断p=1,或者q=1是否为0,表示已经返回下排第一行或左方第一列,当p=1,不断将q值-1,直到q=1,当q=1,不断将p值-1,直到p=1,并将g(p,q)记录进集合。如果p=1&q=1p+q=2表示已经回到起点(1,1),当p≠1&q≠1,根据箭头所示,更新p,q点的值,逐步回溯,并将当前的点记录进集合。
S403、输出集合中的点对,逆序规则为路径得到(1,1;2,1;2,2;2,3;3,4;3,5;4,6),得到最佳匹配路径。
将实验数据换成Geolife的真实数据,两条轨迹分别为517,1005个点,217,300个点以及21,17个点,轨迹数据DTW距离计算结果如图5所示,图(a)(b)(c)分别代表两条轨迹在不同阈值下的最短距离,并且可以看出随着阈值的增加,筛选的点越少,最终的距离也是成数量级减小。
综上所述,本发明方法对用户的轨迹隐私保护程度进行量化,清晰反映用户隐私安全程度和隐私泄露程度,在基于位置的服务(LBS),智能交通,出行预测,数据挖掘等需要利用轨迹技术等领域也有较好的应用价值。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。

Claims (10)

1.一种轨迹隐私保护的改进DTW度量方法,其特征在于,包括以下步骤:
S1、采用Filter算法对原始轨迹数据进行预处理,去除噪声点和离群点,得到两条输出轨迹;
S2、计算步骤S1得到的两个输出轨迹之间各个点的实际距离,放入距离矩阵D中;
S3、根据规整路径单向性,对距离矩阵D进行距离最短匹配,得到两条轨迹的DTW距离矩阵G并计算相似度;
S4、从相似度回溯求解输出集合中的点对得到最佳匹配路径和相应匹配点。
2.根据权利要求1所述的轨迹隐私保护的改进DTW度量方法,其特征在于,步骤S1具体为:
S101、接收阈值Threshold和轨迹,将轨迹定义为T,使用GPS定位的经纬度坐标表示输入轨迹Tin
S102、计算同一条轨迹Tin中的两个点pi(ti,xi,yi)和pi+1(ti+1,xi+1,yi+1)的时间间隔I=|ti-ti+1|;
S103、计算pi和pi+1两点之间的实际距离d;
S104、计算pi和pj两点之间的速度v,如果v≤Threshold,继续遍历轨迹上的点,并将pi加入到输出轨迹Tout中,否则移除后面的一个记录点pi+1
S105、根据遍历点集合返回输出轨迹Tout
3.根据权利要求1所述的轨迹隐私保护的改进DTW度量方法,其特征在于,步骤S104中,对轨迹Tin={p1(t1,x1,y1),p2(t2,x2,y2),p3(t3,x3,y3),…,pn(tn,xn,yn)}预处理时,设置坐标i,j;i表示当前考查的点,初始值为1,j表示当前考查点的下一个考察点,初始值为2;如果两点间速度v≤Threshold,将pi加入到输出轨迹Tout中,并且将j所指的点作为新的考查点,将坐标i指向它,j指向下一个点;否则,i不变,将j所指的点舍弃,并将j后移;当j后移后,两点间速度仍然≥Threshold,将i移到j当前位置,j向后移到到下一个位置,继续计算两点间速度;当i为n,则将i所指的点直接加入Tout,得到两点间的速度。
4.根据权利要求1所述的轨迹隐私保护的改进DTW度量方法,其特征在于,步骤S2具体为:
S201、对任意两条轨迹T1和T2,用实际距离d(i,j)表示T1和T2上的两不同点i和j;
S202、逐一计算距离矩阵D中i行j列元素的值,令D[i][j]=d(i,j)得到n行m列矩阵的DTW矩阵,每一个矩阵元素d(i,j)表示点i和j的对齐距离。
5.根据权利要求4所述的轨迹隐私保护的改进DTW度量方法,其特征在于,步骤S201中,实际距离d(i,j)为T1中每个点pi(ti,xi,yi)与T2中每个点pj(tj,xj,yj)的距离,1≤i≤n,1≤j≤m,表示如下:
Figure FDA0002543992190000021
C=sin yi×sin yj×cos(xi-xj)+cos yi×cos yj
其中,R为地球半径取6371千米。
6.根据权利要求1所述的轨迹隐私保护的改进DTW度量方法,其特征在于,步骤S3具体为:
S301、根据规整路径单向性,从距离矩阵D的左下角[1,1]出发,直到矩阵右上角的[n,m]结束,令初始距离g(0,0)=0;
S302、根据规则路径单向性计算每一步距离g(i,j),i,j代表横纵坐标,根据寻路结果,计算最小g(i,j)时,使用箭头标注最小值来源于g(i-1,j),g(i-1,j-1)或者g(i,j-1)作为最小值方向;
S303、根据寻路结果,以及箭头标注方向,递增i和j,当i=m,j=n,表示距离计算已达矩阵右上角,得到最小规整路径,以及计算来源和过程,此刻得到两条轨迹的DTW距离矩阵G。
7.根据权利要求6所述的轨迹隐私保护的改进DTW度量方法,其特征在于,步骤S302中,每一步距离g(i,j)为:
Figure FDA0002543992190000031
其中,d(i,j)为距离矩阵D中D[i][j]的值。
8.根据权利要求1所述的轨迹隐私保护的改进DTW度量方法,其特征在于,步骤S4具体为:
S401、从最终相似度值G[i][j]=g(i,j),i=m,j=n开始计算,定义变量p,q,从(m,n)出发,根据路径标注,寻找当前值的来源,得到g(p,q),将g(i,j)、g(p,q)等记录进集合,并将当前点换成(p,q);
S402、判断p,q点的值,判断p=1,或者q=1是否为0,表示已经返回下排第一行或左方第一列,当p=1,不断将q值-1,直到q=1,当q=1,将p值-1,直到p=1,并将g(p,q)记录进集合;如果p=1&q=1p+q=2表示已经回到起点(1,1),当p≠1&q≠1,根据箭头更新p,q点的值,逐步回溯,并将当前的点记录进集合;
S403、输出集合中的点对,得到最佳匹配路径。
9.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据权利要求1至8所述的方法中的任一方法。
10.一种计算设备,其特征在于,包括:
一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1至8所述的方法中的任一方法的指令。
CN202010555042.7A 2020-06-17 2020-06-17 一种轨迹隐私保护的改进dtw度量方法、存储设备及设备 Active CN111914287B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010555042.7A CN111914287B (zh) 2020-06-17 2020-06-17 一种轨迹隐私保护的改进dtw度量方法、存储设备及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010555042.7A CN111914287B (zh) 2020-06-17 2020-06-17 一种轨迹隐私保护的改进dtw度量方法、存储设备及设备

Publications (2)

Publication Number Publication Date
CN111914287A true CN111914287A (zh) 2020-11-10
CN111914287B CN111914287B (zh) 2023-03-31

Family

ID=73237772

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010555042.7A Active CN111914287B (zh) 2020-06-17 2020-06-17 一种轨迹隐私保护的改进dtw度量方法、存储设备及设备

Country Status (1)

Country Link
CN (1) CN111914287B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113159106A (zh) * 2021-02-26 2021-07-23 国网甘肃省电力公司 一种基于形态趋势特征的负荷曲线聚类方法、介质及设备
CN114125709A (zh) * 2022-01-25 2022-03-01 南京安元科技有限公司 一种结合gis路网和蓝牙信标的实时数据挖掘定位的方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101895866A (zh) * 2010-04-16 2010-11-24 华中师范大学 位置服务中的轨迹隐私度量方法
US20110208429A1 (en) * 2010-02-24 2011-08-25 Microsoft Corporation Route Computation Based on Route-Oriented Vehicle Trajectories
US20110310245A1 (en) * 2010-06-21 2011-12-22 Nissan Motor Co., Ltd. Travel distance detection device and travel distance detection method
CN106844409A (zh) * 2016-06-16 2017-06-13 南京航空航天大学 快速连续历史轨迹距离查询技术
CN106960006A (zh) * 2017-02-24 2017-07-18 河海大学 一种不同轨迹间相似度度量系统及其度量方法
CN108596202A (zh) * 2018-03-08 2018-09-28 清华大学 基于移动终端gps定位数据计算个人通勤时间的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110208429A1 (en) * 2010-02-24 2011-08-25 Microsoft Corporation Route Computation Based on Route-Oriented Vehicle Trajectories
CN101895866A (zh) * 2010-04-16 2010-11-24 华中师范大学 位置服务中的轨迹隐私度量方法
US20110310245A1 (en) * 2010-06-21 2011-12-22 Nissan Motor Co., Ltd. Travel distance detection device and travel distance detection method
CN106844409A (zh) * 2016-06-16 2017-06-13 南京航空航天大学 快速连续历史轨迹距离查询技术
CN106960006A (zh) * 2017-02-24 2017-07-18 河海大学 一种不同轨迹间相似度度量系统及其度量方法
CN108596202A (zh) * 2018-03-08 2018-09-28 清华大学 基于移动终端gps定位数据计算个人通勤时间的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIANGLILAN ZHANG等: "Confidence index dynamic time warping for language-independent embedded speech recognition", 《2013 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING》 *
赵家石等: "一种隐私保护的在线相似轨迹挖掘方法", 《哈尔滨工业大学学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113159106A (zh) * 2021-02-26 2021-07-23 国网甘肃省电力公司 一种基于形态趋势特征的负荷曲线聚类方法、介质及设备
CN113159106B (zh) * 2021-02-26 2024-02-02 国网甘肃省电力公司 一种基于形态趋势特征的负荷曲线聚类方法、介质及设备
CN114125709A (zh) * 2022-01-25 2022-03-01 南京安元科技有限公司 一种结合gis路网和蓝牙信标的实时数据挖掘定位的方法

Also Published As

Publication number Publication date
CN111914287B (zh) 2023-03-31

Similar Documents

Publication Publication Date Title
Chen et al. TrajCompressor: An online map-matching-based trajectory compression framework leveraging vehicle heading direction and change
US10281284B2 (en) Hybrid road network and grid based spatial-temporal indexing under missing road links
US9086288B2 (en) Method and system for finding paths using GPS tracks
CN105528359B (zh) 用于存储行进轨迹的方法和系统
CN111914287B (zh) 一种轨迹隐私保护的改进dtw度量方法、存储设备及设备
CN106574975A (zh) 使用外围信号的轨迹匹配
CN102567497B (zh) 一种最匹配模糊轨迹问题的查询方法
CN107883974B (zh) 导航路径的规划方法、导航服务器及计算机可读介质
Li et al. Robust inferences of travel paths from GPS trajectories
CN109215338A (zh) 一种基于网格化的北斗gps车辆轨迹管理系统及其方法
Yin et al. Feature-based map matching for low-sampling-rate GPS trajectories
US20170227365A1 (en) Information processing apparatus and trajectory information correcting method
CN111400747B (zh) 一种基于轨迹隐私保护的度量方法
Züfle et al. Handling uncertainty in geo-spatial data
Zhang et al. Vehicle positioning system with multi‐hypothesis map matching and robust feedback<? show [AQ ID= Q1]?>
US20090172507A1 (en) Information Processing System
Fujino et al. Detecting deviations from intended routes using vehicular GPS tracks
CN116150299B (zh) 一种可信度传播网络指引的多源轨迹关联方法
Xie et al. High-Accuracy off-line map-matching of trajectory network division based on weight adaptation HMM
El Mokhtari et al. Circular particle fusion filter applied to map matching
Shen et al. Retrieving similar trajectories from cellular data at city scale
CN115862416A (zh) 一种路径规划方法、装置、电子设备及存储介质
Čavojský et al. Comparison of user trajectories with the Needleman-Wunsch algorithm
Van Hunnik Extensive comparison of trajectory simplification algorithms
CN114898559A (zh) 一种城市车辆移动感知能力测定方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant