CN108491730B - 基于拉格朗日优化的轨迹间相关性隐私保护方法 - Google Patents

基于拉格朗日优化的轨迹间相关性隐私保护方法 Download PDF

Info

Publication number
CN108491730B
CN108491730B CN201810188835.2A CN201810188835A CN108491730B CN 108491730 B CN108491730 B CN 108491730B CN 201810188835 A CN201810188835 A CN 201810188835A CN 108491730 B CN108491730 B CN 108491730B
Authority
CN
China
Prior art keywords
correlation
user
usefulness
track
time point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810188835.2A
Other languages
English (en)
Other versions
CN108491730A (zh
Inventor
欧露
秦拯
胡娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN201810188835.2A priority Critical patent/CN108491730B/zh
Publication of CN108491730A publication Critical patent/CN108491730A/zh
Application granted granted Critical
Publication of CN108491730B publication Critical patent/CN108491730B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6263Protecting personal data, e.g. for financial or medical purposes during internet communication, e.g. revealing personal data from cookies

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于拉格朗日优化的轨迹间相关性隐私保护方法。本发明提出了一种轨迹间相关性的隐私保护方法,在给定数据有用性的情况下,提供了更大力度的隐私保护,并且在同等隐私保护力度下,使得数据有用性更高。

Description

基于拉格朗日优化的轨迹间相关性隐私保护方法
技术领域
本发明属于计算机领域,尤其涉及一种基于拉格朗日优化的轨迹间相关性隐私保护方法。
背景技术
两用户的轨迹间相关性可直接应用于许多现应用程序,例如,产品推荐和社交媒体。虽然轨迹间相关性可带来许多好处,但是由于轨迹间相关性可暗示某些社交关系,因此发布相关的轨迹可造成敏感社交关系的泄露。目前,针对轨迹间相关性的隐私保护方法,未见其相关报道。我们首次提出轨迹间相关性隐私保护方法,在给定数据有用性的情况下,可提供更大力度的隐私保护。并且,与现有的方法相比,我们提出的方法数据有用性更高,隐私保护力度更强。
名词解释:
n体拉普拉斯框架:对一天内具有n个时间点的轨迹一次性添加n个噪声,并且每个噪声都服从拉普拉斯分布。
隐私预算:一种隐私保护力度的表现形式,设定的值越小,隐私保护力度越大。
位置有用性:一种通过绝对距离偏差来衡量数据有用性的方法。
位置相关性有用性:一种运用两用户间经度和纬度的相关系数来衡量数据有用性的方法。
发明内容
为解决上述问题,本发明提供了一种基于拉格朗日优化的轨迹间相关性隐私保护方法。本发明提出了一种轨迹间相关性的隐私保护方法,在给定数据有用性情况下,可提供更大力度的隐私保护,在同等隐私保护力度下,数据有用性更高。
为达到上述技术效果,本发明的技术方案是:
一种基于拉格朗日优化的轨迹间相关性隐私保护方法,包括如下步骤:
步骤一:将用户的原始轨迹以天为单位,划分为多条子轨迹,称为“每天的轨迹”,“每天的轨迹”具有n个采样时间点;
步骤二:针对每天的轨迹,运用n体拉普拉斯框架,通过生成服从拉普拉斯分布的噪声集合,并将集合中噪声依据时间顺序分别添加到原始轨迹上,从而实现轨迹间相关性隐私保护;并且n体拉普拉斯框架满足以下不等式:
Figure BDA0001591101600000021
其中,
Figure BDA0001591101600000022
Figure BDA0001591101600000023
表示,在θρ分布的条件下,
Figure BDA0001591101600000024
属于
Figure BDA0001591101600000025
集合的概率;
Figure BDA0001591101600000026
表示运用S机制查询
Figure BDA0001591101600000027
所得到的结果,
Figure BDA0001591101600000028
表示加噪声之后的一个轨迹距离;
Figure BDA0001591101600000029
表示,在θρ分布的条件下,
Figure BDA00015911016000000210
属于
Figure BDA00015911016000000211
集合的概率;
Figure BDA00015911016000000212
表示运用S机制查询
Figure BDA00015911016000000213
所得到的结果,
Figure BDA00015911016000000214
表示加噪声之后的另一个轨迹距离;
Figure BDA00015911016000000215
Figure BDA00015911016000000216
有且仅有一个时间点上的位置距离不同;θρ是所有可能的位置相关性的分布;位置相关性
Figure BDA00015911016000000217
表示第i个时间点上经度x的相关系数,
Figure BDA00015911016000000218
表示第i个时间点上纬度y的相关系数;
Figure BDA00015911016000000219
为第m个时间点上经度x的隐私保护预算,
Figure BDA00015911016000000220
第m个时间点上纬度y的隐私保护预算,
Figure BDA00015911016000000221
为第i个时间点上经度的隐私保护预算,
Figure BDA00015911016000000222
第i个时间点上纬度的隐私保护预算;
Figure BDA00015911016000000223
步骤三:当应用场景不需要利用用户位置间相关关系的时候,根据位置有用性,来净化处理两个用户的轨迹,以实现轨迹间相关性;位置有用性是通过绝对距离偏差来衡量数据有用性的方法,通过计算经度和纬度上噪声的期望之和的平均值,表达式为:
Figure BDA0001591101600000031
其中,
Figure BDA0001591101600000032
Figure BDA0001591101600000033
分别为第i个时间点上用户的经度x和纬度y所添加的噪声,ud表示位置有用性,d表示位置有用性的下标;E()表示
Figure BDA0001591101600000034
Figure BDA0001591101600000035
绝对值的期望的运算符;
面向位置有用性时,两个用户的隐私保护处理步骤如下:
一、输入原始数据:输入用户a和用户b的原始轨迹集合
Figure BDA0001591101600000036
以及给定的位置有用性ud=ud,其中,ud的取值由用户依据需求来设定;ud值越大越数据有用性越低,越小越数据有用性越高;
二、计算原始轨迹距离:将用户a和用户b用户轨迹中每个时间点上经度和纬度依次相减,得到的集合为原始轨迹距离,标记为
Figure BDA0001591101600000037
其中,
Figure BDA0001591101600000038
Figure BDA0001591101600000039
分别为两用户的经度上位置距离和纬度上位置距离,i为一天中第i个时间点,x为经度,y为纬度,
Figure BDA00015911016000000310
Figure BDA00015911016000000311
分别为用户a和b在第i个时间点上的经度,
Figure BDA00015911016000000312
Figure BDA00015911016000000313
分别为用户a和b在第i个时间点上的纬度;
三、计算用户a和用户b的轨迹相关性分数S:轨迹相关性分数S是一种运用轨迹距离来测量同一天两条轨迹间相关性的测量方法,该方法为一个关于轨迹距离的指数函数,其表达式为:
S=S(x)S(y),
Figure BDA00015911016000000314
Figure BDA0001591101600000041
其中,R表示决定相关性范围的参数,由用户根据需求设定;
四、计算面向位置有用性情况下的拉格朗日乘数因子λd:首先,构建拉格朗日约束条件,其表达式为:
Figure BDA0001591101600000042
从而可得,与归一化轨迹距离和拉格朗日乘数因子相关的归一化拉普拉斯分布尺度参数的函数,标记为
Figure BDA0001591101600000043
然后,通过牛顿拉弗森方法来求解
Figure BDA0001591101600000044
计算得拉格朗日乘数因子λd。其中,
Figure BDA0001591101600000045
为归一化的第i个时间点上拉普拉斯分布尺度参数,
Figure BDA0001591101600000046
表示面向位置有用性情况下第i个时间点上的拉普拉斯分布尺度参数;
五、计算归一化的拉普拉斯分布尺度参数的集合
Figure BDA0001591101600000047
运用拉格朗日乘数法,求解满足拉格朗日约束条件;
Figure BDA0001591101600000048
的所有的
Figure BDA0001591101600000049
即得由
Figure BDA00015911016000000410
组成的集合
Figure BDA00015911016000000411
六、净化处理原始轨迹:将服从拉普拉斯分布的噪声添加到原始轨迹上,以实现轨迹间相关性隐私保护,其操作如下所示:
Figure BDA00015911016000000412
Figure BDA00015911016000000413
Figure BDA00015911016000000414
表示净化处理后用户a的轨迹,
Figure BDA00015911016000000415
表示净化处理后用户b的轨迹;
步骤四:当应用场景需要利用用户位置间相关关系的时候,根据位置相关性有用性来净化处理两个用户的轨迹,以实现轨迹间相关性隐私保护;位置相关性有用性是运用两用户间经度和纬度的相关系数来衡量数据有用性的方法,其表达式为:
Figure BDA0001591101600000051
其中,
Figure BDA0001591101600000052
Figure BDA0001591101600000053
分别为在第i个时间点上加入噪声前后经度的相关系数,
Figure BDA0001591101600000054
Figure BDA0001591101600000055
分别为在第i个时间点上加入噪声前后纬度的相关系数,uc表示位置有用性,c表示位置相关性有用性的下标;
面向位置相关性有用性时,两个用户的隐私保护处理步骤如下:
一、输入原始数据:输入两个用户的原始轨迹集合
Figure BDA0001591101600000056
以及位置相关性有用性uc=uc;c表示位置相关性有用性的下标;0≤uc≤1,由客户根据需要进行选取;uc值越大越数据有用性越低,越小越数据有用性越高。
二、计算相关系数集合:获取用户a和用户b原始轨迹中每个时间点上经度的相关系数集合ρx和每个时间点上纬度的相关系数集合ρy
三、计算原始轨迹距离:将用户a和用户b用户轨迹中每个时间点上经度和纬度依次相减,得到的集合为原始轨迹距离,标记为
Figure BDA0001591101600000057
其中,
Figure BDA0001591101600000058
Figure BDA0001591101600000059
分别为两用户的经度上位置距离和纬度上位置距离,i为一天中第i个时间点,x为经度,y为纬度,
Figure BDA00015911016000000510
Figure BDA00015911016000000511
分别为用户a和b在第i个时间点上的经度,
Figure BDA00015911016000000512
Figure BDA00015911016000000513
分别为用户a和b在第i个时间点上的纬度;
四、计算用户a和用户b的轨迹相关性分数S:轨迹相关性分数S是一种运用轨迹距离来测量同一天两条轨迹间相关性的测量方法,该方法为一个关于轨迹距离的指数函数,其表达式为:
S=S(x)S(y),
Figure BDA00015911016000000514
Figure BDA0001591101600000061
其中,R表示决定相关性范围的参数,由用户根据需求设定,一般的,
Figure BDA0001591101600000062
表示所有天数中第i个时间点上经度上的位置距离的标准差,
Figure BDA0001591101600000063
表示所有天数中第i个时间点上纬度上的位置距离的标准差;
五、计算面向位置相关性有用性情况下的拉格朗日乘数因子λc:首先,构建拉格朗日约束条件,其表达式为:
Figure BDA0001591101600000064
从而可得,与归一化位置相关性和拉格朗日乘数因子相关的归一化拉普拉斯分布尺度参数的函数。然后,通过牛顿拉弗森方法来求解
Figure BDA0001591101600000065
计算得拉格朗日乘数因子λc。其中,
Figure BDA0001591101600000066
为归一化的第i个时间点上拉普拉斯分布尺度参数,
Figure BDA0001591101600000067
表示面向位置相关性有用性情况下第i个时间点上的拉普拉斯分布尺度参数;
六、计算归一化的拉普拉斯分布尺度参数的集合
Figure BDA0001591101600000068
运用拉格朗日乘数法,求解满足拉格朗日约束条件
Figure BDA0001591101600000069
的所有的
Figure BDA00015911016000000610
即得由
Figure BDA00015911016000000611
组成的集合
Figure BDA00015911016000000612
七、净化处理原始轨迹:将服从拉普拉斯分布的噪声添加到原始轨迹上,以实现轨迹间相关性隐私保护,其操作如下所示:
Figure BDA00015911016000000613
Figure BDA00015911016000000614
Figure BDA00015911016000000615
表示净化处理后用户a的轨迹,
Figure BDA00015911016000000616
表示净化处理后用户b的轨迹;
进一步的改进,需要利用用户位置间相关关系的应用场景包括广告推荐应用场景。
进一步的改进,所述步骤三中,ud的取值为位置标准差的平均值的三倍,即
Figure BDA0001591101600000071
进一步的改进,所述步骤三中,
Figure BDA0001591101600000072
表示所有天数中第i个时间点上经度上位置距离的标准差,
Figure BDA0001591101600000073
表示所有天数中第i个时间点上纬度上位置距离的标准差。
本发明的优点如下:
1.通过运用服从拉普拉斯分布的扰动机制,可有效解决轨迹间相关性带来的用户社交关系泄露问题。
2.通过采用拉格朗日优化方法,在给定的数据有用性情况下,可提供更大力度的隐私保护。
附图说明
图1为本发明面向位置有用性的隐私保护方法(UD-LMDP)的隐私预算方法与现有Group-DP和MQM方法在隐私保护力度上的比较图;
图2为本发明面向位置相关性的隐私保护方法(UC-LMDP)的隐私预算方法与现有的Group-DP和MQM方法在隐私保护力度上的比较图;
图3为本发明的方法与Group-DP和MQM方法的位置有用性评估比较图;
图4为本发明的方法与Group-DP和MQM方法的位置相关性有用性评估评估比较图。
具体实施方式
下面将结合附图和实施例对本发明做进一步的说明。
实施例1
本发明计算方法公式推导原理分别如下所示
1.用户每天移动轨迹是以时间先后顺序排列的n位置数据序列。因此,轨迹的隐私保护需要对n个位置进行隐私保护,是一个n体隐私保护问题。在说明n体拉普拉斯框架之前,我们先介绍邻居对的最大不同值以及轨迹相关性的敏感度。
1)我们将用户的轨迹以天为单位,划分为多条子轨迹,称为“每天的轨迹”
一条关于用户u的轨迹表示用户u在具有n个采样时间点的一天中所移动的位置序列,标记为
Figure BDA0001591101600000081
其定义为:
Figure BDA0001591101600000082
Figure BDA0001591101600000083
分别为用户u在一天中第i个时间点上的经度和纬度;然后,我们将对每天的轨迹依次进行处理,实现轨迹间相关性的隐私保护
2)用户a和用户b点之间的轨迹距离指两用户间位置经纬度间距离的集合,标记为
Figure BDA0001591101600000084
Figure BDA0001591101600000085
其中,
Figure BDA0001591101600000086
i表示一天内的第i个时间点,x表示用户在经度上位置,y表示用户纬度上位置,a表示一个用户,b表示另外一个用户,
Figure BDA0001591101600000087
表示在第i个时间点用户a和用户b之间在经度上的距离,
Figure BDA0001591101600000088
表示第i个时间点上用户a在经度上位置,
Figure BDA0001591101600000089
表示在第i个时间点上用户b在经度上位置,
Figure BDA00015911016000000810
表示在第i个时间点用户a和用户b在纬度上距离,
Figure BDA00015911016000000811
表示在第i个时间点用户a在纬度上位置,
Figure BDA00015911016000000812
表示在第i个时间点用户b在纬度上位置;
3)确定轨迹相关性分数S:
S=S(x)S(y),
Figure BDA0001591101600000091
Figure BDA0001591101600000092
其中,R表示决定相关性范围的参数,由用户根据需求设定;n表示表示每天的轨迹上时间点的个数;
4)对于用户移动的所有天数中第i个时间点上,所有经度上位置距离的集合标记为
Figure BDA0001591101600000093
所有纬度上位置距离的集合标记为
Figure BDA0001591101600000094
那么在i时间点上经度和纬度上最大位置距离分别存在以下关系:
Figure BDA0001591101600000095
其中,
Figure BDA0001591101600000096
表示
Figure BDA0001591101600000097
的概率,
Figure BDA0001591101600000098
表示
Figure BDA0001591101600000099
的概率。其中,
Figure BDA00015911016000000910
表示在第i个时间点用户在经度上位置的最大距离,
Figure BDA00015911016000000911
表示在第i个时间点用户在纬度上位置的最大距离,
Figure BDA00015911016000000912
表示用户移动轨迹的所有天数中第i个时间点上经度的位置距离的标准差;
Figure BDA00015911016000000913
表示用户移动轨迹的所有天数中第i个时间点上纬度的位置距离的标准差;
Figure BDA00015911016000000914
表示所有时间点上经度上的位置距离的最大标准差的三倍,
Figure BDA00015911016000000915
表示表示所有时间点上纬度上的位置距离的最大标准差的三倍;
因此近似可得:
Figure BDA0001591101600000101
5)n体拉普拉斯分布:当轨迹距离
Figure BDA0001591101600000102
添加了噪声以后,噪声分布如下所示:
Figure BDA0001591101600000103
其中,
Figure BDA0001591101600000104
是添加在经度和纬度上噪声的数据集,
Figure BDA0001591101600000105
表示在第i个时间点添加到经度上的噪声,
Figure BDA0001591101600000106
表示第i个时间点添加到纬度上的噪声;
Figure BDA0001591101600000107
是一天中每个时间点上拉普拉斯分布尺度参数的集合,其中
Figure BDA0001591101600000108
Figure BDA0001591101600000109
分别为在第i个时间点上经度和纬度的拉普拉斯分布尺度参数,
Figure BDA00015911016000001010
Figure BDA00015911016000001011
由在第i个时间点上的敏感度ΔSi=1以及经度和纬度上隐私预算
Figure BDA00015911016000001012
Figure BDA00015911016000001013
决定,即:
Figure BDA00015911016000001014
通常人们采用隐私预算来评估隐私保护的力度。隐私预算越小,则说明隐私保护力度越大。
6)n体拉普拉斯框架通过服从拉普拉斯分布的噪声来净化处理后的轨迹距离
Figure BDA00015911016000001015
如下:
Figure BDA00015911016000001016
轨迹相关性分数的概率最大比率发生在最大化不同的邻居轨迹距离对
Figure BDA00015911016000001017
的轨迹相关性分数S(|(di)′|~∞)~0的时候,其中(di)′为第i个时间点上添加噪声后经度或纬度的位置距离;
2个节点的轨迹间轨迹相关性分数的概率如下所示:
Figure BDA0001591101600000111
P2(S)表示具有两个时间点的轨迹相关性分数的概率;(Si)′表示添加噪声之后第i个时间点上的轨迹相关性分数,
Figure BDA0001591101600000112
表示第1个时间点上归一化的拉普拉斯分布尺度参数,
Figure BDA0001591101600000113
表示第2个时间点上归一化的拉普拉斯分布尺度参数,
Figure BDA0001591101600000114
Figure BDA0001591101600000115
Figure BDA0001591101600000116
Figure BDA0001591101600000117
对于面向位置有用性的轨迹间相关性隐私保护方法;
n个节点的轨迹间轨迹相关性分数趋近于零的时候的概率P(~0)是拉普拉斯的形式,表达式为:
Figure BDA0001591101600000118
其中,
Figure BDA0001591101600000121
n体拉普拉斯框架满足以下不等式:
Figure BDA0001591101600000122
其中,
Figure BDA0001591101600000123
θp是所有可能的位置相关性的分布;以及位置相关性
Figure BDA0001591101600000124
为第m个时间点上经度的隐私保护预算,
Figure BDA0001591101600000125
第m个时间点上纬度的隐私保护预算,
Figure BDA0001591101600000126
为第i个时间点上经度的隐私保护预算,
Figure BDA0001591101600000127
第i个时间点上纬度的隐私保护预算;
Figure BDA0001591101600000128
2.面向位置有用性的轨迹间相关性隐私保护方法:
位置有用性是通过绝对距离偏差来衡量数据有用性的方法,定义为
Figure BDA0001591101600000129
其中ud表示位置有用性,d表示位置有用性的下标,
Figure BDA00015911016000001210
Figure BDA00015911016000001211
分别为第i个时间点上经度和纬度所添加的噪声,
Figure BDA00015911016000001212
表示
Figure BDA00015911016000001213
绝对值的期望,
Figure BDA00015911016000001214
表示
Figure BDA00015911016000001215
绝对值的期望;
根据位置有用性,提出满足n体拉普拉斯框架的轨迹间相关性的隐私保护方法:
优化拉普拉斯分布尺度参数,达到改善轨迹间相关性隐私保护的目的:
Figure BDA0001591101600000131
Figure BDA0001591101600000136
表示面向位置有用性的情况下,所有时间点上拉普拉斯分布尺度参数的集合,ud表示用户给定的位置有用性,
通过拉格朗日乘数法,λd的解如下所示:
Figure BDA0001591101600000132
其中,
Figure BDA0001591101600000133
表示在第i个时间上归一化的拉普拉斯分布尺度参数,
Figure BDA0001591101600000134
表示第i个时间点上归一化的位置距离,λd表示面向位置有用性情况下的拉格朗日乘数因子;
在不考虑位置间相关性的应用场景中,我们将采用以下来对轨迹T进行隐私保护处理,得到净化后的轨迹T′,并发布:
Figure BDA0001591101600000135
3.面向位置相关性有用性的轨迹间相关性隐私保护
两个用户a和b之间在第i个时间点上经度和纬度的相关系数分别为:
Figure BDA0001591101600000141
其中,
Figure BDA0001591101600000142
Figure BDA0001591101600000143
分别为两用户a和b在第i个时间点上经度x和纬度y的协方差;Var{}表示很多天的轨迹在同一时间点上在经度x或纬度y的的方差。
位置相关性有用性是运用两用户间经度和纬度的相关系数来衡量数据有用性的方法,其定义为:
Figure BDA0001591101600000144
其中,
Figure BDA0001591101600000145
Figure BDA0001591101600000146
分别为在第i个时间点上加入噪声前后经度的相关系数,
Figure BDA0001591101600000147
Figure BDA0001591101600000148
分别为在第i个时间点上加入噪声前后纬度的相关系数;
同样的,根据位置相关性有用性,我们提出另一个满足n体拉普拉斯框架的轨迹间相关性隐私保护方法,称为“UC-LMDP”。为优化隐私保护,我们在给定有用性uc的情况下,采用拉格朗日优化方法,优化拉普拉斯分布尺度参数,其过程如下:
Figure BDA0001591101600000149
通过拉格朗日乘数法,可得拉格朗日乘数因子λc满足以下等式:
Figure BDA00015911016000001410
其中,
Figure BDA0001591101600000151
为归一化的第i个时间点上拉普拉斯分布尺度参数,即,
Figure BDA0001591101600000152
由此可见,拉普拉斯分布尺度参数的集合
Figure BDA0001591101600000153
是一个关于归一化的位置距离
Figure BDA0001591101600000154
以及拉格朗日乘数因子λc的函数。
此外,拉普拉斯分布尺度参数的集合
Figure BDA0001591101600000158
与给定的位置相关性有用性uc之间的关系式如下所示:
Figure BDA0001591101600000155
改变位置相关性
Figure BDA0001591101600000156
不会影响每个用户的概率分布.
在广告推荐等应用场景中,我们将采用以下算法来实现具有隐私保护的轨迹发布
Figure BDA0001591101600000157
相较于现有的方法,面向位置有用性的隐私保护方法(UD-LMDP)的隐私预算均小于Group-DP和MQM,因此,我们方法的隐私保护力度要强于现有的方法。实验结果如图1所示,其中,空心三角形表示我们的方法,空心五角星表示Group-DP,空心圆形表示MQM。相较于现有的方法,面向位置相关性的隐私保护方法(UC-LMDP)的隐私预算均小于Group-DP和MQM,因此,我们方法的隐私保护力度要强于现有的方法。实验结果如图2所示,其中,空心三角形表示我们的方法,空心五角星表示Group-DP,空心圆形表示MQM。
根据之前定义的两个数据有用性:位置有用性Yd和位置相关性有用性Yc,我们分别针对这两方面的数据有用性,进行了相关的评估。
根据位置有用性定义,位置有用性越小,其数据有用性越大。如图3所示,我们的方法UD-LMDP的Yd的值均小于现有的方法,因此我们方法的数据有用性均优于现有的方法。根据位置相关性有用性定义,位置相关性有用性越小,其数据有用性越大。如图4所示,我们的方法UD-LMDP的Yc的值均小于现有的方法,因此我们方法的数据有用性均优于现有的方法。
以上实例的说明只是用于帮助理解本发明的核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (4)

1.一种基于拉格朗日优化的轨迹间相关性隐私保护方法,其特征在于,包括如下步骤:
步骤一:将用户的原始轨迹以天为单位,划分为多条子轨迹,称为“每天的轨迹”,“每天的轨迹”具有n个采样时间点;
步骤二:针对每天的轨迹,运用n体拉普拉斯框架,通过生成服从拉普拉斯分布的噪声集合,并将集合中噪声依据时间顺序分别添加到原始轨迹上,从而实现轨迹间相关性隐私保护;并且n体拉普拉斯框架满足以下式子:
Figure FDA0003147721360000011
其中,
Figure FDA0003147721360000012
Figure FDA0003147721360000013
表示在θρ分布的条件下,
Figure FDA0003147721360000014
属于
Figure FDA0003147721360000015
集合的概率;
Figure FDA0003147721360000016
表示运用S机制查询
Figure FDA0003147721360000017
所得到的结果,
Figure FDA0003147721360000018
表示加噪声之后的一个轨迹距离;
Figure FDA0003147721360000019
表示,在θρ分布的条件下,
Figure FDA00031477213600000110
属于
Figure FDA00031477213600000111
集合的概率;
Figure FDA00031477213600000112
表示运用S机制查询
Figure FDA00031477213600000113
所得到的结果,
Figure FDA00031477213600000114
表示加噪声之后的另一个轨迹距离;
Figure FDA00031477213600000115
Figure FDA00031477213600000116
有且仅有一个时间点上的位置距离不同;θρ是所有可能的位置相关性的分布;位置相关性
Figure FDA00031477213600000117
Figure FDA00031477213600000118
表示第i个时间点上经度x的相关系数,
Figure FDA00031477213600000119
表示第i个时间点上纬度y的相关系数;
Figure FDA00031477213600000120
为第m个时间点上经度x的隐私保护预算,
Figure FDA00031477213600000121
为第m个时间点上纬度y的隐私保护预算,
Figure FDA00031477213600000122
为第i个时间点上经度x的隐私保护预算,
Figure FDA00031477213600000123
为第i个时间点上纬度y的隐私保护预算;
步骤三:当应用场景不需要利用用户位置间相关关系的时候,根据位置有用性,来净化处理两个用户的轨迹,以实现轨迹间相关性;位置有用性是通过绝对距离偏差来衡量数据有用性的方法,通过计算经度x和纬度y上噪声的期望之和的平均值,表达式为:
Figure FDA0003147721360000021
其中,
Figure FDA0003147721360000022
Figure FDA0003147721360000023
分别为第i个时间点上用户的经度x和纬度y所添加的噪声,ud表示位置有用性,d表示位置有用性的下标;E()表示
Figure FDA0003147721360000024
Figure FDA0003147721360000025
绝对值的期望的运算符;
面向位置有用性时,两个用户的隐私保护处理步骤如下:
一、输入原始数据:输入用户a和用户b的原始轨迹集合
Figure FDA0003147721360000026
以及给定的位置有用性
Figure FDA0003147721360000027
其中,ud的取值由用户依据需求来设定;
二、计算原始轨迹距离:将用户a和用户b轨迹中每个时间点上经度x和纬度y依次相减,得到的集合为原始轨迹距离,标记为
Figure FDA0003147721360000028
其中,
Figure FDA0003147721360000029
Figure FDA00031477213600000210
分别为两用户的经度x上位置距离和纬度y上位置距离,i为一天中第i个时间点,
Figure FDA00031477213600000211
Figure FDA00031477213600000212
分别为用户a和b在第i个时间点上的经度,
Figure FDA00031477213600000213
Figure FDA00031477213600000214
分别为用户a和b在第i个时间点上的纬度;
三、计算用户a和用户b的轨迹相关性分数S:轨迹相关性分数S是一种运用轨迹距离来测量同一天两条轨迹间相关性的测量方法,该方法为一个关于轨迹距离的指数函数,其表达式为:S=S(x)S(y),
Figure FDA0003147721360000031
Figure FDA0003147721360000032
其中,R表示决定相关性范围的参数;
四、计算面向位置有用性情况下的拉格朗日乘数因子λd:首先,构建拉格朗日约束条件,其表达式为:
Figure FDA0003147721360000033
从而可得,与归一化轨迹距离和拉格朗日乘数因子相关的归一化拉普拉斯分布尺度参数的函数,标记为
Figure FDA0003147721360000034
Figure FDA0003147721360000035
表示第i个时间点上归一化的位置距离,然后,通过牛顿拉弗森方法来求解
Figure FDA0003147721360000036
计算得拉格朗日乘数因子λd;其中,
Figure FDA0003147721360000037
为归一化的第i个时间点上拉普拉斯分布尺度参数,
Figure FDA0003147721360000038
Figure FDA0003147721360000039
表示面向位置有用性情况下第i个时间点上的拉普拉斯分布尺度参数;
五、计算归一化的拉普拉斯分布尺度参数的集合
Figure FDA00031477213600000310
运用拉格朗日乘数法,求解满足拉格朗日约束条件:
Figure FDA00031477213600000311
的所有的
Figure FDA00031477213600000312
即得,由
Figure FDA00031477213600000313
组成的集合
Figure FDA00031477213600000314
六、净化处理原始轨迹:将服从拉普拉斯分布的噪声添加到原始轨迹上,以实现轨迹间相关性隐私保护,其操作如下所示:
Figure FDA00031477213600000315
δ是添加在经度和纬度上噪声的数据集;
Figure FDA0003147721360000041
Figure FDA0003147721360000042
表示净化处理后用户a的轨迹,
Figure FDA0003147721360000043
表示净化处理后用户b的轨迹;
步骤四:当应用场景需要利用用户位置间相关关系的时候,根据位置相关性有用性来净化处理两个用户的轨迹,以实现轨迹间相关性隐私保护;位置相关性有用性是运用两用户间经度和纬度的相关系数来衡量数据有用性的方法,其表达式为:
Figure FDA0003147721360000044
其中,
Figure FDA0003147721360000045
Figure FDA0003147721360000046
分别为在第i个时间点上加入噪声前后的经度的相关系数,
Figure FDA0003147721360000047
Figure FDA0003147721360000048
分别为在第i个时间点上加入噪声前后的纬度的相关系数,
Figure FDA0003147721360000049
表示位置相关性有用性,c表示位置相关性有用性的下标;
面向位置相关性有用性时,两个用户的隐私保护处理步骤如下:
一、输入原始数据:输入两个用户的原始轨迹集合
Figure FDA00031477213600000410
以及位置相关性有用性
Figure FDA00031477213600000411
c表示位置相关性有用性的下标;0≤uc≤1;
二、计算相关系数集合:获取用户a和用户b原始轨迹中每个时间点上经度相关系数集合ρx和每个时间点上纬度相关系数集合ρy
三、计算原始轨迹距离:将用户a和用户b用户轨迹中每个时间点上经度和纬度依次相减,得到的集合为原始轨迹距离,标记为
Figure FDA00031477213600000412
其中,
Figure FDA00031477213600000413
Figure FDA00031477213600000414
分别为两用户的经度上位置距离和纬度上位置距离,i为一天中第i个时间点,x为经度,y为纬度,
Figure FDA00031477213600000415
Figure FDA00031477213600000416
分别为用户a和b在第i个时间点上的经度,
Figure FDA00031477213600000417
Figure FDA00031477213600000418
分别为用户a和b在第i个时间点上的纬度;
四、计算用户a和用户b的轨迹相关性分数S:轨迹相关性分数S是一种运用轨迹距离来测量同一天两条轨迹间相关性的测量方法,该方法为一个关于轨迹距离的指数函数,其表达式为:
S=S(x)S(y),
Figure FDA0003147721360000051
Figure FDA0003147721360000052
其中,R表示决定相关性范围的参数;
Figure FDA0003147721360000053
五、计算面向位置相关性有用性情况下拉格朗日乘数因子λc:首先,构建拉格朗日约束条件,其表达式为:
Figure FDA0003147721360000054
从而可得,与归一化位置相关性和拉格朗日乘数因子相关的归一化拉普拉斯分布尺度参数的函数;然后,通过牛顿拉弗森方法来求解
Figure FDA0003147721360000055
ρi表示第i个时间点上两用户间相关系数;计算得拉格朗日乘数因子λc;其中,
Figure FDA0003147721360000056
为归一化的第i个时间点上拉普拉斯分布尺度参数,
Figure FDA0003147721360000057
Figure FDA0003147721360000058
表示面向位置相关性有用性情况下第i个时间点上的拉普拉斯分布尺度参数;
六、计算归一化的拉普拉斯分布尺度参数的集合
Figure FDA0003147721360000059
运用拉格朗日乘数法,求解满足拉格朗日约束条件
Figure FDA00031477213600000510
的所有的
Figure FDA00031477213600000511
即得由
Figure FDA00031477213600000512
组成的集合
Figure FDA00031477213600000513
七、净化处理原始轨迹:将服从拉普拉斯分布的噪声添加到原始轨迹上,以实现轨迹间相关性隐私保护,其操作如下所示:
Figure FDA0003147721360000061
Figure FDA0003147721360000062
Figure FDA0003147721360000063
表示净化处理后用户a的轨迹,
Figure FDA0003147721360000064
表示净化处理后用户b的轨迹。
2.如权利要求1所述的基于拉格朗日优化的轨迹间相关性隐私保护方法,其特征在于,需要利用用户位置间相关关系的应用场景包括广告推荐应用场景。
3.如权利要求1所述的基于拉格朗日优化的轨迹间相关性隐私保护方法,其特征在于,所述步骤三中,ud的取值为所有天数中位置标准差的平均值的三倍,即
Figure FDA0003147721360000065
4.如权利要求1所述的基于拉格朗日优化的轨迹间相关性隐私保护方法,其特征在于,所述步骤三中,
Figure FDA0003147721360000066
Figure FDA0003147721360000068
表示所有天数中第i个时间点上经度上的位置距离的标准差,
Figure FDA0003147721360000067
表示所有天数中第i个时间点上纬度上的位置距离的标准差。
CN201810188835.2A 2018-03-08 2018-03-08 基于拉格朗日优化的轨迹间相关性隐私保护方法 Active CN108491730B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810188835.2A CN108491730B (zh) 2018-03-08 2018-03-08 基于拉格朗日优化的轨迹间相关性隐私保护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810188835.2A CN108491730B (zh) 2018-03-08 2018-03-08 基于拉格朗日优化的轨迹间相关性隐私保护方法

Publications (2)

Publication Number Publication Date
CN108491730A CN108491730A (zh) 2018-09-04
CN108491730B true CN108491730B (zh) 2021-11-19

Family

ID=63338109

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810188835.2A Active CN108491730B (zh) 2018-03-08 2018-03-08 基于拉格朗日优化的轨迹间相关性隐私保护方法

Country Status (1)

Country Link
CN (1) CN108491730B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111079177B (zh) * 2019-12-04 2023-01-13 湖南大学 一种基于小波变换的轨迹数据中时间相关性隐私保护方法
CN112861171B (zh) * 2021-01-20 2024-04-09 华中科技大学 基于粒子群优化算法的轨迹间相关性隐私保护方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914659A (zh) * 2014-03-12 2014-07-09 西安电子科技大学 基于频率的轨迹抑制数据发布隐私保护的系统及其方法
CN105760780A (zh) * 2016-02-29 2016-07-13 福建师范大学 基于路网的轨迹数据隐私保护方法
CN106295395A (zh) * 2016-07-27 2017-01-04 福建师范大学 基于图划分的不确定轨迹隐私保护方法
CN106407841A (zh) * 2016-09-28 2017-02-15 武汉大学 基于差分隐私的相关性时间序列发布方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914659A (zh) * 2014-03-12 2014-07-09 西安电子科技大学 基于频率的轨迹抑制数据发布隐私保护的系统及其方法
CN105760780A (zh) * 2016-02-29 2016-07-13 福建师范大学 基于路网的轨迹数据隐私保护方法
CN106295395A (zh) * 2016-07-27 2017-01-04 福建师范大学 基于图划分的不确定轨迹隐私保护方法
CN106407841A (zh) * 2016-09-28 2017-02-15 武汉大学 基于差分隐私的相关性时间序列发布方法及系统

Also Published As

Publication number Publication date
CN108491730A (zh) 2018-09-04

Similar Documents

Publication Publication Date Title
Gansemer et al. Rssi-based euclidean distance algorithm for indoor positioning adapted for the use in dynamically changing wlan environments and multi-level buildings
Zhao et al. Applying kriging interpolation for WiFi fingerprinting based indoor positioning systems
Wang et al. A bias-reduced nonlinear WLS method for TDOA/FDOA-based source localization
CN108536851B (zh) 一种基于移动轨迹相似度比较的用户身份识别方法
CN108427891A (zh) 基于差分隐私保护的邻域推荐方法
Kim et al. An efficient TDOA-based localization algorithm without synchronization between base stations
Song et al. A privacy-preserving continuous location monitoring system for location-based services
CN108491730B (zh) 基于拉格朗日优化的轨迹间相关性隐私保护方法
CN111680228B (zh) 基于地理位置融合和类别流行度的兴趣点推荐方法
Zheng et al. Incorporating Context Correlation into Context-aware Matrix Factorization.
Jiang et al. Composite quantile regression for massive datasets
Wang et al. A 3D fingerprinting positioning method based on cellular networks
CN111797319B (zh) 推荐方法、装置、设备及存储介质
Hua et al. NLOS identification and positioning algorithm based on localization residual in wireless sensor networks
CN106056577B (zh) 基于mds-srm混合级联的sar图像变化检测方法
CN111400747B (zh) 一种基于轨迹隐私保护的度量方法
Wang et al. Fingerprint-based Wi-Fi indoor localization using map and inertial sensors
Zhang et al. Particle swarm optimization–based minimum residual algorithm for mobile robot localization in indoor environment
Zhang et al. Analytical evaluation of geometric dilution of precision for three-dimensional angle-of-arrival target localization in wireless sensor networks
CN111263295B (zh) 一种wlan室内定位方法和装置
US11012812B2 (en) System and method for identifying associated subjects from location histories
Zhou et al. Modified Jaccard index analysis and adaptive feature selection for location fingerprinting with limited computational complexity
Kim et al. Bayesian filtering for keyframe-based visual SLAM
US10791418B2 (en) Method and system for modeling user and location
CN108763515B (zh) 一种基于概率矩阵分解的时间敏感个性化推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant