CN111079177A - 一种基于小波变换的轨迹数据中时间相关性隐私保护方法 - Google Patents

一种基于小波变换的轨迹数据中时间相关性隐私保护方法 Download PDF

Info

Publication number
CN111079177A
CN111079177A CN201911224969.6A CN201911224969A CN111079177A CN 111079177 A CN111079177 A CN 111079177A CN 201911224969 A CN201911224969 A CN 201911224969A CN 111079177 A CN111079177 A CN 111079177A
Authority
CN
China
Prior art keywords
data
noise
track
time
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911224969.6A
Other languages
English (en)
Other versions
CN111079177B (zh
Inventor
翟亚静
秦拯
欧露
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN201911224969.6A priority Critical patent/CN111079177B/zh
Publication of CN111079177A publication Critical patent/CN111079177A/zh
Application granted granted Critical
Publication of CN111079177B publication Critical patent/CN111079177B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/148Wavelet transforms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2151Time stamp

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Bioethics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Algebra (AREA)
  • Computer Security & Cryptography (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种基于小波变换的轨迹数据中时间相关性隐私保护方法,主要包括:量化轨迹数据中时间相关性,并且扰动原始数据从而达到隐私保护效果以及在确保隐私保护的同时提高数据有用性。

Description

一种基于小波变换的轨迹数据中时间相关性隐私保护方法
技术领域
本发明涉及数据隐私保护领域,一种基于小波变换的轨迹数据中时间相关性隐私保护方法。
背景技术
随着计算机视觉、通讯、大数据产业的成熟,促进了智慧城市、智能交通等领域的迅速发展,人们的衣食住行等信息无时无刻不被数字化着。通过传感器、智能处理设备等终端收集和使用的这些相关视频、图片、位置等数据中包含了大量的时间相关的轨迹数据,攻击者如果获得这些时间相关轨迹数据,结合背景知识等方式推断出用户的兴趣点、行为习惯等敏感信息,比如用户经常出入的场所、身体状况等。因此,在将这些数据发布以前需要进行隐私保护处理,以防止用户个人隐私信息的泄露。
目前,针对用户时间相关轨迹数据发布的隐私泄漏问题,传统的隐私保护方法包括K-匿名、假轨迹、抑制等,K-匿名是通过将能够唯一识别用户的属性泛化,使得真实轨迹不能与其它轨迹进行区分,假轨迹是为每条真实轨迹产生一定的假轨迹来降低真实轨迹暴露的几率,轨迹抑制则是选择性的发布原始数据,其中可能会暴露用户隐私的轨迹信息不将其发布,以此来保护用户的真实轨迹。但是这些隐私保护的方法容易遭受背景知识攻击,或者在对用户数据进行隐私保护的过程中,没有考虑时间相关性的影响,只对除时间以外的轨迹序列数据处理,给用户的隐私保护问题带来了一定的挑战。
轨迹数据是一系列位置信息按照其发生的时间顺序连接而成的序列数据,本发明的目标是防止攻击者通过关于用户的先验知识分析时间相关性来从中挖掘用户的隐私,先量化轨迹数据中的时间相关性,并对数据做变换处理,然后在得到的数据系数上加入拉普拉斯噪声,最后通过迭代收敛优化噪声修正的数据有用性,以平衡隐私和数据效用之间的关系。
发明内容
本发明提出了一种基于小波变换的轨迹数据中时间相关性隐私保护方法来解决上述问题,主要包括三大内容:
步骤一:量化轨迹数据中时间相关性;
步骤二:扰动原始数据;
步骤三:优化数据有用性。
具体技术方法是:
步骤一:量化轨迹数据中时间相关性
首先,假设存在一个原始轨迹数据集包含某用户在D天中所产生的轨迹,那么用户在第d天的轨迹Tr如下所示:
Tr={(Jn,Wn)|n=0,1,2,...,N-1},
其中,Jn和Wn分别表示用户在第d天中第n个时间戳上的经度和纬度,d∈{1,2,.......,D}。
本发明将只考虑减去均值的轨迹:{(jn,wn)|n=0,1,2,...,N-1},其中
Figure BDA0002301939940000021
Figure BDA0002301939940000022
分别表示用户在D天里第n个时间戳上经度和纬度的平均值。此外,假设{jn|n=0,1,2,...,N-1}和{wn|n=0,1,2,...,N-1}在统计学上是独立的,可以单独使用,为了简单起见,以修改后的经度轨迹{jn|n=0,1,2,...,N-1}为例解释本发明所提出的隐私保护方法。
接下来,将量化轨迹数据时间相关性,以Corr表示长度为M的用户时间相关性,描述了用户在当前时间戳tn处和接下来第i个时间戳tn+i的两个位置的关系,用户的移动性模式可以由当前第n个位置下第n+i个位置的条件概率来描述,即Pr(jn+i|jn),用户有且只有一个Corr,并且当前位置的条件概率仅依赖于它的上一个位置,其定义如下:
Corr={Corri|i=0,1,...,M-1},
其中,Corri=Ed{jn+ijn}=∫jn+ijndPr(jn+i|jn)dPr(jn),tn和tn+i分别表示一天中第n个和第n+i个时间戳,E表示期望,d∈{1,2,.......,D}。
然后,采用离散小波变换方法对量化后的时间相关轨迹数据做处理,可采用如下式子:
Figure BDA0002301939940000031
其中,t表示时间,b,k∈Z,b表示不同尺度,k表示位移,
Figure BDA0002301939940000032
表示尺度函数,描述轨迹的粗略部分,ψb,k(t)表示小波函数,描述轨迹的详细部分,通过变换得到的小波系数为
Figure BDA0002301939940000035
和db[k]=<j(t),ψb,k(t)>,小波系数服从均值μk=0和标准方差σSk的高斯分布。
步骤二:扰动原始数据
由步骤一通过小波变换得到的轨迹数据系数cb[k]和db[k]上添加拉普拉斯噪声来对数据进行扰动:
c'b[k]=cb[k]+δcb[k],(k=0,1,...,K-1),
d'b[k]=db[k]+δdb[k],(k=0,1,...,K-1),
加入噪声后,具有噪声的位置变为:
Figure BDA0002301939940000033
Figure BDA0002301939940000034
其中,τcb[k]和τdb[k]表示噪声小波系数,c'b[k]和d'b[k]则为添加噪声后的小波系数,τjn表示添加小波系数噪声的位置,j'n则为添加噪声后的位置。添加噪声的位置应具有拉普拉斯分布,即,满足下式:
Figure BDA0002301939940000041
其中,j'n则为添加噪声后的位置表示,λj为拉普拉斯分布的尺度参数。
同样的,添加噪声的时间相关性也应满足拉普拉斯分布,即:
Figure BDA0002301939940000042
其中,Corr'表示噪声时间相关,
Figure BDA0002301939940000043
为相隔i个时间间隔的时间相关性均值,
Figure BDA0002301939940000044
为相应的时间相关性均值噪声引起的变化,
Figure BDA0002301939940000046
表示拉普拉斯分布的尺度参数。
面向时间相关轨迹数据发布,本发明采用以下算法来对轨迹数据做隐私保护处理,得到噪声修正的轨迹数据:
Figure BDA0002301939940000045
Figure BDA0002301939940000051
步骤三:优化数据的有用性
选取适当的初值j(0),j(0)∈R,不断迭代,计算得到的轨迹函数fTr(j)的极小值点jmin,如果第r次得到的迭代值为j(r),计算fTr(j(r))以及fTr(j(r))在j(r)处的梯度gTr=gTr(j(r)),当||gTr||<ε时,停止迭代,令jmin=j(r);否则,设置使函数值下降最快的方向为qr=-gTr(j(r)),使
Figure BDA0002301939940000052
求步长βr,其中,根据步骤二扰动原始数据中所得到的拉普拉斯分布的尺度参数
Figure BDA0002301939940000054
Figure BDA0002301939940000055
可以得到隐私预算ε。
然后,令j(r+1)=j(r)rqr,计算fTr(j(r+1))。当两次计算的值||fTr(j(r+1))-fTr(j(r))||<ε或||j(r+1)-j(r)||<ε时,停止迭代,jmin=j(r+1);否则,r赋值为r+1,继续计算梯度和重复上述后续步骤,从而为在给定的隐私预算的情况下实现更好的数据效用,数据效用采用轨迹的平均位置标准差效用和时间相关性效用进行评价。
面向轨迹数据有用性优化算法如下:
Figure BDA0002301939940000053
Figure BDA0002301939940000061
附图说明
图1为本发明技术路线图。
具体实施方式
本发明主要步骤如下:
步骤1:准备带有时间戳的用户轨迹数据,字段主要包括ID、经度、纬度以及时间。
步骤2:将轨迹时间相关性量化,计算所有D天的第n个时间戳的经度和纬度的平均值。
步骤3:得到第d天的修改后的轨迹{(jn,wn)|n=0,1,2,...,N-1},并以{jn|n=0,1,2,...,N-1}为例进行解释。
步骤4:对量化后的时间相关轨迹数据进行变换处理,可以得到相关的数据系数:
Figure BDA0002301939940000062
db[k]=<j(t),ψb,k(t)>。
步骤5:在所得数据系数上加入拉普拉斯噪声,得到噪声系数c'b[k]=cb[k]+τcb[k],(k=0,1,...,K-1),d'b[k]=db[k]+τdb[k],(k=0,1,...,K-1)。
步骤6:获得噪声位置j'n
步骤7:选取适当的初值j(0),j(0)∈R,对得到的轨迹函数fTr(j)计算梯度,不断迭代,直至收敛,优化数据有用性,从而平衡隐私和数据效用之间的关系。
步骤8:最终得到噪声修正的轨迹{(j'n,w'n)|n=0,1,2,...,N-1}。
步骤9:将具有隐私保护的数据
Figure BDA0002301939940000071
发送给第三方机构。

Claims (4)

1.本发明提出了一种基于小波变换的轨迹数据中时间相关性隐私保护方法,其特征在于,包括以下步骤:
步骤一:量化轨迹数据中时间相关性
首先,假设存在一个原始轨迹数据集包含某用户在D天中所产生的轨迹,那么用户在第d天的轨迹Tr如下所示:
Tr={(Jn,Wn)|n=0,1,2,...,N-1},
其中,Jn和Wn分别表示用户在第d天中第n个时间戳上的经度和纬度,d∈{1,2,.......,D}。
本发明将只考虑减去均值的轨迹:{(jn,wn)|n=0,1,2,...,N-1},其中
Figure FDA0002301939930000011
Figure FDA0002301939930000012
Figure FDA0002301939930000013
分别表示用户在D天里第n个时间戳上经度和纬度的平均值。此外,假设{jn|n=0,1,2,...,N-1}和{wn|n=0,1,2,...,N-1}在统计学上是独立的,可以单独使用,为了简单起见,以修改后的经度轨迹{jn|n=0,1,2,...,N-1}为例解释本发明所提出的隐私保护方法。
接下来,将量化轨迹数据时间相关性,以Corr表示长度为M的用户时间相关性,描述了用户在当前时间戳tn处和接下来第i个时间戳tn+i的两个位置的关系,用户的移动性模式可以由当前第n个位置下第n+i个位置的条件概率来描述,即Pr(jn+i|jn),用户有且只有一个Corr,并且当前位置的条件概率仅依赖于它的上一个位置,其定义如下:
Corr={Corri|i=0,1,...,M-1},
其中,Corri=Ed{jn+ijn}=∫jn+ijnd Pr(jn+i|jn)d Pr(jn),tn和tn+i分别表示一天中第n个和第n+i个时间戳,E表示期望,d∈{1,2,.......,D}。
然后,采用离散小波变换方法对量化后的时间相关轨迹数据做处理,可采用如下式子:
Figure FDA0002301939930000021
其中,t表示时间,b,k∈Z,b表示不同尺度,k表示位移,
Figure FDA0002301939930000022
表示尺度函数,描述轨迹的粗略部分,ψb,k(t)表示小波函数,描述轨迹的详细部分,通过变换得到的小波系数为
Figure FDA0002301939930000023
和db[k]=<j(t),ψb,k(t)>,小波系数服从均值μk=0和标准方差σSk的高斯分布。
步骤二:扰动原始数据
由步骤一通过小波变换得到的轨迹数据系数cb[k]和db[k]上添加拉普拉斯噪声来对数据进行扰动:
c'b[k]=cb[k]+τcb[k],(k=0,1,...,K-1),
d'b[k]=db[k]+τdb[k],(k=0,1,...,K-1),
加入噪声后,具有噪声的位置变为:
Figure FDA0002301939930000024
Figure FDA0002301939930000025
其中,τcb[k]和τdb[k]表示噪声小波系数,c'b[k]和d'b[k]则为添加噪声后的小波系数,τjn表示添加小波系数噪声的位置,j'n则为添加噪声后的位置。
添加噪声的位置应具有拉普拉斯分布,即,满足下式:
Figure FDA0002301939930000026
其中,j'n则为添加噪声后的位置表示,λj为拉普拉斯分布的尺度参数。
同样的,添加噪声的时间相关性也应满足拉普拉斯分布,即:
Figure FDA0002301939930000027
其中,Corr'表示噪声时间相关,
Figure FDA0002301939930000031
为相隔i个时间间隔的时间相关性均值,
Figure FDA0002301939930000032
为相应的时间相关性均值噪声引起的变化,
Figure FDA0002301939930000033
表示拉普拉斯分布的尺度参数。
步骤三:优化数据有用性
选取适当的初值j(0),j(0)∈R,不断迭代,计算得到的轨迹函数fTr(j)的极小值点jmin,如果第r次得到的迭代值为j(r),计算fTr(j(r))以及fTr(j(r))在j(r)处的梯度gTr=gTr(j(r)),当||gTr||<ε时,停止迭代,令jmin=j(r);否则,设置使函数值下降最快的方向为qr=-gTr(j(r)),使
Figure FDA0002301939930000034
求步长βr,其中,根据步骤二扰动原始数据所得到的拉普拉斯分布的尺度参数
Figure FDA0002301939930000035
Figure FDA0002301939930000036
可以得到隐私预算ε。
然后,令j(r+1)=j(r)rqr,计算fTr(j(r+1))。当两次计算的值||j(r+1)-j(r)||<ε或||fTr(j(r+1))-fTr(j(r))||<ε时,停止迭代过程,jmin=j(r+1);否则,r赋值为r+1,继续计算梯度和重复上述后续步骤,从而为在给定的隐私预算的情况下实现更好的数据效用,数据效用采用轨迹的平均位置标准差效用和时间相关性效用进行评价。
2.根据权利要求1所述的步骤一:量化轨迹数据中时间相关性,其特征在于:首先将轨迹数据时间相关性量化,并采用小波变换方法对产生的离散时序数据统一做变换处理,随着分解层数的增加,低频系数的数据量减少,高频系数的数据量增加,且大多集中在较少的系数上,为数据处理创造了有利条件。
3.根据权利要求1所述的步骤二:扰动原始数据,其特征在于:在经过量化处理变换之后的数据系数上加入拉普拉斯噪声,通过数据预处理改变了直接向原始轨迹数据中添加拉普拉斯噪声的过程,然后,得到一个噪声修正的轨迹。
4.根据权利要求1所述的步骤三:优化数据有用性,其特征是,针对轨迹数据加入噪声后导致数据可用性降低的问题,通过不断地迭代计算,利用梯度将数据收敛到当前最合适的值来实现数据有用性的优化,从而平衡隐私和数据效用之间的关系,在给定相同隐私预算的情况下得到更优的数据有用性。
CN201911224969.6A 2019-12-04 2019-12-04 一种基于小波变换的轨迹数据中时间相关性隐私保护方法 Active CN111079177B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911224969.6A CN111079177B (zh) 2019-12-04 2019-12-04 一种基于小波变换的轨迹数据中时间相关性隐私保护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911224969.6A CN111079177B (zh) 2019-12-04 2019-12-04 一种基于小波变换的轨迹数据中时间相关性隐私保护方法

Publications (2)

Publication Number Publication Date
CN111079177A true CN111079177A (zh) 2020-04-28
CN111079177B CN111079177B (zh) 2023-01-13

Family

ID=70312690

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911224969.6A Active CN111079177B (zh) 2019-12-04 2019-12-04 一种基于小波变换的轨迹数据中时间相关性隐私保护方法

Country Status (1)

Country Link
CN (1) CN111079177B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573560A (zh) * 2015-01-27 2015-04-29 上海交通大学 基于小波变换的差分隐私数据发布方法
US20150286827A1 (en) * 2012-12-03 2015-10-08 Nadia Fawaz Method and apparatus for nearly optimal private convolution
CN105608388A (zh) * 2015-09-24 2016-05-25 武汉大学 一种基于相关性去除的差分隐私数据发布方法及系统
CN107766742A (zh) * 2017-11-02 2018-03-06 广西师范大学 非独立同分布环境下的多相关性差分隐私矩阵分解方法
US20180239925A1 (en) * 2015-11-02 2018-08-23 LeapYear Technologies, Inc. Differentially Private Density Plots
CN108491730A (zh) * 2018-03-08 2018-09-04 湖南大学 基于拉格朗日优化的轨迹间相关性隐私保护方法
CN109885769A (zh) * 2019-02-22 2019-06-14 内蒙古大学 一种基于差分隐私算法的主动推荐系统及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150286827A1 (en) * 2012-12-03 2015-10-08 Nadia Fawaz Method and apparatus for nearly optimal private convolution
CN104573560A (zh) * 2015-01-27 2015-04-29 上海交通大学 基于小波变换的差分隐私数据发布方法
CN105608388A (zh) * 2015-09-24 2016-05-25 武汉大学 一种基于相关性去除的差分隐私数据发布方法及系统
US20180239925A1 (en) * 2015-11-02 2018-08-23 LeapYear Technologies, Inc. Differentially Private Density Plots
CN107766742A (zh) * 2017-11-02 2018-03-06 广西师范大学 非独立同分布环境下的多相关性差分隐私矩阵分解方法
CN108491730A (zh) * 2018-03-08 2018-09-04 湖南大学 基于拉格朗日优化的轨迹间相关性隐私保护方法
CN109885769A (zh) * 2019-02-22 2019-06-14 内蒙古大学 一种基于差分隐私算法的主动推荐系统及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郎永祥,秦拯: "应用于实时通信版权保护的BTC图像水印技术", 《电视技术》 *

Also Published As

Publication number Publication date
CN111079177B (zh) 2023-01-13

Similar Documents

Publication Publication Date Title
CN110874488A (zh) 一种基于混合差分隐私的流数据频数统计方法、装置、系统及存储介质
Fan et al. An adaptive approach to real-time aggregate monitoring with differential privacy
US10296999B2 (en) Methods and apparatus for color image watermarking
Li et al. Error analysis of finite difference and Markov chain approximations for option pricing
US10853362B2 (en) Optimized full-spectrum loglog-based cardinality estimation
US20140196151A1 (en) Preserving geometric properties of datasets while protecting privacy
US10983976B2 (en) Optimized full-spectrum cardinality estimation based on unified counting and ordering estimation techniques
Vostrikov et al. Expansion of the quasi-orthogonal basis to mask images
CN110490002A (zh) 一种基于本地化差分隐私的多维众包数据真值发现方法
Mnatsakanov et al. Nonparametric estimation of ruin probabilities given a random sample of claims
CN111079177B (zh) 一种基于小波变换的轨迹数据中时间相关性隐私保护方法
Ahuja et al. A neural approach to spatio-temporal data release with user-level differential privacy
CN112307514B (zh) 一种采用Wasserstein距离的差分隐私贪心分组方法
Gzyl et al. Stieltjes moment problem and fractional moments
US11068481B2 (en) Optimized full-spectrum order statistics-based cardinality estimation
CN111047587B (zh) 图像的噪声估计方法、计算机设备和存储介质
CN112700277B (zh) 用户行为数据的处理方法和多行为序列转化模型训练方法
CN113962591A (zh) 一种基于深度学习的工业物联网数据空间访问风险评估方法
CN113094751B (zh) 一种个性化隐私数据处理方法、装置、介质及计算机设备
CN115630219A (zh) 推荐模型的训练方法、装置和计算机设备
CN108491730A (zh) 基于拉格朗日优化的轨迹间相关性隐私保护方法
CN110222528B (zh) 数据流中频繁情节挖掘的差分隐私保护方法
CN109067502B (zh) 基于动态自适应压缩感知的多用户检测方法及电子设备
US10332279B2 (en) Methods and apparatus for image construction
CN114766020A (zh) 基于生物特征数据匿名跟踪和/或分析个体的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant