CN111079177A - 一种基于小波变换的轨迹数据中时间相关性隐私保护方法 - Google Patents
一种基于小波变换的轨迹数据中时间相关性隐私保护方法 Download PDFInfo
- Publication number
- CN111079177A CN111079177A CN201911224969.6A CN201911224969A CN111079177A CN 111079177 A CN111079177 A CN 111079177A CN 201911224969 A CN201911224969 A CN 201911224969A CN 111079177 A CN111079177 A CN 111079177A
- Authority
- CN
- China
- Prior art keywords
- data
- noise
- track
- time
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/148—Wavelet transforms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2151—Time stamp
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Bioethics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computer Hardware Design (AREA)
- Medical Informatics (AREA)
- Algebra (AREA)
- Computer Security & Cryptography (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出了一种基于小波变换的轨迹数据中时间相关性隐私保护方法,主要包括:量化轨迹数据中时间相关性,并且扰动原始数据从而达到隐私保护效果以及在确保隐私保护的同时提高数据有用性。
Description
技术领域
本发明涉及数据隐私保护领域,一种基于小波变换的轨迹数据中时间相关性隐私保护方法。
背景技术
随着计算机视觉、通讯、大数据产业的成熟,促进了智慧城市、智能交通等领域的迅速发展,人们的衣食住行等信息无时无刻不被数字化着。通过传感器、智能处理设备等终端收集和使用的这些相关视频、图片、位置等数据中包含了大量的时间相关的轨迹数据,攻击者如果获得这些时间相关轨迹数据,结合背景知识等方式推断出用户的兴趣点、行为习惯等敏感信息,比如用户经常出入的场所、身体状况等。因此,在将这些数据发布以前需要进行隐私保护处理,以防止用户个人隐私信息的泄露。
目前,针对用户时间相关轨迹数据发布的隐私泄漏问题,传统的隐私保护方法包括K-匿名、假轨迹、抑制等,K-匿名是通过将能够唯一识别用户的属性泛化,使得真实轨迹不能与其它轨迹进行区分,假轨迹是为每条真实轨迹产生一定的假轨迹来降低真实轨迹暴露的几率,轨迹抑制则是选择性的发布原始数据,其中可能会暴露用户隐私的轨迹信息不将其发布,以此来保护用户的真实轨迹。但是这些隐私保护的方法容易遭受背景知识攻击,或者在对用户数据进行隐私保护的过程中,没有考虑时间相关性的影响,只对除时间以外的轨迹序列数据处理,给用户的隐私保护问题带来了一定的挑战。
轨迹数据是一系列位置信息按照其发生的时间顺序连接而成的序列数据,本发明的目标是防止攻击者通过关于用户的先验知识分析时间相关性来从中挖掘用户的隐私,先量化轨迹数据中的时间相关性,并对数据做变换处理,然后在得到的数据系数上加入拉普拉斯噪声,最后通过迭代收敛优化噪声修正的数据有用性,以平衡隐私和数据效用之间的关系。
发明内容
本发明提出了一种基于小波变换的轨迹数据中时间相关性隐私保护方法来解决上述问题,主要包括三大内容:
步骤一:量化轨迹数据中时间相关性;
步骤二:扰动原始数据;
步骤三:优化数据有用性。
具体技术方法是:
步骤一:量化轨迹数据中时间相关性
首先,假设存在一个原始轨迹数据集包含某用户在D天中所产生的轨迹,那么用户在第d天的轨迹Tr如下所示:
Tr={(Jn,Wn)|n=0,1,2,...,N-1},
其中,Jn和Wn分别表示用户在第d天中第n个时间戳上的经度和纬度,d∈{1,2,.......,D}。
本发明将只考虑减去均值的轨迹:{(jn,wn)|n=0,1,2,...,N-1},其中和分别表示用户在D天里第n个时间戳上经度和纬度的平均值。此外,假设{jn|n=0,1,2,...,N-1}和{wn|n=0,1,2,...,N-1}在统计学上是独立的,可以单独使用,为了简单起见,以修改后的经度轨迹{jn|n=0,1,2,...,N-1}为例解释本发明所提出的隐私保护方法。
接下来,将量化轨迹数据时间相关性,以Corr表示长度为M的用户时间相关性,描述了用户在当前时间戳tn处和接下来第i个时间戳tn+i的两个位置的关系,用户的移动性模式可以由当前第n个位置下第n+i个位置的条件概率来描述,即Pr(jn+i|jn),用户有且只有一个Corr,并且当前位置的条件概率仅依赖于它的上一个位置,其定义如下:
Corr={Corri|i=0,1,...,M-1},
其中,Corri=Ed{jn+ijn}=∫jn+ijndPr(jn+i|jn)dPr(jn),tn和tn+i分别表示一天中第n个和第n+i个时间戳,E表示期望,d∈{1,2,.......,D}。
然后,采用离散小波变换方法对量化后的时间相关轨迹数据做处理,可采用如下式子:
其中,t表示时间,b,k∈Z,b表示不同尺度,k表示位移,表示尺度函数,描述轨迹的粗略部分,ψb,k(t)表示小波函数,描述轨迹的详细部分,通过变换得到的小波系数为和db[k]=<j(t),ψb,k(t)>,小波系数服从均值μk=0和标准方差σSk的高斯分布。
步骤二:扰动原始数据
由步骤一通过小波变换得到的轨迹数据系数cb[k]和db[k]上添加拉普拉斯噪声来对数据进行扰动:
c'b[k]=cb[k]+δcb[k],(k=0,1,...,K-1),
d'b[k]=db[k]+δdb[k],(k=0,1,...,K-1),
加入噪声后,具有噪声的位置变为:
其中,τcb[k]和τdb[k]表示噪声小波系数,c'b[k]和d'b[k]则为添加噪声后的小波系数,τjn表示添加小波系数噪声的位置,j'n则为添加噪声后的位置。添加噪声的位置应具有拉普拉斯分布,即,满足下式:
其中,j'n则为添加噪声后的位置表示,λj为拉普拉斯分布的尺度参数。
同样的,添加噪声的时间相关性也应满足拉普拉斯分布,即:
面向时间相关轨迹数据发布,本发明采用以下算法来对轨迹数据做隐私保护处理,得到噪声修正的轨迹数据:
步骤三:优化数据的有用性
选取适当的初值j(0),j(0)∈R,不断迭代,计算得到的轨迹函数fTr(j)的极小值点jmin,如果第r次得到的迭代值为j(r),计算fTr(j(r))以及fTr(j(r))在j(r)处的梯度gTr=gTr(j(r)),当||gTr||<ε时,停止迭代,令jmin=j(r);否则,设置使函数值下降最快的方向为qr=-gTr(j(r)),使求步长βr,其中,根据步骤二扰动原始数据中所得到的拉普拉斯分布的尺度参数由可以得到隐私预算ε。
然后,令j(r+1)=j(r)+βrqr,计算fTr(j(r+1))。当两次计算的值||fTr(j(r+1))-fTr(j(r))||<ε或||j(r+1)-j(r)||<ε时,停止迭代,jmin=j(r+1);否则,r赋值为r+1,继续计算梯度和重复上述后续步骤,从而为在给定的隐私预算的情况下实现更好的数据效用,数据效用采用轨迹的平均位置标准差效用和时间相关性效用进行评价。
面向轨迹数据有用性优化算法如下:
附图说明
图1为本发明技术路线图。
具体实施方式
本发明主要步骤如下:
步骤1:准备带有时间戳的用户轨迹数据,字段主要包括ID、经度、纬度以及时间。
步骤2:将轨迹时间相关性量化,计算所有D天的第n个时间戳的经度和纬度的平均值。
步骤3:得到第d天的修改后的轨迹{(jn,wn)|n=0,1,2,...,N-1},并以{jn|n=0,1,2,...,N-1}为例进行解释。
步骤5:在所得数据系数上加入拉普拉斯噪声,得到噪声系数c'b[k]=cb[k]+τcb[k],(k=0,1,...,K-1),d'b[k]=db[k]+τdb[k],(k=0,1,...,K-1)。
步骤6:获得噪声位置j'n。
步骤7:选取适当的初值j(0),j(0)∈R,对得到的轨迹函数fTr(j)计算梯度,不断迭代,直至收敛,优化数据有用性,从而平衡隐私和数据效用之间的关系。
步骤8:最终得到噪声修正的轨迹{(j'n,w'n)|n=0,1,2,...,N-1}。
Claims (4)
1.本发明提出了一种基于小波变换的轨迹数据中时间相关性隐私保护方法,其特征在于,包括以下步骤:
步骤一:量化轨迹数据中时间相关性
首先,假设存在一个原始轨迹数据集包含某用户在D天中所产生的轨迹,那么用户在第d天的轨迹Tr如下所示:
Tr={(Jn,Wn)|n=0,1,2,...,N-1},
其中,Jn和Wn分别表示用户在第d天中第n个时间戳上的经度和纬度,d∈{1,2,.......,D}。
本发明将只考虑减去均值的轨迹:{(jn,wn)|n=0,1,2,...,N-1},其中 和分别表示用户在D天里第n个时间戳上经度和纬度的平均值。此外,假设{jn|n=0,1,2,...,N-1}和{wn|n=0,1,2,...,N-1}在统计学上是独立的,可以单独使用,为了简单起见,以修改后的经度轨迹{jn|n=0,1,2,...,N-1}为例解释本发明所提出的隐私保护方法。
接下来,将量化轨迹数据时间相关性,以Corr表示长度为M的用户时间相关性,描述了用户在当前时间戳tn处和接下来第i个时间戳tn+i的两个位置的关系,用户的移动性模式可以由当前第n个位置下第n+i个位置的条件概率来描述,即Pr(jn+i|jn),用户有且只有一个Corr,并且当前位置的条件概率仅依赖于它的上一个位置,其定义如下:
Corr={Corri|i=0,1,...,M-1},
其中,Corri=Ed{jn+ijn}=∫jn+ijnd Pr(jn+i|jn)d Pr(jn),tn和tn+i分别表示一天中第n个和第n+i个时间戳,E表示期望,d∈{1,2,.......,D}。
然后,采用离散小波变换方法对量化后的时间相关轨迹数据做处理,可采用如下式子:
其中,t表示时间,b,k∈Z,b表示不同尺度,k表示位移,表示尺度函数,描述轨迹的粗略部分,ψb,k(t)表示小波函数,描述轨迹的详细部分,通过变换得到的小波系数为和db[k]=<j(t),ψb,k(t)>,小波系数服从均值μk=0和标准方差σSk的高斯分布。
步骤二:扰动原始数据
由步骤一通过小波变换得到的轨迹数据系数cb[k]和db[k]上添加拉普拉斯噪声来对数据进行扰动:
c'b[k]=cb[k]+τcb[k],(k=0,1,...,K-1),
d'b[k]=db[k]+τdb[k],(k=0,1,...,K-1),
加入噪声后,具有噪声的位置变为:
其中,τcb[k]和τdb[k]表示噪声小波系数,c'b[k]和d'b[k]则为添加噪声后的小波系数,τjn表示添加小波系数噪声的位置,j'n则为添加噪声后的位置。
添加噪声的位置应具有拉普拉斯分布,即,满足下式:
其中,j'n则为添加噪声后的位置表示,λj为拉普拉斯分布的尺度参数。
同样的,添加噪声的时间相关性也应满足拉普拉斯分布,即:
步骤三:优化数据有用性
选取适当的初值j(0),j(0)∈R,不断迭代,计算得到的轨迹函数fTr(j)的极小值点jmin,如果第r次得到的迭代值为j(r),计算fTr(j(r))以及fTr(j(r))在j(r)处的梯度gTr=gTr(j(r)),当||gTr||<ε时,停止迭代,令jmin=j(r);否则,设置使函数值下降最快的方向为qr=-gTr(j(r)),使求步长βr,其中,根据步骤二扰动原始数据所得到的拉普拉斯分布的尺度参数由可以得到隐私预算ε。
然后,令j(r+1)=j(r)+βrqr,计算fTr(j(r+1))。当两次计算的值||j(r+1)-j(r)||<ε或||fTr(j(r+1))-fTr(j(r))||<ε时,停止迭代过程,jmin=j(r+1);否则,r赋值为r+1,继续计算梯度和重复上述后续步骤,从而为在给定的隐私预算的情况下实现更好的数据效用,数据效用采用轨迹的平均位置标准差效用和时间相关性效用进行评价。
2.根据权利要求1所述的步骤一:量化轨迹数据中时间相关性,其特征在于:首先将轨迹数据时间相关性量化,并采用小波变换方法对产生的离散时序数据统一做变换处理,随着分解层数的增加,低频系数的数据量减少,高频系数的数据量增加,且大多集中在较少的系数上,为数据处理创造了有利条件。
3.根据权利要求1所述的步骤二:扰动原始数据,其特征在于:在经过量化处理变换之后的数据系数上加入拉普拉斯噪声,通过数据预处理改变了直接向原始轨迹数据中添加拉普拉斯噪声的过程,然后,得到一个噪声修正的轨迹。
4.根据权利要求1所述的步骤三:优化数据有用性,其特征是,针对轨迹数据加入噪声后导致数据可用性降低的问题,通过不断地迭代计算,利用梯度将数据收敛到当前最合适的值来实现数据有用性的优化,从而平衡隐私和数据效用之间的关系,在给定相同隐私预算的情况下得到更优的数据有用性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911224969.6A CN111079177B (zh) | 2019-12-04 | 2019-12-04 | 一种基于小波变换的轨迹数据中时间相关性隐私保护方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911224969.6A CN111079177B (zh) | 2019-12-04 | 2019-12-04 | 一种基于小波变换的轨迹数据中时间相关性隐私保护方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111079177A true CN111079177A (zh) | 2020-04-28 |
CN111079177B CN111079177B (zh) | 2023-01-13 |
Family
ID=70312690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911224969.6A Active CN111079177B (zh) | 2019-12-04 | 2019-12-04 | 一种基于小波变换的轨迹数据中时间相关性隐私保护方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111079177B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573560A (zh) * | 2015-01-27 | 2015-04-29 | 上海交通大学 | 基于小波变换的差分隐私数据发布方法 |
US20150286827A1 (en) * | 2012-12-03 | 2015-10-08 | Nadia Fawaz | Method and apparatus for nearly optimal private convolution |
CN105608388A (zh) * | 2015-09-24 | 2016-05-25 | 武汉大学 | 一种基于相关性去除的差分隐私数据发布方法及系统 |
CN107766742A (zh) * | 2017-11-02 | 2018-03-06 | 广西师范大学 | 非独立同分布环境下的多相关性差分隐私矩阵分解方法 |
US20180239925A1 (en) * | 2015-11-02 | 2018-08-23 | LeapYear Technologies, Inc. | Differentially Private Density Plots |
CN108491730A (zh) * | 2018-03-08 | 2018-09-04 | 湖南大学 | 基于拉格朗日优化的轨迹间相关性隐私保护方法 |
CN109885769A (zh) * | 2019-02-22 | 2019-06-14 | 内蒙古大学 | 一种基于差分隐私算法的主动推荐系统及装置 |
-
2019
- 2019-12-04 CN CN201911224969.6A patent/CN111079177B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150286827A1 (en) * | 2012-12-03 | 2015-10-08 | Nadia Fawaz | Method and apparatus for nearly optimal private convolution |
CN104573560A (zh) * | 2015-01-27 | 2015-04-29 | 上海交通大学 | 基于小波变换的差分隐私数据发布方法 |
CN105608388A (zh) * | 2015-09-24 | 2016-05-25 | 武汉大学 | 一种基于相关性去除的差分隐私数据发布方法及系统 |
US20180239925A1 (en) * | 2015-11-02 | 2018-08-23 | LeapYear Technologies, Inc. | Differentially Private Density Plots |
CN107766742A (zh) * | 2017-11-02 | 2018-03-06 | 广西师范大学 | 非独立同分布环境下的多相关性差分隐私矩阵分解方法 |
CN108491730A (zh) * | 2018-03-08 | 2018-09-04 | 湖南大学 | 基于拉格朗日优化的轨迹间相关性隐私保护方法 |
CN109885769A (zh) * | 2019-02-22 | 2019-06-14 | 内蒙古大学 | 一种基于差分隐私算法的主动推荐系统及装置 |
Non-Patent Citations (1)
Title |
---|
郎永祥,秦拯: "应用于实时通信版权保护的BTC图像水印技术", 《电视技术》 * |
Also Published As
Publication number | Publication date |
---|---|
CN111079177B (zh) | 2023-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110874488A (zh) | 一种基于混合差分隐私的流数据频数统计方法、装置、系统及存储介质 | |
Fan et al. | An adaptive approach to real-time aggregate monitoring with differential privacy | |
US10296999B2 (en) | Methods and apparatus for color image watermarking | |
Li et al. | Error analysis of finite difference and Markov chain approximations for option pricing | |
US10853362B2 (en) | Optimized full-spectrum loglog-based cardinality estimation | |
US20140196151A1 (en) | Preserving geometric properties of datasets while protecting privacy | |
US10983976B2 (en) | Optimized full-spectrum cardinality estimation based on unified counting and ordering estimation techniques | |
Vostrikov et al. | Expansion of the quasi-orthogonal basis to mask images | |
CN110490002A (zh) | 一种基于本地化差分隐私的多维众包数据真值发现方法 | |
Mnatsakanov et al. | Nonparametric estimation of ruin probabilities given a random sample of claims | |
CN111079177B (zh) | 一种基于小波变换的轨迹数据中时间相关性隐私保护方法 | |
Ahuja et al. | A neural approach to spatio-temporal data release with user-level differential privacy | |
CN112307514B (zh) | 一种采用Wasserstein距离的差分隐私贪心分组方法 | |
Gzyl et al. | Stieltjes moment problem and fractional moments | |
US11068481B2 (en) | Optimized full-spectrum order statistics-based cardinality estimation | |
CN111047587B (zh) | 图像的噪声估计方法、计算机设备和存储介质 | |
CN112700277B (zh) | 用户行为数据的处理方法和多行为序列转化模型训练方法 | |
CN113962591A (zh) | 一种基于深度学习的工业物联网数据空间访问风险评估方法 | |
CN113094751B (zh) | 一种个性化隐私数据处理方法、装置、介质及计算机设备 | |
CN115630219A (zh) | 推荐模型的训练方法、装置和计算机设备 | |
CN108491730A (zh) | 基于拉格朗日优化的轨迹间相关性隐私保护方法 | |
CN110222528B (zh) | 数据流中频繁情节挖掘的差分隐私保护方法 | |
CN109067502B (zh) | 基于动态自适应压缩感知的多用户检测方法及电子设备 | |
US10332279B2 (en) | Methods and apparatus for image construction | |
CN114766020A (zh) | 基于生物特征数据匿名跟踪和/或分析个体的方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |