CN113329398B

CN113329398B - 一种基于整数规划的敏感上下车模式的隐藏方法

Info

Publication number: CN113329398B
Application number: CN202110591865.XA
Authority: CN
Inventors: 杨蔡芸; 张海涛; 蔡馨蒙; 宋锐; 刘晋源
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2021-05-28
Filing date: 2021-05-28
Publication date: 2022-08-02
Anticipated expiration: 2041-05-28
Also published as: CN113329398A

Abstract

本发明提供一种基于整数规划的敏感上下车模式的隐藏方法，步骤为；1.上下车轨迹点对的提取以及其包含时空信息的离散；2.计算上车模式、下车模式、上下车模式的支持度，并基于用户设定的支持度阈值得到频繁的上下车模式集合；3.用户敏感的频繁上下车模式集的获取，支持矩阵的构建，条件表达的处理，整数规划求解和最佳移除项的确定，以及原始上下车轨迹数据的修改。与现有方法相比，本发明具有高精确性和高效率的优势。

Description

一种基于整数规划的敏感上下车模式的隐藏方法

技术领域

本发明涉及空间数据隐私保护技术研究领域，具体是涉及一种基于整数规划的敏感上下车模式的隐藏方法。

背景技术

近年来，随着城市建设的快速发展，网约车得到了大量普及。乘客通过网络APP软件可以提前预约车辆安排出行，司机通过后台管理系统可以实现灵活接单和最佳路径导航。在此过程中，网约车运营平台系统积累产生了大量的网约车运行轨迹数据。采用大数据挖掘和人工智能技术，对海量的网约车轨迹数据进行分析，可以从中发现众多网约车轨迹中蕴含的频繁出现的运动模式规律。基于这些运动模式规律，网约车运营平台系统可以实现资源优化的分配方案、个性化的智能推荐等优化管理功能。

但是，对网约车轨迹中蕴含运动模式规律的分析，也可能会带来一定的信息安全问题。当运动模式规律中包含的空间区域如果涉及到敏感空间信息(例如，军事禁区等)，运动模式规律就会有敏感特性，会对满足敏感模式前置条件的网约车司机带来信息安全问题。因此，网约车运营平台系统必须加强网约车轨迹数据的安全管理。在其将拥有的网约车轨迹数据进行共享发布，或者与其他行业部门进行信息交换时，必须对网约车轨迹数据进行分析，消除其中包含的敏感模式规律。

目前，国内外学者对隐藏敏感模式的相关研究较为丰富。Verykios等人提出了通过降低对关联规则的置信度、控制数据集中信息相异程度的方法。Oliveira等人提出了4种隐藏频繁项集的算法，以数据库中事务支持的敏感项集的数量为依据，识别需要净化的事务数据。Zaiane等人提出了利用敏感规则分组的方式来处理规则之间相交的问题的IGA算法。

然而，上述方法存在以下问题：(1)敏感项集不能实现完全隐藏，且精确度较低，对于数据敏感安全性要求较高的场景并不适用。(2)隐藏敏感模式的数据处理“副作用”较大，在完成隐藏敏感模式的同时,会删除较多的非敏感数据，降低了数据集的可用性。因此，需要设计实现一种可是实现敏感模式精确隐藏，且尽可能保证数据集可用性的方法。

发明内容

为解决上述技术问题，本发明提供了一种基于整数规划的敏感上下车模式的隐藏方法，该方法不需要处理全部数据，只需对含特定内容的数据进行处理，具有数据修改精确性高、“副作用”小以及计算效率高的优势，具有广阔的市场应用前景。

本发明所述的一种基于整数规划的敏感上下车模式的隐藏方法，所述方法的步骤为：

步骤1、采集网约车上下车轨迹数据，构建上下车轨迹数据集，对所述数据集中的数据进行预处理；

步骤2、对频繁上下车模式进行挖掘；

步骤3、对网约车轨迹数据中敏感上下车模式进行隐藏。

进一步的，对网约车轨迹数据预处理的步骤为：

步骤1-1、计算网约车上下车轨迹数据集中每条轨迹所对应的上下车轨迹点对序列；

步骤2-2、对上下车轨迹点对序列中时空信息进行离散，得到时空离散的上下车轨迹点对序列。

进一步的，频繁上下车模式的挖掘的步骤为：

步骤2-1、构建上下车轨迹点对集合；

步骤2-2、计算上车模式、下车模式、上下车模式的支持度；

步骤2-3、基于用户设定的支持度阈值得到频繁的上下车模式集合。

进一步的，对网约车轨迹数据中敏感上下车模式进行隐藏的步骤为：

步骤3-1、从频繁的上下车模式集合得到敏感的频繁上下车模式集；

步骤3-2、计算敏感的频繁上下车模式集的支持矩阵；

步骤3-3、基于整数规划实现敏感上下车模式的隐藏；

步骤3-4、基于最佳项移除确定需要修改的时空离散的上下车轨迹点对中的时空信息；

步骤3-5、修改原始的上下车轨迹数据。

本发明所述的有益效果为：本发明通过采用整数规划的最优化求解以及最佳项移除，快速排除非频繁、非敏感的模式以及数据，只针对敏感的频繁模式以及相关联的轨迹数据进行处理，大大减少数据处理量，具有高精确性、小“副作用”以及高计算效率的优势。

附图说明

为了使本发明的内容更容易被清楚地理解，下面根据具体实施例并结合附图，对本发明作进一步详细的说明；

图1是本发明所述方法的流程图；

图2是网约车的上下车轨迹数据的空间分布；

图3是时空离散的上下车轨迹点对序列的空间分布；

图4是敏感的频繁上下车模式集的空间分布；

图5是修改后的时空离散的上下车轨迹点对；

图6是修改后上下车轨迹。

具体实施方式

首先，给出如下的基本定义：

定义1上下车轨迹：Traj＝{VID，date，{tp₁，tp₂，...，tp_n}}表示为一辆网约车某天的上下车轨迹，其中，VID表示车辆的编号，date表示轨迹记录的日期，tp_i＝{time，flag，lat，lon}，1≤i≤n表示其中的一个轨迹点，time表示轨迹记录的时间，且tp_i·time≥tp_i+1·time表示轨迹点tp_i先于tp_i+1生成，flag表示乘客上下车的标识，flag＝0表示乘客上车，flag＝1表示乘客下车，当i＝1时flag＝0，当i＝n时flag＝1，lat表示轨迹点对应的经度值，lon表示轨迹点对应的纬度值。

定义2上下车轨迹点对：给定一条上下车轨迹

Traj＝{VID，date，{tp₁，tp₂，...，tp_n}}，如果其中的两个轨迹点tp_i，tp_i+1，1≤i≤(n-1)满足条件：(tp_i·flag＝0)∧(tp_i+1·flag＝1)，也即tp_i是上车点，tp_i+1是下车点，则tp_i、tp_i+1可以形成一个上下车轨迹点对：

RecPuPo＝{VID，Date，Pulat，Pulon，Putime，Polat，Polon，Potime}

其中，RecPuPo·VID＝Traj·VID，RecPuPo·date＝Traj·date，RecPuPo·Pulat＝tp_i·lat，RecPuPo·Pulon＝tp_i·lon，RecPuPo-Putime＝tp_i-time，RecPuPo·Polat＝tp_i+1·lat，RecPuPo·Polon＝tp_i+1·lon，RecPuPo·Potime＝tp_i+1·time；

Traj中所有轨迹点构成的所有上下车轨迹点对，按顺序组合得到上下车轨迹点对序列RecPuPoSe＝{RecPuPo₁，RecPuPo₂，…，RecPuPo_m}，1≤m≤n/2。

定义3时空离散的上下车轨迹点对：给定一个上下车轨迹点对RecPuPo＝{VID，Date，Pulat，Pulon，Putime，Polat，Polon，Potime}，将其包含的时间信息{Putime，Potime}、空间信息Pulat，Pulon，Polat，Polon}分别映射到离散的时间段和空间网格中，可以得到对应的时空离散的上下车轨迹点对NumPuPo＝{VID，Date，Pusnum，Putnum，Posnum，Potnum}，

其中NumPuPo·VID＝RecPuPo·VID，NumPuPoDate＝RecPuPoDate，

表示网格Pusnum的空间范围包含上车点的经度Pulat和纬度Pulon，

表示时段Putnum的时间范围包含上车点的时间Putime，

表示网格Posnum的空间范围包含下车点的经度Polat和纬度Polon，

表示时段Potnum的时间范围包含下车点的时间Potime；

进一步，由Traj的上下车轨迹点对序列RecPuPoSe，可以得到时空离散的上下车轨迹点对序列NumPuPoSe＝{NumPuPo₁，NumPuPo₂，…，NumPuPo_m}。

定义4上下车模式：U＝{Pusnum，Putnum}表示一个上车模式，O＝Posnum，Potnum}表示一个下车模式，L＝{Pusnum，Putnum，Posnum，Potnum}表示一个上下车模式，其中，Pusnum表示上车点所在的空间网格，Putnum表不上车时间所在的时段，Posnum表示下车点所在的空间网格，Potnum表示下车时间所在的时段。

定义5上下车模式的支持：给定一上车模式U＝{Pusnum，Putnum}，以及一个时空离散的上下车轨迹点对NumPuPo＝{VID，DataPusnum，Putnum，Posnum，Potnum}，如果满足条件：(NumPuPo·Pusnum＝U·Pusnum)∧(NumPuPo·Putnum＝u·Putnum)，则称NumPuPo支持U，记为：

同理，给定一下车模式O＝{Posnum，Potnum}，以及一个时空离散的上下车轨迹点对NumPuPo＝{VID，Date，Pusnum，Putnum，Posnum，Potnum}，如果满足条件：

(NumPuPo·Posnum＝L·Posnum)∧(NumPuPo·Potnum＝L·Potnum)，则称NumPuPo支持O，记为：

进一步，给定一上下车模式L＝{Pusnum，Putnum，Posnum，Potnum}，以及一个时空离散的上下车轨迹点对NumPuPo＝{VID，Date，Pusnum，Putnum，Posnum，Potnum}，如果满足条件：

则称NumPuPo支持L，记为：

定义6上下车模式的支持度：给定上下车轨迹集合Trajs＝{Traj₁，Traj₂，...，Traj_n}，以及所对应的时空离散的上下车轨迹点对序列集合NumPuPoSes＝{NumPuPoSe₁NumPuPoSe₂，…，NumPuPoSe_n}，NumPuPoSes中所有时空离散的上下车轨迹点对序列中的元素组成一个时空离散的上下车轨迹点对集合NumPuPos＝{NumPuPo₁，NumPuPo₂，…，NumPuPo_m}，对于一上车模式U，NumPuPos对U的支持度定义为：

如果Support(NumPuPos，U)≥σ_min，σ_min为用户设定的支持度阈值，则称U为频繁的上车模式，记为FU；

同理，对于一下车模式O，NumPuPos对O的支持度定义为：

如果Support(NumPuPos，O)≥σ_min，σ_min为用户设定的支持度阈值，则称O为频繁的下车模式，记为FO；

进一步，对于一上下车模式L，NumPuPos对其支持度定义为：

如果Support(NumPuPos，L)≥σ_min，σ_min为用户设定的支持度阈值，则称L为频繁的上下车模式，记为FL。

定义7敏感的频繁上下车模式集：给定一频繁的上车模式集FUs＝{FU₁，FU₂，…，FU_n}，对于其中上车模式FU_i，1≤i≤n，如果其包含的时空信息具有敏感属性，也即FU_i与敏感的时空区域SenST的交集不为空(FU_i⌒SenST)≠φ，则称FU_i为敏感的频繁上车模式，记为FSenU_i，对应的敏感的频繁的上车模式集记为FSenUs＝{FSenU₁，FSenU₂，…，FSenU_m}，1≤m≤n；

同理，可定义敏感的频繁的下车模式集记为FSenOs＝{FSenO₁，FSenO₂，…，FSenO_m}，1≤m≤n；

进一步，可定义敏感的频繁的上下车模式集记为FSenLs＝{FSenL₁，FSenL₂，…，FSenL_m}，1≤m≤n。

定义8支持矩阵：给定一个时空离散的上下车轨迹点对集合NumPuPos＝{NumPuPo₁，NumPuPo₂，…，NumPuPo_n}，以及从中挖掘分析得到的敏感的频繁的上车、下车、上下车模式集合FSenUs、FSenOs、FSenLs的并集FSenUOLs＝{FSenUOL₁，FSenUOL₂，…，FSenUOL_m}，其中，支持FSenUOLs中元素NumPuPos的子集为NumPuPos′＝{NumPuPo′₁，NumPuPo′2，…，NumPuPo′_k}，则对应的支持矩阵定义为：

其中，

定义9敏感模式隐藏：给定一个时空离散的上下车轨迹点对集合NumPuPos＝{NumPuPo₁，NumPuPo₂，…，NumPuPo_n}，从中挖掘分析得到的敏感的频繁的上车、下车、上下车模式集合FSenUs、FSenOs、FSenLs的并集FSenUOLs＝{FSenUOL₁，FSenUOL₂，…，FSenUOL_m}，以及支持FSenUOLs中元素NumPuPos的子集为NumPuPos′＝{NumPuPo′₁，NumPuPo′₂，…，NumPuPo′_k}，如果通过对NumPuPos′中时空离散的上下车轨迹点对NumPuPo′_j，1≤j≤k的修改，使得FSenUOLs中敏感的频繁模式FSenUOL_i，1≤i≤k不再从NumPuPos中挖掘发现，则称FSenUOL_i被隐藏；

为实现FSenUOLs中所有敏感的频繁模式的隐藏，需要对NumPuPos中时空离散的上下车轨迹点对进行修改的代价定义为：

其中，如Modi(NumPuPo′_j)表示NumPuPo′_j被修改，UModi(NumPuPo′_j)表示NumPuPo′_j未被修改；采用对NumPuPo′_j记录进行删除称为清空式修改，如果只是修改NumPuPo′_j支持的敏感模式项NumPuPo′_j，1≤j≤k，则称为最佳项移除修改。

定义10整数规划：给定一个无重复的时空离散的上下车轨迹点对集合NumPuPos＝{NumPuPo₁，NumPuPo₂，…，NumPuPo_n}，从中挖掘分析得到的敏感的频繁的上车、下车、上下车模式集合FSenUs、FSenOs、FSenLs的并集FSenUOLs＝{FSenUOL₁，FSenUOL₂，…，FSenUOL_m}，以及支持FSenUOLs中元素NumPuPos的子集为NumPuPo′s＝{NumPuPo′₁，NumPuPo′₂，…，NumPuPo′_k}，以及实现其敏感频繁模式隐藏的支持矩阵

修改的代价

则实现优化隐藏的整数规划定义为：

min MCost

其中，Support(NumPuPos，FSenUOL_i)表示NumPuPos对FSenUOL_i的支持度，minMCost表示用户设定的支持度阈值。

如图1所示，本发明所述的一种基于整数规划的敏感上下车模式的隐藏方法，包括如下步骤：

步骤1、对网约车上下车轨迹数据预处理，所述预处理步骤如下：

步骤1-1、计算网约车上下车轨迹数据集中每条轨迹所对应的上下车轨迹点对序列，如图2所示；

依据定义2，对每条上下车轨迹数据按照其中的表示乘客上下车的标识flag进行分离得到对应的上下车轨迹点对序列。

本实例中，使用包含4辆网约车的上下车轨迹数据集

Trajs＝{Traj₁，Traj₂，Traj₃，Traj₄}，Traj₁～Traj₄的空间分布如图1所示，其中：

Traj₁＝{1，2016/2/19，{tp₁，tp₂，tp₃，tp₄，tp₅，tp₆，tp₇，tp₈，tp₉，tp₁₀，tp₁₁，tp₁₂}}，

Traj₂＝{2，2016/2/19，{tp₁，tp₂，tp₃，tp₄，tp₅，tp₆，tp₇，tp₈，tp₉，tp₁₀}}，

Traj₃＝{3，2016/2/19，{tp₁，tp₂，tp₃，tp₄，tp₅，tp₆，tp₇，tp₈，tp₉，tp₁₀，tp₁₁，tp₁₂}}，

Traj₄＝{4，2016/2/19，{tp₁，tp₂，tp₃，tp₄，tp₅tp₆}}。

对于Traj1，其包含的轨迹点的信息如下：

tp₁＝{5:00，up，41.952349，87.624672}，tp₂＝{5:15，off，41.942378，87.652781}，

tp₃＝{5:20，up，41.902781，87.665172}，tp₄＝{5:40，off，41.883192，87.681721}，

tp₅＝{5:40，up，41.883192，87.681721}，tp₆＝{6:00，off，41.862901，87.682901}，

tp₇＝{6:10，up，41.872891，87.682718}，tp₈＝{6:25，off，41.902812，87.683764}，

tp₉＝{6:25，up，41.90281２，87.683764}，tp₁₀＝{7:00，off，41.967718，87.686671}，

tp₁₁＝{7:00，up，41.962718，87.682671}，tp₁₂＝{7:10，off，41.967812，87.662187}。

依据定义2，可得到由tp₁、tp₂形成一个上下车轨迹点对：

RecPuPo₁＝{1，2016/2/19，41.952349，87.624672，5:00，41.942378，87.6527815:15}。

同理可得，

RecPuPo₂＝{1，2016/2/19，41.902781，87.665172，5:20，41.883192，87.6817215:40}，

RecPuPo₃＝{1，2016/2/19，41.883192，87.6817215:40，41.862901，87.682901，6:00}，

RecPuPo₄＝{1，2016/2/19，41.872891，87.682718，6:10，41.902812，87.683764，6:25}，

RecPuPo₅＝{1，2016/2/19，41.902812，87.683764，6∶25，41.967718，87.686671，7:00}，

RecPuPo₆＝{1，2016/2/19，41.962718，87.682671，7:00，41.967812，87.662187，7:10}；

从而，得到Traj₁所对应的上下车轨迹点对序列

RecPuPoSe₁＝{RecPuPo₁，RecPuPo₂，RecPuPo₃，RecPuPo₄，RecPuPo₅，RecPuPo₆}；

对于Traj₂，其包含的轨迹点的信息如下：

tp₁＝{5:00，up，41.89819287.632178}，tp₂＝{5:20，off，41.902812，87.665323}，

tp₃＝{5:20，up，41.909812，87.669323}，tp₄＝{5:40，off，41.908453，87.687532}，

tp₅＝{5:40，up，41.908999，87.689886}，tp₆＝{6:05，off，41.872671，87.682718}，

tp₇＝{6:10，up，41.862912，87.682839}，tp₈＝{7:00，off，41.959234，87.687683}，

tp₉＝{7:00，up，41.952617，87.682913}，tp₁₀＝{7:25，off，41.962173，87.652812}。

对应的上下车轨迹点对为：

RecPuPo₁＝{2，2016/2/19，41.898192，87.632178，5:00，41.902812，87.665323，5:20}，

RecPuPo₂＝{2，2016/2/19，41.909812，87.669323，5:20，41.908453，87.687532，5:40}，

RecPuPo₃＝{2，2016/2/19，41.908999，87.689886，5:40，41.872671，87.682718，6:05}，

RecPuPo₄＝{2，2016/2/19，41.862912，87.682839，6:10，41.959234，87.687683，7:00}，

RecPuPo₅＝{2，2016/2/19，41.952617，87.682913，7:00，41.962173，87.652812，7:25}。

所对应的上下车轨迹点对序列：

RecPuPoSe₂＝{RecPuPo₁，RecPuPo₂，RecPuPo₃，RecPuPo₄，RecPuPo₅}

对于Traj₃，其包含的轨迹点的信息如下：

tp₁＝{5:20，up，41.886712，87.652671}，tp₂＝{5:40，off，41.898371,87.682712}，

tp₃＝{5:55，up，41.956721，87.683712}，tp₄＝{6:10，off，41.906371,87.662781}，

tp₅＝{6:10，up，41.906371，87.662781}，tp₆＝{6:30，off，41.917261，87.687263}，

tp₇＝{6:35，up，41.867216，87.682718}，tp₈＝{6:45，off，41.872671，87.677825}，

tp₉＝{6:45，up，41.872671，87.677825}，tp₁₀＝{7:00，off，41.959988，87.680022}，

tp₁₁＝{7:00，up，41.962579，87.687218}，tp₁₂＝{7:10，off，41.96257，87.657832}。

对应的上下车轨迹点对为：

RecPuPo₁＝{3，2016/2/19，41.886712，87.652671，5:20，41.898371，87.682712，5:40}，

RecPuPo₂＝{3，2016/2/19，41.956721，87.683712，5:55，41.906371，87.662781，6:10}，

RecPuPo₃＝{3，2016/2/19，41.906371，87.662781，6:10，41.917261，87.687263，6:30}，

RecPuPo₄＝{3，2016/2/19，41.867216，87.682718，6:35，41.872671，87.677825，6:45}，

RecPuPo₅＝{3，2016/2/19，41.872671，87.677825，6:45，41.959988，87.68002２，7:00}，

RecPuPo₆＝{3，2016/2/19，41.962579，87.687218，7:00，41.96257，87.657832，7:10}。

所对应的上下车轨迹点对序列：

RecPuPoSe₃＝{RecPuPo₁，RecPuPo₂，RecPuPo₃，RecPuPo₄，RecPuPo₅，RecPuPo₆}。

对于Traj₄，其包含的轨迹点的信息如下：

tp₁＝{5:20，up，41.847261，87.646282}，tp₂＝{6:00，off，41.826736，87.667281}，

tp₃＝{6:10，up，41.856273，87.698721}.，tp₄＝{7:00，off，41.962781，87.682738}，

tp₅＝{7:10，up，41.962781，87.652613}，tp₆＝{7:25，off，41.896736，87.670972}；

对应的上下车轨迹点对为：

RecPuPo₁＝{4，2016/2/19，41.847261，87.646282，5:20，41.826382，87.667281，6:00}，

RecPuPo₂＝{4，2016/2/19，41.856273，87.698721，6:10，41.962781，87.682738，7:00}，

RecPuPo₃＝{4，2016/2/19，41.962781，87.6526137:10，41.896736，87.670972，7:25}；

所对应的上下车轨迹点对序列：

RecPuPoSe₄＝{RecPuPo₁，RecPuPo₂，RecPuPPo₃}。

步骤1-2、对上下车轨迹点对序列中时空信息进行离散，得到时空离散的上下车轨迹点对序列，如图3所示；

先采用等间隔的方法对所有轨迹的时空范围进行离散化处理，然后将所有轨迹对应的上下车轨迹点对序列转化为时空离散的上下车轨迹点对序列；

本实例中，Trajs＝{Traj₁，Traj₂，Traj₃，Traj₄}中所有轨迹的时间范围为一天，以5分钟为一个间隔划分288个时间段；所有轨迹的经纬度坐标进行平面投影转化，并将其空间范围划分为3*3格网，编号由左到右、由上到下依次为1-9；

对于Traj₁对应的上下车轨迹点对序列

RecPuPoSe₁＝{RecPuPo₁，RecPuPo₂，RecPuPo₃，RecPuPo₄，RecPuPo₅，RecPuPo₆}，其中，RecPuPo₁上下车轨的上车点(41.952349，87.624672)位于格网1中，下车点(41.942378，87.652781)位于格网2中，上车时间5:00对应的时间段为61，下车时间5:15对应时间段为64，则得到RecPuPo₁的时空离散的上下车轨迹点对NumPuPo₁＝{1，2016/2/19，1，61，2，64}；

进一步，得到上下车轨迹点对序列RecPuPoSe₁中RecPuPo₂～RecPuPo₆的时空离散的上下车轨迹点对；

NumPuPo₂＝{1，2016/2/19，5，65，6，69}，NumPuPo₃＝{1，2016/2/19，6，69，9，73}，

NumPuPo₄＝{1，2016/2/19，9，75，6，78}，NumPuPo₅＝{1，2016/2/19，6，78，3，85}，

NumPuPo₆＝{1，2016/2/19，3，85，2，87}；

最终，得到RecPuPoSe₁的时空离散的上下车轨迹点对序列

NumPuPoSe₁＝{NumPuPo₁，NumPuPo₂，NumPuPo₃，NumPuPo₄，NumPuPo₅，NumPuPo₆}

同理，可以得到对于Traj₂～Traj₄对应上下车轨迹点对序列RecPuPoSo₂～

RecPuPoSe₄的时空离散的上下车轨迹点对序列：

NumPuPoSe₂＝{NumPuPo₁，NumPuPo₂，NumPuPo₃，NumPuPo₄，NumPuPo₅}，其中，

NumPuPo₁＝{2，2016/2/19，4，61，5，65}，NumPuPo₂＝{2，2016/2/19，5，65，6，69}，

NumPmPo₃＝{2，2016/2/19，6，69，9，74}，NumPuPo₄＝{2，2016/2/19，9，75，3，85}，

NumPuPo₅＝{2，2016/2/19，3，85，2，90}；

NumPuPoSe₅＝{NumPuPo₁，NumPuPo₂，NumPuPo₃，NumPuPo₄，NumPuPo₅，NumPuPo₆}

其中，NumPuPo₁＝{3，2016/2/19，5，65，6，69}，NumPuPo₂＝{3，2016/2/19，3，72，5，75}，

NumPuPo₃＝{3，2016/2/19，5，75，6，79}，NumPuPo₄＝{3，2016/2/19，9，80，9，82}，

NumPuPo₅＝{3，2016/2/19，9，823，85}，NumPuPo₆＝{3，2016/2/19，3，85，2，87}；

NumPuPoSe₄＝{NumPuPo₁，NumPuPo₂，NumPuPo₃}，其中，

NumPuPo₁＝{4，2016/2/19，7，65，8，73}，NumPuPo₂＝{4，2016/2/19，9，75，3，85}，

NumPuPo₃＝{4，2016/2/19，2，87，5，90}.

NumPuPoSe₁～NumPuPoSe₄时空离散的上下车轨迹点对序列的空间分布如图2所示。步骤2、对频繁上下车模式进行挖掘，其包括如下步骤：

步骤2-1、构建上下车轨迹点对集合；

将所有时空离散的上下车轨迹点对序列中的上下车轨迹点对进行合并得到上下车轨迹点对集合。

本实例中，将NumPuPoSe₁～NumPuPoSe₄的上下车轨迹点对序列进行合并得到上下车轨迹点对集合NumPuPos＝{NumPuPo₁，NumPuPo₂，...，NumPuPo₂₀}，其中：

NumPuPo₁＝{1，2016/2/19，1，612，64}，NumPuPo₂＝{1，2016/2/19，5，65，6，69}，

NumPuPo₃＝{1，2016/2/19，6，69，9，73}，NumPuPo₄＝{1，2016/2/19，9，75，6，78}，

NumPuPo₅＝{1，2016/2/19，6，78，3，85}，NumPuPo₆＝{1，2016/2/19，3，85，2，87}，

NumaPuPo₇＝{2，2016/2/19，4，61，5，65}，NumPuPo₈＝{2，2016/2/19，5，65，6，69}，

NumPuPo₉＝{2，2016/2/19，6，69，9，74}，NumPuPo₁₀＝{2，2016/2/19，9，75，3，85}，

NumPuPo₁₁＝{2，2016/2/19，3，85，2，90}，NumPuPo₁₂＝{3，2016/2/19，5，65，6，69}，

NumPuPo₁₃＝{3，2016/2/19，3，72，5，75}，NumPuPo₁₄＝{3，2016/2/19，5，75，6，79}，

NumPuPo₁₅＝{3，2016/2/19，9，80，9，82}，NumPuPo₁₆＝{3，2016/2/19，9，82，3，85}，

NumPuPo₁₇＝{3，2016/2/19，3，85，2，87}，NumPuPo₁₈＝{4，2016/2/19，7，65，8，73}，

NumPuPo₁₉＝{4，2016/2/19，9，75，3，85}，NumPuPo₂₀＝{4，2016/2/19，2，87，5，90}。

步骤2-2、计算上车模式、下车模式、上下车模式的支持度；

以上下车轨迹点对集合中第一个上下车轨迹点对为起点，顺序、无重复计算集合中包含的所有上车模式、下车模式、上下车模式的支持度。

本实例中，首先，从第一个上下车轨迹点对NumPuPo₁＝{1，2016/2/19，1，61，2，64}得到上车模式U₁＝{1，61}、下车模式o₁＝{2，64}、上下车模式L₁＝{1，61，2，64}，并依据定义6分别计算NumPuPos对这些模式的支持度。

由于只有NumPuPo₁＝{1，2016/2/19，1，1，2，64}支持U₁＝{1，61}、o₁＝{2，64}、L₁＝{1，61，2，64}，也即是

因此，Support(NumPuPos，U₁＝{1，61})＝1、Support(NumPuPos，O₁＝{2，64})＝1、Support(NumPuPos，L₁＝{1，61，2，64})＝1；

然后，依次从其他上下车轨迹点NumPuPo₂～NumPuPo₂₀发现无重复的上车模式、下车模式以及上下车模式，并依据定义6计算NumPuPos对这些模式的支持度；具体信息为：

Support(NumPuPos，U₂＝{2，87})＝1、Support(NumPuPos，O₂＝{2，87})＝2、

Support(NumPuPos，L₂＝{2，87，5，90})＝1，

Support(NumPuPos，U₃＝{3，72})＝1、Support(NumPuPos，O₃＝{2，90})＝1、

Support(NumPuPos，L₃＝{3，72，5，75})＝1，

Support(NumPuPos，U₄＝{3，85})＝3.、Support(NumPuPos，O₄＝{3，85})＝4、

Support(NumPuPos，L₄＝{3，85，2，87})＝2，

Support(NumPuPos，U₅＝{4，61})＝1、Support(NumPuPos，O₅＝{5，65})＝1、

Suppor(NumPuPos，L₅＝{3，85，2，90})＝1，

Support(NumPuPos，U₆＝{5，65})＝３.、Support(NumPuPos，O₆＝{5，75})＝1

Support(NumPuPos，L₆＝{4，61，5，65})＝1，

Support(NumPuPos，U₇＝{5，75})＝1、Support({NumPuPos，O₇＝{5，90})＝1、

Support(NumPuPos，L₇＝{5，65，6，69})＝3，

Support(NumPuPos，U₈＝{6，69})＝2、Support(NumPuPos，O₈＝{6，69})＝3、

Suppor(NumPuPos，L₈＝{5，75，6，79})＝1，

Support(NumPuPos，U₉＝{6，78})＝1、Support(NumPuPos，O₉＝{6，78})＝1、

Suppor(NumPuPos，L₉＝{6，69，9，73})＝1，

Support(NumPuPos，U₁₀＝{7，65})＝1、Support(NumPuPos，O₁₀＝{6，79})＝1、

Support(NumPuPos，L₁₀＝{6，69，9，74})＝1，

Support(NumPuPos，U₁₁＝{9，75})＝3、Support(NumPuPos，O₁₁＝{8，73})＝1、

Support(NumPuPos，L₁₁＝{6，78，3，85})＝1，

Support(NumPuPos，U₁₂＝{9，80})＝1、Support(NumPuPos，O₁₂＝{9，73})＝1、

Support(NumPuPos，L₁₂＝{7，65，8，73})＝1，

Support(NumPuPos，U₁₃＝{9，82})＝1、Support(NumPuPos，O₁₃＝{9，74})＝1、

Support(NumPuPos，L₁₃＝{9，75，3，85})＝2，

Support(NumPuPos，O₁₄＝{9，82})＝1、Support(NumPuPos，L₁₄＝{9，75，6，78})＝1、

Support(NumPuPos，L₁₅＝{9，80，9，82})＝1，

Support(NumPuPos，L₁₆＝{9，82，3，85})＝1.，

步骤2-3、基于用户设定的支持度阈值得到频繁的上下车模式集合；

基于用户设定的支持度阈值，通过与步骤2-2中计算的上车模式、下车模式、上下车模式支持度的比较，得到频繁的上车模式集、下车模式集、上下车模式集；

本实例中，设定最小支持度阈值为2即σ_min＝2，并通过与步骤2-2中计算的上车模式、下车模式、上下车模式支持度的比较，得到频繁的上车模式集FUs＝{FU₁，FU₂，FU₃，FU₄}、频繁的下车模式集FOs＝{FO₁，FO₂，FO₃}、频繁的上下车模式集FLs＝{FL₁，FL₂，FL₃}；其中，FU₁＝{3，85}，FU₂＝{5，65}，FU₃＝{6，69}，FO₁＝{2，87}，FO₂＝{3，85}，FO₃＝{6，69}，FL₁＝{3，85，2，87}，FL₂＝{5，65，6，69}，FL₃＝{9，75，3，85}。

步骤3、基于整数规划的网约车轨迹数据中敏感上下车模式的隐藏，其具体步骤为：

基于用户的设定的敏感时空信息，从频繁的上下车模式集合得到敏感的频繁上下车模式集。

本实例中，依据用户设定的敏感时空信息，得到敏感的频繁的上车模式集FSenUs＝{FSenU₁}、频繁的下车模式集FSenOs＝{FSenO₁}、敏感的频繁的上下车模式集FSenLs＝{FSenL₁}，其中，FSenU₁＝{6，69}，FSenO₁＝{3，85}，FSenL₁＝{5，65，6，69}，其空间分布如图3所示；最终，得到敏感的频繁的上车、下车、上下车模式集合FSenUs、FSenOs、FSenLs的并集FSenUOLs＝{FSenUOL₁，FSenUOL₂，FSenUOL₃}，其中，FSenUOL₁＝{6，69}，FSenUOL₂＝{3，85}，FSenUOL₃＝{5，65，6，69}。

步骤3-2、计算敏感的频繁上下车模式集的支持矩阵；

从时空离散的上下车轨迹点对集合得到支持敏感的频繁上车、下车、上下车模式集合的上下车轨迹点对子集，并依据定义8，计算时空离散的上下车轨迹点对集合对敏感的频繁上车、下车、上下车模式集合的支持矩阵。

本实例中，首先，从时空离散的上下车轨迹点对集合得到

NumPuPos＝{NumPuPo₁，NumPuPo₂，…，NumPuPo₂₀}对于

FSenUOLs＝{FSenUOL₁，FSenUOL₂，FSenUOL₃}支持的上下车轨迹点对子集

NumPuPo′s＝[NumPuPo′₁，NumPuPo′₂，…，NumPuPo′₁₃}，其中：

NumPuPO₁＝NumPuPo₂，NumPuPo′₂＝NumPuPo₃，NumPuPo′₃＝NumPuPo′₄，NumPuPo′₄＝NumPuPo₅，NumPuPo′₅＝NumPuPo₆，NumPuPo′₆＝NumPuPo₈，NumPuPo′₇＝NumPuPo₉，NumPuPo′₈＝NumPuPo₁₀，NumPuPo′₉＝NumPuPo₁₁，NumPuPo′₁₀＝NumPuPo₁₂，NumPuPo′₁₁＝NumPuPo₁₆，NumPuPo′₁₂＝NumPuPo₁₇，NumPuPo′₁₃＝NumPuPo₁₉；

然后，并依据定义8，计算NumPuPos′对FSenUOLs的支持矩阵

其中，

因此cm_1，1＝0；而

因此cm_1，2＝1，

同理，计算得到：cm_1，3＝0，cm_1，4＝0，cm_1，5＝0，cm_1，6＝0，cm_1，7＝1，cm_1，8＝0，cm_1，9＝0，cm_1，10＝0，cm_1，11＝0，cm_1，12＝0，cm_1，13＝0；

进一步，计算得到：cm_2，1＝0，cm_2，2＝0，cm_2，3＝0，cm_2，4＝1，cm_2，5＝0，cm_2，6＝0，cm_2，7＝0，cm_2，8＝1，cm_2，9＝0，cm_2，10＝0，cm_2，11＝1，cm_2，12＝0，cm_2，13＝1；

cm_3，1＝1，cm_3，2＝0，cm_3，3＝0，cm_3，4＝1，cm_3，5＝0，cm_3，6＝1，cm_3，7＝0，cm_3，8＝0，cm_3，9＝0，cm_3，10＝1，cm_3，11＝0，em_3，12＝0，cm_3，13＝0；

最终，得到支持矩阵：

步骤3-3、基于整数规划实现敏感上下车模式的隐藏；

依据定义10，得到实现时空离散上下车轨迹点修改代价最小的整数规划公式，基于最优求解得到需要修改的时空离散的上下车轨迹点对，以及对应的原始轨迹信息。

本实例中，基于步骤3-2计算的支持矩阵CM，用户设定的最小支持度阈值σ_min＝2，以及为隐藏敏感模式FSenUOLs＝{FSenUOL₁，FSenUOL₂，FSenUOL₃}需要修改NumPuPo′s＝{NumPuPo′₁，NumPuPo′₂，…，NumPuPo′₃}的代价

得到整数规划：

min MCost

也即，

min(y₁+y₂+y₃+y₄+y₅+y₆+y₇+y₈+y₉+y₁₀+y₁₁+y₁₂+y₁₃)

进一步，依据NumPuPos′对敏感模式FSenUOL₁、FSenUOL₂、FSenUOL₃的支持度，分别为Support(NumPuPos′，FSenUOL₁＝{6，69})＝2、Support(NumPuPos′，FSenUOL₂＝{3，85})＝4、Support(NumPuPos′，FSenUOL₃＝{5，65，6，69})＝3，得到：

main(y₁+y₂+y₃+y₄+y₅+y₆+y₇+y₈+y₉+y₁₀+y₁₁+y₁₂+y₁₃)

进一步，依据支持矩CM中元素的取值得到：

s.t y₂+y₇≥1

y₄+y₈+y₁₁+y₁₃≥3

y₁+y₆+y₁₀≥2

最后，通过对整数规划公式的求解，得到y₄＝y₆＝y₇＝y₈＝y₁₀＝y₁₁＝1，y₁＝y₂＝y₃＝y₅＝y₉＝y₁₂＝y₁₃＝0。因此，只需要对支持敏感模式的上下车轨迹点对集合NumPuPos′中的NumPuPo′₄，NumPuPo′₆，NumPuPo′₇，NumPuPo′₈，NumPuPo′₁₀，NumPuPo′₁₁进行修改，也即只需要对支持敏感模式的上下车轨迹点对集合NumPuPo中的NumPuPo₅，NumPuPo₈，NumPuPo₉，NumPuPo₁₀，NumPuPo₁₂，NumPuPo₁₆进行修改。

依据敏感的上下车模式中的时空信息，对整数规划求解的需要修改的时空离散的上下车轨迹点对中包含的敏感项进行修改。

本实例中，依据敏感模式FSenUOLs＝{FSenUOL₁，FSenUOL₂，FSenUOL₃}中的时空信息，也即是：FSenUOL₁＝{6，69}FSenUOL₂＝{3，85}FSenUOL₃＝{5，65，6，69}，确定NumPuPo₅，NumPuPo₈，NumPuPo₉，NumPuPo₁₀，NumPuPo₁₂，NumPuPo₁₆中的移除最佳项。

具体地，对于NumPuPo₅只需要对其中敏感项集中的某一项或某几项进行修改，这里将FSenUOL₂＝{3，85}的第1项修改为*，即修改为{*，85}，最终得到修改后的时空离散的上下车轨迹点对M_NumPuPo₅＝{1，2016/2/19，6，78，*，85}。

同理，可对其他时空离散的上下车轨迹点对进行修改，具体信息如下：

M_NumPuPo₈＝{2，2016/2/19*，65，6，69}，

M_NumPuPo₉＝{2，2016/2/19，*，69，9，74}，

M_NumPuPo₁₀＝{2，2016/2/19，9，75，*，85}，

M_NumPuPo₁₂＝{3，2016/2/19，*，65，*，69}，

M_NumPuPo₁₆＝{3，2016/2/19，9，82，*，85}。

其空间分布如图5所示

步骤3-5、修改原始的上下车轨迹数据；

依据修改的时空离散的上下车轨迹点对信息，对原始的上下车轨迹信息进行修改。

本实例中，依据修改的时空离散的上下车轨迹点对

M_NumPuPo₅＝{1，2016/2/19，6，78，*，85}，匹配到RecPuPoSe₁中的

RecPuPo₅＝{1，2016/2/19，41.902812，87.683764，6:25，41.967718，87.686671，7:00}，对进行对应修改后得到

RecPuPoSe₁·M_RecPuPo₅＝{1，2016/2/19，41.902812，87.683764，6:25，*，*，7:00}。

同理，依据M_NumPuPo₈，M_NumPuPo₉，M_NumPuPo₁₀，M_NumPuPo₁₂，M_NumPuPo₁₆，分别匹配到RecPuPoSe₂中的RecPuPo₂＝{2，2016/2/19，41.909812，87.669323，5：20，41.908453，87.687532，5:40}，RecPuPo₃＝{2，2016/2/19，41.908453，87.687532，5:40，41.872671，87.682718，6:05}，RecPuPo₄＝{2，2016/2/19，41.862912，87.682839，6:10，41.959234，87.687683，7:00}。

RecPuPoSe₃中的RecPuPo₁＝{3，2016/2/19，41.886712，87.65267，15:20，41.898371，87.682712，5:40}，RecPuPo₅＝{3，2016/2/19，41.872671，87.677825，6:45，41.959988，87.680022，7:00}。

分别对进行对应修改后得到：

RecPuPoSe₂·M_RecPuPo₂＝{2，2016/2/19，*，*，5:20，41.908453，87.687532，5:40}，

RecPuPoSe₂·M_RecPuPo₃＝{2，2016/2/19，*，*，5:40，41.872671，87.682718，6:05}，

RecPuPoSe₂·M_RecPuPo₄＝{2，2016/2/19，41.862912，87.682839，6:10，*，*，7:00}，

RecPuPoSe₃·M_RecPuPo₁＝{3，2016/2/19，*，*，5:20，*，*，5:40}，

RecPuPoSe₃·M_RecPuPo₅＝{3，2016/2/19，41.872671，87.677825，6:45，*，*，7:00}。

进一步进行对应的原始上下车轨迹点修改，也即是分别对于Traj₁中的tp₁₀＝{7:00，off，41.967718，87.686671}，Traj₂中的tp₃＝{5:20，up，41.909812，87.669323}，tp₅＝{5:40，up，41.908999，87.689886}，tp₈＝{7:00，off，41.959234，87.687683}，Traj₃中的tp₁＝{5:20，up，41.886712，87.652671}，tp₂＝{5:40，off，41.898371，87.682712}，tp₁₀＝{7:00，off，41.959988，87.680022}进行修改。

对应地得到，

M_Traj₁_tp₁₀＝{7:00，off，*，*}，M_Traj₂_tp₃＝{5:20，up，*，*}，

M_Traj₂_tp₅＝{5:40，up，*，*}，M_Traj₂_tp₈＝{7:00，off，*，*}，

M_Traj₃_tp₁＝{5:20，up，*，*}，M_Traj₃_tp₂＝{5:40，off，*，*}，

M_Traj₃_tp₁₀＝{7:00，off，*，*}；

最终得到修改后的轨迹分别是：

其空间分布如图6所示。

以上所述仅为本发明的优选方案，并非作为对本发明的进一步限定，凡是利用本发明说明书及附图内容所作的各种等效变化均在本发明的保护范围之内。

Claims

1.一种基于整数规划的敏感上下车模式的隐藏方法，其特征在于，所述方法的步骤为：

步骤1、对网约车轨迹数据进行预处理；

步骤2-2、对上下车轨迹点对序列中时空信息进行离散，得到时空离散的上下车轨迹点对序列；

步骤2、对频繁上下车模式进行挖掘；

步骤2-1、构建上下车轨迹点对集合；

步骤2-2、计算上车模式、下车模式、上下车模式的支持度；

步骤3、对网约车轨迹数据中敏感上下车模式进行隐藏；

步骤3-2、计算敏感的频繁上下车模式集的支持矩阵；

步骤3-3、基于整数规划实现敏感上下车模式的隐藏；

所述整数规划定义为：给定一个无重复的时空离散的上下车轨迹点对集合NumPuPos＝{NumPuPo₁，NumPuPo₂，…，NumPuPo_n}，从中挖掘分析得到的敏感的频繁的上车、下车、上下车模式集合FSenUs、FSenOs、FSenLs的并集FSenUOLs＝{FSenUOL₁，FSenUOL₂，…，FSenUOL_m}，1≤m≤n，以及支持FSenUOLs中元素NumPuPos的子集为NumPuPos′＝{NumPuPo′₁，NumPuPo′₂，…，NumPuPo′_k}，以及实现其敏感频繁模式隐藏的支持矩阵

修改的代价，

则实现优化隐藏的整数规划定义为：

min MCost

其中，Support(NumPuPos，FSenUOL_i)表示NumPuPos对FSenUOL_i的支持度，min MCost表示用户设定的支持度阈值，σ_min为用户设定的最小支持度阈值；其中，

依据上述整数规划的定义，得到实现时空离散上下车轨迹点修改代价最小的整数规划公式，基于最优求解得到需要修改的时空离散的上下车轨迹点对，以及对应的原始轨迹信息；

依据敏感的上下车模式中的时空信息，对整数规划求解的需要修改的时空离散的上下车轨迹点对中包含的敏感项进行修改；

步骤3-5、修改原始的上下车轨迹数据。