CN109977324B - 一种兴趣点挖掘方法及系统 - Google Patents

一种兴趣点挖掘方法及系统 Download PDF

Info

Publication number
CN109977324B
CN109977324B CN201910241403.8A CN201910241403A CN109977324B CN 109977324 B CN109977324 B CN 109977324B CN 201910241403 A CN201910241403 A CN 201910241403A CN 109977324 B CN109977324 B CN 109977324B
Authority
CN
China
Prior art keywords
user
recommendation list
interest
data set
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910241403.8A
Other languages
English (en)
Other versions
CN109977324A (zh
Inventor
张琳
金超
李丽
徐小龙
付雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN201910241403.8A priority Critical patent/CN109977324B/zh
Publication of CN109977324A publication Critical patent/CN109977324A/zh
Application granted granted Critical
Publication of CN109977324B publication Critical patent/CN109977324B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种兴趣点挖掘方法及系统,根据原始轨迹数据集构建聚类兴趣点,根据聚类兴趣点获取用户‑位置二分图,然后转换为对应的关联矩阵,通过在隐私阈值范围内调节表征用户隐私安全性大小的隐私预算
Figure 967236DEST_PATH_IMAGE001
以设置噪声
Figure 843925DEST_PATH_IMAGE002
,将噪声
Figure 728704DEST_PATH_IMAGE002
加入所述关联矩阵中的每一项,获取扰动关联矩阵,将扰动关联矩阵作为输入,使用HITS算法,生成用户推荐列表和位置推荐列表供查询用户进行兴趣点查询;本发明在保证用户隐私安全的同时,对用户的兴趣点进行挖掘,为兴趣点查询用户提供了一种准确性高的兴趣点查询服务。

Description

一种兴趣点挖掘方法及系统
技术领域
本发明涉及一种兴趣点挖掘方法及系统,属于数据挖掘技术领域。
背景技术
随着移动定位设备的快速增长和高速无线网络的广泛使用,基于位置的服务(LBS),包括基于位置的社交网络、基于位置的广告、基于位置的信息共享等被广泛应用。轨迹由一系列<经度,纬度,时间戳>三元组表示的位置信息构成,其蕴含着用户的移动目的地、移动路径以及移动模式等信息。服务后端通过收集大规模不同移动用户的历史轨迹数据,并加以处理与挖掘,可以提供给用户准确且有用的兴趣点推荐服务,例如,某个城市的前10个兴趣点在哪里,哪个购物中心在这个地区最受欢迎,以及哪些用户经常访问这家餐厅等。
然而,敏感轨迹数据的暴露可能造成隐私信息的泄露。具体地,表示为二维坐标的位置信息通常与语义含义相关联,例如酒吧、商场或医院等。例如,如果攻击者推断用户和医院相关联,则可以知晓用户的健康状态。因此,保护隐私的轨迹挖掘是一个具有挑战性的问题。但是,通过研究隐私保护制约机理表明,数据挖掘与隐私保护存在利益的矛盾,对数据进行隐私保护处理,势必降低数据挖掘效果。因此,如何权衡两者利益,在保护隐私信息的同时,尽可能提高数据挖掘的效果是进一步亟待解决的问题。
发明内容
本发明的目的在于提供一种兴趣点挖掘方法及系统,以解决现有技术中导致的上述多项缺陷或缺陷之一。
为达到上述目的,本发明是采用下述技术方案实现的:
第一方面,本发明提供了一种兴趣点挖掘方法,方法包括如下步骤:
步骤1:根据用户轨迹数据集,构建聚类兴趣点数据集,根据聚类兴趣点数据集,构建用户-位置二分图,将用户-位置二分图转换为关联矩阵;
步骤2:在关联矩阵中的每一项添加服从拉普拉斯分布的噪声
Figure BDA0002009782700000021
获取扰动关联矩阵;其中Δf为全局敏感度,ε为隐私预算,所述隐私预算ε满足隐私阈值要求;
步骤3:根据关联矩阵和HITS算法,获取未加噪声的用户推荐列表和位置推荐列表;根据扰动关联矩阵和HITS算法,获取加入噪声的用户推荐列表和位置推荐列表;
步骤4:根据未加噪声的用户推荐列表和位置推荐列表、加入噪声的用户推荐列表和位置推荐列表,计算匹配度;若匹配度满足设定的匹配度阈值,转入步骤5;若匹配度不满足设定的匹配度阈值,则转入步骤2,通过调整全局敏感度Δf和隐私预算ε,重新设置噪声
Figure BDA0002009782700000022
步骤5:将匹配度满足匹配度阈值的加入噪声的用户推荐列表和位置推荐列表保存至数据库供查询用户查询。
进一步的,方法还包括采集包含用户位置信息和与所述位置信息对应的时刻信息的轨迹数据,构建用户原始轨迹数据集。
进一步的,计算匹配度MR(A)的方法包括:
Figure BDA0002009782700000031
其中,ori(A)表示未加噪声的用户推荐列表和位置推荐列表,noi(A)表示加入噪声的用户推荐列表和位置推荐列表,A表示用户-位置二分图中的用户组和位置组取并集。
构建聚类兴趣点数据集的方法包括如下步骤:
根据用户原始轨迹数据集,构建兴趣点数据集;所述兴趣点数据集中的数据包括用户信息、用户的位置信息和与所述位置信息对应的时刻信息;
采用DBSCAN聚类算法对兴趣点数据集进行聚类分析形成多个聚簇,每个聚簇用该聚簇的中心点的位置信息表示,并用中心点的Id作为该聚簇的唯一标识,并且统计各用户访问该聚簇的频率,构建聚类兴趣点数据集。
所述用户-位置二分图的数据结构ULBG=(U,L,E),其中U={ui|1≤i≤m}表示用户节点组,L={lj|1≤j≤n}表示位置节点组,E={(ui,lj,wij)|1≤i≤m,1≤j≤n}表示边的访问集;其中,ui表示用户i的Id,lj表示兴趣点j的Id,wij表示用户i访问兴趣点j的频率。
关联矩阵包含|U|行、|L|列,关联矩阵中的元素为用户i访问兴趣点j的频率wij
另一方面,本发明提供了一种兴趣点挖掘系统,系统包括:
第一获取模块:用于根据用户轨迹数据集,构建聚类兴趣点数据集,根据聚类兴趣点数据集,构建用户-位置二分图,将用户-位置二分图转换为关联矩阵;
第二获取模块:用于在关联矩阵中的每一项添加服从拉普拉斯分布的噪声
Figure BDA0002009782700000041
获取扰动关联矩阵;其中Δf为全局敏感度,ε为隐私预算,所述隐私预算ε满足设定隐私阈值要求;
第三获取模块:用于根据关联矩阵和HITS算法,获取未加噪声的用户推荐列表和位置推荐列表;根据扰动关联矩阵和HITS算法,获取加入噪声的用户推荐列表和位置推荐列表;
数据处理模块:用于根据未加噪声的用户推荐列表和位置推荐列表、加入噪声的用户推荐列表和位置推荐列表,计算匹配度;若匹配度满足设定的匹配度阈值,转入存储模块处理;若匹配度不满足设定的匹配度阈值,则转入第二获取模块处理,通过调整全局敏感度Δf和隐私预算ε,重新设置噪声
Figure BDA0002009782700000042
存储模块:用于将满足匹配度的加入噪声的用户推荐列表和位置推荐列表保存至数据库供查询用户查询。
进一步的,系统还包括用于采集包含用户位置信息和与所述位置对应的时刻信息的轨迹数据,构建用户原始轨迹数据集的构建模块。
第一获取模块还包括用于构建聚类兴趣点数据集的第一构建模块,所述构建模块包括:
第二构建模块:用于根据用户原始轨迹数据集,构建兴趣点数据集;所述兴趣点数据集中的数据包括用户信息、用户的位置信息和与所述位置信息对应的时刻信息;
第三构建模块:用于采用DBSCAN聚类算法对兴趣点数据集进行聚类分析形成多个聚簇,每个聚簇用该聚簇的中心点的位置信息表示,并用中心点的Id作为该聚簇的唯一标识,并且统计各用户访问该聚簇的频率,构建聚类兴趣点数据集。
本发明提供的一种兴趣点挖掘方法及系统,将用户原始轨迹数据集转换为用户-位置二分图,然后转化为对应的关联矩阵,并加入拉普拉斯噪声以获取扰动关联矩阵,根据扰动关联矩阵,使用HITS算法生成安全性和可用性满足要求的用户推荐列表和位置推荐列表供查询用户查询。
附图说明
图1是根据本发明实施例提供的一种轨迹数据迁移图;
图2是根据本发明实施例提供的一种兴趣点挖掘方法流程图;
图3是根据本发明实施例提供的一种用户-位置二分图的结构图;
图4是根据本发明实施例提供的一种兴趣点挖掘的服务构架图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本实施例提供一种兴趣点挖掘方法,参照图1和图2,方法包括如下步骤:
步骤1:数据采集:
采集用户轨迹数据,构建用户原始轨迹数据集,原始数据集包含多个用户的轨迹数据;每个用户的轨迹数据由多个<经度,纬度,时间戳>三元组构成,表示用户的位置信息和与所述位置信息对应的时刻信息;用户轨迹数据是由GPS设备离散捕获。
步骤2:构建用户-位置二分图,将用户-位置二分图转换为关联矩阵:
步骤21:构建兴趣点数据集
根据步骤1中构建的用户原始轨迹数据集,构建兴趣点数据集;应当清楚的是,不是捕捉到的用户的所有位置点都是兴趣点,兴趣点表示在一个距离阈值Dt内停留的时间大于等于时间阈值Tt的空间区域;而用户原始轨迹数据集中有的位置点只是用户经过时被捕捉到的,不属于兴趣点,因此需要对用户原始轨迹数据集中的轨迹数据进行筛选,选取兴趣点,兴趣点的选取方法包括:当第k个轨迹数据{(xk,yk,tk)|a≤k≤b}满足
Figure BDA0002009782700000061
Figure BDA0002009782700000062
tb-ta≥Tt (3)
时,称第k个轨迹数据(xk,yk,tk)为兴趣点数据,其中,xk表示用户在时刻tk时所处位置k的经度坐标,yk表示用户在时刻tk时所处位置的纬度坐标;xa表示用户在时刻ta时所处位置的经度坐标,ya表示用户在时刻ta时所处位置的纬度坐标;xb+1表示用户在时刻tb+1时所处位置的经度坐标,yb+1表示用户在时刻tb+1时所处位置的纬度坐标,ta表示采集用户原始轨迹数据的起点位置a对应的时刻,tb表示采集用户原始轨迹数据的终点位置b对应的时刻;
步骤22:构建聚类兴趣点数据集
采用DBSCAN算法对根据步骤21获取的兴趣点集进行聚类分析,形成的每个聚簇用该聚簇的中心点的位置信息表示,并用中心点的Id作为该聚簇的唯一标识,每个聚簇中心点的位置关联一个对应的地理标签,包括旅游景点、购物中心;统计各用户访问该聚簇的频率,用户访问该聚簇的频率表示用户访问与所述聚簇对应的兴趣点的频率,用于构建聚类兴趣点数据集,聚类兴趣点包含用户Id、兴趣点Id以及用户访问兴趣点的频率信息;
步骤21和步骤22是对数据预清洗过程,以获取待处理数据集。
步骤23:构建用户-位置二分图;
根据用户和位置之间的访问关系,生成用户-位置二分图,用户-位置二分图的结构参照图3,由用户指向位置的箭头表示用户访问该位置,箭头上的权值表示该用户多次访问该位置,访问的频率越高表示用户对该位置的推荐越高;
用户-位置二分图的数据结构ULBG=(U,L,E),其中U={ui|1≤i≤m}表示用户节点组,L={lj|1≤j≤n}表示位置节点组,E={(ui,lj,wij)|1≤i≤m,1≤j≤n}表示边的访问集,ui表示用户i的Id,lj表示兴趣点j的Id,wij表示用户i访问兴趣点j的频率。
步骤24:获取关联矩阵
将用户-位置二分图转换为关联矩阵M[i][j];所述关联矩阵包含|U|行、|L|列,矩阵中每一项为用户i和兴趣点j之间的边权重,所述边权重等于用户i访问兴趣点j的频率wij,如果用户ui从未访问位置lj,将wij设置为0。
步骤3:获取扰动关联矩阵
应当清楚的是,差分隐私技术能确保公布的统计数据不依赖于数据中某个记录的存在与否,从而达到保护隐私的效果。本方案中需要保护的是用户-位置二分图,根据步骤23构建的用户-位置二分图数据结构,图中的一条边(ui,lj,1)相当于是一条记录,用户-位置二分图中共包含
Figure BDA0002009782700000081
条记录;
本实施例通过拉普拉斯机制来保证差分隐私,实现方法是向根据步骤24获取的关联矩阵中的每一项添加服从拉普拉斯分布的噪声
Figure BDA0002009782700000082
获取扰动关联矩阵
Figure BDA0002009782700000083
Figure BDA0002009782700000084
其中Δf为全局敏感度,用于衡量聚类兴趣点数据集中单个记录变化可能导致的最大影响,全局敏感度Δf满足设定的全局敏感度阈值;ε为隐私预算,隐私预算ε用于衡量对用户隐私保护的安全性,隐私预算ε满足隐私阈值要求;
步骤4:获取加入噪声的用户推荐列表和位置推荐列表
一个良好的Hub页面会指向许多优秀的Authority页面,许多优秀的Hub页面会指向一个良好的Authority页面,通过类比,将根据步骤23构建的用户-位置二分图的用户视为Hub页面,将位置视为Authority页面,使用HITS算法对每个用户和位置进行评分,得分较高的用户表示更有经验、对兴趣点推荐比较可靠的用户,得分较高的位置表示更值得访问的兴趣点;
本实施例提供的方案,将根据步骤24获取的经用户-位置二分图转换得到的关联矩阵作为输入,使用HITS算法,得到未加噪声的用户推荐列表和位置推荐列表;将根据步骤3获取的扰动关联矩阵作为输入,使用HITS算法,获取加入噪声的用户推荐列表和位置推荐列表;用户推荐列表包括对用户按对应评分的升序排列,位置推荐列表包括对位置按对应位置评分的升序排列。
步骤5:可用性评估
为保证用户的隐私保护和兴趣点推荐结果准确性,对生产的推荐列表进行可用性评估:
根据上述步骤,通过在关联矩阵中加入噪声获取扰动关联矩阵,根据扰动关联矩阵获取的加入噪声的用户推荐列表和位置推荐列表,达到对采集原始轨迹数据的用户隐私保护的目的,但应当清楚的是,加入噪声越高,推荐结果的准确性越低,兴趣点挖掘的可用性越低,为了权衡安全性和准确性,需要计算推荐的用户列表、位置列表的匹配度,计算匹配度MR(A)的方法包括:
Figure BDA0002009782700000091
其中,ori(A)表示未加噪声的用户推荐列表和位置推荐列表,noi(A)表示加入噪声的用户推荐列表和位置推荐列表,A=Urec∪Lrec,表示用户-位置二分图的用户组和位置组取并集,其中Urec表示用户组,Lrec表示位置组:
Urec={u,score(u)|score(ui)≥score(uj),1≤i<j≤|U|} (6)
Lrec={l,score(l)|score(li)≥score(lj),1≤i<j≤|L|} (7)
若匹配度MR(A)满足设定的匹配度阈值,转入步骤6;
若匹配度不满足设定的匹配度阈值,则转入步骤3,通过调整全局敏感度Δf和隐私预算ε,重新设置噪声
Figure BDA0002009782700000101
在调整Δf和隐私预算ε的过程中,要保证Δf满足设定的全局敏感度阈值,隐私预算ε满足隐私阈值要求;
隐私预算ε用于控制算法在邻近数据集上获得相同输出的概率比值,反映隐私保护水平,隐私预算ε越小,隐私保护水平越高,需要添加的噪声越高,从而导致匹配度MR越低。Δf表示数据集中的单个记录的变化引起的统计查询结果之间的差异,Δf越小,需要添加的噪声越低,从而导致匹配度MR越高。
步骤6:将满足匹配度的加入噪声的用户推荐列表和位置列表保存至数据库供查询用户查询,根据查询用户的查询信息,向查询用户推荐和查询信息匹配的用户推荐列表和位置推荐列表。
本发明实施例还提供了一种兴趣点挖掘系统,用于实现上述兴趣点挖掘方法,系统包括:
用于根据用户原始轨迹数据集,构建用户-位置二分图,将用户-位置二分图转换为关联矩阵的第一获取模块;
用于在关联矩阵中的每一项添加服从拉普拉斯分布的噪声
Figure BDA0002009782700000102
获取扰动关联矩阵;其中Δf为全局敏感度,ε为隐私预算,所述隐私预算ε满足设定隐私阈值要求的第二获取模块;
用于根据关联矩阵和HITS算法,获取未加噪声的用户推荐列表和位置推荐列表;根据扰动关联矩阵和HITS算法,获取加入噪声的用户推荐列表和位置推荐列表的第三获取模块;
用于根据未加噪声的用户推荐列表和位置推荐列表、加入噪声的用户推荐列表和位置推荐列表,计算匹配度;若匹配度满足设定的匹配度阈值,转入存储模块处理;若匹配度不满足设定的匹配度阈值,则转入第二获取模块处理,通过调整全局敏感度Δf和隐私预算ε,重新设置噪声的数据处理模块;
用于将满足匹配度的加入噪声的用户推荐列表和位置列表保存至数据库供查询用户查询的存储模块。
进一步的,系统还包括用于采集包含用户位置信息和与所述位置对应的时刻信息的轨迹数据,构建用户原始轨迹数据集的构建模块。
第一获取模块还包括用于构建用户-位置二分图的第一构建模块,所述构建模块包括:
第二构建模块:用于根据用户原始轨迹数据集,构建兴趣点数据集;所述兴趣点数据集包括用户信息、位置信息和时刻信息;
第三构建模块:用于采用DBSCAN聚类算法对兴趣点数据集进行聚类分析形成多个聚簇,并且统计各用户访问该聚簇的频率,构建聚类兴趣点数据集;
第四构建模块:用于根据聚类兴趣点数据集,构建用户位置二分图。
本发明实施例提供的一种兴趣点挖掘方法及系统,将用户原始轨迹数据集转换为用户-位置二分图,然后转化为对应的关联矩阵,并加入噪声
Figure BDA0002009782700000121
获取扰动关联矩阵,根据扰动关联矩阵,使用HITS算法生成加入噪声的用户推荐列表和加入噪声的位置推荐列表供查询用户查询,通过调节噪声中全局敏感度Δf和隐私预算ε的大小,调节生成的加入噪声的用户推荐列表和加入噪声的位置推荐列表的准确性,在调节噪声的过程中,保证隐私预算ε符合设定隐私阈值,以保证对用户的隐私保护,本发明实施例提供了一种准确性高的兴趣点挖掘方法,并保证了用户的隐私安全,本发明提供的兴趣点挖掘方法及系统可用于向兴趣点查询用户推荐兴趣点。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (9)

1.一种兴趣点挖掘方法,其特征在于,所述方法包括如下步骤:
步骤1:根据用户轨迹数据集,构建聚类兴趣点数据集,根据聚类兴趣点数据集,构建用户-位置二分图,将用户-位置二分图转换为关联矩阵;
步骤2:在关联矩阵中的每一项添加服从拉普拉斯分布的噪声
Figure FDA0002009782690000011
获取扰动关联矩阵;其中Δf为全局敏感度,ε为隐私预算,所述隐私预算ε满足隐私阈值要求;
步骤3:根据关联矩阵和HITS算法,获取未加噪声的用户推荐列表和位置推荐列表;根据扰动关联矩阵和HITS算法,获取加入噪声的用户推荐列表和位置推荐列表;
步骤4:根据未加噪声的用户推荐列表和位置推荐列表、加入噪声的用户推荐列表和位置推荐列表,计算匹配度;若匹配度满足设定的匹配度阈值,转入
步骤5;若匹配度不满足设定的匹配度阈值,则转入步骤2,通过调整全局敏感度Δf和隐私预算ε,重新设置噪声
Figure FDA0002009782690000012
步骤5:将匹配度满足匹配度阈值的加入噪声的用户推荐列表和位置推荐列表保存至数据库供查询用户查询。
2.根据权利要求1所述的兴趣点挖掘方法,其特征在于,所述方法还包括:采集包含用户位置信息和与所述位置信息对应的时刻信息的轨迹数据,构建用户原始轨迹数据集。
3.根据权利要求1所述的兴趣点挖掘方法,其特征在于,所述计算匹配度MR(A)的方法包括:
Figure FDA0002009782690000021
其中,ori(A)表示未加噪声的用户推荐列表和位置推荐列表,noi(A)表示加入噪声的用户推荐列表和位置推荐列表,A表示用户-位置二分图中的用户组和位置组取并集。
4.根据权利要求1所述的兴趣点挖掘方法,其特征在于,所述构建聚类兴趣点数据集的方法包括如下步骤:
根据用户原始轨迹数据集,构建兴趣点数据集;所述兴趣点数据集中的数据包括用户信息、用户的位置信息和与所述位置信息对应的时刻信息;
采用DBSCAN聚类算法对兴趣点数据集进行聚类分析形成多个聚簇,每个聚簇用该聚簇的中心点的位置信息表示,并用中心点的Id作为该聚簇的唯一标识,统计各用户访问该聚簇的频率,构建聚类兴趣点数据集。
5.根据权利要求1所述的兴趣点挖掘方法,其特征在于,所述用户-位置二分图的数据结构ULBG=(U,L,E),其中U={ui|1≤i≤m}表示用户节点组,L={lj|1≤j≤n}表示位置节点组,E={(ui,lj,wij)|1≤i≤m,1≤j≤n}表示边的访问集;其中,ui表示用户i的Id,lj表示兴趣点j的Id,wij表示用户i访问兴趣点j的频率。
6.根据权利要求5所述的兴趣点挖掘方法,其特征在于,所述关联矩阵包含|U|行、|L|列,关联矩阵中的元素为用户i访问兴趣点j的频率wij
7.一种兴趣点挖掘系统,其特征在于,所述系统包括:
第一获取模块:根据用户轨迹数据集,构建聚类兴趣点数据集,根据聚类兴趣点数据集,构建用户-位置二分图,将用户-位置二分图转换为关联矩阵;
第二获取模块:用于在关联矩阵中的每一项添加服从拉普拉斯分布的噪声
Figure FDA0002009782690000031
获取扰动关联矩阵;其中Δf为全局敏感度,ε为隐私预算,所述隐私预算ε满足设定隐私阈值要求;
第三获取模块:用于根据关联矩阵和HITS算法,获取未加噪声的用户推荐列表和位置推荐列表;根据扰动关联矩阵和HITS算法,获取加入噪声的用户推荐列表和位置推荐列表;
数据处理模块:用于根据未加噪声的用户推荐列表和位置推荐列表、加入噪声的用户推荐列表和位置推荐列表,计算匹配度;若匹配度满足设定的匹配度阈值,转入存储模块处理;若匹配度不满足设定的匹配度阈值,则转入第二获取模块处理,通过调整全局敏感度Δf和隐私预算ε,重新设置噪声
Figure FDA0002009782690000032
存储模块:用于将匹配度满足匹配度阈值的加入噪声的用户推荐列表和位置推荐列表保存至数据库供查询用户查询。
8.根据权利要求7所述的兴趣点挖掘系统,其特征在于,所述系统还包括用于采集包含用户位置信息和与所述位置对应的时刻信息的轨迹数据,构建用户原始轨迹数据集的构建模块。
9.根据权利要求7所述的兴趣点挖掘系统,其特征在于,所述第一获取模块还包括用于构建聚类兴趣点数据集的第一构建模块,所述构建模块包括:
第二构建模块:用于根据用户原始轨迹数据集,构建兴趣点数据集;所述兴趣点数据集中的数据包括用户信息、用户的位置信息和与所述位置信息对应的时刻信息;
第三构建模块:用于采用DBSCAN聚类算法对兴趣点数据集进行聚类分析形成多个聚簇,每个聚簇用该聚簇的中心点的位置信息表示,并用中心点的Id作为该聚簇的唯一标识,统计各用户访问该聚簇的频率,构建聚类兴趣点数据集。
CN201910241403.8A 2019-03-28 2019-03-28 一种兴趣点挖掘方法及系统 Active CN109977324B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910241403.8A CN109977324B (zh) 2019-03-28 2019-03-28 一种兴趣点挖掘方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910241403.8A CN109977324B (zh) 2019-03-28 2019-03-28 一种兴趣点挖掘方法及系统

Publications (2)

Publication Number Publication Date
CN109977324A CN109977324A (zh) 2019-07-05
CN109977324B true CN109977324B (zh) 2022-09-16

Family

ID=67080990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910241403.8A Active CN109977324B (zh) 2019-03-28 2019-03-28 一种兴趣点挖掘方法及系统

Country Status (1)

Country Link
CN (1) CN109977324B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020130082A1 (ja) * 2018-12-20 2020-06-25 日本電信電話株式会社 分析クエリ応答システム、分析クエリ実行装置、分析クエリ検証装置、分析クエリ応答方法及びプログラム
CN110300029B (zh) * 2019-07-06 2021-11-30 桂林电子科技大学 一种防边权攻击和位置语义攻击的位置隐私保护方法
CN113438603B (zh) * 2021-03-31 2024-01-23 南京邮电大学 一种基于差分隐私保护的轨迹数据发布方法及系统
CN116992488B (zh) * 2023-09-26 2024-01-05 济南三泽信息安全测评有限公司 一种差分隐私保护方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140025538A1 (en) * 2012-07-19 2014-01-23 Avinash Kalgi Dual Encoding of Machine Readable Code for Automatic Scan-Initiated Purchase or Uniform Resource Locator Checkout
CN106960044A (zh) * 2017-03-30 2017-07-18 浙江鸿程计算机系统有限公司 一种基于张量分解及加权hits的时间感知个性化poi推荐方法
CN107491557A (zh) * 2017-09-06 2017-12-19 徐州医科大学 一种基于差分隐私的TopN协同过滤推荐方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140025538A1 (en) * 2012-07-19 2014-01-23 Avinash Kalgi Dual Encoding of Machine Readable Code for Automatic Scan-Initiated Purchase or Uniform Resource Locator Checkout
CN106960044A (zh) * 2017-03-30 2017-07-18 浙江鸿程计算机系统有限公司 一种基于张量分解及加权hits的时间感知个性化poi推荐方法
CN107491557A (zh) * 2017-09-06 2017-12-19 徐州医科大学 一种基于差分隐私的TopN协同过滤推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
位置大数据服务中基于差分隐私的数据发布技术;张琳等;《通信学报》;20160930;全文 *

Also Published As

Publication number Publication date
CN109977324A (zh) 2019-07-05

Similar Documents

Publication Publication Date Title
CN109977324B (zh) 一种兴趣点挖掘方法及系统
JP6254583B2 (ja) 動的言語モデル
Yuan et al. Measuring similarity of mobile phone user trajectories–a Spatio-temporal Edit Distance method
Roick et al. L ocation B ased S ocial N etworks–Definition, Current State of the Art and Research Agenda
US9730028B2 (en) Systems and methods to identify home addresses of mobile devices
US20060058958A1 (en) Proximity search methods using tiles to represent geographical zones
CN103493044B (zh) 使用在区域中的3d模型活动对场所排名的扩展
Liu et al. Characterizing mixed-use buildings based on multi-source big data
AU2010245847B2 (en) Refining location estimates and reverse geocoding based on a user profile
US8838586B2 (en) Relevancy ranking for map-related search
US9838847B2 (en) Data driven evaluation and rejection of trained Gaussian process-based wireless mean and standard deviation models
CN111212383B (zh) 区域常住人口数量的确定方法、装置、服务器和介质
CN105243148A (zh) 一种基于签到数据的时空轨迹相似性度量方法及系统
US9880257B2 (en) Gaussian process-based approach for identifying correlation between wireless signals
US20230031543A1 (en) Determining Geographic Locations of Network Devices
CN108256117A (zh) 方法、计算机可读非易失性存储介质和系统
Uddin et al. On diversifying source selection in social sensing
CN109672980A (zh) 确定兴趣点对应的无线局域网热点的方法、装置及存储介质
Li et al. Differentially private trajectory analysis for points-of-interest recommendation
CN107395680A (zh) 店铺群信息推送和输出方法及装置、设备
Xia et al. Decision tree-based contextual location prediction from mobile device logs
Cao et al. Understanding metropolitan crowd mobility via mobile cellular accessing data
CN109902512A (zh) 一种空间数据集的差分隐私的隐私保护方法
CN107291784B (zh) 地理围栏类别的获取方法、装置及业务设备
US9591454B2 (en) Computational complexity reduction of training wireless strength-based probabilistic models from big data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant