CN105718460A - 一种基于历史定位信息的数据挖掘方法及装置 - Google Patents

一种基于历史定位信息的数据挖掘方法及装置 Download PDF

Info

Publication number
CN105718460A
CN105718460A CN201410721294.7A CN201410721294A CN105718460A CN 105718460 A CN105718460 A CN 105718460A CN 201410721294 A CN201410721294 A CN 201410721294A CN 105718460 A CN105718460 A CN 105718460A
Authority
CN
China
Prior art keywords
user
place
determined
location point
location
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410721294.7A
Other languages
English (en)
Inventor
杨海军
安华明
王铁军
赵礼剑
朱熙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Navinfo Co Ltd
Original Assignee
Navinfo Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Navinfo Co Ltd filed Critical Navinfo Co Ltd
Priority to CN201410721294.7A priority Critical patent/CN105718460A/zh
Publication of CN105718460A publication Critical patent/CN105718460A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于历史定位信息的数据挖掘方法及装置。方法包括:获取用户的历史定位信息;根据所述历史定位信息,确定所述用户的常去场所以及在所述常去场所的出现时间;根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息。本发明的方案根据用户的历史定位信息确定出用户的常去场所以及在常去场所的时间,从而能够挖掘出常去场所针对用户的语义信息。由于确定出的语音信息对用户来讲具有针对性,因此可以用于对用户进行如广告、通知等信息推广的依据,从而使用户得到更好的体验。

Description

一种基于历史定位信息的数据挖掘方法及装置
技术领域
本发明涉及数据挖掘领域,特别是一种基于历史定位信息的数据挖掘方法及装置。
背景技术
随着计算机技术、通信技术以及各种其他多媒体传输技术的发展,信息提供方式变得愈加多种多样。而针对用户的生活习惯,有目的地向用户推送信息是最有效、最合理的方法。
通过用户的历史定位信息能够一定程度上了解用户的生活习惯,因此当前亟需一种基于用户历史定位信息进行数据挖掘的方案。
发明内容
本发明要解决的技术问题是提供一种基于历史定位信息的数据挖掘方法及装置,能够根据用户的历史定位信息挖掘出对信息推送具有参考价值的信息。
为解决上述技术问题,本发明的实施例提供一种基于历史定位信息的数据挖掘方法,包括:
获取用户的历史定位信息;
根据所述历史定位信息,确定所述用户的常去场所以及在所述常去场所的出现时间;
根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息。
其中,根据所述历史定位信息,确定所述用户的常去场所,包括:
根据所述历史定位信息,确定用户在地图数据中,出现过的多个位置点;
通过基于密度的聚类分析法,在所有位置点中,确定用户的常去区域;
根据地图数据,确定用户的常去区域所对应的场所,并将该场所作为用户的常去场所;
其中,通过基于密度的聚类分析法,在所述多个位置点中,确定用户的常去区域,包括:
以位置点为中心,分别针对每个位置点,确定一第一预设范围的位置区域;
将包含位置点最多、且位置点数量≥第一预设阈值的一个位置区域确定为用户的常去区域;
保存常去区域内所有的位置点,并对距该常去区域的中心点预设距离之内的所有位置点进行过滤;
基于过滤后剩余的位置点,重新确定用户另一个常去区域,直至用户的所有常去区域全部确认完毕。
其中,根据所述历史定位信息,确定用户对应于常去场所的出现时间,包括:
根据所述历史定位信息,确定用户出现在常去场所的多个位置点所对应的定位时间;
将用户出现在常去场所的多个位置点对应的定位时间,作为用户在常去场所的出现时间。
其中,根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息,包括:
根据用户在所述常去区域的每个出现时间,与预设的办公时间、休闲时间以及居家时间进行匹配,得到一匹配结果;
若所述常去场所为工作场所,且所述匹配结果指示用户在办公时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的公司;和/或
若所述常去场所为居住场所,且所述匹配结果指示用户在居家时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的住宅;和/或
若所述常去场所为服务场所,且所述匹配结果指示用户在休闲时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户常去的服务地点。
其中,若地图数据将所述常去场所细分为多个子区域,则所述方法还包括:
根据所述地图数据,确定所述常去场所中每个子区域所包含的位置点;
根据子区域中的位置点数量,确定所述常去区域中各个子区域的权重值;
若某一子区域的权重值大于其他子区域,且其权重值占所有子区域的权重之和的比例大于第二预设阈值,则将该子区域作为用户在所述常去场所中的具体位置。
其中,根据所述历史定位信息,确定用户在地图数据中,出现过的多个位置点,包括:
将所述历史定位信息按照时间段进行分组;
根据每一组历史定位信息,在地图数据中,确定各时间段内用户出现过的所有位置点;
对同一时间段内用户出现过的所有位置点进行过滤,使得在同一时间段,一个第二预设范围的区域内,最多保留一个位置点。
其中,对同一时间段内用户出现过的所有位置点进行过滤,使得在同一时间段,一个第二预设范围的区域内,最多保留一个位置点,包括:
以位置点为中心,分别针对以同一时间段的每个位置点,确定一第二预设范围的检测区域;
在包含位置点最多一个检测区域中,过滤掉除中心位置点以外的所有其它位置点;
根据过滤后剩余的位置点,重新确定一个包含位置点最多的检测区域,并进行过滤,直至同一时间段内没有可再过滤的位置点。
其中,根据所述历史定位信息,确定用户出现过的多个位置点,还包括:
根据地图数据,确定并过滤掉坐落在道路、河流、湖泊以及海洋的位置点。
此外,本发明的另一实施例还提供一种基于历史定位信息的数据挖掘装置,包括:
获取模块,用于获取用户的历史定位信息;
第一处理模块,用于根据所述历史定位信息,确定所述用户的常去场所以及在所述常去场所的出现时间;
第二处理模块,用于根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息。
其中,所述第一处理模块,包括:
投影子模块,用于根据所述历史定位信息,确定用户在地图数据中,出现过的多个位置点;
聚类分子模块,用于根通过基于密度的聚类分析法,在所有位置点中,确定用户的常去区域;
确定子模块,用于根据地图数据,确定用户的常去区域所对应的场所,并将该场所作为用户的常去场所;
其中,所述聚类分子模块包括:
位置区域确定单元,用于以位置点为中心,分别针对每个位置点,确定一第一预设范围的位置区域;
常去区域确定单元,用于将包含位置点最多、且位置点数量≥第一预设阈值的一个位置区域确定为用户的常去区域;
过滤单元,用于保存常去区域内所有的位置点,并对距该常去区域的中心点预设距离之内的所有位置点进行过滤;
控制单元,用于控制所述常去区域确定单元以及过滤单元进行循环工作,直至用户的所有常去区域全部确认完毕。
其中,所述第一处理模块,还包括:
第一确定子模块,用于根据所述历史定位信息,确定用户出现在常去场所的多个位置点所对应的定位时间;
第二确定子模块,用于将用户出现在常去场所的多个位置点对应的定位时间,作为用户在常去场所的出现时间。
其中,所述第二处理模块包括:
时间匹配子模块,用于根据用户在所述常去区域的每个出现时间,与预设的办公时间、休闲时间以及居家时间进行匹配,得到一匹配结果;
第一挖掘子模块,用于若所述常去场所为工作场所,且所述匹配结果指示用户在办公时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的公司;和/或
第二挖掘子模块,用于若所述常去场所为居住场所,且所述匹配结果指示用户在居家时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的住宅;和/或
第三挖掘子模块,用于若所述常去场所为服务场所,且所述匹配结果指示用户在休闲时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户常去的服务地点。
其中,若地图数据将所述常去场所细分为多个子区域,则所述数据挖掘装置还包括:
第三处理模块,用于根据所述地图数据,确定所述常去场所中每个子区域所包含的位置点;
第四处理模块,用于根据子区域中的位置点数量,确定所述常去区域中各个子区域的权重值;
第五处理模块,用于若某一子区域的权重值大于其他子区域,且其权重值占所有子区域的权重之和的比例大于第二预设阈值,则将该子区域作为用户在所述常去场所中的具体位置。
其中,所述投影子模块,包括:
分组单元,用于将所述历史定位信息按照时间段进行分组;
确定单元,用于根据每一组历史定位信息,在地图数据中,确定各时间段内用户出现过的所有位置点;
第一过滤单元,用于对同一时间段内用户出现过的所有位置点进行过滤,使得在同一时间段,一个第二预设范围的区域内,最多保留一个位置点。
其中,所述过滤单元具体用于:
以位置点为中心,分别针对以同一时间段的每个位置点,确定一第二预设范围的检测区域;
在包含位置点最多一个检测区域中,过滤掉除中心位置点以外的所有其它位置点;
根据过滤后剩余的位置点,重新确定一个包含位置点最多的检测区域,并进行过滤,直至同一时间段内没有可再过滤的位置点。
其中,所述投影子模块,还包括:
第二过滤单元,用于根据地图数据,确定并过滤掉坐落在道路、河流、湖泊以及海洋的位置点。
本发明的上述技术方案的有益效果如下:
本发明的方案根据用户的历史定位信息确定出用户的常去场所以及在常去场所的时间,从而能够挖掘出常去场所针对用户的语义信息。由于确定出的语音信息对用户来讲具有针对性,因此可以用于对用户进行如广告、通知等信息推广的依据,从而使用户得到更好的体验。
附图说明
图1为本发明中,基于历史定位信息的数据挖掘方法的步骤示意图;
图2、图3为本发明中,确定常用区域的示意图;
图4为本发明中,确定用户在常用场所中具体位置的示意图;
图5为本发明中,基于历史定位信息的数据挖掘装置的结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
如图1所示,本发明的实施例提供一种数据挖掘方法,包括:
步骤11,获取用户的历史定位信息;
步骤12,根据所述历史定位信息,确定所述用户的常去场所以及在所述常去场所的出现时间;
步骤13,根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息。
通过上述描述可以知道:本实施例的方法根据用户的历史定位信息确定出用户的常去场所以及在常去场所的时间,从而能够挖掘出常去场所针对用户的语义信息,例如:用户在工作时间经常出现在一个办公场所,则可以确定该办公场所就是用户的公司,同理还能确定用户的家以及常去的商场等语义信息,因此,能够为用户的消息推荐提供数据支持,使用户得到更好的体验。
具体地,在上述步骤12中,确定用户的常去场进一步包括如下步骤:
步骤121,根据所述历史定位信息,确定用户在地图数据中,出现过的多个位置点;在该步骤中,可根据用户的GPS数据确定出用户已往的定位坐标,并根据定位坐标投影到地图数据中(如CGCS2000国家大地坐标系,能够根据平面直角坐标数据进行距离量算等工作);
步骤122,通过基于密度的聚类分析法,在所有位置点中,确定用户的常去区域;
步骤123,根据地图数据,确定用户的常去区域所对应的场所,并将该场所作为用户的常去场所;
显然,如果将根据历史定位信息确定的位置点进行叠加分析,位置点密度最大的区域即表示用户的常去区域。在一般情况下,用户的常去场所不止一个,如家和公司,在将位置点叠加后,会呈现多块高密度的区域,因此通过基于密度的聚类分析法可以根据位置点的密度,有效地将对同一块区域附近范围的位置点聚类为一个常去区域。
下面对确定用户的常去区域的方法进行详细介绍。
在上述步骤122中,进一步包括:
步骤1221,以位置点为中心,分别针对每个位置点,确定一第一预设范围的位置区域;
示例性地,可设置位置区域为圆形区域(形状可任意设置,如多边形),半径为30m,即第一预设范围是π×(30m)2
步骤1222,将包含位置点最多、且位置点数量≥第一预设阈值的一个位置区域确定为用户的常去区域;
虽然,每个位置区域是以对应的位置点为中心建立的,但用户在常去区域中往往会有密集的位置点存在,因此一个位置区域出了中心的位置点外,还会涵盖到其它的位置点,因此哪个位置区域中的位置点最多即表示用户在该位置区域内经常出现,可以确定为用户的常去区域。此外,即便是包含位置点最多的位置区域,其位置点数量也不一定足以支持是用户经常去的区域,这里通过第一预设阈值(可根据实际情况设置)来作为判定常去区域的一个门限,不符合门限的位置区域,即便包含位置点最多,也不能被确定人常去区域。
步骤1223,保存常去区域内所有的位置点,并对距该常去区域的中心点预设距离之内的所有位置点进行过滤;
通过上文描述可以知道,一般情况下,用户常去区域有多个,如图2所示,实线圈A1、A2和A3是已确定好的部分位置区域,假设A1区域附近对应于用户的住宅,A2区域附近对应于用户的公司,A3区域附近对应于一个餐馆。在经过上述步骤1222后,确定A2为用户常去区域,之后以A2中心点为中心,进行预设距离之内的位置点过滤。示例性地,通过合理设置预设距离,保证过滤范围(即图2中的虚线圈)要略大于位置区域的第一预设范围,从而能够保将A2附近的位置点过滤干净,此外过滤范围也不能设置过大,防止在步骤1223执行后,将A1和A3附近的位置点过滤掉。根据实际经验,优选将预设距离设置在300m左右最为合适。此外,在过滤前可以将A2的位置点单独保存起来,为后续的数据挖掘提供支持。
步骤1224,基于过滤后剩余的位置点,重新确定用户另一个常去区域,直至用户的所有常去区域全部确认完毕;
图3所示的是根据图2的过滤范围进行过滤后得到位置点示意图,在经过一次过滤后,A1的位置点最多,之后循环步骤1222和步骤1223,经过反复的过滤后,会零星剩下一些位置点,但对应的位置区域涵盖的位置点数量小于第一预设阈值,致使流程结束。
具体地,在上述步骤12中,确定用户对应于常去场所的出现时间包括如下步骤:
步骤124,根据所述历史定位信息,确定用户出现在常去场所的多个位置点所对应的定位时间;
步骤125,将用户出现在常去场所的多个位置点对应的定位时间,作为用户在常去场所的出现时间。
在执行步骤124和125的过程中,可以通过上述步骤1223保存位置点,判断常去场所的位置点,或者也可以恢复之前过滤的位置点,来判断常去场所的各个位置点。由于每个位置点都是用户经过一次定位服务的所产生的,因此会保留有相应的定位时间。
具体地,在执行上述步骤13过程中,进一步包括如下步骤:
步骤131,根据用户在所述常去区域的每个出现时间,与预设的办公时间、休闲时间以及居家时间进行匹配,得到一匹配结果;
示例性地,设置非国家法定节假日以9:00--12:00、13:00—18:00为办公时间,12:00—13:00、18:00—21:00为休闲时间,其它的时间为居家时间;国家法定节假日以22:00-14:00为居家时间,14:00-22:00为休闲时间。
步骤132,若所述常去场所为工作场所,且所述匹配结果指示用户在办公时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的公司;和/或
步骤133,若所述常去场所为居住场所,且所述匹配结果指示用户在居家时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的住宅;和/或
步骤134,若所述常去场所为服务场所,且所述匹配结果指示用户在休闲时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户常去的服务地点。例如,确定出用户常去的商场、公园等信息。
需要说明的是,上述步骤132至步骤134仅仅一种可行的确定用户的常去场所的语义信息。除此之外,如果用户在办公时间多数出现在商场,也可确定用户在商场上班。此外,在具体实施时,还可加入用户常在哪个时段出现,以及该场所的相关信息(如确定用户在某一场所上班,且该场所在地图数据中显示为某个公司的,则可以进一步推断出用户的公司名称)。
如果地图数据信息全面,将所述常去场所再细分为多个子区域,还可以进一步推断出用户在常去场所的具体位置,详细步骤如下:
步骤14,根据所述地图数据,确定所述常去场所中每个子区域所包含的位置点;
步骤15,根据子区域中的位置点数量,确定所述常去区域中各个子区域的权重值;
步骤16,若某一子区域的权重值大于其他子区域,且其权重值占所有子区域的权重之和的比例大于第二预设阈值,则将该子区域作为用户在所述常去场所中的具体位置。
示例性地,图4为已确定出的用户的公司,通过地图数据可以知道该公司进一步包含3座办公楼:A座、B座和C座(即3个子区域)。根据图4可以看出,用户的位置点出现在A座最多,且A座的位置点的权重值占所有办公楼的权重之和的比例大于40%时,则可以确定用户具体在公司的A座办公楼上班。
此外,由于目前一部分的定位服务是持续性地对用户进行的定位,因此根据用户的历史定位信息确定的为止点过多,需要进行筛选。
下面是筛选位置点的详细介绍。
首先,可以根据提前设置的时间端对位置点进行删选,将用户短时间内在某一位置上会产生多个定位点简化为一位置点,从而能够有效减小数据量,即,上述步骤121包括:
步骤1211,将所述历史定位信息按照时间段进行分组;
步骤1212,根据每一组历史定位信息,确定各时间段内用户出现过的所有位置点;
步骤1213,对同一时间段内用户出现过的所有位置点进行过滤,使得在同一时间段,一个第二预设范围的区域内,最多保留一个位置点。
具体地,在执行步骤1213中,包括如下步骤:
S1,以位置点为中心,分别针对以同一时间段的每个位置点,确定一第二预设范围的检测区域;
S2,在包含位置点最多一个检测区域中,过滤掉除中心位置点以外的所有其它位置点;
循环执行步骤S1-步骤S2,从而根据过滤后剩余的位置点,重新确定一个包含位置点最多的检测区域,并进行过滤,直至同一时间段内没有可再过滤的位置点。
此外,还可以删掉不能确定场所的位置点以精简数据,即,上述步骤121还包括:
1214,根据地图数据,确定并过滤掉坐落在道路、河流、湖泊以及海洋的位置点。
根据上述的两个位置点的筛选方案,能够过滤掉90%以上的位置点。之后在对剩余位置点确定用户的常去场所。
综上所述,在本实施例的技术之上,可通过具有定位能力终端,海量获取不同用户的历史定位信息,并根据用户对历史定信息进行划分,从而针对每个用户,进行数据挖掘。例如,确定出某一用户常去的商场后,可向该用户发送商场的优惠广告等,从而使用户得到更好的体验。
此外,如图5所示,本发明的实施例还提供一种基于历史定位信息的数据挖掘装置,包括:
获取模块,用于获取用户的历史定位信息;
第一处理模块,用于根据所述历史定位信息,确定所述用户的常去场所以及在所述常去场所的出现时间;
第二处理模块,用于根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息。
通过上述描述可以知道:本实施例的装置根据用户的历史定位信息确定出用户的常去场所以及在常去场所的时间,从而能够挖掘出常去场所针对用户的语义信息,例如:用户在工作时间经常出现在一个办公场所,则可以确定该办公场所就是用户的公司,同理还能确定用户的家以及常去的商场等语义信息,因此,能够为用户的消息推荐提供数据支持,使用户得到更好的体验。
其中,所述第一处理模块,包括:
投影子模块,用于根据所述历史定位信息,确定用户在地图数据中,出现过的多个位置点;
聚类分子模块,用于根通过基于密度的聚类分析法,在所有位置点中,确定用户的常去区域;
确定子模块,用于根据地图数据,确定用户的常去区域所对应的场所,并将该场所作为用户的常去场所;
其中,所述聚类分子模块包括:
位置区域确定单元,用于以位置点为中心,分别针对每个位置点,确定一第一预设范围的位置区域;
常去区域确定单元,用于将包含位置点最多、且位置点数量≥第一预设阈值的一个位置区域确定为用户的常去区域;
过滤单元,用于保存常去区域内所有的位置点,并对距该常去区域的中心点预设距离之内的所有位置点进行过滤;
控制单元,用于控制所述常去区域确定单元以及过滤单元进行循环工作,直至用户的所有常去区域全部确认完毕。
其中,所述第一处理模块,还包括:
第一确定子模块,用于根据所述历史定位信息,确定用户出现在常去场所的多个位置点所对应的定位时间;
第二确定子模块,用于将用户出现在常去场所的多个位置点对应的定位时间,作为用户在常去场所的出现时间。
其中,所述第二处理模块包括:
时间匹配子模块,用于根据用户在所述常去区域的每个出现时间,与预设的办公时间、休闲时间以及居家时间进行匹配,得到一匹配结果;
第一挖掘子模块,用于若所述常去场所为工作场所,且所述匹配结果指示用户在办公时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的公司;和/或
第二挖掘子模块,用于若所述常去场所为居住场所,且所述匹配结果指示用户在居家时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的住宅;和/或
第三挖掘子模块,用于若所述常去场所为服务场所,且所述匹配结果指示用户在休闲时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户常去的服务地点。
其中,若地图数据将所述常去场所细分为多个子区域,则所述数据挖掘装置还包括:
第三处理模块,用于根据所述地图数据,确定所述常去场所中每个子区域所包含的位置点;
第四处理模块,用于根据子区域中的位置点数量,确定所述常去区域中各个子区域的权重值;
第五处理模块,用于若某一子区域的权重值大于其他子区域,且其权重值占所有子区域的权重之和的比例大于第二预设阈值,则将该子区域作为用户在所述常去场所中的具体位置。
其中,所述投影子模块,包括:
分组单元,用于将所述历史定位信息按照时间段进行分组;
确定单元,用于根据每一组历史定位信息,在地图数据中,确定各时间段内用户出现过的所有位置点;
第一过滤单元,用于对同一时间段内用户出现过的所有位置点进行过滤,使得在同一时间段,一个第二预设范围的区域内,最多保留一个位置点。
其中,所述过滤单元具体用于:
以位置点为中心,分别针对以同一时间段的每个位置点,确定一第二预设范围的检测区域;
在包含位置点最多一个检测区域中,过滤掉除中心位置点以外的所有其它位置点;
根据过滤后剩余的位置点,重新确定一个包含位置点最多的检测区域,并进行过滤,直至同一时间段内没有可再过滤的位置点。
其中,所述投影子模块,还包括:
第二过滤单元,用于根据地图数据,确定并过滤掉坐落在道路、河流、湖泊以及海洋的位置点。
显然,本发明提供的数据挖掘装置与上一实施例提供的数据挖掘方法相对应,均能够达到同样的技术效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (18)

1.一种基于历史定位信息的数据挖掘方法,其特征在于,包括:
获取用户的历史定位信息;
根据所述历史定位信息,确定所述用户的常去场所以及在所述常去场所的出现时间;
根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息。
2.根据权利要求1所述的数据挖掘方法,其特征在于,
根据所述历史定位信息,确定所述用户的常去场所,包括:
根据所述历史定位信息,确定用户在地图数据中,出现过的多个位置点;
通过基于密度的聚类分析法,在所有位置点中,确定用户的常去区域;
根据地图数据,确定用户的常去区域所对应的场所,并将该场所作为用户的常去场所。
3.根据权利要求2所述的数据挖掘方法,其特征在于,
通过基于密度的聚类分析法,在所述多个位置点中,确定用户的常去区域,包括:
以位置点为中心,分别针对每个位置点,确定一第一预设范围的位置区域;
将包含位置点最多、且位置点数量≥第一预设阈值的一个位置区域确定为用户的常去区域;
保存常去区域内所有的位置点,并对距该常去区域的中心点预设距离之内的所有位置点进行过滤;
基于过滤后剩余的位置点,重新确定用户另一个常去区域,直至用户的所有常去区域全部确认完毕。
4.根据权利要求2所述的数据挖掘方法,其特征在于,
根据所述历史定位信息,确定用户对应于常去场所的出现时间,包括:
根据所述历史定位信息,确定用户出现在常去场所的多个位置点所对应的定位时间;
将用户出现在常去场所的多个位置点对应的定位时间,作为用户在常去场所的出现时间。
5.根据权利要求4所述的数据挖掘方法,其特征在于,
根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息,包括:
根据用户在所述常去区域的每个出现时间,与预设的办公时间、休闲时间以及居家时间进行匹配,得到一匹配结果;
若所述常去场所为工作场所,且所述匹配结果指示用户在办公时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的公司;和/或
若所述常去场所为居住场所,且所述匹配结果指示用户在居家时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的住宅;和/或
若所述常去场所为服务场所,且所述匹配结果指示用户在休闲时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户常去的服务地点。
6.根据权利要求2所述的数据挖掘方法,其特征在于,
若地图数据将所述常去场所细分为多个子区域,则所述方法还包括:
根据所述地图数据,确定所述常去场所中每个子区域所包含的位置点;
根据子区域中的位置点数量,确定所述常去区域中各个子区域的权重值;
若某一子区域的权重值大于其他子区域,且其权重值占所有子区域的权重之和的比例大于第二预设阈值,则将该子区域作为用户在所述常去场所中的具体位置。
7.根据权利要求2所述的数据挖掘方法,其特征在于,
根据所述历史定位信息,确定用户在地图数据中,出现过的多个位置点,包括:
将所述历史定位信息按照时间段进行分组;
根据每一组历史定位信息,在地图数据中,确定各时间段内用户出现过的所有位置点;
对同一时间段内用户出现过的所有位置点进行过滤,使得在同一时间段,一个第二预设范围的区域内,最多保留一个位置点。
8.根据权利要求7所述的数据挖掘方法,其特征在于,
对同一时间段内用户出现过的所有位置点进行过滤,使得在同一时间段,一个第二预设范围的区域内,最多保留一个位置点,包括:
以位置点为中心,分别针对以同一时间段的每个位置点,确定一第二预设范围的检测区域;
在包含位置点最多一个检测区域中,过滤掉除中心位置点以外的所有其它位置点;
根据过滤后剩余的位置点,重新确定一个包含位置点最多的检测区域,并进行过滤,直至同一时间段内没有可再过滤的位置点。
9.根据权利要求7所述的数据挖掘方法,其特征在于,
根据所述历史定位信息,确定用户出现过的多个位置点,还包括:
根据地图数据,确定并过滤掉坐落在道路、河流、湖泊以及海洋的位置点。
10.一种基于历史定位信息的数据挖掘装置,其特征在于,包括:
获取模块,用于获取用户的历史定位信息;
第一处理模块,用于根据所述历史定位信息,确定所述用户的常去场所以及在所述常去场所的出现时间;
第二处理模块,用于根据用户的常去场所以及在所述常去场所的出现时间,确定该常去场所针对所述用户的语义信息。
11.根据权利要求10所述的数据挖掘装置,其特征在于,
所述第一处理模块,包括:
投影子模块,用于根据所述历史定位信息,确定用户在地图数据中,出现过的多个位置点;
聚类分子模块,用于根通过基于密度的聚类分析法,在所有位置点中,确定用户的常去区域;
确定子模块,用于根据地图数据,确定用户的常去区域所对应的场所,并将该场所作为用户的常去场所。
12.根据权利要求11所述的数据挖掘装置,其特征在于,
所述聚类分子模块包括:
位置区域确定单元,用于以位置点为中心,分别针对每个位置点,确定一第一预设范围的位置区域;
常去区域确定单元,用于将包含位置点最多、且位置点数量≥第一预设阈值的一个位置区域确定为用户的常去区域;
过滤单元,用于保存常去区域内所有的位置点,并对距该常去区域的中心点预设距离之内的所有位置点进行过滤;
控制单元,用于控制所述常去区域确定单元以及过滤单元进行循环工作,直至用户的所有常去区域全部确认完毕。
13.根据权利要求11所述的数据挖掘装置,其特征在于,
所述第一处理模块,还包括:
第一确定子模块,用于根据所述历史定位信息,确定用户出现在常去场所的多个位置点所对应的定位时间;
第二确定子模块,用于将用户出现在常去场所的多个位置点对应的定位时间,作为用户在常去场所的出现时间。
14.根据权利要求13所述的数据挖掘装置,其特征在于,
所述第二处理模块包括:
时间匹配子模块,用于根据用户在所述常去区域的每个出现时间,与预设的办公时间、休闲时间以及居家时间进行匹配,得到一匹配结果;
第一挖掘子模块,用于若所述常去场所为工作场所,且所述匹配结果指示用户在办公时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的公司;和/或
第二挖掘子模块,用于若所述常去场所为居住场所,且所述匹配结果指示用户在居家时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户的住宅;和/或
第三挖掘子模块,用于若所述常去场所为服务场所,且所述匹配结果指示用户在休闲时间内出现在所述常去场所的次数最多,则将该常去场所确定为用户常去的服务地点。
15.根据权利要求11所述的数据挖掘装置,其特征在于,
若地图数据将所述常去场所细分为多个子区域,则所述数据挖掘装置还包括:
第三处理模块,用于根据所述地图数据,确定所述常去场所中每个子区域所包含的位置点;
第四处理模块,用于根据子区域中的位置点数量,确定所述常去区域中各个子区域的权重值;
第五处理模块,用于若某一子区域的权重值大于其他子区域,且其权重值占所有子区域的权重之和的比例大于第二预设阈值,则将该子区域作为用户在所述常去场所中的具体位置。
16.根据权利要求11所述的数据挖掘装置,其特征在于,
所述投影子模块,包括:
分组单元,用于将所述历史定位信息按照时间段进行分组;
确定单元,用于根据每一组历史定位信息,在地图数据中,确定各时间段内用户出现过的所有位置点;
第一过滤单元,用于对同一时间段内用户出现过的所有位置点进行过滤,使得在同一时间段,一个第二预设范围的区域内,最多保留一个位置点。
17.根据权利要求16所述的数据挖掘装置,其特征在于,
所述过滤单元具体用于:
以位置点为中心,分别针对以同一时间段的每个位置点,确定一第二预设范围的检测区域;
在包含位置点最多一个检测区域中,过滤掉除中心位置点以外的所有其它位置点;
根据过滤后剩余的位置点,重新确定一个包含位置点最多的检测区域,并进行过滤,直至同一时间段内没有可再过滤的位置点。
18.根据权利要求11所述的数据挖掘装置,其特征在于,
所述投影子模块,还包括:
第二过滤单元,用于根据地图数据,确定并过滤掉坐落在道路、河流、湖泊以及海洋的位置点。
CN201410721294.7A 2014-12-02 2014-12-02 一种基于历史定位信息的数据挖掘方法及装置 Pending CN105718460A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410721294.7A CN105718460A (zh) 2014-12-02 2014-12-02 一种基于历史定位信息的数据挖掘方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410721294.7A CN105718460A (zh) 2014-12-02 2014-12-02 一种基于历史定位信息的数据挖掘方法及装置

Publications (1)

Publication Number Publication Date
CN105718460A true CN105718460A (zh) 2016-06-29

Family

ID=56146222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410721294.7A Pending CN105718460A (zh) 2014-12-02 2014-12-02 一种基于历史定位信息的数据挖掘方法及装置

Country Status (1)

Country Link
CN (1) CN105718460A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106296488A (zh) * 2016-08-08 2017-01-04 武汉理工大学 一种基于众包模式的智慧旅游系统及方法
CN106780064A (zh) * 2016-12-02 2017-05-31 腾讯科技(深圳)有限公司 一种区域划分方法、装置及网络设备
CN107515890A (zh) * 2017-07-04 2017-12-26 深圳市金立通信设备有限公司 一种识别常驻点的方法及终端
CN107783976A (zh) * 2016-08-25 2018-03-09 腾讯科技(深圳)有限公司 用户信息挖掘方法及装置
CN108881388A (zh) * 2018-05-17 2018-11-23 镇江国中亿家科技有限公司 一种位置数据的处理方法和装置
CN109471914A (zh) * 2018-12-13 2019-03-15 惠州Tcl移动通信有限公司 一种位置确定方法、装置和存储介质
CN110516017A (zh) * 2019-08-02 2019-11-29 Oppo广东移动通信有限公司 基于终端设备的地点信息处理方法、装置、电子设备及存储介质
CN111742586A (zh) * 2018-02-23 2020-10-02 诺基亚技术有限公司 被配置为提供距离过滤的基站
CN112069325A (zh) * 2020-09-01 2020-12-11 张富平 基于区块链离线支付的大数据处理方法及云服务推送平台
CN112232723A (zh) * 2020-12-14 2021-01-15 南京领行科技股份有限公司 异常行为的实时检测方法、装置、电子设备及存储介质
CN112560910A (zh) * 2020-12-02 2021-03-26 中国联合网络通信集团有限公司 用户分类方法和装置
CN113223215A (zh) * 2021-05-21 2021-08-06 歌尔股份有限公司 智能门锁的唤醒方法、终端设备及智能门锁

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1661604A (zh) * 2004-02-25 2005-08-31 松下电器产业株式会社 移动终端的活动记录分析和自动信息推荐系统及方法
CN102682041A (zh) * 2011-03-18 2012-09-19 日电(中国)有限公司 用户行为识别设备及方法
CN103052022A (zh) * 2011-10-17 2013-04-17 中国移动通信集团公司 基于移动行为的用户稳定点发现方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1661604A (zh) * 2004-02-25 2005-08-31 松下电器产业株式会社 移动终端的活动记录分析和自动信息推荐系统及方法
CN102682041A (zh) * 2011-03-18 2012-09-19 日电(中国)有限公司 用户行为识别设备及方法
CN103052022A (zh) * 2011-10-17 2013-04-17 中国移动通信集团公司 基于移动行为的用户稳定点发现方法和系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ANDREW KIRMSE等: "Extracting Patterns from Location History", 《GIS "11 PROCEEDINGS OF THE 19TH ACM SIGSPATIAL INTERNATIONAL CONFERENCE ON ADVANCES IN GEOGRAPHIC INFORMATION SYSTEMS TABLE OF CONTENTS》 *
孟宪文主编: "《公安情报分析》", 31 August 2013, 中国人民公安大学出版社 *
郑宇等: "基于用户轨迹挖掘的智能位置服务", 《中国计算机学会通讯》 *
陈康等: "基于位置信息的用户行为轨迹分析与应用综述", 《电信科学》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106296488A (zh) * 2016-08-08 2017-01-04 武汉理工大学 一种基于众包模式的智慧旅游系统及方法
CN107783976A (zh) * 2016-08-25 2018-03-09 腾讯科技(深圳)有限公司 用户信息挖掘方法及装置
CN107783976B (zh) * 2016-08-25 2020-04-07 腾讯科技(深圳)有限公司 用户信息挖掘方法及装置
CN106780064A (zh) * 2016-12-02 2017-05-31 腾讯科技(深圳)有限公司 一种区域划分方法、装置及网络设备
CN106780064B (zh) * 2016-12-02 2021-01-05 腾讯科技(深圳)有限公司 一种区域划分方法、装置及网络设备
CN107515890A (zh) * 2017-07-04 2017-12-26 深圳市金立通信设备有限公司 一种识别常驻点的方法及终端
CN111742586A (zh) * 2018-02-23 2020-10-02 诺基亚技术有限公司 被配置为提供距离过滤的基站
CN111742586B (zh) * 2018-02-23 2022-07-19 诺基亚技术有限公司 被配置为提供距离过滤的基站
CN108881388A (zh) * 2018-05-17 2018-11-23 镇江国中亿家科技有限公司 一种位置数据的处理方法和装置
CN109471914A (zh) * 2018-12-13 2019-03-15 惠州Tcl移动通信有限公司 一种位置确定方法、装置和存储介质
CN110516017A (zh) * 2019-08-02 2019-11-29 Oppo广东移动通信有限公司 基于终端设备的地点信息处理方法、装置、电子设备及存储介质
CN112069325A (zh) * 2020-09-01 2020-12-11 张富平 基于区块链离线支付的大数据处理方法及云服务推送平台
CN112560910A (zh) * 2020-12-02 2021-03-26 中国联合网络通信集团有限公司 用户分类方法和装置
CN112560910B (zh) * 2020-12-02 2024-03-01 中国联合网络通信集团有限公司 用户分类方法和装置
CN112232723A (zh) * 2020-12-14 2021-01-15 南京领行科技股份有限公司 异常行为的实时检测方法、装置、电子设备及存储介质
CN113223215A (zh) * 2021-05-21 2021-08-06 歌尔股份有限公司 智能门锁的唤醒方法、终端设备及智能门锁

Similar Documents

Publication Publication Date Title
CN105718460A (zh) 一种基于历史定位信息的数据挖掘方法及装置
CN105261217B (zh) 一种基于密度聚类算法的城市交通拥堵状态检测方法
US20210374204A1 (en) Method and apparatus for managing region tag
CN103809194B (zh) 一种gps轨迹曲线的显示方法及装置
CN110765219A (zh) 地理围栏生成方法、装置、计算机设备和存储介质
CN105740347A (zh) 基于gps的用户信息采集与行为分析方法
CN106547894A (zh) 基于移动通信信令大数据挖掘职住位置标签的系统及方法
CN103347009A (zh) 一种信息过滤方法及装置
CN106445292A (zh) 应用程序的分身管理方法及系统
CN104462273A (zh) 提取轨迹的方法及系统
CN103984472A (zh) 消息提示方法、消息提示装置和电子设备
CN108427679A (zh) 一种人流分布处理方法及其设备
CN104063691B (zh) 基于改进的Hough变换的车道线快速检测方法
CN103516912A (zh) 一种移动终端定位省电方法
CN109951306A (zh) 告警的处理方法、装置、设备及介质
Villarreal et al. The influence of wastewater subsidy, flood disturbance and neighbouring land use on current and historical patterns of riparian vegetation in a semi‐arid watershed
CN109582410A (zh) 截图方法、装置、设备及计算机可读存储介质
Whitlock et al. Using genetic pedigree reconstruction to estimate effective spawner abundance from redd surveys: an example involving Pacific lamprey (Entosphenus tridentatus)
CN103838861B (zh) 一种基于三维gis动态显示信息的方法和显示系统
CN103839291B (zh) 构建三维地形的方法及装置
Muehlbauer et al. Knickpoint effects on macroinvertebrates, sediment, and discharge in urban and forested streams: urbanization outweighs microscale habitat heterogeneity
CN106682058A (zh) 应用程序的筛选方法、装置和系统
Li et al. A hybrid automatic thresholding approach using panchromatic imagery for rapid mapping of landslides
Kitson-Walters et al. Fine-scale population structure of Lobatus gigas in Jamaica’s exclusive economic zone considering hydrodynamic influences
CN108268876A (zh) 一种基于聚类的近似重复记录的检测方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160629