CN108230020A - 一种基于多维时间粒度时空频繁区域挖掘的方法 - Google Patents
一种基于多维时间粒度时空频繁区域挖掘的方法 Download PDFInfo
- Publication number
- CN108230020A CN108230020A CN201711461433.7A CN201711461433A CN108230020A CN 108230020 A CN108230020 A CN 108230020A CN 201711461433 A CN201711461433 A CN 201711461433A CN 108230020 A CN108230020 A CN 108230020A
- Authority
- CN
- China
- Prior art keywords
- time
- space
- granularity
- mobile object
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0261—Targeted advertisements based on user location
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S19/00—Satellite radio beacon positioning systems; Determining position, velocity or attitude using signals transmitted by such systems
- G01S19/38—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system
- G01S19/39—Determining a navigation solution using signals transmitted by a satellite radio beacon positioning system the satellite radio beacon positioning system transmitting time-stamped messages, e.g. GPS [Global Positioning System], GLONASS [Global Orbiting Navigation Satellite System] or GALILEO
- G01S19/42—Determining position
Abstract
本发明公开了一种基于多维时间粒度时空频繁区域挖掘的方法,包括采集移动对象的位置信息以及对应的时间信息;将感兴趣的时间段按时间粒度层次进行划分,形成多层的时间粒度;根据所述的位置信息,获取所述的移动对象在所有时间粒度下的时空停留区域;根据获取的时空停留区域,计算所述的移动对象在所有时间粒度下的时空频繁区域;根据时空频繁区域,计算所述移动对象在所有时间粒度下的核心时空频繁区域;根据所述核心时空频繁区域的信息,获取所述移动对象的活动规律,制定基于位置信息的广告投放策略,用以解决在基于位置的广告投放的场景下,单一时间粒度下时空频繁区域移动对象活动规律语义信息挖掘不充分的问题,提高了广告投放效率。
Description
技术领域
本发明涉及一种时空频繁区域挖掘的方法,具体涉及一种基于多维时间粒度时空频繁区域挖掘的方法。
背景技术
随着移动通信和定位技术的发展,各类移动设备中采集到大量轨迹数据,基于轨迹数据的分析挖掘研究受到领域专家和业界的关注。轨迹数据记录着移动对象在现实世界的活动规律,通过分析移动对象的历史轨迹,发现移动对象频繁访问的地理区域,为基于位置的服务提供有价值信息,例如交通流量控制、基于位置的旅游推荐、广告推荐、共享单车投放选址等。
目前的研究从空间方面进行研究,着重考虑空间信息,未能充分考虑移动对象频繁访问某个区域的时间信息;或者在频繁区域挖掘研究中引入时间因素,但是采用单一时间粒度(如时间粒度为时)挖掘,无法实现多维时间粒度下(如时间粒度分别为周→周末、周内→时) 时空频繁区域中移动对象运动规律语义信息的挖掘。例如,现有技术在广告投放时,仅仅按照时间粒度为时进行挖掘,但是挖掘出来的信息不明确,在早8:30-9:30时段内,发现移动对象经常停留的区域有地铁站、公寓还有公园等众多地点,即时空频繁区域,由于现有技术在挖掘时,时空频繁区域众多且没有特征,使得广告投放时无法具有针对性的进行布局,导致广告的投放无法达到预期的效果。
因此,目前基于轨迹数据的频繁区域挖掘存在单一时间粒度下时空频繁区域移动对象活动规律语义信息挖掘不充分的问题。
发明内容
本发明的目的在于提供一种基于多维时间粒度时空频繁区域挖掘的方法,用以解决在基于位置的广告投放的场景下,单一时间粒度下时空频繁区域移动对象活动规律语义信息挖掘不充分,使得广告投放效率低、无法达到预期效果等问题。
为了实现上述任务,本发明采用以下技术方案:
一种基于多维时间粒度时空频繁区域挖掘方法,包括以下步骤:
步骤1,采集移动对象的位置信息以及对应的时间信息;
步骤2,将感兴趣的时间段按时间粒度层次进行划分,形成多层的时间粒度;
步骤3,根据所述的位置信息,获取所述的移动对象在所有时间粒度下的时空停留区域;
步骤4,根据步骤3中获取的时空停留区域,计算所述的移动对象在所有时间粒度下的时空频繁区域;
步骤5,根据步骤4得到的时空频繁区域,计算所述移动对象在所有时间粒度下的核心时空频繁区域;
步骤6,根据所述核心时空频繁区域的信息,获取所述移动对象的活动规律,制定基于位置信息的广告投放策略。
进一步地,所述的采集移动对象的位置信息以及对应的时间信息具体是指:
所述的移动对象包括多个单独移动的客体,所述的位置信息为所述客体的GPS移动轨迹,该GPS轨迹数据包括经度、纬度,所述的时间信息是指每一条GPS轨迹数据所对应的时间。
进一步地,所述的将感兴趣的时间段按时间粒度层次进行划分,形成多层的时间粒度,具体是指:
将感兴趣的时间段进划分成由大到小的多层时间粒度,每一层对应多个时间粒度,从而建立时间粒度表,所述的时间粒度表每一列分别代表时间粒度、客体编号以及时空停留区域,其中第一列按照所述的时间粒度大小进行排序。
进一步地,所述的根据所述的位置信息,获取所述的移动对象在所有时间粒度下的时空停留区域具体是指:
任选一个未被访问的轨迹点开始,找出与其距离在邻域半径之内的所有GPS轨迹点。如果邻域半径内GPS轨迹点的数量大于等于设置的最少轨迹点数阈值,则当前点与其邻域半径内的点形成一个簇,并且出发点被标记为已访问,然后循环重复,以相同的方法处理该簇内所有未被标记为已访问的轨迹点,从而对簇进行扩展,得到具有密度相连的轨迹点的最大集合,将此集合内的GPS轨迹点构成的区域作为一个时空停留区域,并将其填入所述的时间粒度表中,直至将时间粒度表填满,获得所述的移动对象在所有时间粒度下的时空停留区域。
进一步地,所述的根据步骤3中获取的时空停留区域,计算所述的移动对象在所有时间粒度下的时空频繁区域具体包括:
当所述的移动对象在时间粒度下的时空停留区域的支持度大于支持度阈值,则将该时间粒度下的时空停留区域标记为时空频繁区域,按时间粒度从大到小的顺序依次计算出所述的移动对象在所有时间粒度下的时空频繁区域;
其中,所述的时间粒度下的时空停留区域的支持度为该时间粒度下访问该时空停留区域的移动对象总数与该时间粒度下移动对象总数的比值。
进一步地,根据步骤4得到的时空频繁区域,计算所述移动对象在所有时间粒度下的核心时空频繁区域具体是指:
将所有的时间粒度下的每一个时空频繁区域记为一个集合,其中i代表当前的时间粒度,j代表第j个在当前时间粒度下的时空频繁区域;
将同一时间粒度下的多个集合进行两两相交,将其交集作为当前时间粒度下的核心时空频繁区域,按照时间粒度从大到小的顺序依次计算出所述的移动对象在所有时间粒度下的核心时空频繁区域。
进一步地,所述的根据所述核心时空频繁区域的信息,获取所述移动对象的活动规律,制定基于位置信息的广告投放策略具体是指:
将所述的移动对象在每一个时间粒度下的所述核心时空频繁区域映射至地图上,得到核心时空频繁区域地图,分析移动对象的活动规律,并将广告根据所述的活动规律投放至所述的核心时空频繁区域。
本发明与现有技术相比具有以下技术特点:
1、本发明提供的多维时间粒度时空频繁区域发掘方法将时间信息划分为多层的结构,相比于单一时间粒度下的发掘,在多维时间粒度下的发掘,能够发现移动对象的活动规律随时间粒度变化的情况;
2、由于挖掘出了更多的移动对象的活动规律,在广告投放时,能够更具有针对性的制定投放策略,提高广告投放效率。
附图说明
图1为本发明提供的挖掘方法流程图;
图2为本发明提供的挖掘方法中时间粒度划分示意图;
图3为本发明提供的挖掘方法中支持度阈值与时间粒度为周、周内、周末的关系图;
图4为本发明提供的挖掘方法中支持度阈值与时间粒度为时的关系图;
图5为本发明提供的挖掘方法中重叠情况下获得核心时空频繁区域示意图;
图6为本发明提供的挖掘方法中包含情况下获得核心时空频繁区域示意图;
图7为本发明提供的挖掘方法中相交情况下获得核心时空频繁区域示意图;
图8为本发明提供的挖掘方法中时间粒度为周、周内、周内下的核心时空频繁区域映射地图;
图9为本发明提供的挖掘方法中时间粒度为周内8:30-9:30、周内12:00-13:00、周内17:30-18:30下的核心时空频繁区域映射地图。
图10为本发明方法的整体框架图。
具体实施方式
遵从上述技术方案,如图1至图10所示,本发明公开了一种基于多维时间粒度时空频繁区域挖掘方法,包括以下步骤:
步骤1,采集移动对象的位置信息以及对应的时间信息;
本方案中所述的移动对象是指能够发送以及接收GPS数据的移动设备,也泛指携带移动设备的行人,这里的移动设备可以是手机、计算机等内置有GPS模块的设备。
具体地,在本实施例中,所述的位置信息为GPS移动轨迹,该 GPS轨迹数据包括经度、纬度,所述的时间信息是指每一条GPS轨迹数据所对应的时间。
本方案对一个固定的地图范围内的移动对象进行研究,在本申请中移动对象为在当前地图范围内的携带移动设备的行人,为便于叙述,将每一个移动设备(行人)称作单独移动的客体,客体在移动时,其所携带的移动设备会产生一系列的GPS轨迹数据,该GPS轨迹数据是由众多GPS单点构成的,计算机收集该客体的GPS轨迹数据以及采集该GPS轨迹数据时的时间信息,并将它们存入数据库中。因此步骤 1的目的是将采集移动对象的信息,并存入数据库中,以供后续步骤的调用。本方案中,对于GPS轨迹数据的采集,可从移动运营商处获取,也可以在用户的移动设备中装入GPS记录软件,GPS记录软件定期将该移动设备的GPS轨迹数据通过移动网络或无线网络上传至云平台并存储在数据库中。
本实施例采用微软亚洲研究院Geolife项目5年期间(2007年4 月-2012年8月)搜集的182个用户的轨迹数据,包含17621条轨迹,总长度达1292951公里,总时长50176小时,在本实施例中,选取其中4个单独移动的客体,这4个客体的GPS移动轨迹包括经纬度等信息,例如,
40.004849,116.321153,0,102,39744.4048032407,2008-10-23,0 9:42:55
以上数据分别代表:经度,纬度,0,海拔高度,时间戳,日期,时间,在本实施例中只使用了经度,纬度,日期以及时间,因此该数据为2008-10-2309:42:55这个时间点上一个客体处于经度为 40.004849,纬度为116.321153的一个GPS数据单点,由多个如此的 GPS数据单点构成了GPS移动轨迹数据。对这些原始轨迹数据进行预处理,去掉不相关及冗余属性,得到只含经纬度、时间信息的轨迹数据,即40.004849,116.321153,2008-10-23,09:42:55。
将以上的数据存入数据库中,建立移动对象的GPS轨迹数据库,其中每一个客体都对应有自己的一张表,表里的每一条信息都与如上所述数据的结构一致。
步骤2,将感兴趣的时间段按时间粒度层次进行划分,形成多层的时间粒度;
其中,多层的时间粒度是指将时间信息按照从大到小的顺序划分为多层,每一层代表一个时间粒度的维度,每一层维度对应多个时间粒度。本方案进行数据挖掘后,其主要服务于广告等行业,根据不同的广告,其所需要研究的时间段是不同的。本方案中,选取感兴趣的时间段,按照时间粒度层次进行划分,这里的感兴趣时间段可以是两年、三个月或几天等,选取的具体时间段对应于广告的实际需求。所述的时间粒度层次是指时间的不同单位,例如年、月、日分别是不同的时间粒度层次,并且划分时应按照时间单位由大至小的方向依次划分。
具体地,将感兴趣的时间段进划分成由大到小的多层时间粒度,每一层对应多个时间粒度,从而建立时间粒度表,所述的时间粒度表每一列分别代表时间粒度、客体编号以及时空停留区域,其中第一列按照所述的时间粒度大小进行排序。
本实施例中,选用感兴趣的时间段为7天,并从数据库中导出在这7天内的移动对象的GPS轨迹数据;本例从GPS轨迹数据中选取4 个移动对象的数据进行说明。
首先,将感兴趣的时间段按照时间粒度层次进行划分,本例中研究的时间段为7天,将其分为3个时间粒度层,对应9个时间粒度,其中,第一层为周,即时间粒度为周;第二层为周内、周末,即时间粒度为周内/末;第三层为周内的8:30-9:30,周内的12:00-13:00,周内的17:30-18:30,周末的8:30-9:30,周末的12:00-13:00,周末的17:30-18:30,即时间粒度为时,建立了如表1所示的时间粒度表,在该表中,每一个客体在每一个时间粒度下都对应时空停留区域。
表1时间粒度表
步骤3,根据所述的位置信息,获取所述的移动对象在所有时间粒度下的时空停留区域;
其中,时空停留区域是指客体的轨迹在地图上停留的范围,时空停留区域由地图上的多个点构成,即对应于多个客体的停留位置,由于在步骤1中采集到的GPS轨迹数据仅仅是客体在一段时间内的行动轨迹,而无法通过该段轨迹确定其活动范围,活动规律等,因此在本步骤中,根据采集到的GPS移动轨迹,获取移动对象在每一个时间粒度下的时空停留区域,即确定客体在哪一片区域停留,也就是说确定客体在哪里会驻足较长的时间,这样客体才有可能关注到路边的广告,因此本步骤的目的是将客体的GPS轨迹数据转换为客体停留过的区域。
任选一个未被访问的轨迹点开始,找出与其距离在邻域半径之内的所有GPS轨迹点。如果邻域半径内GPS轨迹点的数量大于等于设置的最少轨迹点数阈值,则当前点与其邻域半径内的点形成一个簇,并且出发点被标记为已访问。然后循环重复,以相同的方法处理该簇内所有未被标记为已访问的轨迹点,从而对簇进行扩展,得到具有密度相连的轨迹点的最大集合,将此集合内的GPS轨迹点构成的区域作为一个时空停留区域,并将其填入所述的时间粒度表中,直至将时间粒度表填满,获得所述的移动对象在所有时间粒度下的时空停留区域。
具体地,位置信息是指步骤1中存入数据库的GPS轨迹数据,这些GPS移动轨迹包括多个客体的GPS移动轨迹,因此在步骤3中,将每一个客体的GPS移动轨迹,根据步骤2中划分的时间粒度进行划分后,实际上这一个客体在当前时间粒度下的GPS移动轨迹是由多个GPS单点构成,将这些点映射到地图上之后,依次选取地图上的点作为圆心,进行判断。
在本实施例中,选取半径Eps为4米,阈值MinPts为10个,即在以在地图上随机的一点(GPS轨迹数据点)为圆心,其半径为4米的范围内,计算落入其中的GPS单点的个数,若落入其范围内GPS单点的个数大于10个,则当前点与其邻域半径内的点形成一个簇,并且出发点被标记为已访问。然后递归,以相同的方法处理该簇内所有未被标记为已访问的轨迹点,从而对簇进行扩展,得到具有密度相连的轨迹点的最大集合,将此集合内的GPS轨迹点构成的区域作为移动客体的一个时空停留区域,该时空停留区域使用矩形表示法,使用其左上角、右下角两个坐标进行表示,即以左上角、右下角的两个点分别为矩形区域的两个对角点,这里的矩形区域即为所述的时空停留区域,如表2所示:
表2时空停留区域示意表
当对一个客体在当前时间粒度下的时空停留区域计算出来后,例如,此时计算出来的是编号为001的客体在时间粒度为周的时空停留区域,再根据步骤2中划分出来的从小到大的顺序,继续计算该单独客体下一个时间粒度下的时空停留区域,例如编号为001的客体在时间粒度为周内的时空停留区域,再计算编号为001的客体在时间粒度为周末的时空停留区域,直至将该单独客体的每一个时间粒度下的时空停留区域计算出来,即获得单独客体在所有时间粒度下的时空停留区域;之后计算下一个单独客体在所有时间粒度下的时空停留区域直至将所有的单独客体在所有时间粒度下的时空停留区域填入所述的时间粒度表中,即获得了移动对象在所有时间粒度下的时空停留区域。
例如,在本实施例中,客体个数为4,时间粒度由大到下为周—周内/末—时,填充完成后的时间粒度表如表3所示。
表3填充后的时间粒度表
步骤4,根据步骤3中获取的时空停留区域,计算所述的移动对象在所有时间粒度下的时空频繁区域;
其中,步骤3中获取的时空停留区域是在每一个时间粒度下的时空停留区域,也就是说仅仅是移动对象停留过的区域,该区域包括偶尔路过停留的区域,也包括经常停留的区域,例如地铁站等。而在广告投放的过程中,为了尽可能使得投放效率高,应该选取移动对象经常停留的区域作为投放目标地,因此本步骤就将在步骤3获取的时空停留区域中进行计算,筛选出移动对象经常停留的区域即时空频繁区域。具体地,计算时空停留区域的方法可以是根据客体在同一地点下的停留时间长短设定阈值进行筛选,也可以是计算一段时间内客体重复访问该地点的次数。
具体地,当所述的移动对象在当前时间粒度下的时空停留区域的支持度大于支持度阈值,则将该时间粒度下的时空停留区域标记为当前时间粒度下的时空频繁区域,按时间粒度从大到小的顺序依次计算出所述的移动对象在所有时间粒度下的时空频繁区域;
其中,所述的当前时间粒度下的时空停留区域的支持度为该时间粒度下访问该时空停留区域的移动对象总数与该时间粒度下移动对象总数的比值。这里的时间粒度即为本例中时间粒度表中的9个不同的时间粒度。
在每一个时间粒度下都存在多个时空停留区域,在步骤4中对每一个时空停留区域进行筛选,选取其中客体经常活动的频繁区域,将该频繁区域作为当前时间粒度下的时空频繁区域后,进行循环重复,直至计算出每一个时间粒度下的时空频繁区域,即获得所有时间粒度下的时空频繁区域,建立时空频繁区域表,如表4所示,表中每一列分别代表时间粒度以及时空频繁区域。
本例中,选取其中客体经常活动的频繁区域的方法可以是判断在该区域内的移动客体的密度是否大于阈值、移动客体的个数是否大于阈值等。
例如,采用设置支持度Sup(Stay_Region)的方法,即计算在每一个时间粒度下的时空停留区域的支持度其中c为在该时间粒度下访问该时空停留区域的移动对象总数,K为在该时间粒度下移动对象的总数,并且设置了阈值σ,其中σ≤1,若 Sup(Stay_Region)≥σ,则将该时空停留区域填入表4的对应时间粒度下的时空频繁区域,即该时空停留区域为时空频繁区域。
在本实施例中,时间粒度为周,阈值σ=0.3,当前访问青年公寓的移动对象有2人,当前移动对象的总数是4人,因此青年公寓是时空频繁区域,依次得出每一个时间粒度下的时空频繁区域,直至将表3中每一个时空停留区域都计算完,并对应地填入到表4中,计算出移动对象在所有时间粒度下的时空频繁区域。
表4时空频繁区域表
另外,阈值σ的选取对最终获得的时空频繁区域的结果也会产生影响,如图3至图4所示,时间粒度为周、周内/末、时的情况下,所计算出的时空频繁区域的个数与阈值σ的选取之间的关系,随着σ的增大,挖掘出的时空频繁区域数据逐渐减少直至为0。
步骤5,根据步骤4得到的时空频繁区域,计算所述移动对象在所有时间粒度下的核心时空频繁区域;
其中,根据步骤3计算出的时空频繁区域后,为使广告投放效率能够更高,在以上计算出的时空频繁区域中,若某两个区域之间存在相交,包含的情况,则说明该区域为较多的移动客体经常访问的区域,因此相交或者被包含的部分就是广告投放的重点区域,即核心时空频繁区域。具体地,计算核心时空频繁区域的方法可以是设定将每一个时空频繁区域定义为一个集合,通过集合间相交或者包含的关系进行计算。
将所有的时间粒度下的每一个时空频繁区域记为一个集合其中i代表当前的时间粒度,j代表第j个在当前时间粒度下的时空频繁区域;
将同一时间粒度下的多个集合进行两两相交,将其交集作为当前时间粒度下的核心时空频繁区域,按照时间粒度从大到小的顺序依次计算出所述的移动对象在所有时间粒度下的核心时空频繁区域。
其中,根据步骤4得到的时空频繁区域是指在多个时间粒度下的时空频繁区域,即在每一个时间粒度下都存在时空频繁区域,在本实施例中,首先计算在当前时间粒度下的核心时空频繁区域,具体地,通过计算当前时间粒度下的时空频繁区域的重叠、相交或者包含的关系,如图5至图7所示,获得当前时间粒度下的核心时空频繁区域;之后进行循环重复,直至计算出所有时间粒度下的核心时空频繁区域,建立核心时空频繁区域表,如表5所示,在该表中,每一列分别代表时间粒度、核心时空频繁区域。
在本实施例中,代表时间粒度为周时的第1个时空频繁区域—青年公寓,代表时间粒度为周时的第2个时空频繁区域—青年公寓 6号楼,由于青年公寓包含青年公寓6号楼,因此即时间粒度为周时的一个核心时空区域为青年公寓6号楼;代表时间粒度为周时的第9个时空频繁区域—Region_A(包含分米鸡),代表时间粒度为周时的第13个时空频繁区域—Region_B(包含分米鸡),因此即时间粒度为周时的又一个核心时空区域为分米鸡,按照时间粒度从大到小的顺序,依次将每一个时间粒度下的核心时空频繁区域都计算出来,填入表5中。
表5核心时空频繁区域表
步骤6,根据所述核心时空频繁区域的信息,获取所述移动对象的活动规律,制定基于位置信息的广告投放策略。
其中,核心时空频繁区域是指在每一个时间粒度下的时空频繁区域,根据每一个时间粒度下的时空频繁区域,获取移动对象在当前时间粒度下的活动规律,再根据该活动规律指定广告的投放策略。
相比于单一时间粒度,多层的时间粒度下可以挖掘出随着时间粒度的变化,核心时空频繁区域的变化情况。不同时间粒度下挖掘出的核心时空频繁区域并非像时间粒度一样呈简单包含关系。与周内/末相比,周能够挖掘出在周末、周内均未出现的核心时空频繁区域,比如一些休闲区;与周相比,周末能够挖掘出时间粒度为周未出现的核心时空频繁区域,比如移动对象客体经常访问的一些地铁站和休闲区;与周相比,周内能够挖掘出时间粒度为周未出现的核心时空频繁区域,比如周内移动对象经常访问的地铁站等,由此可以得出,移动对象在周内经常访问地铁站、周末则为地铁站与休闲区,因此可以根据该活动规律,将广告在周内投放至移动对象经常访问的地铁站,在周末时投放至移动对象经常访问的休闲区,以提高广告投放的效率。
具体地,在本步骤中,将所述的移动对象在每一个时间粒度下的所述核心时空频繁区域映射至地图上,得到核心时空频繁区域地图,分析移动对象的活动规律,并将广告根据所述的活动规律投放至所述的核心时空频繁区域。
将表5中的核心时空频繁区域映射至地图上,具体地,将时间粒度为周、周内、周内下的核心时空频繁区域映射至地图1上,如图8 所示,用五边形代表时间粒度为周的核心时空频繁区域,例如北四环路周围的D3区域,六边形代表时间粒度为周内的核心时空频繁区域,例如知春里地铁站C4区域,三角形代表时间粒度为周末的核心时空频繁区域,例如高尔夫俱乐部附近的D11区域,并且在地图1上标注了一些时间粒度重合的区域,例如,在时间粒度为周和周内,五道口地铁站C3都是核心时空频繁区域,在时间粒度为周、周内和周末,双榆树冬里附近的A3区域是核心时空频繁区域,其中地图1上的A 代表生活区,B为工作区,C为地铁站&公交站,D为休闲区。
在本实施例中,计算出核心时空频繁区域后,时间粒度为周、周内、周末的情况下,时间粒度为周,核心时空频繁区域包括欧美汇购物中心、外婆家等休闲区,而时间粒度为周内,其核心时空频繁区域仅有苏州街站、知春里站等常访问的地铁站,因此一些为投放对象为上班族的广告不仅能投放在他们常访问的地铁站点,如苏州街站、知春里站等,也可以投放在欧美汇购物中心、外婆家等休闲区,以提高广告的投放效率。
将时间粒度为周内8:30-9:30、周内12:00-13:00、周内 17:30-18:30的核心时空频繁区域映射至地图2上,如图9所示,其中地图2上的A代表生活区,B为工作区,C为地铁站&公交站,D为休闲区,周内8:30-9:30的核心时空频繁区域有苏州街站C2区域、知春里站C4区域等,周内12:00-13:00的核心时空频繁区域有人民大学北路附近的A7区域、美嘉欢乐影城附近的D2区域等,周内 17:30-18:30的核心时空频繁区域有中关村皇冠假日酒店A9附近的区域、北京大学附属中学A1附近的区域等,周内8:30-9:30与周内 17:30-18:30,这两段时间一般是上下班的时间,因此在这段时间内,客体的流量最大,在地图2上可以看出,双榆树附近的A3区域既是周内8:30-9:30的核心时空频繁区域,也是周内17:30-18:30的核心时空频繁区域,因此在这个区域可以投放针对于上班族的广告信息;而在周内17:30-18:30的时间粒度下,也是下班的时间,因此可以在中关村皇冠假日酒店A9附近的区域投放适合上班族在晚上休闲时间进行休闲的广告,例如说健身机构的广告或者是电影院的广告等等,以提高广告投放的效率。
因此,通过本申请提供的一种基于多维时间粒度时空频繁区域挖掘方法,如图10所示,将时间进行分层从而形成多层的时间粒度,针对每一个时间粒度下的时空频繁区域进行挖掘,相比于单一时间粒度,多层的时间粒度下可以挖掘出随着时间粒度的变化,频繁区域的变化情况,因此可以根据频繁区域的变换情况,寻找移动对象的活动规律,根据活动规律,制定相应的广告投放计划,使得广告投放更具有针对性,以提高广告投放效率。
另外,本申请提供的挖掘方法不仅可以应用在基于位置的广告投放领域,也可以应用在共享单车投放选址、交通流量控制等应用领域,例如根据不同时间粒度下的移动对象的活动规律,在周内的早晨将共享单车投放在核心频繁区域内,提供共享单车的利用效率等。
Claims (7)
1.一种基于多维时间粒度时空频繁区域挖掘的方法,包括以下步骤:
步骤1,采集移动对象的位置信息以及对应的时间信息;
步骤2,将感兴趣的时间段按时间粒度层次进行划分,形成多层的时间粒度;
步骤3,根据所述的位置信息,获取所述的移动对象在所有时间粒度下的时空停留区域;
步骤4,根据步骤3中获取的时空停留区域,计算所述的移动对象在所有时间粒度下的时空频繁区域;
步骤5,根据步骤4得到的时空频繁区域,计算所述移动对象在所有时间粒度下的核心时空频繁区域;
步骤6,根据所述核心时空频繁区域的信息,获取所述移动对象的活动规律,制定基于位置信息的广告投放策略。
2.如权利要求1所述的基于多维时间粒度时空频繁区域挖掘的方法,其特征在于,所述的采集移动对象的位置信息以及对应的时间信息具体是指:
所述的移动对象包括多个单独移动的客体,所述的位置信息为所述客体的GPS移动轨迹,该GPS轨迹数据包括经度、纬度,所述的时间信息是指每一条GPS轨迹数据所对应的时间。
3.如权利要求2所述的基于多维时间粒度时空频繁区域挖掘的方法,其特征在于,所述的将感兴趣的时间段按时间粒度层次进行划分,形成多层的时间粒度,具体是指:
将感兴趣的时间段进划分成由大到小的多层时间粒度,每一层对应多个时间粒度,从而建立时间粒度表,所述的时间粒度表每一列分别代表时间粒度、客体编号以及时空停留区域,其中第一列按照所述的时间粒度大小进行排序。
4.如权利要求3所述的基于多维时间粒度时空频繁区域挖掘的方法,其特征在于,所述的根据所述的位置信息,获取所述的移动对象在所有时间粒度下的时空停留区域具体是指:
任选一个未被访问的GPS轨迹点开始,找出与其距离在邻域半径之内的所有GPS轨迹点,如果邻域半径内GPS轨迹点的数量大于等于设置的最少GPS轨迹点数阈值,则当前点与其邻域半径内的点形成一个簇,并且出发点被标记为已访问,然后循环重复,以相同的方法处理该簇内所有未被标记为已访问的GPS轨迹点,从而对簇进行扩展,得到具有密度相连的轨迹点的最大集合,将此集合内的GPS轨迹点构成的区域作为一个时空停留区域,并将其填入所述的时间粒度表中,直至将时间粒度表填满,获得所述的移动对象在所有时间粒度下的时空停留区域。
5.如权利要求4所述的基于多维时间粒度时空频繁区域挖掘的方法,其特征在于,所述的根据步骤3中获取的时空停留区域,计算所述的移动对象在所有时间粒度下的时空频繁区域具体包括:
当所述的移动对象在时间粒度下的时空停留区域的支持度大于支持度阈值,则将该时间粒度下的时空停留区域标记为时空频繁区域,按时间粒度从大到小的顺序依次计算出所述的移动对象在所有时间粒度下的时空频繁区域;
其中,所述的时间粒度下的时空停留区域的支持度为该时间粒度下访问该时空停留区域的移动对象总数与该时间粒度下移动对象总数的比值。
6.如权利要求5所述的基于多维时间粒度时空频繁区域挖掘的方法,其特征在于,根据步骤4得到的时空频繁区域,计算所述移动对象在所有时间粒度下的核心时空频繁区域具体是指:
将所有的时间粒度下的每一个时空频繁区域记为一个集合其中i代表当前的时间粒度,j代表第j个在当前时间粒度下的时空频繁区域;
将同一时间粒度下的多个集合进行两两相交,将其交集作为当前时间粒度下的核心时空频繁区域,按照时间粒度从大到小的顺序依次计算出所述的移动对象在所有时间粒度下的核心时空频繁区域。
7.如权利要求1所述的基于多维时间粒度时空频繁区域挖掘的方法,其特征在于,所述的根据所述核心时空频繁区域的信息,获取所述移动对象的活动规律,制定基于位置信息的广告投放策略具体是指:
将所述的移动对象在每一个时间粒度下的所述核心时空频繁区域映射至地图上,得到核心时空频繁区域地图,分析移动对象的活动规律,并将广告根据所述的活动规律投放至所述的核心时空频繁区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711461433.7A CN108230020B (zh) | 2017-12-28 | 2017-12-28 | 一种基于多维时间粒度时空频繁区域挖掘的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711461433.7A CN108230020B (zh) | 2017-12-28 | 2017-12-28 | 一种基于多维时间粒度时空频繁区域挖掘的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108230020A true CN108230020A (zh) | 2018-06-29 |
CN108230020B CN108230020B (zh) | 2021-05-04 |
Family
ID=62645791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711461433.7A Active CN108230020B (zh) | 2017-12-28 | 2017-12-28 | 一种基于多维时间粒度时空频繁区域挖掘的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108230020B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109656967A (zh) * | 2018-11-09 | 2019-04-19 | 北京京东金融科技控股有限公司 | 基于空间的大数据挖掘处理方法、装置、介质及电子设备 |
CN110046218A (zh) * | 2019-05-13 | 2019-07-23 | 东软集团股份有限公司 | 一种用户出行模式的挖掘方法、装置、系统和处理器 |
CN110458589A (zh) * | 2019-02-01 | 2019-11-15 | 吉林大学 | 基于轨迹大数据的路侧式出租车停靠站选址优选方法 |
CN112669537A (zh) * | 2020-12-17 | 2021-04-16 | 上海交通大学 | 基于Wi-Fi日志的校园共享单车投放信息处理方法及装置 |
CN112818216A (zh) * | 2021-01-13 | 2021-05-18 | 平安科技(深圳)有限公司 | 客户推荐方法、装置、电子设备及存储介质 |
CN112901275A (zh) * | 2021-02-25 | 2021-06-04 | 北方民族大学 | 基于环境监测大数据的煤矿安全状态监测方法 |
CN113344052A (zh) * | 2021-05-28 | 2021-09-03 | 东南大学 | 基于泰森多边形和k均值聚类的时空频繁模式挖掘方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080091529A1 (en) * | 2006-07-24 | 2008-04-17 | Bailey Kenneth S | Fly Buy Coupon System |
CN103324706A (zh) * | 2013-06-17 | 2013-09-25 | 中国矿业大学 | 具有时间约束的轨迹数据热点区域的方法 |
CN104931041A (zh) * | 2015-05-03 | 2015-09-23 | 西北工业大学 | 一种基于用户轨迹数据的地点序列预测方法 |
CN107194434A (zh) * | 2017-06-16 | 2017-09-22 | 中国矿业大学 | 一种基于时空数据的移动对象相似度计算方法及系统 |
-
2017
- 2017-12-28 CN CN201711461433.7A patent/CN108230020B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080091529A1 (en) * | 2006-07-24 | 2008-04-17 | Bailey Kenneth S | Fly Buy Coupon System |
CN103324706A (zh) * | 2013-06-17 | 2013-09-25 | 中国矿业大学 | 具有时间约束的轨迹数据热点区域的方法 |
CN104931041A (zh) * | 2015-05-03 | 2015-09-23 | 西北工业大学 | 一种基于用户轨迹数据的地点序列预测方法 |
CN107194434A (zh) * | 2017-06-16 | 2017-09-22 | 中国矿业大学 | 一种基于时空数据的移动对象相似度计算方法及系统 |
Non-Patent Citations (1)
Title |
---|
袁冠: "移动对象轨迹数据挖掘方法研究", 《中国优秀博士学位论文全文数据库 信息科技辑》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109656967A (zh) * | 2018-11-09 | 2019-04-19 | 北京京东金融科技控股有限公司 | 基于空间的大数据挖掘处理方法、装置、介质及电子设备 |
CN110458589A (zh) * | 2019-02-01 | 2019-11-15 | 吉林大学 | 基于轨迹大数据的路侧式出租车停靠站选址优选方法 |
CN110046218A (zh) * | 2019-05-13 | 2019-07-23 | 东软集团股份有限公司 | 一种用户出行模式的挖掘方法、装置、系统和处理器 |
CN110046218B (zh) * | 2019-05-13 | 2021-05-07 | 东软集团股份有限公司 | 一种用户出行模式的挖掘方法、装置、系统和处理器 |
CN112669537A (zh) * | 2020-12-17 | 2021-04-16 | 上海交通大学 | 基于Wi-Fi日志的校园共享单车投放信息处理方法及装置 |
CN112669537B (zh) * | 2020-12-17 | 2022-08-09 | 上海交通大学 | 基于Wi-Fi日志的校园共享单车投放信息处理方法及装置 |
CN112818216A (zh) * | 2021-01-13 | 2021-05-18 | 平安科技(深圳)有限公司 | 客户推荐方法、装置、电子设备及存储介质 |
CN112818216B (zh) * | 2021-01-13 | 2021-09-28 | 平安科技(深圳)有限公司 | 客户推荐方法、装置、电子设备及存储介质 |
CN112901275A (zh) * | 2021-02-25 | 2021-06-04 | 北方民族大学 | 基于环境监测大数据的煤矿安全状态监测方法 |
CN112901275B (zh) * | 2021-02-25 | 2022-09-09 | 北方民族大学 | 基于环境监测大数据的煤矿安全状态监测方法 |
CN113344052A (zh) * | 2021-05-28 | 2021-09-03 | 东南大学 | 基于泰森多边形和k均值聚类的时空频繁模式挖掘方法 |
CN113344052B (zh) * | 2021-05-28 | 2024-04-09 | 东南大学 | 基于泰森多边形和k均值聚类的时空频繁模式挖掘方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108230020B (zh) | 2021-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108230020A (zh) | 一种基于多维时间粒度时空频繁区域挖掘的方法 | |
CN107872808B (zh) | 一种wlan站址预测分析方法及装置 | |
CN109544690B (zh) | 共享单车出行影响因素识别方法、系统及存储介质 | |
Quatrini et al. | Is new always better than old? Accessibility and usability of the urban green areas of the municipality of Rome | |
CN102637358A (zh) | 立足市民满意度的公共自行车服务系统及调度配送方法 | |
CN104252489A (zh) | 一种根据经纬度数据快速获得位置文字描述信息的方法 | |
CN109800940A (zh) | 一种充电桩选址方法及装置 | |
CN110059860A (zh) | 一种城市的公共充电站位置布局多目标优化方法 | |
CN110413855A (zh) | 一种基于出租车下客点的区域出入口动态提取方法 | |
Afshari et al. | Land capability assessment for regional planning using AHP and GIS at Shandiz Urban Region, Northeast Iran | |
Gimblett et al. | Simulating wildland recreation use and conflicting spatial interactions using rule-driven intelligent agents | |
Xuan et al. | Research on Correlation between Spatial Quality of Urban Streets and Pedestrian Walking Characteristics in China Based on Street View Big Data | |
Liu et al. | Security patterns and resistance surface model in urban development: Case study of Sanshui, China | |
Chaudhuri et al. | Application of web-based Geographical Information System (GIS) in tourism development | |
CN116976692A (zh) | 一种基于适应性循环路径的传统村落分类分区保护控制方法 | |
Hayakawa et al. | Analysis of quality of data in OpenStreetMap | |
CN106231555A (zh) | 一种人口空间分布的模拟方法及装置 | |
Li | Application of Spatial-Temporal Behavioral Trajectory Analysis in the Space Design of Digital Villages | |
Zheng et al. | Spatial Accessibility of Urban Green Space Based on Multiple Research Scales: A Case Study of Futian District, Shenzhen. | |
Pandey | Land Use and Land Cover Planning of Gondia Municipal City, Maharashtra State, India Using Remote Sensing & GIS Techniques | |
Daneshvar | Land evaluation based on GIS for spatial management of an urbanized region, NE Iran | |
CN110189029A (zh) | 一种基于大规模手机位置数据的自行车骑车与停车需求评估方法 | |
Jehn et al. | A GIS Performance Measure-based Methodology for Prioritizing Bike Share System Expansion | |
Su et al. | Research on the Boundary Delimitation Method of National Park Based on Cultural Service Protection | |
Hartmann et al. | Vail: explaining growth dynamics of a Colorado Ski Resort Town |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |