CN110020222A - 标志点确定方法、装置及存储介质 - Google Patents

标志点确定方法、装置及存储介质 Download PDF

Info

Publication number
CN110020222A
CN110020222A CN201711318468.5A CN201711318468A CN110020222A CN 110020222 A CN110020222 A CN 110020222A CN 201711318468 A CN201711318468 A CN 201711318468A CN 110020222 A CN110020222 A CN 110020222A
Authority
CN
China
Prior art keywords
subregion
preset window
operating quantity
location information
index point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711318468.5A
Other languages
English (en)
Other versions
CN110020222B (zh
Inventor
潘广谋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Beijing Co Ltd
Original Assignee
Tencent Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Beijing Co Ltd filed Critical Tencent Technology Beijing Co Ltd
Priority to CN201711318468.5A priority Critical patent/CN110020222B/zh
Publication of CN110020222A publication Critical patent/CN110020222A/zh
Application granted granted Critical
Publication of CN110020222B publication Critical patent/CN110020222B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种标志点确定方法、装置及存储介质,属于数据挖掘领域。方法包括:将目标区域划分为多个子区域,根据历史操作记录中至少一个操作行为的位置信息统计每个子区域的操作量;选取操作量大于预设操作量的子区域作为初始中心子区域;以初始中心子区域作为预设窗口的中心子区域,将预设窗口向总操作量变大的方向移动,直至预设窗口不再移动时为止;根据预设窗口当前包括的子区域的操作量和位置信息,确定标志点的位置信息。本发明实施例保证挖据出的标志点能够与热门区域相吻合,并且无需人工挖掘标志点,大大降低了人力成本,提高了挖掘效率,可以挖掘出足够数量的标志点,足以满足LBS的业务需求。

Description

标志点确定方法、装置及存储介质
技术领域
本发明涉及数据挖掘领域,特别涉及一种标志点确定方法、装置及存储介质。
背景技术
LBS(Location Based Service,基于位置的服务)是基于移动终端的位置信息为移动终端用户提供服务的技术,采用LBS能够为用户提供周围标志点的业务信息,如为用户推荐附近的景点或者为用户发放附近餐厅的优惠券等。LBS的实现依赖于标志点的确定,只有确定了足够多的标志点,才能更好地为用户提供服务。
确定标志点是一项费事费力的工作,通常情况下,针对一个目标区域,需要人工查看该目标区域,确定该目标区域内存在的标志点,并采集该标志点的位置信息,从而挖掘出多个标志点。
在实现本发明实施例的过程中,发明人发现相关技术至少存在以下缺陷:人工挖掘标志点的方法,挖掘效率非常低,需要耗费大量的人力成本,而且仅能挖掘出少量的标志点,无法满足LBS的业务需求。
发明内容
本发明实施例提供了一种标志点确定方法、装置及存储介质,可以解决相关技术的问题。所述技术方案如下:
第一方面,提供了一种标志点确定方法,所述方法包括:
将目标区域划分为多个子区域,根据历史操作记录中至少一个操作行为的位置信息统计每个子区域的操作量;
从所述多个子区域中,选取操作量大于预设操作量的子区域作为预设窗口的初始中心子区域;
将所述预设窗口向总操作量变大的方向移动,直至所述预设窗口不再移动时为止,所述总操作量根据所述预设窗口包括的所有子区域的操作量确定;
根据所述预设窗口当前包括的子区域的操作量和位置信息,确定标志点的位置信息。
第二方面,提供了一种标志点确定装置,所述装置包括:
划分模块,用于将目标区域划分为多个子区域,根据历史操作记录中至少一个操作行为的位置信息统计每个子区域的操作量;
初始选取模块,用于从所述多个子区域中,选取操作量大于预设操作量的子区域作为预设窗口的初始中心子区域;
移动模块,用于将所述预设窗口向总操作量变大的方向移动,直至所述预设窗口不再移动时为止,所述总操作量根据所述预设窗口包括的所有子区域的操作量确定;
确定模块,用于根据所述预设窗口当前包括的子区域的操作量和位置信息,确定标志点的位置信息。
第三方面,提供了一种标志点确定装置,所述标志点确定装置包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现如第一方面所述的标志点确定方法中所执行的操作。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现如第一方面所述的标志点确定方法中所执行的操作。
本发明实施例提供的技术方案带来的有益效果是:
本发明实施例提供的方法、装置及存储介质,通过将目标区域划分为多个子区域,根据历史操作记录中至少一个操作行为的位置信息统计每个子区域的操作量,选取操作量大于预设操作量的子区域,作为预设窗口的初始中心子区域,并将预设窗口向总操作量变大的方向移动,直至预设窗口不再移动时为止,根据预设窗口当前包括的子区域的操作量和位置信息,确定标志点的位置信息。本发明实施例以目标区域中各个子区域的操作量来表示各个子区域的热门程度,从而根据多个子区域的操作量和位置信息挖掘标志点,保证挖据出的标志点能够与人流密集、社交属性强的热门区域相吻合,并且无需人工挖掘标志点,大大降低了人力成本,提高了挖掘效率,可以挖掘出足够数量的标志点,足以满足LBS的业务需求。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种标志点确定方法的流程图;
图2是本发明实施例提供的一种子区域操作量的示意图;
图3是本发明实施例提供的一种公园标志点的示意图;
图4是本发明实施例提供的一种学校标志点的示意图;
图5是本发明实施例提供的一种标志点确定装置的结构示意图;
图6是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种挖掘目标区域中标志点的方法,对于给定的目标区域,能够以目标区域中各个子区域的操作量来表示各个子区域的热门程度,从而根据多个子区域的热门程度确定标志点,保证挖据出的标志点能够与人流密集、社交属性强的热门区域相吻合,并且挖掘效率很高,无需人工挖掘标志点,可以挖掘出足够数量的标志点。
本发明实施例可以应用于LBS的场景下,挖掘出多个标志点后,可以根据移动终端的位置信息以及附近标志点的位置信息,向移动终端推送标志点的业务信息,基于标志点的业务信息为用户提供相应的服务。由于标志点与热门区域相吻合并且数量足够多,因此可以提供更好的服务,更能满足用户的需求。
例如,针对一个较大面积的公园,采用人工挖掘的方法只能挖掘出几个大型的景点,而采用本发明实施例提供的方法,可以挖掘出很多用户常去的区域,不仅包括大型的景点,还包括一些人工不易发现的区域,如公园中的一个摊位、一条游览路线等,那么,当用户在公园游览时,可以向用户推荐这些区域。
图1是本发明实施例提供的一种标志点确定方法的流程图,该标志点确定方法的执行主体为挖掘服务器,参见图1,该方法包括:
101、将目标区域划分为多个子区域。
其中,该目标区域为需要挖掘标志点的区域,可以为任意类型、任意面积的地理区域,例如公园、学校、游乐园等。或者,考虑到在公园门口、学校门口等边界处也存在很多热门标志点,因此为了避免遗漏边界处的标志点,所设置的目标区域可以为某一地理区域以及该地理区域的周边区域,例如公园和公园门口的街道组成的区域等。
实际应用中,对任一目标区域均可采用本发明实施例提供的方法挖掘标志点,或者,也可以对面积较大的目标区域采用本发明实施例提供的方法挖掘标志点,而对面积较小的目标区域采用人工挖掘的方式挖掘标志点。
挖掘标志点时,先将目标区域划分为多个子区域,并确定每个子区域的位置信息,以便从多个子区域中选取比较热门的子区域作为标志点。其中,子区域可以为方形形状或者六边形形状等,如正方形、长方形、正六边形等,子区域的位置信息可以以子区域中某一位置点的位置信息来表示,该位置点可以为子区域的中心点或者左上角等,该位置信息可以为经纬度坐标或者其他形式的位置信息。
进行划分时可以将投影到二维水平面的目标区域划分为面积相等的多个子区域,或者也可以采用墨卡托投影将目标区域划分为多个子区域,划分出的多个子区域的面积近似相等。墨卡托投影是针对地球上的地理区域,假想一个与地轴方向一致的圆柱切或割于地球,按等角条件将经纬网投影到圆柱面上,将圆柱面展为平面后得到的投影。
在一种可能实现方式中,参见图2,将投影到二维水平面的目标区域的经纬度坐标按照等距方格进行离散化,即可得到多个方形的子区域,根据该多个子区域的位置信息生成二维平面点阵,二维平面点阵中的一个点代表一个子区域,可以从该多个子区域中选取标志点。
如果该目标区域的形状不规则而导致按照等距方格进行离散化之后,在边缘处存在着一些面积小于该等距方格面积的边缘区域,则为了保证挖掘的全面性,也可以保留这些剩余的边缘区域,或者为了提高计算速度,可以将这些剩余的边缘区域删除,仅根据保留的方形区域挖掘标志点。
其中,该等距方格的尺寸可以默认设定,或者根据要挖掘的标志点的数量以及目标区域的面积设定,或者也可以采用其他方式设定。
102、根据历史操作记录中至少一个操作行为的位置信息统计每个子区域的操作量。
其中,历史操作记录中至少包括收集到的操作行为的位置信息,该位置信息可以包括经纬度坐标,用于表示操作行为发生的位置,且该位置信息还可以包括操作行为关联的地理区域,用于表示与该操作行为关联的地理区域。历史操作记录中还可以包括操作行为的时间信息、用户信息、操作类型等。挖掘服务器可以根据收集到的多个移动终端的操作行为数据生成历史操作记录,并在使用过程中对该历史操作记录进行更新。
例如,用户使用移动终端发布动态消息时,可以选择该动态信息关联的区域进行发布,此时根据该发布操作、该移动终端执行该发布操作时的位置信息以及关联的区域生成发布操作记录。
在挖掘标志点时,历史操作记录中包括至少一个操作行为的位置信息,根据这些操作行为的位置信息,统计在每个子区域内发生的操作行为,进而统计每个子区域内发生的操作行为的数量,即可得到每个子区域的操作量。
操作量越高,表示在对应的子区域内发生的操作行为越多,用户活跃性越强,该子区域越热门,而操作量越低,表示在对应的子区域内发生的操作行为越少,用户活跃性越弱,该子区域越冷门。因此,统计的操作量可以作为用户活动热度的离散分布,根据每个子区域的操作量挖掘标志点,可以挖掘出较为热门的标志点。
在一种可能实现方式中,根据这些操作行为的位置信息统计在每个子区域内发生的操作行为时,可以根据每个操作行为关联的区域,将与该目标区域不关联的操作行为过滤掉,仅根据与该目标区域关联的操作行为进行统计。也即是,当用户在两个区域的交界处执行了某些操作行为,并选定了该操作行为关联的其中一个区域,则在对另一个区域进行标志点挖掘时将该操作行为过滤掉。
在一种可能实现方式中,考虑到随着时间的推移用户感兴趣的区域可能会发生变化,则为了提高精确度,可以根据历史操作记录中至少一个操作行为的时间信息,对预设时长内的操作行为的位置信息进行统计,而无需考虑预设时长之前的操作行为,以保证统计出的操作量符合近期的实际人流情况。其中,该预设时长可以为一周、一个月、一年等,具体可以根据统计需求确定。
103、从多个子区域中,选取操作量大于预设操作量的子区域作为预设窗口的初始中心子区域。
挖掘标志点之前可以设置预设操作量,判断每个子区域的操作量是否大于预设操作量,从而根据判断结果从多个子区域中选取操作量大于预设操作量的子区域,作为预设窗口的初始中心子区域,后续将会从这些初始中心子区域开始,通过移动该预设窗口来挖掘标志点。操作量大于预设操作量的子区域,可以认为是操作量较大的子区域,从这些子区域开始挖掘,可以先筛选掉操作量较小的子区域,从而加快挖掘速度,提高挖掘效率。
其中,该预设操作量可以根据该目标区域内的平均操作量确定,或者综合考虑对挖掘范围的需求以及对计算量的需求确定,或者随着时间的推移该预设操作量还可以相应增加。
104、当选取了多个初始中心子区域时,按照操作量从大到小的顺序对多个初始中心子区域进行排序,按照多个初始中心子区域的排列顺序,依次计算相邻排列的两个初始中心子区域之间的距离,并在这两个初始中心子区域之间的距离小于第一预设距离时,将这两个初始中心子区域中操作量较小的初始中心子区域删除。
如果两个初始中心子区域的距离较近,采用两个初始中心子区域分别挖掘标志点时,挖掘结果很可能相同,而且还会增大计算量,因此为了避免浪费不必要的计算量,当选取了多个初始中心子区域时,将距离小于第一预设距离的两个初始中心子区域进行去重处理,仅保留其中一个初始中心子区域。其中,该第一预设距离可以根据对挖掘粒度和计算量的需求确定。
并且,为了保证去重处理的有序进行,可以先按照操作量从大到小的顺序进行排序,再根据排列顺序,从操作量较大的初始中心子区域开始进行去重处理。排序过程中,针对操作量相等的两个或两个以上的初始中心子区域,可以采用其他的排序标准进行排序,例如按照初始中心子区域的经度坐标从高到低的顺序进行排序,或者按照初始中心子区域的纬度坐标从高到低的顺序进行排序等。通过采用多种排序标准,可以保证排序结果唯一。
需要说明的是,该步骤104为可选步骤,在另一实施例中也可以不执行步骤104,在执行步骤103选取多个初始中心子区域,即可根据该多个初始中心子区域执行下述步骤105。
105、从初始中心子区域开始,将预设窗口向总操作量变大的方向移动,直至预设窗口不再移动时为止。
本发明实施例中,挖掘服务器设置了预设窗口,如滑动窗口等。该预设窗口的形状和尺寸固定,例如该预设窗口可以为方形,尺寸可以为等距方格的整数倍。或者,子区域为六边形,该预设窗口也可以为六边形。例如,预设窗口可以为由3*3的等距方格组成的方形窗口,或者由5*5的等距方格组成的方形窗口,或者还可以为6个六边形包围1个六边形而组成的六边形,或者为12个六边形包围6个六边形,这6个六边形包围1个六边形而组成的六边形。
对于确定的每个初始中心子区域来说,根据初始中心子区域所在的位置以及该预设窗口的尺寸设置一个预设窗口,则该预设窗口内包括多个子区域,初始中心子区域当前位于预设窗口的中心,预设窗口的总操作量根据预设窗口包括的所有子区域的操作量确定,可以为预设窗口包括的所有子区域的操作量的总和,或者也可以根据预设窗口包括的每个子区域的位置确定权重,越靠近预设窗口中心的子区域的权重越大,并根据确定的权重对这些子区域的操作量进行加权求和,得到预设窗口的总操作量。
挖掘过程中,以预设窗口为单位,将预设窗口向总操作量变大的方向移动,直至预设窗口不再移动时为止,此时查找到总操作量最大的区域,在总操作量最大的区域中再挖掘标志点。
为此,对于每个预设窗口来说,以预设窗口当前的中心子区域为第一子区域为例,该第一子区域可以为初始中心子区域,也可以为预设窗口从初始中心子区域所在区域移动一次或多次之后得到的中心子区域。该预设窗口中除第一子区域之外还包括其他子区域,将预设窗口当前的总操作量作为第一子区域对应的总操作量,而对于预设窗口内与第一子区域相邻的每个子区域,计算若以该子区域作为预设窗口的中心子区域时预设窗口的总操作量,作为该子区域对应的总操作量。也即是,每个子区域对应的总操作量可以表示该子区域作为预设窗口的中心子区域时该预设窗口的总操作量,从而能够表示该子区域附近区域的热门程度。
此时,判断与第一子区域相邻的每个子区域对应的总操作量是否大于第一子区域对应的总操作量,如果与第一子区域相邻的第二子区域对应的总操作量大于第一子区域对应的总操作量,则将预设窗口向第二子区域的方向移动,以使预设窗口的中心子区域由第一子区域变为第二子区域。
在一种可能实现方式中,如果与第一子区域相邻的多个第二子区域对应的总操作量均大于第一子区域对应的总操作量,则将预设窗口复制为多个,将每个预设窗口分别向每个第二子区域的方向移动,以使移动完成后多个预设窗口的中心子区域分别由第一子区域变为多个第二子区域。
预设窗口移动之后,重复执行上述移动预设窗口的步骤,直至预设窗口当前的中心子区域对应的总操作量大于预设窗口内与当前的中心子区域相邻的其他子区域对应的总操作量时为止,此时预设窗口所在的位置即为较为热门的区域,从而能够从预设窗口当前包括的子区域中挖掘标志点。
参见图2,预设窗口为3*3的方形窗口,将操作量较大的子区域80作为初始中心子区域,得到第一位置的预设窗口。初始中心子区域周围的8个子区域的操作量分别为60、40、40、20、10、10、10、10,此时的总操作量为200。分别计算以初始中心子区域周围的8个子区域为中心子区域的3*3的方形窗口内所有子区域的操作量的总和,即为这8个子区域对应的总操作量,通过计算确定子区域60对应的总操作量为420,大于初始中心子区域对应的总操作量200,因此将预设窗口从子区域80向子区域60的方向移动,移动到第二位置。
需要说明的是,初始化时所设置的预设窗口数目与初始中心子区域的数目相等,而通过移动之后,最终确定的预设窗口数目可能不变,也可能会由于复制预设窗口而增加,或者由于两个预设窗口移动到同一个位置而减小。
106、根据预设窗口当前包括的子区域的操作量和位置信息,确定标志点的位置信息。
在一种可能实现方式中,预设窗口停止移动后,将预设窗口中操作量最大的子区域作为标志点,因此将操作量最大的子区域的位置信息确定为标志点的位置信息。
在另一种可能实现方式中,考虑到预设窗口中多个子区域的操作量不同,为了在该预设窗口当前所在的位置挖掘出更能体现人流情况的标志点,可以将预设窗口当前包括的每个子区域的操作量作为权重,计算预设窗口当前包括的每个子区域的位置信息的加权平均值,该加权平均值可以表示一个位置信息,将加权平均值表示的位置信息确定为标志点的位置信息。
本发明实施例中,通过上述移动预设窗口的方式可以确定至少一个标志点的位置信息,此时可以将这些标志点作为最终挖掘出的标志点。
或者,在另一实施例中,如果两个标志点的距离较近,为用户推送相关的业务信息时可能会造成重复,因此当确定了多个标志点的位置信息时,可以按照操作量从大到小的顺序对多个标志点进行排序,按照多个标志点的排列顺序,依次计算相邻排列的两个标志点之间的距离,并在两个标志点之间的距离小于第二预设距离时,将两个标志点中操作量较小的标志点的位置信息删除。其中,该第二预设距离可以根据对挖掘粒度和计算量的需求确定。
排序过程中,针对操作量相等的两个或两个以上的标志点,可以采用其他的排序标准进行排序,例如按照标志点的经度坐标从高到低的顺序进行排序,或者按照标志点的纬度坐标从高到低的顺序进行排序等。通过采用多种排序标准,可以保证排序结果唯一。
或者,在另一实施例中,当确定了多个标志点的位置信息时,将所确定的多个标志点的位置信息设置为初始中心点的位置信息,将所确定的多个标志点的数量设置为类别数量,根据多个初始中心点的位置信息和类别数量进行聚类,得到多个类别以及在每个类别内聚类得到的中心点的位置信息。此时确定的中心点即为最终挖掘出的标志点。其中,采用的聚类算法可以为K-means(K均值),GMM(Gaussian Mixture Model,高斯混合模型)等。
相关技术中通常会采用聚类算法挖掘标志点,然而这些传统的聚类算法存在着以下不足:
1、聚类算法需要先确定初始中心点,聚类结果易受到初始中心点的影响,非常不稳定。
2、聚类算法需要事先指定类别数量,也即是最终生成的中心点的数量,但该数量很难预先确定。
3、聚类算法产生的结果中会出现聚类不理想的结果,需要进行进一步地评估。
4、聚类算法通常会将相连的大面积区域聚为一类,仅选取一个中心点,而在挖掘标志点的场景下,针对用户活跃性强、面积大的区域应该挖掘出更多的中心点才能满足需求。
因此,常规的聚类算法无法满足挖掘需求。
而本发明实施例中,根据大多数区域的热力图分析容易发现,操作行为频繁发生的区域与标志点、社交热门区域、道路、人流密集活动区域等热点吻合,而平滑的窗口很容易找到这些热点并移动到这些热点的中心。并且由于预设窗口的尺寸可以设置,在面积较大的联通区域内容易划分出更多的类别,满足挖掘足够数量标志点的需求,无需指定初始的中心点和类别数量,可以得到更为稳定的挖掘结果,挖掘效果非常好。
进一步地,还可以将挖掘标志点的算法与聚类算法相结合,将采用本发明实施例提供的方法挖掘出的标志点作为聚类算法的初始中心点,将挖掘出的标志点数量作为聚类算法的类别数量,采用聚类算法根据多个子区域的位置信息进行聚类,生成多个类别并计算出每个类别对应的中心点,得到最终挖掘出的标志点。
需要说明的是,本发明实施例以执行主体为挖掘服务器为例,该挖掘服务器具有挖据标志点的功能,可以对给定的电子地图中的任一目标区域挖掘标志点。而且,该挖掘服务器具有收集操作行为的功能,可以收集任一移动终端发生的操作行为。
该挖掘服务器可以为在线服务器,在为各个移动终端提供服务的同时,挖掘服务器可以收集移动终端的操作行为,并基于这些操作行为挖掘标志点,或者,该挖掘服务器还可以为离线服务器,在线服务器为各个移动终端提供服务的同时,离线服务器可以收集各个移动终端的操作行为,从而根据历史操作记录挖掘标志点,再将挖掘的标志点投放到在线服务器上进行应用。其中,离线服务器可以采用预定周期,定期地更新标志点。
例如,挖掘服务器可以与多个应用服务器进行交互,实现离线更新。多个应用服务器可以为该挖掘服务器提供接口,在移动终端使用某一应用的过程中,该应用关联的应用服务器可以检测到移动终端在应用中触发的操作行为,此时该应用服务器调用与该挖掘服务器之间的接口,将收集到的操作行为发送给挖掘服务器,由挖掘服务器添加至历史操作记录中,后续挖掘服务器可以应用该历史操作记录挖掘标志点。
本发明实施例提供的方法,通过将目标区域划分为多个子区域,根据历史操作记录中至少一个操作行为的位置信息统计每个子区域的操作量,选取操作量大于预设操作量的子区域,作为预设窗口的初始中心子区域,并将预设窗口向总操作量变大的方向移动,直至预设窗口不再移动时为止,根据预设窗口当前包括的子区域的操作量和位置信息,确定标志点的位置信息。本发明实施例以目标区域中各个子区域的操作量来表示各个子区域的热门程度,利用平滑窗口和移动窗口的方法,根据多个子区域的操作量和位置信息挖掘标志点,保证挖据出的标志点能够与人流密集、社交属性强的热门区域相吻合,能够在局部热度较高的区域额外添加标志点,以此提高标志点的数量,可以挖掘出足够数量的标志点,足以满足LBS的业务需求,优化了LBS拓展业务的用户体验,并且无需人工挖掘标志点,大大降低了人力成本,提高了挖掘效率。
并且,采用本发明实施例确定的标志点作为聚类算法的初始中心点,将确定的标志点的数量作为聚类算法的类别数量,确定了合适的初始中心点和类别数量,采用聚类算法进行聚类时,可以获得稳定的聚类结果,针对用户活跃性强、面积大的区域也能够挖掘足够多的标志点,提高了聚类准确性。
并且,将距离较近的初始中心子区域按照第一预设距离进行过滤筛选,可以实现去重处理,避免了浪费不必要的计算量,降低计算复杂度。
并且,将距离较近的标志点按照第二预设距离进行过滤筛选,可以对挖掘出的标志点进行去重处理,避免了标志点的重复,而且结合聚类算法时可以降低聚类复杂度。
参见图3,采用本发明实施例提供的方法可以针对一个公园挖据出多个标志点,所生成的标志点能够与公园内的道路良好地吻合,说明生成的标志点与人流活动情况吻合。
参见图4,采用本发明实施例提供的方法可以针对一个学校挖据出多个标志点,所生成的标志点能够与学校内重要的景观、建筑等人流密集的区域良好地吻合。
图5是本发明实施例提供的一种标志点确定装置的结构示意图。参见图5,该装置包括:
划分模块501,用于执行上述实施例中将目标区域划分为多个子区域的步骤;
初始选取模块502,用于执行上述实施例中选取初始中心子区域的步骤;
移动模块503,用于执行上述实施例中移动预设窗口的步骤;
确定模块504,用于执行上述实施例中在预设窗口中确定标志点的步骤。
可选地,装置还包括:
排序模块,用于执行上述实施例中对多个初始中心子区域进行排序的步骤;
删除模块,用于执行上述实施例中将操作量较小的初始中心子区域删除的步骤。
可选地,移动模块503,包括:
第一计算单元,用于执行上述实施例中计算第一子区域对应的总操作量;
第二计算单元,用于执行上述实施例中计算与第一子区域相邻的每个子区域对应的总操作量的步骤;
移动单元,用于执行上述实施例中将预设窗口向第二子区域的方向移动的步骤;
第一计算单元、第二计算单元和移动单元用于重复执行移动预设窗口的步骤,直至预设窗口当前的中心子区域对应的总操作量大于预设窗口内的其他子区域对应的总操作量时为止。
可选地,确定模块504,用于执行上述实施例中将操作量最大的子区域确定为标志点的步骤。
可选地,确定模块504,用于执行上述实施例中计算预设窗口当前包括的每个子区域的位置信息的加权平均值的步骤。
可选地,装置还包括:
排序模块,用于执行上述实施例中对多个标志点进行排序的步骤;
删除模块,用于执行上述实施例中将其中一个标志点的位置信息删除的步骤。
需要说明的是:上述实施例提供的标志点确定装置在确定标志点时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将挖掘服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的标志点确定装置与标志点确定方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图6是本发明实施例提供的一种服务器的结构示意图,该服务器600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)622(例如,一个或一个以上处理器)和存储器632,一个或一个以上存储应用程序642或数据644的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器632和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器622可以设置为与存储介质630通信,在服务器600上执行存储介质630中的一系列指令操作。
服务器600还可以包括一个或一个以上电源626,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口658,一个或一个以上键盘656,和/或,一个或一个以上操作系统641,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
服务器600可以用于执行上述标志点确定方法中挖掘服务器所执行的步骤。
本发明实施例还提供了一种标志点确定装置,该标志点确定装置包括处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,指令、程序、代码集或指令集由处理器加载并执行以实现上述实施例的标志点确定方法中所执行的操作。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,该指令、该程序、该代码集或该指令集由处理器加载并执行以实现上述实施例的标志点确定方法中所执行的操作。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种标志点确定方法,其特征在于,所述方法包括:
将目标区域划分为多个子区域,根据历史操作记录中至少一个操作行为的位置信息统计每个子区域的操作量;
从所述多个子区域中,选取操作量大于预设操作量的子区域作为预设窗口的初始中心子区域;
将所述预设窗口向总操作量变大的方向移动,直至所述预设窗口不再移动时为止,所述总操作量根据所述预设窗口包括的所有子区域的操作量确定;
根据所述预设窗口当前包括的子区域的操作量和位置信息,确定标志点的位置信息。
2.根据权利要求1所述的方法,其特征在于,所述从所述多个子区域中,选取操作量大于预设操作量的子区域作为预设窗口的初始中心子区域之后,所述方法还包括:
当选取了多个初始中心子区域时,按照操作量从大到小的顺序对所述多个初始中心子区域进行排序;
按照所述多个初始中心子区域的排列顺序,依次计算相邻排列的两个初始中心子区域之间的距离,并在所述两个初始中心子区域之间的距离小于第一预设距离时,将所述两个初始中心子区域中操作量较小的初始中心子区域删除。
3.根据权利要求1所述的方法,其特征在于,所述将所述预设窗口向总操作量变大的方向移动,直至所述预设窗口不再移动时为止,包括:
当所述预设窗口的中心子区域为第一子区域时,将所述预设窗口当前包括的所有子区域的操作量总和作为所述第一子区域对应的总操作量;
对于所述预设窗口内与所述第一子区域相邻的每个子区域,计算若以所述子区域作为所述预设窗口的中心子区域时所述预设窗口的总操作量,作为所述子区域对应的总操作量;
如果至少一个第二子区域对应的总操作量大于所述第一子区域对应的总操作量,则将所述预设窗口分别向所述至少一个第二子区域的方向移动,以使至少一个所述预设窗口的中心子区域分别为所述至少一个第二子区域;
重复执行移动所述预设窗口的步骤,直至所述预设窗口当前的中心子区域对应的总操作量大于所述预设窗口当前的中心子区域相邻的其他子区域对应的总操作量时为止。
4.根据权利要求1所述的方法,其特征在于,所述根据所述预设窗口当前包括的子区域的操作量和位置信息,确定标志点的位置信息,包括:
根据所述预设窗口当前包括的子区域的操作量和位置信息,将所述操作量最大的子区域的位置信息确定为所述标志点的位置信息。
5.根据权利要求1所述的方法,其特征在于,所述根据所述预设窗口当前包括的子区域的操作量和位置信息,确定标志点的位置信息,包括:
将所述预设窗口当前包括的每个子区域的操作量作为权重,计算所述预设窗口当前包括的每个子区域的位置信息的加权平均值,将所述加权平均值表示的位置信息确定为标志点的位置信息。
6.根据权利要求1所述的方法,其特征在于,所述根据所述预设窗口当前包括的子区域的操作量和位置信息,确定标志点的位置信息之后,所述方法还包括:
当确定了多个标志点的位置信息时,按照操作量从大到小的顺序对所述多个标志点进行排序;
按照所述多个标志点的排列顺序,依次计算相邻排列的两个标志点之间的距离,并在所述两个标志点之间的距离小于第二预设距离时,将所述两个标志点中操作量较小的标志点的位置信息删除。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述预设窗口当前包括的子区域的操作量和位置信息,确定标志点的位置信息之后,所述方法还包括:
当确定了多个标志点的位置信息时,将所确定的多个标志点的位置信息设置为初始中心点的位置信息,将所确定的多个标志点的数量设置为类别数量;
根据多个初始中心点的位置信息和所述类别数量进行聚类,得到多个类别以及在每个类别内聚类得到的中心点的位置信息。
8.一种标志点确定装置,其特征在于,所述装置包括:
划分模块,用于将目标区域划分为多个子区域,根据历史操作记录中至少一个操作行为的位置信息统计每个子区域的操作量;
初始选取模块,用于从所述多个子区域中,选取操作量大于预设操作量的子区域作为预设窗口的初始中心子区域;
移动模块,用于将所述预设窗口向总操作量变大的方向移动,直至所述预设窗口不再移动时为止,所述总操作量根据所述预设窗口包括的所有子区域的操作量确定;
确定模块,用于根据所述预设窗口当前包括的子区域的操作量和位置信息,确定标志点的位置信息。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
排序模块,用于当选取了多个初始中心子区域时,按照操作量从大到小的顺序对所述多个初始中心子区域进行排序;
删除模块,用于按照所述多个初始中心子区域的排列顺序,依次计算相邻排列的两个初始中心子区域之间的距离,并在所述两个初始中心子区域之间的距离小于第一预设距离时,将所述两个初始中心子区域中操作量较小的初始中心子区域删除。
10.根据权利要求8所述的装置,其特征在于,所述移动模块,包括:
第一计算单元,用于当所述预设窗口的中心子区域为第一子区域时,将所述预设窗口当前包括的所有子区域的操作量总和作为所述第一子区域对应的总操作量;
第二计算单元,用于对于所述预设窗口内与所述第一子区域相邻的每个子区域,计算若以所述子区域作为所述预设窗口的中心子区域时所述预设窗口的总操作量,作为所述子区域对应的总操作量;
移动单元,用于如果至少一个第二子区域对应的总操作量大于所述第一子区域对应的总操作量,则将所述预设窗口分别向所述至少一个第二子区域的方向移动,以使至少一个所述预设窗口的中心子区域分别为所述至少一个第二子区域;
所述第一计算单元、所述第二计算单元和所述移动单元用于重复执行移动所述预设窗口的步骤,直至所述预设窗口当前的中心子区域对应的总操作量大于所述预设窗口当前的中心子区域相邻的其他子区域对应的总操作量时为止。
11.根据权利要求8所述的装置,其特征在于,所述确定模块,用于根据所述预设窗口当前包括的子区域的操作量和位置信息,将所述操作量最大的子区域的位置信息确定为所述标志点的位置信息。
12.根据权利要求8所述的装置,其特征在于,所述确定模块,用于将所述预设窗口当前包括的每个子区域的操作量作为权重,计算所述预设窗口当前包括的每个子区域的位置信息的加权平均值,将所述加权平均值表示的位置信息确定为标志点的位置信息。
13.根据权利要求8所述的装置,其特征在于,所述装置还包括:
排序模块,用于当确定了多个标志点的位置信息时,按照操作量从大到小的顺序对所述多个标志点进行排序;
删除模块,用于按照所述多个标志点的排列顺序,依次计算相邻排列的两个标志点之间的距离,并在所述两个标志点之间的距离小于第二预设距离时,将所述两个标志点中操作量较小的标志点的位置信息删除。
14.一种标志点确定装置,其特征在于,所述标志点确定装置包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1至7任一权利要求所述的标志点确定方法中所执行的操作。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现如权利要求1至7任一权利要求所述的标志点确定方法中所执行的操作。
CN201711318468.5A 2017-12-12 2017-12-12 标志点确定方法、装置及存储介质 Active CN110020222B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711318468.5A CN110020222B (zh) 2017-12-12 2017-12-12 标志点确定方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711318468.5A CN110020222B (zh) 2017-12-12 2017-12-12 标志点确定方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110020222A true CN110020222A (zh) 2019-07-16
CN110020222B CN110020222B (zh) 2023-03-03

Family

ID=67186848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711318468.5A Active CN110020222B (zh) 2017-12-12 2017-12-12 标志点确定方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110020222B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111324800A (zh) * 2020-02-12 2020-06-23 腾讯科技(深圳)有限公司 业务事项展示方法、装置和计算机可读存储介质
CN112489057A (zh) * 2020-12-05 2021-03-12 武汉中海庭数据技术有限公司 交通标志数据处理方法、电子装置和存储介质
CN112492525A (zh) * 2020-11-18 2021-03-12 北京沃东天骏信息技术有限公司 信息推送系统、方法、装置、电子设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777188A (zh) * 2010-03-12 2010-07-14 华中科技大学 一种实时公交车客流量统计方法
CN102063456A (zh) * 2010-09-17 2011-05-18 百度在线网络技术(北京)有限公司 自动定位至网页的视觉中心的方法及设备
US20110145256A1 (en) * 2009-12-10 2011-06-16 Harris Corporation Video processing system providing overlay of selected geospatially-tagged metadata relating to a geolocation outside viewable area and related methods
CN103294712A (zh) * 2012-02-29 2013-09-11 三星电子(中国)研发中心 实时热点区域推荐系统和方法
CN103729423A (zh) * 2013-12-20 2014-04-16 百度在线网络技术(北京)有限公司 一种提供兴趣点的地址信息的方法与装置
CN105488120A (zh) * 2015-11-23 2016-04-13 上海川昱信息科技有限公司 基于手机大数据实时采集人口空间分布与大客流预警方法
CN106060920A (zh) * 2016-05-27 2016-10-26 中国联合网络通信集团有限公司 热点区域确定方法和系统
CN106708955A (zh) * 2016-11-29 2017-05-24 浙江宇视科技有限公司 一种热力图生成方法及设备
CN106844376A (zh) * 2015-12-03 2017-06-13 高德软件有限公司 推荐兴趣点的方法及装置
CN107291860A (zh) * 2017-06-09 2017-10-24 北京邮电大学 种子用户确定方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110145256A1 (en) * 2009-12-10 2011-06-16 Harris Corporation Video processing system providing overlay of selected geospatially-tagged metadata relating to a geolocation outside viewable area and related methods
CN101777188A (zh) * 2010-03-12 2010-07-14 华中科技大学 一种实时公交车客流量统计方法
CN102063456A (zh) * 2010-09-17 2011-05-18 百度在线网络技术(北京)有限公司 自动定位至网页的视觉中心的方法及设备
CN103294712A (zh) * 2012-02-29 2013-09-11 三星电子(中国)研发中心 实时热点区域推荐系统和方法
CN103729423A (zh) * 2013-12-20 2014-04-16 百度在线网络技术(北京)有限公司 一种提供兴趣点的地址信息的方法与装置
CN105488120A (zh) * 2015-11-23 2016-04-13 上海川昱信息科技有限公司 基于手机大数据实时采集人口空间分布与大客流预警方法
CN106844376A (zh) * 2015-12-03 2017-06-13 高德软件有限公司 推荐兴趣点的方法及装置
CN106060920A (zh) * 2016-05-27 2016-10-26 中国联合网络通信集团有限公司 热点区域确定方法和系统
CN106708955A (zh) * 2016-11-29 2017-05-24 浙江宇视科技有限公司 一种热力图生成方法及设备
CN107291860A (zh) * 2017-06-09 2017-10-24 北京邮电大学 种子用户确定方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHEN CHENG等: "Where you like to go next : successive point-of interest recommendation" *
周长利等: "基于敏感位置多样性的LBS位置隐私保护方法研究" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111324800A (zh) * 2020-02-12 2020-06-23 腾讯科技(深圳)有限公司 业务事项展示方法、装置和计算机可读存储介质
CN112492525A (zh) * 2020-11-18 2021-03-12 北京沃东天骏信息技术有限公司 信息推送系统、方法、装置、电子设备及存储介质
CN112492525B (zh) * 2020-11-18 2023-06-27 北京沃东天骏信息技术有限公司 信息推送系统、方法、装置、电子设备及存储介质
CN112489057A (zh) * 2020-12-05 2021-03-12 武汉中海庭数据技术有限公司 交通标志数据处理方法、电子装置和存储介质

Also Published As

Publication number Publication date
CN110020222B (zh) 2023-03-03

Similar Documents

Publication Publication Date Title
CA2187704C (en) Expert system method of performing crime site analysis
CN106407519B (zh) 一种人群移动规律的建模方法
CN110020222A (zh) 标志点确定方法、装置及存储介质
CN110609824B (zh) 城市路网环境下基于动态空间网络模型的热点区域检测方法
CN113505510B (zh) 融合景观指数和随机游走模型的生态安全格局识别方法
CN115082250B (zh) 个体移动与生态空间的网络关系分析方法、装置及终端
CN109740798B (zh) 一种基于路网的警务巡逻盘查路径优化方法
CN105224821A (zh) 一种基于gis的军队人员伤病信息监测预警系统及方法
CN108960562A (zh) 一种区域影响力评估方法及装置
CN104200295A (zh) Rcrss中基于分区的多警察智能体任务分配方法
Anderson et al. Bayesian cluster detection via adjacency modelling
CN108805392A (zh) 一种基于轨迹数据集成人类出行行为的可达性评估方法
Almquist et al. Point process models for household distributions within small areal units
CN112529289B (zh) 人流扩散风险的预测方法、装置、电子设备及存储介质
Norte Pinto et al. Cellular automata and urban studies: A literature survey
CN105354784A (zh) 一种基于gis的卫生信息可视化系统
Bakker et al. The use of GIS in leprosy control
CN115331833B (zh) 一种多层网络及其构建方法、传染病建模仿真方法
Amichi et al. Mobility profiling: Identifying scouters in the crowd
Malm et al. Approaches to simulations of urban growth
Chan et al. Querying and exploring polygamous relationships in urban spatio-temporal data sets
Ye et al. A new definition of modularity for community detection in complex networks
Sarafis et al. Inferring the spatial distribution of physical activity in children population from characteristics of the environment
CN112487539A (zh) 一种智能的建筑模型生成方法、电子设备及存储介质
CN110428627A (zh) 一种公交出行潜力区域识别方法及识别系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant