CN108628896A - 签到行为热度处理方法及装置 - Google Patents

签到行为热度处理方法及装置 Download PDF

Info

Publication number
CN108628896A
CN108628896A CN201710174573.XA CN201710174573A CN108628896A CN 108628896 A CN108628896 A CN 108628896A CN 201710174573 A CN201710174573 A CN 201710174573A CN 108628896 A CN108628896 A CN 108628896A
Authority
CN
China
Prior art keywords
registering
face
value
data area
poi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710174573.XA
Other languages
English (en)
Other versions
CN108628896B (zh
Inventor
毛帅
司向辉
孟凡超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201710174573.XA priority Critical patent/CN108628896B/zh
Publication of CN108628896A publication Critical patent/CN108628896A/zh
Application granted granted Critical
Publication of CN108628896B publication Critical patent/CN108628896B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Investigating Or Analyzing Materials Using Thermal Means (AREA)

Abstract

本发明实施例公开了一种签到行为热度处理方法及装置,所述方法包括:根据兴趣点POI,确定签到面;对所述签到面进行栅格化处理,获得数据区域;根据落入每一个所述数据区域签到行为,确定每一个所述数据区域的概率密度值;对所述签到面内所有数据区域的概率密度值进行归一化处理,得到所述每一个所述数据区域的热度值。

Description

签到行为热度处理方法及装置
技术领域
本发明涉及信息技术领域,尤其涉及一种签到行为热度处理方法及装置。
背景技术
兴趣点(Point Of Interest,POI)的热度值是在进行POI数据处理过程中经常需要计算的一个物理量。在现有技术中会将签到数据中的签到位置对应到栅格化的数据区域内,然后统计每一个数据区域内的签到点数量,当签到点数量大于一定阈值时,就认为该数据区域的热度值为1,否则热度值为0。这样的话,热度值的取值只有0和1这两个点值。当栅格化的数据区域面积不同或阈值不同时,在比较两个数据区域的热度时就没有任何意义,故这种热度值的确定方法无法较为真实客观的反映一个POI的热度。
发明内容
有鉴于此,本发明实施例期望提供一种签到行为热度处理方法及装置,能够得到真实客观反映签到行为发生在POI周围概率的热度值。
为达到上述目的,本发明的技术方案是这样实现的:
本发明实施例第一方面提供一种签到行为热度处理方法,包括:
根据POI,确定签到面;
对所述签到面进行栅格化处理,获得数据区域;
根据落入每一个所述数据区域签到行为,确定每一个所述数据区域的概率密度值;
对所述签到面内所有数据区域的概率密度值进行归一化处理,得到所述每一个所述数据区域的热度值。
基于上述方案,所述根据POI,确定签到面,包括:
根据所述签到行为的签到位置与所述POI之间的距离进行去噪处理,筛选出有效签到位置;
根据所述有效签到位置,确定所述签到面;其中,所述签到面为包括所有所述签到位置的地理区域。
基于上述方案,所述根据所述签到行为的签到位置与所述POI之间的距离进行去噪处理,筛选出有效签到位置,包括:
根据如下函数关系,筛选m个所述有效签到位置;
m=a*M,其中,所述M为所有签到行为对应的签到位置总个数;所述a为筛选比值,所述有效签到位置为M个所述签到位置中,距离所述POI最近的m个所述签到位置。
基于上述方案,所述根据所述签到行为的签到位置与所述POI之间的距离进行去噪处理,筛选出有效签到位置,包括:
选择与所述POI之间距离小于距离阈值的所述签到位置,获得所述有效签到位置。
基于上述方案,所述根据落入每一个所述数据区域签到行为,确定每一个所述数据区域的概率密度值,包括:
以所述数据区域的一个预定位置为测试位置,统计落入所述数据区域的所述签到行为,计算所述测试位置对应的核密度估计值。
基于上述方案,所述对所述签到面内所有数据区域的概率密度值进行归一化处理,得到所述每一个所述数据区域的热度值,包括:
利用如下函数关系,计算所述热度值;
其中,所述MAX(B)为所述签到面内最大概率密度值,所述Bi为所述签到面内第i个所述数据区域的概率密度值;所述Ai为所述签到面内第i个所述数据区域的热度值。
基于上述方案,所述方法还包括:
根据所述热度值,绘制各个围绕所述POI的热度值的等势线。
本发明实施例第二方面提供一种签到行为热度处理装置,包括:
第一确定单元,用于根据POI,确定签到面;
栅格化单元,用于对所述签到面进行栅格化处理,获得数据区域;
第二确定单元,用于根据落入每一个所述数据区域签到行为,确定每一个所述数据区域的概率密度值;
获取单元,用于对所述签到面内所有数据区域的概率密度值进行归一化处理,得到所述每一个所述数据区域的热度值。
基于上述方案,所述第一确定单元,具体用于根据所述签到行为的签到位置与所述POI之间的距离进行去噪处理,筛选出有效签到位置;根据所述有效签到位置,确定所述签到面;其中,所述签到面为包括所有所述签到位置的地理区域。
基于上述方案,所述第一确定单元,具体用于根据如下函数关系,筛选m个所述有效签到位置;m=a*M,其中,所述M为所有签到行为对应的签到位置总个数;所述a为筛选比值,所述有效签到位置为M个所述签到位置中,距离所述POI最近的m个所述签到位置。
基于上述方案,所述第一确定单元,具体用于选择与所述POI之间距离小于距离阈值的所述签到位置,获得所述有效签到位置。
基于上述方案,所述第二确定单元,具体用于以所述数据区域的一个预定位置为测试位置,统计落入所述数据区域的所述签到行为,计算所述测试位置对应的核密度估计值。
基于上述方案,所述获取单元,具体用于利用如下函数关系,计算所述热度值;
其中,所述MAX(B)为所述签到面内最大概率密度值,所述Bi为所述签到面内第i个所述数据区域的概率密度值;所述Ai为所述签到面内第i个所述数据区域的热度值。
基于上述方案,所述装置还包括:
绘制单元,具体用于根据所述热度值,绘制各个围绕所述POI的热度值的等势线。
本发明实施例提供的签到行为热度处理方法及装置,不再是简单的统计签到行为总数之后,然后通过阈值比较得到的一个逻辑值作为所述热度值。在本实施例中会通过签到面的栅格化处理,得到各个数据区域,然后对各个数据区域的概率密度值的计算,然后对各个数据区域的概率密度进行归一化处理,得到的是一个0到1之间取值的计算值而非逻辑值。这样的得到的热度值能够精确反映出不同数据区域被签到行为签到的热衷程度,方便不同数据区域的热度值的比较及热度值后续的使用。
附图说明
图1为本发明实施例提供的第一种签到行为热度处理方法的流程示意图;
图2为本发明实施例提供的第二种签到行为热度处理方法的流程示意图;
图3为本发明实施例提供的一种等势图的显示效果示意图;
图4为本发明实施例提供的一种数据区域的示意图;
图5为本发明实施例提供的第一种签到行为热度处理装置的结构示意图;
图6为本发明实施例提供的第二种签到行为热度处理装置的结构示意图;
图7为本发明实施例提供的第三种签到行为热度处理方法的流程示意图;
图8为本发明实施例提供的一种签到行为处理系统的结构示意图。
具体实施方式
以下结合说明书附图及具体实施例对本发明的技术方案做进一步的详细阐述。
如图1所示,本实施例提供一种签到行为热度处理方法,包括:
步骤S110:根据POI,确定签到面;
步骤S120:对所述签到面进行栅格化处理,获得数据区域;
步骤S130:根据落入每一个所述数据区域签到行为的签到位置,确定每一个所述数据区域的概率密度值;
步骤S140:对所述签到面内所有数据区域的概率密度值进行归一化处理,得到所述每一个所述数据区域的热度值。
本实施例提供了一种签到行为的热度处理方法。这里的签到行为可包括:用户达到某一个位置的定位信息。所述签到行为对应的行为信息至少包括:签到位置的位置信息。通常所述行为信息还会包括签到时间,这里的签到时间可用于指示用户何时位于所述签到位置。具体的所述位置信息可为全球定位系统(Global Position System,GPS)信息等。当然,所述位置信息不局限于所述GPS信息,还可以是其他基于基站辅助定位得到的位置信息等。所述位置信息可包括所述签到位置的经纬度信息等。
在步骤S110中会根据签到行为对应的签到位置和POI确定签到面。通常该签到面是围绕所述POI的一个连续或非连续分布的区域。本实施例中提供的POI是一个地理位置点或一个地理位置区域,例如,某一栋大厦,某一个园区或某一个楼层或某一个商铺。
在本实施例中所述签到面实质上是对应于该POI的签到位置的集合。例如,以所述POI为圆心,向周围拓展500米所覆盖的地理位置形成区域所述签到面。这样若用户的签到时所处的位置位于该签到面,则用户这次签到行为就是对该POI的有效签到,其所在位置即为有效签到位置。
在步骤S120中,会第签到面进行栅格化,在本实施例中所述栅格化可包括:将所述签到面进行等面积区域的划分,将整个签到面划分为若干个子区域,每一个所述子区域为一个所述数据区域。这些子区域可为以某一个点为中心的圆形区域,也可以是矩形区域、等腰三角性区域等各种形状的子区域。可选地为,各个所述子区域形成的数据区域为等面积的地理区域。
签到行为对应的签到位置,就会散落在这些数据区域内。不同数据区域内散落的签到位置的数目会产生差异。在本实施例中以所述数据区域为单位计算每一个数据区域的概率密度值,这里的概率密度值为用户的签到行为对POI进行签到出现该区域的概率值。通常情况下,所述概率密度值与一个所述数据区域内的签到行为次数呈现正相关。例如,所述概率密度值与所述数据区域内各个地理位置被签到的签到行为总数呈正比关系。
在本实施例中可以事先利用数据仿真或线性回归等方式,获得所述签到行为的数量与概率密度值之间的预设函数关系,在所述步骤S130中计算所述概率密度值时,可以根据所述预设函数关系以所述签到行为总个数为输出参数,得到所述概率密度值,从而得到当前的概率密度值。
在具体计算所述概率密度值时,还可以根据每一个所述数据区域内,签到行为的签到位置的聚合度,结合该数据区域的所述签到行为的总次数,共同确定出所述概率密度值等。
在步骤S140中会根据每一个数据区域的概率密度值,确定出所述热度值。在本实施例中主要是对所述概率密度值,进行归一化处理,这样的话,一个签到面内所有的数据区域的概率密度值都被转换成了0到1之间的取值。而这一个取值在本实施例中称之为热度值。显然,在本实施例中所述热度值不再是通过签到行为的次数与预定阈值的简单比较得到的一个逻辑判断值,热度值的取值不再仅仅是0或1了,而是从0到1的任何一个实数。且每一个数据区域的概率密度值是通过统一的归一化处理的,显然,这样得到的热度值,任意两个数据区域的热度值都是具有可比性的。且由于该热度值不再是0或1,而是0到1之间的一个具体实数,则当用户看到该热度值时,就可以确定出该热度值在该签到面一个被签到的热衷程度,丰富了该物理量的物理含义,方便后续使用该热度值,从而更加精确的正某一个POI在对应位置的签到热衷度。
具体如何进行签到面的圈定,圈定多大的签到面是合适的,在本实施例中一方面为了减少不必要的计算量,另一方面提升热度值的精确话,在进行签到面确定时,会根据签到行为的签到位置与POI之间的距离,圈定签到面。
所述步骤S110可,包括:
根据所述签到行为的签到位置与所述POI之间的距离进行去噪处理,筛选出有效签到位置;
根据所述有效签到位置,确定所述签到面;其中,所述签到面为包括所有所述签到位置的地理区域。
当用户达到某一个地点利用自身携带的移动终端,移动终端基于用户指示或终端自动触发,进行终端位置定位并上传到签到服务器,完成签到动作。有时候可能用户并非想要到POI,而只是路过。一般路过的时候,用户所在的位置会比用户真的达到所述POI的距离更远。在本实施例中为了排除这种误操作点的噪声点的签到行为,在本实施例中会根据签到位置与POI之间的距离进行去噪处理,筛选出确实要达到该位置的有效签到位置。例如,给出一个预定距离阈值,大于该距离阈值的可认为是该POI的无效签到位置,而不大于所述距离阈值的,则可认为是所述有效签到位置。
在本实施例中根据所述有效签到位置,确定出签到面。这里的签到面需要包围所有签到位置所在的地理区域。例如,所述签到面可为包括所述POI为预定点,最外围有效签到位置的连线包括的地理区域。所述签到面可以是非规则区域,也可以是规则区域。当所述签到面为规则的矩形区域时,则以所述POI为所述矩形区域的中心点,向外拓展一直到包括最外围的有效签到位置,则此时,所述签到面为矩形区域,则所有有效签到位置都位于该矩形区域内,且距离所述POI最远的有效签到位置位于所述矩形区域的边界上。这里的矩形区域可为在水平面内的垂直投影为矩形的区域,对应的地表可为圆弧区域。
在本实施例中所述规则区域还可包括:在水平面内垂直投影为圆形或等腰三角形的各种地理区域。在本实施例中将所述签到面设置为规则区域,可以方便后续数据区域的划分和概率密度值的计算。故在本实施例中素数签到面优选为规则区域。
具体确定所述签到面的方式有多种,以下提供两种可选方式:
方式一:
所述根据所述签到行为的签到位置与所述POI之间的距离进行去噪处理,筛选出有效签到位置,包括:
根据如下函数关系,筛选m个所述有效签到位置;
m=a*M,其中,所述M为所有签到行为对应的签到位置总个数;所述a为筛选比值,所述有效签到位置为M个所述签到位置中,距离所述POI最近的m个所述签到位置。
例如,每一次签到行为会对应一个签到位置,这些签到位置与POI的距离有远有近。在本实施例中会对签到位置与POI之间的距离进行排序,选择出距离较短的部分签到位置作为有效签到位置,有效签到位置对应的签到行为为有效签到行为。
例如,P次签到行为,供产生M个签到位置,所述M为不大于所述P的正整数。例如,用户A和用户B都在同一个位置进行签到,则用户A和用户B的签到行为的次数为2,但是仅产生了一个签到位置。
所述a为预先确定的筛选比值,该筛选比值可为经验值,也可以为根据热度值的计算精确度的反馈,动态调整的调整参数。在本实施例中所述a的取值可为0.9、0.95、0.85、0.8等具体取值,所述a的取值优选为0.9到0.85。
在本实施例中通过距离排序或比较等处理,选择出有效签到位置,而有效签到位置一旦确定,就可以简便的确定出所述签到面了。例如,所述签到面为歪接所述有效签到位置的规则区域。
方式二:
所述根据所述签到行为的签到位置与所述POI之间的距离进行去噪处理,筛选出有效签到位置,包括:
选择与所述POI之间距离小于距离阈值的所述签到位置,获得所述有效签到位置。
在本实施例中直接以POI为中心点,以距离阈值为辐射半径,确定出所述有效签到位置。然后再根据有效签到位置,确定出所述签到面。这里的确定签到面的方式可以参见前述实施例,在此就不重复了,这种方式具有计算量小的特点。
在一些实施例中,所述步骤S130可包括:
以所述数据区域的一个预定位置为测试位置,统计落入所述数据区域的所述签到行为,计算所述测试位置对应的核密度估计值。
在本实施例中一个数据区域被划定了之后,数据区域包括的地理位置就确定了。在本实施例中会以数据区域的一个顶点位置为测试位置。例如,所述数据区域为在水平面垂直投影为矩形区域或三角形区域的地理区域,则会存在各种顶点,这里的预定位置则可为多个顶点中的一个。若所述数据区域在水平面内的垂直投影为圆形求,则所述预定位置可为圆心区域。例如,当所述数据区域为矩形区域时,则以所述数据区域的左上角顶点位置为所述测试位置。这里的测试位置实质上就是该数据区域的代表位置,代表了该数据区域。然后以各个签到行为在该数据区域的签到位置为输入参数,这样设备就可以判断出哪些签到行为落入该数据区域,并统计落入该数据区域的签到行为次数,最后可以根据该签到行为次数得到所述核密度估计值。在本实施例中可以利用核密度估计算法,以签到面内所有有效签到行为的签到位置为训练数据,得到各个数据区域的核密度值。这里计算得到的核密度值即为所述概率密度值。
以上仅是提供例一种计算所概率密度值的一种可选方式,具体实现时不局限于上述方案。
以下提供具体如何进行概率密度的归一化处理。所述对所述签到面内所有数据区域的概率密度值进行归一化处理,得到所述每一个所述数据区域的热度值,包括:
利用如下函数关系,计算所述热度值;
其中,所述MAX(B)为所述签到面内最大概率密度值,所述Bi为所述签到面内第i个所述数据区域的概率密度值;所述Ai为所述签到面内第i个所述数据区域的热度值。
在本实施例中当所述概率密度值为所述核密度值时,则所述MAX(B)为所述签到面内最大核密度估计值,所述Bi为所述签到面内第i个所述数据区域的核密度估计值。
根据上述公式可知,最大概率密度值所在的数据区域的热度值为1,而距离POI很远位置的热度值显然会为0。热度值越大,则表示对该POI进行签到时发生在该数据区域的概率越高。
在一些实施例中,如图2所示,所述方法还包括:
步骤S150:根据所述热度值,绘制各个围绕所述POI的热度值的等势线。
在本实施例中首先是以数据区域计算出某一个区域预定位置的热度值,而这些值都是离散的,在本实施例中会连接这些离散的热度值,形成表征热度值的等势线。通常认为所述等势线上的点被签到的概率值是相等或相近的。在本实施例中,所述等势线是围绕着所述POI的。通常为了提升所述等势线的精确度,需要限定所述数据区域的面积或在热度值的等势图上的面积。
连接形成所述等势线的方式有多种,以下介绍两种可实现方式:
可选方式一:所述步骤S150可包括:
连接各个所述热度值相等对应的地理位置,形成所述等势线。
采用这种方式就可以确保等势线上的热度值都是相等的,确保了等势线的精确度。
可选方式二:所述步骤S150可包括:连接差值在预设范围所述热度值对应的地理位置,形成所述等势线。
采用这种方式,等势线上的热度值是有一定浮动,只是这种浮动的范围在所述预设范围内。采用这种方式的话,当计算出的热度值存在比较多的单一取值时,也可以确保能够连接成等势线,从而利用一根或多根等势线绘制出所述POI对应的等势图。
图3所示,为本发明实施例提供的一种热度值的等势图的示意图,等势图中不同的线型表示的不同热度值连接成的等势线。通常,所述等势线离所述POI越近,所述等势线对应的热度值越高,表示被用户对该POI进行签到的概率值越高,越偏离所述POI,则所述等势线对应的热度值越低,表示在该灯等势线代表的地理位置被用户对POI进行签到的概率越低。多条等势线将围城表示热度值变化的虚拟面。在图3中阴影圆形表示的POI,空心原点表示的签到行为产生的签到位置;实心黑点表示的栅格化后的一个预定位置。图3中的细线条都是相等的热度值或近似热度值按照预设连线模式连接而成的。
如图4所示,所述数据区域包括一组平行于经线的边界线和一组平行于纬线的边界线。这样的数据区域在水平面或竖直平面内的垂直投影,形成的一个矩形或近似矩形。当然具体的实现过程中,所述数据区域的形状不局限于上述形状。
如图5所示,本实施例提供一种签到行为热度处理装置,其特征在于,包括:
第一确定单元110,用于根据POI,确定签到面;
栅格化单元120,用于对所述签到面进行栅格化处理,获得数据区域;
第二确定单元130,用于根据落入每一个所述数据区域签到行为,确定每一个所述数据区域的概率密度值;
获取单元140,用于对所述签到面内所有数据区域的概率密度值进行归一化处理,得到所述每一个所述数据区域的热度值。
本实施例所述热度处理装置,可为应用于各种服务器中的信息处理装置。所述第一确定单元110、栅格化单元120、第二确定单元130及所述获取单元140都可对应于处理器或处理电路。所述处理器可包括中央处理器、数字信号处理器、微处理器、应用处理器或可编程整列等。所述处理电路可包括专用集成电路等。所述处理器或处理电路可以通过预定代码的执行,实现上述一个或多个功能单元的操作。
图6所示即为本实施例提供的一种热度处理装置。所述装置包括处理器210、存储介质240以及至少一个网络接口220;所述处理器210、存储介质240以及网络接口220均通过总线230连接。所述存储介质240上存储有计算机可执行指令;所述处理器210执行所述存储介质240中存储的所述计算机可执行指令可实现以下两个方案中的任意一个。
在有些实施中,所述热度处理装置还可包括输入/输出接口250,这里的输入接口可为键盘、鼠标等供用户输入信息的接口,所述输出接口可为显示器或音频输出设备等可供电子设备输出信息的接口。
在本实施例中所述存储介质240可为各种类型的存储介质,例如,随机存取存储器(RAM,Random Access Memory)、只读存储器(ROM,Read-Only Memory)、闪存flash等存储介质,可选为非瞬间存储介质。所述网络接口220可为有线接口或无线接口,该接口直接或通过互联网与用户持有的终端进行信息交互,例如,与用户随身携带的手机、平板电脑或可穿戴式设备或车载设备进行信息交互,至少可以接收用户终端提供的签到行为的签到信息等,从而获得进行上述签到面确定、数据区域划分及最终热度值确定的原始数据。
如图6所示,所述装置还包括输入/输出接口,该输入/输出接口可用于人机交互。所述输入/输入接口可用于连接显示设备或音频设备等输出设备,还可用于连接键盘、鼠标或触摸面板等输入设备。所述输入/输出接口可以输出绘制的所述等势图。
此处提供的是所述签到行为热度处理装置的一个示例,但是具体实现不局限于该示例。
进一步地,所述第一确定单元110,具体用于根据所述签到行为的签到位置与所述POI之间的距离进行去噪处理,筛选出有效签到位置;根据所述有效签到位置,确定所述签到面;其中,所述签到面为包括所有所述签到位置的地理区域。
在本实施例中为了提升热度值的精确度,同时减少不必要干扰数据导致的计算量。在本实施例中在进行签到面确定时,不会随机的确定一个地理区域即可,而是会通过所述签到行为产生的签到位置与POI之间的距离,进行去噪处理,过滤掉噪声签到行为,筛选出有效签到位置。再根据有效签到位置圈定最后的签到面。这样确定的签到面,一方面去除了干扰签到,另一方面仅可能减少了遗漏有效签到行为产生的有效签到位置。
具体地如,所述第一确定单元110,具体用于根据如下函数关系,筛选m个所述有效签到位置;m=a*M,其中,所述M为所有签到行为对应的签到位置总个数;所述a为筛选比值,所述有效签到位置为M个所述签到位置中,距离所述POI最近的m个所述签到位置。
在本实施例中通过距离排序或比较的方式,选择出与POI最近的一部分签到行为产生的签到位置,作为所述有效签到。这样的话,随着签到行为的产生,则有效签到位置与POI之间的最大距离是动态变化的。
再比如。所述第一确定单元110,具体用于选择与所述POI之间距离小于距离阈值的所述签到位置,获得所述有效签到位置。
在本实施例中本实施例给出了一定的距离阈值,签到位置与POI间的距离小于距离阈值,可认为对应的签到行为为有效签到行为,而有效签到行为产生的签到位置则为所述有效签到位置。本实施例中所述第一确定单元110进行签到面确定的计算量少及操作简单等特点。
在一些实施例中,所述第二确定单元130,具体用于以所述数据区域的一个预定位置为测试位置,统计落入所述数据区域的所述签到行为,计算所述测试位置对应的核密度估计值。
在本实施例中具体如何确定所述概率密度值,在本实施例中所述第二确定单元130可为计算器或具有计算功能的处理器等,通过核密度估计算法获得核密度估计值,此处获得核密度估计值即为所述密度概率值的一种。在本实施例中通过核密度估计值的计算,简便快捷获得所述概率密度值。
在一些实施例中,所述获取单元140,具体用于利用如下函数关系,计算所述热度值;
其中,所述MAX(B)为所述签到面内最大概率密度值,所述Bi为所述签到面内第i个所述数据区域的概率密度值;所述Ai为所述签到面内第i个所述数据区域的热度值。
在本实施例中所述获取单元140,通过上述函数关系式,可以简便实现所述核密度估计值等概率密度值的归一化,从而简便的获得所述热度值。
在一些实施例中,所述装置还包括:
绘制单元,具体用于根据所述热度值,绘制各个围绕所述POI的热度值的等势线。
所述绘制单元,同样可包括处理器或处理电路,获取所述POI周边的地图或地理信息,从而获得绘制所述等势线的地理背景,然后根据计算出的所述热度值及热度值与地理位置的对应关系,通过连线绘制出所述等势线。
在具体的实现过程中,所述装置还可包括显示装置。这里的显示装置可包括各种的显示屏,例如,液晶显示屏、投影显示屏、电子墨水显示屏或有机发光二级管OLED显示屏等。这些显示屏可以显示所述等势线及包括等势线的等势图。当然,这里的显示装置可为服务器或服务平台自身的显示装置,也可以是通过网络连接等方式,连接到所述服务器的显示终端,显示终端可以接收所述等势线或等势图的相关信息。
在另一些实施例中,所述绘制单元,具体用于连接各个所述热度值相等对应的地理位置,形成所述等势线;或,连接差值在预设范围所述热度值对应的地理位置,形成所述等势线。
在本实施例中所述绘制单元,将具体依次连接各个热度值相当的地理位置,形成所述等势线,或依次连接差值在预设范围内的热度值,形成所述等势线。具体采用哪种方式形成所述等势线,可以根据等势线需要表征的精度来的。
进一步地,所述数据区域包括一组平行于经线的边界线和一组平行于纬线的边界线。
以下结合上述实施例提供几个具体示例:
本示例提供的签到行为热度处理方法,包括:
第一步:收集了多个POI的一个预设时间窗内的所有签到数据,例如,手机累计6个月的签到数据。
第二步:签到数据进行了初步的降噪处理。由于定位误差和其他技术原因,POI所对应的签到数据会包含部分错误的签到数据,通过建立每个签到位置与poi距离放入KD-tree,可以采用一种极快的方式筛选出距离poi距离较近的头部90%的签到数据作为输入数据。
第三步:方案选取能够容纳所有输入数据的最小外接矩形,且该矩形的边应当分别与经线和纬线相平行作为签到面;对签到面进行栅格化处理,栅格的带宽可通过拇指规则等经验公式计算得出;将签到面内的所有签到点作为训练数据,将栅格化后的每个栅格的左上角的顶点作为测试数据,利用核密度估计这一无参数估计方法对测试数据集对应的密度值进行估计。估计结果为每个栅格的核密度估计值。所述核密度估计值通常有以下含义:签到行为发生越集中的位置,其核密度估计值越大,签到行为发生越少的地方,其对应的核密度估计值越小,距离POI无限远处的热度值通常定义为0。
第四步:对测试数据集中估算的每个地理位置点的核度估计值行0至1归一化处理,得到对应的地理位置点的热度值。
第五步:将热度值相等及接近的地理位置按照一定的连线模式,连接形成等势线,进而形成等势面。这里的连线模式包括:将所有的热度值相等或相近的地理位置单招顺时针方向或逆时帧方向连接形成等势面,即可获得由最大签到热度值至签到面边界的多个嵌套等势面。这些等势面最外层的等势面对应的热力值最小,最靠近内部的等势面所对应的热度值最大。选取一定阈值的等势面即为该POI对应的虚拟面。
图7为本示例提供一个签到行为热度处理方法的流程示意图,包括:
S1:签到数据降噪处理;
S2:签到数据核密度估计(Kernel Density Estimation,KDE)分析;
S3:预估栅格化后顶点的核密度估计值进行归一化,得到热度值;
S4:等值连线,得到热度值的等势线。
图8所示为本实施例提供的一种签到行为热度处理方法的系统,包括:用户终端100及服务器200;
用户终端100定位用户位置信息,采集签到行为,形成包括签到位置、签到时间等信息的签到数据,并将所述签到数据上传给服务器200。
服务器200,通过网络与多个用户终端100连接,收集所述签到数据,并在对应的时间点,进行如图1或图2所示的处理,从而可以绘制出如图3所示的某一个POI或多个POI的等势图。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (14)

1.一种签到行为热度处理方法,其特征在于,包括:
根据兴趣点POI,确定签到面;
对所述签到面进行栅格化处理,获得数据区域;
根据落入每一个所述数据区域签到行为,确定每一个所述数据区域的概率密度值;
对所述签到面内所有数据区域的概率密度值进行归一化处理,得到所述每一个所述数据区域的热度值。
2.根据权利要求1所述的方法,其特征在于,
所述根据兴趣点POI,确定签到面,包括:
根据所述签到行为的签到位置与所述POI之间的距离进行去噪处理,筛选出有效签到位置;
根据所述有效签到位置,确定所述签到面;其中,所述签到面为包括所有所述签到位置的地理区域。
3.根据权利要求2所述的方法,其特征在于,
所述根据所述签到行为的签到位置与所述POI之间的距离进行去噪处理,筛选出有效签到位置,包括:
根据如下函数关系,筛选m个所述有效签到位置;
m=a*M,其中,所述M为所有签到行为对应的签到位置总个数;所述a为筛选比值,所述有效签到位置为M个所述签到位置中,距离所述POI最近的m个所述签到位置。
4.根据权利要求2所述的方法,其特征在于,
所述根据所述签到行为的签到位置与所述POI之间的距离进行去噪处理,筛选出有效签到位置,包括:
选择与所述POI之间距离小于距离阈值的所述签到位置,获得所述有效签到位置。
5.根据权利要求1至4任一项所述的方法,其特征在于,
所述根据落入每一个所述数据区域签到行为,确定每一个所述数据区域的概率密度值,包括:
以所述数据区域的一个预定位置为测试位置,统计落入所述数据区域的所述签到行为,计算所述测试位置对应的核密度估计值。
6.根据权利要求1至4任一项所述的方法,其特征在于,
所述对所述签到面内所有数据区域的概率密度值进行归一化处理,得到所述每一个所述数据区域的热度值,包括:
利用如下函数关系,计算所述热度值;
其中,所述MAX(B)为所述签到面内最大概率密度值,所述Bi为所述签到面内第i个所述数据区域的概率密度值;所述Ai为所述签到面内第i个所述数据区域的热度值。
7.根据权利要求1至4任一项所述的方法,其特征在于,
所述方法还包括:
根据所述热度值,绘制各个围绕所述POI的热度值的等势线。
8.一种签到行为热度处理装置,其特征在于,包括:
第一确定单元,用于根据兴趣点POI,确定签到面;
栅格化单元,用于对所述签到面进行栅格化处理,获得数据区域;
第二确定单元,用于根据落入每一个所述数据区域签到行为,确定每一个所述数据区域的概率密度值;
获取单元,用于对所述签到面内所有数据区域的概率密度值进行归一化处理,得到所述每一个所述数据区域的热度值。
9.根据权利要求8所述的装置,其特征在于,
所述第一确定单元,具体用于根据所述签到行为的签到位置与所述POI之间的距离进行去噪处理,筛选出有效签到位置;根据所述有效签到位置,确定所述签到面;其中,所述签到面为包括所有所述签到位置的地理区域。
10.根据权利要求9所述的装置,其特征在于,
所述第一确定单元,具体用于根据如下函数关系,筛选m个所述有效签到位置;m=a*M,其中,所述M为所有签到行为对应的签到位置总个数;所述a为筛选比值,所述有效签到位置为M个所述签到位置中,距离所述POI最近的m个所述签到位置。
11.根据权利要求9所述的装置,其特征在于,
所述第一确定单元,具体用于选择与所述POI之间距离小于距离阈值的所述签到位置,获得所述有效签到位置。
12.根据权利要求8至11任一项所述的装置,其特征在于,
所述第二确定单元,具体用于以所述数据区域的一个预定位置为测试位置,统计落入所述数据区域的所述签到行为,计算所述测试位置对应的核密度估计值。
13.根据权利要求8至11任一项所述的装置,其特征在于,
所述获取单元,具体用于利用如下函数关系,计算所述热度值;
其中,所述MAX(B)为所述签到面内最大概率密度值,所述Bi为所述签到面内第i个所述数据区域的概率密度值;所述Ai为所述签到面内第i个所述数据区域的热度值。
14.根据权利要求8至11任一项所述的装置,其特征在于,
所述装置还包括:
绘制单元,具体用于根据所述热度值,绘制各个围绕所述POI的热度值的等势线。
CN201710174573.XA 2017-03-22 2017-03-22 签到行为热度处理方法及装置 Active CN108628896B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710174573.XA CN108628896B (zh) 2017-03-22 2017-03-22 签到行为热度处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710174573.XA CN108628896B (zh) 2017-03-22 2017-03-22 签到行为热度处理方法及装置

Publications (2)

Publication Number Publication Date
CN108628896A true CN108628896A (zh) 2018-10-09
CN108628896B CN108628896B (zh) 2023-04-07

Family

ID=63707228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710174573.XA Active CN108628896B (zh) 2017-03-22 2017-03-22 签到行为热度处理方法及装置

Country Status (1)

Country Link
CN (1) CN108628896B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109272594A (zh) * 2018-10-17 2019-01-25 重庆扬升信息技术有限公司 一种海量数据环境下无纸化会议签到判断工作方法
CN111339446A (zh) * 2020-02-18 2020-06-26 腾讯科技(深圳)有限公司 一种兴趣点挖掘方法、装置、电子设备和存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010040400A1 (en) * 2008-10-08 2010-04-15 Tomtom International B.V. Navigation apparatus and method of providing points of interest
US20120197524A1 (en) * 2011-02-02 2012-08-02 Mapquest, Inc. Systems and methods for generating electronic map displays with points-of-interest based on density thresholds
CN103167404A (zh) * 2011-12-14 2013-06-19 北京千橡网景科技发展有限公司 用于确定兴趣点的方法和设备
CN103177189A (zh) * 2013-04-09 2013-06-26 武汉大学 一种众源位置签到数据质量分析方法
CN103198135A (zh) * 2013-04-12 2013-07-10 武汉大学 一种地理区域格网划分的微博签到数据在线获取方法
CN103986782A (zh) * 2014-05-30 2014-08-13 厦门云朵网络科技有限公司 一种位置服务器和签到处理方法
CN104391853A (zh) * 2014-09-25 2015-03-04 深圳大学 Poi推荐方法、poi信息处理方法及服务器
CN104866542A (zh) * 2015-05-05 2015-08-26 腾讯科技(深圳)有限公司 一种poi数据验证方法和装置
CN104899368A (zh) * 2015-05-29 2015-09-09 浙江宇视科技有限公司 基于数据热度的监控布点需求图生成方法及装置
CN105138668A (zh) * 2015-09-06 2015-12-09 中山大学 基于poi数据的城市商业中心与零售业态集聚区识别方法
CN105893998A (zh) * 2016-03-30 2016-08-24 北京奇虎科技有限公司 一种指定区域内的实点的密度估计方法和装置
CN106384250A (zh) * 2016-09-13 2017-02-08 百度在线网络技术(北京)有限公司 一种选址方法及装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010040400A1 (en) * 2008-10-08 2010-04-15 Tomtom International B.V. Navigation apparatus and method of providing points of interest
US20120197524A1 (en) * 2011-02-02 2012-08-02 Mapquest, Inc. Systems and methods for generating electronic map displays with points-of-interest based on density thresholds
CN103167404A (zh) * 2011-12-14 2013-06-19 北京千橡网景科技发展有限公司 用于确定兴趣点的方法和设备
CN103177189A (zh) * 2013-04-09 2013-06-26 武汉大学 一种众源位置签到数据质量分析方法
CN103198135A (zh) * 2013-04-12 2013-07-10 武汉大学 一种地理区域格网划分的微博签到数据在线获取方法
CN103986782A (zh) * 2014-05-30 2014-08-13 厦门云朵网络科技有限公司 一种位置服务器和签到处理方法
CN104391853A (zh) * 2014-09-25 2015-03-04 深圳大学 Poi推荐方法、poi信息处理方法及服务器
CN104866542A (zh) * 2015-05-05 2015-08-26 腾讯科技(深圳)有限公司 一种poi数据验证方法和装置
CN104899368A (zh) * 2015-05-29 2015-09-09 浙江宇视科技有限公司 基于数据热度的监控布点需求图生成方法及装置
CN105138668A (zh) * 2015-09-06 2015-12-09 中山大学 基于poi数据的城市商业中心与零售业态集聚区识别方法
CN105893998A (zh) * 2016-03-30 2016-08-24 北京奇虎科技有限公司 一种指定区域内的实点的密度估计方法和装置
CN106384250A (zh) * 2016-09-13 2017-02-08 百度在线网络技术(北京)有限公司 一种选址方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109272594A (zh) * 2018-10-17 2019-01-25 重庆扬升信息技术有限公司 一种海量数据环境下无纸化会议签到判断工作方法
CN111339446A (zh) * 2020-02-18 2020-06-26 腾讯科技(深圳)有限公司 一种兴趣点挖掘方法、装置、电子设备和存储介质
CN111339446B (zh) * 2020-02-18 2023-04-18 腾讯科技(深圳)有限公司 一种兴趣点挖掘方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN108628896B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN110726418B (zh) 兴趣点区域确定方法、装置、设备及存储介质
WO2018120424A1 (zh) 基于位置服务的人群分类方法、装置、设备和存储介质
JP6463263B2 (ja) モバイル・デバイスの位置決め
CN104636482A (zh) 用于确定目标地址的方法和装置
CN107908677B (zh) 基于智能终端的小区房源展示方法及装置
EP3001332A1 (en) Target user determination method, device and network server
CN110096929A (zh) 基于神经网络的目标检测
CN106097222A (zh) 顾及用户特征的公共设施空间可达性分析方法及装置
US20130194272A1 (en) Placing pixels according to attribute values in positions in a graphical visualization that correspond to geographic locations
CN105335393A (zh) 一种地图显示方法及装置
CN109154938A (zh) 使用离散非踪迹定位数据将数字图中的实体分类
CN103544325B (zh) 用于网页页面点击分布的数据处理方法和装置
CN107818116B (zh) 用于确定用户行为区域位置信息的方法与设备
CN109213949A (zh) 热力图的绘制方法和装置
CN104050709A (zh) 一种三维图像处理方法及电子设备
US20130041753A1 (en) System and Method for Identifying a Path of a Billboard Audience Group and Providing Advertising Content Based on the Path
Xue et al. Geographically weighted Cox regression for prostate cancer survival data in Louisiana
CN108628896A (zh) 签到行为热度处理方法及装置
CN111552429A (zh) 一种图形选中方法、装置及电子设备
AU2023203219A1 (en) Player density based region division for regional chat
Anderson et al. Bayesian cluster detection via adjacency modelling
US8930875B2 (en) Estimating power supply of a 3D IC
CN110008387A (zh) 流场可视化实现方法、装置及电子设备
CN111798281B (zh) 作弊操作的判定方法、装置、计算机可读存储介质及设备
Mantoro et al. A Support Vector Machine Classification of Computational Capabilities of 3D Map on Mobile Device for Navigation Aid.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant