CN110351665B - 用户惯常地的识别方法、设备及计算机可读存储介质 - Google Patents
用户惯常地的识别方法、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110351665B CN110351665B CN201910698171.9A CN201910698171A CN110351665B CN 110351665 B CN110351665 B CN 110351665B CN 201910698171 A CN201910698171 A CN 201910698171A CN 110351665 B CN110351665 B CN 110351665B
- Authority
- CN
- China
- Prior art keywords
- grid
- user
- optimization
- position data
- geographic area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000002650 habitual effect Effects 0.000 title claims description 5
- 238000005457 optimization Methods 0.000 claims abstract description 136
- 238000013507 mapping Methods 0.000 claims abstract description 76
- 238000010586 diagram Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 238000005192 partition Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000000638 solvent extraction Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000013480 data collection Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/021—Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种用户惯常地的识别方法、设备及计算机可读存储介质。该方法包括:基于预定地理区域上用户位置数据采集点的覆盖率,对预定地理区域上预先划分的栅格进行优化,得到优化栅格,优化栅格的栅格步长小于预先划分的栅格的栅格步长且按照优化栅格的栅格步长划分地理区域后,能够使用户位置数据采集点在预定地理区域上均匀分布;将用户位置数据采集点映射至优化栅格,得到用户位置数据采集点与优化栅格间的映射关系;基于用户位置数据采集点与优化栅格间的映射关系,将用户位置数据采集点采集的预定时间段内预定地理区域范围内的用户位置数据映射至对应的优化栅格,得到用户惯常地。本发明实施例能够提高用户惯常地的识别准确度。
Description
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种用户惯常地的识别方法、设备及计算机可读存储介质。
背景技术
随着现代通信技术的发展,各类无线通信网络均能够覆盖人群能够到达的所有空间区域范围。而通过获取用户所在地理位置的数据,能够识别出用户的日常活动规律,比如有些区域是用户高频出现并长时间停留的区域,称之为用户的惯常环境或惯常地,从而为旅游、城市规划、交通规划、智慧城市、选址、广告位规划、流动/常驻人口管理、大型活动有序组织、人群兴趣点分析及应用提供服务。然而目前的识别方法由于数据采集点是基于覆盖范围在公里级别的基站小区,因此分析得到的用户惯常地范围是不连续的、不精确的,使得识别结果准确度较低。
发明内容
本发明实施例提供一种用户惯常地的识别方法、设备及计算机可读存储介质,以提高对用户惯常地的识别准确度。
第一方面,本发明实施例提供一种用户惯常地的识别方法,包括:基于预定地理区域上用户位置数据采集点的覆盖率,对预定地理区域上预先划分的栅格进行优化,得到优化栅格,优化栅格的栅格步长小于预先划分的栅格的栅格步长且按照优化栅格的栅格步长划分地理区域后,能够使得用户位置数据采集点在预定地理区域上均匀分布;将用户位置数据采集点映射至优化栅格,得到用户位置数据采集点与优化栅格之间的映射关系;基于用户位置数据采集点与优化栅格之间的映射关系,将用户位置数据采集点采集的预定时间段内预定地理区域范围内的用户位置数据映射至对应的优化栅格,得到用户惯常地。
第二方面,本发明实施例提供一种用户惯常地的识别设备,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现第一方面所述的方法。
第三方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现第一方面所述的方法。
本发明实施例提供的用户惯常地的识别方法、设备及计算机可读存储介质,通过基于预定地理区域上用户位置数据采集点的覆盖率,对预定地理区域上预先划分的栅格进行优化,得到优化栅格,优化栅格的栅格步长小于预先划分的栅格的栅格步长且按照优化栅格的栅格步长划分地理区域后,能够使得所述用户位置数据采集点在所述预定地理区域上均匀分布;将用户位置数据采集点映射至优化栅格,得到用户位置数据采集点与优化栅格之间的映射关系;基于用户位置数据采集点与优化栅格之间的映射关系,将用户位置数据采集点采集的预定时间段内预定地理区域范围内的用户位置数据映射至对应的优化栅格,得到用户惯常地。由于基于预定地理区域上用户位置数据采集点的覆盖率对预定地理区域范围内预先划分的栅格进行了优化,因此,能够提高对用户惯常地的识别准确度。
附图说明
图1为本发明实施例提供的应用场景图;
图2为本发明另一实施例提供的用户惯常地的识别方法流程图;
图3为本发明另一实施例提供的用户惯常地的识别方法流程图;
图4为本发明实施例提供的覆盖指数与栅格划分精度的散点图;
图5为本发明实施例提供的覆盖指数与栅格单位步长的散点图;
图6为本发明实施例提供的用户位置数据采集点与栅格的关系示意图;
图7为本发明实施例提供的包括第一优化栅格和第二优化栅格的地图示意图;
图8为本发明另一实施例提供的用户惯常地的识别方法流程图;
图9为本发明实施例提供的用户惯常地的识别装置的结构示意图;
图10为本发明实施例提供的用户惯常地的识别设备的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本发明实施例提供的用户惯常地的识别方法,可以适用于图1所示的应用场景。该应用场景包括:多个预定地理区域11和若干个用户位置数据采集点(图中圆圈所示);其中,如图1所示,每个预定地理区域11上分布有多个用户位置数据采集点。另外,每个预定地理区域11预先被栅格化,每个栅格中可以有多个位置数据采集点,位置数据采集点可以是移动通信基站、导航卫星、地面站、无线网络(Wireless network,WLAN)/WIFI采集点、蓝牙采集点、射频采集点等。
本发明实施例提供的用户惯常地的识别方法,旨在对上述预先被划分的栅格进行优化,即优化预先划分的栅格步长,并基于优化后的栅格步长对预定地理区域重新划分栅格。从而解决现有技术中识别的用户惯常地范围经常为公里级别导致识别精度不高的问题。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
图2为本发明实施例提供的用户惯常地的识别方法流程图。本发明实施例针对现有技术的如上技术问题,提供了用户惯常地的识别方法,该方法具体步骤如下:
步骤201、基于预定地理区域上用户位置数据采集点的覆盖率,对预定地理区域上预先划分的栅格进行优化,得到优化栅格,该优化栅格的栅格步长小于预先划分的栅格的栅格步长且按照优化栅格的栅格步长划分地理区域后,能够使得所述用户位置数据采集点在所述预定地理区域上均匀分布。
具体的,预定地理区域上用户位置数据采集点的覆盖率是预定地理区域范围内的用户位置数据采集点所覆盖的栅格数量与预定地理区域上的总栅格数量的比值。请参阅图1,假设预定地理区域11上的总栅格数量为N,预定地理区域11范围内用户位置数据采集点的数量为M个,该M个用户位置数据采集点所覆盖的栅格数量为N1,则预定地理区域上用户位置数据采集点的覆盖率为N1/N。举例来说,若用户位置数据采集点的坐标点为a(x0,y0),而预先划分的栅格的初始坐标点为m(118,27);则坐标点a所对应的预先划分的栅格坐标为(x1,y1),x1=celling((x0-118)/经度步长),y1=celling((y0-27)/纬度步长),celling()表示向上取整。通过上述计算方法可以计算得到每个用户位置数据采集点所对应的栅格坐标,然后将计算得到的所有栅格坐标进行去重,就可以得到用户位置数据采集点在地理区域范围内所覆盖的栅格数。
请继续参阅图1,假设预定地理区域11上预先划分的栅格的栅格步长为S0,则通过优化后,优化栅格的栅格步长为S1,且S1<S0。
步骤202、将用户位置数据采集点映射至优化栅格,得到用户位置数据采集点与优化栅格之间的映射关系。
具体的,每个用户位置数据采集点具有唯一标识号,每个优化栅格具有栅格编号。将用户位置数据采集点映射至优化栅格,得到用户位置数据采集点与优化栅格之间的映射关系是指基于用户位置数据采集点对预定地理区域上优化栅格的覆盖,建立用户位置数据采集点的唯一标识号与优化栅格的栅格编号之间的映射关系。
步骤203、基于用户位置数据采集点与优化栅格之间的映射关系,将用户位置数据采集点采集的预定时间段内预定地理区域范围内的用户位置数据映射至对应的优化栅格,得到用户惯常地。
例如,若用户位置数据采集点的唯一标识号为ID1,其对应的优化栅格为S0-S5,则在用户位置数据采集点的唯一标识号为ID1采集到预定时间段内预定地理区域范围内的用户位置数据后,将这些用户位置数据都映射至优化栅格S0-S5内,最后将这些映射的优化栅格连通,得到用户惯常地。
本发明实施例通过基于预定地理区域上用户位置数据采集点的覆盖率,对预定地理区域上预先划分的栅格进行优化,得到优化栅格,优化栅格的栅格步长小于预先划分的栅格的栅格步长;将用户位置数据采集点映射至优化栅格,得到用户位置数据采集点与优化栅格之间的映射关系;基于用户位置数据采集点与优化栅格之间的映射关系,将用户位置数据采集点采集的预定时间段内预定地理区域范围内的用户位置数据映射至对应的优化栅格,得到用户惯常地。由于基于预定地理区域上用户位置数据采集点的覆盖率对预定地理区域范围内预先划分的栅格进行了优化,因此,使得识别出的用户惯常地范围小于公里级别,提高了识别精度。
可选的,优化栅格包括第一优化栅格和第二优化栅格,第二优化栅格的栅格步长大于第一优化栅格的栅格步长。相应的,基于预定地理区域上用户位置数据采集点的覆盖率,对预定地理区域上预先划分的栅格进行优化,得到优化栅格,包括:基于预定地理区域上用户位置数据采集点的覆盖率,对预定地理区域上预先划分的栅格进行优化,得到第一优化栅格;将多个第一优化栅格连通作为第二优化栅格。本实施例中,第一优化栅格和第二优化栅格是对同一预定地理区域范围进行不同划分得到的。例如,在得到第一优化栅格后,可以将n*n个第一优化栅格作为一个第二优化栅格。其中,第一优化栅格和第二优化栅格分别具有编号。
图3为本发明另一实施例提供的用户惯常地的识别方法流程图。在上述实施例的基础上,本实施例提供的用户惯常地的识别方法具体包括如下步骤:
步骤301、对预定地理区域上用户位置数据采集点的覆盖率与对预定地理区域进行不同划分得到的栅格步长之间的关系进行拟合,得到拟合曲线。
可选的,对预定地理区域上用户位置数据采集点的覆盖率与对预定地理区域进行不同划分得到的栅格步长之间的关系进行拟合,得到拟合曲线,包括:对预定地理区域上用户位置数据采集点的覆盖率进行归一化处理,得到预定地理区域上用户位置数据采集点的覆盖指数;对预定地理区域进行不同划分的栅格步长进行归一化处理,得到对预定地理区域进行不同划分得到的栅格划分精度;将预定地理区域进行不同划分得到的栅格划分精度作为横轴,预定地理区域上用户位置数据采集点的覆盖指数作为纵轴,生成覆盖指数与栅格划分精度的散点图;对散点图上的散点进行拟合,得到拟合曲线。
具体的,对预定地理区域上用户位置数据采集点的覆盖率进行归一化处理,得到预定地理区域上用户位置数据采集点的覆盖指数,是指将预定地理区域上用户位置数据采集点的覆盖率归一到0-100的范围内。同样地,对预定地理区域进行不同划分得到的栅格步长进行归一化处理,得到对预定地理区域进行不同划分得到的栅格划分精度,是指预定地理区域进行不同划分得到的栅格步长归一到0-100的范围内。应当理解的是,0-100的归一化范围是本发明实施例的一个举例,并不对本发明实施例进行限定。本领域技术人员可以根据实际需求来设定归一化范围,需要注意的是,对预定地理区域上用户位置数据采集点的覆盖率和对预定地理区域进行不同划分的栅格步长进行归一化处理,须保证将预定地理区域上用户位置数据采集点的覆盖率和预定地理区域进行不同划分的栅格步长归一化处理至同一归一化范围。
如图4所示,为覆盖指数与栅格划分精度的散点图。可以看到,覆盖指数是随着栅格划分精度的增大而减小,而覆盖指数的边际效应也随栅格划分精度的增大而减弱。其中,覆盖指数的边际效应是指栅格数量每增加一个度量单位,覆盖指数减少的程度。
本实施例中,散点图上分布的是多个散点,但是可以看到,这些散点基本可以形成一条曲线,也就是说,这些散点之间存在某种函数关系。因此,通过对这些散点进行拟合,可以得到一条拟合曲线。具体可以通过最小化误差的平方或寻找数据的最佳函数匹配来得到拟合曲线。例如,假设散点图上的散点之间函数关系描述为:log(y)=λ1log(x)+λ2,则可以通过调整λ1和λ2,使得该函数与散点图上的散点的差别达到最小,得到拟合曲线的函数表达式。
步骤302、确定拟合曲线在均衡状态下的栅格步长,作为优化栅格步长。
可选的,确定拟合曲线在均衡状态下的栅格步长,作为优化栅格步长,包括:在拟合曲线上某一散点对应的栅格划分精度与预定地理区域上用户位置数据采集点的覆盖指数的乘积达到最大值时,判定拟合曲线达到均衡状态;基于该散点的栅格划分精度计算栅格长度,得到优化栅格步长。
可选的,通过将栅格划分精度转换为栅格单位步长,可以得到横轴为覆盖指数,纵轴为栅格单位步长的散点图。如图5所示,可以看到,图中的曲线为覆盖指数与栅格单位步长的拟合曲线,通过寻找拟合曲线上某一散点的横轴坐标与纵轴坐标的乘积的最大值,来确定优化栅格的单位栅格步长。当拟合曲线达到均衡状态时,认为预定地理区域上用户位置数据采集点的覆盖率和预定地理区域的优化栅格数量的分布最均匀。具体到图5中,某一个散点的横轴坐标与纵轴坐标的乘积可以认为是以该点到横轴之间的垂线段,以及该点到纵轴之间的垂线段和坐标系的横轴、纵轴之间围成的矩形,拟合曲线上某一散点的横轴坐标与纵轴坐标的乘积达到最大值,另一方面,即散点图上的散点对应的矩形面积达到最大。假设拟合曲线上具有三个散点D、E、F,而E点对应的矩形面积最大,则认为按照E点对应的栅格单位步长划分的预定地理区域得到的第一优化栅格能够使得用户位置数据采集点分布达到最为均匀的状态。
可选的,在经过上述实施例得到第一优化栅格的单位栅格步长后,由于用户位置数据采集点的覆盖范围一般是扇形或者圆形,而栅格一般为正方形,因此,如图6所示,可以看到,在圆形之外正方形之内大致有1/4的留白区域。故为了使得预定地理区域上用户位置数据采集点的覆盖率更加精确,减少运算复杂度,可以将单位栅格步长增大1/4倍。即若通过拟合曲线计算得到的第一优化栅格的单位步长为433米,则可以将第一优化栅格最终的单位步长设定为500米左右。
步骤303、基于优化栅格步长对预定地理区域划分第一优化栅格。
具体的,在得到优化栅格步长后,可以通过地理球面计算将优化栅格步长转换为相应的纬度步长和经度步长,进而以选取的预定地理区域范围的基点的经度和纬度为起点,分别在纬度和经度方向上按照转换的纬度步长和经度步长对预定地理区域进行划分,得到若干的第一优化栅格,并对每个第一优化栅格进行编号。
进一步的,还可以以第一优化栅格为基础,将n*n个第一优化栅格作为一个第二优化栅格。例如,选择4*4个第一优化栅格作为一个第二优化栅格。如图7所示,图中第一优化栅格的编号为S0-S15,则S0-S15的栅格可以组成一个第二优化栅格S0’。
可选的,将用户位置数据采集点映射至优化栅格,得到用户位置数据采集点与优化栅格之间的映射关系,包括:将位置数据采集点映射至第一优化栅格,得到用户位置数据采集点与第一优化栅格之间的映射关系。具体的,是将用户位置数据采集点的经度坐标和纬度坐标分别与栅格的起始点经度坐标和纬度坐标进行匹配,从而建立用户位置数据采集点与第一优化栅格之间的映射关系。用户位置数据采集点与第一优化栅格之间的映射关系具体如下表1所示:
表1用户位置数据采集点与优化栅格的映射关系
图8为本发明另一实施例提供的用户惯常地的识别方法流程图。在上述实施例的基础上,本实施例提供的用户惯常地的识别方法具体包括如下步骤:
步骤801、将采集的预定时间段内预定地理区域范围内的用户位置数据按照预设划分规则划分为至少两个时间段的用户位置数据。
步骤802、对每个用户,分别统计映射至各个第二优化栅格的至少两个时间段的用户位置数据的数量,以及用户停留的总时长。
步骤803、确定映射数量大于数量阈值且总时长大于时长阈值的第二优化栅格;
步骤804、对映射数量大于数量阈值且总时长大于时长阈值的所述第二优化栅格进行排序,取映射数量与总时长之和最大的所述第二优化栅格作为所述用户惯常地的所述第二优化栅格。
可选的,至少两个时间段包括工作时段和非工作时段;将采集的预定时间段内预定地理区域范围内的用户位置数据按照预设划分规则划分为至少两个时间段的用户位置数据,包括:将采集的预定时间段内预定地理区域范围内的用户位置数据按照时间段划分为工作时段的用户位置数据和非工作时段的用户位置数据。可选的,至少两个时间段可以是工作日和休息日,对于工作日和休息日的划分可以参照现有技术中日历表对于工作日和节假日的划分。进一步的,可以是在累计采集得到1天的用户位置数据后,判断该天的对应的是工作时段还是非工作时段,如果是工作日,则进一步划分为工作时段还是休息时段,具体的,工作时段可以设置为9:00-11:00和14:00-17:00;工作时段之外的其他时间段设置为休息时段。例如,可以选取21:00-次日6:00为休息时段。在将用户位置数据映射至第二优化栅格后,可以通过统计映射至每个第二优化栅格中的用户位置数据的数量,以及这些用户位置数据在第二优化栅格中的停留总时长,即每个第二优化栅格会计算得到一个用户位置数据的数量和停留总时长,进而通过基于密度的聚类算法(Density-Based SpatialClustering of Applications with Noise,DBSCAN)计算得到数量阈值和停留时长阈值,然后提取出用户位置数据的数量大于数量阈值且停留总时长大于时长阈值的第二优化栅格,并计算映射至第二优化栅格的用户位置数据的数量与用户在该第二优化栅格中停留总时长加起来的和值,通过对计算的和值进行排序,取和值最大的第二优化栅格,就可以得到用户惯常地第二优化栅格。进一步的,还可以将工作时间段和值最大第二优化栅格作为用户工作惯常地,将休息时间段和值最大第二优化栅格作为用户居住惯常地。
可选的,在步骤804之后,还可以包括步骤805(图中未示出):对映射数量与总时长之和最大的所述第二优化栅格中的所述第一优化栅格,取映射数量与总时长之和最大的所述第一优化栅格作为所述用户惯常地的所述第一优化栅格。
可选的,对映射数量与总时长之和最大的所述第二优化栅格中的所述第一优化栅格,取映射数量与总时长之和最大的所述第一优化栅格作为所述用户惯常地的所述第一优化栅格之后,本发明实施例的方法还包括如下步骤:若识别的所述用户惯常地所属的所述第一优化栅格位于对应的所述第二优化栅格的边缘位置时,确定与所述用户惯常地所属的所述第一优化栅格相邻的邻域第一优化栅格;将与所述用户惯常地所属的所述第一优化栅格相邻的邻域第一优化栅格和所述第一优化栅格中,映射数量与停留总时长之和最大的栅格识别为用户惯常地的所述第一优化栅格。这样,能够避免用户的位置轨迹在周围栅格大量离散分布的影响。其中,对于邻域第一优化栅格的选取可以是:若最大和值对应的第一优化栅格位于第二优化栅格的四个角位置处,则可以选取邻域内3-5个第一优化栅格进行扩样;若最大和值对应的第一优化栅格位于第二优化栅格的边缘位置处但不在四个角位置处时,则可以选取该最大和值对应的第一优化栅格邻域内1-3个第一优化栅格栅格进行扩样。应当理解的是,扩样的邻域栅格数量只是作为举例方便理解,并不对本发明实施例做限定。本领域技术人员可以根据实际需求来选取邻域栅格的数量。
图9为本发明实施例提供的用户惯常地的识别装置的结构示意图。本发明实施例提供的用户惯常地的识别装置可以执行用户惯常地的识别方法实施例提供的处理流程,如图9所示,用户惯常地的识别装置90包括:优化模块91和映射模块92;其中,优化模块91,用于基于预定地理区域上用户位置数据采集点的覆盖率,对所述预定地理区域上预先划分的栅格进行优化,得到优化栅格,所述优化栅格的栅格步长小于所述预先划分的栅格的栅格步长且按照优化栅格的栅格步长划分地理区域后,且能够使得所述用户位置数据采集点在所述预定地理区域上均匀分布;映射模块92用于将所述用户位置数据采集点映射至所述优化栅格,得到所述用户位置数据采集点与所述优化栅格之间的映射关系;映射模块92还用于基于所述用户位置数据采集点与所述优化栅格之间的映射关系,将所述用户位置数据采集点采集的预定时间段内所述预定地理区域范围内的用户位置数据映射至对应的所述优化栅格,得到所述用户惯常地。
可选的,所述优化栅格包括第一优化栅格和第二优化栅格,所述第二优化栅格的栅格步长大于所述第一优化栅格的栅格步长。其中,优化模块91在基于预定地理区域上用户位置数据采集点的覆盖率,对所述预定地理区域上预先划分的栅格进行优化,得到优化栅格时,具体用于:基于预定地理区域上用户位置数据采集点的覆盖率,对所述预定地理区域上预先划分的栅格进行优化,得到所述第一优化栅格;将多个所述第一优化栅格连通作为所述第二优化栅格。
可选的,优化模块91在基于预定地理区域上用户位置数据采集点的覆盖率,对所述预定地理区域上预先划分的栅格进行优化,得到所述第一优化栅格时,具体用于:对所述预定地理区域上用户位置数据采集点的覆盖率与对所述预定地理区域进行不同划分得到的栅格步长之间的关系进行拟合,得到拟合曲线;确定所述拟合曲线在均衡状态下的栅格步长,作为优化栅格步长;基于所述优化栅格步长对所述预定地理区域划分第一优化栅格。
可选的,优化模块91对所述预定地理区域上用户位置数据采集点的覆盖率与对所述预定地理区域进行不同划分得到的栅格步长之间的关系进行拟合,得到拟合曲线,具体用于:对所述预定地理区域上用户位置数据采集点的覆盖率进行归一化处理,得到所述预定地理区域上用户位置数据采集点的覆盖指数;对所述预定地理区域进行不同划分的栅格步长进行归一化处理,得到对所述预定地理区域进行不同划分得到的栅格划分精度;将所述栅格划分精度作为横轴,所述覆盖指数作为纵轴,生成覆盖指数与栅格划分精度的散点图;对所述散点图上的散点进行拟合,得到所述拟合曲线。
可选的,优化模块91确定所述拟合曲线在均衡状态下的栅格步长,作为优化栅格步长,具体用于:在所述拟合曲线上某一散点对应的栅格划分精度与所述预定地理区域上用户位置数据采集点的覆盖指数的乘积达到最大值时,判定所述拟合曲线达到均衡状态;基于该散点的栅格划分精度计算栅格长度,得到优化栅格步长。
可选的,预定地理区域上用户位置数据采集点的覆盖率是所述预定地理区域范围内的所述用户位置数据采集点所覆盖的栅格数量与所述预定地理区域上的总栅格数量的比值。
可选的,映射模块92将所述用户位置数据采集点映射至所述优化栅格,得到所述用户位置数据采集点与所述优化栅格之间的映射关系时,具体用于:将所述用户位置数据采集点映射至所述第一优化栅格,得到所述用户位置数据采集点与所述第一优化栅格之间的映射关系。
可选的,映射模块92基于所述用户位置数据采集点与所述优化栅格之间的映射关系,将所述用户位置数据采集点采集的预定时间段内所述预定地理区域范围内的用户位置数据映射至对应的所述优化栅格,得到所述用户惯常地时,具体用于:将采集的预定时间段内所述预定地理区域范围内的用户位置数据按照预设划分规则划分为至少两个时间段的用户位置数据;对每个用户,分别统计映射至各个所述第二优化栅格的所述至少两个时间段的用户位置数据的数量,以及用户停留的总时长;确定映射数量大于数量阈值且总时长大于时长阈值的所述第二优化栅格;对映射数量大于数量阈值且总时长大于时长阈值的所述第二优化栅格进行排序,取映射数量与总时长之和最大的所述第二优化栅格作为所述用户惯常地的所述第二优化栅格。
可选的,映射模块92基于所述用户位置数据采集点与所述优化栅格之间的映射关系,将所述用户位置数据采集点采集的预定时间段内所述预定地理区域范围内的用户位置数据映射至对应的所述优化栅格,得到所述用户惯常地时,还用于:对映射数量与总时长之和最大的所述第二优化栅格中的所述第一优化栅格,取映射数量与总时长之和最大的所述第一优化栅格作为所述用户惯常地的所述第一优化栅格。可选的,所述数量阈值是根据聚类算法对各个所述第二优化栅格的所述至少两个时间段的用户位置数据的数量进行聚类得到;所述时长阈值是根据聚类算法对各个所述第二优化栅格中用户的停留总时长进行聚类得到。
可选的,至少两个时间段包括工作时段和非工作时段;映射模块92将采集的预定时间段内所述预定地理区域范围内的用户位置数据按照预设划分规则划分为至少两个时间段的用户位置数据,具体用于:所述将采集的预定时间段内所述预定地理区域范围内的用户位置数据按照时间段划分为工作时段的用户位置数据和非工作时段的用户位置数据。
可选的,映射模块92对映射数量与总时长之和最大的所述第二优化栅格中的所述第一优化栅格,取映射数量与总时长之和最大的所述第一优化栅格作为所述用户惯常地的所述第一优化栅格之后,还用于若识别的所述用户惯常地所属的所述第一优化栅格位于对应的所述第二优化栅格的边缘位置时,确定与所述用户惯常地所属的所述第一优化栅格相邻的邻域第一优化栅格;将与所述用户惯常地所属的所述第一优化栅格相邻的邻域第一优化栅格和所述第一优化栅格中,映射数量与停留总时长之和最大的栅格识别为用户惯常地的所述第一优化栅格。
图9所示实施例的用户惯常地的识别装置可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图10为本发明实施例提供的用户惯常地的识别设备的结构示意图。本发明实施例提供的用户惯常地的识别设备可以执行用户惯常地的识别方法实施例提供的处理流程,如图10所示,用户惯常地的识别设备100包括:存储器101、处理器102、计算机程序和通讯接口103;其中,计算机程序存储在存储器101中,并被配置为由处理器102执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图10所示实施例的用户惯常地的识别设备可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
另外,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现上述实施例所述的用户惯常地的识别方法。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种用户惯常地的识别方法,其特征在于,包括:
基于对预定地理区域上用户位置数据采集点的覆盖率与对所述预定地理区域进行不同划分得到的栅格步长之间的关系进行拟合,得到拟合曲线;确定所述拟合曲线在均衡状态下的栅格步长,作为优化栅格步长;基于所述优化栅格步长对所述预定地理区域划分第一优化栅格,将多个所述第一优化栅格连通作为第二优化栅格;所述第二优化栅格的栅格步长大于所述第一优化栅格的栅格步长;所述第一优化栅格和所述第二优化栅格归属为优化栅格;所述优化栅格的栅格步长小于预先划分的栅格的栅格步长且按照所述优化栅格的栅格步长划分所述预定地理区域后,能够使得所述用户位置数据采集点在所述预定地理区域上均匀分布;其中,所述覆盖率是所述预定地理区域范围内的所述用户位置数据采集点所覆盖的栅格数量与所述预定地理区域上的总栅格数量的比值;
将所述用户位置数据采集点映射至所述优化栅格,得到所述用户位置数据采集点与所述优化栅格之间的映射关系;所述映射关系是将所述用户位置数据采集点映射至所述第一优化栅格,得到所述用户位置数据采集点与所述第一优化栅格之间的映射关系;
基于所述用户位置数据采集点与所述优化栅格之间的映射关系,将所述用户位置数据采集点采集的预定时间段内所述预定地理区域范围内的用户位置数据映射至对应的所述优化栅格,得到用户惯常地。
2.根据权利要求1所述的方法,其特征在于,所述对所述预定地理区域上用户位置数据采集点的覆盖率与对所述预定地理区域进行不同划分得到的栅格步长之间的关系进行拟合,得到拟合曲线,包括:
对所述预定地理区域上用户位置数据采集点的覆盖率进行归一化处理,得到所述预定地理区域上用户位置数据采集点的覆盖指数;
对所述预定地理区域进行不同划分的栅格步长进行归一化处理,得到对所述预定地理区域进行不同划分得到的栅格划分精度;
将所述栅格划分精度作为横轴,所述覆盖指数作为纵轴,生成覆盖指数与栅格划分精度的散点图;
对所述散点图上的散点进行拟合,得到所述拟合曲线。
3.根据权利要求2所述的方法,其特征在于,所述确定所述拟合曲线在均衡状态下的栅格步长,作为优化栅格步长,包括:
在所述拟合曲线上某一散点对应的栅格划分精度与所述预定地理区域上用户位置数据采集点的覆盖指数的乘积达到最大值时,判定所述拟合曲线达到均衡状态;
基于所述均衡状态对应的散点的栅格划分精度计算栅格长度,得到优化栅格步长。
4.根据权利要求2-3任一项所述的方法,其特征在于,所述基于所述用户位置数据采集点与所述优化栅格之间的映射关系,将所述用户位置数据采集点采集的预定时间段内所述预定地理区域范围内的用户位置数据映射至对应的所述优化栅格,得到用户惯常地,包括:
将采集的预定时间段内所述预定地理区域范围内的用户位置数据按照预设划分规则划分为至少两个时间段的用户位置数据;
对每个用户,分别统计映射至各个所述第二优化栅格的所述至少两个时间段的用户位置数据的数量,以及用户停留的总时长;
确定映射数量大于数量阈值且总时长大于时长阈值的所述第二优化栅格;
对映射数量大于数量阈值且总时长大于时长阈值的所述第二优化栅格进行排序,取映射数量与总时长之和最大的所述第二优化栅格作为所述用户惯常地的所述第二优化栅格。
5.根据权利要求4所述的方法,其特征在于,所述对映射数量大于数量阈值且总时长大于时长阈值的所述第二优化栅格进行排序,取映射数量与总时长之和最大的所述第二优化栅格作为所述用户惯常地的所述第二优化栅格之后,所述方法还包括:
对映射数量与总时长之和最大的所述第二优化栅格中的所述第一优化栅格,取映射数量与总时长之和最大的所述第一优化栅格作为所述用户惯常地的所述第一优化栅格。
6.根据权利要求4所述的方法,其特征在于,所述数量阈值是根据聚类算法对各个所述第二优化栅格的所述至少两个时间段的用户位置数据的数量进行聚类得到;
所述时长阈值是根据聚类算法对各个所述第二优化栅格中用户的停留总时长进行聚类得到。
7.根据权利要求4所述的方法,其特征在于,所述至少两个时间段包括工作时段和非工作时段;
所述将采集的预定时间段内所述预定地理区域范围内的用户位置数据按照预设划分规则划分为至少两个时间段的用户位置数据,包括:
所述将采集的预定时间段内所述预定地理区域范围内的用户位置数据按照时间段划分为工作时段的用户位置数据和非工作时段的用户位置数据。
8.根据权利要求5所述的方法,其特征在于,所述对映射数量与总时长之和最大的所述第二优化栅格中的所述第一优化栅格,取映射数量与总时长之和最大的所述第一优化栅格作为所述用户惯常地的所述第一优化栅格之后,所述方法还包括:
若识别的所述用户惯常地所属的所述第一优化栅格位于对应的所述第二优化栅格的边缘位置时,确定与所述用户惯常地所属的所述第一优化栅格相邻的邻域第一优化栅格;
将与所述用户惯常地所属的所述第一优化栅格相邻的邻域第一优化栅格和所述第一优化栅格中,映射数量与停留总时长之和最大的栅格识别为用户惯常地的所述第一优化栅格。
9.一种用户惯常地的识别设备,其特征在于,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-8中任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910698171.9A CN110351665B (zh) | 2019-07-31 | 2019-07-31 | 用户惯常地的识别方法、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910698171.9A CN110351665B (zh) | 2019-07-31 | 2019-07-31 | 用户惯常地的识别方法、设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110351665A CN110351665A (zh) | 2019-10-18 |
CN110351665B true CN110351665B (zh) | 2020-10-30 |
Family
ID=68183418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910698171.9A Active CN110351665B (zh) | 2019-07-31 | 2019-07-31 | 用户惯常地的识别方法、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110351665B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114640983B (zh) * | 2020-12-15 | 2024-05-24 | 中国移动通信集团山东有限公司 | 用户识别方法及装置、服务器、存储介质 |
CN113176599B (zh) * | 2021-05-20 | 2024-03-15 | 中国第一汽车股份有限公司 | 地理位置确定方法、装置、设备及存储介质 |
CN113868818B (zh) * | 2021-10-13 | 2024-04-02 | 桂林电子科技大学 | 一种区域数据点栅格化区块大小确定方法及系统 |
CN113963536A (zh) * | 2021-10-19 | 2022-01-21 | 海南波罗密信息科技有限公司 | 通过手机信令数据识别居民惯常环境和出行目的的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116696A (zh) * | 2013-01-16 | 2013-05-22 | 上海美慧软件有限公司 | 基于稀疏采样的手机定位数据的人员常驻地点识别方法 |
CN104684080A (zh) * | 2015-02-10 | 2015-06-03 | 同济大学 | 一种三维wlan室内定位方法 |
CN106780064A (zh) * | 2016-12-02 | 2017-05-31 | 腾讯科技(深圳)有限公司 | 一种区域划分方法、装置及网络设备 |
CN107547633A (zh) * | 2017-07-27 | 2018-01-05 | 腾讯科技(深圳)有限公司 | 一种用户常驻点的处理方法、装置和存储介质 |
CN110012436A (zh) * | 2018-12-13 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 用户位置确定方法、装置、设备及计算机可读存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8406239B2 (en) * | 2005-10-03 | 2013-03-26 | Broadcom Corporation | Multi-wideband communications over multiple mediums |
CN102235873B (zh) * | 2010-04-21 | 2013-12-11 | 北京四维图新科技股份有限公司 | 导航电子地图的处理方法和装置、导航仪 |
US8860742B2 (en) * | 2011-05-02 | 2014-10-14 | Nvidia Corporation | Coverage caching |
CN104408043B (zh) * | 2014-10-17 | 2019-02-22 | 深圳大学 | 一种信息处理方法及服务器 |
-
2019
- 2019-07-31 CN CN201910698171.9A patent/CN110351665B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116696A (zh) * | 2013-01-16 | 2013-05-22 | 上海美慧软件有限公司 | 基于稀疏采样的手机定位数据的人员常驻地点识别方法 |
CN104684080A (zh) * | 2015-02-10 | 2015-06-03 | 同济大学 | 一种三维wlan室内定位方法 |
CN106780064A (zh) * | 2016-12-02 | 2017-05-31 | 腾讯科技(深圳)有限公司 | 一种区域划分方法、装置及网络设备 |
CN107547633A (zh) * | 2017-07-27 | 2018-01-05 | 腾讯科技(深圳)有限公司 | 一种用户常驻点的处理方法、装置和存储介质 |
CN110012436A (zh) * | 2018-12-13 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 用户位置确定方法、装置、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110351665A (zh) | 2019-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110351665B (zh) | 用户惯常地的识别方法、设备及计算机可读存储介质 | |
CN107547633B (zh) | 一种用户常驻点的处理方法、装置和存储介质 | |
CN108181607B (zh) | 基于指纹库的定位方法、装置及计算机可读存储介质 | |
CN110020221B (zh) | 职住分布确认方法、装置、服务器及计算机可读存储介质 | |
JP2016152044A (ja) | 目標位置を確定するための方法及び装置 | |
CN103120000A (zh) | 覆盖区域模型的产生和使用 | |
CN108427679B (zh) | 一种人流分布处理方法及其设备 | |
CN110298687B (zh) | 一种区域吸引力评估方法及设备 | |
CN109561390A (zh) | 确定口碑场景覆盖小区的方法及装置 | |
CN106708837B (zh) | 兴趣点搜索方法、装置 | |
CN111311748B (zh) | 室内立体图构建方法及装置、终端设备和存储介质 | |
CN109068272A (zh) | 相似用户识别方法、装置、设备及可读存储介质 | |
CN102480784A (zh) | 一种指纹定位误差的评估方法和系统 | |
CN111311193B (zh) | 公共服务资源的配置方法和装置 | |
CN111475746B (zh) | 兴趣点位置挖掘方法、装置、计算机设备和存储介质 | |
US9612315B2 (en) | Methods of and systems for extracting patterns of human extent and density from geographically anchored radio signal sources | |
CN114205831B (zh) | 一种优化方案的确定方法、装置、存储介质及设备 | |
CN111062525A (zh) | 扩容小区的基站选址方法、装置、设备及存储介质 | |
CN114710787B (zh) | 网络规划方法、装置、设备及存储设备 | |
KR20140056828A (ko) | 사용자 단말을 이용한 유동 인구 분석 장치, 방법 및 컴퓨터 판독 가능한 기록 매체 | |
CN105338186A (zh) | 基于情景感知的Android移动终端电源管理方法 | |
CN107103037B (zh) | 一种地理区域的社会功能的识别方法与终端设备 | |
CN112887910B (zh) | 异常覆盖区域的确定方法、装置和计算机可读存储介质 | |
CN110320493B (zh) | 室内定位方法、装置、电子设备和计算机存储介质 | |
CN110619090A (zh) | 一种区域吸引力评估方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |