CN110290467B - 停留点、商业区服务范围、影响因素的获取方法及装置 - Google Patents

停留点、商业区服务范围、影响因素的获取方法及装置 Download PDF

Info

Publication number
CN110290467B
CN110290467B CN201910541701.9A CN201910541701A CN110290467B CN 110290467 B CN110290467 B CN 110290467B CN 201910541701 A CN201910541701 A CN 201910541701A CN 110290467 B CN110290467 B CN 110290467B
Authority
CN
China
Prior art keywords
point
data
mfr
investigation
business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910541701.9A
Other languages
English (en)
Other versions
CN110290467A (zh
Inventor
杨铮
赵毅
王需
刘桐彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201910541701.9A priority Critical patent/CN110290467B/zh
Publication of CN110290467A publication Critical patent/CN110290467A/zh
Application granted granted Critical
Publication of CN110290467B publication Critical patent/CN110290467B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • H04W4/35Services specially adapted for particular environments, situations or purposes for the management of goods or merchandise

Abstract

本发明实施例提供一种停留点、商业区服务范围、影响因素的获取方法及装置,其中用户停留点的获取方法包括:若考察集合中的任意一个MFR数据中记录的基站位置与考察点中记录的基站位置的间距小于第二预设阈值、数据子集中紧邻起始点之前的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值、数据子集中紧邻终点之后的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值,则将所述考察点作为停留点,将所述考察集合中起始点和终点的时间差作为停留时长。本发明实施例可以准确地找出用户的停留点。

Description

停留点、商业区服务范围、影响因素的获取方法及装置
技术领域
本发明涉及地图技术领域,更具体地,涉及停留点、商业区服务范围、影响因素的获取方法及装置。
背景技术
了解顾客访问各个商业区的情况不仅可以为城市规划提供参考,而且可以辅助商业区的经营者制定更好的经营策略,提高经济收益。在城市规划领域,一个常用的刻画商业区访问情况的方法是“服务范围”分析,一个商业区的服务范围指它的潜在顾客的分布区域。“服务范围”刻画了一个商业区的顾客都是从何处而来,以及它在不同区域的市场份额有多少。
现有的服务范围分析方法往往采用费时费力的问卷调查实现,通过派出调查员前往各个居民区,询问居民在一段时间内访问过哪些商业区,访问的次数有多少。这种方法成本较高,而且只能覆盖少数人群,无法进行大规模的分析。
发明内容
本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的停留点、商业区服务范围、影响因素的获取方法及装置。
第一个方面,本发明实施例提供一种用户停留点的获取方法,包括:
获取一段时间的MFR数据,构成MFR数据集;所述MFR数据中记录用户连接的基站以及连接时刻;
过滤MFR数据集,再将MFR数据集按时序分为若干个数据子集,其中,每个数据子集的最后一个MFR数据的时间与下一个数据子集的第一个MFR数据的时间间隔大于第一预设阈值;
在数据子集中任选一个MFR数据作为考察点,结合所述考察点前后一定范围的MFR数据构建考察集合,将考察集合中第一个MFR数据和最后一个MFR数据分别作为起始点和终点,所述起始点和终点的时间差大于第三预设阈值;
若所述考察集合中的任意一个MFR数据中记录的基站位置与考察点中记录的基站位置的间距小于第二预设阈值、数据子集中紧邻起始点之前的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值、数据子集中紧邻终点之后的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值,则将所述考察点作为停留点,将所述考察集合中起始点和终点的时间差作为停留时长。
优选地,所述用户停留点的获取方法还包括:将所述停留点从所述数据子集中移除,从数据子集中剩余的MFR数据再次选取考察点,直至无法构建起始点和终点的时间差大于第三预设阈值的考察集合。
优选地,过滤MFR数据集,具体为:
若相邻两个MFR数据的时间间隔小于第四预设阈值,且相邻两个MFR数据中记录的基站位置大于第五预设阈值,则将相邻两个MFR数据中的后一个数据删除;
若相邻两个MFR数据的时间间隔小于第六预设阈值,且相邻两个MFR数据中记录的基站位置相同,则将相邻两个MFR数据删除。
第二个方面,本发明实施例提供一种商业区服务范围的获取方法,包括:
根据上述实施例的用户停留点的获取方法获得用户的停留点和停留时长;
根据所述停留点和停留时长确定用户的家庭位置;
将目标区域划分为若干个网格区域,将用户的家庭位置和商业区分别归属至各网格区域中;
将停留点位于商业区的网格区域作为用户访问一次商业区,将网格区域的用户访问商业区的次数除以网格区域的用户访问所有商业区的总次数,作为网格区域的用户访问商业区的概率。
第三个方面,本发明实施例还提供一种商业区吸引力的影响因素的获取方法,包括:
构建商业区吸引力的重力模型:
Figure GDA0002437069830000031
其中,Pij表示区域i的居民访问商业区j的概率,Uij表示商业区j对区域i的居民的吸引力,满足:
Figure GDA0002437069830000032
表示影响因素h的真实值;γ表示影响因素h对商业区j的权重;Dij表示商业区j与区域i的距离;λ表示商业区与区域的距离对于商业区吸引力的权重;
根据上述实施例所述的方法获得区域i的居民访问商业区j的概率,采集各影响因素的真实值,并代入至商业区吸引力的重力模型进行拟合,获得各影响因素对商业区的权重。
优选地,影响因素包括与商业实体相关的影响因素、与城市服务设施相关的影响因素以及与城市人群相关的影响因素;
其中,所述与商业实体相关的影响因素包括商店、餐厅、娱乐设施的数量以及商业区中门店类型的种类;
所述与城市服务设施相关的影响因素包括商业区内停车场、地铁站、公交站的数量;
所述与城市人群相关的影响因素包括商业区周边不同距离范围的人口密度以及商业区的人流量。
第四个方面,本发明实施例还提供一种商业区服务范围的获取方法,包括:
根据上述实施例的获取方法获得各影响因素对商业区的权重;
采集目标商业区的各影响因素的真实值;
将各影响因素的真实值以及各影响因素对目标商业区的权重,输入上述实施例的获取方法中的重力模型,获得商业区对不同区域的居民的吸引力。
第五个方面,本发明实施例还提供一种用户停留点的获取装置,包括:
数据获取模块,用于获取一段时间的MFR数据,构成MFR数据集;所述MFR数据中记录用户连接的基站以及连接时刻;
拆分模块,用于过滤MFR数据集,再将MFR数据集按时序分为若干个数据子集,其中,每个数据子集的最后一个MFR数据的时间与下一个数据子集的第一个MFR数据的时间间隔大于第一预设阈值;
考察集合获取模块,用于在数据子集中任选一个MFR数据作为考察点,结合所述考察点前后一定范围的MFR数据构建考察集合,将考察集合中第一个MFR数据和最后一个MFR数据分别作为起始点和终点,所述起始点和终点的时间差大于第三预设阈值;
停留点确定模块,用于若所述考察集合中的任意一个MFR数据中记录的基站位置与考察点中记录的基站位置的间距小于第二预设阈值、数据子集中紧邻起始点之前的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值、数据子集中紧邻终点之后的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值,则将所述考察点作为停留点,将所述考察集合中起始点和终点的时间差作为停留时长。
第六方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。
第七方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
本发明实施例提供的停留点、商业区服务范围、影响因素的获取方法及装置,能够排除突然切换的数据以及冗余数据的干扰,通过构建考察集合,通过对考察集合中任意两个MFR数据的间距、考察集合中首尾两个MFR数据与数据子集中特定的MRF聚集的间距的限定,可以准确地找出用户的停留点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的用户停留点的获取方法的流程示意图;
图2为本发明实施例提供的用户停留点的获取装置的结构示意图;
图3为本发明实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
近些年,蜂窝网络的发展非常迅速。智能手机的普及和各种网络应用的出现产生了前所未有的海量数据。在世界范围内,智能手机的数量已经超过了人的数量了。这些移动设备频繁的访问蜂窝网络,以获取各种各样的服务。大量的移动数据蕴含了珍贵的商业价值。
图1为本发明实施例的用户停留点的获取方法的流程示意图,如图1所示,包括S101、S102、S103和S104,具体地:
S101、获取一段时间的MFR数据,构成MFR数据集;所述MFR数据中记录用户连接的基站以及连接时刻。
需要说明的是,MFR(Multilink Frame Relay)数据通过用户连接的基站来定位用户的位置,MFR数据可以近似看作用户的位置信息。
S102、过滤MFR数据集,再将MFR数据集按时序分为若干个数据子集,其中,每个数据子集的最后一个MFR数据的时间与下一个数据子集的第一个MFR数据的时间间隔大于第一预设阈值。
需要说明的是,由于用户使用的移动终端并不总是连接到与它最近的基站。比如有时,一个手机可能突然连接上一个距离很远的基站,然后在很短的时间内又切换到一个很近的基站。同时用户对手机的使用通常是间歇性的,比如用户使用移动网络看视频的时候,会产生大量的MFR数据;而用户不使用手机时,产生的MFR数据又十分稀疏。因此,本发明实施例需要对MFR数据集进行过滤,剔除掉基站远距离切换造成的位置错误以及冗余数据。过滤后按照时序将MFR数据集分为若干个数据子集,每个数据子集的最后一个MFR数据的时间与下一个数据子集的第一个MFR数据的时间间隔大于第一预设阈值(例如为2个小时)。
S103、在数据子集中任选一个MFR数据作为考察点,结合所述考察点前后一定范围的MFR数据构建考察集合,将考察集合中第一个MFR数据和最后一个MFR数据分别作为起始点和终点,所述起始点和终点的时间差大于第三预设阈值。
当本发明实施例解决掉MFR数据存至的突然切换以及数据获取时机不规律的问题后,本发明实施例开始从MFR数据中提取用户的停留点和停留时长。在本发明实施例中,当用户在一个区域内停留了足够长的时间时,就认为发生了一次“停留”,相应的位置和时间就被定义成这次的停留点和停留时间。相比原始数据,停留点能更好的刻画用户的位置信息,原因有二:(1)原始的MFR数据存在噪声,手机连接的基站可能在附近几个基站之间波动;(2)停留点往往带有语义信息,比如,在家中休息,在公园游玩,在公司工作等。
S104、若所述考察集合中的任意一个MFR数据中记录的基站位置与考察点中记录的基站位置的间距小于第二预设阈值、数据子集中紧邻起始点之前的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值、数据子集中紧邻终点之后的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值,则将所述考察点作为停留点,将所述考察集合中起始点和终点的时间差作为停留时长。
需要说明的是,本发明实施例的获取用户停留点的方法,能够排除突然切换的数据以及冗余数据的干扰,通过构建考察集合,通过对考察集合中任意两个MFR数据的间距、考察集合中首尾两个MFR数据与数据子集中特定的MRF聚集的间距的限定,可以准确地找出用户的停留点。
在上述各实施例的基础上,作为一种可选实施例,当找出一个停留点后,还包括将所述停留点从所述数据子集中移除,从数据子集中剩余的MFR数据再次选取考察点,直至无法构建起始点和终点的时间差大于第三预设阈值的考察集合。
在上述各实施例的基础上,作为一种可选实施例,过滤MFR数据集的方法具体为:
若相邻两个MFR数据的时间间隔小于第四预设阈值,且相邻两个MFR数据中记录的基站位置大于第五预设阈值,则将相邻两个MFR数据中的后一个数据删除;
若相邻两个MFR数据的时间间隔小于第六预设阈值,且相邻两个MFR数据中记录的基站位置相同,则将相邻两个MFR数据删除。
可以理解的是,本发明实施例中的第一预设阈值至第六预设阈值均可以通过日常的统计获得。
在上述各实施例的基础上,作为一种可选实施例,本发明实施例还包括利用上述各实施例的用户停留点的获取方法推断商业区服务范围的方法。具体地,包括:
S201、根据上述各实施例的用户停留点的获取方法获得用户的停留点和停留时长。
S202、根据所述停留点和停留时长确定用户的家庭位置。
例如,本发明实施例可以使用DBSCAN算法对用户的停留点进行聚类。在每一类中,每个停留点以自身的停留时间作为权重,加权平均得到该类的中心点。所有停留点的停留时间之和作为该类的总停留时间。一般可选取夜间的停留时间最长的聚类作为用户家的位置。
S203、将目标区域划分为若干个网格区域,将用户的家庭位置和商业区分别归属至各网格区域中。
作为一种可选实施例,对于完全未知的目标区域,本发明实施例也可以通过POI(Point of Interest)聚类方法发现目标区域中的商业区,POI聚类方法属于本领域的公知常识,不再赘述。
S204、将停留点位于商业区的网格区域作为用户访问一次商业区,将网格区域的用户访问商业区的次数除以网格区域的用户访问所有商业区的总次数,作为网格区域的用户访问商业区的概率。
具体地,对于获取的每个用户的停留点,若发现停留点所在的网格区域恰好是商业区的网格区域(以下简称区域),那么溜任务用户访问了一次商业区。将网格区域的用户访问商业区的次数除以网格区域的用户访问所有商业区的总次数,作为网格区域的用户访问商业区的概率。例如,某个(住宅)网格区域中有50个用户,通过对50个用户一段时间的MFR数据进行分析,获知共有200个停留点位于商业区A的网格区域,同时有1000个停留点位于目标区域的所有商业区——商业区A、B和C中,那么区域的用户访问商业区A的概率为20%。
本发明实施例利用停留点推断出商业区的服务范围,相比现有技术具有客观性,并且获取到的商业区的服务范围更加准确。
在上述各实施例的基础上,作为一种可选实施例,本发明实施例还提供一种商业区吸引力的影响因素的获取方法,该方法的主要构思为利用重力模型构建商业区服务范围的经典模型,利用上述实施例的商业区服务范围的获取方法获得用户访问商业区的概率,利用概率反推出各影响因素的权重。具体地,本发明实施例的商业区吸引力的影响因素的获取方法具体为:
S301、构建商业区吸引力的重力模型:
Figure GDA0002437069830000081
其中,Pij表示区域i的居民访问商业区j的概率,Uij表示商业区j对区域i的居民的吸引力,满足:
Figure GDA0002437069830000082
表示影响因素h的真实值;γ表示影响因素h对商业区j的权重;Dij表示商业区j与区域i的距离;λ表示商业区与区域的距离对于商业区吸引力的权重。
需要说明的是,重力模型认为一个区域的居民访问某个商业区的概率等于该商业区对这个区域的居民的吸引力除以所有商业区对这个区域的居民的吸引力之和。
本发明实施例的影响因素分为以下几种:
(1)商业实体相关。商业实体的数量和多样性会影响一个商业区的吸引力。对于一个商业区,统计其中的商店的数量,餐厅的数量,娱乐设施的数量,作为影响因素的真实值,还可以用熵来刻画不同种类服务的多样性。熵越高,代表不同种类的设施的多样性越丰富,相应的,该商业区的吸引力就会越大。
(2)城市服务设施相关。一个商业区的吸引力不仅仅和该商业区的商业实体有关,还和该商业区的各种市政设施有关。比如,该商业区停车是否方便,如果选择公共交通前往是否便捷等等,这些都会影响一个商业区的吸引力。因此,在这一类特征中,本发明实施例考虑了停车场的数量,地铁站的数量,公交站的数量等。
(3)城市人群相关。在这一类特征中,本发明实施例考虑了商业区周围的人口密度以及商业区的人流量大小。利用我们推断出的用户的家的位置,本发明实施例估计了商业区周围5km,10km,15km范围内的人口密度。同时,利用基站数据给出的轨迹信息,估计一个商业区的人流量的大小。
S302、根据上述实施例所述的获取方法获得区域i的居民访问商业区j的概率,采集各影响因素的真实值,并代入至商业区吸引力的重力模型进行拟合,获得各影响因素对商业区的权重。
本发明实施例的商业区吸引力的影响因素的获取方法,通过上述实施例的商业区服务范围的获取方法,获得居民访问商业区的概率,然后代入预先构建的商业区吸引力的重力模型中,即可获得各影响因素对商业区的权重。本发明实施例的优势在于采用客观的方式获取影响因素的权重,排除了主观因素的干扰,并且效率更高。
在上述各实施例的基础上,作为一种可选实施例,影响因素包括与商业实体相关的影响因素、与城市服务设施相关的影响因素以及与城市人群相关的影响因素;
其中,所述与商业实体相关的影响因素包括商店、餐厅、娱乐设施的数量以及商业区中门店类型的种类;
所述与城市服务设施相关的影响因素包括商业区内停车场、地铁站、公交站的数量;
所述与城市人群相关的影响因素包括商业区周边不同距离范围的人口密度以及商业区的人流量。
在上述各实施例的基础上,作为一种可选实施例,重力模型在拟合过程中加入L1正则项。L1正则项可以给拟合结果带来稀疏性,从而保留出最重要的特征。
在上述各实施例的基础上,作为一种可选实施例,本发明实施例还提供一种商业区服务范围的获取方法,具体地,包括:
S401、根据上述实施例的商业区吸引力的影响因素的获取方法获得各影响因素对商业区的权重;
S402、采集目标商业区的各影响因素的真实值;
S403、将各影响因素的真实值以及各影响因素对目标商业区的权重,输入上述实施例的商业区吸引力的影响因素的获取方法中的重力模型,获得目标商业区对不同区域的居民的吸引力。
需要说明的是,本发明实施例首先结合大数据,利用上述实施例的商业区吸引力的影响因素的获取方法获得各影响因素对商业区的权重,然后采集目标商业区的各影响因素的真实值,最后将各影响因素的真实值以及各影响因素对目标商业区的权重,输入至上述实施例的重力模型中,即可获得商业区对不同区域的居民的吸引力。本发明实施例的商业区服务范围的获取方法,相比上述实施例的商业区服务范围的获取方法,可以实现离线获取的效果,即预先获取好重力模型以及影响因素对商业区的权重,只需要后期采集目标商业区的各影响因素的真实值,即可快速确定商业区对居民的吸引力。本发明实施例具有效率高,排除主观因素的干扰、结果客观准确的优势。
图2为本发明实施例提供的用户停留点的获取装置的结构示意图,如图2所示,该用户停留点的获取装置包括:数据获取模块201、拆分模块202、考察集合获取模块203和停留点确定模块204,其中:
数据获取模块201,用于获取一段时间的MFR数据,构成MFR数据集;所述MFR数据中记录用户连接的基站以及连接时刻;
拆分模块202,用于过滤MFR数据集,再将MFR数据集按时序分为若干个数据子集,其中,每个数据子集的最后一个MFR数据的时间与下一个数据子集的第一个MFR数据的时间间隔大于第一预设阈值;
考察集合获取模块203,用于在数据子集中任选一个MFR数据作为考察点,结合所述考察点前后一定范围的MFR数据构建考察集合,将考察集合中第一个MFR数据和最后一个MFR数据分别作为起始点和终点,所述起始点和终点的时间差大于第三预设阈值;
停留点确定模块204,用于若所述考察集合中的任意一个MFR数据中记录的基站位置与考察点中记录的基站位置的间距小于第二预设阈值、数据子集中紧邻起始点之前的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值、数据子集中紧邻终点之后的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值,则将所述考察点作为停留点,将所述考察集合中起始点和终点的时间差作为停留时长
本发明实施例提供的用户停留点的获取装置,具体执行上述各用户停留点的获取方法实施例流程,具体请详见上述各用户停留点的获取方法实施例的内容,在此不再赘述。本发明实施例提供的用户停留点的获取装置能够排除突然切换的数据以及冗余数据的干扰,通过构建考察集合,通过对考察集合中任意两个MFR数据的间距、考察集合中首尾两个MFR数据与数据子集中特定的MRF聚集的间距的限定,可以准确地找出用户的停留点。
图3为本发明实施例提供的电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储在存储器330上并可在处理器310上运行的计算机程序,以执行上述各实施例提供的方法,例如包括:获取一段时间的MFR数据,构成MFR数据集;所述MFR数据中记录用户连接的基站以及连接时刻;过滤MFR数据集,再将MFR数据集按时序分为若干个数据子集,其中,每个数据子集的最后一个MFR数据的时间与下一个数据子集的第一个MFR数据的时间间隔大于第一预设阈值;在数据子集中任选一个MFR数据作为考察点,结合所述考察点前后一定范围的MFR数据构建考察集合,将考察集合中第一个MFR数据和最后一个MFR数据分别作为起始点和终点,所述起始点和终点的时间差大于第三预设阈值;若所述考察集合中的任意一个MFR数据中记录的基站位置与考察点中记录的基站位置的间距小于第二预设阈值、数据子集中紧邻起始点之前的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值、数据子集中紧邻终点之后的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值,则将所述考察点作为停留点,将所述考察集合中起始点和终点的时间差作为停留时长。或者,根据上述各实施例所述的获取方法获得用户的停留点和停留时长;根据所述停留点和停留时长确定用户的家庭位置;将目标区域划分为若干个网格区域,将用户的家庭位置和商业区分别归属至各网格区域中;将停留点位于商业区的网格区域作为用户访问一次商业区,将网格区域的用户访问商业区的次数除以网格区域的用户访问所有商业区的总次数,作为网格区域的用户访问商业区的概率。或者,构建商业区吸引力的重力模型,根据上述实施例方法获得区域i的居民访问商业区j的概率,并代入至商业区吸引力的重力模型进行拟合,获得各影响因素对商业区的权重。或者,根据上述实施例的获取方法获得各影响因素对商业区的权重,采集目标商业区的各影响因素的真实值,将各影响因素的真实值以及各影响因素对目标商业区的权重,输入上述各实施例的获取方法中的重力模型,获得商业区对不同区域的居民的吸引力。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法,例如包括:获取一段时间的MFR数据,构成MFR数据集;所述MFR数据中记录用户连接的基站以及连接时刻;过滤MFR数据集,再将MFR数据集按时序分为若干个数据子集,其中,每个数据子集的最后一个MFR数据的时间与下一个数据子集的第一个MFR数据的时间间隔大于第一预设阈值;在数据子集中任选一个MFR数据作为考察点,结合所述考察点前后一定范围的MFR数据构建考察集合,将考察集合中第一个MFR数据和最后一个MFR数据分别作为起始点和终点,所述起始点和终点的时间差大于第三预设阈值;若所述考察集合中的任意一个MFR数据中记录的基站位置与考察点中记录的基站位置的间距小于第二预设阈值、数据子集中紧邻起始点之前的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值、数据子集中紧邻终点之后的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值,则将所述考察点作为停留点,将所述考察集合中起始点和终点的时间差作为停留时长。或者,根据上述各实施例所述的获取方法获得用户的停留点和停留时长;根据所述停留点和停留时长确定用户的家庭位置;将目标区域划分为若干个网格区域,将用户的家庭位置和商业区分别归属至各网格区域中;将停留点位于商业区的网格区域作为用户访问一次商业区,将网格区域的用户访问商业区的次数除以网格区域的用户访问所有商业区的总次数,作为网格区域的用户访问商业区的概率。或者,构建商业区吸引力的重力模型,根据上述实施例方法获得区域i的居民访问商业区j的概率,并代入至商业区吸引力的重力模型进行拟合,获得各影响因素对商业区的权重。或者,根据上述实施例的获取方法获得各影响因素对商业区的权重,采集目标商业区的各影响因素的真实值,将各影响因素的真实值以及各影响因素对目标商业区的权重,输入上述各实施例的获取方法中的重力模型,获得商业区对不同区域的居民的吸引力。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种用户停留点的获取方法,其特征在于,包括:
获取一段时间的MFR数据,构成MFR数据集;所述MFR数据中记录用户连接的基站以及连接时刻;
过滤MFR数据集,再将MFR数据集按时序分为若干个数据子集,其中,每个数据子集的最后一个MFR数据的时间与下一个数据子集的第一个MFR数据的时间间隔大于第一预设阈值;
在数据子集中任选一个MFR数据作为考察点,任意结合所述考察点前后一定范围的MFR数据构建考察集合,将考察集合中第一个MFR数据和最后一个MFR数据分别作为起始点和终点,所述起始点和终点的时间差大于第三预设阈值;
若所述考察集合中的任意一个MFR数据中记录的基站位置与考察点中记录的基站位置的间距小于第二预设阈值,数据子集中紧邻起始点之前的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值,和数据子集中紧邻终点之后的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值,则将所述考察点作为停留点,将所述考察集合中起始点和终点的时间差作为停留时长。
2.根据权利要求1所述的用户停留点的获取方法,其特征在于,还包括:
将所述停留点从所述数据子集中移除,从数据子集中剩余的MFR数据再次选取考察点,直至无法构建起始点和终点的时间差大于第三预设阈值的考察集合。
3.根据权利要求1所述的用户停留点的获取方法,其特征在于,所述过滤MFR数据集,具体为:
若相邻两个MFR数据的时间间隔小于第四预设阈值,且相邻两个MFR数据中记录的基站位置大于第五预设阈值,则将相邻两个MFR数据中的后一个数据删除;
若相邻两个MFR数据的时间间隔小于第六预设阈值,且相邻两个MFR数据中记录的基站位置相同,则将相邻两个MFR数据删除。
4.一种商业区服务范围的获取方法,其特征在于,包括:
根据权利要求1-3任意一项所述的获取方法获得用户的停留点和停留时长;
根据所述停留点和停留时长确定用户的家庭位置;
将目标区域划分为若干个网格区域,将用户的家庭位置和商业区分别归属至各网格区域中;
将停留点位于商业区的网格区域作为用户访问一次商业区,将网格区域的用户访问商业区的次数除以网格区域的用户访问所有商业区的总次数,作为网格区域的用户访问商业区的概率。
5.一种商业区吸引力的影响因素的获取方法,其特征在于,包括:
构建商业区吸引力的重力模型:
Figure FDA0002437069820000021
其中,Pij表示区域i的居民访问商业区j的概率,Uij表示商业区j对区域i的居民的吸引力,满足:
Figure FDA0002437069820000022
Figure FDA0002437069820000023
表示影响因素h的真实值;γ表示影响因素h对商业区j的权重;Dij表示商业区j与区域i的距离;λ表示商业区与区域的距离对于商业区吸引力的权重;其中,Ni指的是所有商业区的数量,H指的是影响因素的数量;
根据权利要求4所述的方法获得区域i的居民访问商业区j的概率,采集各影响因素的真实值,并代入至商业区吸引力的重力模型进行拟合,获得各影响因素对商业区的权重。
6.根据权利要求5所述的获取方法,其特征在于,所述影响因素包括与商业实体相关的影响因素、与城市服务设施相关的影响因素以及与城市人群相关的影响因素;
其中,所述与商业实体相关的影响因素包括商店的数量,餐厅的数量,娱乐设施的数量,和商业区中门店类型的种类;
所述与城市服务设施相关的影响因素包括商业区内停车场的数量,地铁站的数量,和公交站的数量;
所述与城市人群相关的影响因素包括商业区周边不同距离范围的人口密度以及商业区的人流量。
7.一种商业区服务范围的获取方法,其特征在于,包括:
根据权利要求5或6所述的获取方法获得各影响因素对商业区的权重;
采集目标商业区的各影响因素的真实值;
将各影响因素的真实值以及各影响因素对目标商业区的权重,输入权利要求5或6所述的获取方法中的重力模型,获得商业区对不同区域的居民的吸引力。
8.一种用户停留点的获取装置,其特征在于,包括:
数据获取模块,用于获取一段时间的MFR数据,构成MFR数据集;所述MFR数据中记录用户连接的基站以及连接时刻;
拆分模块,用于过滤MFR数据集,再将MFR数据集按时序分为若干个数据子集,其中,每个数据子集的最后一个MFR数据的时间与下一个数据子集的第一个MFR数据的时间间隔大于第一预设阈值;
考察集合获取模块,用于在数据子集中任选一个MFR数据作为考察点,任意结合所述考察点前后一定范围的MFR数据构建考察集合,将考察集合中第一个MFR数据和最后一个MFR数据分别作为起始点和终点,所述起始点和终点的时间差大于第三预设阈值;
停留点确定模块,用于若所述考察集合中的任意一个MFR数据中记录的基站位置与考察点中记录的基站位置的间距小于第二预设阈值,数据子集中紧邻起始点之前的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值,和数据子集中紧邻终点之后的MFR数据中记录的基站位置与考察点中记录的基站位置的间距大于第二预设阈值,则将所述考察点作为停留点,将所述考察集合中起始点和终点的时间差作为停留时长。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至7中任意一项所述的方法。
CN201910541701.9A 2019-06-21 2019-06-21 停留点、商业区服务范围、影响因素的获取方法及装置 Active CN110290467B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910541701.9A CN110290467B (zh) 2019-06-21 2019-06-21 停留点、商业区服务范围、影响因素的获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910541701.9A CN110290467B (zh) 2019-06-21 2019-06-21 停留点、商业区服务范围、影响因素的获取方法及装置

Publications (2)

Publication Number Publication Date
CN110290467A CN110290467A (zh) 2019-09-27
CN110290467B true CN110290467B (zh) 2020-08-04

Family

ID=68004794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910541701.9A Active CN110290467B (zh) 2019-06-21 2019-06-21 停留点、商业区服务范围、影响因素的获取方法及装置

Country Status (1)

Country Link
CN (1) CN110290467B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111405483B (zh) * 2020-03-10 2021-07-30 腾讯科技(深圳)有限公司 行程轨迹生成方法、装置、电子设备及存储介质
CN112118531B (zh) * 2020-09-12 2021-06-29 上海大学 一种基于位置的群智感知应用的隐私保护方法
CN112685658B (zh) * 2020-12-25 2022-07-26 江苏满运物流信息有限公司 货源聚集地展示方法、装置、电子设备、存储介质
CN113672812A (zh) * 2021-08-25 2021-11-19 北京三快在线科技有限公司 一种地点推荐方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102629297A (zh) * 2012-03-06 2012-08-08 北京建筑工程学院 一种基于行程识别的出行者活动规律分析方法
EP2664999A4 (en) * 2011-01-14 2015-01-28 Nec Corp ACTIVITY DIAGRAM ANALYSIS UNIT, ACTIVITY DIAGRAM ANALYSIS METHOD, AND ACTIVITY DIAGRAM ANALYSIS PROGRAM
CN105142106A (zh) * 2015-07-29 2015-12-09 西南交通大学 基于手机信令数据的出行者职住地识别与出行链刻画方法
CN105682025A (zh) * 2016-01-05 2016-06-15 重庆邮电大学 基于移动信令数据的用户驻留地识别方法
CN109672715A (zh) * 2018-09-13 2019-04-23 深圳壹账通智能科技有限公司 用户常驻地判断方法、装置、设备及计算机可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101799549B (zh) * 2010-01-26 2013-03-20 华为终端有限公司 记录地理位置信息的方法及移动终端
CN102607553B (zh) * 2012-03-06 2014-08-13 北京建筑工程学院 一种基于出行轨迹数据的行程识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2664999A4 (en) * 2011-01-14 2015-01-28 Nec Corp ACTIVITY DIAGRAM ANALYSIS UNIT, ACTIVITY DIAGRAM ANALYSIS METHOD, AND ACTIVITY DIAGRAM ANALYSIS PROGRAM
CN102629297A (zh) * 2012-03-06 2012-08-08 北京建筑工程学院 一种基于行程识别的出行者活动规律分析方法
CN105142106A (zh) * 2015-07-29 2015-12-09 西南交通大学 基于手机信令数据的出行者职住地识别与出行链刻画方法
CN105682025A (zh) * 2016-01-05 2016-06-15 重庆邮电大学 基于移动信令数据的用户驻留地识别方法
CN109672715A (zh) * 2018-09-13 2019-04-23 深圳壹账通智能科技有限公司 用户常驻地判断方法、装置、设备及计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Finding Important Locations: A Feature-Based Approach;Marco Pavan et.al;《2015 16th IEEE International Conference on Mobile Data Management》;20150914;全文 *
基于基站数据挖掘个人驻留规律;齐帅等;《计算机系统应用》;20170915;全文 *

Also Published As

Publication number Publication date
CN110290467A (zh) 2019-09-27

Similar Documents

Publication Publication Date Title
CN110290467B (zh) 停留点、商业区服务范围、影响因素的获取方法及装置
WO2020258905A1 (zh) 一种信息推送方法和装置
CN109614556B (zh) 访问路径预测、信息推送方法及装置
JP6937776B2 (ja) 地理的位置の属性情報を特定するための方法及びデバイス
CN103914536A (zh) 一种用于电子地图的兴趣点推荐方法及系统
CN105007171A (zh) 基于通信领域大数据的用户数据分析系统及方法
CN105354196A (zh) 信息推送方法和信息推送装置
CN102752336B (zh) 基于地理位置服务的ugc的共享方法及系统
JP2014533388A (ja) インターネットに接続されたデバイスに関連するインテリジェンスデータに基づいてデータネットワークを使用してモバイル広告を提供すること
CN109816440A (zh) 营销方法、装置及系统
CN113412607B (zh) 内容推送方法、装置、移动终端及存储介质
US10178498B2 (en) Method and device for signal processing
CN102801817A (zh) 基于用户上下文的推送方法及装置
WO2021147431A1 (zh) 无线热点与兴趣点的映射方法、装置、计算机可读存储介质和计算机设备
CN101557582B (zh) 一种移动通信用户信息统计方法及装置
CN106570014A (zh) 用于确定用户的家庭属性信息的方法与设备
CN107341693A (zh) 旅游用户筛选的方法和旅游用户筛选的系统
CN112311612A (zh) 一种家庭画像构建方法、装置及存储介质
CN108011761A (zh) 基于大数据的采集和分析访客数据的方法
CN102957676A (zh) 一种基于地理位置的网络信息推送方法及装置
CN115866547A (zh) 基于信令数据的固定区域游客统计方法、系统和存储介质
CN110992230B (zh) 基于终端信令数据的全量人口统计方法、装置及服务器
CN108076032B (zh) 一种异常行为用户识别方法及装置
CN110619090B (zh) 一种区域吸引力评估方法及设备
CN112465565A (zh) 一种基于机器学习的用户画像预测的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant