CN107103037B - 一种地理区域的社会功能的识别方法与终端设备 - Google Patents

一种地理区域的社会功能的识别方法与终端设备 Download PDF

Info

Publication number
CN107103037B
CN107103037B CN201710175044.1A CN201710175044A CN107103037B CN 107103037 B CN107103037 B CN 107103037B CN 201710175044 A CN201710175044 A CN 201710175044A CN 107103037 B CN107103037 B CN 107103037B
Authority
CN
China
Prior art keywords
time period
operator network
user
preset time
geographic area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710175044.1A
Other languages
English (en)
Other versions
CN107103037A (zh
Inventor
韩剑
蒋宇波
徐亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201710175044.1A priority Critical patent/CN107103037B/zh
Publication of CN107103037A publication Critical patent/CN107103037A/zh
Application granted granted Critical
Publication of CN107103037B publication Critical patent/CN107103037B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Remote Sensing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例公开了一种地理区域的社会功能的识别方法与终端设备。其中,该方法包括:获取地理区域中用户与运营商网络交互的数据;根据用户与运营商网络交互的数据,统计地理区域的第一特征量;对第一特征量进行特征聚类以获得至少两个地理区域分类;根据用户与运营商网络交互的数据,统计地理区域的第二特征量;统计上述地理区域分类中对应的第二特征量符合目标社会功能的先验条件的地理区域的数量占所在的分类的地理区域总数量的比例,从而将比例最高的地理区域分类中的地理区域作为具有目标社会功能的地理区域。由此,可以对地理区域内用户与运营商网络交互的数据进行提取、处理,进而确定该地理区域是否具有某社会功能。

Description

一种地理区域的社会功能的识别方法与终端设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种地理区域的社会功能的识别方法与终端设备。
背景技术
随着城市化的不断推进,为了满足人们不同的城市生活需求,每个地理区域都包含了不同的社会功能,甚至有的地理区域形成了以某种社会功能为主的功能区,例如居民区、商业区、工业园区等等。如果对地理区域的社会功能进行识别,可以有针对性地进行广告投放、商业投资和城市规划等。
在进行地理区域的社会功能的识别时,常利用大量用户在不同地理区域之间的移动规律和城市兴趣点(Point Of Interest,POI)的地理分布信息,通过建立主题模型以分析不同地理区域的主要社会功能。基于这种思路的分析过程主要包含下面三个步骤:
1、通过用户在不同区域之间的移动轨迹,例如出租车的运行路线或者蜂窝网络中经历的基站轨迹等,建立不同地理区域之间的联系;
2、把城市兴趣点的地理分布信息作为先验条件,通过主题模型得到每个地理区域的社会功能分布;
3、根据地理区域的社会功能分布确定该地理区域的主要社会功能,从而确定城市的功能区域划分。
然而,这种做法的缺点是,需要城市中餐厅、商场等城市兴趣点的地理分布信息作为先验条件;除此以外,这种方式仅能确定商业区、教学区等大区域在城市中的分布,而不能具体识别某一具体的地理区域的社会功能。
因此,如何确定一个地理区域是否包含某社会功能,成为一个亟待解决的问题。
发明内容
本发明实施例提供了一种地理区域的社会功能的识别方法与终端设备,可以对地理区域内用户与运营商网络交互的数据进行提取、处理,进而确定该地理区域是否具有某社会功能。
第一方面,本发明实施例提供了一种地理区域的社会功能的识别方法,包括:
获取至少两个地理区域中用户与运营商网络交互的数据;
根据所述用户与运营商网络交互的数据,统计所述至少两个地理区域的至少两个第一特征量,所述至少两个第一特征量与所述至少两个地理区域一一对应;
对所述至少两个第一特征量进行特征聚类以获得至少两个地理区域分类;
根据所述用户与运营商网络交互的数据,统计所述至少两个地理区域的至少两个第二特征量,所述至少两个第二特征量与所述至少两个地理区域一一对应;
分别统计所述至少两个地理区域分类中对应的第二特征量符合目标社会功能的先验条件的地理区域的数量占所在的地理区域分类的地理区域总数量的比例,从而用于将所述比例最高的地理区域分类中的地理区域作为具有所述目标社会功能的地理区域。
在该实施方式中,可以通过特征聚类的方式将需识别的地理区域分为至少两类,再从中确定一个类别作为目标社会功能的分类(即该类别中的地理区域具有目标社会功能)。
作为一种可选的实施方式,所述将所述比例最高的地理区域分类中的地理区域作为具有所述目标社会功能的地理区域之后,所述方法还包括:
标记具有所述目标社会功能的地理区域。
在该实施方式中,将目标社会功能的分类中包含的地理区域标记为含有目标社会功能的地理区域,即可以确定每个单独的地理区域是否包含某社会功能,而不是确定一个大范围的地理区域的主要社会功能。
作为一种可选的实施方式,所述用户与运营商网络交互的数据包括:用户的语音通话记录、短信记录、上网记录和应用使用记录。
在该实施方式中,可以通过用户与运营商网络交互的数据总结出该地理区域中用户使用终端设备的行为特征,由于用户在不同社会功能的地理区域中使用终端设备的行为存在较大差异,因而可以将用户使用终端设备的行为特征包含在第一特征量之中,再利用第一特征量为建立多维特征对地理区域进行特征聚类。
作为一种可选的实施方式,所述根据所述用户与运营商网络交互的数据统计所述地理区域的第一特征量之前,所述方法还包括:
根据所述目标社会功能确定需统计的所述第一特征量;
所述统计所述至少两个分类中每个地理区域的第二特征量之前,所述方法还包括:
根据所述目标社会功能确定需统计的所述第二特征量。
在该实施方式中,根据预先调研得到的目标社会功能的地理区域的特点,确定需统计的第一特征量与第二特征量。因此,第一特征量与第二特征量,根据需识别的目标社会功能的不同而有所区别。
作为一种可选的实施方式,所述目标社会功能包括:办公功能、居住功能、餐馆或商场。
在该实施方式中,目标社会功能还可能包括图书馆、医院等,由于具有不同社会功能的地理区域,用户与运营商网络交互的数据会呈现不同的特点,因而可以根据用户与运营商网络交互的数据,来确定地理区域是否具有目标社会功能。
作为一种可选的实施方式,所述至少两个第一特征量为用于指示对应的地理区域中平均每个用户与运营商网络交互的统计数据。
作为一种可选的实施方式,所述目标社会功能为所述办公功能,所述第一特征量包括:
工作日在第一预设时间段内用户与所述运营商网络交互的平均时间间隔;
工作日在所述第一预设时间段内用户与所述运营商网络交互的时间间隔的方差;
工作日在所述第一预设时间段内用户使用应用的平均时间间隔;
工作日在所述第一预设时间段内用户使用应用的时间间隔的方差;
工作日在所述第一预设时间段内用户与所述运营商网络交互的频率;
工作日在所述第一预设时间段内用户使用应用的频率;
工作日在所述第一预设时间段内用户使用社交类应用的频率;
工作日在所述第一预设时间段内用户使用浏览器访问网页的频率;以及,
工作日在第二预设时间段内用户使用应用的个数中的至少一项。
作为一种可选的实施方式,所述至少两个第二特征量为用于指示对应的地理区域中人流量的统计数据。
在该实施方式中,第一特征量包含至少一项反映用户在地理区域使用终端设备的行为特征的量,因此,可以根据上述列举的量建立多维聚类的坐标系,将需识别的地理区域聚类为至少两个簇,每个簇代表对地理区域的一种分类。
作为一种可选的实施方式,所述目标社会功能为所述办公功能,所述第二特征量包括:
工作日在所述第一预设时间段在所述运营商网络注册的平均人数;
节假日在所述第一预设时间段在所述运营商网络注册的平均人数;
工作日在所述运营商网络注册人数增加最多的时间段;
工作日在所述运营商网络注册人数减少最多的时间段中的至少一项。
在该实施方式中,第二特征量包含至少一项反映地理区域的人流量特征的量,由于不同社会功能的地理区域的人流量特征存在一定差异,因此可以根据预先总结的目标社会功能的先验条件(目标社会功能的地理区域的人流量特征)来确定特征聚类后的哪个分类为目标社会功能的分类。
作为一种可选的实施方式,所述目标社会功能为所述办公功能,所述目标社会功能的先验条件包括:
工作日在所述第一预设时间段在所述运营商网络注册的平均人数多于节假日在所述第一预设时间段在所述运营商网络注册的平均人数;
工作日在所述运营商网络注册人数增加最多的时间段为第三预设时间段;以及,
工作日在所述运营商网络注册人数减少最多的时间段为第四预设时间段中的至少一项。
在该实施方式中,同级特征聚类后的至少两个分类中,第二特征量符合上述先验条件的地理区域的比例,将比例最高的分类确定为办公功能的分类(即该分类中的各个地理区域,均具有办公功能)。
第二方面,本发明实施例提供了一种终端设备,包括:
获取单元,用于获取至少两个地理区域中用户与运营商网络交互的数据;
第一统计单元,用于根据所述用户与运营商网络交互的数据,统计所述至少两个地理区域的至少两个第一特征量,所述至少两个第一特征量与所述至少两个地理区域一一对应;
特征聚类单元,用于对所述至少两个第一特征量进行特征聚类以获得至少两个地理区域分类;
第二统计单元,用于根据所述用户与运营商网络交互的数据,统计所述至少两个地理区域的至少两个第二特征量,所述至少两个第二特征量与所述至少两个地理区域一一对应;
第三统计单元,用于分别统计所述至少两个地理区域分类中对应的第二特征量符合目标社会功能的先验条件的地理区域的数量占所在的地理区域分类的地理区域总数量的比例,从而用于将所述比例最高的地理区域分类中的地理区域作为具有所述目标社会功能的地理区域。
作为一种可选的实施方式,所述终端设备还包括:
标记单元,用于标记具有所述目标社会功能的地理区域。
作为一种可选的实施方式,所述用户与运营商网络交互的数据包括:用户的语音通话记录、短信记录、上网记录和应用使用记录。
作为一种可选的实施方式,所述终端设备还包括:
第一确定单元,用于根据所述目标社会功能确定所述第一统计单元需统计的所述第一特征量;
所述终端设备还包括:
第二确定单元,用于根据所述目标社会功能确定所述第二统计单元需统计的所述第二特征量。
作为一种可选的实施方式,所述目标社会功能包括:办公功能、居住功能、餐馆或商场。
作为一种可选的实施方式,所述至少两个第一特征量为用于指示对应的地理区域中平均每个用户与运营商网络交互的统计数据。
作为一种可选的实施方式,所述目标社会功能为所述办公功能,所述第一特征量包括:
工作日在第一预设时间段内用户与所述运营商网络交互的平均时间间隔;
工作日在所述第一预设时间段内用户与所述运营商网络交互的时间间隔的方差;
工作日在所述第一预设时间段内用户使用应用的平均时间间隔;
工作日在所述第一预设时间段内用户使用应用的时间间隔的方差;
工作日在所述第一预设时间段内用户与所述运营商网络交互的频率;
工作日在所述第一预设时间段内用户使用应用的频率;
工作日在所述第一预设时间段内用户使用社交类应用的频率;
工作日在所述第一预设时间段内用户使用浏览器访问网页的频率;以及,
工作日在第二预设时间段内用户使用应用的个数中的至少一项。
作为一种可选的实施方式,所述至少两个第二特征量为用于指示对应的地理区域中人流量的统计数据。
作为一种可选的实施方式,所述目标社会功能为所述办公功能,所述第二特征量包括:
工作日在所述第一预设时间段在所述运营商网络注册的平均人数;
节假日在所述第一预设时间段在所述运营商网络注册的平均人数;
工作日在所述运营商网络注册人数增加最多的时间段;
工作日在所述运营商网络注册人数减少最多的时间段中的至少一项。
作为一种可选的实施方式,所述目标社会功能为所述办公功能,所述目标社会功能的先验条件包括:
工作日在所述第一预设时间段在所述运营商网络注册的平均人数多于节假日在所述第一预设时间段在所述运营商网络注册的平均人数;
工作日在所述运营商网络注册人数增加最多的时间段为第三预设时间段;以及,
工作日在所述运营商网络注册人数减少最多的时间段为第四预设时间段中的至少一项。
通过实施本发明实施例,可以对地理区域内用户与运营商网络交互的数据进行提取、处理,进而确定该地理区域是否具有某社会功能。
附图说明
为了更清楚地说明本发明实施例或背景技术中的技术方案,下面将对本发明实施例或背景技术中所需要使用的附图进行说明。
图1A是本发明实施例公开的一种地理区域的社会功能的识别方法的流程示意图;
图1B是本发明实施例公开的一种小区的结构示意图;
图1C是本发明实施例公开的另一种小区的结构示意图;
图1D是本发明实施例公开的一种K-means算法的聚类结果的示意图;
图2是本发明实施例公开的一种用户终端与基站以及用于社会功能识别的终端设备之间的交互示意图;
图3是本发明实施例公开的一种终端设备300的结构示意图;
图4是本发明实施例公开的另一种终端设备400的结构示意图;
图5是本发明实施例公开的又一种终端设备500的结构示意图。
具体实施方式
下面结合本发明实施例中的附图对本发明实施例进行描述。
请参见图1A,图1A是本发明实施例提供的一种地理区域的社会功能的识别方法的流程示意图。其中,该流程包括以下步骤:
101、获取至少两个地理区域中用户与运营商网络交互的数据。
本发明实施例中,终端设备获取地理区域中用户与运营商网络交互的数据。上述终端设备可为智能手机、智能手表、掌上电脑、平板电脑、个人数字助理(Personal DigitalAssistant,PDA)、个人电脑(Personal Computer,PC)、小型服务器、分布式服务器等,本发明实施例后续不作复述。
本发明实施例中,基站向用户提供运营商的网络接入,用户的终端设备在与基站进行交互的过程中,基站可以记录用户使用终端设备时产生的数据,包括:用户的语音通话记录、短信记录、上网记录和应用使用记录等。其中,该应用使用记录应为用户的终端设备中,需要与运营商网络进行数据交互的应用,在该交互过程中产生的应用使用记录。终端设备可以从运营商处获得数据的接口,从而获取上述基站记录的数据。除此之外,用户与运营商网络交互的数据也可以预先存储于终端设备的存储介质中,在执行本发明实施例中所描述的地理区域的社会功能的识别方法时,通过终端设备内部进程调取存储于存储介质中的数据。其中,基站记录的用户数据具有一定的格式,如表1所示,表1为部分从基站获得的数据的字段的解释及数据样例。
字段名 字段解释 样例
USER_NO 用户编号 12366
TIME 记录时间 1474876937.0
LAC 位置区号 A038
SAC 服务区号 02AB
CI 小区号 00AA
HOST 访问的URL m.taobao.com
表1基站记录的数据样例
请参阅图1B,图1B为本发明实施例公开的一种小区的结构示意图。如图1B所示,小区的理论形状为六边形,当提供无线覆盖的基站为定向性基站时,一个基站可提供3个小区,因此基站位于小区的六边形的顶点处。假设如图1B所示的小区为微小区,其覆盖半径大约为30m~300m,图1B中的甲小区正好覆盖了一栋大楼的地理区域。
请参阅图1C,图1C为本发明实施例公开的另一种小区的结构示意图。如图1C所示,当提供无线覆盖的基站为全向性基站时,全向性基站使用全向天线,整个小区只需要一个天线即可实现覆盖。用户若在该小区内与运营商网络进行交互,则该基站可以获取并记录用户使用终端设备时产生的数据。
102、根据上述用户与运营商网络交互的数据,统计上述至少两个地理区域的至少两个第一特征量。
本发明实施例中,上述至少两个第一特征量与上述至少两个地理区域一一对应。
在终端设备根据上述用户与运营商网络交互的数据统计上述地理区域的第一特征量之前,先根据想要识别的目标社会功能确定需统计的第一特征量。
举例来说,当目标社会功能为办公功能时,对办公功能的地理区域进行一定的调研统计,总结出办公功能的地理区域中,人们使用智能手机、智能手表等终端设备的行为规律:碎片化使用为主,其具体表现为与终端设备的交互频率较低、每次使用的持续时间短,应用使用种类少,并且通话和短信占终端设备使用行为的比重较大。
因此,基于办公功能的地理区域中人们使用终端设备的行为规律,确定以下量中的至少一项作为第一特征量:
a.工作日在第一预设时间段内用户与上述运营商网络交互的平均时间间隔;
b.工作日在第一预设时间段内用户与上述运营商网络交互的时间间隔的方差;
c.工作日在第一预设时间段内用户使用应用的平均时间间隔;
d.工作日在第一预设时间段内用户使用应用的时间间隔的方差;
e.工作日在第一预设时间段内用户与上述运营商网络交互的频率;
f.工作日在第一预设时间段内用户使用应用的频率;
g.工作日在第一预设时间段内用户使用社交类应用的频率;
h.工作日在第一预设时间段内用户使用浏览器访问网页的频率;以及,
i.工作日在第二预设时间段内用户使用应用的个数。
其中,第一预设时间和第二预设时间大致为上班时间,根据地区的不同,上班时间可能会有较大差异,举例来说,第一预设时间可为9:00~17:00,第二预设时间为9:00~18:00,以此为例,下面具体说明根据基站获得的用户与运营商网络交互的数据计算上述a~i项特征的方法:
a.工作日在第一预设时间段内用户与上述运营商网络交互的平均时间间隔:
a1)针对每个用户,筛选其工作日9:00-17:00在该基站记录的交互记录;
a2)对筛选后每个用户的记录按照时间先后顺序进行排序;
a3)对排序后每个用户的记录按天进行统计,计算每天交互记录两两间的时间间隔,并求平均;
a4)对每个用户每天得到的平均时间间隔,按天求取平均;
a5)对每个用户得到的按天平均后的平均时间间隔按用户进行平均,从而得到平均每个用户的交互记录平均时间间隔。
b.工作日在第一预设时间段内用户与上述运营商网络交互的时间间隔的方差:
b1)针对每个用户,筛选其工作日9:00-17:00在该基站记录的交互记录;
b2)对筛选后每个用户的记录按照时间先后顺序进行排序;
b3)对排序后每个用户的记录按天进行统计,计算每天交互记录两两间的时间间隔,并求方差;
b4)对每个用户每天得到的方差,按天求取平均;
b5)对每个用户得到的按天平均后的方差按用户进行平均,从而得到平均每个用户的交互记录时间间隔的方差。
c.工作日在第一预设时间段内用户使用应用的平均时间间隔:
c1)针对每个用户,筛选其工作日9:00-17:00在该基站记录的APP的使用记录;
c2)对筛选后每个用户的记录按照时间先后顺序进行排序;
c3)对排序后每个用户的记录按天进行统计,计算每天APP使用记录两两间的时间间隔,并求平均;
c4)对每个用户每天得到的平均时间间隔,按天求取平均;
c5)对每个用户得到的按天平均后的平均时间间隔按用户进行平均,从而得到平均每个用户的APP使用记录的平均时间间隔。
d.工作日在第一预设时间段内用户使用应用的时间间隔的方差:
d1)针对每个用户,筛选其工作日9:00-17:00在该基站记录的APP使用记录;
d2)对筛选后每个用户的记录按照时间先后顺序进行排序;
d3)对排序后每个用户的记录按天进行统计,计算每天APP使用记录两两间的时间间隔,并求方差;
d4)对每个用户每天得到的方差,按天求取平均;
d5)对每个用户得到的按天平均后的方差按用户进行平均,从而得到平均每个用户的APP使用记录时间间隔的方差。
e.工作日在第一预设时间段内用户与上述运营商网络交互的频率:
e1)针对每个用户,筛选其工作日9:00-17:00在该基站记录的交互记录;
e2)统计存在交互记录的天数以及统计周期内交互记录的数目;
e3)将交互记录的总数目除以存在交互记录天数,再除以8个小时,从而得到平均每个用户交互记录的频率;
e4)按照用户对上述频率进行平均,从而得到平均每个用户的与运营商网络交互的频率。
f.工作日在第一预设时间段内用户使用应用的频率:
f1)针对每个用户,筛选其工作日9:00-17:00在该基站记录的APP使用记录;
f2)统计存在交互记录的天数以及统计周期内APP使用记录的数目;
f3)将交互记录的总数目除以存在APP使用记录天数,再除以8个小时,从而得到平均每个用户APP使用记录的频率;
f4)按照用户对上述频率进行平均,从而得到平均每个用户的应用使用频率。
g.工作日在第一预设时间段内用户使用社交类应用的频率:
g1)针对每个用户,筛选其工作日9:00-17:00在该基站记录的社交类APP使用记录;
g2)统计存在交互记录的天数以及统计周期内社交类APP使用记录的数目;
g3)将交互记录的总数目除以存在社交类APP使用记录天数,再除以8个小时,从而得到平均每个用户社交类APP使用记录的频率;
g4)按照用户对上述频率进行平均,从而得到平均每个用户的社交类应用使用频率。
h.工作日在第一预设时间段内用户使用浏览器访问网页的频率:
h1)针对每个用户,筛选其工作日9:00-17:00在该基站记录的使用浏览器访问网页的记录;
h2)统计存在交互记录的天数以及统计周期内使用浏览器访问网页记录的数目;
h3)将交互记录的总数目除以存在使用浏览器访问网页记录天数,再除以8个小时,从而得到每个用户使用浏览器访问网页记录的频率;
h4)按照用户对上述频率进行平均,从而得到平均每个用户使用浏览器访问网页的频率。
i.工作日在第二预设时间段内用户使用应用的个数:
i1)针对每个用户,筛选其工作日9:00-17:00在该基站记录的使用APP的记录;
i2)统计工作日每个用户9:00-17:00使用的APP数目;
i3)按天对每个用户使用的APP数目进行平均,确定每个用户的APP的平均个数;
i4)对用户进行平均,从而确定平均每个用户平均使用个数。
除此之外,如果目标社会功能为居住功能时,第一特征量可以包括以下量中的至少一项:
在第三时间段内用户与运营商网络交互的平均时间间隔;
在第三时间段内用户与运营商网络交互的平均时间间隔的方差;
在第三时间段内用户与运营商网络交互的频率;
在第三时间段内用户使用应用和页面访问的频率;
在第三时间段内用户使用社交类应用的频率;
在第三时间段内用户使用浏览器访问网页的频率;
在第三时间段内用户使用移动购物类应用的频率;
在第三时间段内用户使用游戏类应用的频率;
在第三时间段内用户使用应用的个数。
其中,第三时间段可以设置为人们晚上回家之后和睡觉之前的时间,举例来说,可以设置为19点~24点,在这段时间之内,人们有较高的概率使用终端设备接入运营商网络,进行游戏、聊天、购物等较为休闲的活动。
而如果目标社会功能为餐馆时,第一特征量可以包括以下量中的至少一项:
在第四时间段内用户使用的应用类型是否为团购类应用;
在第四时间段内用户使用的应用类型是否为导航类应用;
在第四时间段内用户使用的应用类型是否为支付类应用;
在第四时间段内用户的终端设备是否收到银行发送的短信;
在第四时间段内用户使用应用和访问网页的频率;
在第四时间段内用户使用团购类应用的频率
在第四时间段内用户使用支付类应用的频率。
其中,第三时间段可以设置为10点~12点或18点~20点,并且根据不同地区人们用餐时间的采样统计结果,第三时间段可以进行相应的调整。
103、对上述至少两个第一特征量进行特征聚类以获得至少两个地理区域分类。
本发明实施例中,可以利用多种聚类算法对需识别的地理区域进行特征聚类,例如K-均值(means)、J-均值、增长细胞模型(Growing Cell Structures,GCS)、概率GCS等,以K-means算法为例来进行说明。
K-means算法是一种基于原型、基于划分的经典的聚类方法,这个方法的主要思想是对于每一个簇,可以选出一个中心点,使得该簇中所有的点到该中心点的距离小于到其他簇的中心点的距离。因此,两个对象的距离越近,其相似度就越大,因此,应用于本发明实施例,距离越近的两个对象,就越可能是具有相同社会功能的地理区域。
请参阅图1D,图1D为以两维特征为例,使用K-means算法处理数据而获得的结果的示意图。图中的横轴和纵轴分别为一种特征,类比于本发明实施例,在本发明实施例中,坐标轴所代表的量应为第一特征量。其中,特征聚类所获得的类别总数可由用户定义,图中展示的为将待聚类点分为三类时的聚类结果。图中每个簇中心的较为显著的一个点为该类别的聚类中心,以该点来表示此类别下的聚类点的平均倾向,通过判断聚类点与聚类中心之间的距离来确定聚类点的类别归属。
104、根据上述用户与运营商网络交互的数据,统计上述至少两个地理区域的至少两个第二特征量。
本发明实施例中,上述至少两个第二特征量与上述至少两个地理区域一一对应。
本发明实施例中,在统计每个地理区域的第二特征量之前,先根据目标社会功能确定需统计的第二特征量。举例来说,若目标社会功能为办公功能,对办公功能的地理区域进行一定的调研统计,总结出办公功能的地理区域中,工作日注册的人数多于节假日,一天中在运营商网络注册人数增加最多的时间段是上班时间(比如8:00-10:00),一天中注册人数减少最多的时间段是下班时间(比如17:00-19:00)。
因此,基于办公功能的地理区域中的人流量规律,确定以下量中的至少一项作为第二特征量:
j.工作日在第一预设时间段在上述运营商网络注册的平均人数;
k.节假日在第一预设时间段在上述运营商网络注册的平均人数;
l.工作日在上述运营商网络注册人数增加最多的时间段;
m.工作日在上述运营商网络注册人数减少最多的时间段。
其中,第一预设时间大致为上班时间,根据地区的不同,上班时间可能会有较大差异,举例来说,第一预设时间可为9:00~17:00,以此为例,下面具体说明根据基站获得的用户与运营商网络交互的数据计算上述j~m项特征的方法:
j.工作日在第一预设时间段在上述运营商网络注册的平均人数:
j1)针对每个基站,筛选工作日9:00-17:00的记录;
j2)统计每个基站筛选后记录中每天的用户数目;
j3)按天对每个基站的记录用户数目进行平均,确定平均人数。
k.节假日在第一预设时间段在上述运营商网络注册的平均人数:
k1)针对每个基站,筛选休息日9:00-17:00的记录;
k2)统计每个基站筛选后的记录中每天的用户数目;
k3)按天对每个基站的记录用户数目进行平均,确定平均记录人数。
l.工作日在上述运营商网络注册人数增加最多的时间段:
l1)针对每个基站,筛选工作日的记录;
l2)对每个时段筛选得到的记录,确定其中的用户数目;
l3)按天对每个基站每个时段的记录用户数进行平均,确定平均每天每个时段的用户数目;
l4)比较前后两个时段平均用户数目的增加量,确定增加最多的时刻。
m.工作日在上述运营商网络注册人数减少最多的时间段:
m1)针对每个基站,筛选工作日的记录;
m2)对每个时段筛选得到的记录,确定其中的用户数目;
m3)按天对每个基站每个时段的记录用户数进行平均,确定平均每天每个时段的用户数目;
m4)比较前后两个时段平均用户数目的减少量,确定减少最多的时刻。
然而,若目标社会功能为居住功能,对居住功能的地理区域进行一定的调研统计,总结出居住功能的地理区域中,工作日在运营商网络注册人数减少最多的时间段为大约6点到8点,工作日在运营商网络注册人数增加最多的时间段为大约18点~20点,工作日9点~17点在运营商网络注册的平均人数小于节假日的平均人数,并且工作日9点~17点在运营商网络注册的平均人数小于19~24点的平均人数。其中,上述时间段均为举例说明,在不同城市、不同地区其具体的时间会有一定的差异,本发明实施例不做限定。
针对居住功能的地理区域的人流量特点,可以归纳出与居住功能相对应的第二特征量来进行统计,以用于确定地理区域是否具有居住功能。
与此对应,若目标社会功能为餐馆,餐馆的人流量特征可能为:在运营商网络注册人数增加最多的时间段为10点~12点或18点~20点,针对餐馆的人流量特点,可以归纳出与餐馆相对应的第二特征量来进行统计,以用于确定地理区域是否为餐馆。
105、分别统计上述至少两个地理区域分类中对应的第二特征量符合目标社会功能的先验条件的地理区域的数量占所在的地理区域分类的地理区域总数量的比例,从而用于将上述比例最高的地理区域分类中的地理区域作为具有上述目标社会功能的地理区域。
本发明实施例中,目标社会功能的先验条件可为具有目标社会功能的地理区域的人流量特点,以目标社会功能为办公功能为例,目标社会功能的先验条件可为办公功能的地理区域的人流量特点:工作日注册的人数多于节假日,一天中在运营商网络注册人数增加最多的时间段是上班时间(比如8:00-10:00),一天中注册人数减少最多的时间段是下班时间(比如17:00-19:00)。
计算了各个地理区域的第二特征量之后,分别统计各个分类中第二特征量符合上述人流量特征的地理区域的比例。
以目标社会功能为办公功能为例,假设甲分类中,符合办公功能的地理区域的人流量特点的地理区域的比例为80%,乙分类中,符合办公功能的地理区域的人流量特征的地理区域的比例为30%,基于K-means算法的基本思想,同一个分类中的地理区域极有可能是具有相同社会功能的地理区域,因此,将甲分类确定为办公功能的分类。
作为一种可选的实施方式,可以将甲分类中包含的地理区域均标记为含有办公功能的地理区域。因此,在本发明实施例中,可以确定一个单一的地理区域是否具有某社会功能。
而对于地理区域的划分,可以通过基站建立的小区的覆盖面积来确定,针对宏小区、微小区、微微小区,其覆盖的区域大小有所不同,比如微微小区的覆盖半径可能为10~30m,因此,本发明实施例可以用于小至一栋办公楼的地理区域是否具有某社会功能的确定。
在实验中,随机抽取十个地理区域进行实地考察以确定该地理区域是否具有办公功能,与利用本发明实施例中所描述的方法的判断结果进行比较,比较结果如表2所示:
Figure BDA0001252158080000101
Figure BDA0001252158080000111
表2地理区域的办公功能识别结果
表2中的W表示该地理区域含有办公功能,为空则表示该地理区域不具有办公功能。“真值”列代表通过实地考察确认该地理区域具有办公功能,“实验值”列代表通过本发明实施例中提供的方法的识别结果。通过真值与实验值的比较可知,本发明实施例中的识别方法可以达到接近90%的准确性。
在图1A所描述的地理区域的社会功能识别方法中,第一特征量包括用户在该地理区域使用终端设备的行为特征,第二特征量包括该地理区域的人流量特征。因此,可以根据用户在地理区域中使用终端设备的行为特征对地理区域进行特征聚类从而获得至少两个分类;之后再统计上述各个分类中,每个地理区域的第二特征量(比如,人流量特征);最后根据目标社会功能的先验条件(比如含有目标社会功能的地理区域的人流量特征)确定出上述各个分类中,为目标社会功能的分类。因此,在该实施方式中可以利用地理区域内用户与运营商网络交互的数据来确定地理区域是否具有目标社会功能。
请参见图2,图2是本发明实施例公开的一种用户终端与基站以及用于社会功能识别的终端设备之间的交互示意图,在图2中,将用于地理区域的社会功能的识别的终端设备简称为识别设备。在图2中,用户终端发送注册信息给基站以在运营商网络上注册,之后与基站进行交互以发送数据或接收数据;基站获取用户与运营商网络交互的数据,并存储这些数据;识别设备向基站发送请求消息,以获取用户与运营商网络交互的数据,在对数据进行了数据清洗等预处理之后,执行地理区域的社会功能的识别过程;其中,识别过程的具体实现可以参照图1A所示的方法实施例的相应描述。
上述详细阐述了本发明实施例的方法,下面提供了本发明实施例的装置。
请参见图3,图3是本发明实施例提供的一种终端设备300的结构示意图,该终端设备可以包括获取单元301、第一统计单元302、特征聚类单元303、第二统计单元304、第三统计单元305,其中,各个单元的详细描述如下。
获取单元301,用于获取至少两个地理区域中用户与运营商网络交互的数据。
第一统计单元302,用于根据上述获取单元获取的用户与运营商网络交互的数据,统计上述至少两个地理区域的至少两个第一特征量,上述至少两个第一特征量与上述至少两个地理区域一一对应。
特征聚类单元303,用于对上述第一统计单元统计得到的至少两个第一特征量进行特征聚类以获得至少两个地理区域分类。
第二统计单元304,用于根据上述获取单元获取的用户与运营商网络交互的数据,统计上述至少两个地理区域的至少两个第二特征量,上述至少两个第二特征量与上述至少两个地理区域一一对应。
第三统计单元305,用于根据上述第二统计单元统计得到的至少两个第二特征量,分别统计上述特征聚类单元得到的至少两个地理区域分类中对应的第二特征量符合目标社会功能的先验条件的地理区域的数量占所在的地理区域分类的地理区域总数量的比例,从而用于将上述比例最高的地理区域分类中的地理区域作为具有上述目标社会功能的地理区域。
需要说明的是,各个单元的实现还可以对应参照图1A所示的方法实施例的相应描述。
在图3所描述的终端设备300中,可以利用地理区域内用户与运营商网络交互的数据统计出第一特征量,再利用第一特征量对地理区域进行特征聚类从而获得至少两个分类;之后再统计上述各个分类中,每个地理区域的第二特征量(比如,人流量特征);最后根据目标社会功能的先验条件(比如含有目标社会功能的地理区域的人流量特征)确定出上述各个分类中,为目标社会功能的分类。因此,在该实施方式中可以利用地理区域内用户与运营商网络交互的数据来确定地理区域是否具有目标社会功能。
请一并参阅图4,图4是本发明实施例公开的另一种终端设备400的结构示意图。其中,图4所示的终端设备是由图3所示的终端设备进行优化得到的,与图3所示的终端设备相比,图4所示的终端设备还包括:标记单元306、第一确定单元307和第二确定单元308。各个单元的详细描述如下。
标记单元306,用于标记具有上述目标社会功能的地理区域。
第一确定单元307,用于在根据上述用户与运营商网络交互的数据统计上述地理区域的第一特征量之前,根据上述目标社会功能确定第一统计单元302需统计的第一特征量;
第二确定单元308,用于在统计上述至少两个分类中每个地理区域的第二特征量之前,根据上述目标社会功能确定第二统计单元304需统计的第二特征量。
在图4所描述的终端设备400中,可以利用地理区域内用户与运营商网络交互的数据统计出第一特征量,再利用第一特征量对地理区域进行特征聚类从而获得至少两个分类;之后再统计上述各个分类中,每个地理区域的第二特征量(比如,人流量特征);最后根据目标社会功能的先验条件(比如含有目标社会功能的地理区域的人流量特征)确定出上述各个分类中,为目标社会功能的分类。因此,在该实施方式中可以利用地理区域内用户与运营商网络交互的数据来确定地理区域是否具有目标社会功能。
请参阅图5,图5是本发明实施例公开的另一种终端设备500的实体结构示意图,如图5所示,该终端设备可以包括:
输入单元501、处理器单元502、输出单元503、存储单元504、通信单元505以及电源506等组件。这些组件通过一条或多条总线507进行通信。本领域技术人员可以理解,图5所示的终端设备的结构并不构成对本发明的限定,它既可以是总线型结构,也可以是星型结构,还可以包括比图5所示的结构更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施方式中,图5所示的终端设备包括但不限于移动电话、移动电脑、平板电脑、个人数字助理(Personal Digital Assistant,PDA)等各种终端设备。
输入单元501用于实现用户与终端设备的交互和/或信息输入到终端设备中。在本发明具体实施方式中,输入单元501可以是触控面板,触控面板也称为触摸屏或触控屏,可收集用户在其上触摸或接近的操作动作。比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或接近触控面板位置的操作动作,并根据预先设定的程式驱动相应的连接装置。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸操作,并将检测到的触摸操作转换为电信号,以及将电信号传送给触摸控制器;触摸控制器从触摸检测装置上接收电信号,并将它转换成触点坐标,再送给处理器单元502。触摸控制器还可以接收处理器单元502发来的命令并执行。此外,可以采用电阻式、电容式、红外线(Infrared)以及表面声波等多种类型实现触控面板。
处理器单元502为终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分,通过运行或执行存储在存储单元504内的程序代码和/或模块,以及调用存储在存储单元504内的数据,以执行终端设备的各种功能和/或处理数据。处理器单元502可以由集成电路(Integrated Circuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器单元502可以仅包括中央处理器(Central ProcessingUnit,简称CPU),也可以是CPU、数字信号处理器(digitalsignal processor,简称DSP)、图形处理器(Graphic Processing Unit,简称GPU)及通信单元中的控制芯片(例如基带芯片)的组合。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
输出单元503可以包括但不限于影像输出单元、声音输出和触感输出单元。影像输出单元用于输出文字、图片和/或视频。影像输出单元可包括显示面板,例如采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)、场发射显示器(field emission display,简称FED)等形式来配置的显示面板。或者影像输出单元可以包括反射式显示器,例如电泳式(electrophoretic)显示器,或利用光干涉调变技术(Interferometric Modulation of Light)的显示器。影像输出单元可以包括单个显示器或不同尺寸的多个显示器。在本发明的具体实施方式中,上述输入单元501所采用的触控面板亦可同时作为输出单元503的显示面板。虽然在图5中,输入单元501与输出单元503是作为两个独立的部件来实现终端设备的输入和输出功能,但是在某些实施例中,可以将触控面板与显示面板集成一体而实现终端设备的输入和输出功能。
存储单元504可用于存储程序代码以及模块,处理器单元502通过运行存储在存储单元504的程序代码以及模块,从而执行终端设备的各种功能应用以及实现数据处理。存储单元504主要包括程序存储区和数据存储区,其中,程序存储区可存储操作系统、至少一个功能所需的程序代码;数据存储区可存储根据终端设备的使用所创建的数据(比如音频数据、电话本等)等。在本发明具体实施方式中,存储单元504可以包括易失性存储器,例如非挥发性动态随机存取内存(Nonvolatile RandomAccess Memory,简称NVRAM)、相变化随机存取内存(Phase Change RAM,简称PRAM)、磁阻式随机存取内存(Magetoresistive RAM,简称MRAM)等,还可以包括非易失性存储器,例如至少一个磁盘存储器件、电子可抹除可规划只读存储器(Electrically Erasable ProgrammableRead-OnlyMemory,简称EEPROM)、闪存器件,例如反或闪存(NOR flash memory)或是反及闪存(NAND flash memory)。非易失存储器储存处理器单元502所执行的操作系统及程序代码。处理器单元502从非易失存储器加载运行程序与数据到内存并将数字内容储存于大量储存装置中。操作系统包括用于控制和管理常规系统任务,例如内存管理、存储设备控制、电源管理等,以及有助于各种软硬件之间通信的各种组件和/或驱动器。在本发明实施方式中,操作系统可以是Google公司的Android系统、Apple公司开发的iOS系统或Microsoft公司开发的Windows操作系统等,或者是Vxworks这类的嵌入式操作系统。
通信单元505用于建立通信信道,使终端设备通过通信信道连接至远程服务器,并从远程服务器下载媒体数据。通信单元505可以包括无线局域网(Wireless Local AreaNetwork,简称wireless LAN)模块、蓝牙模块、近距离无线通信(Near FieldCommunication,简称NFC)、基带(Base Band)模块等无线通信模块和以太网、通用串行总线(Universal Serial Bus,简称USB)、闪电接口(Lightning,目前Apple用于iPhone6/6s等设备)等有线通信模块。
电源506用于给终端设备的不同部件进行供电以维持其运行。作为一般性理解,电源506可以是内置的电池,例如常见的锂离子电池、镍氢电池等,也包括直接向终端设备供电的外接电源,例如AC适配器等。在本发明的一些实施方式中,电源506还可以作更为广泛的定义,例如还可以包括电源管理系统、充电系统、电源故障检测电路、电源转换器或逆变器、电源状态指示器(如发光二极管),以及与终端设备的电能生成、管理及分布相关联的其他任何组件。
在图5所示的终端设备中,处理器单元502可以调用存储单元504中存储的程序代码,用于执行以下操作:
获取至少两个地理区域中用户与运营商网络交互的数据;
根据上述用户与运营商网络交互的数据,统计上述至少两个地理区域的至少两个第一特征量,上述至少两个第一特征量与上述至少两个地理区域一一对应;
对上述至少两个第一特征量进行特征聚类以获得至少两个地理区域分类;
根据上述用户与运营商网络交互的数据,统计上述至少两个地理区域的至少两个第二特征量,上述至少两个第二特征量与上述至少两个地理区域一一对应;
分别统计上述至少两个地理区域分类中对应的第二特征量符合目标社会功能的先验条件的地理区域的数量占所在的地理区域分类的地理区域总数量的比例,从而用于将上述比例最高的地理区域分类中的地理区域作为具有上述目标社会功能的地理区域。
需要说明的是,各个操作的实现还可以对应参照图1A所示的方法实施例的相应描述。
在图5所描述的设备500中,可以利用地理区域内用户与运营商网络交互的数据统计出第一特征量,再利用第一特征量对地理区域进行特征聚类从而获得至少两个分类;之后再统计上述各个分类中,每个地理区域的第二特征量(比如,人流量特征);最后根据目标社会功能的先验条件(比如含有目标社会功能的地理区域的人流量特征)确定出上述各个分类中,为目标社会功能的分类。因此,在该实施方式中可以利用地理区域内用户与运营商网络交互的数据来确定地理区域是否具有目标社会功能。
综上上述,通过实施本发明实施例,可以对地理区域内用户与运营商网络交互的数据进行提取、处理,进而确定该地理区域是否具有某社会功能。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。

Claims (20)

1.一种地理区域的社会功能的识别方法,其特征在于,包括:
获取至少两个地理区域中用户与运营商网络交互的数据;
根据所述用户与运营商网络交互的数据,统计所述至少两个地理区域的至少两个第一特征量,所述至少两个第一特征量与所述至少两个地理区域一一对应;其中,统计所述第一特征量之前,先根据想要识别的目标社会功能确定需统计的所述第一特征量,所述用户与运营商网络交互的数据包括:用户的语音通话记录、短信记录、上网记录和应用使用记录;
对所述至少两个第一特征量进行特征聚类以获得至少两个地理区域分类;
根据所述用户与运营商网络交互的数据,统计所述至少两个地理区域的至少两个第二特征量,所述至少两个第二特征量与所述至少两个地理区域一一对应;
分别统计所述至少两个地理区域分类中对应的第二特征量符合目标社会功能的先验条件的地理区域的数量占所在的地理区域分类的地理区域总数量的比例,从而用于将所述比例最高的地理区域分类中的地理区域作为具有所述目标社会功能的地理区域;所述目标社会功能包括:办公功能;所述目标社会功能为所述办公功能时,所述第一特征量包括:
工作日在第一预设时间段内用户与所述运营商网络交互的平均时间间隔;
工作日在所述第一预设时间段内用户与所述运营商网络交互的时间间隔的方差;
工作日在所述第一预设时间段内用户使用应用的平均时间间隔;
工作日在所述第一预设时间段内用户使用应用的时间间隔的方差;
工作日在所述第一预设时间段内用户与所述运营商网络交互的频率;
工作日在所述第一预设时间段内用户使用应用的频率;
工作日在所述第一预设时间段内用户使用社交类应用的频率;
工作日在所述第一预设时间段内用户使用浏览器访问网页的频率;以及,
工作日在第二预设时间段内用户使用应用的个数中的至少一项。
2.根据权利要求1所述的方法,其特征在于,所述将所述比例最高的地理区域分类中的地理区域作为具有所述目标社会功能的地理区域之后,所述方法还包括:
标记具有所述目标社会功能的地理区域。
3.根据权利要求1或2所述的方法,其特征在于,所述目标社会功能包括:居住功能、餐馆或商场。
4.根据权利要求3所述的方法,其特征在于,所述至少两个第一特征量为用于指示对应的地理区域中平均每个用户与运营商网络交互的统计数据。
5.根据权利要求3所述的方法,其特征在于,所述至少两个第二特征量为用于指示对应的地理区域中人流量的统计数据。
6.根据权利要求4所述的方法,其特征在于,所述至少两个第二特征量为用于指示对应的地理区域中人流量的统计数据。
7.根据权利要求5所述的方法,其特征在于,所述目标社会功能为所述办公功能,所述第二特征量包括:
工作日在所述第一预设时间段在所述运营商网络注册的平均人数;
节假日在所述第一预设时间段在所述运营商网络注册的平均人数;
工作日在所述运营商网络注册人数增加最多的时间段;
工作日在所述运营商网络注册人数减少最多的时间段中的至少一项。
8.根据权利要求6所述的方法,其特征在于,所述目标社会功能为所述办公功能,所述第二特征量包括:
工作日在所述第一预设时间段在所述运营商网络注册的平均人数;
节假日在所述第一预设时间段在所述运营商网络注册的平均人数;
工作日在所述运营商网络注册人数增加最多的时间段;
工作日在所述运营商网络注册人数减少最多的时间段中的至少一项。
9.根据权利要求7所述的方法,其特征在于,若所述目标社会功能为所述办公功能,所述目标社会功能的先验条件包括:
工作日在所述第一预设时间段在所述运营商网络注册的平均人数多于节假日在所述第一预设时间段在所述运营商网络注册的平均人数;
工作日在所述运营商网络注册人数增加最多的时间段为第三预设时间段;以及,
工作日在所述运营商网络注册人数减少最多的时间段为第四预设时间段中的至少一项。
10.根据权利要求8所述的方法,其特征在于,若所述目标社会功能为所述办公功能,所述目标社会功能的先验条件包括:
工作日在所述第一预设时间段在所述运营商网络注册的平均人数多于节假日在所述第一预设时间段在所述运营商网络注册的平均人数;
工作日在所述运营商网络注册人数增加最多的时间段为第三预设时间段;以及,
工作日在所述运营商网络注册人数减少最多的时间段为第四预设时间段中的至少一项。
11.一种终端设备,其特征在于,包括:
获取单元,用于获取至少两个地理区域中用户与运营商网络交互的数据;
第一统计单元,用于根据所述获取单元获取的所述用户与运营商网络交互的数据,统计所述至少两个地理区域的至少两个第一特征量,所述至少两个第一特征量与所述至少两个地理区域一一对应;其中,统计所述第一特征量之前,先根据想要识别的目标社会功能确定需统计的所述第一特征量,所述用户与运营商网络交互的数据包括:用户的语音通话记录、短信记录、上网记录和应用使用记录;
特征聚类单元,用于对所述第一统计单元统计得到的所述至少两个第一特征量进行特征聚类以获得至少两个地理区域分类;
第二统计单元,用于根据所述获取单元获取的所述用户与运营商网络交互的数据,统计所述至少两个地理区域的至少两个第二特征量,所述至少两个第二特征量与所述至少两个地理区域一一对应;
第三统计单元,用于根据所述第二统计单元统计得到的所述至少两个第二特征量,分别统计所述特征聚类单元得到的所述至少两个地理区域分类中对应的第二特征量符合目标社会功能的先验条件的地理区域的数量占所在的地理区域分类的地理区域总数量的比例,从而用于将所述比例最高的地理区域分类中的地理区域作为具有所述目标社会功能的地理区域;所述目标社会功能包括:办公功能;所述目标社会功能为所述办公功能时,所述第一特征量包括:
工作日在第一预设时间段内用户与所述运营商网络交互的平均时间间隔;
工作日在所述第一预设时间段内用户与所述运营商网络交互的时间间隔的方差;
工作日在所述第一预设时间段内用户使用应用的平均时间间隔;
工作日在所述第一预设时间段内用户使用应用的时间间隔的方差;
工作日在所述第一预设时间段内用户与所述运营商网络交互的频率;
工作日在所述第一预设时间段内用户使用应用的频率;
工作日在所述第一预设时间段内用户使用社交类应用的频率;
工作日在所述第一预设时间段内用户使用浏览器访问网页的频率;以及,
工作日在第二预设时间段内用户使用应用的个数中的至少一项。
12.根据权利要求11所述的终端设备,其特征在于,所述终端设备还包括:
标记单元,用于标记具有所述目标社会功能的地理区域。
13.根据权利要求11或12所述的终端设备,其特征在于,所述目标社会功能包括:居住功能、餐馆或商场。
14.根据权利要求13所述的终端设备,其特征在于,所述至少两个第一特征量为用于指示对应的地理区域中平均每个用户与运营商网络交互的统计数据。
15.根据权利要求13所述的终端设备,其特征在于,所述至少两个第二特征量为用于指示对应的地理区域中人流量的统计数据。
16.根据权利要求14所述的终端设备,其特征在于,所述至少两个第二特征量为用于指示对应的地理区域中人流量的统计数据。
17.根据权利要求15所述的终端设备,其特征在于,所述目标社会功能为所述办公功能,所述第二特征量包括:
工作日在所述第一预设时间段在所述运营商网络注册的平均人数;
节假日在所述第一预设时间段在所述运营商网络注册的平均人数;
工作日在所述运营商网络注册人数增加最多的时间段;
工作日在所述运营商网络注册人数减少最多的时间段中的至少一项。
18.根据权利要求16所述的终端设备,其特征在于,所述目标社会功能为所述办公功能,所述第二特征量包括:
工作日在所述第一预设时间段在所述运营商网络注册的平均人数;
节假日在所述第一预设时间段在所述运营商网络注册的平均人数;
工作日在所述运营商网络注册人数增加最多的时间段;
工作日在所述运营商网络注册人数减少最多的时间段中的至少一项。
19.根据权利要求17所述的终端设备,其特征在于,所述目标社会功能为所述办公功能,所述目标社会功能的先验条件包括:
工作日在所述第一预设时间段在所述运营商网络注册的平均人数多于节假日在所述第一预设时间段在所述运营商网络注册的平均人数;
工作日在所述运营商网络注册人数增加最多的时间段为第三预设时间段;以及,
工作日在所述运营商网络注册人数减少最多的时间段为第四预设时间段中的至少一项。
20.根据权利要求18所述的终端设备,其特征在于,所述目标社会功能为所述办公功能,所述目标社会功能的先验条件包括:
工作日在所述第一预设时间段在所述运营商网络注册的平均人数多于节假日在所述第一预设时间段在所述运营商网络注册的平均人数;
工作日在所述运营商网络注册人数增加最多的时间段为第三预设时间段;以及,工作日在所述运营商网络注册人数减少最多的时间段为第四预设时间段中的至少一项。
CN201710175044.1A 2017-03-22 2017-03-22 一种地理区域的社会功能的识别方法与终端设备 Expired - Fee Related CN107103037B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710175044.1A CN107103037B (zh) 2017-03-22 2017-03-22 一种地理区域的社会功能的识别方法与终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710175044.1A CN107103037B (zh) 2017-03-22 2017-03-22 一种地理区域的社会功能的识别方法与终端设备

Publications (2)

Publication Number Publication Date
CN107103037A CN107103037A (zh) 2017-08-29
CN107103037B true CN107103037B (zh) 2020-06-26

Family

ID=59676106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710175044.1A Expired - Fee Related CN107103037B (zh) 2017-03-22 2017-03-22 一种地理区域的社会功能的识别方法与终端设备

Country Status (1)

Country Link
CN (1) CN107103037B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110727793B (zh) * 2018-06-28 2023-03-24 百度在线网络技术(北京)有限公司 区域识别的方法、装置、终端和计算机可读存储介质
CN109982257B (zh) * 2019-02-27 2021-03-23 中国联合网络通信集团有限公司 确定移动用户归属区域的方法、装置、系统
CN110176141B (zh) * 2019-05-09 2021-04-06 浙江海康智联科技有限公司 一种基于poi及流量特征的交通小区划分方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116696A (zh) * 2013-01-16 2013-05-22 上海美慧软件有限公司 基于稀疏采样的手机定位数据的人员常驻地点识别方法
CN104778231A (zh) * 2015-03-31 2015-07-15 北京奇艺世纪科技有限公司 一种地理区域的特征识别方法和装置
CN105682024A (zh) * 2016-01-05 2016-06-15 重庆邮电大学 一种基于移动信令数据的城市热点识别方法
CN106101224A (zh) * 2016-06-12 2016-11-09 腾讯科技(深圳)有限公司 识别用户所在地理位置的类别的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116696A (zh) * 2013-01-16 2013-05-22 上海美慧软件有限公司 基于稀疏采样的手机定位数据的人员常驻地点识别方法
CN104778231A (zh) * 2015-03-31 2015-07-15 北京奇艺世纪科技有限公司 一种地理区域的特征识别方法和装置
CN105682024A (zh) * 2016-01-05 2016-06-15 重庆邮电大学 一种基于移动信令数据的城市热点识别方法
CN106101224A (zh) * 2016-06-12 2016-11-09 腾讯科技(深圳)有限公司 识别用户所在地理位置的类别的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于手机数据识别上海中心城的城市空间结构;钮心毅等;《城市规划学刊》;20141231(第6期);第61-67页 *

Also Published As

Publication number Publication date
CN107103037A (zh) 2017-08-29

Similar Documents

Publication Publication Date Title
US10115306B2 (en) Parking identification and availability prediction
JP5859611B2 (ja) 意味的地域に基づいて検索語を推薦する方法およびシステム
US9798822B2 (en) Location based grouping of browsing histories
CN111556442B (zh) 一种信息确定的方法及装置
CN104813316B (zh) 具有本地化应用程序推荐的移动设备
CN108960785B (zh) 一种信息提示方法及装置
KR102121361B1 (ko) 사용자가 위치되는 지리적 위치의 유형을 식별하기 위한 방법 및 디바이스
KR102068788B1 (ko) 사용자 타겟 서비스를 제공하는 서버 및 그 서비스 제공방법
US11663282B2 (en) Taxonomy-based system for discovering and annotating geofences from geo-referenced data
CN103714112A (zh) 定制的事件和景点建议
CN107103037B (zh) 一种地理区域的社会功能的识别方法与终端设备
CN107220308B (zh) Poi的合理性的检测方法及装置、设备及可读介质
WO2017040852A1 (en) Modeling of geospatial location over time
US10970318B2 (en) Active change detection for geospatial entities using trend analysis
CN107391592A (zh) 地理围栏的处理方法、装置、设备及计算机可读存储介质
CN108011928A (zh) 一种信息推送方法、终端设备及计算机可读介质
CN103337221A (zh) 一种室内地图制作方法及室内地图
CN111522838A (zh) 地址相似度计算方法及相关装置
CN111597279B (zh) 基于深度学习的信息预测方法及相关设备
CN111311193B (zh) 公共服务资源的配置方法和装置
CN110012426B (zh) 消亡poi的确定方法、装置、计算机设备和存储介质
CN106888433B (zh) 一种基于泰森多边形的相同服务请求位置隐私保护方法
CN103487057A (zh) 基于端点扩展的路径规划方法及装置
CN104080168B (zh) 一种定位方法及装置
CN103079006A (zh) 联系人管理方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200626

CF01 Termination of patent right due to non-payment of annual fee