CN108921214A - 城市属性的获取方法、装置及计算机可读存储介质 - Google Patents
城市属性的获取方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN108921214A CN108921214A CN201810692742.3A CN201810692742A CN108921214A CN 108921214 A CN108921214 A CN 108921214A CN 201810692742 A CN201810692742 A CN 201810692742A CN 108921214 A CN108921214 A CN 108921214A
- Authority
- CN
- China
- Prior art keywords
- population characteristic
- city attribution
- city
- attribution
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 239000013598 vector Substances 0.000 claims abstract description 68
- 238000012512 characterization method Methods 0.000 claims abstract description 62
- 230000011664 signaling Effects 0.000 claims abstract description 37
- 230000004941 influx Effects 0.000 claims abstract description 19
- 238000004590 computer program Methods 0.000 claims 2
- 238000013480 data collection Methods 0.000 abstract description 4
- 101100100125 Mus musculus Traip gene Proteins 0.000 description 14
- 238000004891 communication Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 206010039203 Road traffic accident Diseases 0.000 description 4
- 238000011835 investigation Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0108—Measuring and analyzing of parameters relative to traffic conditions based on the source of data
- G08G1/0116—Measuring and analyzing of parameters relative to traffic conditions based on the source of data from roadside infrastructure, e.g. beacons
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W48/00—Access restriction; Network selection; Access point selection
- H04W48/16—Discovering, processing access restriction or access information
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Signal Processing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Analytical Chemistry (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Security & Cryptography (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种城市属性的获取方法,所述城市属性的获取方法包括以下步骤:获取目标区域内的基站;从所述基站中获取所述目标区域对应的信令数据;根据所述信令数据获取所述目标区域的人口特征序列,其中,所述人口特征序列包括用户流量、流入量、流出量以及新增量中的至少一个人口特征向量;获取预设城市属性中与所述人口特征序列对应的城市属性,将所述人口特征序列对应的城市属性作为所述目标区域的城市属性。本发明还公开了一种城市属性的获取装置及计算机可读存储介质。通过基站采集到的信令数据来采集居民出行数据,数据采集的样本量大,采集范围广,可以实现实时采集数据,提高数据更新频率,数据采集准确、质量高。
Description
技术领域
本发明涉及数据统计领域,尤其涉及城市属性的获取方法、装置及计算机可读存储介质。
背景技术
随着中国城市的不断发展以及城市化进程的推进,中国城市发展过程中越来越突出的交通问题表明,城市交通在满足居民日常出行活动能力上已经日显不足,由其带来的各种社会问题也已成为制约城市健康发展的障碍。
居民日常出行活动是城市交通需求的直接反映。交通出行调查是为获取居民日常交通出行数据,通过数据分析可挖掘出居民对整个城市交通及其他城市功能需求的特征与分布情况,可对进一步的城市交通规划、建设提供信息与决策支撑。
现有技术中现场抽样采集居民出行数据,为城市交通规划、建设提供信息与决策提供参考依据。然而,现场抽样调查成本较高,抽样样本非常有限,数据采集过程较长,导致数据更新频率较低,调查数据质量较低。
发明内容
本发明的主要目的在于提供一种城市属性的获取方法、装置及计算机可读存储介质,旨在解决现场抽样调查成本较高,抽样样本非常有限,数据采集过程较长,导致数据更新频率较低,调查数据质量较低的技术问题。
为实现上述目的,本发明提供一种城市属性的获取方法,所述城市属性的获取方法包括以下步骤:
获取目标区域内的基站;
从所述基站中获取所述目标区域对应的信令数据;
根据所述信令数据获取所述目标区域的人口特征序列,其中,所述人口特征序列包括用户流量、流入量、流出量以及新增量中的至少一个人口特征向量;
获取预设城市属性中与所述人口特征序列对应的城市属性,将所述人口特征序列对应的城市属性作为所述目标区域的城市属性。
优选地,所述根据所述信令数据获取所述目标区域的人口特征序列的步骤包括:
获取预设时长内的所述信令数据;
按照预设时间间隔将所述预设时长划分为多个时间段;
根据预设时长内的所述信令数据,获取各个所述时间段对应的人口特征数据;
获取所述人口特征向量的类型,依次获取所述时间段对应的人口特征数据中与所述类型对应的人口特征数据;
由所述类型对应的人口特征数据组成所述类型的人口特征向量;
由各个类型的所述人口特征向量组成所述目标区域的人口特征序列。
优选地,所述获取预设城市属性中与所述人口特征序列对应的预设城市属性,将所述人口特征序列对应的预设城市属性作为所述目标区域的城市属性的步骤之前,还包括:
依次获取各个所述人口特征向量中所述人口特征数据的最大值和最小值,其中,所述人口特征向量为所述人口特征序列中的人口特征向量;
根据所述最大值和所述最小值对应更新所述人口特征向量中各个人口特征数据;
根据更新后的所述人口特征数据更新所述人口特征序列。
优选地,所述根据所述最大值和所述最小值对应更新所述人口特征向量中各个人口特征数据的步骤包括:
依次获取各个所述人口特征向量中所述最大值和所述最小值的第一差值以及各个所述人口特征数据与所述最小值的第二差值;
将所述第二差值与所述第一差值的商作为更新后的所述人口特征数据。
优选地,所述获取预设城市属性中与所述人口特征序列对应的城市属性,将所述人口特征序列对应的城市属性作为所述目标区域的城市属性的步骤包括:
采用聚类算法根据所述预设城市属性获取所述人口特征序列对应的城市属性;
将所述人口特征序列对应的城市属性作为所述目标区域的城市属性。
优选地,所述聚类算法包括:K-均值算法。
优选地,所述采用聚类算法根据所述预设城市属性获取所述人口特征序列对应的城市属性的步骤包括:
获取各个预设城市属性对应的预设特征曲线;
将所述人口特征序列绘制对应的目标特征曲线;
采用以所述预设特征曲线为初始聚类中心的K-均值算法获取所述目标特征曲线对应的城市属性;
将所述目标特征曲线对应的城市属性作为所述人口特征序列的城市属性。
优选地,所述采用以所述预设特征曲线为初始聚类中心的K-均值算法获取所述目标特征曲线对应的城市属性的步骤包括:
分别获取所述目标特征曲线与各个所述预设特征曲线间的距离;
获取最小距离对应的所述预设特征曲线作为所述目标特征曲线的相似曲线;
将所述相似曲线对应的预设城市属性作为所述目标特征曲线对应的城市属性。
此外,为实现上述目的,本发明还提供一种城市属性的获取装置,其特征在于,所述城市属性的获取装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的城市属性的获取程序,所述城市属性的获取程序被所述处理器执行时实现如上所述的城市属性的获取方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有城市属性的获取程序,所述城市属性的获取程序被处理器执行时实现如上所述的城市属性的获取方法的步骤。
本发明实施例提出的一种城市属性的获取方法、装置及计算机可读存储介质,确定目标区域内存在的基站,进而从所述基站中获取与该目标区域有关的信令数据。根据信令数据获取目标区域内的人口特征序列。通过基站采集到的信令数据来采集居民出行数据,数据采集的样本量大,采集范围广,可以实现实时采集数据,提高数据更新频率,数据采集准确、质量高。获取明显具有预设城市属性对应的区域作为标准区域,获取标准区域对应的人口特征序列,从标准区域对应的人口特征序列中获取与所述目标区域对应的人口特征序列最相似的人口特征序列,最相似的人口特征序列对应的城市属性即为所述目标区域的城市属性。通过获取目标区域的城市属性可以根据城市属性的特性安排交通规划,为居民提供出行便利,避免交通拥挤产生交通事故以及踩踏事件的发生,保障居民人身安全。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图;
图2为本发明所述城市属性的获取方法第一实施例的流程示意图;
图3为本发明所述城市属性的获取方法第二实施例的流程示意图;
图4为本发明所述城市属性的获取方法第三实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:
获取目标区域内的基站;
从所述基站中获取所述目标区域对应的信令数据;
根据所述信令数据获取所述目标区域的人口特征序列,其中,所述人口特征序列包括用户流量、流入量、流出量以及新增量中的至少一个人口特征向量;
获取预设城市属性中与所述人口特征序列对应的城市属性,将所述人口特征序列对应的城市属性作为所述目标区域的城市属性。
由于现有技术中现场抽样调查成本较高,抽样样本非常有限,数据采集过程较长,导致数据更新频率较低,调查数据质量较低。
本发明提供一种解决方案,确定目标区域内存在的基站,进而从所述基站中获取与该目标区域有关的信令数据。根据信令数据获取目标区域内的人口特征序列。通过基站采集到的信令数据来采集居民出行数据,数据采集的样本量大,采集范围广,可以实现实时采集数据,提高数据更新频率,数据采集准确、质量高。获取明显具有预设城市属性对应的区域作为标准区域,获取标准区域对应的人口特征序列,从标准区域对应的人口特征序列中获取与所述目标区域对应的人口特征序列最相似的人口特征序列,最相似的人口特征序列对应的城市属性即为所述目标区域的城市属性。通过获取目标区域的城市属性可以根据城市属性的特性安排交通规划,为居民提供出行便利,避免交通拥挤产生交通事故以及踩踏事件的发生,保障居民人身安全。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。
本发明实施例终端可以是PC,也可以是智能手机、平板电脑、便携计算机等具有数据分析功能的可移动式终端设备。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及城市属性的获取程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的城市属性的获取程序,并执行以下操作:
获取目标区域内的基站;
从所述基站中获取所述目标区域对应的信令数据;
根据所述信令数据获取所述目标区域的人口特征序列,其中,所述人口特征序列包括用户流量、流入量、流出量以及新增量中的至少一个人口特征向量;
获取预设城市属性中与所述人口特征序列对应的城市属性,将所述人口特征序列对应的城市属性作为所述目标区域的城市属性。
进一步地,处理器1001可以调用存储器1005中存储的城市属性的获取程序,还执行以下操作:
获取预设时长内的所述信令数据;
按照预设时间间隔将所述预设时长划分为多个时间段;
根据预设时长内的所述信令数据,获取各个所述时间段对应的人口特征数据;
获取所述人口特征向量的类型,依次获取所述时间段对应的人口特征数据中与所述类型对应的人口特征数据;
由所述类型对应的人口特征数据组成所述类型的人口特征向量;
由各个类型的所述人口特征向量组成所述目标区域的人口特征序列。
进一步地,处理器1001可以调用存储器1005中存储的城市属性的获取程序,还执行以下操作:
依次获取各个所述人口特征向量中所述人口特征数据的最大值和最小值,其中,所述人口特征向量为所述人口特征序列中的人口特征向量;
根据所述最大值和所述最小值对应更新所述人口特征向量中各个人口特征数据;
根据更新后的所述人口特征数据更新所述人口特征序列。
进一步地,处理器1001可以调用存储器1005中存储的城市属性的获取程序,还执行以下操作:
依次获取各个所述人口特征向量中所述最大值和所述最小值的第一差值以及各个所述人口特征数据与所述最小值的第二差值;
将所述第二差值与所述第一差值的商作为更新后的所述人口特征数据。
进一步地,处理器1001可以调用存储器1005中存储的城市属性的获取程序,还执行以下操作:
采用聚类算法根据所述预设城市属性获取所述人口特征序列对应的城市属性;
将所述人口特征序列对应的城市属性作为所述目标区域的城市属性。
进一步地,处理器1001可以调用存储器1005中存储的城市属性的获取程序,还执行以下操作:
所述聚类算法包括:K-均值算法。
进一步地,处理器1001可以调用存储器1005中存储的城市属性的获取程序,还执行以下操作:
获取各个预设城市属性对应的预设特征曲线;
将所述人口特征序列绘制对应的目标特征曲线;
采用以所述预设特征曲线为初始聚类中心的K-均值算法获取所述目标特征曲线对应的城市属性;
将所述目标特征曲线对应的城市属性作为所述人口特征序列的城市属性。
进一步地,处理器1001可以调用存储器1005中存储的城市属性的获取程序,还执行以下操作:
分别获取所述目标特征曲线与各个所述预设特征曲线间的距离;
获取最小距离对应的所述预设特征曲线作为所述目标特征曲线的相似曲线;
将所述相似曲线对应的预设城市属性作为所述目标特征曲线对应的城市属性。
参照图2,本发明城市属性的获取方法第一实施例,所述城市属性的获取方法包括:
步骤S10,获取目标区域内的基站。
步骤S20,从所述基站中获取所述目标区域对应的信令数据。
随着手机拥有量的与日俱增,城市居民已经普及了手机的使用,人手一部手机已经成为常态,因此,将手机可以作为居民随身的出行探测器,利用移动通信网络设施获取居民出行位置信息,可以准确获取固定区域内的人口流动情况。具体地,移动通信网络包含移动通信基站及其发射信号和移动台(主要指手机),在基站接收该基站覆盖的通信范围内所有手机通讯时产生的信令信息,进而根据信令信息统计基站覆盖的通信范围内存在的手机数量,手机数量即可表示该基站覆盖的通信范围内存在的居民数量。
因此,在获取目标区域的城市属性,根据城市属性规划目标区域的交通安排,首先确定该目标区域内存在的基站,进而从所述基站中获取与该目标区域有关的信令数据。通过基站采集到的信令数据来采集居民出行数据,数据采集的样本量大,采集范围广,可以实现实时采集数据,提高数据更新频率,数据采集准确、质量高。
步骤S30,根据所述信令数据获取所述目标区域的人口特征序列,其中,所述人口特征序列包括用户流量、流入量、流出量以及新增量中的至少一个人口特征向量。
通过信令数据的分析可以获取目标区域内某一时间段内居民的用户流量、流入量、流出量以及新增量。其中,用户流量表示存在的总居民数量;流入量表示此时间段内进入目标区域内的居民数量;流出量表示此时间段内离开目标区域的居民数量;新增量表示此时间段内目标区域内新增加的居民数量,新增量的数值为流入量减流出量的数值。
为提高目标区域的城市属性归类的准确性,获取预设时长内的信令数据,再按照预设时间间隔将所述预设时长划分为多个时间段,分别分析各个时间段内产生的信令数据,获取各个时间段对应的人口特征数据。其中,每个时间段内的人口特征数据包括用户流量、流入量、流出量以及新增量。将得到的人口特征数据分类,将同一类型的人口特征数据作为一个人口特征向量,最后,由各个类型的所述人口特征向量组成所述目标区域对应的人口特征序列。其中所述类型即为人口特征向量的类型,主要包括用户流量、流入量、流出量以及新增量等类型。即人口特征序列中含有多个人口特征向量,人口特征向量中具有多个时间段内的人口特征数据。人口特征序列相当于一个数组,每个人口特征向量相当于数组中的一个向量,每个人口特征数据相当于数组(或向量)的一个元素。
例如,预设时长为24小时,预设时间间隔为10分钟,则从基站中获取24小时内目标区域对应的信令数据,将24小时划分为144个时间段,每个时间段10分钟。由信令数据依次统计每个10分钟内的人口特征数据(用户流量、流入量、流出量以及新增量),将所有人口特征数据中的用户流量作为用户流量这一人口特征向量的人口特征数据,同理将流入量、流出量以及新增量对应的人口特征数据分类至流入量、流出量以及新增量对应人口特征向量中,在将这四个人口特征向量组成目标区域的人口特征序列。换言之,每10分钟获取一次目标区域内的用户流量、流入量、流出量以及新增量,共获取144次,总时长24小时。四个人口特征向量中分别具有144个人口特征数据,人口特征序列由四个人口特征向量组成。
步骤S40,获取预设城市属性中与所述人口特征序列对应的城市属性。
步骤S50,将所述人口特征序列对应的城市属性作为所述目标区域的城市属性。
预设多个城市属性,例如商业区、工作区、居住区、娱乐区以及综合区等。每个城市属性具有其特性,例如:
商业区:该区域的人口聚散特点是上午人口在快速流入,傍晚达到高峰,晚上逐渐回落,凌晨回落到全天最低点。
工作区:上午和下午各有一个高峰,正午时间人相对较少,因此该类曲线代表了只有工作时间才会有人口集散特征。
居住区:早上和晚上人最多,上午时间人口流出,下午达到最低值,晚上人口慢慢聚集。
娱乐区:该区域的聚散特征为早上人数处于低谷,早高峰后人口慢慢聚集,晚上达到最高值,然后慢慢回落。
获取明显具有预设城市属性对应的区域作为标准区域,获取标准区域对应的人口特征序列,从标准区域对应的人口特征序列中获取与所述目标区域对应的人口特征序列最相似的一个人口特征序列,最相似的人口特征序列对应的城市属性即为所述目标区域的城市属性。通过获取目标区域的城市属性可以根据城市属性的特性安排交通规划,为居民提供出行便利,避免交通拥挤产生交通事故以及踩踏事件的发生,保障居民人身安全。
在比对相似的人口特征序列时,可以选取人口特征序列中的一个或多个人口特征向量进行比对,由于在各个预设城市属性中流入量的特征较为显著,常选取流入量作为比对向量。
在本实施例中,确定目标区域内存在的基站,进而从所述基站中获取与该目标区域有关的信令数据。根据信令数据获取目标区域内的人口特征序列。通过基站采集到的信令数据来采集居民出行数据,数据采集的样本量大,采集范围广,可以实现实时采集数据,提高数据更新频率,数据采集准确、质量高。获取明显具有预设城市属性对应的区域作为标准区域,获取标准区域对应的人口特征序列,从标准区域对应的人口特征序列中获取与所述目标区域对应的人口特征序列最相似的人口特征序列,最相似的人口特征序列对应的城市属性即为所述目标区域的城市属性。通过获取目标区域的城市属性可以根据城市属性的特性安排交通规划,为居民提供出行便利,避免交通拥挤产生交通事故以及踩踏事件的发生,保障居民人身安全。
进一步的,参照图3,本发明城市属性的获取第二实施例,基于上述第一实施例,所述步骤S40之前,还包括:
步骤S60,依次获取各个所述人口特征向量中所述人口特征数据的最大值和最小值,其中,所述人口特征向量为所述人口特征序列中的人口特征向量。
步骤S70,根据所述最大值和所述最小值对应更新所述人口特征向量中各个人口特征数据。
步骤S80,根据更新后的所述人口特征数据更新所述人口特征序列。
由于用户流量、流入量、流出量以及新增量是四个不同维度的人口特征数据,每个维度间的数值的量纲和数量级可能存在较大的差异,对城市属性的获取存在影响,故,对每个人口特征向量中的人口特征数据进行归一化处理,以消除不同量纲和数量级对城市属性的归属结果的影响。
对于每个人口特征向量中的人口特征数据做如下处理,使得各个人口特征数据的数值转化为0-1之间:获取人口特征向量中的人口特征数据的最大值和最小值,由最大值和最小值计算出最大值和最小值间的第一差值,由人口特征数据与最小值间的第二差值,将第二差值除以第一差值得到的商作为该人口特征数据更新后的人口特征数据。由更新后的人口特征数据组成更新后的人口特征向量,由更新后的人口特征向量得到更新后的人口特征序列。例如,流入量对应的人口特征向量A{a1,a2,a3,…,a144}具有144个人口特征数据,最大值为amax,最小值为amin,则处理向量A中的各个元素a,处理方式为:a=(a-amax)/(amax-amin),将处理后的元素对应替换原元素,得到更新后的人口特征向量为A。将更新后的各个人口特征向量组成更新后的人口特征序列。
在本实施例中,获取人口特征向量中的人口特征数据的最大值和最小值,由最大值和最小值计算出最大值和最小值间的第一差值,由人口特征数据与最小值间的第二差值,将第二差值除以第一差值得到的商作为该人口特征数据更新后的人口特征数据。由更新后的人口特征数据组成更新后的人口特征向量,由更新后的各个人口特征向量组成更新后的人口特征序列。对每个人口特征向量中的人口特征数据进行归一化处理,以消除不同量纲和数量级对城市属性的归属结果的影响。
进一步的,参照图4,本发明城市属性的获取第三实施例,基于上述第一或第二实施例,所述步骤S40包括:
步骤S41,采用聚类算法根据所述预设城市属性获取所述人口特征序列对应的城市属性。
获取预设城市属性中与所述人口特征序列对应的城市属性的具体方法可以是采用聚类算法,以预设城市属性为类型,目标区域的人口特征序列与各个预设城市属性的相似度为依据,相似度高的预设城市属性则为人口特征序列对应的城市属性。聚类算法有K-MEANS算法、K-MEDOIDS算法、CLARANS算法。
进一步地,采用K-MEANS算法(又称K-均值算法)作为具体的聚类算法获取人口特征序列对应的城市属性。本发明对现有的K-MEANS算法加以改进,以预设城市属性对应的预设人口特征序列为初始聚类中心,提高聚类的稳定性,能够实现将目标区域的人口特征序列聚类至预设人口特征序中的一个,从而将目标区域的城市属性归属于预设城市属性中的一个。
进一步地,获取由各个预设城市属性对应的预设人口特征数据绘制的预设特征曲线,同时将目标区域对应的所述人口特征序列绘制为对应的目标特征曲线。采用以所述预设特征曲线为初始聚类中心的K-均值算法获取所述目标特征曲线对应的城市属性。分别计算目标特征曲线与各个预设特征曲线间的距离(距离越小,相似度越高),获取最小距离对应的所述预设特征曲线作为所述目标特征曲线的相似曲线,将所述相似曲线对应的预设城市属性作为所述目标特征曲线对应的城市属性。其中,所述距离为欧式距离或者是弗雷歇距离。
需要指出的是,绘制的特征曲线是以时间为横坐标,以人口特征数据为纵坐标的曲线,计算两条曲线间的距离时,取两条曲线中横坐标相同的两个对应点,计算对应点间的距离,所有对应点间的距离之和作为两条曲线间的距离。对应点的选取可以是绘制特征曲线采用的人口特征数据,也可以是特征曲线上获取的任意点。
所述特征曲线为依据人口特征序列中的人口特征向量绘制,目标特征曲线采用的人口特征向量与所述预设特征曲线采用的为同类型的人口特征向量。例如,预设城市属性的预设特征曲线是依据流入量绘制的,则目标特征曲线也是通过人口特征序列中的流入量对应的人口特征向量来绘制。
此外,本发明所述的目标区域可以是多个目标区域,采用上述方法,同时获取多个目标区域的人口特征序列,依据人口特征序列采用聚类算法获取目标区域的所属城市属性。实现对多个区域进行城市属性的聚类。
在本实施例中,采用聚类算法,以预设城市属性为类型,目标区域的人口特征序列与各个预设城市属性的相似度为依据,相似度高的预设城市属性则为人口特征序列对应的城市属性。实现目标区域的有效分类,目标区域对应城市属性的有效获取。
此外,本发明实施例还提出一种城市属性的获取装置,所述城市属性的获取装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的城市属性的获取程序,所述城市属性的获取程序被所述处理器执行时实现如上各个实施例所述的城市属性的获取方法的步骤。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有城市属性的获取程序,所述城市属性的获取程序被处理器执行时实现如上各个实施例所述的城市属性的获取方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种城市属性的获取方法,其特征在于,所述城市属性的获取方法包括以下步骤:
获取目标区域内的基站;
从所述基站中获取所述目标区域对应的信令数据;
根据所述信令数据获取所述目标区域的人口特征序列,其中,所述人口特征序列包括用户流量、流入量、流出量以及新增量中的至少一个人口特征向量;
获取预设城市属性中与所述人口特征序列对应的城市属性,将所述人口特征序列对应的城市属性作为所述目标区域的城市属性。
2.如权利要求1所述的城市属性的获取方法,其特征在于,所述根据所述信令数据获取所述目标区域的人口特征序列的步骤包括:
获取预设时长内的所述信令数据;
按照预设时间间隔将所述预设时长划分为多个时间段;
根据预设时长内的所述信令数据,获取各个所述时间段对应的人口特征数据;
获取所述人口特征向量的类型,依次获取所述时间段对应的人口特征数据中与所述类型对应的人口特征数据;
由所述类型对应的人口特征数据组成所述类型的人口特征向量;
由各个类型的所述人口特征向量组成所述目标区域的人口特征序列。
3.如权利要求2所述的城市属性的获取方法,其特征在于,所述获取预设城市属性中与所述人口特征序列对应的预设城市属性,将所述人口特征序列对应的预设城市属性作为所述目标区域的城市属性的步骤之前,还包括:
依次获取各个所述人口特征向量中所述人口特征数据的最大值和最小值,其中,所述人口特征向量为所述人口特征序列中的人口特征向量;
根据所述最大值和所述最小值对应更新所述人口特征向量中各个人口特征数据;
根据更新后的所述人口特征数据更新所述人口特征序列。
4.如权利要求3所述的城市属性的获取方法,其特征在于,所述根据所述最大值和所述最小值对应更新所述人口特征向量中各个人口特征数据的步骤包括:
依次获取各个所述人口特征向量中所述最大值和所述最小值的第一差值以及各个所述人口特征数据与所述最小值的第二差值;
将所述第二差值与所述第一差值的商作为更新后的所述人口特征数据。
5.如权利要求1-4任一所述的城市属性的获取方法,其特征在于,所述获取预设城市属性中与所述人口特征序列对应的城市属性,将所述人口特征序列对应的城市属性作为所述目标区域的城市属性的步骤包括:
采用聚类算法根据所述预设城市属性获取所述人口特征序列对应的城市属性;
将所述人口特征序列对应的城市属性作为所述目标区域的城市属性。
6.如权利要求5所述的城市属性的获取方法,其特征在于,所述聚类算法包括:K-均值算法。
7.如权利要求6所述的城市属性的获取方法,其特征在于,所述采用聚类算法根据所述预设城市属性获取所述人口特征序列对应的城市属性的步骤包括:
获取各个预设城市属性对应的预设特征曲线;
将所述人口特征序列绘制对应的目标特征曲线;
采用以所述预设特征曲线为初始聚类中心的K-均值算法获取所述目标特征曲线对应的城市属性;
将所述目标特征曲线对应的城市属性作为所述人口特征序列的城市属性。
8.如权利要求7所述的城市属性的获取方法,其特征在于,所述采用以所述预设特征曲线为初始聚类中心的K-均值算法获取所述目标特征曲线对应的城市属性的步骤包括:
分别获取所述目标特征曲线与各个所述预设特征曲线间的距离;
获取最小距离对应的所述预设特征曲线作为所述目标特征曲线的相似曲线;
将所述相似曲线对应的预设城市属性作为所述目标特征曲线对应的城市属性。
9.一种城市属性的获取装置,其特征在于,所述城市属性的获取包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的城市属性的获取方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有城市属性的获取程序,所述城市属性的获取程序被处理器执行时实现如权利要求1至8中任一项所述的城市属性的获取方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810692742.3A CN108921214A (zh) | 2018-06-28 | 2018-06-28 | 城市属性的获取方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810692742.3A CN108921214A (zh) | 2018-06-28 | 2018-06-28 | 城市属性的获取方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108921214A true CN108921214A (zh) | 2018-11-30 |
Family
ID=64422278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810692742.3A Pending CN108921214A (zh) | 2018-06-28 | 2018-06-28 | 城市属性的获取方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108921214A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413722A (zh) * | 2019-08-06 | 2019-11-05 | 京东城市(北京)数字科技有限公司 | 地址选择方法、装置以及非瞬时性存储介质 |
CN111046122A (zh) * | 2019-12-06 | 2020-04-21 | 深圳集智数字科技有限公司 | 一种地理区域的属性确定方法和相关设备 |
CN113641913A (zh) * | 2021-08-20 | 2021-11-12 | 数睿科技(珠海横琴)有限公司 | 数据处理方法、装置和电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102890860A (zh) * | 2012-09-28 | 2013-01-23 | 北京世纪高通科技有限公司 | 一种交通小区划分方法及装置 |
CN104484993A (zh) * | 2014-11-27 | 2015-04-01 | 北京交通大学 | 用于交通小区划分的手机信令信息的处理方法 |
CN107194525A (zh) * | 2017-03-23 | 2017-09-22 | 同济大学 | 一种基于手机信令的城市中心评估方法 |
-
2018
- 2018-06-28 CN CN201810692742.3A patent/CN108921214A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102890860A (zh) * | 2012-09-28 | 2013-01-23 | 北京世纪高通科技有限公司 | 一种交通小区划分方法及装置 |
CN104484993A (zh) * | 2014-11-27 | 2015-04-01 | 北京交通大学 | 用于交通小区划分的手机信令信息的处理方法 |
CN107194525A (zh) * | 2017-03-23 | 2017-09-22 | 同济大学 | 一种基于手机信令的城市中心评估方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413722A (zh) * | 2019-08-06 | 2019-11-05 | 京东城市(北京)数字科技有限公司 | 地址选择方法、装置以及非瞬时性存储介质 |
CN110413722B (zh) * | 2019-08-06 | 2021-03-30 | 京东城市(北京)数字科技有限公司 | 地址选择方法、装置以及非瞬时性存储介质 |
CN111046122A (zh) * | 2019-12-06 | 2020-04-21 | 深圳集智数字科技有限公司 | 一种地理区域的属性确定方法和相关设备 |
CN113641913A (zh) * | 2021-08-20 | 2021-11-12 | 数睿科技(珠海横琴)有限公司 | 数据处理方法、装置和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106228386A (zh) | 一种信息推送方法及装置 | |
CN107248082B (zh) | 养卡识别方法及装置 | |
CN103150696A (zh) | 选择目标增值业务潜在客户的方法及装置 | |
US20150051948A1 (en) | Behavioral attribute analysis method and device | |
KR101420180B1 (ko) | 유동인구 정보 분석 장치 및 그 방법 | |
CN108921214A (zh) | 城市属性的获取方法、装置及计算机可读存储介质 | |
CN105007171A (zh) | 基于通信领域大数据的用户数据分析系统及方法 | |
CN104573304A (zh) | 一种基于信息熵和聚类分群的用户质态评估方法 | |
CN108876475A (zh) | 一种基于兴趣点采集的城市功能区识别方法、服务器及存储介质 | |
CN108764319A (zh) | 一种样本分类方法和装置 | |
CN109982367A (zh) | 移动终端上网用户投诉预测方法、装置、设备及存储介质 | |
CN109636457A (zh) | 一种面向高净值客户的广告投放方法、装置及系统 | |
CN105975537A (zh) | 一种应用程序的排序方法及装置 | |
CN109118615A (zh) | 一种智能楼宇管理方法、服务器、介质及系统 | |
CN109101559A (zh) | 一种基于poi和公交刷卡数据的城市功能区识别方法 | |
CN111177287A (zh) | 广告投放方法及其装置 | |
CN107767153A (zh) | 一种数据处理方法及装置 | |
CN110377829A (zh) | 应用于电子设备的功能推荐方法和装置 | |
CN109428910A (zh) | 一种数据处理方法、装置及系统 | |
CN107563807A (zh) | 一种基于数据挖掘的区域广告推送系统 | |
CN111311193B (zh) | 公共服务资源的配置方法和装置 | |
CN106327236B (zh) | 一种确定用户行动轨迹的方法及装置 | |
Woods et al. | Exploring methods for mapping seasonal population changes using mobile phone data | |
CN109919805A (zh) | 信息推送方法、用户设备、存储介质及装置 | |
WO2018226173A2 (en) | A system for demographic analysis of mobile operator subscribers visiting the areas wherein indoor base station is established |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181130 |
|
RJ01 | Rejection of invention patent application after publication |