CN111813835B - 一种基于手机信令和poi数据的公共活动中心识别系统 - Google Patents

一种基于手机信令和poi数据的公共活动中心识别系统 Download PDF

Info

Publication number
CN111813835B
CN111813835B CN202010676221.6A CN202010676221A CN111813835B CN 111813835 B CN111813835 B CN 111813835B CN 202010676221 A CN202010676221 A CN 202010676221A CN 111813835 B CN111813835 B CN 111813835B
Authority
CN
China
Prior art keywords
data
travel
center
land
urban
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010676221.6A
Other languages
English (en)
Other versions
CN111813835A (zh
Inventor
裘炜毅
李明敏
刘佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yuanzhuo Information Technology Co ltd
Original Assignee
Shanghai Yuanzhuo Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yuanzhuo Information Technology Co ltd filed Critical Shanghai Yuanzhuo Information Technology Co ltd
Priority to CN202010676221.6A priority Critical patent/CN111813835B/zh
Publication of CN111813835A publication Critical patent/CN111813835A/zh
Application granted granted Critical
Publication of CN111813835B publication Critical patent/CN111813835B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Fuzzy Systems (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种基于手机信令和POI数据的公共活动中心识别系统。本发明涉及大数据分析领域。本发明的方案:包括数据库、城市用地类型识别模块、城市居民出行链提取模块和城市活动中心识别模块,所述城市用地类型识别模块。本发明可以更好地理解一个城市的空间发展结构,为分析现实中城市发展与城市规划的差异。

Description

一种基于手机信令和POI数据的公共活动中心识别系统
技术领域
本发明涉及大数据分析领域,具体而言,涉及一种基于手机信令和POI数据的公共活动中心识别系统。
背景技术
城市公共活动中心是城市结构的核心地区和城市功能的重要组成部分,是城市居民公共活动最频繁、社会生活最集中的场所。
目前,现有技术中不能识别城市公共活动中心,不能更好地理解一个城市的空间发展结构。
发明内容
本发明的目的在于提供一种基于手机信令和POI数据的公共活动中心识别系统,其能够更好地理解一个城市的空间发展结构,分析现实中城市发展与城市规划的差异。
本发明的实施例是这样实现的:
本申请实施例提供一种基于手机信令和POI数据的公共活动中心识别系统,包括数据库、城市用地类型识别模块、城市居民出行链提取模块和城市活动中心识别模块,城市用地类型识别模块、城市居民出行链提取模块和城市活动中心识别模块分别与数据库连接:
数据库:用于存储空间数据、属性数据和文档数据;
城市用地类型识别模块:用于对数据库感兴趣区域的城市功能POI数据进行数据清理和坐标转换,按照POI分类标准计算各类型指标及指标权重,转化为感兴趣区域内各基础类别的特征参数;
城市居民出行链提取模块:用于获取居民生活出行活动数据,观测感兴趣区域内人口分布和流动规律,建立出行链;
城市活动中心识别模块:用于分析感兴趣区域公共活动中心的数量、类型和结构,获取感兴趣区域公共活动中心的空间分布分析其城市发展结构。
在本发明的一些实施例中,上述城市用地类型识别模块LDA监督学习算法,对感兴趣区域用地类型进行识别,包括以下步骤:
A:计算已知用地性质的且包含有m个样本的区域m的特征参数向量矩阵m为样本量,n为样本特征参数向量维度;
B:计算最优投影矩阵ωopt
C:用地性质识别分类。
在本发明的一些实施例中,上述数据库中的文档数据包括经济社会指标数据、手机信令数据、城市功能POI数据。
在本发明的一些实施例中,上述城市用地类型识别模块中基础类别包括公共管理与公共服务用地、商业服务业设施用地、工业用地、交通设施用地、居住用地、绿地和广场用地。
在本发明的一些实施例中,上述城市活动中心识别模块包括城市生活中心识别单元、商业活动中心识别单元和商务办公活动中心识别单元;
城市生活中心识别单元:用于测量公共服务设施用地的POI类型数量、生活圈出行人流量、人流平均出行时间及人流平均出行距离;
商业活动中心识别单元:用于测定商业服务设施用地的POI类型权重值、周末全目的出行人流量、人流平均出行时间及人流平均出行距离;
商务办公活动中心识别单元:用于测量对应类型城市用地上结合单位面积的通勤人流量分布情况计算得到不同聚集强度的商务办公活动集中范围。
在本发明的一些实施例中,上述城市生活中心识别单元、商业活动中心识别单元和商务办公活动中心识别单元均采用K均值聚类方法对中心级别进行分类,包括以下步骤:
D:城市生活中心识别单元、商业活动中心识别单元或商务办公活动中心识别单元分为n级,同时设置城市生活中心识别单元、商业活动中心识别单元或商务办公活动中心识别单元的影响因子;
E:将影响因子数据分为n类,随机初始化n个空间单元x1,……,xn,其对应的影响因子数据向量集合,作为n类中心的中心空间单元;
F:计算每个中心空间单元的影响因子到各类中心的中心空间单元的距离,其中,第i个影响因子xi到第k类中心的中心空间单元xk的距离为dk,则有:dk=||xi-xk||,距离哪类中心的中心空间单元最近就将影响因子划分到哪一类中,从而计算得到n类中心空间单元集合{x1,……,xn};
G:在n类商业中心空间单元集合{x1,……,xn}基础上,重新计算每一类中心的空间单元作为新的中心点;
H:重复步骤F及步骤G,直到每一类中心空间单元集合在每次迭代后变化不大为止,形成n类中心空间单元集合,即完成对城市生活中心识别单元、商业活动中心识别单元或商务办公活动中心识别单元的识别及分级。
在本发明的一些实施例中,上述商业活动中心识别模块识别结果分为四个等级:市级商业中心、区级商业中心、社区级商业中心和非商业中心。
在本发明的一些实施例中,上述城市居民出行链提取模块包括用户类型识别单元、出行性质识别单元和数据整合单元;
用户类型识别单元:用于读取数据库中基于用户个体出行链在城市中的停留时间进行识别并统计输出各个用户的类型;
出行性质识别单元:用于读取数据库中用户个体出行链对各个用户在城市中的目的地进行识别并根据目的地对应用户的居住地、工作地或是其它停留地对用户的出行性质进行判定;
数据整合单元:用于读取数据库中个体出行链、用户类型以及出行性质作为基础统计数据,提取基于出行链的人口活动指标。
在本发明的一些实施例中,上述用户的类型包括本地人口、短期驻留人口和其他人口。
在本发明的一些实施例中,上述用户的出行性质包括通勤出行、生活圈出行、旅游出行和商务活动出行。
相对于现有技术,本发明的实施例至少具有如下优点或有益效果:
数据计算方面,采用先进的大数据分析处理技术,包括Spark技术等分布式计算,人工智能分析工具,如python,对多源大数据进行深入分析挖掘,包括历史数据训练、业务关联分析、时空关联分析等;可视化方面,利用大数据可视化分析工具软件,丰富的Echart图表,以及GIS地理空间可视化工具。其中本发明的城市公共活动中心识别系统在数据存储方面考虑源数据特点及数据量的大小、接入的实时性,包括结构化、非结构化及实时流数据,采用传统的Oracle数据库与大数据分布式存储结合的技术方案,既满足基础数据、中间成果、结果等结构化数据存储稳定性、便捷性、高效率需求,同时达到手机信令、互联网、交通采集等海量数据存储、调用、计算等性能需求,该系统包括数据库和连接数据库的城市用地类型识别模块、城市公共活动中心的识别模块,其城市用地类型识别功能模块以POI数据为数据基础,挖掘POI分布特征与城市用地关系,提出LDA监督学习方法,实现城市类型分类及识别;其城市公共活动中心识别功能模块以手机信令和POI数据为数据基础,通过研究基于出行链的居民出行规律,关联城市用地类型关系,提出城市公共活动中心影响因子,利用K均值聚类方法,实现城市公共活动中心的识别及分级应用。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例数据库和功能模块的连接示意图;
图2为本发明实施例系统分层逻辑框架图;
图3为本发明实施例城市居民出行链的人口活动指标提取的业务逻辑原理图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明实施例的描述中,“多个”代表至少2个。
在本发明实施例的描述中,还需要说明的是,除非另有明确的规定和限定,若出现术语“设置”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
实施例
请参考图1-图3所示。本实施例提供一种基于手机信令和POI数据的公共活动中心识别系统,包括数据库、城市用地类型识别模块、城市居民出行链提取模块和城市活动中心识别模块,城市用地类型识别模块、城市居民出行链提取模块和城市活动中心识别模块分别与数据库连接:
数据库:用于存储空间数据、属性数据和文档数据;
城市用地类型识别模块:用于对数据库感兴趣区域的城市功能POI数据进行数据清理和坐标转换,按照POI分类标准计算各类型指标及指标权重,转化为感兴趣区域内各基础类别的特征参数;
城市居民出行链提取模块:用于获取居民生活出行活动数据,观测感兴趣区域内人口分布和流动规律,建立出行链;
城市活动中心识别模块:用于分析感兴趣区域公共活动中心的数量、类型和结构,获取感兴趣区域公共活动中心的空间分布分析其城市发展结构。
上述实施方式中,数据库,其用于描述、存储和处理空间数据、属性数据以及文档数据,支持空间数据类型和空间索引。所述空间数据是和空间有关的信息,如点、线、矩形、多边形、多面体等占有空间的对象,包括感兴趣区域的行政区划图、感兴趣区域各时期土地利用现状图等。所述属性数据是与空间数据有关的各个属性,如点所表示的城市的面积、人口等,包括感兴趣区域的总面积、感兴趣区域中各地类的类型和面积。所述文档数据包括手机信令数据及POI数据等相关表格、文件以及说明文本等。
数据管理模块、地图编辑模块、数据维护模块和用户管理模分别连接数据库,其中:
数据管理模块:用于打开和/或导出和/或打印所述空间数据和/或属性数据和/或文档数据。
地图编辑模块:用于供用户对当前地图文档进行编辑操作。所述编辑操作包括视图切换、插入布局要素和地图标注中的一种或几种。
数据维护模块:用于供用户对所述空间数据、属性数据以及文档数据中的一种或几种进行维护操作,且维护操作后,所述数据库根据维护操作对相应的数据进行更新。所述维护操作包括新增、修改和删除中的一种或几种
用户管理模:用于供用户修改密码和/或添加用户和/或查询用户。用户管理模块与现有智能控制终端(包括手机、电脑等)的用户管理/设置单元相同。
城市用地类型识别模块:与数据库建立数据通信,对数据库感兴趣区域的城市功能POI数据进行数据清理和坐标转换,按照POI分类标准计算各类型指标及指标权重,转化为感兴趣区域内各建设用地的基础类别,基础类别包括公共管理与公共服务用地、商业服务业设施用地、工业用地、交通设施用地、居住用地、绿地与广场用地,对于城市功能POI数据未被识别的建设用地标记为其它用地,并获取感兴趣区域内建设用地多维数据,依据上述获得的各建设用地的基础类别进一步识别感兴趣区域内各类建设用地类型,从而实现融合不同尺度的感兴趣区域的功能区的识别。
城市居民出行链提取模块:用于获取分别对应各个用户以及各个基站的手机信令数据,并对其进行处理从而生成对应各个用户的个体出行链。本实施例中,基站为用于进行手机数据传输的信号基站,能够对用户的手机产生的数据进行传输并记录手机的信令作为手机信令数据。
城市活动中心识别模块:在城市用地类型识别模块和城市居民出行链提取模块基础上,设计城市商业活力中心、商务办公中心及城市生活中心分级影响因子。
其中,城市用地类型与互联网POI分类及权重设计,见下表格:
本实施例中,数据计算方面,采用先进的大数据分析处理技术,包括Spark技术等分布式计算,人工智能分析工具,如python,对多源大数据进行深入分析挖掘,包括历史数据训练、业务关联分析、时空关联分析等;可视化方面,利用大数据可视化分析工具软件,丰富的Echart图表,以及GIS地理空间可视化工具。其中本发明的城市公共活动中心识别系统在数据存储方面考虑源数据特点及数据量的大小、接入的实时性,包括结构化、非结构化及实时流数据,采用传统的Oracle数据库与大数据分布式存储结合的技术方案,既满足基础数据、中间成果、结果等结构化数据存储稳定性、便捷性、高效率需求,同时达到手机信令、互联网、交通采集等海量数据存储、调用、计算等性能需求,该系统包括数据库和连接数据库的城市用地类型识别模块、城市公共活动中心的识别模块,其城市用地类型识别功能模块以POI数据为数据基础,挖掘POI分布特征与城市用地关系,提出LDA监督学习方法,实现城市类型分类及识别;其城市公共活动中心识别功能模块以手机信令和POI数据为数据基础,通过研究基于出行链的居民出行规律,关联城市用地类型关系,提出城市公共活动中心影响因子,利用K均值聚类方法,实现城市公共活动中心的识别及分级应用。
在本发明的一些实施例中,城市用地类型识别模块LDA监督学习算法,对感兴趣区域用地类型进行识别,包括以下步骤:
A:计算已知用地性质的且包含有m个样本的区域m的特征参数向量矩阵m为样本量,n为样本特征参数向量维度;
A1:根据POI类别与用地性质相关性,将POI分为n类,并根据POI性质规模设计相应权值;
A2:计算区域m属于第n类POI的权值pmn,其特征参数向量第n维度值即区域m的特征参数向量xm={δm1,δm2……δmn};
A3:构建区域m的特征参数向量矩阵
B:计算最优投影矩阵ωopt
B1:将区域m包含的m个样本根据用地性质划分为c类数据集,第i类数据集中包括ni个样本ni,n1+n2+...ni+...+nc=m,则第i类数据集对应的参数向量均值xj为第i类数据集中第j个样本,全样本参数向量均值/>
B2:计算各类数据集间的离散度sb及数据集内部的离散度sw
B3:根据Fisher线性鉴别准则,计算最优投影矩阵其中:ω为投影矩阵。
C:用地性质识别分类;
C1:对于感兴趣区域m,根据其特征参数向量xm按照最优矩阵方向进行投影ωoptxm,根据欧氏距离分类方法,识别地块用地性质copt=min||ωoptxmoptμi||,i∈c,即完成感兴趣区域m用地类型识别。
在本发明的一些实施例中,数据库中的文档数据包括经济社会指标数据、手机信令数据、城市功能POI数据。
在本发明的一些实施例中,城市用地类型识别模块中基础类别包括公共管理与公共服务用地、商业服务业设施用地、工业用地、交通设施用地、居住用地、绿地和广场用地。
在本发明的一些实施例中,城市活动中心识别模块包括城市生活中心识别单元、商业活动中心识别单元和商务办公活动中心识别单元;
城市生活中心识别单元:用于测量公共服务设施用地的POI类型数量、生活圈出行人流量、人流平均出行时间及人流平均出行距离;
其中,城市生活中心识别单元涉及的影响因子有公共服务设施用地的POI类型数量、生活圈出行人流量、人流平均出行时间及人流平均出行距离,识别结果分为四个等级:市级生活中心、区级生活中心、社区级生活中心及非生活中心。
商业活动中心识别单元:用于测定商业服务设施用地的POI类型权重值、周末全目的出行人流量、人流平均出行时间及人流平均出行距离;
其中,商业活动中心识别单元的影响因子包括商业服务设施用地的POI类型权重值、周末全目的出行人流量、人流平均出行时间及人流平均出行距离,识别结果分为四个等级:市级商业中心、区级商业中心、社区级商业中心及非商业中心。
商务办公活动中心识别单元:用于测量对应类型城市用地上结合单位面积的通勤人流量分布情况计算得到不同聚集强度的商务办公活动集中范围。
其中,基于POI数据识别的对应类型城市用地上结合单位面积的通勤人流量分布情况计算得到不同聚集强度的商务办公活动集中范围,用户根据符合地区情况的人口指标将其单元划分为高聚集强度办公单元、中等聚集强度办公单元或低聚集强度办公单元。
其中,城市公共活动中心影响因子,见下表:
在本发明的一些实施例中,城市生活中心识别单元、商业活动中心识别单元和商务办公活动中心识别单元均采用K均值聚类方法对中心级别进行分类,包括以下步骤:
D:城市生活中心识别单元、商业活动中心识别单元或商务办公活动中心识别单元分为n级,同时设置城市生活中心识别单元、商业活动中心识别单元或商务办公活动中心识别单元的影响因子;
E:将影响因子数据分为n类,随机初始化n个空间单元x1,……,xn,其对应的影响因子数据向量集合,作为n类中心的中心空间单元;
F:计算每个中心空间单元的影响因子到各类中心的中心空间单元的距离,其中,第i个影响因子xi到第k类中心的中心空间单元xk的距离为dk,则有:dk=||xi-xk||,距离哪类中心的中心空间单元最近就将影响因子划分到哪一类中,从而计算得到n类中心空间单元集合{x1,……,xn};
G:在n类商业中心空间单元集合{x1,……,xn}基础上,重新计算每一类中心的空间单元作为新的中心点;
H:重复步骤F及步骤G,直到每一类中心空间单元集合在每次迭代后变化不大为止,形成n类中心空间单元集合,即完成对城市生活中心识别单元、商业活动中心识别单元或商务办公活动中心识别单元的识别及分级。
本实施例中,其集成了多项功能器,更加方便识别城市公共活动中心和解读其城市结构,对在城乡规划编制过程中推动基本公共服务的均衡化和城市用地功能调整提供有效的信息化支撑手段。该系统包括数据库和连接数据库的城市用地类型识别模块、城市公共活动中心的识别及分析模块,其城市用地类型识别功能模块以POI数据为数据基础,挖掘POI分布特征与城市用地关系,提出LDA监督学习方法,实现城市类型分类及识别;其城市公共活动中心识别功能模块以手机信令和POI数据为数据基础,通过研究基于出行链的居民出行规律,关联城市用地类型关系,提出城市公共活动中心影响因子,利用K均值聚类方法,实现城市公共活动中心的识别及分级应用。
在本发明的一些实施例中,商业活动中心识别模块识别结果分为四个等级:市级商业中心、区级商业中心、社区级商业中心和非商业中心。
在本发明的一些实施例中,城市居民出行链提取模块包括用户类型识别单元、出行性质识别单元和数据整合单元;
用户类型识别单元:用于读取数据库中基于用户个体出行链在城市中的停留时间进行识别并统计输出各个用户的类型;
其中,用于读取数据库中基于所述用户个体出行链在城市中的停留时间进行识别并统计输出各个用户的类型,包括本地人口、短期驻留人口、其他人口。本实例中,取一个月某市手机数据量举例,其中夜间23:00-05:00期间超过2/3的天数处在同一区域的打卡数据近似表示常住人口分布(即本地人口),夜间23:00-05:00期间只有4天及以下天数处在同一区域的打卡数据近似表示短期驻留人口,剩下的表示为其他人口。
出行性质识别单元:用于读取数据库中用户个体出行链对各个用户在城市中的目的地进行识别并根据目的地对应用户的居住地、工作地或是其它停留地对用户的出行性质进行判定;
其中,用于读取数据库中所述个体出行链对各个所述用户在城市中的目的地进行识别并根据所述目的地对应所述用户的居住地、工作地或是其他停留地对所述用户的出行性质进行判定,主要包括三类:商业出行、通勤出行、生活圈出行。其中,工作日09:00-17:00期间超过2/3的天数处在同一区域,且与夜间所处区域不同,白天所在区域近似识别就业岗位处,夜间所处区域近似识别为居住地处。对于10:00-22:00期间在商业用地中所有到过该区域的出行数据进行记录,然后去掉日常工作流动出行数据近似为商业出行数据。对于旅游出行数据参考基于景点的单元空间内在此区域停留1小时及其以上的出行数据再去掉日常工作流动出行数据。
数据整合单元:用于读取数据库中个体出行链、用户类型以及出行性质作为基础统计数据,提取基于出行链的人口活动指标。
其中,用于读取数据库中所述个体出行链、用户类型以及出行性质进行对应整合并作为基础统计数据,输出数据主要包括城市人口分布、出行特征等信息;
其中,出行链的人口活动指标提取,见下表:
在本发明的一些实施例中,用户的类型包括本地人口、短期驻留人口和其他人口。
在本发明的一些实施例中,用户的出行性质包括通勤出行、生活圈出行、旅游出行和商务活动出行。
综上,本发明的实施例提供一种基于手机信令和POI数据的公共活动中心识别系统,其有益效果:
数据计算方面,采用先进的大数据分析处理技术,包括Spark技术等分布式计算,人工智能分析工具,如python,对多源大数据进行深入分析挖掘,包括历史数据训练、业务关联分析、时空关联分析等;可视化方面,利用大数据可视化分析工具软件,丰富的Echart图表,以及GIS地理空间可视化工具。其中本发明的城市公共活动中心识别系统在数据存储方面考虑源数据特点及数据量的大小、接入的实时性,包括结构化、非结构化及实时流数据,采用传统的Oracle数据库与大数据分布式存储结合的技术方案,既满足基础数据、中间成果、结果等结构化数据存储稳定性、便捷性、高效率需求,同时达到手机信令、互联网、交通采集等海量数据存储、调用、计算等性能需求,该系统包括数据库和连接数据库的城市用地类型识别模块、城市公共活动中心的识别模块,其城市用地类型识别功能模块以POI数据为数据基础,挖掘POI分布特征与城市用地关系,提出LDA监督学习方法,实现城市类型分类及识别;其城市公共活动中心识别功能模块以手机信令和POI数据为数据基础,通过研究基于出行链的居民出行规律,关联城市用地类型关系,提出城市公共活动中心影响因子,利用K均值聚类方法,实现城市公共活动中心的识别及分级应用。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于手机信令和POI数据的公共活动中心识别系统,其特征在于,包括数据库、城市用地类型识别模块、城市居民出行链提取模块和城市活动中心识别模块,所述城市用地类型识别模块、所述城市居民出行链提取模块和所述城市活动中心识别模块分别与所述数据库连接:
数据库:用于存储空间数据、属性数据和文档数据;
城市用地类型识别模块:用于对数据库感兴趣区域的城市功能POI数据进行数据清理和坐标转换,按照POI分类标准计算各类型指标及指标权重,转化为感兴趣区域内各基础类别的特征参数;
城市居民出行链提取模块:用于获取居民生活出行活动数据,观测感兴趣区域内人口分布和流动规律,建立出行链;
城市活动中心识别模块:用于分析感兴趣区域公共活动中心的数量、类型和结构,获取感兴趣区域公共活动中心的空间分布分析其城市发展结构;
所述城市用地类型识别模块LDA监督学习算法,对感兴趣区域用地类型进行识别,包括以下步骤:
A:计算已知用地性质的且包含有m个样本的区域m的特征参数向量矩阵,m为样本量,n为样本特征参数向量维度;
A1:根据POI类别与用地性质相关性,将POI分为n类,并根据POI性质规模设计相应权值;
A2:计算区域m属于第n类POI的权值pmn,其特征参数向量第n维度值,即区域的特征参数向量/>
A3:构建区域m的特征参数向量矩阵
B:计算最优投影矩阵
B1:将区域m包含的m个样本根据用地性质划分为c类数据集,第i类数据集中包括ni个样本ni,则第i类数据集对应的参数向量均值,xj为第i类数据集中第j个样本,全样本参数向量均值/>
B2:计算各类数据集间的离散度sb及数据集内部的离散度sw
B3:根据Fisher线性鉴别准则,计算最优投影矩阵;其中:/>为投影矩阵;
C:用地性质识别分类;
C1:对于感兴趣区域m,根据其特征参数向量xm按照最优矩阵方向进行投影,根据欧氏距离分类方法,识别地块用地性质/>,/>,即完成感兴趣区域m用地类型识别。
2.根据权利要求1所述的一种基于手机信令和POI数据的公共活动中心识别系统,其特征在于,所述数据库中的文档数据包括经济社会指标数据、手机信令数据、城市功能POI数据。
3.根据权利要求1所述的一种基于手机信令和POI数据的公共活动中心识别系统,其特征在于,所述城市用地类型识别模块中基础类别包括公共管理与公共服务用地、商业服务业设施用地、工业用地、交通设施用地、居住用地、绿地和广场用地。
4.根据权利要求1所述的一种基于手机信令和POI数据的公共活动中心识别系统,其特征在于,所述城市活动中心识别模块包括城市生活中心识别单元、商业活动中心识别单元和商务办公活动中心识别单元;
城市生活中心识别单元:用于测量公共服务设施用地的POI类型数量、生活圈出行人流量、人流平均出行时间及人流平均出行距离;
商业活动中心识别单元:用于测定商业服务设施用地的POI类型权重值、周末全目的出行人流量、人流平均出行时间及人流平均出行距离;
商务办公活动中心识别单元:用于测量对应类型城市用地上结合单位面积的通勤人流量分布情况计算得到不同聚集强度的商务办公活动集中范围。
5.根据权利要求4所述的一种基于手机信令和POI数据的公共活动中心识别系统,其特征在于,所述城市生活中心识别单元、所述商业活动中心识别单元和所述商务办公活动中心识别单元均采用K均值聚类方法对中心级别进行分类,包括以下步骤:
D:城市生活中心识别单元、商业活动中心识别单元或商务办公活动中心识别单元分为n级,同时设置城市生活中心识别单元、商业活动中心识别单元或商务办公活动中心识别单元的影响因子;
E:将影响因子数据分为n类,随机初始化n个空间单元x1,……,xn,其对应的影响因子数据向量集合,作为n类中心的中心空间单元;
F:计算每个中心空间单元的影响因子到各类中心的中心空间单元的距离,其中,第i个影响因子xi到第k类中心的中心空间单元xk的距离为dk,则有:dk=||xi-xk||,距离哪类中心的中心空间单元最近就将影响因子划分到哪一类中,从而计算得到n类中心空间单元集合{x1,……,xn};
G:在n类商业中心空间单元集合{x1,……,xn}基础上,重新计算每一类中心的空间单元作为新的中心点;
H:重复步骤F及步骤G,直到每一类中心空间单元集合在每次迭代后变化不大为止,形成n类中心空间单元集合,即完成对城市生活中心识别单元、商业活动中心识别单元或商务办公活动中心识别单元的识别及分级。
6.根据权利要求3所述的一种基于手机信令和POI数据的公共活动中心识别系统,其特征在于,商业活动中心识别模块识别结果分为四个等级:市级商业中心、区级商业中心、社区级商业中心和非商业中心。
7.根据权利要求1所述的一种基于手机信令和POI数据的公共活动中心识别系统,其特征在于,所述城市居民出行链提取模块包括用户类型识别单元、出行性质识别单元和数据整合单元;
用户类型识别单元:用于读取数据库中基于用户个体出行链在城市中的停留时间进行识别并统计输出各个用户的类型;
出行性质识别单元:用于读取数据库中用户个体出行链对各个用户在城市中的目的地进行识别并根据目的地对应用户的居住地、工作地或是其它停留地对用户的出行性质进行判定;
数据整合单元:用于读取数据库中个体出行链、用户类型以及出行性质作为基础统计数据,提取基于出行链的人口活动指标。
8.根据权利要求7所述的一种基于手机信令和POI数据的公共活动中心识别系统,其特征在于,所述用户的类型包括本地人口、短期驻留人口和其他人口。
9.根据权利要求7所述的一种基于手机信令和POI数据的公共活动中心识别系统,其特征在于,所述用户的出行性质包括通勤出行、生活圈出行、旅游出行和商务活动出行。
CN202010676221.6A 2020-07-14 2020-07-14 一种基于手机信令和poi数据的公共活动中心识别系统 Active CN111813835B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010676221.6A CN111813835B (zh) 2020-07-14 2020-07-14 一种基于手机信令和poi数据的公共活动中心识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010676221.6A CN111813835B (zh) 2020-07-14 2020-07-14 一种基于手机信令和poi数据的公共活动中心识别系统

Publications (2)

Publication Number Publication Date
CN111813835A CN111813835A (zh) 2020-10-23
CN111813835B true CN111813835B (zh) 2023-09-26

Family

ID=72864769

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010676221.6A Active CN111813835B (zh) 2020-07-14 2020-07-14 一种基于手机信令和poi数据的公共活动中心识别系统

Country Status (1)

Country Link
CN (1) CN111813835B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112862176B (zh) * 2021-02-01 2023-04-07 上海元卓信息科技有限公司 一种公共服务设施选址方法及装置
CN113342910B (zh) * 2021-04-28 2024-06-07 北京一亩田新农网络科技有限公司 用于确定区域类型的方法、装置、电子设备和计算机可读介质
CN113473399B (zh) * 2021-06-28 2023-04-07 京东城市(北京)数字科技有限公司 异常聚集事件检测方法、装置、计算机设备及存储介质
CN115375108A (zh) * 2022-08-01 2022-11-22 北京清华同衡规划设计研究院有限公司 一种数据处理设施布设方法、系统、终端及存储介质
CN115442748A (zh) * 2022-08-30 2022-12-06 厦门市城市规划设计研究院有限公司 一种使用手机信令数据进行城市空间结构识别方法
CN115438998A (zh) * 2022-09-22 2022-12-06 广州市城市规划设计有限公司 一种公共服务中心体系的识别方法、装置、设备及介质
CN116308956B (zh) * 2023-03-17 2023-11-24 中国测绘科学研究院 一种城市区域主导功能与规划用途差异检测的方法
CN116956133B (zh) * 2023-07-26 2024-02-27 中国地震局地质研究所 基于时序手机信令数据和机器学习的建筑功能识别方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107194525A (zh) * 2017-03-23 2017-09-22 同济大学 一种基于手机信令的城市中心评估方法
CN110334321A (zh) * 2019-06-24 2019-10-15 天津城建大学 一种基于兴趣点数据的城市轨交站区功能识别方法
CN110533038A (zh) * 2019-09-04 2019-12-03 广州市交通规划研究院 一种基于信息数据的城市活力区和中心城区边界识别的方法
CN110852547A (zh) * 2019-08-19 2020-02-28 上海元卓信息科技有限公司 一种基于位置数据和聚类算法的公共服务设施分级方法
CN111090994A (zh) * 2019-11-12 2020-05-01 北京信息科技大学 一种面向中文网络论坛文本的事件地点归属省份识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10678888B2 (en) * 2017-11-24 2020-06-09 Vmware, Inc. Methods and systems to predict parameters in a database of information technology equipment

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107194525A (zh) * 2017-03-23 2017-09-22 同济大学 一种基于手机信令的城市中心评估方法
CN110334321A (zh) * 2019-06-24 2019-10-15 天津城建大学 一种基于兴趣点数据的城市轨交站区功能识别方法
CN110852547A (zh) * 2019-08-19 2020-02-28 上海元卓信息科技有限公司 一种基于位置数据和聚类算法的公共服务设施分级方法
CN110533038A (zh) * 2019-09-04 2019-12-03 广州市交通规划研究院 一种基于信息数据的城市活力区和中心城区边界识别的方法
CN111090994A (zh) * 2019-11-12 2020-05-01 北京信息科技大学 一种面向中文网络论坛文本的事件地点归属省份识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《重庆市中心城区生活中心的识别与评估》;殷振轩;《规划广角》;第35卷(第7期);全文 *
上海城市生活中心体系的识别与评估;宴龙旭;《城市规划学刊》(第6期);全文 *
基于多源时空大数据的城市规划评估研究——以温州市为例;裘炜毅;《地理信息世界》;第27卷(第3期);全文 *

Also Published As

Publication number Publication date
CN111813835A (zh) 2020-10-23

Similar Documents

Publication Publication Date Title
CN111813835B (zh) 一种基于手机信令和poi数据的公共活动中心识别系统
CN110245981B (zh) 一种基于手机信令数据的人群类型识别方法
Gao et al. Discovering spatial interaction communities from mobile phone d ata
CN107656987B (zh) 一种基于lda模型的地铁站点功能挖掘方法
CN107729919A (zh) 基于大数据技术的深化投诉穿透分析方法
CN113326593B (zh) 一种顾及规划布局与要素配置合理性的生态空间网络优化方法
CN113344758B (zh) 基于城市人群数字画像的服务设施规模调整方法及系统
Borges et al. Feature engineering for crime hotspot detection
CN112966899A (zh) 一种影响人口密度的城市公共服务设施建设决策方法
CN112508425B (zh) 一种用于弹性公交系统的城市出行用户画像体系构建方法
CN116013084B (zh) 交通管控场景确定方法、装置、电子设备及存储介质
CN112000755A (zh) 一种基于手机信令数据的区域出行廊道识别方法
Manley et al. New forms of data for understanding urban activity in developing countries
CN109740957B (zh) 一种城市交通网络节点分类方法
CN113256978A (zh) 一种城市拥堵地区的诊断方法、系统及储存介质
CN111461197A (zh) 一种基于特征提取的空间负荷分布规律研究方法
CN115100395A (zh) 一种融合poi预分类和图神经网络的城市街区功能分类方法
Yao et al. Analysis of key commuting routes based on spatiotemporal trip chain
CN115510056B (zh) 一种利用手机信令数据进行宏观经济分析的数据处理系统
US20230245007A1 (en) User segmentation method based on toll data of expressway electronic toll collection
CN116662860A (zh) 一种基于能源大数据的用户画像与分类方法
CN116244395A (zh) 基于城市道路和poi数据的区域类型判别方法、装置及设备
CN114596030A (zh) 基于数据挖掘的快递网点运营预测模型
CN114611622A (zh) 一种利用手机数据识别跨城通勤人群的方法
CN113538011A (zh) 一种电力系统中非在册联系信息与在册用户的关联方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant