CN112200705A - 一种基于张量分解的城市组团识别方法 - Google Patents

一种基于张量分解的城市组团识别方法 Download PDF

Info

Publication number
CN112200705A
CN112200705A CN202010948416.1A CN202010948416A CN112200705A CN 112200705 A CN112200705 A CN 112200705A CN 202010948416 A CN202010948416 A CN 202010948416A CN 112200705 A CN112200705 A CN 112200705A
Authority
CN
China
Prior art keywords
tensor
travel
factor matrix
resident
traffic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010948416.1A
Other languages
English (en)
Inventor
蔡正义
曾佳棋
王殿海
张国政
金盛
马东方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202010948416.1A priority Critical patent/CN112200705A/zh
Publication of CN112200705A publication Critical patent/CN112200705A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Algebra (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于张量分解的城市组团识别方法。该方法的核心思想是通过借助手机信令、自动车牌识别数据、出行调查等方式获取的居民出行OD分布,基于张量分解方法,获取城市空间组团模式的因子矩阵,通过因子矩阵分析城市组团结构。本发明提出的一种基于张量分解的城市组团识别方法包括:结合交通小区对居民出行OD数据预处理;构建居民出行OD张量;基于张量分解算法对出行OD张量进行分解,得到因子矩阵;对因子矩阵归一化处理,计算得到城市组团概率分布。相比传统的定性描述方法,本方法的结果以概率形式定量化识别出城市各组团分布以及每个交通小区从属组团的概率。

Description

一种基于张量分解的城市组团识别方法
技术领域
本发明涉及一种基于张量分解的城市组团识别方法,用于城市规划与交通规划,属于城市交通规划领域。
背景技术
城市建成区由相对独立非连片的若干团块组成,这些团块具有一定规模承担一定城市功能,团块内部因产业或者职住均衡自发集聚并紧密联系在一起,这些团块被称为城市组团。
城市组团不仅影响着城市的空间结构与形态变化,而且引导着城市的功能建设,进而影响整个城市的全面可持续发展。目前城市规划、城市地理学以及区域规划等众多学科对城市组团空间格局模式进行了研究,多以定性提炼描述为主,缺乏量化分析。在这种背景下,迫切需要提出一种定量化的城市组团识别方法,在城市空间格局模式提炼的基础上,研究组团模式判别和表达的方法。
发明内容
本发明的目的在于提供一种基于张量分解的城市组团识别方法。该方法的核心思想是通过借助手机信令、自动车牌识别数据、出行调查等方式获取的居民出行OD分布,基于张量分解方法,获取城市空间组团模式的因子矩阵,通过因子矩阵分析城市组团结构。
为实现上述目标,本发明提出的一种基于张量分解的城市组团识别方法包括:结合交通小区对居民出行OD数据预处理;构建居民出行OD张量;基于张量分解算法对出行OD张量进行分解,得到因子矩阵;对因子矩阵归一化处理,计算得到城市组团概率分布。
本发明的基本步骤如下:
c1、结合交通小区划分对居民出行OD数据预处理;
c2、构建居民出行OD张量;
c3、基于张量分解算法对出行OD张量进行分解,得到因子矩阵;
c4、对因子矩阵列归一化处理,计算得到城市组团概率分布。
步骤c1的过程包括:
c11、对居民出行数据(手机信令、自动车牌识别数据、出行调查)进行预处理,整理成如下格式,表格中地点可以是经纬度、交叉口、居民小区等。
Figure BDA0002676073420000021
c12、结合交通小区划分情况,通过gis处理获取居民出行的O点和D点所分别对应的交通小区,整理成如下格式:
Figure BDA0002676073420000022
步骤c2的过程包括:
c21、将采集到的居民出行OD表进行整合:针对分析区域的I1个交通小区,依据上表按照时段划分提取得到每个时段的OD表,维度为I1×I2,其中I1=I2
c22、选择I3个时段数的OD表,按照时间顺序排列OD表,得到居民出行张量
Figure BDA0002676073420000023
进一步地,步骤c3的过程包括:
C31、将三维张量按照不同维度进行张量矩阵化,得到3个矩阵,即M(1),M(2),M(3)
C32、对于指定的J1、J2、J3,对M(1),M(2),M(3)进行非负矩阵分解,得到矩阵
Figure BDA0002676073420000031
作为张量分解的初始化因子矩阵。
C33、设定收敛阈值εtoi,以
Figure BDA0002676073420000032
作为初始化矩阵,以J1、J2、J3作为核张量大小,计算核张量
Figure BDA0002676073420000033
C34、计算误差
Figure BDA0002676073420000034
判断
Figure BDA0002676073420000035
是否小于阈值εtoi,否的话采用最小二乘ALS计算因子矩阵
Figure BDA0002676073420000036
Figure BDA0002676073420000037
和核张量
Figure BDA0002676073420000038
重复判断直至收敛。
步骤c4的过程包括:
c41、对因子矩阵
Figure BDA0002676073420000039
按照列进行了归一化处理得到A(1)',其中元素值为
Figure BDA00026760734200000310
c42、A(1)'每一列代表一个空间组团,元素值
Figure BDA00026760734200000311
代表小区i从属于组团j的概率值。
本发明的有益效果:相比传统的城市组团识别方法,本发明基于实际居民出行需求,从数据角度客观量化各组团分布的从属概率分布,更能体现组团识别准确性。
附图说明
图1计算过程流程图;
图2出行OD的张量构建示意图;
图3本发明的方法计算结果示意图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而非全部实施方式。基于本发明中的实施方式,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
以某城市的基于手机信令获取的居民出行数据为例,应用本方法识别城市组团,见图1。
步骤1:结合交通小区划分对居民出行OD数据预处理。
(1)对居民出行数据进行预处理,整理成如下格式
Figure BDA0002676073420000041
(2)结合交通小区划分情况,通过gis处理获取居民出行的O点和D点所分别对应的交通小区,整理成如下格式:
Figure BDA0002676073420000042
步骤2:构建居民出行OD张量,见图2;
(1)将采集到的居民出行OD表进行整合:针对分析区域的71个交通小区,依据上表按照时段划分提取得到每个时段的OD表。
(2)选择一周早晚高峰共14个时段数的OD表,按照时间顺序排列OD表,得到居民出行的三维张量
Figure BDA0002676073420000051
步骤3:基于张量分解算法对出行OD张量进行分解,得到因子矩阵;
(1)将三维张量按照不同维度进行张量矩阵化,得到3个矩阵,即M(1),M(2),M(3)
(2)指定J1、J2、J3分别为8、8、5,对M(1),M(2),M(3)进行非负矩阵分解,得到矩阵
Figure BDA0002676073420000052
作为张量分解的初始化因子矩阵。
(3)设定收敛阈值εtoi=0.001,以
Figure BDA0002676073420000053
作为初始化矩阵,以J1、J2、J3作为核张量大小,计算核张量
Figure BDA0002676073420000054
(4)计算误差
Figure BDA0002676073420000055
判断
Figure BDA0002676073420000056
是否小于阈值εtoi,否的话采用最小二乘ALS计算因子矩阵
Figure BDA0002676073420000057
Figure BDA0002676073420000058
和核张量
Figure BDA0002676073420000059
重复判断直至收敛。
步骤4:对因子矩阵处理,计算得到城市组团概率分布。
(1)对因子矩阵的元素值
Figure BDA00026760734200000510
的每一列的值进行了归一化处理。
(2)每一列代表一个空间组团,列的值代表属于该组团的概率值。具体结果见附图3。
Figure BDA00026760734200000511
Figure BDA0002676073420000061
由结果可知,本发明可清晰识别出城市各组团分布以及每个交通小区从属组团的概率。

Claims (5)

1.一种基于张量分解的城市组团识别方法,其特征在于该方法包括以下步骤:
c1、结合交通小区划分对居民出行OD数据预处理;
c2、构建居民出行OD张量;
c3、基于张量分解算法对出行OD张量进行分解,得到因子矩阵;
c4、对因子矩阵归一化处理,计算得到城市组团概率分布。
2.根据权利要求1所述的一种基于张量分解的城市组团识别方法,其特征在于:步骤c1中,将居民出行数据整合成一定格式,结合交通小区划分情况,通过gis处理获取居民出行的O点和D点所分别对应的交通小区:
c11、对居民出行数据进行预处理,整理成一次表格形式,表格内容包括O点地点、D点地点和OD对人数,其中所述的地点为经纬度、交叉口或居民小区;
c12、结合交通小区划分情况,通过gis处理获取居民出行的O点和D点所分别对应的交通小区,整理成二次表格形式,表格内容包括O点地点、O点所属交通小区编号、D点地点、D点所属交通小区编号和OD对人数。
3.根据权利要求1所述的一种基于张量分解的城市组团识别方法,其特征在于:步骤c2中,构建居民出行OD张量,具体过程包括:
c21、将采集到的二次表格进行整合:针对分析区域的I1个交通小区,依据上表按照时段划分提取得到每个时段的OD表,维度为I1×I2,其中I1=I2
c22、选择I3个时段数的OD表,按照时间顺序排列OD表,得到居民出行张量
Figure FDA0002676073410000021
4.根据权利要求1所述的一种基于张量分解的城市组团识别方法,其特征在于:步骤c3中基于张量分解算法对出行OD张量进行分解,得到因子矩阵,具体过程包括:
C31、将三维张量按照不同维度进行张量矩阵化,得到3个矩阵,即M(1),M(2),M(3)
C32、对于指定的J1、J2、J3,对M(1),M(2),M(3)进行非负矩阵分解,得到矩阵
Figure FDA0002676073410000022
作为张量分解的初始化因子矩阵;
C33、设定收敛阈值εtoi,以
Figure FDA0002676073410000023
作为初始化矩阵,以J1、J2、J3作为核张量大小,计算核张量
Figure FDA0002676073410000024
C34、计算误差
Figure FDA0002676073410000025
判断
Figure FDA0002676073410000026
是否小于阈值εtoi,否的话采用最小二乘ALS计算因子矩阵
Figure FDA0002676073410000027
Figure FDA0002676073410000028
和核张量
Figure FDA0002676073410000029
重复判断直至收敛。
5.根据权利要求1所述的一种基于张量分解的城市组团识别方法,其特征在于:步骤的c4中,对因子矩阵归一化处理,计算得到城市组团概率分布,具体过程包括:
c41、对因子矩阵
Figure FDA00026760734100000210
按照列进行了归一化处理得到A(1)',其中元素值为
Figure FDA00026760734100000211
c42、A(1)'每一列代表一个空间组团,元素值
Figure FDA00026760734100000212
代表小区i从属于组团j的概率值。
CN202010948416.1A 2020-09-10 2020-09-10 一种基于张量分解的城市组团识别方法 Pending CN112200705A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010948416.1A CN112200705A (zh) 2020-09-10 2020-09-10 一种基于张量分解的城市组团识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010948416.1A CN112200705A (zh) 2020-09-10 2020-09-10 一种基于张量分解的城市组团识别方法

Publications (1)

Publication Number Publication Date
CN112200705A true CN112200705A (zh) 2021-01-08

Family

ID=74015616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010948416.1A Pending CN112200705A (zh) 2020-09-10 2020-09-10 一种基于张量分解的城市组团识别方法

Country Status (1)

Country Link
CN (1) CN112200705A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018195244A (ja) * 2017-05-22 2018-12-06 日本電信電話株式会社 Odトラヒック予測装置、方法、及びプログラム
CN110428614A (zh) * 2019-07-11 2019-11-08 银江股份有限公司 一种基于非负张量分解的交通拥堵热度时空预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018195244A (ja) * 2017-05-22 2018-12-06 日本電信電話株式会社 Odトラヒック予測装置、方法、及びプログラム
CN110428614A (zh) * 2019-07-11 2019-11-08 银江股份有限公司 一种基于非负张量分解的交通拥堵热度时空预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蔡正义: "基于大数据的城市居民出行分析建模", 中国博士学位论文全文数据库信息科技辑, no. 12 *

Similar Documents

Publication Publication Date Title
CN109978249B (zh) 基于分区建模的人口数据空间化方法、系统及介质
CN110298553A (zh) 一种基于gis的国土空间规划方法、系统和设备
CN106503714B (zh) 一种基于兴趣点数据识别城市功能区的方法
CN110348506B (zh) 基于遥感图像的土地利用分类方法、存储介质和计算设备
CN107526786A (zh) 基于多源数据的地名地址数据整合的方法和系统
CN109684428A (zh) 空间数据建设方法、装置、设备及存储介质
CN109189917B (zh) 一种融合景观和社会特征的城市功能区划分方法及系统
CN109359162B (zh) 一种基于gis的学校选址方法
Guan et al. The concept of urban intensity and China's townization policy: Cases from Zhejiang Province
AU2021435561A1 (en) Big data-based commercial space quality evaluation method and system, device, and medium
CN105913347A (zh) 一种面向住房信息采集的房屋编码方法
CN102646164A (zh) 一种结合空间滤波的土地利用变化建模方法及其系统
CN110633895A (zh) 一种基于地理信息的特色小镇评价方法
CN114969007A (zh) 一种基于功能混合度和集成学习的城市功能区识别方法
CN110263109A (zh) 一种融合互联网信息及gis技术的家庭户数估算方法
CN114004524A (zh) 一种考虑空间约束条件的学区划分方法
CN115238584A (zh) 一种基于多源大数据的人口分布识别方法
CN112000755A (zh) 一种基于手机信令数据的区域出行廊道识别方法
CN116796904A (zh) 一种轨道交通新线客流预测方法、系统、电子设备及介质
CN111798032A (zh) 支撑国土空间规划双评价的精细化网格评价方法
CN111432417A (zh) 一种基于手机信令数据的体育中心选址方法
CN112200705A (zh) 一种基于张量分解的城市组团识别方法
CN112053076A (zh) 一种基于大数据的宜居城市评价方法和系统
CN116013084A (zh) 交通管控场景确定方法、装置、电子设备及存储介质
CN110852547A (zh) 一种基于位置数据和聚类算法的公共服务设施分级方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination