CN112559909B - 一种基于gcn嵌入空间聚类模型的商业区发现方法 - Google Patents

一种基于gcn嵌入空间聚类模型的商业区发现方法 Download PDF

Info

Publication number
CN112559909B
CN112559909B CN202011499260.XA CN202011499260A CN112559909B CN 112559909 B CN112559909 B CN 112559909B CN 202011499260 A CN202011499260 A CN 202011499260A CN 112559909 B CN112559909 B CN 112559909B
Authority
CN
China
Prior art keywords
data
regions
gcn
clustering
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011499260.XA
Other languages
English (en)
Other versions
CN112559909A (zh
Inventor
沈国江
赵振振
孔祥杰
刘娜利
刘志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202011499260.XA priority Critical patent/CN112559909B/zh
Publication of CN112559909A publication Critical patent/CN112559909A/zh
Application granted granted Critical
Publication of CN112559909B publication Critical patent/CN112559909B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • G06Q30/0205Location or geographical consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0645Rental transactions; Leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

一种基于GCN嵌入空间聚类模型的商业区发现方法,包括:1)数据收集:综合考虑多种数据来源,包括地理数据、路网数据和出租车轨迹数据等,经过筛选提取预处理以后,得到实验所需的数据;2)特征提取:应用皮尔逊相关系数分析地区之间的相似性,构造图卷积神经网络所需的边特征和节点特征;3)嵌入空间聚类:在发现城市中的功能区时,综合考虑地理相似性和人类移动性,本发明在图卷积神经网络的嵌入空间使用层次聚类算法;4)候选地区标识:本发明采用高斯核密度估计对地区进行功能评估,结合聚类所得结果,最终确认待选商业区,对于处理类似问题具有出色表现。

Description

一种基于GCN嵌入空间聚类模型的商业区发现方法
技术领域
本发明涉及数据挖掘领域,尤其是一种发现城市的商业功能区域、规划城市商业区建设的方法。
背景技术
随着经济和信息技术的快速发展,人们不断提高的现代化生活,带来了交通拥堵、环境污染和资源分配等问题,以前因为城市的复杂设置导致想要解决这些问题有些棘手。如今,由于各种传感器技术和云计算服务的成熟,我们拥有了交通流量、出租车轨迹数据、地理等多种大数据,这些城市异构大数据为解决这些问题提供了新的可能和思路。利用城市大数据和城市计算为城市管理者和规划者提供有价值的信息参考,提升交通管控能力、服务效率,改善城市中不合理的规划,可以处理城市发展中遇到的问题和挑战。同时,分布式平台和云计算的建设和发展也在技术上使我们具备了处理这些大规模异构数据的能力。
数据挖掘是结合人工智能、机器学习、模式识别、统计学、数据库等多种技术,从大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的过程。现在存在着大量数据,可以广泛使用,迫切需要将这些数据转换为有用的信息和知识用以指导城市规划、市场分析和科学探索等各个领域。
一个成熟的商业区在城市文化和经济发展中起着重要的作用,它直接决定了城市的发展水平。大城市的消费能力高于平均水平,他们希望城市能提供令人满意的服务。然而,在城市的什么地方建立商业区是一个棘手的问题,商业区往往需要具有交通便利和高人气的特点。传统上,商家会对候选地区的周边设施进行调查,并根据他们的经验来判断它是否能成为一个成熟的商业中心。这项任务非常费时费力。随着工业技术的发展,许多数据传感器在一个城市播放,所有的出租车几乎都配备一个GPS设备,它可以反映出租车的位置,以GPS序列的方式描述出租车在城市中的运行情况,从侧面反映出人们的在城市中的出行需求。另外,成熟的地理信息系统(GIS)会告诉我们城市中的路网的道路结构和兴趣点(POI)的分布情况。这些城市异构数据描述了一个城市如何运作,我们可以运用数据挖掘的方法,分析出城市中的重要功能区域,这将为解决商业区发现问题带来新的机遇。
发明内容
本发明要克服现有技术的上述缺点,提供一种基于GCN嵌入空间聚类模型的商业区发现方法。
本发明运用数据挖掘的方法揭示城市中的商业区域。挖掘商业区这一城市重要的特殊区域的功能,可以了解城市功能区的分布,把握城市的发展规律,进而为资源配置、商业区建设等城市规划提供宝贵的参考,对建设智慧城市具有重要的实际意义。
本发明是通过以下技术方案达到上述目的:一种基于GCN嵌入空间聚类模型的商业区发现方法,包括如下步骤:
(1)对多源异构城市数据,如路网数据、地理因素数据和出租车轨迹数据进行预处理,保证数据的正确性;
(2)以表征任意两个地区地理相似性的矩阵和表征地区受欢迎程度的出租车轨迹点分布矩阵为输入,应用GCN模型挖掘地区的特征;
(3)联合步骤(2)所得的特征,利用层次聚类算法对不同行为模式下的地区进行伪标签定义;
(4)联合步骤(3)所得伪标签定义,利用高斯核密度估计算法对地区进行功能估计,最终确定合适的商业区。
进一步,所述步骤(1)具体包括如下步骤:
1a).出租车轨迹数据的清洗,如缺失值、噪声数据的清除,以及出租车数据的规范化处理。
1b).原始路网数据的清洗,如将具有共同路口的两个不同方向的车道看作一条道路,以及对路网数据的规范化处理。
1c).地理数据的统计,统计地区范围内的一些常用兴趣点,如购物点、公司、小区、地铁和公交的数量,用以表征地理相似性。
1d).区域的划分,基于清洗的路网数据,将城市划分为多个地区单元。
进一步,所述步骤(2)具体包括如下步骤:
2a).按照时间段统计步骤(1)中所得到出租车轨迹数据,构造图卷积神经网络(GCN)所需要的节点特征,最终得到表征地区受欢迎程度的出租车轨迹点分布矩阵X。
2b).按照步骤(1)中所得到的地理数据,采用皮尔逊相关系数计算地理相似性,对于任意两个地区的地理特征向量U、V,计算公式如下:
Figure GDA0003565848800000021
其中
Figure GDA0003565848800000022
表示特征向量的平均值。最终得到表征任意两个地区地理相似性的矩阵A。
进一步,所述步骤(3)具体包括如下步骤:
3a).行为模式划分,人们在不同的日子里采取不同的活动模式,根据节假日和工作日将出租车轨迹数据分为两类。
3b).结合步骤(2)所得到的边特征与节点特征,对不同的行为模式利用GCN模型进行特征表示,图结构数据上的快速卷积公式如下:
Figure GDA0003565848800000031
其中
Figure GDA0003565848800000032
IN表示单位矩阵,D是度矩阵D=∑jAij,λmax是Lsys矩阵的最大特征值,Tk(·)表示k阶切比雪夫多项式。θ表示切比雪夫系数的向量。同时利用神经网络进行参数向量进行优化,本发明采用两层图卷积神经网络进行特征提取。公式如下:
f(A,X)=(gθH0W1+b1+H0)*σ(gθH0W1+b1) (3)
其中H0=Relu(gθXW0+b0+X)表示带有残差结构的第一层神经网络输出,gθ的常数项可以计算得到,待优化的参数项由神经网络参数进行优化,最后我们可以得到在嵌入空间中的聚合多个节点后生成的新的节点表示向量。
3c).在提取特征之后,采用层次聚类算法来挖掘地区的潜在商业指数,定义聚类的规则为样本之间的相关系数,具体包括如下步骤:
A:依照最优实验结果设置层次聚类的阈值,对于任意两个地区,计算相关系数公式如下:
Figure GDA0003565848800000033
B:根据相似度从强到弱连接对应节点对,并形成树状图,以阈值分割所得到的簇,最终得到所有的聚类结果。
3d).对不同行为模式下的聚类结果取交集。
进一步,所述步骤(4)具体包括如下步骤:
4a).商业区估计,对整个路网区域进行全局细粒度的购物中心功能估计,采用高斯核密度方法进行估计,对于给定的多个二维数据点,核密度通过一个核估计器来计算地区强度,公式如下:
Figure GDA0003565848800000041
其中h是带宽,K(·)是指高斯核函数,公式如下:
Figure GDA0003565848800000042
4b).簇内功能强度计算,通过细粒度的高斯核密度估计,我们可以得到每一个地区的核密度分数,然后计算不同簇内功能强度的平均值,最终我们可以得到聚类伪标签结果的高斯核密度估计分数值。
4c).语义标签,为了更好的理解伪标签的结果,我们结合出租车轨迹点和簇内的功能强度,将商业区候选地区主要分为三部分:
S1.具有高数量出租车轨迹点但购物中心密度小的地区,这种区域属于要达到目的地必须经过的道路,可以认为是重要的道路区域。
S2.具有高数量出租车轨迹点但购物中心密度中的地区,这种区域属于发展中的商业区,可以认为是适合建造成熟商业区的地区。
S3.具有高数量出租车轨迹点同时购物中心密度大的地区,这种区域属于已经发展成熟的商业区。
最终,得到候选的商业地区的语义标签,用于指导城市中商业区的建设和规划。
本发明的创新之处在于:
(1)首次将GCN模型应用到城市商业区发现的场景中,并将数据按照不同行为模式进行分类。
(2)首次提出GCN嵌入空间下的层次聚类方法。
(3)从三个方面进行分析,对候选商业区进行语义标签的标识。
本发明的优点是:
(1)不过分依赖于标签数据,利用无监督学习的方式挖掘人们不同的行为模式来发现潜在的商业区。
(2)同时考虑人类的移动性和地理相似性两种因素,并通过GCN嵌入空间下的层次聚类方法挖掘隐藏在人们行为模式中的共识。
附图说明
图1是本发明的整体流程图。
图2是本发明所使用的GCN嵌入空间模型流程图。
图3是本发明所使用的高斯核密度估计地区功能结果图。
图4是本发明所使用的高斯核密度估计地区功能热力图。
图5a~图5b是本发明用于说明城市人口流动性重要性的结果图,其中图5a是云栖小镇2017年10月4日出租车轨迹数据热力图,图5b是云栖小镇2017年10月11日出租车轨迹数据热力图。
图6是本发明实例中单独成类的重要道路区域。
图7是本发明实例中单独成类的发展成熟的商业区域。
图8是本发明实例中单独成类的正在发展中的商业区域。
具体实施方式
下面结合杭州市萧山区商业区发现实例对本发明进行进一步描述。
本实例中的商业区发现方法整体框架如图1所示,具体包括以下步骤:
(1)从杭州出租车公司获取出租车轨迹数据,同时从北京捷泰天域信息技术有限公司获取POI和路网信息,然后对数据进行筛选和预处理,按照路网数据将萧山区部分地区划分为n个区域。本发明所用到的数据集统计如下:
Figure GDA0003565848800000051
(2)使用预处理好的数据,获得表征任意两个地区地理相似性的矩阵和表征地区受欢迎程度的出租车轨迹点分布矩阵,具体包括如下步骤:
a).地理相似性的矩阵:
将地区中所有的医院、居民区、公司、餐馆、学校、购物中心和休闲场所的数量作为一个向量的不同维度,然后使用正态分布标准化对数据进行规范化处理。对于任意两个表征地区地理信息的向量U、V,使用皮尔逊相关系数进行关联性分析,计算公式如下:
Figure GDA0003565848800000061
两个地区的地理特征越相似,皮尔逊相关系数越大,它们就越可能是同一种功能区域,最终得到表征任意两个地区地理相似性A,大小为n×n的矩阵。
b).出租车轨迹点分布矩阵:
出租车轨迹数据由很多字段组成,能够很好的表示出租车的运行状态、出租车的位置以及出租车的运行速度等等。本发明采用表征出租车轨迹序列的三元组进行表示,即经度Lng,维度Lat和时间戳TimpStamp。每一辆出租车都由这个三元组序列组成。
为减缓数据稀疏带来的影响,我们每隔一个小时,统计经过每个地区的出租车数量,因为人们不太可能做出租车去自己不想去的地方,所以出租车的轨迹可以看作人们在城市中出行需求的一种表现。同样对得到的数据进行规范化处理,最终得到表征人们出行需求的出租车轨迹点分布矩阵X。
(3)在构建节点特征和边特征以后,需要采用GCN模型通过边特征对节点特征进行聚合,并生成新的节点表示。所采用的两层GCN模型,公式如下:
f(A,X)=(gθH0W1+b1+H0)*σ(gθH0W1+b1) (3)
其中H0=Relu(gθXW0+b0+X)表示带有残差结构的第一层神经网络输出,gθ的常数项可以计算得到,待优化的参数想由神经网络参数进行优化,最后我们可以得到在嵌入空间中的聚合多个节点后生成的新的节点表示向量。
经过GCN模型生成的新的节点表示将地区之间的地理相似性和人们的不同行为模式结合在一起,再对其使用层次聚类算法,可以更好地区分地区的不同功能。
(4)在GCN提取特征之后,采用层次聚类算法来挖掘地区的潜在商业指数,定义聚类的规则为样本之间的相关系数,具体过程如下:
A:依照最优实验结果设置层次聚类的阈值,对于任意两个地区,计算相关系数公式如下:
Figure GDA0003565848800000062
B:根据相似度从强到弱连接对应节点对,并形成树状图,以阈值分割所得到的簇,最终得到所有的聚类结果。对不同行为模式下的聚类结果取交集。最终得到聚类结果,每个簇内都具有极大的相关性。
(5)为候选地区簇添加语义标签,具体包括以下几个角度:
a).商业区估计,对整个路网区域进行全局细粒度的购物中心功能估计并进行可视化,如图3所示,采用高斯核密度方法进行估计,对于给定的多个二维数据点,核密度通过一个核估计器来计算地区强度,公式如下:
Figure GDA0003565848800000071
其中h是带宽,K(·)是指高斯核函数,公式如下:
Figure GDA0003565848800000072
b).簇内功能强度计算,通过细粒度的高斯核密度估计,我们可以得到每一个地区的核密度分数,然后计算不同簇内功能强度的平均值,最终我们可以得到聚类伪标签结果的高斯核密度估计分数值。
c).语义标签,我们结合出租车轨迹点和簇内的功能强度,城市中有低数量的出租车轨迹点和低功能强度的地区,这类地方大多数据待开发地区,是不适合作为商业区的,所以在排除这些地区后,本发明将商业区候选地区主要分为三部分并将结果进行可视化。
一种是具有高数量出租车轨迹点但购物中心密度小的地区,这种区域属于要达到目的地必须经过的道路,可以认为是重要的道路区域,如图6所示。
另外一种是具有高数量出租车轨迹点但购物中心密度中的地区,这种区域属于正在发展中的商业区,可以认为是适合建造成熟商业区的地区,如图8所示。
最后一种是具有高数量出租车轨迹点同时购物中心密度大的地区,这种区域属于已经发展成熟的商业区,如图7所示。

Claims (4)

1.一种基于GCN嵌入空间聚类模型的商业区发现方法,包括如下步骤:
(1)对多源异构城市数据进行预处理,多源异构城市数据包括路网数据、地理因素数据和出租车轨迹数据,保证数据的正确性;
(2)以表征任意两个地区地理相似性的矩阵和表征地区受欢迎程度的出租车轨迹点分布矩阵为输入,应用GCN模型挖掘地区的特征;
(3)联合步骤(2)所得的特征,利用层次聚类算法对不同行为模式下的地区进行伪标签定义;具体包括如下步骤:
3a).行为模式划分,人们在不同的日子里采取不同的活动模式,根据节假日和工作日将出租车轨迹数据分为两类;
3b).结合步骤(2)所得到的边特征与节点特征,对不同的行为模式利用GCN模型进行特征表示,图结构数据上的快速卷积公式如下:
Figure FDA0003565848790000011
其中
Figure FDA0003565848790000012
IN表示单位矩阵,D是度矩阵D=∑jAij,λmax是Lsys矩阵的最大特征值,Tk(·)表示k阶切比雪夫多项式;θ表示切比雪夫系数的向量;同时利用神经网络进行参数向量进行优化,采用两层图卷积神经网络进行特征提取;公式如下:
f(A,X)=(gθH0W1+b1+H0)*σ(gθH0W1+b1) (3)
其中H0=Relu(gθXW0+b0+X)表示带有残差结构的第一层神经网络输出,gθ的常数项可以计算得到,待优化的参数项由神经网络参数进行优化,最后得到在嵌入空间中的聚合多个节点后生成的新的节点表示向量;
3c).在提取特征之后,采用层次聚类算法来挖掘地区的潜在商业指数,定义聚类的规则为样本之间的相关系数,具体包括如下步骤:
A:依照最优实验结果设置层次聚类的阈值,对于任意两个地区,计算相关系数公式如下:
Figure FDA0003565848790000013
B:根据相似度从强到弱连接对应节点对,并形成树状图,以阈值分割所得到的簇,最终得到所有的聚类结果;
3d).对不同行为模式下的聚类结果取交集;
(4)联合步骤(3)所得伪标签定义,利用高斯核密度估计算法对地区进行功能估计,最终确定合适的商业区。
2.根据权利要求1所述的一种基于GCN嵌入空间聚类模型的商业区发现方法,其特征在于:所述步骤(1)具体包括如下步骤:
1a).出租车轨迹数据的清洗,清除缺失值、噪声数据,以及出租车数据的规范化处理;
1b).原始路网数据的清洗,将具有共同路口的两个不同方向的车道看作一条道路,以及对路网数据的规范化处理;
1c).地理数据的统计,统计地区范围内的常用兴趣点的数量,用以表征地理相似性;
1d).区域的划分,基于清洗的路网数据,将城市划分为多个地区单元。
3.根据权利要求1所述的一种基于GCN嵌入空间聚类模型的商业区发现方法,其特征在于:所述步骤(2)具体包括如下步骤:
2a).按照时间段统计步骤(1)中所得到出租车轨迹数据,构造图卷积神经网络(GCN)所需要的节点特征,最终得到表征地区受欢迎程度的出租车轨迹点分布矩阵X;
2b).按照步骤(1)中所得到的地理因素数据,采用皮尔逊相关系数计算地理相似性,对于任意两个地区的地理特征向量U、V,计算公式如下:
Figure FDA0003565848790000021
其中
Figure FDA0003565848790000022
表示特征向量的平均值;最终得到表征任意两个地区地理相似性的矩阵A。
4.根据权利要求1所述的一种基于GCN嵌入空间聚类模型的商业区发现方法,其特征在于:所述步骤(4)具体包括如下步骤:
4a).商业区估计,对整个路网区域进行全局细粒度的购物中心功能估计,采用高斯核密度方法进行估计,对于给定的多个二维数据点,核密度通过一个核估计器来计算地区强度,公式如下:
Figure FDA0003565848790000023
其中h是带宽,K(·)是指高斯核函数,公式如下:
Figure FDA0003565848790000031
4b).簇内功能强度计算,通过细粒度的高斯核密度估计,我们可以得到每一个地区的核密度分数,然后计算不同簇内功能强度的平均值,最终我们可以得到聚类伪标签结果的高斯核密度估计分数值;
4c).语义标签,为了更好的理解伪标签的结果,结合出租车轨迹点和簇内的功能强度,将商业区候选地区分为三部分:
S1.具有高数量出租车轨迹点但购物中心密度小的地区,这种区域属于要达到目的地必须经过的道路,可以认为是重要的道路区域;
S2.具有高数量出租车轨迹点但购物中心密度中的地区,这种区域属于发展中的商业区,可以认为是适合建造成熟商业区的地区;
S3.具有高数量出租车轨迹点同时购物中心密度大的地区,这种区域属于已经发展成熟的商业区;
最终,得到候选的商业地区的语义标签,用于指导城市中商业区的建设和规划。
CN202011499260.XA 2020-12-18 2020-12-18 一种基于gcn嵌入空间聚类模型的商业区发现方法 Active CN112559909B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011499260.XA CN112559909B (zh) 2020-12-18 2020-12-18 一种基于gcn嵌入空间聚类模型的商业区发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011499260.XA CN112559909B (zh) 2020-12-18 2020-12-18 一种基于gcn嵌入空间聚类模型的商业区发现方法

Publications (2)

Publication Number Publication Date
CN112559909A CN112559909A (zh) 2021-03-26
CN112559909B true CN112559909B (zh) 2022-06-21

Family

ID=75063298

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011499260.XA Active CN112559909B (zh) 2020-12-18 2020-12-18 一种基于gcn嵌入空间聚类模型的商业区发现方法

Country Status (1)

Country Link
CN (1) CN112559909B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116756695B (zh) * 2023-06-27 2024-05-31 深圳技术大学 一种融合地理特征和流特征的城市功能协同优化方法
CN117036939A (zh) * 2023-08-07 2023-11-10 宁波大学 一种基于图卷积网络的多源数据协同的城市功能区识别方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4235908B2 (ja) * 2004-01-15 2009-03-11 独立行政法人理化学研究所 クロマチン再編成因子の機能改変による相同組換えの制御方法
CN110298500B (zh) * 2019-06-19 2022-11-08 大连理工大学 一种基于出租车数据和城市路网的城市交通轨迹数据集生成方法
CN111612206B (zh) * 2020-03-30 2022-09-02 清华大学 一种基于时空图卷积神经网络的街区人流预测方法及系统
CN111651502B (zh) * 2020-06-01 2021-09-14 中南大学 一种基于多子空间模型的城市功能区识别方法

Also Published As

Publication number Publication date
CN112559909A (zh) 2021-03-26

Similar Documents

Publication Publication Date Title
CN108629978B (zh) 一种基于高维路网和循环神经网络的交通轨迹预测方法
WO2018214675A1 (zh) 一种量化分析城市建成环境对道路行程时间影响的方法
Kumar et al. Fast and scalable big data trajectory clustering for understanding urban mobility
Casali et al. A topological analysis of growth in the Zurich road network
CN107656987B (zh) 一种基于lda模型的地铁站点功能挖掘方法
US20160125307A1 (en) Air quality inference using multiple data sources
An et al. How the built environment promotes public transportation in Wuhan: A multiscale geographically weighted regression analysis
CN110555544B (zh) 一种基于gps导航数据的交通需求估计方法
CN108427965A (zh) 一种基于路网聚类的热点区域挖掘方法
Zhao et al. Identification of land-use characteristics using bicycle sharing data: A deep learning approach
CN107481511A (zh) 一种计算候选公交站点的方法及系统
CN113806419B (zh) 基于时空大数据的城市区域功能识别模型及识别方法
CN112559909B (zh) 一种基于gcn嵌入空间聚类模型的商业区发现方法
CN111814596B (zh) 一种遥感影像与出租车轨迹融合的自动城市功能分区方法
Zou et al. Estimation of travel time based on ensemble method with multi-modality perspective urban big data
Priambodo et al. Predicting traffic flow propagation based on congestion at neighbouring roads using hidden Markov model
Sun et al. Road network metric learning for estimated time of arrival
Ma et al. An interpretable analytic framework of the relationship between carsharing station development patterns and built environment for sustainable urban transportation
CN114723596A (zh) 一种基于多源交通出行数据和主题模型的城市功能区识别方法
CN113159371B (zh) 基于跨模态数据融合的未知目标特征建模与需求预测方法
Wu et al. A flood-discharge-based spatio-temporal diffusion method for multi-target traffic hotness construction from trajectory data
Bing et al. Integrating semantic zoning information with the prediction of road link speed based on taxi GPS data
CN109508749A (zh) 一种基于深度知识表达的聚类分析系统及方法
Li et al. Personalized travel time prediction using a small number of probe vehicles
Batista et al. On the partitioning of urban networks for MFD-based applications using Gaussian Mixture Models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant