CN115408452B - 一种城市设施关联模式挖掘方法及相关设备 - Google Patents
一种城市设施关联模式挖掘方法及相关设备 Download PDFInfo
- Publication number
- CN115408452B CN115408452B CN202211358979.0A CN202211358979A CN115408452B CN 115408452 B CN115408452 B CN 115408452B CN 202211358979 A CN202211358979 A CN 202211358979A CN 115408452 B CN115408452 B CN 115408452B
- Authority
- CN
- China
- Prior art keywords
- urban
- facility
- point data
- road
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005065 mining Methods 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims abstract description 35
- 239000013598 vector Substances 0.000 claims abstract description 72
- 238000012546 transfer Methods 0.000 claims abstract description 48
- 239000011159 matrix material Substances 0.000 claims abstract description 47
- 230000000694 effects Effects 0.000 claims abstract description 23
- 238000012512 characterization method Methods 0.000 claims abstract description 21
- 238000005295 random walk Methods 0.000 claims abstract description 13
- 238000010586 diagram Methods 0.000 claims abstract description 12
- 230000000007 visual effect Effects 0.000 claims abstract description 7
- 238000004590 computer program Methods 0.000 claims description 12
- 239000000126 substance Substances 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241001235534 Graphis <ascomycete fungus> Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 235000021185 dessert Nutrition 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
- Y02A30/60—Planning or developing urban green infrastructure
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Fuzzy Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Remote Sensing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种城市设施关联模式挖掘方法及相关设备,方法包括:基于城市道路交叉口划分城市路网;收集轨迹点数据,并将轨迹点数据与城市路网进行匹配;收集城市设施点数据,并将城市设施点数据与城市路网进行匹配,得到城市设施点数据匹配结果;根据轨迹点数据和城市设施点数据匹配结果,计算人群移动层转移矩阵与人群访问层转移矩阵;通过人群移动层转移矩阵与人群访问层转移矩阵,构建人类活动视角下的城市设施关系图;在城市设施关系图中进行多次随机游走,生成多条游走序列;对多条游走序列中每个设施类别的向量表达进行学习,形成表征向量集;基于表征向量集计算向量间的余弦相似度,根据余弦相似度挖掘城市设施间的关联模式。
Description
技术领域
本发明涉及时空数据挖掘技术领域,特别涉及一种城市设施关联模式挖掘方法及相关设备。
背景技术
挖掘城市设施之间的复杂关联模式,对于理解城市结构与功能,帮助城市的合理规划布局具有重要的知识支撑作用。在小数据时代,出于数据获取便利性的限制,以及对城市功能结构运转模式的认知有偏性限制,研究者皮鞭基于纯空间的角度挖掘城市设施之间的关联模式。而在万物计算,信息互联的大数据时代下,随着智慧城市建设进程的加速,各类低成本、高实时的新型传感器大量接入城市环境,导致对人观测数据爆炸式增长。在丰富的数据支撑下,研究者开始意识到人类活动是驱动城市功能结构运转的内在核心推动力,如何从纯空间视觉拓展到人类活动约束下的空间视角,在大数据的加持下,智能化的挖掘城市设施间的复杂关联关系,对于进一步剖析城市功能及运作模式,提高城市管理及规划水平具有重要的科学意义。
传统对城市设施关联模式的挖掘大多基于空间同位模式挖掘方式,即通过设定相关距离阈值以划定城市设施的空间邻域,进而借用传统事务性关联规则挖掘的思路,通过计算参与率与参与度两个指标,与人设定的阈值相比较,来提取出城市设施间的同位模式,作为其关联关系。针对该方式,有研究者分别从时空异质性、统计显著性、计算效率等方面进行了相应的改进,但是耦合人类活动模式的城市设施挖掘方法仍然是一片空白。并且,现有挖掘方式存在参数过多、主观性较强、计算繁琐等缺陷无法适应于大数据时代下,复杂城市场景中的设施关联关系挖掘。
发明内容
本发明提供了一种城市设施关联模式挖掘方法及相关设备,其目的是为了解决现有挖掘方式无法有效耦合人类活动在内的外部驱动因素,导致挖掘结果的信息缺失问题。
为了达到上述目的,本发明提供了一种城市设施关联模式挖掘方法,包括:
步骤1,基于城市道路交叉口划分城市路网;
步骤2,收集轨迹点数据,并将轨迹点数据与城市路网进行匹配;
步骤3,收集城市设施点数据,并将城市设施点数据与城市路网进行匹配,得到城市设施点数据匹配结果;
步骤4,根据轨迹点数据和城市设施点数据匹配结果,计算人群移动层转移矩阵与人群访问层转移矩阵;
步骤5,通过人群移动层转移矩阵与人群访问层转移矩阵,构建人类活动视角下的城市设施关系图;
步骤6,在城市设施关系图中进行多次随机游走,生成多条游走序列;
步骤7,对多条游走序列中每个设施类别的向量表达进行学习,形成表征向量集;
步骤8,基于表征向量集计算向量间的余弦相似度,根据余弦相似度挖掘城市设施间的关联模式。
进一步来说,城市路网为
其中,表示城市路网中全部路段的集合,表示路段到路段的权重。
进一步来说,步骤2包括:
收集轨迹数据,轨迹数据包括多个轨迹点;
针对多个轨迹点中的每个轨迹点,计算轨迹点与每条路段的方位角的夹角余弦值;
判断夹角余弦值与预设的角度阈值的大小,将预设角度阈值大于夹角余弦值时的路段均加入轨迹点的保留路段集中;
计算轨迹点到保留路段集中每一条路段的距离并得到最小距离;
将最小距离与预设的距离阈值进行比较,若最小距离大于或等于预设的距离阈值,则将最小距离对应的路段作为轨迹点所匹配上的路段,并将最小距离对应的路段更新至轨迹点内。
进一步来说,步骤3包括:
收集城市设施点数据;
针对城市设施点数据中的每个设施点,计算设施点到城市路网中每一条路段的距离并得到最小距离;
将最小距离与预设的距离阈值进行比较,若最小距离小于或等于预设的距离阈值,则将最小距离对应的路段作为设施点所匹配上的路段,并将最小距离及与最小距离对应的路段更新至设施点内。
进一步来说,步骤4包括:
基于轨迹点数据,通过计算人群移动层转移矩阵;
基于城市设施点数据匹配结果,通过计算人群访问层转移矩阵;
其中,表示所有轨迹点从路段直接到达路段的次数,表示路段的总数量,表示所有轨迹点从路段直接到达路段的次数,,表示路段到设施点之间的距离,表示路段匹配到的设施点的总数量,表示路段到设施点之间的距离。
进一步来说,步骤7包括:
构建目标函数为
其中,为预设的游走序列个数的阈值,为预设的游走序列步数的阈值,为邻域参数,表示条件概率值,为游走序列中以路段为起点的第条序列的第个元素的向量,为游走序列中以路段为起点的第条序列的第个元素的向量;
对目标函数进行最大化,并选择与目标最大化时对应的向量构造城市设施向量表征集。
进一步来说,步骤8包括:
根据表征向量集,计算向量间的余弦相似度为
其中,为向量的长度,表示向量的第个分量,,为城市设施点数据的类别数;
根据余弦相似度,基于准则挖掘显著的设施间的关联模式;
定义显著关联模式集,表示第个元显著关联模式,,若,则将显著关联模式加入显著关联模式集中。
本发明还提供了一种城市设施关联模式挖掘装置,包括:
划分模块,用于基于城市道路交叉口划分城市路网;
轨迹点数据匹配模块,用于收集轨迹点数据,并将轨迹点数据与城市路网进行匹配;
城市设施点数据匹配模块,用于收集城市设施点数据,并将城市设施点数据与城市路网进行匹配,得到城市设施点数据匹配结果;
第一计算模块,用于根据轨迹点数据和城市设施点数据匹配结果,计算人群移动层转移矩阵与人群访问层转移矩阵;
关系图构建模块,用于通过人群移动层转移矩阵与人群访问层转移矩阵,构建人类活动视角下的城市设施关系图;
随机游走模块,用于在城市设施关系图中进行多次随机游走,生成多条游走序列;
学习模块,用于对多条游走序列中每个设施类别的向量表达进行学习,形成表征向量集;
第二计算模块,用于基于表征向量集计算向量间的余弦相似度,根据余弦相似度挖掘城市设施间的关联模式。
本发明还提供了一种计算机可读存储介质,用于存储计算机程序,通过执行计算机程序,用于实现上述的城市设施关联模式挖掘方法。
本发明还提供了一种城市设施关联模式挖掘设备,用于实现上述的城市设施关联模式挖掘方法,包括:
存储器和处理器;
存储器用于储存计算机程序;
处理器用于执行存储器存储的计算机程序。
本发明的上述方案有如下的有益效果:
本发明根据城市道路交叉口划分城市路网,将收集轨迹点数据与城市设施点数据与城市路网进行匹配,得到匹配结果,通过匹配结果计算人群移动层转移矩阵与人群访问层转移矩阵,从而构建人类活动视角下的城市设施关系图,来模拟人类活动于城市设时间的流动规律;在城市设施关系图中进行多次随机游走,生成多条游走序列,以表达人类活动在城市设施之间的转移及访问关系;对多条游走序列中每个设施类别的向量表达进行学习,形成表征向量集;通过计算向量间的余弦相似度,来度量城市设施间的关联强度,最终实现城市设施间关联模式的挖掘;解决现有挖掘方式无法有效耦合人类活动在内的外部驱动因素,导致挖掘结果的信息缺失问题。
本发明的其它有益效果将在随后的具体实施方式部分予以详细说明。
附图说明
图1为本发明实施例的流程示意图;
图2为本发明实施例中城市设施间关联强度矩阵图;
图3为本发明实施例中利用弦图对城市设施间关联强度的可视化结果。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是锁定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本发明实施例针对现有的问题,提供了一种城市设施关联模式挖掘方法及相关设备。
如图1所示,本发明的实施例提供了一种城市设施关联模式挖掘方法,包括:
步骤1,基于城市道路交叉口划分城市路网;
步骤2,收集轨迹点数据,并将轨迹点数据与城市路网进行匹配;
步骤3,收集城市设施点数据,并将城市设施点数据与城市路网进行匹配,得到城市设施点数据匹配结果;
步骤4,根据轨迹点数据和城市设施点数据匹配结果,计算人群移动层转移矩阵与人群访问层转移矩阵;
步骤5,通过人群移动层转移矩阵与人群访问层转移矩阵,构建人类活动视角下的城市设施关系图;
步骤6,在城市设施关系图中进行多次随机游走,生成多条游走序列;
步骤7,对多条游走序列中每个设施类别的向量表达进行学习,形成表征向量集;
步骤8,基于表征向量集计算向量间的余弦相似度,根据余弦相似度挖掘城市设施间的关联模式。
本发明实施例结合深圳市罗湖区与福田区672条路段构成的路网数据、2012年1月1日至2012年1月31日的全量网约车行程数据以及城市内包含了15种大类、116种中类的9276个城市设施点作为实际数据集,关联强度矩阵图如图2所示,其中图2的上方部分表示基于设施表征向量间的距离,进行聚类得到的聚类树,图2下方部分反应城市设施点与城市设施点间的关联强度,对本发明的实施过程进行说明。城市设施具体分类见下表1:
表 1
具体来说,步骤1包括:
基于道路交叉口划分城市路网,形成一个有向图,其中表示城市路网中全部672条路段的集合,每一条路段包含其两个端点的地理位置坐标信息,分别为与,表示路段到路段的权重,表示第条路段到第条路段之间被赋予了权重的边,表示路段的总数量。
具体来说,步骤2包括:
收集轨迹点数据,将轨迹点数据与城市路网进行匹配,采用的是基于方向-距离的匹配算法,具体步骤如下:
收集车辆GPS轨迹点数据;
其中,表示天数,,为每一天的轨迹,由若干个轨迹点所构成,表示轨迹的长度,,为其对应的车辆的车牌号,为地理位置坐标,为时间戳,为轨迹点的方位角。
对每一天的轨迹中的每个轨迹点,计算轨迹点与每条路段的方位角的夹角余弦值:
其中。
通过预设的角度阈值与进行判断,如果,则将路段加入轨迹点的保留路段集中,否则舍弃掉该路段。
对所有符合角度要求的路段,采用矢量法计算轨迹点到中每一条路段的距离,具体包括以下步骤:
对于每一条路段,基于需要计算距离的轨迹点,构建向量,向量,向量。
在此基础上,令C点为轨迹点在路段上的投影,进而,通过下式计算向量。
进而,可计算。
通过下式计算为:
基于此,通过下式计算轨迹点与路段的距离为:
基于轨迹点与中每一条路段的距离计算结果,将其中的最小距离与预先设定的距离阈值进行比较,如果,则将最小距离对应的路段作为该轨迹点所匹配上的路段,即。并基于更新该轨迹点的内容为,完成轨迹点与城市路网中路段的匹配。
具体来说,步骤3包括:
收集城市设施点数据,将城市设施点数据与城市路网进行匹配,得到城市设施点数据匹配结果。
采用的是基于距离的匹配算法,具体步骤如下:
收集城市设施点数据;
其中,表示的城市设施点数据的总个数,每一个城市设施点数据均包含其对应的地理位置位置坐标及其所属类别。
对城市设施点数据中的每一个设施点,采用矢量法计算其到路段中每一条路段的距离,具体步骤可参照步骤2中详细过程,将其中的轨迹点的地理坐标同步替换为的地理坐标即可。
选择设施点与所有的路段之间的最小距离,将最小距离与预设的距离阈值进行比较,如果,则将其最小距离对应的路段作为该设施点所匹配上的路段,其中。并基于和更新该设施点的内容为,完成了设施点与城市路网中路段的匹配。
具体来说,步骤4包括:
基于轨迹点数据,通过计算人群移动层转移矩阵;
基于城市设施点数据匹配结果,通过计算人群访问层转移矩阵;
其中表示所有轨迹点从路段直接到达路段的次数,表示路段的总数量,表示所有轨迹点从路段直接到达路段的次数,,表示路段到设施点之间的距离,表示路段匹配到的设施点的总数量,表示路段到设施点之间的距离。
具体来说,步骤5包括:
通过人群移动层转移矩阵与人群访问层转移矩阵,将城市设施点数据即POI数据在人类活动的视角下,构建城市设施关系图。其中,城市设施关系图的节点包括所有的路段及城市设施点,城市设施关系图的边及其权重由步骤5所计算的人群移动层转移矩阵、人群访问层转移矩阵构成,其中,表示图中路段与路段之间的权重,而表示图中路段与城市设施点之间的权重。
具体来说,步骤6包括:
基于城市设施关系图,设计一种随机游走策略,以生成若干条由城市设施点所构成的游走序列,以综合表达人类活动在城市设施之间的转移及访问关系。
具体步骤如下:
选择城市设施关系图中的一个路段类节点,作为游走的起始节点。
在人群访问层转移矩阵中,起始节点转移至各类城市设施点的概率,随机采样其时刻的游走目标,。并将放入以节点为起点的游走序列中。
在人群移动层转移矩阵中,起始节点转移至所有路段的概率,随机采样其时刻的游走节点。
重复前两个步骤,直到游走步数满足预设的游走步数阈值,即当时,生成了一条以节点为起点,长度为的游走序列。
重复上一步骤,直到生成以为起始节点的游走序列个数大于预设的游走序列个数阈值,最后形成条游走序列。
分别选择城市设施关系图中的其他路段类节点作为游走的起始节点,重复上述所有步骤,最终生成条游走序列,即。
具体来说,步骤7包括:
基于步骤6得到的游走序列,利用模型对每个设施类别的向量表达进行学习,形成表征向量集表示城市设施的类别数,表示向量的长度,具体步骤如下:
7.1)构建目标是函数
其中,为预设的游走序列个数的阈值,为预设的游走序列步数的阈值,为邻域参数,表示条件概率值,为游走序列中以路段为起点的第条序列的第个元素的向量,为游走序列中以路段为起点的第条序列的第个元素的向量。
基于优化器对目标函数进行最大化处理,并选择与目标最大化时对应的向量构造城市设施向量表征集。
具体来说,步骤8包括:
基于上述步骤7得到的表征向量集,计算向量间的余弦相似度,用于度量设施间的关联强度。
其中,表示向量的第个分量;对于多元设施间关联强度,同样是基于上式得来的。
具体地,对于元模式,在中间处分为前后两组向量集,分别对这两组向量集中的各向量分坐标求和取平均,得到两个平均向量
、 ,再将这两个向量放入上式中计算从而得到多元设施间的关联强度值。
根据设施间的余弦相似度,基于3σ准则挖掘显著的设施间的关联模式如下:
其中为余弦相似度的均值,为余弦相似度的标准差。
定义显著关联模式集
, 表示第个元显著关联模式,。如果,,则将模式加入集合中,完成城市设施间显著关联模式的挖掘。
具体对挖掘结果进行相应性的分析如下:
由表2可看出,在关联强度最高的二三四元关联模式中主要是由“餐饮服务”、“购物服务”、“生活服务”、“公司企业”四类组成;仅从单一的地理视角很难发现其内在规律,但其实这反应的就是城市中大多数人的生活轨迹,毕竟城市中绝大部分人都是需要上班的,从而会涉及到公司企业,而另外三个部分更是日常生活会涉及到的,“餐饮服务”、“购物服务”和“生活服务”共同组成了城市设施间的显著关联模式,也说明该结果较好的耦合了人类活动。
表 2
采用如图3所示的弦图,对二元设施间最为显著的关联模式的关联强度——(餐饮服务,购物服务)进行深入分析设施种类间的关联关系。在弦图中,每个结点代表了一类城市设施,每条弦连接了两类设施,弦的宽带则正好对应了这两类设施间的关联强度值。若设施间关联强度值越大,则在图中表现为这两类设施所连接的弦越粗。因此,可以发现——“超级市场”、“综合市场”与“甜品店”之间存在着强关联关系。
由上可知,本发明实施例根据城市道路交叉口划分城市路网,将收集轨迹点数据与城市设施点数据与城市路网进行匹配,得到匹配结果,通过匹配结果计算人群移动层转移矩阵与人群访问层转移矩阵,从而构建人类活动视角下的城市设施关系图,来模拟人类活动于城市设时间的流动规律;对城市设施关系图进行多层次随机游走,生成多条游走序列,以表达人类活动在城市设施之间的转移及访问关系;对多条游走序列中每个设施类别的向量表达进行学习,形成表征向量集;通过计算向量间的余弦相似度,来度量城市设施间的关联强度,最终实现城市设施间关联模式的挖掘;解决现有挖掘方式无法有效耦合人类活动在内的外部驱动因素,导致挖掘结果的信息缺失问题。
本发明实施例还提供了一种城市设施关联模式挖掘装置,包括:
划分模块,用于基于城市道路交叉口划分城市路网;
轨迹点数据匹配模块,用于收集轨迹点数据,并将轨迹点数据与城市路网进行匹配;
城市设施点数据匹配模块,用于收集城市设施点数据,并将城市设施点数据与城市路网进行匹配,得到城市设施点数据匹配结果;
第一计算模块,用于根据轨迹点数据和城市设施点数据匹配结果,计算人群移动层转移矩阵与人群访问层转移矩阵;
关系图构建模块,用于通过人群移动层转移矩阵与人群访问层转移矩阵,构建人类活动视角下的城市设施关系图;
随机游走模块,用于在城市设施关系图中进行多次随机游走,生成多条游走序列;
学习模块,用于对多条游走序列中每个设施类别的向量表达进行学习,形成表征向量集;
第二计算模块,用于基于表征向量集计算向量间的余弦相似度,根据余弦相似度挖掘城市设施间的关联模式。
本发明实施例还提供了一种计算机可读存储介质,用于存储计算机程序,通过执行计算机程序,用于实现上述的城市设施关联模式挖掘方法。
本发明实施例还提供了一种城市设施关联模式挖掘设备,用于实现上述的城市设施关联模式挖掘方法,包括:
存储器和处理器;
存储器用于储存计算机程序;
处理器用于执行存储器存储的计算机程序。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (9)
1.一种城市设施关联模式挖掘方法,其特征在于,包括:
步骤1,基于城市道路交叉口划分城市路网;
步骤2,收集轨迹点数据,并将所述轨迹点数据与所述城市路网进行匹配;
步骤3,收集城市设施点数据,并将所述城市设施点数据与所述城市路网进行匹配,得到城市设施点数据匹配结果;
步骤4,根据所述轨迹点数据和所述城市设施点数据匹配结果,计算人群移动层转移矩阵与人群访问层转移矩阵;
基于所述轨迹点数据,通过计算所述人群移动层转移矩阵;
基于所述城市设施点数据匹配结果,通过计算所述人群访问层转移矩阵;
其中,表示所有轨迹点从路段直接到达路段的次数,表示路段的总数量,表示所有轨迹点从路段直接到达路段的次数,,表示路段到设施点之间的距离,表示路段匹配到的设施点的总数量,表示路段到设施点之间的距离;
步骤5,通过所述人群移动层转移矩阵与所述人群访问层转移矩阵,构建人类活动视角下的城市设施关系图;
步骤6,在所述城市设施关系图中进行多次随机游走,生成多条游走序列;
步骤7,对多条所述游走序列中每个设施类别的向量表达进行学习,形成表征向量集;
步骤8,基于所述表征向量集计算向量间的余弦相似度,根据所述余弦相似度挖掘城市设施间的关联模式。
2.根据权利要求1所述的城市设施关联模式挖掘方法,其特征在于,
所述城市路网为
其中,表示城市路网中全部路段的集合,表示路段到路段的权重。
3.根据权利要求2所述的城市设施关联模式挖掘方法,其特征在于,所述步骤2包括:
收集轨迹数据,所述轨迹数据包括多个轨迹点;
针对多个所述轨迹点中的每个轨迹点,计算所述轨迹点与每条路段的方位角的夹角余弦值;
判断所述夹角余弦值与预设的角度阈值的大小,将所述预设角度阈值大于所述夹角余弦值时的路段均加入所述轨迹点的保留路段集中;
计算所述轨迹点到所述保留路段集中每一条路段的距离并得到最小距离;
将所述最小距离与预设的距离阈值进行比较,若所述最小距离大于或等于预设的距离阈值,则将所述最小距离对应的路段作为所述轨迹点所匹配上的路段,并将所述最小距离对应的路段更新至所述轨迹点内。
4.根据权利要求3所述的城市设施关联模式挖掘方法,其特征在于,所述步骤3包括:
收集城市设施点数据;
针对所述城市设施点数据中的每个设施点,计算所述设施点到城市路网中每一条路段的距离并得到最小距离;
将所述最小距离与预设的距离阈值进行比较,若所述最小距离小于或等于预设的距离阈值,则将所述最小距离对应的路段作为所述设施点所匹配上的路段,并将所述最小距离及与所述最小距离对应的路段更新至所述设施点内。
5.根据权利要求1所述的城市设施关联模式挖掘方法,其特征在于,所述步骤7包括:
构建目标函数为
其中,为预设的游走序列个数的阈值,为预设的游走序列步数的阈值,为邻域参数,表示条件概率值,为游走序列中以路段为起点的第条序列的第个元素的向量,为游走序列中以路段为起点的第条序列的第个元素的向量;
对所述目标函数进行最大化,并选择与目标最大化时对应的向量构造城市设施向量表征集。
6.根据权利要求1所述的城市设施关联模式挖掘方法,其特征在于,所述步骤8包括:
根据所述表征向量集,计算向量间的余弦相似度为
其中,为向量的长度,表示向量的第个分量,,为城市设施点数据的类别数;
根据所述余弦相似度,基于准则挖掘显著的设施间的关联模式;
定义显著关联模式集,表示第个元显著关联模式,,若,则将显著关联模式加入显著关联模式集中。
7.一种城市设施关联模式挖掘装置,其特征在于,包括:
划分模块,用于基于城市道路交叉口划分城市路网;
轨迹点数据匹配模块,用于收集轨迹点数据,并将所述轨迹点数据与所述城市路网进行匹配;
城市设施点数据匹配模块,用于收集城市设施点数据,并将所述城市设施点数据与所述城市路网进行匹配,得到城市设施点数据匹配结果;
第一计算模块,用于根据所述轨迹点数据和所述城市设施点数据匹配结果,计算人群移动层转移矩阵与人群访问层转移矩阵;
基于所述轨迹点数据,通过计算所述人群移动层转移矩阵;
基于所述城市设施点数据匹配结果,通过计算所述人群访问层转移矩阵;
其中,表示所有轨迹点从路段直接到达路段的次数,表示路段的总数量,表示所有轨迹点从路段直接到达路段的次数,,表示路段到设施点之间的距离,表示路段匹配到的设施点的总数量,表示路段到设施点之间的距离;
关系图构建模块,用于通过所述人群移动层转移矩阵与所述人群访问层转移矩阵,构建人类活动视角下的城市设施关系图;
随机游走模块,用于在所述城市设施关系图中进行多次随机游走,生成多条游走序列;
学习模块,用于对多条所述游走序列中每个设施类别的向量表达进行学习,形成表征向量集;
第二计算模块,用于基于所述表征向量集计算向量间的余弦相似度,根据所述余弦相似度挖掘城市设施间的关联模式。
8.一种计算机可读存储介质,用于存储计算机程序,其特征在于,通过执行所述计算机程序,用于实现上述权利要求1-6中任意一项所述的城市设施关联模式挖掘方法。
9.一种城市设施关联模式挖掘设备,用于实现上述权利要求1-6任意一项所述的城市设施关联模式挖掘方法,其特征在于,包括:
存储器和处理器;
所述存储器用于储存计算机程序;
所述处理器用于执行所述存储器存储的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211358979.0A CN115408452B (zh) | 2022-11-02 | 2022-11-02 | 一种城市设施关联模式挖掘方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211358979.0A CN115408452B (zh) | 2022-11-02 | 2022-11-02 | 一种城市设施关联模式挖掘方法及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115408452A CN115408452A (zh) | 2022-11-29 |
CN115408452B true CN115408452B (zh) | 2023-04-07 |
Family
ID=84169198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211358979.0A Active CN115408452B (zh) | 2022-11-02 | 2022-11-02 | 一种城市设施关联模式挖掘方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115408452B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113378891A (zh) * | 2021-05-18 | 2021-09-10 | 东北师范大学 | 基于轨迹分布表示的城市区域关系可视分析方法 |
WO2022134649A1 (zh) * | 2020-12-24 | 2022-06-30 | 南方科技大学 | 城市人流监控方法、装置、电子设备及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170124464A1 (en) * | 2015-10-28 | 2017-05-04 | Fractal Industries, Inc. | Rapid predictive analysis of very large data sets using the distributed computational graph |
CN108197150B (zh) * | 2017-12-05 | 2020-06-02 | 北京千方城市信息科技有限公司 | 一种城市停车难区域的分析方法及系统 |
CN109029446B (zh) * | 2018-06-22 | 2020-11-20 | 北京邮电大学 | 一种行人位置预测方法、装置及设备 |
CN111310340B (zh) * | 2020-02-19 | 2022-08-16 | 中南大学 | 基于人类移动的城市区域交互异常关系识别方法及设备 |
CN112863182B (zh) * | 2021-01-13 | 2022-03-18 | 南京航空航天大学 | 基于迁移学习的跨模态数据预测方法 |
CN114969234A (zh) * | 2022-05-25 | 2022-08-30 | 中南大学 | 一种面向全量城市路网的向量表征方法 |
-
2022
- 2022-11-02 CN CN202211358979.0A patent/CN115408452B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022134649A1 (zh) * | 2020-12-24 | 2022-06-30 | 南方科技大学 | 城市人流监控方法、装置、电子设备及存储介质 |
CN113378891A (zh) * | 2021-05-18 | 2021-09-10 | 东北师范大学 | 基于轨迹分布表示的城市区域关系可视分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115408452A (zh) | 2022-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112182410B (zh) | 基于时空轨迹知识图谱的用户出行模式挖掘方法 | |
CN104462190B (zh) | 一种基于海量空间轨迹挖掘的在线的位置预测方法 | |
CN110111574B (zh) | 一种基于流量树分析的城市交通不平衡评价方法 | |
CN108153867B (zh) | 基于时间规律性的用户轨迹预测方法和装置 | |
CN109167805A (zh) | 基于城市场景中车联网时空数据的分析处理方法 | |
CN103593430A (zh) | 一种基于移动对象时空信息轨迹分段聚类的方法 | |
CN110836675B (zh) | 一种基于决策树的自动驾驶搜索决策方法 | |
CN110516870B (zh) | 一种基于协同进化的多回收站点垃圾收运方法 | |
CN106407519A (zh) | 一种人群移动规律的建模方法 | |
CN110132260B (zh) | 一种面向复杂地表空间的行人步行导航路径规划方法 | |
CN106157624A (zh) | 基于交通定位数据的多粒度道路分流可视分析方法 | |
CN112734176A (zh) | 一种充电站建站方法、装置、终端设备和可读存储介质 | |
CN113393488A (zh) | 一种基于量子游走的行为轨迹序列多特征模拟方法 | |
CN115809378A (zh) | 一种基于手机信令数据的医疗短缺区识别及布局优化方法 | |
CN115391882A (zh) | 一种多元数据融合全息空间系统的构建方法 | |
CN112884014A (zh) | 一种基于路段拓扑结构分类的交通速度短时预测方法 | |
CN110275911A (zh) | 基于频繁序列模式的私家车出行热点路径挖掘方法 | |
CN115730519A (zh) | 一种基于时空势能场的城市人群流动预测系统及其方法 | |
CN113611115B (zh) | 一种基于路网敏感特征的车辆轨迹聚类方法 | |
Zhang et al. | How road network transformation may be associated with reduced carbon emissions: An exploratory analysis of 19 major Chinese cities | |
CN113159371B (zh) | 基于跨模态数据融合的未知目标特征建模与需求预测方法 | |
CN109064750A (zh) | 城市路网交通估计方法及系统 | |
CN115408452B (zh) | 一种城市设施关联模式挖掘方法及相关设备 | |
CN109785656B (zh) | 一种基于局部近似秩的交通规划及导航方法 | |
CN115691140B (zh) | 一种汽车充电需求时空分布的分析与预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |