CN109543876A - 一种城市问题的可视化分析方法 - Google Patents

一种城市问题的可视化分析方法 Download PDF

Info

Publication number
CN109543876A
CN109543876A CN201811208262.1A CN201811208262A CN109543876A CN 109543876 A CN109543876 A CN 109543876A CN 201811208262 A CN201811208262 A CN 201811208262A CN 109543876 A CN109543876 A CN 109543876A
Authority
CN
China
Prior art keywords
event
similarity
occurs
place
certain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811208262.1A
Other languages
English (en)
Inventor
夏理超
陈锦言
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201811208262.1A priority Critical patent/CN109543876A/zh
Publication of CN109543876A publication Critical patent/CN109543876A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种城市问题的可视化分析方法,包括:处理原始数据;利用Apriori算法,以每天,每个地点发生的事件为数据,进行频繁项集的计算,通过频繁项集,对与某一事件有关联的事件按关联度进行排序;计算事件集相似度;可视化事件发生的频繁程度;可视化相似事件地点分布。

Description

一种城市问题的可视化分析方法
技术领域
本发明涉及数据挖掘与可视化技术领域,涉及一种可视化分析方法。
背景技术
数据挖掘技术以及可视化的发展,给智慧城市的建设带来了新的方式。城市服务中心每天都会收到大量的居民反映的有关城市问题的数据,这给计算机学家研究城市问题提供了很好的研究素材。计算机学家通过数据挖掘算法将城市数据信息进行关联性挖掘,通过可视化方式有效的展现数据之间的规律,以帮助决策者分析城市问题,制定解决方案。
发明内容
本发明提出一种对城市问题准本溯源和预测的方法,并可视化某个城市问题发生的相似地点帮助决策者分析问题,整体制定决策。技术方案如下:
一种城市问题的可视化分析方法,包括下列步骤:
1)处理原始数据
对原始的市民对城市问题反映的数据进行预处理,将城市问题发生地点的经纬度精确到0.001,对原始数据的事件发生按天进行统计,在一天发生某一城市问题发生地点相应属性的位置置为1,否则置为0;通过处理之后数据库中每一行记录包含内容为:日期,地点,事件1,事件2,...,事件n,n为数据库中已有的事件的相关属性的数目。
2)关联分析事件
利用Apriori算法,以每天,每个地点发生的事件为数据,进行频繁项集的计算,通过频繁项集,对与某一事件有关联的事件按关联度进行排序;
3)计算事件集相似度
某一特定时间,某一地点发生事件集合与其他地点发生事件集合的相似度计算方法,如公式3,通过计算某一特定时间,某一地点发生事件集合与其他各个地点发生事件集合的相似度,然后进行排序,相似度值越大,代表两地点之间发生同类事件集合的相似性越大;
其中γ代表相似度,向量代表事件a的各属性值的向量,向量代表事件b的各属性的向量公式3
4)可视化事件发生的频繁程度
对某一事件按月份、地点统计其发生数目,并利用热力图的方式展示,以时间为坐标轴,可通过调整坐标轴动态展示该事件发生的地点、时间以及发生数目多少;通过有向图的方式列举出与该事件有关联的事件,并按关联度从大到小的排序进行展示,有向图中与原事件之间的连线宽度代表事件之间关联度的大小,关联度越高,连线的宽度值越大;有向图中的原点代表事件的代表事件出现的次数,出现次数越多,原点的值越大;
5)可视化相似事件地点分布
在某一特定时间下,确定某一特定坐标,计算改坐标发生的事件集合与其他不同坐标位置发生的事件集合的相似度,并按照相似大小进行排序,在地图上列举出与该特定坐标下相似度大于某一特定阈值的坐标所在位置,并按照相似度大小分别给定不同的演示颜色展示。
步骤2)可以按以下步骤执行:
第一步:发现频繁项集
a.扫描元素,得到每天,每个地点发生事件集合;
b.计算概率;
c.统计筛选支持度和置信度同时大于阈值的候选集,支持度按公式1计算,置信度按公式2计算:
P(AB)关联规则A-B,事件A和事件B同时发生的概率公式1
P(B|A)=P(AB)/P(A)在事件A发生的前提下,事件A和事件B同时发生的概率
公式2
d.产生频繁项集;
e.自链接;
f.剪枝,即合并后的集合,如果有子集不在原集合中,则把该合并集合删除;
g.产生候选集;
第二步:产生关联规则。
附图说明
图1所提方法流程图
图2关联问题分析图
具体实施方式
本发明提出了一种利用关联分析算法寻找与已发生的城市问题可能有关联的问题,以帮助城市决策者分析已发生的城市问题,为城市的问题追本溯源以及可能发生的关联问题预测提供了有效方式。同时本发明提出了一种为该城市的各个地点寻找发生类似问题的相似地点的方法,为城市决策者统一分析城市问题提供依据。具体步骤如下:
1、处理原始数据
原始的市民对城市问题反映的数据进行预处理,将数据发生地点的精确度调整为1千米的经度,即城市问题发生地点的经纬度精确到0.001,对原始数据的事件发生按天进行统计,即,在一天发生某一城市问题改地点相应属性的位置置为1,否则置为0。通过处理之后数据库中每一行记录包含内容为:日期,地点,事件1,事件2,...,事件n,n为数据库中已有的事件的相关属性的数目。事件相关的属性中包括降雨量大,雷雨,气温高等天气类的属性,以及丢井盖,暖气不供暖,水管爆裂等公共设施属性等。
2、关联分析事件
利用Apriori算法,以每天,每个地点发生的事件为数据,进行频繁项集的计算。通过频繁项集,可对与某一事件有关联的事件按关联度进行排序。具体步骤如下:
第一步:发现频繁项集
a.扫描元素,得到每天,每个地点发生事件集合。
b.计算概率。
c.统计筛选支持度和置信度同时大于阈值的候选集,支持度计算公式如公式1所示,置信度计算公式如公式2所示。
P(AB)关联规则A-B,事件A和事件B同时发生的概率。
公式1
P(B|A)=P(AB)/P(A)在事件A发生的前提下,事件A和事件B同时发生的概率。
公式2
d.产生频繁项集。
e.自链接。
f.剪枝,即合并后的集合,如果有子集不在原集合中,则把该合并集合删除。
g.产生候选集
第二步:产生关联规则
3、计算事件集相似度
某一特定时间,某一地点发生事件集合与其他地点发生事件集合的相似度计算方法,如公式3所示,通过计算某一特定时间,某一地点发生事件集合与其他各个地点发生事件集合的相似度,然后进行排序,相似度值越大,代表两地点之间发生同类事件集合的相似性越大。
其中γ代表相似度,向量代表事件a的各属性值的向量,向量代表事件b的各属性的向量。
公式3
4、可视化事件发生的频繁程度
对某一事件按月份、地点统计其发生数目,并利用热力图的方式展示,同时以时间为坐标轴,可通过调整坐标轴动态展示该事件发生的地点、时间以及发生数目多少。同时通过有向图的方式列举出与该事件有关联的事件如图2所示,并按关联度从大到小的排序进行展示。有向图中与原事件之间的连线宽度代表事件之间关联度的大小,关联度越高,连线的宽度值越大;有向图中的原点代表事件的代表事件出现的次数,出现次数越多,原点的值越大。
5、可视化相似事件地点分布
在某一特定时间下,确定某一特定坐标,计算改坐标发生的事件集合与其他不同坐标位置发生的事件集合的相似度,并按照相似大小进行排序,在地图上列举出与该特定坐标下相似度大于某一特定阈值的坐标所在位置,并按照相似度大小分别给定不同的演示颜色展示。
采用Windows7系统,以java作为开发语言。选用城建数据库作为模型训练和测试数据集,选用scikit-learn模块中的Apriori算法模块作为模型训练算法,选用百度地图作为展示图层。通过城市问题关联分析能够有效的找出已发生问题的关联问题,帮助决策者防患其他问题和寻找原问题的根源;通过同时分析不同地点之间的相似问题能够更有效帮助决策者制定整体问题解决方案。

Claims (2)

1.一种城市问题的可视化分析方法,包括下列步骤:
1)处理原始数据
对原始的市民对城市问题反映的数据进行预处理,将城市问题发生地点的经纬度精确到0.001,对原始数据的事件发生按天进行统计,在一天发生某一城市问题发生地点相应属性的位置置为1,否则置为0;通过处理之后数据库中每一行记录包含内容为:日期,地点,事件1,事件2,...,事件n,n为数据库中已有的事件的相关属性的数目。
2)关联分析事件
利用Apriori算法,以每天,每个地点发生的事件为数据,进行频繁项集的计算,通过频繁项集,对与某一事件有关联的事件按关联度进行排序;
第二步:产生关联规则
3)计算事件集相似度
某一特定时间,某一地点发生事件集合与其他地点发生事件集合的相似度计算方法,如公式3,通过计算某一特定时间,某一地点发生事件集合与其他各个地点发生事件集合的相似度,然后进行排序,相似度值越大,代表两地点之间发生同类事件集合的相似性越大;
其中γ代表相似度,向量代表事件a的各属性值的向量,向量代表事件b的各属性的向量 公式3
4)可视化事件发生的频繁程度
对某一事件按月份、地点统计其发生数目,并利用热力图的方式展示,以时间为坐标轴,可通过调整坐标轴动态展示该事件发生的地点、时间以及发生数目多少;通过有向图的方式列举出与该事件有关联的事件,并按关联度从大到小的排序进行展示,有向图中与原事件之间的连线宽度代表事件之间关联度的大小,关联度越高,连线的宽度值越大;有向图中的原点代表事件的代表事件出现的次数,出现次数越多,原点的值越大;
5)可视化相似事件地点分布
在某一特定时间下,确定某一特定坐标,计算改坐标发生的事件集合与其他不同坐标位置发生的事件集合的相似度,并按照相似大小进行排序,在地图上列举出与该特定坐标下相似度大于某一特定阈值的坐标所在位置,并按照相似度大小分别给定不同的演示颜色展示。
2.根据权利要求1所述的方法,其特征在于,步骤2)按以下步骤执行:
第一步:发现频繁项集
a.扫描元素,得到每天,每个地点发生事件集合;
b.计算概率;
c.统计筛选支持度和置信度同时大于阈值的候选集,支持度按公式1计算,置信度按公式2计算:
P(AB)关联规则A-B,事件A和事件B同时发生的概率 公式1
P(B|A)=P(AB)/P(A)在事件A发生的前提下,事件A和事件B同时发生的概率
公式2
d.产生频繁项集;
e.自链接;
f.剪枝,即合并后的集合,如果有子集不在原集合中,则把该合并集合删除;
g.产生候选集;
第二步:产生关联规则。
CN201811208262.1A 2018-10-17 2018-10-17 一种城市问题的可视化分析方法 Pending CN109543876A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811208262.1A CN109543876A (zh) 2018-10-17 2018-10-17 一种城市问题的可视化分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811208262.1A CN109543876A (zh) 2018-10-17 2018-10-17 一种城市问题的可视化分析方法

Publications (1)

Publication Number Publication Date
CN109543876A true CN109543876A (zh) 2019-03-29

Family

ID=65844015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811208262.1A Pending CN109543876A (zh) 2018-10-17 2018-10-17 一种城市问题的可视化分析方法

Country Status (1)

Country Link
CN (1) CN109543876A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737321A (zh) * 2020-07-02 2020-10-02 大连理工大学人工智能大连研究院 基于数据挖掘的城市大气污染联防联控区域划分方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101578603A (zh) * 2006-11-14 2009-11-11 谷歌公司 事件搜索
CN102364473A (zh) * 2011-11-09 2012-02-29 中国科学院自动化研究所 融合地理信息与视觉信息的网络新闻检索系统及方法
CN103065474A (zh) * 2012-12-28 2013-04-24 杨涛 基于gprs/gps的城市道路养护需求自发报告系统
CN103341506A (zh) * 2013-07-10 2013-10-09 鞍钢股份有限公司 一种基于数据模式的板形时间序列数据挖掘方法
CN103955505A (zh) * 2014-04-24 2014-07-30 中国科学院信息工程研究所 一种基于微博的事件实时监测方法及系统
CN105512210A (zh) * 2015-11-27 2016-04-20 网神信息技术(北京)股份有限公司 关联事件类型的检测方法及装置
CN105718509A (zh) * 2016-01-11 2016-06-29 北京交通大学 一种基于有向图关联规则音乐云推荐算法
CN107045532A (zh) * 2017-01-20 2017-08-15 中国科学院电子学研究所 时空地理空间可视化的分析方法
CN107609107A (zh) * 2017-09-13 2018-01-19 大连理工大学 一种基于多源城市数据的出行共现现象可视化分析方法
CN107633044A (zh) * 2017-09-14 2018-01-26 国家计算机网络与信息安全管理中心 一种基于热点事件的舆情知识图谱构建方法
CN107633067A (zh) * 2017-09-21 2018-01-26 北京工业大学 一种基于人员行为规律和数据挖掘方法的群体识别方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101578603A (zh) * 2006-11-14 2009-11-11 谷歌公司 事件搜索
CN102364473A (zh) * 2011-11-09 2012-02-29 中国科学院自动化研究所 融合地理信息与视觉信息的网络新闻检索系统及方法
CN103065474A (zh) * 2012-12-28 2013-04-24 杨涛 基于gprs/gps的城市道路养护需求自发报告系统
CN103341506A (zh) * 2013-07-10 2013-10-09 鞍钢股份有限公司 一种基于数据模式的板形时间序列数据挖掘方法
CN103955505A (zh) * 2014-04-24 2014-07-30 中国科学院信息工程研究所 一种基于微博的事件实时监测方法及系统
CN105512210A (zh) * 2015-11-27 2016-04-20 网神信息技术(北京)股份有限公司 关联事件类型的检测方法及装置
CN105718509A (zh) * 2016-01-11 2016-06-29 北京交通大学 一种基于有向图关联规则音乐云推荐算法
CN107045532A (zh) * 2017-01-20 2017-08-15 中国科学院电子学研究所 时空地理空间可视化的分析方法
CN107609107A (zh) * 2017-09-13 2018-01-19 大连理工大学 一种基于多源城市数据的出行共现现象可视化分析方法
CN107633044A (zh) * 2017-09-14 2018-01-26 国家计算机网络与信息安全管理中心 一种基于热点事件的舆情知识图谱构建方法
CN107633067A (zh) * 2017-09-21 2018-01-26 北京工业大学 一种基于人员行为规律和数据挖掘方法的群体识别方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737321A (zh) * 2020-07-02 2020-10-02 大连理工大学人工智能大连研究院 基于数据挖掘的城市大气污染联防联控区域划分方法

Similar Documents

Publication Publication Date Title
He et al. The impact of urban growth patterns on urban vitality in newly built-up areas based on an association rules analysis using geographical ‘big data’
Souza et al. City Information Modelling as a support decision tool for planning and management of cities: A systematic literature review and bibliometric analysis
Hegazy et al. Monitoring urban growth and land use change detection with GIS and remote sensing techniques in Daqahlia governorate Egypt
US7801842B2 (en) Method and system for spatial behavior modification based on geospatial modeling
US7917458B2 (en) Temporal-influenced geospatial modeling system and method
Pham et al. Urban growth and change analysis using remote sensing and spatial metrics from 1975 to 2003 for Hanoi, Vietnam
Liu et al. Simulating urban dynamics in China using a gradient cellular automata model based on S-shaped curve evolution characteristics
Benedetti et al. Sampling spatial units for agricultural surveys
US20080082472A1 (en) Event, threat and result change detection system and method
Wang et al. A patch‐based cellular automaton for simulating land‐use changes at fine spatial resolution
Maddahi et al. Land suitability analysis for rice cultivation using multi criteria evaluation approach and GIS
Cheng et al. Remote sensing and social sensing data fusion for fine-resolution population mapping with a multimodel neural network
Ye et al. Urban commerce distribution analysis based on street view and deep learning
McCool PRAGIS: a test case for a web-based archaeological GIS
Liang et al. Modeling urban growth in the middle basin of the Heihe River, northwest China
Wang et al. Simulating large-scale urban land-use patterns and dynamics using the U-Net deep learning architecture
CN111984701A (zh) 乡村聚落演化的预测方法、装置、设备及存储介质
Yuan et al. Using street view images and a geographical detector to understand how street-level built environment is associated with urban poverty: A case study in Guangzhou
Gao et al. Identifying priority areas for ecological conservation and restoration based on circuit theory and dynamic weighted complex network: A case study of the Sichuan Basin
CN109543876A (zh) 一种城市问题的可视化分析方法
Stanislawski et al. A rapid approach for automated comparison of independently derived stream networks
Mudigonda et al. Deep learning for detecting extreme weather patterns
Colston et al. Using Geospatial Analysis to Inform Decision Making In Targeting Health Facility-Based Programs
Olaniyi et al. Characterization of drivers of agricultural land use change
Ivanković et al. Web visualization of data from numerical models and real-time stations network in frame of Adriatic Sea and Coast (AdriSC) Meteotsunami Forecast

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190329

WD01 Invention patent application deemed withdrawn after publication