CN109543876A - 一种城市问题的可视化分析方法 - Google Patents
一种城市问题的可视化分析方法 Download PDFInfo
- Publication number
- CN109543876A CN109543876A CN201811208262.1A CN201811208262A CN109543876A CN 109543876 A CN109543876 A CN 109543876A CN 201811208262 A CN201811208262 A CN 201811208262A CN 109543876 A CN109543876 A CN 109543876A
- Authority
- CN
- China
- Prior art keywords
- event
- similarity
- occurs
- place
- certain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 9
- 230000000007 visual effect Effects 0.000 title claims abstract description 8
- 238000012800 visualization Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 11
- 238000012098 association analyses Methods 0.000 claims description 5
- 241000001621 Fusicolla betae Species 0.000 claims description 3
- 238000013138 pruning Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 239000003086 colorant Substances 0.000 claims 1
- 238000004364 calculation method Methods 0.000 description 4
- 238000007418 data mining Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种城市问题的可视化分析方法,包括:处理原始数据;利用Apriori算法,以每天,每个地点发生的事件为数据,进行频繁项集的计算,通过频繁项集,对与某一事件有关联的事件按关联度进行排序;计算事件集相似度;可视化事件发生的频繁程度;可视化相似事件地点分布。
Description
技术领域
本发明涉及数据挖掘与可视化技术领域,涉及一种可视化分析方法。
背景技术
数据挖掘技术以及可视化的发展,给智慧城市的建设带来了新的方式。城市服务中心每天都会收到大量的居民反映的有关城市问题的数据,这给计算机学家研究城市问题提供了很好的研究素材。计算机学家通过数据挖掘算法将城市数据信息进行关联性挖掘,通过可视化方式有效的展现数据之间的规律,以帮助决策者分析城市问题,制定解决方案。
发明内容
本发明提出一种对城市问题准本溯源和预测的方法,并可视化某个城市问题发生的相似地点帮助决策者分析问题,整体制定决策。技术方案如下:
一种城市问题的可视化分析方法,包括下列步骤:
1)处理原始数据
对原始的市民对城市问题反映的数据进行预处理,将城市问题发生地点的经纬度精确到0.001,对原始数据的事件发生按天进行统计,在一天发生某一城市问题发生地点相应属性的位置置为1,否则置为0;通过处理之后数据库中每一行记录包含内容为:日期,地点,事件1,事件2,...,事件n,n为数据库中已有的事件的相关属性的数目。
2)关联分析事件
利用Apriori算法,以每天,每个地点发生的事件为数据,进行频繁项集的计算,通过频繁项集,对与某一事件有关联的事件按关联度进行排序;
3)计算事件集相似度
某一特定时间,某一地点发生事件集合与其他地点发生事件集合的相似度计算方法,如公式3,通过计算某一特定时间,某一地点发生事件集合与其他各个地点发生事件集合的相似度,然后进行排序,相似度值越大,代表两地点之间发生同类事件集合的相似性越大;
其中γ代表相似度,向量代表事件a的各属性值的向量,向量代表事件b的各属性的向量公式3
4)可视化事件发生的频繁程度
对某一事件按月份、地点统计其发生数目,并利用热力图的方式展示,以时间为坐标轴,可通过调整坐标轴动态展示该事件发生的地点、时间以及发生数目多少;通过有向图的方式列举出与该事件有关联的事件,并按关联度从大到小的排序进行展示,有向图中与原事件之间的连线宽度代表事件之间关联度的大小,关联度越高,连线的宽度值越大;有向图中的原点代表事件的代表事件出现的次数,出现次数越多,原点的值越大;
5)可视化相似事件地点分布
在某一特定时间下,确定某一特定坐标,计算改坐标发生的事件集合与其他不同坐标位置发生的事件集合的相似度,并按照相似大小进行排序,在地图上列举出与该特定坐标下相似度大于某一特定阈值的坐标所在位置,并按照相似度大小分别给定不同的演示颜色展示。
步骤2)可以按以下步骤执行:
第一步:发现频繁项集
a.扫描元素,得到每天,每个地点发生事件集合;
b.计算概率;
c.统计筛选支持度和置信度同时大于阈值的候选集,支持度按公式1计算,置信度按公式2计算:
P(AB)关联规则A-B,事件A和事件B同时发生的概率公式1
P(B|A)=P(AB)/P(A)在事件A发生的前提下,事件A和事件B同时发生的概率
公式2
d.产生频繁项集;
e.自链接;
f.剪枝,即合并后的集合,如果有子集不在原集合中,则把该合并集合删除;
g.产生候选集;
第二步:产生关联规则。
附图说明
图1所提方法流程图
图2关联问题分析图
具体实施方式
本发明提出了一种利用关联分析算法寻找与已发生的城市问题可能有关联的问题,以帮助城市决策者分析已发生的城市问题,为城市的问题追本溯源以及可能发生的关联问题预测提供了有效方式。同时本发明提出了一种为该城市的各个地点寻找发生类似问题的相似地点的方法,为城市决策者统一分析城市问题提供依据。具体步骤如下:
1、处理原始数据
原始的市民对城市问题反映的数据进行预处理,将数据发生地点的精确度调整为1千米的经度,即城市问题发生地点的经纬度精确到0.001,对原始数据的事件发生按天进行统计,即,在一天发生某一城市问题改地点相应属性的位置置为1,否则置为0。通过处理之后数据库中每一行记录包含内容为:日期,地点,事件1,事件2,...,事件n,n为数据库中已有的事件的相关属性的数目。事件相关的属性中包括降雨量大,雷雨,气温高等天气类的属性,以及丢井盖,暖气不供暖,水管爆裂等公共设施属性等。
2、关联分析事件
利用Apriori算法,以每天,每个地点发生的事件为数据,进行频繁项集的计算。通过频繁项集,可对与某一事件有关联的事件按关联度进行排序。具体步骤如下:
第一步:发现频繁项集
a.扫描元素,得到每天,每个地点发生事件集合。
b.计算概率。
c.统计筛选支持度和置信度同时大于阈值的候选集,支持度计算公式如公式1所示,置信度计算公式如公式2所示。
P(AB)关联规则A-B,事件A和事件B同时发生的概率。
公式1
P(B|A)=P(AB)/P(A)在事件A发生的前提下,事件A和事件B同时发生的概率。
公式2
d.产生频繁项集。
e.自链接。
f.剪枝,即合并后的集合,如果有子集不在原集合中,则把该合并集合删除。
g.产生候选集
第二步:产生关联规则
3、计算事件集相似度
某一特定时间,某一地点发生事件集合与其他地点发生事件集合的相似度计算方法,如公式3所示,通过计算某一特定时间,某一地点发生事件集合与其他各个地点发生事件集合的相似度,然后进行排序,相似度值越大,代表两地点之间发生同类事件集合的相似性越大。
其中γ代表相似度,向量代表事件a的各属性值的向量,向量代表事件b的各属性的向量。
公式3
4、可视化事件发生的频繁程度
对某一事件按月份、地点统计其发生数目,并利用热力图的方式展示,同时以时间为坐标轴,可通过调整坐标轴动态展示该事件发生的地点、时间以及发生数目多少。同时通过有向图的方式列举出与该事件有关联的事件如图2所示,并按关联度从大到小的排序进行展示。有向图中与原事件之间的连线宽度代表事件之间关联度的大小,关联度越高,连线的宽度值越大;有向图中的原点代表事件的代表事件出现的次数,出现次数越多,原点的值越大。
5、可视化相似事件地点分布
在某一特定时间下,确定某一特定坐标,计算改坐标发生的事件集合与其他不同坐标位置发生的事件集合的相似度,并按照相似大小进行排序,在地图上列举出与该特定坐标下相似度大于某一特定阈值的坐标所在位置,并按照相似度大小分别给定不同的演示颜色展示。
采用Windows7系统,以java作为开发语言。选用城建数据库作为模型训练和测试数据集,选用scikit-learn模块中的Apriori算法模块作为模型训练算法,选用百度地图作为展示图层。通过城市问题关联分析能够有效的找出已发生问题的关联问题,帮助决策者防患其他问题和寻找原问题的根源;通过同时分析不同地点之间的相似问题能够更有效帮助决策者制定整体问题解决方案。
Claims (2)
1.一种城市问题的可视化分析方法,包括下列步骤:
1)处理原始数据
对原始的市民对城市问题反映的数据进行预处理,将城市问题发生地点的经纬度精确到0.001,对原始数据的事件发生按天进行统计,在一天发生某一城市问题发生地点相应属性的位置置为1,否则置为0;通过处理之后数据库中每一行记录包含内容为:日期,地点,事件1,事件2,...,事件n,n为数据库中已有的事件的相关属性的数目。
2)关联分析事件
利用Apriori算法,以每天,每个地点发生的事件为数据,进行频繁项集的计算,通过频繁项集,对与某一事件有关联的事件按关联度进行排序;
第二步:产生关联规则
3)计算事件集相似度
某一特定时间,某一地点发生事件集合与其他地点发生事件集合的相似度计算方法,如公式3,通过计算某一特定时间,某一地点发生事件集合与其他各个地点发生事件集合的相似度,然后进行排序,相似度值越大,代表两地点之间发生同类事件集合的相似性越大;
其中γ代表相似度,向量代表事件a的各属性值的向量,向量代表事件b的各属性的向量 公式3
4)可视化事件发生的频繁程度
对某一事件按月份、地点统计其发生数目,并利用热力图的方式展示,以时间为坐标轴,可通过调整坐标轴动态展示该事件发生的地点、时间以及发生数目多少;通过有向图的方式列举出与该事件有关联的事件,并按关联度从大到小的排序进行展示,有向图中与原事件之间的连线宽度代表事件之间关联度的大小,关联度越高,连线的宽度值越大;有向图中的原点代表事件的代表事件出现的次数,出现次数越多,原点的值越大;
5)可视化相似事件地点分布
在某一特定时间下,确定某一特定坐标,计算改坐标发生的事件集合与其他不同坐标位置发生的事件集合的相似度,并按照相似大小进行排序,在地图上列举出与该特定坐标下相似度大于某一特定阈值的坐标所在位置,并按照相似度大小分别给定不同的演示颜色展示。
2.根据权利要求1所述的方法,其特征在于,步骤2)按以下步骤执行:
第一步:发现频繁项集
a.扫描元素,得到每天,每个地点发生事件集合;
b.计算概率;
c.统计筛选支持度和置信度同时大于阈值的候选集,支持度按公式1计算,置信度按公式2计算:
P(AB)关联规则A-B,事件A和事件B同时发生的概率 公式1
P(B|A)=P(AB)/P(A)在事件A发生的前提下,事件A和事件B同时发生的概率
公式2
d.产生频繁项集;
e.自链接;
f.剪枝,即合并后的集合,如果有子集不在原集合中,则把该合并集合删除;
g.产生候选集;
第二步:产生关联规则。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811208262.1A CN109543876A (zh) | 2018-10-17 | 2018-10-17 | 一种城市问题的可视化分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811208262.1A CN109543876A (zh) | 2018-10-17 | 2018-10-17 | 一种城市问题的可视化分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109543876A true CN109543876A (zh) | 2019-03-29 |
Family
ID=65844015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811208262.1A Pending CN109543876A (zh) | 2018-10-17 | 2018-10-17 | 一种城市问题的可视化分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109543876A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737321A (zh) * | 2020-07-02 | 2020-10-02 | 大连理工大学人工智能大连研究院 | 基于数据挖掘的城市大气污染联防联控区域划分方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101578603A (zh) * | 2006-11-14 | 2009-11-11 | 谷歌公司 | 事件搜索 |
CN102364473A (zh) * | 2011-11-09 | 2012-02-29 | 中国科学院自动化研究所 | 融合地理信息与视觉信息的网络新闻检索系统及方法 |
CN103065474A (zh) * | 2012-12-28 | 2013-04-24 | 杨涛 | 基于gprs/gps的城市道路养护需求自发报告系统 |
CN103341506A (zh) * | 2013-07-10 | 2013-10-09 | 鞍钢股份有限公司 | 一种基于数据模式的板形时间序列数据挖掘方法 |
CN103955505A (zh) * | 2014-04-24 | 2014-07-30 | 中国科学院信息工程研究所 | 一种基于微博的事件实时监测方法及系统 |
CN105512210A (zh) * | 2015-11-27 | 2016-04-20 | 网神信息技术(北京)股份有限公司 | 关联事件类型的检测方法及装置 |
CN105718509A (zh) * | 2016-01-11 | 2016-06-29 | 北京交通大学 | 一种基于有向图关联规则音乐云推荐算法 |
CN107045532A (zh) * | 2017-01-20 | 2017-08-15 | 中国科学院电子学研究所 | 时空地理空间可视化的分析方法 |
CN107609107A (zh) * | 2017-09-13 | 2018-01-19 | 大连理工大学 | 一种基于多源城市数据的出行共现现象可视化分析方法 |
CN107633044A (zh) * | 2017-09-14 | 2018-01-26 | 国家计算机网络与信息安全管理中心 | 一种基于热点事件的舆情知识图谱构建方法 |
CN107633067A (zh) * | 2017-09-21 | 2018-01-26 | 北京工业大学 | 一种基于人员行为规律和数据挖掘方法的群体识别方法 |
-
2018
- 2018-10-17 CN CN201811208262.1A patent/CN109543876A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101578603A (zh) * | 2006-11-14 | 2009-11-11 | 谷歌公司 | 事件搜索 |
CN102364473A (zh) * | 2011-11-09 | 2012-02-29 | 中国科学院自动化研究所 | 融合地理信息与视觉信息的网络新闻检索系统及方法 |
CN103065474A (zh) * | 2012-12-28 | 2013-04-24 | 杨涛 | 基于gprs/gps的城市道路养护需求自发报告系统 |
CN103341506A (zh) * | 2013-07-10 | 2013-10-09 | 鞍钢股份有限公司 | 一种基于数据模式的板形时间序列数据挖掘方法 |
CN103955505A (zh) * | 2014-04-24 | 2014-07-30 | 中国科学院信息工程研究所 | 一种基于微博的事件实时监测方法及系统 |
CN105512210A (zh) * | 2015-11-27 | 2016-04-20 | 网神信息技术(北京)股份有限公司 | 关联事件类型的检测方法及装置 |
CN105718509A (zh) * | 2016-01-11 | 2016-06-29 | 北京交通大学 | 一种基于有向图关联规则音乐云推荐算法 |
CN107045532A (zh) * | 2017-01-20 | 2017-08-15 | 中国科学院电子学研究所 | 时空地理空间可视化的分析方法 |
CN107609107A (zh) * | 2017-09-13 | 2018-01-19 | 大连理工大学 | 一种基于多源城市数据的出行共现现象可视化分析方法 |
CN107633044A (zh) * | 2017-09-14 | 2018-01-26 | 国家计算机网络与信息安全管理中心 | 一种基于热点事件的舆情知识图谱构建方法 |
CN107633067A (zh) * | 2017-09-21 | 2018-01-26 | 北京工业大学 | 一种基于人员行为规律和数据挖掘方法的群体识别方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737321A (zh) * | 2020-07-02 | 2020-10-02 | 大连理工大学人工智能大连研究院 | 基于数据挖掘的城市大气污染联防联控区域划分方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
He et al. | The impact of urban growth patterns on urban vitality in newly built-up areas based on an association rules analysis using geographical ‘big data’ | |
Souza et al. | City Information Modelling as a support decision tool for planning and management of cities: A systematic literature review and bibliometric analysis | |
Hegazy et al. | Monitoring urban growth and land use change detection with GIS and remote sensing techniques in Daqahlia governorate Egypt | |
US7801842B2 (en) | Method and system for spatial behavior modification based on geospatial modeling | |
US7917458B2 (en) | Temporal-influenced geospatial modeling system and method | |
Pham et al. | Urban growth and change analysis using remote sensing and spatial metrics from 1975 to 2003 for Hanoi, Vietnam | |
Liu et al. | Simulating urban dynamics in China using a gradient cellular automata model based on S-shaped curve evolution characteristics | |
Benedetti et al. | Sampling spatial units for agricultural surveys | |
US20080082472A1 (en) | Event, threat and result change detection system and method | |
Wang et al. | A patch‐based cellular automaton for simulating land‐use changes at fine spatial resolution | |
Maddahi et al. | Land suitability analysis for rice cultivation using multi criteria evaluation approach and GIS | |
Cheng et al. | Remote sensing and social sensing data fusion for fine-resolution population mapping with a multimodel neural network | |
Ye et al. | Urban commerce distribution analysis based on street view and deep learning | |
McCool | PRAGIS: a test case for a web-based archaeological GIS | |
Liang et al. | Modeling urban growth in the middle basin of the Heihe River, northwest China | |
Wang et al. | Simulating large-scale urban land-use patterns and dynamics using the U-Net deep learning architecture | |
CN111984701A (zh) | 乡村聚落演化的预测方法、装置、设备及存储介质 | |
Yuan et al. | Using street view images and a geographical detector to understand how street-level built environment is associated with urban poverty: A case study in Guangzhou | |
Gao et al. | Identifying priority areas for ecological conservation and restoration based on circuit theory and dynamic weighted complex network: A case study of the Sichuan Basin | |
CN109543876A (zh) | 一种城市问题的可视化分析方法 | |
Stanislawski et al. | A rapid approach for automated comparison of independently derived stream networks | |
Mudigonda et al. | Deep learning for detecting extreme weather patterns | |
Colston et al. | Using Geospatial Analysis to Inform Decision Making In Targeting Health Facility-Based Programs | |
Olaniyi et al. | Characterization of drivers of agricultural land use change | |
Ivanković et al. | Web visualization of data from numerical models and real-time stations network in frame of Adriatic Sea and Coast (AdriSC) Meteotsunami Forecast |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190329 |
|
WD01 | Invention patent application deemed withdrawn after publication |