CN116401568A - 一种基于密度聚类的事件多发区域智能划分方法 - Google Patents
一种基于密度聚类的事件多发区域智能划分方法 Download PDFInfo
- Publication number
- CN116401568A CN116401568A CN202310051518.7A CN202310051518A CN116401568A CN 116401568 A CN116401568 A CN 116401568A CN 202310051518 A CN202310051518 A CN 202310051518A CN 116401568 A CN116401568 A CN 116401568A
- Authority
- CN
- China
- Prior art keywords
- data
- event
- neighborhood
- sample
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000005096 rolling process Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000007619 statistical method Methods 0.000 abstract description 3
- 238000004458 analytical method Methods 0.000 abstract description 2
- 231100000279 safety data Toxicity 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Primary Health Care (AREA)
- Economics (AREA)
- Medical Informatics (AREA)
- Development Economics (AREA)
- Computing Systems (AREA)
- Marketing (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Human Resources & Organizations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于密度聚类的事件多发区域智能划分方法,涉及车社会公共安全数据智能分析领域。本发明包括以下步骤:获取某市某区的事件数据;将原始的事件数据预处理,得到统一规范后的数据;对预处理后的数据用密度聚类算法聚类,得到所有类别及每一类别对应的数据;对每一类别数据提取边界点,得到对应的边界轮廓;进一步整理得到事件信息。本发明针对性强,智能高效,利用密度聚类算法,能够快速有效地智能规划出事件多发区域,一定程度上解决了事件多发区域依靠传统人工经验或统计分析方法判断的局限性,为科学出勤提供了切实有力的数据支撑。
Description
技术领域
本发明属于数据智能分析领域,特别是涉及一种基于密度聚类的事件多发区域智能划分方法。
背景技术
随着科技的进步,尤其是近几年大数据、人工智能的普及和应用,积极探索并采用高效智能的事件重点区域规划方法,为精准化出勤提供了科学有效的数据支撑。如CN110929915A所公开的事件发生区域的智能预警模型建立方法、装置及存储介质技术,其具体是根据预设时间内的对象流量信息、目标区域和历史事件数据,通过二者对长短期记忆模型进行训练后所获得的目标函数,从而根据目标函数对待预测区域的预测信息进行挖掘和分析,获得待预测区域所对应的事件发生概率。该技术方案是先确定区域再进行预警,且并未考虑到天气、节假日等差异造成的区域变化的影响,并且也没有给出对应的事件划分的区域范围或轮廓。
发明内容
本发明提供了一种基于密度聚类的事件多发区域智能划分方法,解决了以上问题。
本发明的目的就是为了克服上述现有技术存在的不足,而提供的一种基于密度聚类的事件多发区域智能划分方法,通过对历史事件数据按时间轴、天气、节假日等多维度信息建立数据集,又采用密度聚类机器学习算法对数据聚类,然后使用滚球算法对每一类别数据提取边界点,最终进一步处理得到每个事件多发区域中心点经纬、边界轮廓点、面积、事件数量等信息。本发明针对性强,智能高效,一定程度上解决了事件多发区域依靠传统人工经验或统计分析方法判断的局限性,为科学出勤提供了有力的数据支撑。
本发明的一种基于密度聚类的事件多发区域智能划分方法,包括如下步骤:
S1、获取某市某区的事件数据;
S2、将所获得的原始的事件数据进行预处理,得到统一规范后的数据;该步骤具体为:
S21、数据清洗,删除无效的上报数据,得到事件所对应的包括时间、进度、维度、上报单编号在内的信息;
S22、根据时间序列,按照包括日期、小时、天气、节假日在内的多维度进行划分数据;
S3、对预处理后的数据用密度聚类算法聚类,得到所有类别及每一类别对应的数据,该步骤具体为:
S31、设置领域距离ε和核心点邻域最小样本数目m,组成邻域参数[ε,m];输入数据样本集P={p1,p2,…,pi},其中pi=[xi,yi],xi、yi分别是第i个事件样本的经度和纬度;
S32、在样本集P中,计算出每个样本点pj在半径ε邻域内的所有邻域样本点pk,且包括该样本点,并组成对应的邻域集合:
Nε(pj)={p1,p2,…,pk},dist(pj,pk)≤ε,pj∈P,Nε(pj),pk∈P;
其中,dist(pj,pk)为计算两个经纬度样本点的球面距离函数,如公式(1),pj=[xj,yj],pk=[xk,yk],R=6371393是地球的均匀球体半径;
S33、计算每个样本点pj在半径ε邻域内的所有邻域样本点pk的总数k=sum(Nε(pj)),如果k≥m,即邻域样本点总数k不小于设置的核心点邻域最小样本数目m,则该样本点pj为核心点;
S34、找到所有的核心点,并组成核心点集合C={p1,p2,…,pc},其中pc是第c个核心点;
S35、在核心点集合C中,如果一个核心点pi在另一个核心点pj的邻域内,则合并这两个核心点和对应的邻域样本点,并更新核心点集合C;
S36、重复步骤S35,直至核心点集合C中,任意一个核心点都不在其他核心点的邻域内;
S37、返回最终的核心点集合C和每个核心点对应的邻域样本点集合,即为密度聚类出来所有类别及每一类别对应的数据;
S4、对每一类别数据提取边界点,得到对应的边界轮廓;该步骤具体是用滚球法对每一类别数据提取边界点,得到对应的边界轮廓;
S5、进一步整理得到事件信息,所得事件信息包括每个事件多发区域中心点经纬、边界轮廓点、面积、事件数量在内的信息。
本发明相对于现有技术包括有以下有益效果:
(1)与现有技术相比,本发明实现了对历史事件数据按时间轴、天气、节假日等多维度信息建立数据集,又采用密度聚类机器学习算法对数据聚类,然后使用滚球算法对每一类别数据提取边界点,最终进一步处理得到每个事件多发区域中心点经纬、边界轮廓点、面积、事件数量等信息。
(2)本发明针对性强,智能高效,利用密度聚类算法,能够快速有效地智能规划出勤情多发区域,一定程度上解决了事件多发区域依靠传统人工经验或统计分析方法判断的局限性,为科学出勤提供了切实有力的数据支撑。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种基于密度聚类的事件多发区域智能划分方法的步骤图;
图2为具体实施例中以某市某区2022年7月14日事件数据预处理后部分经纬度坐标点展示图;
图3为具体实施例中以某市某区2022年7月14日预处理后的事件数据所对应的经过密度聚类结果部分经纬度坐标点展示图;
图4为具体实施例中对密度聚类结果中每一类别数据提取边界点对应的的展示图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明的实验测试是在2个8核CPU Intel(R)Xeon(R)CPU E5630@2.53GHz,2个GPUGeForce RTX 3090,Python的版本为Python3.7.9;
下面按照图1的流程图详细给出本发明技术方案中所涉及的各个步骤细节做出说明:本发明的一种基于密度聚类的事件多发区域智能划分方法,包括如下步骤:
S1、获取某市某区的事件数据;举例来说,从某市某区的事件数据库中,获取至少包括上报时间、编号、经度、维度;
S2、将所获得的原始的事件数据进行预处理,得到统一规范后的数据;该步骤具体为:
S21、数据清洗,删除无效的上报数据,得到事件所对应的包括时间、进度、维度、上报单编号在内的信息;
S22、根据时间序列,按照包括日期、小时、天气、节假日在内的多维度进行划分数据;某市某区2022年7月14日事件数据预处理后部分经纬度坐标点展示如图2所示;
S3、对预处理后的数据用密度聚类算法聚类,得到所有类别及每一类别对应的数据,该步骤具体为:
S31、设置领域距离ε和核心点邻域最小样本数目m,组成邻域参数[ε,m];输入数据样本集P={p1,p2,…,pi},其中pi=[xi,yi],xi、yi分别是第i个事件样本的经度和纬度;
S32、在样本集P中,计算出每个样本点pj在半径ε邻域内的所有邻域样本点pk,且包括该样本点,并组成对应的邻域集合:
Nε(pj)={p1,p2,…,pk},dist(pj,pk)≤ε,pj∈P,Nε(pj),pk∈P;
其中,dist(pj,pk)为计算两个经纬度样本点的球面距离函数,如公式(1),pj=[xj,yj],pk=[xk,yk],R=6371393是地球的均匀球体半径;
S33、计算每个样本点pj在半径ε邻域内的所有邻域样本点pk的总数k=sum(Nε(pj)),如果k≥m,即邻域样本点总数k不小于设置的核心点邻域最小样本数目m,则该样本点pj为核心点;
S34、找到所有的核心点,并组成核心点集合C={p1,p2,…,pc},其中pc是第c个核心点;
S35、在核心点集合C中,如果一个核心点pi在另一个核心点pj的邻域内,则合并这两个核心点和对应的邻域样本点,并更新核心点集合C;
S36、重复步骤S35,直至核心点集合C中,任意一个核心点都不在其他核心点的邻域内;
S37、返回最终的核心点集合C和每个核心点对应的邻域样本点集合,即为密度聚类出来所有类别及每一类别对应的数据;对某市某区2022年7月14日预处理后的事件数据,用邻域距离ε=600米和核心点邻域最小样本数目m=6组合参数,密度聚类结果如图3所示;
S4、对每一类别数据提取边界点,得到对应的边界轮廓;该步骤具体是用滚球法(alpha shape)对每一类别数据提取边界点,得到对应的边界轮廓;对密度聚类结果中每一类别数据提取边界点,如图4所示;
S5、进一步整理得到事件信息,所得事件信息包括每个事件多发区域中心点经纬、边界轮廓点、面积、事件数量在内的信息。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (1)
1.一种基于密度聚类的事件多发区域智能划分方法,其特征在于,包括如下步骤:
S1、获取某市某区的事件数据;
S2、将所获得的原始的事件数据进行预处理,得到统一规范后的数据;该步骤具体为:
S21、数据清洗,删除无效的上报数据,得到事件所对应的包括时间、进度、维度、上报单编号在内的信息;
S22、根据时间序列,按照包括日期、小时、天气、节假日在内的多维度进行划分数据;
S3、对预处理后的数据用密度聚类算法聚类,得到所有类别及每一类别对应的数据,该步骤具体为:
S31、设置领域距离ε和核心点邻域最小样本数目m,组成邻域参数[ε,m];输入数据样本集P={p1,p2,...,pi},其中pi=[xi,yi],xi、yi分别是第i个事件样本的经度和纬度;
S32、在样本集P中,计算出每个样本点pj在半径ε邻域内的所有邻域样本点pk,且包括该样本点,并组成对应的邻域集合:
Nε(pj)={p1,p2,...,pk},dist(pj,pk)≤ε,pj∈P,Nε(pj),pk∈P;
其中,dist(pj,pk)为计算两个经纬度样本点的球面距离函数,如公式(1),pj=[xj,yj],pk=[xk,yk],R=6371393是地球的均匀球体半径;
S33、计算每个样本点pj在半径ε邻域内的所有邻域样本点pk的总数k=sum(Nε(pj)),如果k≥m,即邻域样本点总数k不小于设置的核心点邻域最小样本数目m,则该样本点pj为核心点;
S34、找到所有的核心点,并组成核心点集合C={p1,p2,...,pc},其中pc是第c个核心点;
S35、在核心点集合C中,如果一个核心点pi在另一个核心点pj的邻域内,则合并这两个核心点和对应的邻域样本点,并更新核心点集合C;
S36、重复步骤S35,直至核心点集合C中,任意一个核心点都不在其他核心点的邻域内;
S37、返回最终的核心点集合C和每个核心点对应的邻域样本点集合,即为密度聚类出来所有类别及每一类别对应的数据;
S4、对每一类别数据提取边界点,得到对应的边界轮廓;该步骤具体是用滚球法对每一类别数据提取边界点,得到对应的边界轮廓;
S5、进一步整理得到事件信息,所得事件信息包括每个事件多发区域中心点经纬、边界轮廓点、面积、事件数量在内的信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310051518.7A CN116401568A (zh) | 2023-02-02 | 2023-02-02 | 一种基于密度聚类的事件多发区域智能划分方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310051518.7A CN116401568A (zh) | 2023-02-02 | 2023-02-02 | 一种基于密度聚类的事件多发区域智能划分方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116401568A true CN116401568A (zh) | 2023-07-07 |
Family
ID=87016698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310051518.7A Pending CN116401568A (zh) | 2023-02-02 | 2023-02-02 | 一种基于密度聚类的事件多发区域智能划分方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116401568A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103035009A (zh) * | 2012-12-19 | 2013-04-10 | 长春工业大学 | 一种基于ct影像的肺结节边缘重建与分割方法 |
CN111241208A (zh) * | 2019-12-31 | 2020-06-05 | 安徽中科大国祯信息科技有限责任公司 | 一种周期性时序数据的异常监测方法及装置 |
CN112131381A (zh) * | 2020-08-20 | 2020-12-25 | 彭涛 | 警情高发地的识别方法、装置、电子设备及存储介质 |
CN113392338A (zh) * | 2021-06-11 | 2021-09-14 | 中国联合网络通信集团有限公司 | 热点区域定位方法、装置、设备及存储介质 |
WO2022032781A1 (zh) * | 2020-08-12 | 2022-02-17 | 深圳技术大学 | 车流量特征提取方法及系统 |
CN114528619A (zh) * | 2022-01-24 | 2022-05-24 | 中国人民解放军战略支援部队信息工程大学 | 一种居民地约束下的道路网综合方法 |
-
2023
- 2023-02-02 CN CN202310051518.7A patent/CN116401568A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103035009A (zh) * | 2012-12-19 | 2013-04-10 | 长春工业大学 | 一种基于ct影像的肺结节边缘重建与分割方法 |
CN111241208A (zh) * | 2019-12-31 | 2020-06-05 | 安徽中科大国祯信息科技有限责任公司 | 一种周期性时序数据的异常监测方法及装置 |
WO2022032781A1 (zh) * | 2020-08-12 | 2022-02-17 | 深圳技术大学 | 车流量特征提取方法及系统 |
CN112131381A (zh) * | 2020-08-20 | 2020-12-25 | 彭涛 | 警情高发地的识别方法、装置、电子设备及存储介质 |
CN113392338A (zh) * | 2021-06-11 | 2021-09-14 | 中国联合网络通信集团有限公司 | 热点区域定位方法、装置、设备及存储介质 |
CN114528619A (zh) * | 2022-01-24 | 2022-05-24 | 中国人民解放军战略支援部队信息工程大学 | 一种居民地约束下的道路网综合方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110136154B (zh) | 基于全卷积网络与形态学处理的遥感图像语义分割方法 | |
CN110705457B (zh) | 一种遥感影像建筑物变化检测方法 | |
Pijanowski et al. | Modelling urbanization patterns in two diverse regions of the world | |
CN111652892A (zh) | 一种基于深度学习的遥感影像建筑物矢量提取及优化方法 | |
Meng et al. | Automatic classification of rural building characteristics using deep learning methods on oblique photography | |
CN115512216A (zh) | 耦合街区时空特征和集成学习的城市功能区精细化识别方法 | |
CN109815859A (zh) | 一种低等级道路自动提取及变化分析方法 | |
Xu et al. | Multilane roads extracted from the OpenStreetMap urban road network using random forests | |
CN116595121B (zh) | 一种基于遥感技术数据显示监测系统 | |
CN114283285A (zh) | 交叉一致性自训练遥感图像语义分割网络训练方法及装置 | |
CN111860596A (zh) | 基于深度学习的无监督路面裂缝分类方法及模型建立方法 | |
CN116662468A (zh) | 基于地理对象空间模式特征的城市功能区识别方法及系统 | |
CN112101132B (zh) | 一种基于图嵌入模型和度量学习的交通状况预测方法 | |
CN111833224A (zh) | 一种基于人口栅格数据的城市主副中心边界识别方法 | |
Cheng et al. | Generating high-resolution climate prediction through generative adversarial network | |
CN117152427A (zh) | 基于扩散模型和知识蒸馏的遥感图像语义分割方法与系统 | |
CN117975131A (zh) | 基于深度学习和密度聚类的城市道路交通事故黑点预测方法及系统 | |
CN118014297A (zh) | 一种户外健身设施供需响应度智能评测方法及系统 | |
CN116401568A (zh) | 一种基于密度聚类的事件多发区域智能划分方法 | |
CN116110210B (zh) | 复杂环境下数据驱动的滑坡灾害辅助决策方法 | |
Ruiz-Lendínez et al. | Method for an automatic alignment of imagery and vector data applied to cadastral information in Poland | |
CN117874989A (zh) | 一种基于时空特征的无资料地区径流模拟预测方法及系统 | |
Madraky et al. | Analytic methods for spatio-temporal data in a nature-inspired data model | |
CN103336781A (zh) | 一种医学图像聚类方法 | |
Kaviani et al. | Urban growth pattern in Tehran City: Sustainability or unsustainability |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |