CN109190650A - 一种不规则形状的时空扫描聚类方法 - Google Patents
一种不规则形状的时空扫描聚类方法 Download PDFInfo
- Publication number
- CN109190650A CN109190650A CN201810720472.2A CN201810720472A CN109190650A CN 109190650 A CN109190650 A CN 109190650A CN 201810720472 A CN201810720472 A CN 201810720472A CN 109190650 A CN109190650 A CN 109190650A
- Authority
- CN
- China
- Prior art keywords
- space
- occurrence quantity
- scanning
- unit grid
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001788 irregular Effects 0.000 title claims abstract description 12
- 238000000034 method Methods 0.000 title claims abstract description 12
- 238000009826 distribution Methods 0.000 claims abstract description 10
- 238000000342 Monte Carlo simulation Methods 0.000 claims abstract description 7
- 238000010586 diagram Methods 0.000 claims abstract description 7
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000007476 Maximum Likelihood Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 3
- 238000009825 accumulation Methods 0.000 claims 1
- 238000004220 aggregation Methods 0.000 abstract description 5
- 230000002776 aggregation Effects 0.000 abstract description 5
- 238000007405 data analysis Methods 0.000 abstract description 2
- 230000004888 barrier function Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及一种不规则形状的时空扫描聚类方法,属于时空大数据分析技术领域。在时空领域中获取事例发生的实际地理位置坐标并将其转化成SHP点图层数据,对研究的空间区域进行面图层划分,形成正六边形的单元网格,分析判断点SHP和区域面图层的关系计算涉及的单元网格中该类事例的发生量,求出研究区域内此类事例的平均发生量,找出事例发生量超过平均发生量的单元网格,使用蚁群聚类原理让蚂蚁依次从此类单元格出发获取扫描聚类区域,研究事例基于泊松分布原理求出扫描区域内的最大对数似然函数比,使用蒙特卡罗法检验其聚集区域的聚类显著性。
Description
技术领域
本发明涉及一种不规则形状的时空扫描聚类方法,属于时空大数据分析技术领域。
背景技术
21世纪是互联网时代,互联网时代的到来造就了时空大数据,在生活中,许多领域事件的发生发展与时空分布紧密相关,将这些时空上大数据进行聚类综合分析,根据不同的领域提出对应的应对方案,让其提早做好想用的应对措施,大大的缩减了不必要的物资、劳力消耗,针对紧急事件为我们争取到时间,提前做好应对措施,为建造和谐的社会添加了一道有效屏障。
发明内容
本发明要解决的技术问题是提供一种不规则形状的时空扫描聚类方法,利用蚁群聚类原理寻找聚类区域,突破时空扫描窗口的限制,使得在进行时空扫描聚类时不再受窗口的限制,可以更加准确的获取聚类区域形状。
本发明的技术方案是:一种不规则形状的时空扫描聚类方法,在时空领域中获取事例发生的实际地理位置坐标并将其转化成SHP点图层数据,对研究的空间区域进行面图层划分,形成正六边形的单元网格,分析判断点SHP和区域面图层的关系计算涉及的单元网格中该类事例的发生量,求出研究区域内此类事例的平均发生量,找出事例发生量超过平均发生量的单元网格,使用蚁群聚类原理让蚂蚁依次从此类单元格出发获取扫描聚类区域,研究事例基于泊松分布原理求出扫描区域内的最大对数似然函数比,使用蒙特卡罗法检验其聚集区域的聚类显著性。
具体步骤为:
Step1:获取研究领域内事例发生的具体地理坐标(x,y),将其坐标转换成SPH点图层数据;
Step2:确定研究区域面图层,将其进行网格划分,把整个研究区域面图层划分成正六边形单元网格,将单元网格依次进行标号m1,m2,…mi;
Step3:分析在空间区域图层上SPH点与单元网格的位置关系,得出在网格中包含的SPH 点,求出单元网格中确定时间段内的事例发生量
Step4:计算该空间区域确定时间段内此事例发生的所有位置个数n以及事例的总发生量 A,计算这段时间内此空间区域的事例平均发生量μ;
Step5:找出蚂蚁出发的单元网格:设定单元网格中在确定时间段内的事例发生量的单元网格作为蚂蚁随机的出发点;
Step6:蚁群根据最优路径原则从出发点出发,获取到完整的扫描聚类区域,统计此区域中单元网格的数量,统计该扫描聚类区域中事例总发生量
Step7:设定此事例发生服从泊松分布,计算该扫描聚类区域的对数似然函数比LLR;
Step8:采用蒙特卡罗法检验其聚类区域的聚类显著性:根据事例总数产生一系列随机分布数据集N个,求出每个数据集的最大似然函数比LLR,把真实数据集的LLR与N个随机数据集的LLR进行递减排序,寻找真实数据集的LLR排列的位置R,计算其值越小,设小于0.1,表示该聚集为随机的概率越小;
所述步骤step4中,对确定时间内研究空间区域内事例平均发生量的公式为:
其中:A为选定时间内研究区域的总事例发生量,n为该空间区域、确定时间段内此事例发生的所有位置个数。
所述步骤step7中计算扫描聚类区域的对数似然函数比的公式为:
其中,A为选定时间段内研究区域的总事例发生量,ami为选定时间段扫描聚类区域中事例总发生量,μ选定时间段内研究区域的平均事例发生量。
本发明的有益效果是:本发明考虑了对具有时空特征的事例进行时空扫描聚类分析时,其圆形的扫描窗口对聚集区域有很大的限制,发明中利用利用蚁群聚类原理寻找聚类区域,通过蚁群进行最优化路劲圈绕扫描到所需的聚集区域,突破时空扫描窗口的限制,使得在进行时空扫描聚类时不再受窗口的限制,可以更加准确的获取聚类区域形状。
附图说明
图1是本发明的步骤流程图;
图2是本发明step2中得到的单元网格区域面图层图;
图3是本发明蚁群扫描得到的不规则聚类区域图。
具体实施方式
下面结合附图和具体实施方式,对本发明作进一步说明。
实施例1:如图1所示,一种不规则形状的时空扫描聚类方法,在时空领域中获取事例发生的实际地理位置坐标并将其转化成SHP点图层数据,对研究的空间区域进行面图层划分,形成正六边形的单元网格,分析判断点SHP和区域面图层的关系计算涉及的单元网格中该类事例的发生量,求出研究区域内此类事例的平均发生量,找出事例发生量超过平均发生量的单元网格,使用蚁群聚类原理让蚂蚁依次从此类单元格出发获取扫描聚类区域,研究事例基于泊松分布原理求出扫描区域内的最大对数似然函数比,使用蒙特卡罗法检验其聚集区域的聚类显著性。
具体步骤为:
Step1:获取研究领域内事例发生的具体地理坐标(x,y),将其坐标转换成SPH点图层数据;
Step2:确定研究区域面图层,将其进行网格划分,把整个研究区域面图层划分成正六边形单元网格,将单元网格依次进行标号m1,m2,…mi;
Step3:分析在空间区域图层上SPH点与单元网格的位置关系,得出在网格中包含的SPH 点,求出单元网格中确定时间段内的事例发生量
Step4:计算该空间区域确定时间段内此事例发生的所有位置个数n以及事例的总发生量 A,计算这段时间内此空间区域的事例平均发生量μ;
Step5:找出蚂蚁出发的单元网格:设定单元网格中在确定时间段内的事例发生量的单元网格作为蚂蚁随机的出发点;
Step6:蚁群根据最优路径原则从出发点出发,获取到完整的扫描聚类区域,统计此区域中单元网格的数量,统计该扫描聚类区域中事例总发生量
Step7:设定此事例发生服从泊松分布,计算该扫描聚类区域的对数似然函数比LLR;
Step8:采用蒙特卡罗法检验其聚类区域的聚类显著性:根据事例总数产生一系列随机分布数据集N个,求出每个数据集的最大似然函数比LLR,把真实数据集的LLR与N个随机数据集的LLR进行递减排序,寻找真实数据集的LLR排列的位置R,计算当其值越小,设小于0.1,表示该聚集为随机的概率越小;
所述步骤step4中,对确定时间内研究空间区域内事例平均发生量的公式为:
其中:A为选定时间内研究区域的总事例发生量,n为该空间区域、确定时间段内此事例发生的所有位置个数。
所述步骤step7中计算扫描聚类区域的对数似然函数比的公式为:
其中,A为选定时间段内研究区域的总事例发生量,ami为选定时间段扫描聚类区域中事例总发生量,μ选定时间段内研究区域的平均事例发生量。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
Claims (4)
1.一种不规则形状的时空扫描聚类方法,其特征在于:在时空领域中获取事例发生的实际地理位置坐标并将其转化成SHP点图层数据,对研究的空间区域进行面图层划分,形成正六边形的单元网格,分析判断点SHP和区域面图层的关系计算涉及的单元网格中该类事例的发生量,求出研究区域内此类事例的平均发生量,找出事例发生量超过平均发生量的单元网格,使用蚁群聚类原理让蚂蚁依次从此类单元格出发获取扫描聚类区域,研究事例基于泊松分布原理求出扫描区域内的最大对数似然函数比,使用蒙特卡罗法检验其聚集区域的聚类显著性。
2.根据权利要求1所述的不规则形状的时空扫描聚类方法,其特征在于具体步骤为:
Step1:获取研究领域内事例发生的具体地理坐标(x,y),将其坐标转换成SPH点图层数据;
Step2:确定研究区域面图层,将其进行网格划分,把整个研究区域面图层划分成正六边形单元网格,将单元网格依次进行标号m1,m2,…mi;
Step3:分析在空间区域图层上SPH点与单元网格的位置关系,得出在网格中包含的SPH点,求出单元网格中确定时间段内的事例发生量
Step4:计算该空间区域确定时间段内此事例发生的所有位置个数n以及事例的总发生量A,计算这段时间内此空间区域的事例平均发生量μ;
Step5:找出蚂蚁出发的单元网格:设定单元网格中在确定时间段内的事例发生量的单元网格作为蚂蚁随机的出发点;
Step6:蚁群根据最优路径原则从出发点出发,获取到完整的扫描聚类区域,统计此区域中单元网格的数量,统计该扫描聚类区域中事例总发生量
Step7:设定此事例发生服从泊松分布,计算该扫描聚类区域的对数似然函数比LLR;
Step8:采用蒙特卡罗法检验其聚类区域的聚类显著性:根据事例总数产生一系列随机分布数据集N个,求出每个数据集的最大似然函数比LLR,把真实数据集的LLR与N个随机数据集的LLR进行递减排序,寻找真实数据集的LLR排列的位置R,计算当其值越小,设小于0.1,表示该聚集为随机的概率越小。
3.根据权利2所述的不规则形状的时空扫描聚类方法,其特征在于:所述步骤step4中,对确定时间内研究空间区域内事例平均发生量的公式为:
其中:A为选定时间内研究区域的总事例发生量,n为该空间区域、确定时间段内此事例发生的所有位置个数。
4.根据权利2所述的不规则形状的时空扫描聚类方法,其特征在于:所述步骤step7中计算扫描聚类区域的对数似然函数比的公式为:
其中,A为选定时间段内研究区域的总事例发生量,ami为选定时间段扫描聚类区域中事例总发生量,μ选定时间段内研究区域的平均事例发生量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810720472.2A CN109190650A (zh) | 2018-07-02 | 2018-07-02 | 一种不规则形状的时空扫描聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810720472.2A CN109190650A (zh) | 2018-07-02 | 2018-07-02 | 一种不规则形状的时空扫描聚类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109190650A true CN109190650A (zh) | 2019-01-11 |
Family
ID=64948846
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810720472.2A Pending CN109190650A (zh) | 2018-07-02 | 2018-07-02 | 一种不规则形状的时空扫描聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109190650A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110930281A (zh) * | 2019-12-04 | 2020-03-27 | 中南大学 | 一种城市交通流社团结构统计检测的方法及系统 |
CN112288029A (zh) * | 2020-11-06 | 2021-01-29 | 电子科技大学 | 一种城市路网中车辆轨迹分类方法 |
CN112749354A (zh) * | 2020-12-29 | 2021-05-04 | 深圳赛安特技术服务有限公司 | 基于人工智能的数据扫描方法、装置、计算机设备及介质 |
CN112749619A (zh) * | 2020-11-20 | 2021-05-04 | 北京林业大学 | 一种松材线虫病时空聚集性的探测方法 |
CN113298302A (zh) * | 2021-05-18 | 2021-08-24 | 昆明理工大学 | 一种针对疾病预测的不规则形状时空扫描方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102646151A (zh) * | 2011-02-18 | 2012-08-22 | 四川大学 | 基于泊松分布的可变窗口前瞻性时空重排扫描算法 |
CN103869367A (zh) * | 2014-03-25 | 2014-06-18 | 中南大学 | 一种基于共享密度的地震事件时空聚集模式提取方法 |
CN104008390A (zh) * | 2013-02-25 | 2014-08-27 | 三星泰科威株式会社 | 用于检测异常运动的方法和设备 |
CN104268586A (zh) * | 2014-10-17 | 2015-01-07 | 北京邮电大学 | 一种多视角动作识别方法 |
CN106126918A (zh) * | 2016-06-23 | 2016-11-16 | 中国石油大学(华东) | 一种基于相互作用力的地理空间异常聚集区扫描统计方法 |
CN106383868A (zh) * | 2016-09-05 | 2017-02-08 | 电子科技大学 | 一种基于道路网络的时空轨迹聚类方法 |
-
2018
- 2018-07-02 CN CN201810720472.2A patent/CN109190650A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102646151A (zh) * | 2011-02-18 | 2012-08-22 | 四川大学 | 基于泊松分布的可变窗口前瞻性时空重排扫描算法 |
CN104008390A (zh) * | 2013-02-25 | 2014-08-27 | 三星泰科威株式会社 | 用于检测异常运动的方法和设备 |
CN103869367A (zh) * | 2014-03-25 | 2014-06-18 | 中南大学 | 一种基于共享密度的地震事件时空聚集模式提取方法 |
CN104268586A (zh) * | 2014-10-17 | 2015-01-07 | 北京邮电大学 | 一种多视角动作识别方法 |
CN106126918A (zh) * | 2016-06-23 | 2016-11-16 | 中国石油大学(华东) | 一种基于相互作用力的地理空间异常聚集区扫描统计方法 |
CN106383868A (zh) * | 2016-09-05 | 2017-02-08 | 电子科技大学 | 一种基于道路网络的时空轨迹聚类方法 |
Non-Patent Citations (5)
Title |
---|
YOU WAN 等: "ACOMCD: A multiple cluster detection algorithm based on the spatial scan statistic and ant colony optimization", 《COMPUTATIONAL STATISTICS AND DATA ANALYSIS》 * |
万幼 等: "点集数据不规则形状时空异常聚类模式挖掘研究", 《武汉大学学报信息科学版》 * |
唐建波 等: "时空事件聚类分析方法研究", 《地理信息世界》 * |
朱凤才 等: "《公共卫生应急理论与实践》", 30 November 2017, 《东南大学出版社》 * |
鲍世方 等: "犯罪时空扫描统计分析研究与实践", 《微型电脑应用》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110930281A (zh) * | 2019-12-04 | 2020-03-27 | 中南大学 | 一种城市交通流社团结构统计检测的方法及系统 |
CN110930281B (zh) * | 2019-12-04 | 2023-10-03 | 中南大学 | 一种城市交通流社团结构统计检测的方法及系统 |
CN112288029A (zh) * | 2020-11-06 | 2021-01-29 | 电子科技大学 | 一种城市路网中车辆轨迹分类方法 |
CN112749619A (zh) * | 2020-11-20 | 2021-05-04 | 北京林业大学 | 一种松材线虫病时空聚集性的探测方法 |
CN112749354A (zh) * | 2020-12-29 | 2021-05-04 | 深圳赛安特技术服务有限公司 | 基于人工智能的数据扫描方法、装置、计算机设备及介质 |
CN112749354B (zh) * | 2020-12-29 | 2024-04-02 | 深圳赛安特技术服务有限公司 | 基于人工智能的数据扫描方法、装置、计算机设备及介质 |
CN113298302A (zh) * | 2021-05-18 | 2021-08-24 | 昆明理工大学 | 一种针对疾病预测的不规则形状时空扫描方法 |
CN113298302B (zh) * | 2021-05-18 | 2022-06-28 | 昆明理工大学 | 一种针对疾病预测的不规则形状时空扫描方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109190650A (zh) | 一种不规则形状的时空扫描聚类方法 | |
CN104992072B (zh) | 基于空间网格剖分的作业地块自动识别与面积统计方法 | |
Ram et al. | A density based algorithm for discovering density varied clusters in large spatial databases | |
Dong et al. | An Intrusion Detection Model for Wireless Sensor Network Based on Information Gain Ratio and Bagging Algorithm. | |
Duczmal et al. | A genetic algorithm for irregularly shaped spatial scan statistics | |
Tan et al. | Exploiting data fusion to improve the coverage of wireless sensor networks | |
CN110389982A (zh) | 一种基于空气质量数据的时空模式可视分析系统及方法 | |
CN107070968B (zh) | 对监控区域部署传感器的方法 | |
CN105634593B (zh) | 一种基于遗传算法的室内可见光通信led阵列布局优化方法 | |
CN106651031B (zh) | 基于历史信息的雷击闪络预警方法及系统 | |
CN104280612B (zh) | 一种基于单频电流传输特性的分布式谐波源辨识方法 | |
CN105244387B (zh) | 一种光电导探测器 | |
CN103440525A (zh) | 基于Vague值相似度量改进算法的城市湖库水华应急治理多目标多层次决策方法 | |
CN109120230B (zh) | 一种太阳能电池片el图像检测和缺陷识别方法 | |
CN106649339A (zh) | 离群点的挖掘方法及挖掘装置 | |
CN101917777B (zh) | 基于邻居节点间协作的无线传感器网络节点休眠资格判断方法 | |
Du et al. | LTrust: An adaptive trust model based on LSTM for underwater acoustic sensor networks | |
CN109360659B (zh) | 一种基于相对风险偏差和空间参量修正的时空扫描统计方法 | |
Huang et al. | A novel sequence tensor recovery algorithm for quick and accurate anomaly detection | |
CN102339171B (zh) | 一种红外触摸系统及多点信号扫描计算方法 | |
CN104182407B (zh) | 一种缩小数据查找范围的数据处理系统 | |
CN110097072B (zh) | 一种基于二分模块度的模糊聚类评价方法 | |
CN109409638A (zh) | 一种基于不规则形状时空扫描统计的犯罪预警方法 | |
CN115002788B (zh) | 一种用于道路健康检测的有向传感器网络覆盖优化方法 | |
CN109065168A (zh) | 一种基于时空聚类统计进行疾病风险评估的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190111 |
|
RJ01 | Rejection of invention patent application after publication |