CN110309935A - 一种基于改进starma模型的犯罪预测方法 - Google Patents
一种基于改进starma模型的犯罪预测方法 Download PDFInfo
- Publication number
- CN110309935A CN110309935A CN201910232008.3A CN201910232008A CN110309935A CN 110309935 A CN110309935 A CN 110309935A CN 201910232008 A CN201910232008 A CN 201910232008A CN 110309935 A CN110309935 A CN 110309935A
- Authority
- CN
- China
- Prior art keywords
- crime
- data
- matrix
- trip
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000011159 matrix material Substances 0.000 claims abstract description 108
- 239000000284 extract Substances 0.000 claims abstract description 12
- 238000010219 correlation analysis Methods 0.000 claims abstract description 7
- 238000000605 extraction Methods 0.000 claims abstract description 7
- 238000004458 analytical method Methods 0.000 claims description 28
- 238000005311 autocorrelation function Methods 0.000 claims description 11
- 206010019133 Hangover Diseases 0.000 claims description 5
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000012821 model calculation Methods 0.000 claims description 3
- 230000010355 oscillation Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims 1
- 238000011161 development Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 241001123248 Arma Species 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Computer Security & Cryptography (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Alarm Systems (AREA)
Abstract
一种基于改进STARMA模型的犯罪预测方法,包括以下步骤:(1)获取待分析区域的出租车、犯罪、投诉电话数据集与地形信息;(2)数据集进行预处理,根据投诉电话数据集提取投诉电话矩阵;将犯罪数据转化为平稳序列;(3)根据地形信息与出租车数据,进行出行邻接滞后矩阵提取;(4)对平稳犯罪数据与出行邻接滞后矩阵作时空相关性分析,确定犯罪数据的时间与空间延迟阶数;(5)基于步骤(4)中得到的时间与空间延迟阶数,结合步骤(2)与步骤(3)中得到的平稳犯罪数据、出行邻接滞后矩阵与投诉电话矩阵,实现基于改进STARMA模型的犯罪预测。本发明预测精度较高。
Description
技术领域
本发明涉及犯罪预测与数据挖掘领域,具体涉及一种基于改进STARMA模型的犯罪预测方法。
背景技术
近年来,我国各类犯罪案件明显增多,公安部门所承担的压力也越来越大,已经影响到了社会秩序的稳定和社会经济的发展。面对严峻的社会形势,犯罪预测可以为有针对性的警力部署提供理论依据,预防犯罪的发生。
犯罪行为的分布和发生在时间上和空间上具有一定的规律性。所以一方面可以从时间的角度进行预测分析,例如时间序列法、双重移动平均法、指数平滑法、领先指标法和因素建模法等;另一方面,也可以使用空间序列方法从空间的角度进行预测分析,但是上述两类方法只能从时间或者空间维度进行犯罪预测,无法做出精准而全面的犯罪预测。
犯罪预测的核心是针对犯罪时间序列的变化趋势与区域空间的相关性来预测未来的犯罪行为的发展情况。所以可以同时考虑犯罪数据在时间以及空间上的相关性,依据犯罪的邻近区域传播性质与犯罪的时间趋势来进行犯罪预测分析。但是随着人民生活水平的不断提高,交通的不断发展,新的出行模式(例如出租车、地铁等)使“远距离”出行更为便利。并且实际社会人为的不确定性逻辑和社会关系的分裂化状态为犯罪防控带来了极大的困难。因此传统基于距离、邻域等因素构建的犯罪预测方法已经不能很好地进行犯罪预测分析。
发明内容
为了克服现有犯罪预测方法预测精度低并且考虑特征少的不足,本发明提出一种基于改进自回归移动平均模型(Time spatial autoregressive moving average,STARMA)的犯罪预测方法,区别于当前的犯罪预测方法,对空间权重矩阵,结合了静态的区域信息和动态的出租车流信息提出一种新的矩阵(出行邻接滞后矩阵)构建方法来衡量区域间的犯罪相关性,构建的出行邻接滞后矩阵具备了时间因素,区别于当前静态的权重矩阵构建方法。区别于传统的STARMA模型犯罪预测,考虑了包括出租车数据与投诉电话等多种特征对犯罪影响。在本发明提出的犯罪预测方法中,使用出行邻接滞后矩阵结合犯罪数据完成犯罪数据的时间与空间滞后阶数识别,用于犯罪预测分析。
为了解决上述技术问题,本发明提供的技术方案是:
一种基于改进STARMA模型的犯罪预测方法,该方法包括以下步骤:
(1)获取待分析区域的出租车、犯罪、投诉电话数据集与地形信息;
(2)对步骤(1)中得到的出租车、犯罪与投诉电话数据集进行预处理;根据投诉电话数据集提取投诉电话矩阵;将犯罪数据转化为平稳序列;
(3)根据步骤(1)与步骤(2)中得到的地形信息与出租车数据,进行出行邻接滞后矩阵提取;步骤如下:首先,根据区域间的邻接关系提取区域邻接权重矩阵;然后,根据区域间出租车出行量构建出行矩阵;最后,根据所得到的区域邻接权重矩阵与出行矩阵构建出行邻接滞后矩阵;
(4)对步骤(2)与步骤(3)中得到的平稳犯罪数据与出行邻接滞后矩阵作时空相关性分析,确定犯罪数据的时间与空间延迟阶数;
(5)基于步骤(4)中得到的时间与空间延迟阶数,结合步骤(2)与步骤(3)中得到的平稳犯罪数据、出行邻接滞后矩阵与投诉电话矩阵,实现基于改进STARMA模型的犯罪预测,过程如下:首先,基于(4)中得到的时间与空间延迟阶数对改进STARMA模型参数进行估计;然后,对所得出的模型残差进行检验是否满足要求。
进一步,所述步骤(2)中,数据的预处理包括如下步骤:
(2a)对步骤(1)中得到的出租车、犯罪与投诉电话数据进行去重,合并“ID”重复的数据;
(2b)对步骤(2a)中得到的出租车、犯罪与投诉电话数据进行筛选,删除不符合规则的数据;
(2c)对步骤(2b)中得到的出租车、犯罪数据进行补全,对步骤(2b)中得到的出租车与犯罪数据进行区域与坐标统计,对出租车与犯罪数据中区域缺失但坐标没有缺失的数据进行坐标映射,补全数据;
(2d)对步骤(2c)与步骤(2b)中得到的出租车、犯罪与投诉电话数据进行统一的时间格式变换;
(2e)对步骤(2d)中得到的出租车、犯罪与投诉电话数据按年份统计,统计三个数据集同时包含的年份,将不在年份集合的数据删除;
(2f)根据步骤(2e)中得到的投诉电话数据按月份统计每个区域拨打投诉电话的次数并差分构成投诉电话矩阵;
(2g)对步骤(2e)中得到的犯罪数据进行时间平稳性分析,计算犯罪数据的时间自相关性与时间偏相关性,若犯罪数据时间自相关与偏相关图截尾或者拖尾则数据平稳;
(2h)若犯罪数据平稳则结束步骤(2),若犯罪数据非平稳则进行数据差分得到平稳的犯罪数据。
再进一步,步骤(2b)的筛选过程为:对步骤(1)中得到的地形信息按区域统计,若由步骤(2a)中得到的出租车、犯罪与投诉电话数据区域信息不在统计区域内则删除。
进一步地,步骤(2g)的平稳性分析中,自相关与偏相关图截尾或者拖尾的判断方式为:1)截尾:在大于某个常数k后快速趋于0为k阶截尾;2)拖尾:始终有非零取值,不会在k大于某个常数后就恒等于零(或在0附近随机波动)。
更进一步,所述步骤(3)中,出行邻接滞后矩阵提取包括如下步骤:
(3a)提取一阶空间邻接权重矩阵;
公式如下:
(3b)提取二阶邻接权重矩阵;
公式如下:
(3c)提取出租车的出行矩阵;
公式如下:
其中fij表示以i为出发点以j为目标点的出行数据数量;wij表示两区域间的出行量相关度;
(3d)对步骤(3c)中得到的出行矩阵进行空间聚集特征单元统计。统计出行矩阵中每个犯罪空间聚集特征单元的值;
(3e)对步骤(3a)与(3b)中得到的一阶、二阶空间权重矩阵进行空间聚集特征的单元统计,确定空间权重矩阵中各单元数值为不为零的点;
(3f)由步骤(3d)与步骤(3e)中得到的出行矩阵构建出行邻接滞后矩阵模型的构建公式如下:
其中表示空间权重矩阵区域i行j列的值;表示出行矩阵i行j列的值;W表示出行邻接滞后矩阵。
所述步骤(4)中,犯罪时空相关性分析的步骤如下:
(4a)分析步骤(2)与步骤(3)中得到的犯罪数据与出行邻接滞后矩阵自相关性;
时空自相关分析公式如下所示:
式中ρk表示时空自相关系数;k表示时间延迟阶数;h表示空间延迟阶数;W(h)表示空间延迟期为h的出行邻接滞后矩阵;W(0)表示空间延迟期为0的出行邻接滞后矩阵,是一个单位矩阵;
(4b)分析步骤(2)与步骤(3)中得到的犯罪数据与出行邻接滞后矩阵偏相关性;
时空偏相关分析公式如下所示:
式中ρk表示时空自相关函数;k表示时间延迟阶数;h表示空间延迟阶数;ρ表示最大时间延迟;mk表示时间延迟k时的最大空间延迟;φkh表示时空偏相关系数;
(4c)由步骤(4a)与步骤(4b)中得到的自相关性与偏相关性进行延迟阶数分析确定时空序列的时间延迟阶数与空间延迟阶数。
再进一步地,由犯罪数据与出行邻接滞后矩阵自相关性与偏相关性进行延迟阶数分析的方法为:如果时空自相关函数和偏相关函数值两者都出现几何或者做阻尼振荡减少,选取值自相关系数大于多数点的延迟阶数作为时间与空间延迟阶数,延迟阶数不应大于所构建出行邻接滞后阶数。
所述步骤(5)中,基于步骤(4)中得到的时间与空间延迟阶数,结合步骤(2)与步骤(3)中得到的平稳犯罪数据、出行邻接滞后矩阵与投诉电话矩阵,实现基于改进STARMA模型的犯罪预测,改进STARMA模型运算公式如下所示:
E(ε)=0
Z(t)表示时空序列被解释变量;式中p表示模型的时间延迟阶数;E{·}表示数学期望运算符;mk与nk表示空间延迟阶数;αkhθkh与δ表示模型系数;X表示解释变量;ε(t)表示模型残差函数,时间与空间延迟阶数从相关图中偏自相关函数与自相关函数是否拖尾或截断进行判断。
要求模型的残差为白噪声,若是相关模型参数合理时,模型拟合的残差方为随机误差或白噪声。
与现有技术相比,本发明的有益效果表现在:
1使用本专利提出的犯罪预测方法可以采用不同时间的数据集来训练出行邻接滞后矩阵,构造的出行邻接滞后矩阵具有时效性。
2使用本专利提出的犯罪预测方法可以结合出行数据与地理信息来分析犯罪数据的时间与空间延迟阶数,所涵盖的因素更为广泛。
3本专利提出一种基于改进STARMA的犯罪预测方法,相较传统方法进行犯罪预测时可以取得更好的时空预测效果。
4本专利提出的犯罪预测方法,进行犯罪预测分析时,可以考虑多种数据集对犯罪产生的影响。
附图说明
图1是出行邻接滞后矩阵构建流程图。
图2是本发明改进STARMA模型的犯罪预测方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例1对本发明进行进一步描述。
实施例1:
参照图1和图2,1、一种基于改进STARMA模型的犯罪预测方法,所选取的数据为网上公开下载的美国芝加哥犯罪数据、社区地形信息和出租车出行记录,包括以下步骤:
(1)获取待分析区域的出租车、犯罪、投诉电话数据集与地形信息;
(2)对步骤(1)中得到的出租车、犯罪与投诉电话数据集进行预处理;根据投诉电话数据集提取投诉电话矩阵;将犯罪数据转化为平稳序列;
进一步地,所述步骤(2)中,数据的预处理包括如下步骤:
(2a)对步骤(1)中得到的出租车、犯罪与投诉电话数据进行去重,合并“ID”重复的数据;
(2b)对步骤(2a)中得到的出租车、犯罪与投诉电话数据进行筛选,删除不符合规则的数据;
再进一步地,步骤(2b)的筛选过程为:对步骤(1)中得到的地形信息按区域统计,若由步骤(2a)中得到的出租车、犯罪与投诉电话数据区域信息不在统计区域内则删除;
(2c)对步骤(2b)中得到的出租车、犯罪数据进行补全,对步骤(2b)中得到的出租车与犯罪数据进行区域与坐标统计,对出租车与犯罪数据中区域缺失但坐标没有缺失的数据进行坐标映射,补全数据;
(2d)对步骤(2c)与步骤(2b)中得到的出租车、犯罪与投诉电话数据进行统一的时间格式变换;
(2e)对步骤(2d)中得到的出租车、犯罪与投诉电话数据按年份统计,统计三个数据集同时包含的年份,将不在年份集合的数据删除;
本例中,因为出租车与犯罪数据的年份不同,所以删除不在同一年份的数据,最终用于模型训练的出租车数据为2013年到2017年共49382284条出行数据。
犯罪数据包含2001年至今的犯罪数据,截取其中2013年到2017年的共1527417条犯罪数据集。
(2f)根据步骤(2e)中得到的投诉电话数据按月份统计每个区域拨打投诉电话的次数并差分构成投诉电话矩阵;
(2g)对步骤(2e)中得到的犯罪数据进行时间平稳性分析。计算犯罪数据的时间自相关性与时间偏相关性,若犯罪数据时间自相关与偏相关图截尾或者拖尾则数据平稳;
再进一步地,步骤(2g)的平稳性分析中,自相关与偏相关图截尾或者拖尾的判断方式为:1)截尾:在大于某个常数k后快速趋于0为k阶截尾;2)拖尾:始终有非零取值,不会在k大于某个常数后就恒等于零,或在0附近随机波动。
(2h)若犯罪数据平稳则结束步骤(2),若犯罪数据非平稳则进行数据差分得到平稳的犯罪数据。
(3)根据步骤(1)与步骤(2)中得到的地形信息与出租车数据,进行出行邻接滞后矩阵提取;步骤如下:首先,根据区域间的邻接关系提取区域邻接权重矩阵;然后,根据区域间出租车出行量构建出行矩阵;最后,根据所得到的区域邻接权重矩阵与出行矩阵构建出行邻接滞后矩阵;
进一步地,所述步骤(3)中,出行邻接滞后矩阵提取包括如下步骤:
(3a)提取一阶空间邻接权重矩阵;
公式如下:
(3b)提取二阶邻接权重矩阵;
公式如下:
(3c)提取出租车的出行矩阵;
公式如下:
其中fij表示以i为出发点以j为目标点的出行数据数量;wij表示两区域间的出行量相关度;
(3d)对步骤(3c)中得到的出行矩阵进行空间聚集特征单元统计。统计出行矩阵中每个犯罪空间聚集特征单元的值;
(3e)对步骤(3a)与(3b)中得到的一阶、二阶空间权重矩阵进行空间聚集特征的单元统计,确定空间权重矩阵中各单元数值为不为零的点;
(3f)由步骤(3d)与步骤(3e)中得到的出行矩阵构建出行邻接滞后矩阵模型的构建公式如下:
其中表示空间权重矩阵区域i行j列的值;表示出行矩阵i行j列的值;W表示出行邻接滞后矩阵。
进一步地,所述步骤(4)中,犯罪时空相关性分析的步骤如下:
(4a)分析步骤(2)与步骤(3)中得到的犯罪数据与出行邻接滞后矩阵自相关性;
时空自相关分析公式如下所示:
式中ρk表示时空自相关系数;k表示时间延迟阶数;h表示空间延迟阶数;W(h)表示空间延迟期为h的出行邻接滞后矩阵;W(0)是空间延迟期为0的出行邻接滞后矩阵,是一个单位矩阵;
(4b)分析步骤(2)与步骤(3)中得到的犯罪数据与出行邻接滞后矩阵偏相关性;
时空偏相关分析公式如下所示:
式中ρk表示时空自相关函数;k表示时间延迟阶数;h表示空间延迟阶数;ρ表示最大时间延迟;mk表示时间延迟k时的最大空间延迟;φkh表示时空偏相关系数;
(4c)由步骤(4a)与步骤(4b)中得到的自相关性与偏相关性进行延迟阶数分析确定时空序列的时间延迟阶数与空间延迟阶数。
再进一步地,由犯罪数据与出行邻接滞后矩阵自相关性与偏相关性进行延迟阶数分析的方法为:如果时空自相关函数和偏相关函数值两者都出现几何或者做阻尼振荡减少,选取值自相关系数大于多数点的延迟阶数作为时间与空间延迟阶数,延迟阶数不应大于所构建出行邻接滞后阶数。
(5)基于步骤(4)中得到的时间与空间延迟阶数,结合步骤(2)与步骤(3)中得到的平稳犯罪数据、出行邻接滞后矩阵与投诉电话矩阵,实现基于改进STARMA模型的犯罪预测。步骤如下:首先,基于(4)中得到的时间与空间延迟阶数对改进STARMA模型参数进行估计;然后,对所得出的模型残差进行检验是否满足要求。
进一步地,所述步骤(5)中,基于步骤(4)中得到的时间与空间延迟阶数,结合步骤(2)与步骤(3)中得到的平稳犯罪数据、出行邻接滞后矩阵与投诉电话矩阵,实现基于改进STARMA模型的犯罪预测,改进STARMA模型运算公式如下所示:
E(ε)=0
Z(t)表示时空序列被解释变量;式中p表示模型的时间延迟阶数;E{·}表示数学期望运算符;mk与nk表示空间延迟阶数;αkhθkh与δ表示模型系数;X表示解释变量;ε(t)表示模型残差函数,时间与空间延迟阶数从相关图中偏自相关函数与自相关函数是否拖尾或截断进行判断。
再进一步地,要求模型的残差为白噪声,若是相关模型参数合理时,模型拟合的残差方为随机误差(或白噪声)。
Claims (9)
1.一种基于改进STARMA模型的犯罪预测方法,其特征在于,所述方法依次包括以下步骤:
(1)获取待分析区域的出租车、犯罪、投诉电话数据集与地形信息;
(2)对步骤(1)中得到的出租车、犯罪与投诉电话数据集进行预处理;根据投诉电话数据集提取投诉电话矩阵;将犯罪数据转化为平稳序列;
(3)根据步骤(1)与步骤(2)中得到的地形信息与出租车数据,进行出行邻接滞后矩阵提取;步骤如下:首先,根据区域间的邻接关系提取区域邻接权重矩阵;然后,根据区域间出租车出行量构建出行矩阵;最后,根据所得到的区域邻接权重矩阵与出行矩阵构建出行邻接滞后矩阵;
(4)对步骤(2)与步骤(3)中得到的平稳犯罪数据与出行邻接滞后矩阵作时空相关性分析,确定犯罪数据的时间与空间延迟阶数;
(5)基于步骤(4)中得到的时间与空间延迟阶数,结合步骤(2)与步骤(3)中得到的平稳犯罪数据、出行邻接滞后矩阵与投诉电话矩阵,实现基于改进STARMA模型的犯罪预测,过程如下:首先,基于(4)中得到的时间与空间延迟阶数对改进STARMA模型参数进行估计;然后,对所得出的模型残差进行检验是否满足要求。
2.如权利要求1所述的一种基于改进STARMA模型的犯罪预测方法,其特征在于,所述步骤(2)中,数据的预处理包括如下步骤:
(2a)对步骤(1)中得到的出租车、犯罪与投诉电话数据进行去重,合并“ID”重复的数据;
(2b)对步骤(2a)中得到的出租车、犯罪与投诉电话数据进行筛选,删除不符合规则的数据;
(2c)对步骤(2b)中得到的出租车、犯罪数据进行补全,对步骤(2b)中得到的出租车与犯罪数据进行区域与坐标统计,对出租车与犯罪数据中区域缺失但坐标没有缺失的数据进行坐标映射,补全数据;
(2d)对步骤(2c)与步骤(2b)中得到的出租车、犯罪与投诉电话数据进行统一的时间格式变换;
(2e)对步骤(2d)中得到的出租车、犯罪与投诉电话数据按年份统计,统计三个数据集同时包含的年份,将不在年份集合的数据删除;
(2f)根据步骤(2e)中得到的投诉电话数据按月份统计每个区域拨打投诉电话的次数并差分构成投诉电话矩阵;
(2g)对步骤(2e)中得到的犯罪数据进行时间平稳性分析,计算犯罪数据的时间自相关性与时间偏相关性,若犯罪数据时间自相关与偏相关图截尾或者拖尾则数据平稳;
(2h)若犯罪数据平稳则结束步骤(2),若犯罪数据非平稳则进行数据差分得到平稳的犯罪数据。
3.如权利要求2所述的一种基于改进STARMA模型的犯罪预测方法,其特征在于,所述步骤(2b)的筛选过程为:对步骤(1)中得到的地形信息按区域统计,若由步骤(2a)中得到的出租车、犯罪与投诉电话数据区域信息不在统计区域内则删除。
4.如权利要求2所述的一种基于改进STARMA模型的犯罪预测方法,其特征在于,所述步骤(2g)的平稳性分析中,自相关与偏相关图截尾或者拖尾的判断方式为:1)截尾:在大于某个常数k后快速趋于0为k阶截尾;2)拖尾:始终有非零取值,不会在k大于某个常数后就恒等于零,或在0附近随机波动。
5.如权利要求1~4之一所述的一种基于改进STARMA模型的犯罪预测方法,其特征在于,所述步骤(3)中,出行邻接滞后矩阵提取包括如下步骤:
(3a)提取一阶空间邻接权重矩阵;
公式如下:
(3b)提取二阶邻接权重矩阵;
公式如下:
(3c)提取出租车的出行矩阵;
公式如下:
其中fij表示以i为出发点以j为目标点的出行数据数量;wij表示两区域间的出行量相关度;
(3d)对步骤(3c)中得到的出行矩阵进行空间聚集特征单元统计,统计出行矩阵中每个犯罪空间聚集特征单元的值;
(3e)对步骤(3a)与(3b)中得到的一阶、二阶空间权重矩阵进行空间聚集特征的单元统计,确定空间权重矩阵中各单元数值为不为零的点;
(3f)由步骤(3d)与步骤(3e)中得到的出行矩阵构建出行邻接滞后矩阵模型的构建公式如下:
其中表示空间权重矩阵区域i行j列的值;表示出行矩阵i行j列的值;W表示出行邻接滞后矩阵。
6.如权利要求1~4之一所述的一种基于改进STARMA模型的犯罪预测方法,其特征在于,所述步骤(4)中,犯罪时空相关性分析的步骤如下:
(4a)分析步骤(2)与步骤(3)中得到的犯罪数据与出行邻接滞后矩阵自相关性;
时空自相关分析公式如下所示:
式中ρk表示时空自相关系数;k表示时间延迟阶数;h表示空间延迟阶数;W(h)表示空间延迟期为h的出行邻接滞后矩阵;W(0)表示空间延迟期为0的出行邻接滞后矩阵,是一个单位矩阵;
(4b)分析步骤(2)与步骤(3)中得到的犯罪数据与出行邻接滞后矩阵偏相关性;
时空偏相关分析公式如下所示:
式中ρk表示时空自相关函数;k表示时间延迟阶数;h表示空间延迟阶数;ρ表示最大时间延迟;mk表示时间延迟k时的最大空间延迟;φkh表示时空偏相关系数;
(4c)由步骤(4a)与步骤(4b)中得到的自相关性与偏相关性进行延迟阶数分析确定时空序列的时间延迟阶数与空间延迟阶数。
7.如权利要求6所述的一种基于改进STARMA模型的犯罪预测方法,其特征在于,由犯罪数据与出行邻接滞后矩阵自相关性与偏相关性进行延迟阶数分析的方法为:如果时空自相关函数和偏相关函数值两者都出现几何或者做阻尼振荡减少,选取值自相关系数大于多数点的延迟阶数作为时间与空间延迟阶数,延迟阶数不应大于所构建出行邻接滞后阶数。
8.如权利要求1~4之一所述的一种基于改进STARMA模型的犯罪预测方法,其特征在于,所述步骤(5)中,基于步骤(4)中得到的时间与空间延迟阶数,结合步骤(2)与步骤(3)中得到的平稳犯罪数据、出行邻接滞后矩阵与投诉电话矩阵,实现基于改进STARMA模型的犯罪预测,改进STARMA模型运算公式如下所示:
E(ε)=0
Z(t)表示时空序列被解释变量;式中p表示模型的时间延迟阶数;E{·}表示数学期望运算符;mk与nk表示空间延迟阶数;αkhθkh与δ表示模型系数;X表示解释变量;ε(t)表示模型残差函数,时间与空间延迟阶数从相关图中偏自相关函数与自相关函数是否拖尾或截断进行判断。
9.如权利要求8所述的一种基于改进STARMA模型的犯罪预测方法,其特征在于,要求模型的残差为白噪声,若是相关模型参数合理时,模型拟合的残差方为随机误差或白噪声。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910232008.3A CN110309935A (zh) | 2019-03-26 | 2019-03-26 | 一种基于改进starma模型的犯罪预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910232008.3A CN110309935A (zh) | 2019-03-26 | 2019-03-26 | 一种基于改进starma模型的犯罪预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110309935A true CN110309935A (zh) | 2019-10-08 |
Family
ID=68075406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910232008.3A Pending CN110309935A (zh) | 2019-03-26 | 2019-03-26 | 一种基于改进starma模型的犯罪预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110309935A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110750609A (zh) * | 2019-10-14 | 2020-02-04 | 浙江警察学院 | 基于时空数据和神经网络的犯罪案件数量预测方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104123465A (zh) * | 2014-07-24 | 2014-10-29 | 中国软件与技术服务股份有限公司 | 一种基于聚类的大数据交叉分析预警方法及系统 |
CN104765772A (zh) * | 2015-03-11 | 2015-07-08 | 广西师范学院 | 一种基于时空区域犯罪特征的建模方法 |
KR20160104223A (ko) * | 2015-02-26 | 2016-09-05 | 광운대학교 산학협력단 | 빅데이터 기반의 범죄 패턴 분석을 이용한 범죄 예측 방법 및 범죄 예측 시스템 |
KR20160105151A (ko) * | 2015-02-27 | 2016-09-06 | 광운대학교 산학협력단 | 셀 가치 추산을 이용한 범죄 예측 방법 및 범죄 예측 시스템 |
US20180053110A1 (en) * | 2016-08-22 | 2018-02-22 | The Catholic University Of Korea Industry-Academic Cooperation Foundation | Method of predicting crime occurrence in prediction target region using big data |
CN108805345A (zh) * | 2018-06-01 | 2018-11-13 | 广西师范学院 | 一种基于深度卷积神经网络模型的犯罪时空风险预测方法 |
CN109063887A (zh) * | 2018-06-13 | 2018-12-21 | 中国华戎科技集团有限公司 | 一种犯罪热点预测方法及系统 |
CN109472419A (zh) * | 2018-11-16 | 2019-03-15 | 中山大学 | 基于时空的警情预测模型的建立方法、装置和存储介质 |
-
2019
- 2019-03-26 CN CN201910232008.3A patent/CN110309935A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104123465A (zh) * | 2014-07-24 | 2014-10-29 | 中国软件与技术服务股份有限公司 | 一种基于聚类的大数据交叉分析预警方法及系统 |
KR20160104223A (ko) * | 2015-02-26 | 2016-09-05 | 광운대학교 산학협력단 | 빅데이터 기반의 범죄 패턴 분석을 이용한 범죄 예측 방법 및 범죄 예측 시스템 |
KR20160105151A (ko) * | 2015-02-27 | 2016-09-06 | 광운대학교 산학협력단 | 셀 가치 추산을 이용한 범죄 예측 방법 및 범죄 예측 시스템 |
CN104765772A (zh) * | 2015-03-11 | 2015-07-08 | 广西师范学院 | 一种基于时空区域犯罪特征的建模方法 |
US20180053110A1 (en) * | 2016-08-22 | 2018-02-22 | The Catholic University Of Korea Industry-Academic Cooperation Foundation | Method of predicting crime occurrence in prediction target region using big data |
CN108805345A (zh) * | 2018-06-01 | 2018-11-13 | 广西师范学院 | 一种基于深度卷积神经网络模型的犯罪时空风险预测方法 |
CN109063887A (zh) * | 2018-06-13 | 2018-12-21 | 中国华戎科技集团有限公司 | 一种犯罪热点预测方法及系统 |
CN109472419A (zh) * | 2018-11-16 | 2019-03-15 | 中山大学 | 基于时空的警情预测模型的建立方法、装置和存储介质 |
Non-Patent Citations (2)
Title |
---|
MEILIN LIU,TIANLIANG LU: "A Hybrid Model of Crime Prediction", 《JOURNAL OF PHYSICS: CONFERENCE SERIES》 * |
刘美霖等: "基于时空序列混合模型的犯罪情报预测分析", 《情报杂志》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110750609A (zh) * | 2019-10-14 | 2020-02-04 | 浙江警察学院 | 基于时空数据和神经网络的犯罪案件数量预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108280550B (zh) | 一种比较公共自行车站点社区划分的可视分析方法 | |
CN102169606B (zh) | 一种城市轨道交通网络大客流影响的预测方法 | |
WO2017166370A1 (zh) | 一种基于区域城际流强度测算模型的划定大都市圈的方法 | |
CN109189949B (zh) | 一种人口分布计算方法 | |
CN110532337B (zh) | 面向智慧社区的公共设施服务能力提升方法 | |
CN107656987B (zh) | 一种基于lda模型的地铁站点功能挖掘方法 | |
CN109189917B (zh) | 一种融合景观和社会特征的城市功能区划分方法及系统 | |
CN112291706A (zh) | 一种基于大数据和人工智能的网络优化方法 | |
CN105183870A (zh) | 一种利用微博位置信息的城市功能区探测方法及系统 | |
CN106507315A (zh) | 一种基于网络社交媒体数据的城市交通事故预测方法和系统 | |
CN109345434B (zh) | 一种开放式小区内外部道路设计安全评价的方法 | |
CN112446609B (zh) | 一种基于大数据的充电场站建站方法及系统 | |
CN108171974A (zh) | 一种基于手机三角定位数据的交通出行模式判别方法 | |
CN109284918B (zh) | 一种城市立体空间紧凑性测度方法及系统 | |
CN111445700B (zh) | 一种基于车牌识别数据的区域行停车辆的监测方法 | |
CN114021795A (zh) | 一种考虑电动汽车充电需求的充电站规划方法及系统 | |
CN106370198A (zh) | 一种考虑出行异质性的路径选择方法 | |
CN113505999A (zh) | 应用于城市空间质量评估的指标计算方法 | |
CN110309935A (zh) | 一种基于改进starma模型的犯罪预测方法 | |
CN104392076B (zh) | 城市路网行人交通事故黑点识别方法 | |
CN106056137A (zh) | 一种基于数据挖掘多分类算法的电信集团业务推荐方法 | |
Geng et al. | Geographically Weighted Regression model (GWR) based spatial analysis of house price in Shenzhen | |
CN116797045A (zh) | 夜间灯光融合多源数据的城镇化格局分析方法 | |
CN108428205B (zh) | 一种城市公共地图用户访问量差异因素分析方法 | |
CN110020799A (zh) | 一种基于时空基准的城管网格资源配置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191008 |