CN109472419A - 基于时空的警情预测模型的建立方法、装置和存储介质 - Google Patents

基于时空的警情预测模型的建立方法、装置和存储介质 Download PDF

Info

Publication number
CN109472419A
CN109472419A CN201811372850.9A CN201811372850A CN109472419A CN 109472419 A CN109472419 A CN 109472419A CN 201811372850 A CN201811372850 A CN 201811372850A CN 109472419 A CN109472419 A CN 109472419A
Authority
CN
China
Prior art keywords
alert
target
time
space
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811372850.9A
Other languages
English (en)
Other versions
CN109472419B (zh
Inventor
任江涛
赖超杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN201811372850.9A priority Critical patent/CN109472419B/zh
Publication of CN109472419A publication Critical patent/CN109472419A/zh
Application granted granted Critical
Publication of CN109472419B publication Critical patent/CN109472419B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Alarm Systems (AREA)

Abstract

本发明公开了一种基于时空的警情预测模型的建立方法,所述基于时空的警情预测模型的建立方法包括以下步骤:获取多个目标警情文本,并确定各个所述目标警情文本中警情对应的目标犯罪地点;根据各个所述目标犯罪地点确定犯罪风险区域;根据所述犯罪风险区域对应的各个警情、所述警情的犯罪类型以及所述警情的犯罪时间点,建立所述犯罪风险区域对应的警情预测模型。本发明还公开一种基于时空的警情预测模型的建立装置和存储介质。本发明建立的警情预测模型的警情预测准确性较高。

Description

基于时空的警情预测模型的建立方法、装置和存储介质
技术领域
本发明涉及大数据技术领域,尤其涉及一种基于时空的警情预测模型的建立方法、装置和存储介质。
背景技术
21世纪是属于城市的世纪,全球的城市化进程在不断推进。但与此同时,不断推进的城市化进程也给城市地区带来了巨大的经济和社会影响,并在城市管理问题上带来了若干个挑战。特别是,目前较大城市的犯罪率往往较高,犯罪率飙升正成为大城市地区最重要的社会问题之一。而与此同时,不断发展的信息技术使得公安部门能够获取越来越多的犯罪相关(警情)数据,如何设计一种有效便捷的方法,通过分析这些数据,挖掘犯罪数据背后的模式和趋势,以帮助警方更好地进行治安防控和预防犯罪,已成为一个非常值得研究的问题。
现有技术中,警情预测方法通过定义影响警情发生的因素,再根据决策树算法选出一个信息增益最大的因素作为主要因素,而后通过设置警情高发值为M,找出信息增益值Η>Μ的因素下的历史警情数据的高发区域和高发时段,获得的结果集即为预测的警情高发区域和高发时段。但该方法的缺陷在于需要启发式地定义影响警情的因素,且对区域和时段分开预测,没有考虑它们之间的相互影响,从而导致警情预测的准确性较低。
发明内容
本发明的主要目的在于提供一种基于时空的警情预测模型的建立方法、装置和存储介质,旨在解决警情预测的准确性较低的问题。
为实现上述目的,本发明提供的一种基于时空的警情预测模型的建立方法,所述基于时空的警情预测模型的建立方法包括以下步骤:
获取多个目标警情文本,并确定各个所述目标警情文本中警情对应的目标犯罪地点;
根据各个所述目标犯罪地点确定犯罪风险区域;
根据所述犯罪风险区域对应的各个警情、所述警情的犯罪类型以及所述警情的犯罪时间点,建立所述犯罪风险区域对应的警情预测模型。
在一实施例中,所述确定各个所述目标警情文本中警情对应的目标犯罪地点的步骤包括:
采用第一地点提取算法以及第二地点提取算法,分别在各个所述目标警情文本提取犯罪地点,以得到所述第一地点提取算法对应的第一集合以及所述第二地点提取算法对应的第二集合;
根据所述第一集合以及所述第二集合中的各个犯罪地点,确定各个所述目标犯罪地点。
在一实施例中,所述根据所述第一集合以及所述第二集合中的各个犯罪地点,确定各个所述目标犯罪地点的步骤包括:
对所述第一集合以及所述第二集合中的各个犯罪地点的名称进行规划化修正,以得到第一修正集合以及第二修正集合;
提取所述第一修正集合以及所述第二修正集合对应的并集,并将所述并集中的各个修正犯罪地点均确定为目标犯罪地点。
在一实施例中,所述第一地点提取算法为正则匹配算法,所述第二地点提取算法为命名实体识别算法。
在一实施例中,所述根据各个所述犯罪地点确定犯罪风险区域的步骤包括:
确定各个所述目标犯罪地点对应的经纬度;
根据各个经纬度对各个所述目标犯罪地点进行聚类以得到多个犯罪风险区域。
在一实施例中,所述根据各个经纬度对各个所述目标犯罪地点进行聚类以得到多个犯罪风险区域的步骤包括:
确定目标经纬度范围;
将不处于所述目标经纬度范围的所述经纬度删除,以得到各个目标经纬度;
对各个所述目标经纬度对应的目标犯罪地点进行聚类,以得到多个犯罪风险区域。
在一实施例中,所述建立所述犯罪风险区域对应的警情预测模型的步骤之后,还包括:
在接收警情预测指令时,根据所述警情预测指令确定警情预测时间段以及警情类型;
输出各个所述警情类型在所述警情预测时间段中的数量,以及各个所述警情类型的犯罪风险等级。
在一实施例中,所述获取多个目标警情文本的步骤包括:
获取多个初始警情文本,并将各个所述初始警情文本依次作为当前警情文本;
在所述当前警情文本提取警情描述文本,并在所述警情描述文本中去除目标人物的私密信息,以得到所述当前警情文本对应的目标警情文本,其中,所述目标人物包括目击人、举报人及/或受害人。
为实现上述目的,本发明还提供一种基于时空的警情预测模型的建立装置,所述基于时空的警情预测模型的建立装置包括处理器、存储器和存储在所述存储器上并可在所述处理器上运行的基于时空的警情预测模型的建立程序,所述基于时空的警情预测模型的建立程序被所述处理器执行时实现如上所述的基于时空的警情预测模型的建立方法的各个步骤。
为实现上述目的,本发明还提供一种存储介质,所述存储介质存储有基于时空的警情预测模型的建立程序,所述基于时空的警情预测模型的建立程序被所述处理器执行时实现如上所述的基于时空的警情预测模型的建立方法的各个步骤。
本发明提供的基于时空的警情预测模型的建立方法、装置和存储介质,基于时空的警情预测模型的建立装置获取多个目标警情文本,并确定各个目标警情文本中警情对应的目标犯罪地点,再根据各个目标犯罪时间点确定犯罪风险区域,从而根据犯罪风险区域对应的各个警情、警情的犯罪类型以及犯罪时间点,建立犯罪风险区域对应的警情预测模型;由于警情预测模型是通过高风险犯罪区域中警情数量以及警情时间点建立得到,将地域因素与时间因素充分考虑进来,使得警情预测模式的警情预测准确性较高。
附图说明
图1为本发明实施例涉及的基于时空的警情预测模型的建立装置的硬件结构示意图;
图2为本发明基于时空的警情预测模型的建立方法第一实施例的流程示意图;
图3为图2中步骤S100的细化流程示意图;
图4为图2中步骤S200的细化流程示意图;
图5为本发明基于时空的警情预测模型的建立方法第二实施例的流程示意图;
图6为本发明基于时空的警情预测模型的建立方法第三实施例的流程示意图;
图7为本发明基于时空的警情预测模型的建立方法第四实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:获取多个目标警情文本,并确定各个所述目标警情文本中警情对应的目标犯罪地点;根据各个所述目标犯罪地点确定犯罪风险区域;根据所述犯罪风险区域对应的各个警情的犯罪由于警情预测模型是通过高风险犯罪区域中警情数量以及警情时间点建立得到,将地域因素与时间因素充分考虑进来,使得警情预测模式的警情预测准确性较高。
作为一种实现方案,基于时空的警情预测模型的建立装置可以如图1所示。
本发明实施例方案涉及的是基于时空的警情预测模型的建立装置,基于时空的警情预测模型的建立装置包括:处理器101,例如CPU,存储器102,通信总线103。其中,通信总线103用于实现这些组件之间的连接通信。
存储器102可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。如图1所示,作为一种计算机可读存储介质的存储器103中可以包括基于时空的警情预测模型的建立程序;而处理器101可以用于调用存储器102中存储的基于时空的警情预测模型的建立程序,并执行以下操作:
获取多个目标警情文本,并确定各个所述目标警情文本中警情对应的目标犯罪地点;
根据各个所述目标犯罪地点确定犯罪风险区域;
根据所述犯罪风险区域对应的各个警情、所述警情的犯罪类型以及所述警情的犯罪时间点,建立所述犯罪风险区域对应的警情预测模型。
在一实施例中,处理器101可以用于调用存储器102中存储的基于时空的警情预测模型的建立程序,并执行以下操作:
采用第一地点提取算法以及第二地点提取算法,分别在各个所述目标警情文本提取犯罪地点,以得到所述第一地点提取算法对应的第一集合以及所述第二地点提取算法对应的第二集合;
根据所述第一集合以及所述第二集合中的各个犯罪地点,确定各个所述目标犯罪地点。
在一实施例中,处理器101可以用于调用存储器102中存储的基于时空的警情预测模型的建立程序,并执行以下操作:
对所述第一集合以及所述第二集合中的各个犯罪地点的名称进行规划化修正,以得到第一修正集合以及第二修正集合;
提取所述第一修正集合以及所述第二修正集合对应的并集,并将所述并集中的各个修正犯罪地点均确定为目标犯罪地点。
在一实施例中,处理器101可以用于调用存储器102中存储的基于时空的警情预测模型的建立程序,并执行以下操作:
所述第一地点提取算法为正则匹配算法,所述第二地点提取算法为命名实体识别算法。
在一实施例中,处理器101可以用于调用存储器102中存储的基于时空的警情预测模型的建立程序,并执行以下操作:
确定各个所述目标犯罪地点对应的经纬度;
根据各个经纬度对各个所述目标犯罪地点进行聚类以得到多个犯罪风险区域。
在一实施例中,处理器101可以用于调用存储器102中存储的基于时空的警情预测模型的建立程序,并执行以下操作:
确定目标经纬度范围;
将不处于所述目标经纬度范围的所述经纬度删除,以得到各个目标经纬度;
对各个所述目标经纬度对应的目标犯罪地点进行聚类,以得到多个犯罪风险区域。
在一实施例中,处理器101可以用于调用存储器102中存储的基于时空的警情预测模型的建立程序,并执行以下操作:
在接收警情预测指令时,根据所述警情预测指令确定警情预测时间段以及警情类型;
输出各个所述警情类型在所述警情预测时间段中的数量,以及各个所述警情类型的犯罪风险等级。
在一实施例中,处理器101可以用于调用存储器102中存储的基于时空的警情预测模型的建立程序,并执行以下操作:
获取多个初始警情文本,并将各个所述初始警情文本依次作为当前警情文本;
在所述当前警情文本提取警情描述文本,并在所述警情描述文本中去除目标人物的私密信息,以得到所述当前警情文本对应的目标警情文本,其中,所述目标人物包括目击人、举报人及/或受害人。
本实施例根据上述方案,基于时空的警情预测模型的建立装置获取多个目标警情文本,并确定各个目标警情文本中警情对应的目标犯罪地点,再根据各个目标犯罪时间点确定犯罪风险区域,从而根据犯罪风险区域对应的各个警情、警情的犯罪类型以及犯罪时间点,建立犯罪风险区域对应的警情预测模型;由于警情预测模型是通过高风险犯罪区域中警情数量以及警情时间点建立得到,将地域因素与时间因素充分考虑进来,使得警情预测模式的警情预测准确性较高。
基于上述基于时空的警情预测模型的建立装置的硬件构架,提出本发明基于时空的警情预测模型的建立方法的实施例。
参照图2,图2为本发明基于时空的警情预测模型的建立方法的第一实施例,所述基于时空的警情预测模型的建立方法包括以下步骤:
步骤S100,获取多个目标警情文本,并确定各个所述目标警情文本中警情对应的目标犯罪地点;
在本发明中,执行主体为基于时空的警情预测模型的建立装置,基于时空的警情预测模型的建立装置可以根据警情文本建立警情预测模型,警情文本指的是对犯罪事件的描述文本。
在需要建立警情预测模型时,可在数据库接口中获取多个警情文本,当前获取的警情文本即为作为目标警情文本,然后从目标警情文本中提取警情对应以及犯罪地点,具体的,参照图3,即步骤S100中确定各个所述目标警情文本中警情对应的目标犯罪地点包括:
步骤S110,采用第一地点提取算法以及第二地点提取算法,分别在各个所述目标警情文本提取犯罪地点,以得到所述第一地点提取算法对应的第一集合以及所述第二地点提取算法对应的第二集合;
步骤S120,根据所述第一集合以及所述第二集合中的各个犯罪地点,确定各个所述目标犯罪地点;
基于时空的警情预测模型的建立装置存储有第一地点提取算法以及第二地点提取算法,地点提取算法可为正则匹配抽取,也即基于CRF(条件随机场)的地点抽取;还可为命名实体识别算法,基于BI-LSTM-CRF(双向长短期记忆网络联合条件随机场)的地点抽取,在本发明中优选将正则匹配算法作为第一地点提取算法,将命名实体识别算法中的BI-LSTM-CRF作为第二地点提取算法;装置以第一地点提取算法对各个目标警情文本提取犯罪地点,提取的犯罪地点归类为第一集合,第一集合即为第一地点提取算法对应的第一集合,同理,装置以第二地点提取算法对各个目标警情文本提取犯罪地点,得到第二地点提取算法对应的第二集合;
在得到第二集合以及第一集合后,然后对第一集合以及第二集合取并集元素,以得到含有多个并集元素的并集,具体的,第一集合以及第二集合中各个犯罪地点具有对应的目标警情文本,将二个集合中同一目标警情文本对应的二个犯罪地点进行比对,若二个犯罪地点相同,该犯罪地点即为并集元素,可以理解的是,并集中可含有多个相同的并集元素;在得到并集后,装置可将并集中的各个并集元素,也即各个犯罪地点作为目标犯罪地点。
当然,本发明也可采用一种地点提取方法来提取警情文本的目标犯罪地点,但采用一种地点提取方法来建立警情预测模型,会使得警情预测模型的警情预测分析准确性极高或者极低;而通过采用二种地点提取方法提取警情文本的目标犯罪地点,能够结合二种地点提取方法的优点,避免警情预测模型的警情预测分析的准确性出现极端的问题,警情预测模型的警情预测分析较为稳定且有效。
在本发明中,命名实体识别技术(Named Entity Recognition,简称NER)是指从文本中识别具有特定类别的实体(通常是名词),例如人名、地名、机构名、专有名词等。不需要人工构造抽取规则,是本发明采用的主要的抽取方法。具体地,本发明中的采用了BI-LSTM-CRF(双向长短期记忆网络联合条件随机场)来进行命名实体识别。
下面对BI-LSTM-CRF模型进行简单的说明:
首先,构建警情训练语料的字典库,然后将每一个字转化为对应的one-hot向量(独热编码向量),然后通过一层look-up(查询)层,将one-hot(独热编码向量)向量转换为相应的字向量。本发明采用了预先训练好的字向量,采用人民日报语料训练的300维字向量。在输入下一层之前,设置dropout以缓解过拟合。模型的第二层是双向LSTM(长短期记忆网络)层,自动提取句子特征。将一个句子的各个字的char embedding(字符向量)序列作为双向LSTM(长短期记忆网络)各个时间步的输入,再将正向LSTM(长短期记忆网络)输出的隐状态序列与反向LSTM(长短期记忆网络)的在各个位置输出的隐状态进行按位置拼接,得到完整的隐状态序列。在设置dropout(丢弃正则化)后,接入一个线性层,将隐状态向量从m维映射到k维,k是标注集的标签数,从而得到自动提取的句子特征。模型的第三层是CRF层(条件随机场层),进行句子级别的序列标注。其中模型将句子x标注为序列y的评价公式如下:
整个序列的打分等于各个位置的打分之和,而每个位置的打分由两部分得到,一部分是由LSTM(长短期记忆网络)输出的分值决定,另一部分则由CRF(条件随机场)的转移矩阵A决定。模型在预测过程(解码)时使用动态规划的Viterbi(维特比)算法来求解最优路径,要求解的优化问题如下:
最后,通过最优的y对目标警情文本进行犯罪地点的抽取。
步骤S200,根据各个所述目标犯罪地点确定犯罪风险区域,其中,所述犯罪风险区域中的警情数量大于或等于预设数量;
在得到目标犯罪地点后,装置根据各个目标犯罪地点得到犯罪风险区域,具体的,请参照图4,即步骤S200包括:
步骤S210,确定各个所述目标犯罪地点对应的经纬度;
步骤S220,根据各个经纬度对各个所述目标犯罪地点进行聚类以得到多个犯罪风险区域;
装置在得到各个目标犯罪地点后,会通过外部程序接口确定各个目标犯罪点点对应的经纬度,外部程序可以是百度地图开发中心的API(应用编程接口),当然还可以类型的API。
在确定目标犯罪地点的经纬度后,装置将目标犯罪地点视为数据点,对数据点进行聚类以产生风险区域。
在介绍聚类步骤之前,先介绍聚类过程中所形成的三种数据点:核心点,若数据点x邻域内至少包含了M个数据点,则称数据点x为核心点;边界点,若数据点x的邻域内包含的数据点数目小于M,但是它在其他核心点的邻域内,则称数据点x为边界点;噪音点,既不是核心点也不是边界点的点。
对数据点即目标犯罪地点进行聚类的过程描述如下:
1、计算每个数据点与其他所有数据点之间的欧几里德距离;
2、计算每个数据点的k-距离值,并对所有数据点的k-距离集合进行升序排序,输出的排序后的k-距离值;
k-距离是指:给定数据集P={p(i);i=0,1,…n},对于任意点P(i),计算点P(i)到集合D的子集S={p(1),p(2),…,p(i-1),p(i+1),…,p(n)}中所有点之间的距离,距离按照从小到大的顺序排序,假设排序后的距离集合为D={d(1),d(2),…,d(k-1),d(k),d(k+1),…,d(n)},则d(k)就被称为k-距离;
3、将所有数据点的k-距离值,用散点图显示k-距离变化趋势;
4、根据散点图确定半径Eps的值;
5、根据给定M=4,以及半径Eps的值,计算所有核心点,并建立核心点与到核心点距离小于半径Eps的点的映射;
6、根据得到的核心点集合,以及半径Eps的值,计算能够连通的核心点,并得到离群点;
7、将能够连通的每一组核心点,以及到核心点距离小于半径Eps的点,都放到一起,形成一个簇;
8、选择不同的半径Eps,使用得到的一组簇及其离群点,使用散点图对比聚类效果;
通过上述步骤即可得到聚类后的多个犯罪风险区域。
步骤S300,根据所述犯罪风险区域对应的各个警情、所述警情的犯罪类型以及所述警情的犯罪时间点,建立所述犯罪风险区域对应的警情预测模型;
在得到多个犯罪风险区域后,确定犯罪风险区域中各个警情的类型,以及各个警情的犯罪时间点,然后根据各个警情、警情的类型以及警情的犯罪时间点建立犯罪风险区域的警情预测模型。
对每个特定犯罪风险区域建立模型的过程大致如下:采用自然语言处理模型中的seq2seq模型(序列到序列模型)来进行建模预测,其中encoder(编码器)用的是LSTM(长短期记忆网络),decoder(解码器)用的是LSTM。模型训练的数据这样构造,输入是前三个月的各类型案件数量序列,输出是下一个月各个案件类型等级分布。构造好训练数据后,用Adagrad(一种基于梯度下降的、自适应学习率的优化方法)优化方法训练模型参数直至收敛。预测时,输入是一个月的各类型案件数量序列,模型会自动补上前两个月的数量序列并将其拼接成一个长序列输入已经建立好的模型,然后模型输出预测的案件类型等级分布结果。
需要说明的是,犯罪时间点可以通过正则方式抽取,例如,将目标警情文本中“XX年XX月XX日”的关键字作为发生时间,从而根据关键字提取发生时间,以将发生时间作为犯罪时间点;如果出现“昨日”“前天”“明天”等字眼,则根据上报时间相应推算其发生时间;如出现“近日”“几日前”,则统一以上报时间为发生时间。
在犯罪风险区域的警情预测模型后,即可对该犯罪风险区域进行警情预测,具体的,对警情预测模型输入警情预测指令,警情预测指令中含有警情预测时间段以及需要警情类型,例如,输入一个月(警情预测时间段);纠纷、盗窃、抢劫、诈骗、交通事故、影响公共管理以及侵犯人身权利(警情犯罪类型),那么输出下一个的纠纷、盗窃、抢劫、诈骗、交通事故、影响公共管理以及侵犯人身权利对应的数量分别为200,80,8,24,30,60,25,并会根据每一类的警情犯罪进行犯罪风险等级评估,犯罪风险等级分为高、中、低三个级别,每一个级别的犯罪风险等级对应一个区间的犯罪数量,比如,某一类警情一个月10件以下,该类警情对应的犯罪风险为低级,当然,不同类型的警情对应的犯罪风险等级划分可不同,比如,纠纷50件以下为低等级的犯罪风险等级,而盗窃10件以下为低等级的犯罪风险等级,也即本发明可以根据犯罪类型的危害程度来划分犯罪风险等级,危害程度越大,该类犯罪类型的犯罪风险等级对应的门限数量越小。
上述纠纷、盗窃、抢劫、诈骗、交通事故、影响公共管理以及侵犯人身权利对应的数量分别为200,80,8,24,30,60,25,那么各类犯罪的风险等级依次为:高,中,低,高,高,中,高。
在本实施例提供的技术方案中,获取多个目标警情文本,并确定各个所述目标警情文本中警情对应的目标犯罪地点;根据各个所述目标犯罪地点确定犯罪风险区域,其中,所述犯罪风险区域中的警情数量大于或等于预设数量;根据所述犯罪风险区域对应的各个警情的犯罪由于警情预测模型是通过高风险犯罪区域中警情数量以及警情时间点建立得到,将地域因素与时间因素充分考虑进来,使得警情预测模式的警情预测准确性较高。
参照图5,图5为本发明基于时空的警情预测模型的建立方法的第二实施例,基于第一实施例,所述步骤S120还包括:
步骤S121,对所述第一集合以及所述第二集合中的各个犯罪地点的名称进行规划化修正,以得到第一修正集合以及第二修正集合;
步骤S122,提取所述第一修正集合以及所述第二修正集合对应的并集,并将所述并集中的各个修正犯罪地点均确定为目标犯罪地点;
在一实施例中,是对第一集合以及第二集合取并集,但是由于算法不同,提取的犯罪地点不可避免出现不规范描述,导致描述粒度粗细不同,以及相同犯罪地点描述不同的情况,如“广州市中山大学东校区”与“广州市广州大学城外环东路132号”实际指的是同一个地点。对此,需对第一集合以及第二集合中的各个犯罪地点的名称进行规范化修正,规划化修正指的是对犯罪地点进行统一格式的命名,命名格式即为“省、市、区、路”,由此,将第一集合以及第二集合中的各个犯罪地点的名称进行规划化修正,以得到第二修正集合以及第一修正集合;然后对第一修正集合以及第二修正集合取并集,并集中的并集元素即为目标犯罪地点。
本实施例提供的技术方案中,通过对犯罪地点的名称进行规范化修正,能够更加准确的获取目标犯罪地点,从而避免遗落第一集合与第二集合中相同的犯罪地点,提高了警情预测模型的警情预测精度。
参照图6,图6为本发明基于时空的警情预测模型的建立方法的第三实施例,基于第一或第二实施例,所述步骤S220包括:
步骤S221,确定目标经纬度范围;
步骤S222,将不处于所述目标经纬度范围的所述经纬度删除,以得到各个目标经纬度;
步骤S223,对各个所述目标经纬度对应的目标犯罪地点进行聚类,以得到多个犯罪风险区域;
在一实施例中,装置通过各个经纬度对应的目标犯罪地点聚类得到多个犯罪区域。但在实际过程中,会确定需要建立警情预测模型对应的地点,也即,在本实施例中,仅会对目标地点建模。对此,装置确定目标经纬度范围,目标经纬度范围即为需要研究的目标区域;然后将不处于目标经纬度范围的经纬度删除,筛选后的各个经纬度即为目标经纬度,从而根据目标经纬度对应的目标犯罪地点聚类得到多个犯罪风险区域。本实施例通过对各个经纬度的筛选,减少了用于聚类的目标犯罪地点的数量,节省了装置的计算资源,并使得装置更具针对性的建立警情预测模型。
本实施例提供的技术方案中,基于时空的警情预测模型的建立装置通过各个经纬度的筛选,减少了用于聚类的目标犯罪地点的数量,节省了装置的计算资源,并使得装置更具针对性的建立目标区域对应的警情预测模型。
参照图7,图7为本发明基于时空的警情预测模型的建立方法的第四实施例,基于第一至第三中任一实施例,所述步骤S100中确定多个目标警情文本的包括:
步骤S130,获取多个初始警情文本,并将各个所述初始警情文本依次作为当前警情文本;
步骤S140,在所述当前警情文本提取警情描述文本,并在所述警情描述文本中去除目标人物的私密信息,以得到所述当前警情文本对应的目标警情文本,其中,所述目标人物包括目击人、举报人及/或受害人;
在一实施例中,装置直接通过数据库接口获取的警情文本进行犯罪地点的抽取,犯罪地点只占警情文本的极小部分文字,在当警情文本的数据量较大时,装置遍历警情文本中的文字的时间必然会增长,从而使得警情预测模型的建立时长增长;另外,警情文本中含有目击人、举报人、受害人等目标人物私密信息,私密信息指的是目标人物的名字、联系方式、身份证等私密信息,装置在提取地点时,有可能将这些私密信息泄露,从而会对目标人物造成一定的影响。
对此,装置在数据库接口中获得多个警情文本后,也即获得多个初始警情文本后,依次将各个初始警情文本作为当前警情文本,然后在当前警情文本中提取警情描述文本,警情描述文本中仅是对警情的描述,也即去除了初始警情文本中与警情无关的文字;然后,去除警情描述文本中的目标人物的私密人物的私密信息,从而目标警情文本。
在本实施例提供的技术方案中,装置通过对初始警情文本进行目标人物的私密信息的去除,避免了泄漏目标人物的私密信息,保证了目标人物的人生安全,同时,装置通过对初始警情文本的无关文本的去除,减少了装置提取犯罪地点的时长,减少了警情预测模型的建立时长。
本发明还提供一种基于时空的警情预测模型的建立装置,所述基于时空的警情预测模型的建立装置包括处理器、存储器和存储在所述存储器上并可在所述处理器上运行的基于时空的警情预测模型的建立程序,所述基于时空的警情预测模型的建立程序被所述处理器执行时实现如上实施例所述的基于时空的警情预测模型的建立方法的各个步骤。
本发明还提供一种存储介质,所述存储介质存储有基于时空的警情预测模型的建立程序,所述基于时空的警情预测模型的建立程序被所述处理器执行时实现如上实施例所述的基于时空的警情预测模型的建立方法的各个步骤。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个计算机可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于时空的警情预测模型的建立方法,其特征在于,所述基于时空的警情预测模型的建立方法包括以下步骤:
获取多个目标警情文本,并确定各个所述目标警情文本中警情对应的目标犯罪地点;
根据各个所述目标犯罪地点确定犯罪风险区域;
根据所述犯罪风险区域对应的各个警情、所述警情的犯罪类型以及所述警情的犯罪时间点,建立所述犯罪风险区域对应的警情预测模型。
2.如权利要求1所述的基于时空的警情预测模型的建立方法,其特征在于,所述确定各个所述目标警情文本中警情对应的目标犯罪地点的步骤包括:
采用第一地点提取算法以及第二地点提取算法,分别在各个所述目标警情文本提取犯罪地点,以得到所述第一地点提取算法对应的第一集合以及所述第二地点提取算法对应的第二集合;
根据所述第一集合以及所述第二集合中的各个犯罪地点,确定各个所述目标犯罪地点。
3.如权利要求2所述的基于时空的警情预测模型的建立方法,其特征在于,所述根据所述第一集合以及所述第二集合中的各个犯罪地点,确定各个所述目标犯罪地点的步骤包括:
对所述第一集合以及所述第二集合中的各个犯罪地点的名称进行规划化修正,以得到第一修正集合以及第二修正集合;
提取所述第一修正集合以及所述第二修正集合对应的并集,并将所述并集中的各个修正犯罪地点均确定为目标犯罪地点。
4.如权利要求2所述的基于时空的警情预测模型的建立方法,其特征在于,所述第一地点提取算法为正则匹配算法,所述第二地点提取算法为命名实体识别算法。
5.如权利要求1所述的基于时空的警情预测模型的建立方法,其特征在于,所述根据各个所述犯罪地点确定犯罪风险区域的步骤包括:
确定各个所述目标犯罪地点对应的经纬度;
根据各个经纬度对各个所述目标犯罪地点进行聚类以得到多个犯罪风险区域。
6.如权利要求5所述的基于时空的警情预测模型的建立方法,其特征在于,所述根据各个经纬度对各个所述目标犯罪地点进行聚类以得到多个犯罪风险区域的步骤包括:
确定目标经纬度范围;
将不处于所述目标经纬度范围的所述经纬度删除,以得到各个目标经纬度;
对各个所述目标经纬度对应的目标犯罪地点进行聚类,以得到多个犯罪风险区域。
7.如权利要求1-6任一项所述的基于时空的警情预测模型的建立方法,其特征在于,所述建立所述犯罪风险区域对应的警情预测模型的步骤之后,还包括:
在接收警情预测指令时,根据所述警情预测指令确定警情预测时间段以及警情类型;
输出各个所述警情类型在所述警情预测时间段中的数量,以及各个所述警情类型的犯罪风险等级。
8.如权利要求1-6任一项所述的基于时空的警情预测模型的建立方法,其特征在于,所述获取多个目标警情文本的步骤包括:
获取多个初始警情文本,并将各个所述初始警情文本依次作为当前警情文本;
在所述当前警情文本提取警情描述文本,并在所述警情描述文本中去除目标人物的私密信息,以得到所述当前警情文本对应的目标警情文本,其中,所述目标人物包括目击人、举报人及/或受害人。
9.一种基于时空的警情预测模型的建立装置,其特征在于,所述基于时空的警情预测模型的建立装置包括处理器、存储器和存储在所述存储器上并可在所述处理器上运行的基于时空的警情预测模型的建立程序,所述基于时空的警情预测模型的建立程序被所述处理器执行时实现如权利要求1-8任一项所述的基于时空的警情预测模型的建立方法的各个步骤。
10.一种存储介质,其特征在于,所述存储介质存储有基于时空的警情预测模型的建立程序,所述基于时空的警情预测模型的建立程序被所述处理器执行时实现如权利要求1-8任一项所述的基于时空的警情预测模型的建立方法的各个步骤。
CN201811372850.9A 2018-11-16 2018-11-16 基于时空的警情预测模型的建立方法、装置和存储介质 Active CN109472419B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811372850.9A CN109472419B (zh) 2018-11-16 2018-11-16 基于时空的警情预测模型的建立方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811372850.9A CN109472419B (zh) 2018-11-16 2018-11-16 基于时空的警情预测模型的建立方法、装置和存储介质

Publications (2)

Publication Number Publication Date
CN109472419A true CN109472419A (zh) 2019-03-15
CN109472419B CN109472419B (zh) 2021-09-21

Family

ID=65674041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811372850.9A Active CN109472419B (zh) 2018-11-16 2018-11-16 基于时空的警情预测模型的建立方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN109472419B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309935A (zh) * 2019-03-26 2019-10-08 浙江工业大学 一种基于改进starma模型的犯罪预测方法
CN110399537A (zh) * 2019-07-22 2019-11-01 苏州量盾信息科技有限公司 一种基于人工智能技术的警情时空预测方法
CN110472775A (zh) * 2019-07-26 2019-11-19 广州大学 一种系列案件疑犯落脚点预测方法
CN110990562A (zh) * 2019-10-29 2020-04-10 新智认知数字科技股份有限公司 警情分类方法及其系统
CN111696200A (zh) * 2020-05-06 2020-09-22 广东康云科技有限公司 一种警情态势显示的方法、系统、装置及存储介质
CN112131381A (zh) * 2020-08-20 2020-12-25 彭涛 警情高发地的识别方法、装置、电子设备及存储介质
CN112183829A (zh) * 2020-09-16 2021-01-05 广东康云科技有限公司 一种警情预测方法、系统、装置和存储介质
CN112465229A (zh) * 2020-11-30 2021-03-09 安徽力瀚科技有限公司 一种综合应用人工智能技术的警情时空预测系统
CN112541075A (zh) * 2020-10-30 2021-03-23 中科曙光南京研究院有限公司 一种警情文本的标准案发时间提取方法及系统
CN113222176A (zh) * 2021-05-08 2021-08-06 西北工业大学 一种基于自激点过程的犯罪事件建模方法
CN114418244A (zh) * 2022-03-29 2022-04-29 北京零点远景网络科技有限公司 一种案件的预测分析方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007114846A (ja) * 2005-10-18 2007-05-10 Hitachi Software Eng Co Ltd 防犯対策情報提供装置
CN103955804A (zh) * 2014-05-20 2014-07-30 中山大学 一种服务于警务防控分区规划的犯罪风险时空模式识别方法
CN104765772A (zh) * 2015-03-11 2015-07-08 广西师范学院 一种基于时空区域犯罪特征的建模方法
CN106127231A (zh) * 2016-06-16 2016-11-16 中国人民解放军国防科学技术大学 一种基于信息交互网络的犯罪个体识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007114846A (ja) * 2005-10-18 2007-05-10 Hitachi Software Eng Co Ltd 防犯対策情報提供装置
CN103955804A (zh) * 2014-05-20 2014-07-30 中山大学 一种服务于警务防控分区规划的犯罪风险时空模式识别方法
CN104765772A (zh) * 2015-03-11 2015-07-08 广西师范学院 一种基于时空区域犯罪特征的建模方法
CN106127231A (zh) * 2016-06-16 2016-11-16 中国人民解放军国防科学技术大学 一种基于信息交互网络的犯罪个体识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
何炎祥等: "基于CRF和规则相结合的地理命名实体识别方法", 《计算机应用与软件》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309935A (zh) * 2019-03-26 2019-10-08 浙江工业大学 一种基于改进starma模型的犯罪预测方法
CN110399537A (zh) * 2019-07-22 2019-11-01 苏州量盾信息科技有限公司 一种基于人工智能技术的警情时空预测方法
CN110472775A (zh) * 2019-07-26 2019-11-19 广州大学 一种系列案件疑犯落脚点预测方法
CN110990562B (zh) * 2019-10-29 2022-08-26 新智认知数字科技股份有限公司 警情分类方法及其系统
CN110990562A (zh) * 2019-10-29 2020-04-10 新智认知数字科技股份有限公司 警情分类方法及其系统
CN111696200A (zh) * 2020-05-06 2020-09-22 广东康云科技有限公司 一种警情态势显示的方法、系统、装置及存储介质
CN112131381A (zh) * 2020-08-20 2020-12-25 彭涛 警情高发地的识别方法、装置、电子设备及存储介质
CN112183829A (zh) * 2020-09-16 2021-01-05 广东康云科技有限公司 一种警情预测方法、系统、装置和存储介质
CN112541075A (zh) * 2020-10-30 2021-03-23 中科曙光南京研究院有限公司 一种警情文本的标准案发时间提取方法及系统
CN112541075B (zh) * 2020-10-30 2024-04-05 中科曙光南京研究院有限公司 一种警情文本的标准案发时间提取方法及系统
CN112465229A (zh) * 2020-11-30 2021-03-09 安徽力瀚科技有限公司 一种综合应用人工智能技术的警情时空预测系统
CN112465229B (zh) * 2020-11-30 2023-06-23 安徽力瀚科技有限公司 一种综合应用人工智能技术的警情时空预测系统
CN113222176A (zh) * 2021-05-08 2021-08-06 西北工业大学 一种基于自激点过程的犯罪事件建模方法
CN114418244A (zh) * 2022-03-29 2022-04-29 北京零点远景网络科技有限公司 一种案件的预测分析方法、装置、电子设备及存储介质
CN114418244B (zh) * 2022-03-29 2022-07-08 北京零点远景网络科技有限公司 一种案件的预测分析方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN109472419B (zh) 2021-09-21

Similar Documents

Publication Publication Date Title
CN109472419A (zh) 基于时空的警情预测模型的建立方法、装置和存储介质
Chen et al. Long short-term memory model for traffic congestion prediction with online open data
CN112199608B (zh) 基于网络信息传播图建模的社交媒体谣言检测方法
CN104318340B (zh) 基于文本履历信息的信息可视化方法及智能可视分析系统
CN111061843A (zh) 一种知识图谱引导的假新闻检测方法
CN111159387B (zh) 基于多维度报警信息文本相似度分析的推荐方法
CN109543764B (zh) 一种基于智能语义感知的预警信息合法性检测方法及检测系统
CN113743111B (zh) 基于文本预训练和多任务学习的金融风险预测方法及装置
CN112015901A (zh) 文本分类方法及装置、警情分析系统
Borges et al. Feature engineering for crime hotspot detection
Tonkin et al. A comparison of logistic regression and classification tree analysis for behavioural case linkage
Wang et al. On representation learning for road networks
CN112905868A (zh) 事件抽取方法、装置、设备及存储介质
CN112084240B (zh) 一种群租房智能识别、联动治理方法及系统
CN111259167B (zh) 用户请求风险识别方法及装置
Wang et al. Measuring urban vibrancy of residential communities using big crowdsourced geotagged data
Peng et al. A forecast model of tourism demand driven by social network data
CN116541755A (zh) 一种基于时序图表征学习的金融行为模式分析预测方法
CN110399537A (zh) 一种基于人工智能技术的警情时空预测方法
Zhu et al. Loan default prediction based on convolutional neural network and LightGBM
Yin Crime Prediction Methods Based on Machine Learning: A Survey.
CN117314623A (zh) 融合外部知识的贷款欺诈预测方法、装置及存储介质
Huo et al. Text-to-traffic generative adversarial network for traffic situation generation
Zhang Remote sensing data processing of urban land using based on artificial neural network
CN112069392B (zh) 涉网犯罪防控方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant