CN113450236B - 基于时空数据的可疑人员识别方法、装置、系统和介质 - Google Patents
基于时空数据的可疑人员识别方法、装置、系统和介质 Download PDFInfo
- Publication number
- CN113450236B CN113450236B CN202010213220.8A CN202010213220A CN113450236B CN 113450236 B CN113450236 B CN 113450236B CN 202010213220 A CN202010213220 A CN 202010213220A CN 113450236 B CN113450236 B CN 113450236B
- Authority
- CN
- China
- Prior art keywords
- personnel
- data
- distribution data
- case
- suspicious
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000000694 effects Effects 0.000 claims abstract description 72
- 239000006185 dispersion Substances 0.000 claims abstract description 61
- 238000004458 analytical method Methods 0.000 claims abstract description 11
- 238000012216 screening Methods 0.000 claims description 43
- 238000004590 computer program Methods 0.000 claims description 12
- 238000001914 filtration Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 description 9
- 230000002159 abnormal effect Effects 0.000 description 5
- 230000002354 daily effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 241001622623 Coeliadinae Species 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Alarm Systems (AREA)
Abstract
本发明实施例公开了一种基于时空数据的可疑人员识别方法、装置、系统和介质,对提取的历史案件数据进行分类处理,得到多个数据组;按照预先设定的时空维度,对各数据组进行维度划分,以得到案件分布数据。按照时空维度,对获取的人员活动数据进行维度划分,得到人员停留时间分布数据。依据案件分布数据、人员停留时间分布数据以及人员活动轨迹的离散度,可以筛选出可疑人员。在该技术方案中,通过案件与人员的时空规律分析,可以拟合出具有嫌疑的人员,并结合人员活动轨迹的离散度,排除掉具有个人重复轨迹特性的人员,从而可以准确的筛选出可疑人员。
Description
技术领域
本发明涉及安全防护技术领域,特别是涉及一种基于时空数据的可疑人员识别方法、装置、系统和计算机可读存储介质。
背景技术
公安行业大量系统的建设,使得相关使用方可以采集到大量的多类别数据,这些数据对于案件的侦破具有积极的作用,但这些应用大部分是对于案发后的侦破以及人员侦查,如何更好的做好安全预防和案发后更及时的响应,是当前发展的一个重要方向,也是当前存在最大困难的地方。
现有技术中,通过前端设备采集多维数据存入大数据,然后基于历史案件以及犯罪人员的大数据得到案件特征与犯罪嫌疑人特征的强关联规则;再根据待分析案件的案件特征信息,利用上述强关联规则预测出该案件的犯罪嫌疑人特征信息,最后基于前端多维数据以及犯罪嫌疑人特征信息挖掘出嫌疑目标。
利用案件和已侦破案件的嫌疑人特性建立规则,然后挖掘其他案件有嫌疑的目标人员。但是该技术方案基于的数据类别比较多,如果前端上报的多维数据不全或不准,将大大的影响分析结果,导致挖掘出的可疑人员名单不准确。
可见,如何提升可疑人员挖掘的精确性,是本领域技术人员需要解决的问题。
发明内容
本发明实施例的目的是提供一种基于时空数据的可疑人员识别方法、装置、系统和计算机可读存储介质,可以提升可疑人员挖掘的精确性。
为解决上述技术问题,本发明实施例提供一种基于时空数据的可疑人员识别方法,包括:
对提取的历史案件数据进行分类处理,得到多个数据组;
按照预先设定的时空维度,对各所述数据组进行维度划分,以得到案件分布数据;其中,每个数据组有其对应的一个案件分布数据;
按照所述时空维度,对获取的人员活动数据进行维度划分,以得到人员停留时间分布数据;
依据所述案件分布数据、所述人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员。
可选地,在所述按照预先设定的时空维度,对各所述数据组进行维度划分,以得到案件分布数据之后还包括:
将所述案件分布数据中不满足案件数量过滤规则的数据置零,得到过滤后的案件分布数据;
相应的,所述依据所述案件分布数据、所述人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员包括:
依据所述过滤后的案件分布数据、所述人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员。
可选地,在所述按照所述时空维度,对获取的人员活动数据进行维度划分,得到人员停留时间分布数据之后还包括:
将所述人员停留时间分布数据中停留时间小于预设时间阈值的数据置零,得到处理后的人员停留时间分布数据;
相应的,所述依据所述案件分布数据、所述人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员包括:
依据所述过滤后的案件分布数据、所述处理后的人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员。
可选地,所述依据所述案件分布数据、所述人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员包括:
对预设时间段内获取的所述案件分布数据和所述人员停留时间分布数据进行拟合,筛选出初始可疑人员和高频案发时空维度;
利用轨迹相似度算法对所述初始可疑人员的活动轨迹进行分析,得出所述可疑人员在所述预设时间段内的轨迹离散度;
将所述轨迹离散度大于预设阈值的初始可疑人员标记为可疑人员。
可选地,所述利用轨迹相似度算法对所述初始可疑人员的活动轨迹进行分析,得出所述可疑人员在所述预设时间段内的轨迹离散度包括:
根据所述初始可疑人员在各时间区段的空间点位,确定出在所述预设时间段内所述初始可疑人员的中心点位;其中,所有所述时间区段构成所述预设时间段;
依据所述初始可疑人员的空间点位和中心点位,计算出所述初始可疑人员的轨迹相似度;
依据所述初始可疑人员的轨迹相似度以及所述初始可疑人员在所述预设时间段内的轨迹相似度的平均值,得出所述初始可疑人员在所述预设时间段内的轨迹离散度。
可选地,在所述依据所述案件分布数据、所述人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员之后还包括:
当检测到所述可疑人员在所述高频案发时空维度出现时,进行报警提示。
可选地,在所述按照预先设定的时空维度,对各所述数据组进行维度划分,以得到案件分布数据之前还包括:
将各所述数据组中缺少案件时间信息或案件空间信息的案件数据删除。
本发明实施例还提供了一种基于时空数据的可疑人员识别装置,包括分类单元、案件划分单元、人员划分单元和筛选单元;
所述分类单元,用于对提取的历史案件数据进行分类处理,得到多个数据组;
所述案件划分单元,用于按照预先设定的时空维度,对各所述数据组进行维度划分,以得到案件分布数据;其中,每个数据组有其对应的一个案件分布数据;
所述人员划分单元,用于按照所述时空维度,对获取的人员活动数据进行维度划分,得到人员停留时间分布数据;
所述筛选单元,用于依据所述案件分布数据、所述人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员。
可选地,还包括过滤单元;
所述过滤单元,用于在所述按照预先设定的时空维度,对各所述数据组进行维度划分,以得到案件分布数据之后,将所述案件分布数据中不满足案件数量过滤规则的数据置零,得到过滤后的案件分布数据;
相应的,所述筛选单元具体用于依据所述过滤后的案件分布数据、所述人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员。
可选地,还包括处理单元;
所述处理单元,用于在所述按照所述时空维度,对获取的人员活动数据进行维度划分,得到人员停留时间分布数据之后,将所述人员停留时间分布数据中停留时间小于预设时间阈值的数据置零,得到处理后的人员停留时间分布数据;
相应的,所述筛选单元具体用于依据所述过滤后的案件分布数据、所述处理后的人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员。
可选地,所述筛选单元包括拟合子单元、分析子单元和标记子单元;
所述拟合子单元,用于对预设时间段内获取的所述案件分布数据和所述人员停留时间分布数据进行拟合,筛选出初始可疑人员和高频案发时空维度;
所述分析子单元,用于利用轨迹相似度算法对所述初始可疑人员的活动轨迹进行分析,得出所述可疑人员在所述预设时间段内的轨迹离散度;
所述标记子单元,用于将所述轨迹离散度大于预设阈值的初始可疑人员标记为可疑人员。
可选地,所述分析子单元具体用于
根据所述初始可疑人员在各时间区段的空间点位,确定出在所述预设时间段内所述初始可疑人员的中心点位;其中,所有所述时间区段构成所述预设时间段;
依据所述初始可疑人员的空间点位和中心点位,计算出所述初始可疑人员的轨迹相似度;
依据所述初始可疑人员的轨迹相似度以及所述初始可疑人员在所述预设时间段内的轨迹相似度的平均值,得出所述初始可疑人员在所述预设时间段内的轨迹离散度。
可选地,还包括提示子单元;
所述提示子单元,用于当检测到所述可疑人员在所述高频案发时空维度出现时,进行报警提示。
可选地,还包括删除子单元;
所述删除子单元,用于在所述按照预先设定的时空维度,对各所述数据组进行维度划分,以得到案件分布数据之前,将各所述数据组中缺少案件时间信息或案件空间信息的案件数据删除。
本发明实施例还提供了一种基于时空数据的可疑人员识别系统,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如上述任意一项所述基于时空数据的可疑人员识别方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述基于时空数据的可疑人员识别方法的步骤。
由上述技术方案可以看出,对提取的历史案件数据进行分类处理,得到多个数据组;按照预先设定的时空维度,对各数据组进行维度划分,以得到案件分布数据;其中,每个数据组有其对应的一个案件分布数据。案件分布数据反映了同种类型的案件在时间和空间上的分布情况。按照时空维度,对获取的人员活动数据进行维度划分,得到人员停留时间分布数据。人员停留时间分布数据反映了人员在不同的时间和空间所停留的时间。人员活动轨迹的离散度反映了人员日常活动轨迹的异常情况。依据案件分布数据、人员停留时间分布数据以及人员活动轨迹的离散度,可以筛选出可疑人员。在该技术方案中,通过案件与人员的时空规律分析,可以拟合出具有嫌疑的人员,并结合人员活动轨迹的离散度,排除掉具有个人重复轨迹特性的人员,从而可以准确的筛选出可疑人员。
附图说明
为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于时空数据的可疑人员识别的方法的流程图;
图2为本发明实施例提供的一种筛选可疑人员和高频案发时空维度的方法的流程图;
图3为本发明实施例提供的一种基于二维坐标表示的时空轨迹的示意图;
图4为本发明实施例提供的一种基于时空数据的可疑人员识别的装置的结构示意图;
图5为本发明实施例提供的一种基于时空数据的可疑人员识别的系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
接下来,详细介绍本发明实施例所提供的一种基于时空数据的可疑人员识别的方法。图1为本发明实施例提供的一种基于时空数据的可疑人员识别方法的流程图,该方法包括:
S101:对提取的历史案件数据进行分类处理,得到多个数据组。
历史案件数据包含了案件类型、案发时间和案发地点等属性信息。
在实际应用中,历史案件数据在存储时会针对于其所属的案件类型设置相应的案件代码,在本发明实施例中,可以根据各历史案件数据中的案件代码,对获取的历史案件数据进行分类,得到多个数据组。一个数据组对应一种类型的案件,一个数据组中往往包含有多个案件的案件数据。
一个数据组casedata的形式如下:
casedata={casetype,timerange,space,caselist}
其中,casetype表示案件类型;
timerange表示时间区段,timerange={begintime,endtime}, begintime和endtime表示开始时间点和结束时间点,只包含时分秒;
space表示空间区域,因该区域实际区域不会非常大,可以取该区域四边形的左上角点位和右下角点位的坐标表示,space={pointup, pointdown},pointup和pointdown由经度和纬度组成。
一个数据组包含有多个案件,caselist是案件列表。
S102:按照预先设定的时空维度,对各数据组进行维度划分,以得到案件分布数据。
时空维度可以包括空间区域和时间区段。
空间区域可以按照案件案发地点的分布情况设置,可以按照实际情况划分空间区域。
时间区段可以以一天即24小时进行划分,在本发明实施例中,对于时间区段的划分单元不做限定,例如,可以以30分钟作为时间区段的划分单元,一天的时间则可以被划分成48个时间区段。
每个数据组的处理方式类似,按照时空维度对每个数据组进行维度划分,每个数据组可以得到其对应的一个案件分布数据。在该案件分布数据中记录了不同空间区域在不同的时间区段下案件的分布情况。
每个数据组的维度划分方式相同,以所有数据组中的任意一个数据组即目标数据组为例展开介绍,按照目标数据组的处理,可以得到所有数据组各自对应的案件分布数据。
以目标数据组为例,按照预先设定的空间区域和时间区段,对目标数据组中的案件数据依次进行空间维度和时间维度的划分,得到案件分布数据。
每个空间区域在不同的时间区段有其对应的案件数量,为了更加直观的了解各个空间区域的案件发生概率,在本发明实施例中,可以计算出每个空间区域在某个时间区段案件数量占所有时间区段案件总数量的百分比。即案件分布数据可以记录每个空间区域在不同的时间区段案件数量的百分比。
考虑到实际应用中,在某一个时间区段内某一个空间区域案件数量的百分比较低时,则该时空维度内的数据参考价值较低,为了降低数据分析的工作量,在本发明实施例中,可以将案件分布数据中不满足案件数量过滤规则的数据置零,得到过滤后的案件分布数据。
具体的,可以设置案件数量百分比的下限值,当某个时空维度内案件数量的百分比小于该下限值时,则可以将该时空维度内案件数量的百分比设置为零。
下限值的取值可以根据实际需求设定,在此不做限定。
为了更加清楚简洁的记录案件分布数据,可以将案件分布数据以表格的形式记录。如表1所示为一个数据组所对应的案件分布数据表,其中,划分的空间区域包括S1至Sk,划分的时间区段包括T1至Tm。
表1
S103:按照时空维度,对获取的人员活动数据进行维度划分,以得到人员停留时间分布数据。
人员活动数据维度划分所依赖的时空维度和数据组维度划分所依赖的时空维度相同,在此不再赘述。
人员活动轨迹由多类别轨迹组成,为保证获取到的人员活动数据的完整性与精确性,在本发明实施例中,可以基于档案中心提取人员活动数据。人员活动数据可以包含人员的活动轨迹、人脸信息、机动车信息、手机MAC/IMEI信息、车辆信息等。
每个人员所对应的人员活动数据的维度划分方式相同,在本发明实施例中,以一个人员的人员活动数据为例展开介绍。
在具体实现中,可以按照空间区域和时间区段,对获取的人员活动数据依次进行空间维度和时间维度的划分,得到人员停留时间分布数据。
人员停留时间分布数据记录了该人员在不同的时空维度下停留的时间。
考虑到人员在某个时空维度下停留的时间较为短暂时,说明该人员并不具有作案条件,为了降低数据分析量,可以将人员停留时间分布数据中停留时间小于预设时间阈值的数据置零,从而得到处理后的人员停留时间分布数据。
其中,时间阈值的取值可以依据实际需求设定,在此不做限定。
为了更加清楚简洁的记录人员停留时间分布数据,可以将人员停留时间分布数据以表格的形式记录。如表2所示为一个人员所对应的人员停留时间分布数据,其中,划分的空间区域包括S1至Sk,划分的时间区段包括T1至Tm。
表2
S104:依据案件分布数据、人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员。
案件分布数据反映了同种类型的案件在时间和空间上的分布情况。
人员停留时间分布数据反映了人员在不同的时间和空间所停留的时间。
人员活动轨迹的离散度反映了人员日常活动轨迹的异常情况。
依据案件分布数据和人员停留时间分布数据,可以对案件与人员的时空规律进行分析,从而拟合出具有嫌疑的人员,并结合人员活动轨迹的离散度,排除掉具有个人重复轨迹特性的人员,从而可以准确的筛选出可疑人员。
如图2所示为本发明实施例提供的一种筛选可疑人员和高频案发时空维度的方法的流程图,该方法包括:
S201:对预设时间段内获取的案件分布数据和人员停留时间分布数据进行拟合,筛选出初始可疑人员和高频案发时空维度。
结合S102的介绍可知,时间区段是将一天的时间进行区段的划分。相应的,每一天都有其对应的案件分布数据和人员停留时间分布数据。
在筛选初始可疑人员和高频案发时空维度时,其依赖的数据越多,分析出的结果越准确。
为了更加充分的挖掘案件与人员的时空规律,在本发明实施例中,可以对预设时间段内获取的案件分布数据和人员停留时间分布数据进行拟合。
预设时间段的取值可以根据实际需求设置,在此不做限定。例如,可以设置为7天。
以7天为例,每天都有其对应的案件分布数据和人员停留时间分布数据,在具体实现中,可以将每一天的案件分布数据和人员停留时间分布数据进行拟合,拟合指的是选取出案件分布数据和人员停留时间分布数据在同一时间区段、同一空间区域下取值均不为零的数据。为了便于描述,在本发明实施例中,可以将一个时间区段和一个空间区域的组合形式作为一个区块。
以表1和表2的数据为例,表1在时空维度S2T1的取值不为零,表2在时空维度S2T1的取值也不为零,则说明S2T1为一个重叠区块。其中,S2T1代表的是空间区域S2、时间区段T1。
在本发明实施例中,可以将案件分布数据和人员停留时间分布数据的重叠区块与案件分布数据中非零区块的比值作为人员的轨迹与案件在时空分布的拟合度。
例如,表1中的非零数据有100个,表2中的非零数据有60个,表1和表2在相同时空维度下均不为零的数据有45个,则表1和表2 的拟合度为45/100=45%。
在具体实现中,可以对拟合度设置一个标准值,当拟合度大于或等于该标准值时,则说明这重叠区块所对应的时空维度为高频案发时空维度,重叠区块所对应的人员为初始可疑人员。
其中,标准值可以根据历史数据统计得到,也可以人为设置,在此不做限定。
S202:利用轨迹相似度算法对初始可疑人员的活动轨迹进行分析,得出可疑人员在预设时间段内的轨迹离散度。
人员活动轨迹的离散度反映了人员日常活动轨迹的异常情况。
人员活动轨迹规律总是和其职业相关,以教师为例,其轨迹一般是家和学校的路线,而快递员因为片区划分其轨迹也基本是固定的,外卖人员和无业人员的轨迹可能就比较离散,因此可根据人员活动轨迹规律来分析其与案件的相关性。
轨迹上每一个点位都可以用时间和空间两种维度描述,即点位 P(t,p),其中t是一天24小时以某个固定时长划分后所在的时间区段,以30分钟为例,一天即有48个时间区段。同理p是空间区域内根据经纬度划分的区段,若以时间为横轴x,以空间为纵轴y,则行人的一条时空轨迹可以用如图3所示的二维坐标表示。
在本发明实施例中,可以根据初始可疑人员在各时间区段的空间点位,确定出在预设时间段内初始可疑人员的中心点位;其中,所有时间区段构成预设时间段。
其中,pi表示一个初始可疑人员在第i个时间区段的空间点位。
在确定出在预设时间段内初始可疑人员的中心点位之后,可以依据初始可疑人员的空间点位和中心点位,计算出初始可疑人员的轨迹相似度。
具体的,可以按照如下轨迹相似度计算公式,计算一个初始可疑人员每天的空间点位形成的轨迹与中心点位形成的轨迹的相似度,
其中,N表示24小时划分N个时间区段,N<T。
依据初始可疑人员的轨迹相似度以及初始可疑人员在预设时间段内的轨迹相似度的平均值,得出初始可疑人员在预设时间段内的轨迹离散度。
具体的,可以按照如下轨迹离散度计算公式,计算一个初始可疑人员在预设时间段内的轨迹离散度,
S203:将轨迹离散度大于预设阈值的初始可疑人员标记为可疑人员。
轨迹离散度的取值越大,说明人员的活动轨迹越分散或者是与之前较为固定的活动轨迹偏离较大,此时该人员的作案动机较大。
在具体实现中,可以通过预设阈值对轨迹离散度进行评估,当初始可疑人员的轨迹离散度大于预设阈值时,则将该初始可疑人员标记为可疑人员。
由上述技术方案可以看出,对提取的历史案件数据进行分类处理,得到多个数据组;按照预先设定的时空维度,对各数据组进行维度划分,以得到案件分布数据;其中,每个数据组有其对应的一个案件分布数据。案件分布数据反映了同种类型的案件在时间和空间上的分布情况。按照时空维度,对获取的人员活动数据进行维度划分,得到人员停留时间分布数据。人员停留时间分布数据反映了人员在不同的时间和空间所停留的时间。人员活动轨迹的离散度反映了人员日常活动轨迹的异常情况。依据案件分布数据、人员停留时间分布数据以及人员活动轨迹的离散度,可以筛选出可疑人员。在该技术方案中,通过案件与人员的时空规律分析,可以拟合出具有嫌疑的人员,并结合人员活动轨迹的离散度,排除掉具有个人重复轨迹特性的人员,从而可以准确的筛选出可疑人员。
在本发明实施例中,对案件数据和人员活动数据进行时空维度的划分。考虑到实际应用中,获取的案件数据和人员活动数据可能包含有不完整的数据,例如,缺少案件时间信息或案件空间信息。
因此,在按照预先设定的时空维度和案件数量过滤规则,对各数据组进行维度划分,以得到案件分布数据之前,可以先将各数据组中缺少案件时间信息或案件空间信息的案件数据删除。
同理,对于人员活动数据的处理,在按照时空维度和停留时间过滤规则,对获取的人员活动数据进行维度划分,以得到人员停留时间分布数据之前,可以先将人员活动数据中缺少案件时间信息或案件空间信息的数据删除。
通过删除不完整的数据,可以有效的降低数据分析量,并且有效的保证了案件分布数据和人员停留时间分布数据的有效性。
在本发明实施例中,在依据案件分布数据、人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员和高频案发时空维度之后,可以当检测到可疑人员在高频案发时空维度出现时,进行报警提示。
高频案发时空维度包括高频案发空间区域和高频案发时间区段,在本发明实施例中,主要以高频案发空间区域为主,当可疑人员出现在高频案发空间区域时,则可以进行报警提示。
其中,报警提示的方式可以有多种,一种方式,可以在该高频案发空间区域设置报警器,当检测到可疑人员出现在高频案发空间区域时,则触发该报警器进行报警。另一种方式可以预先记录管理该高频案发区域的民警联系方式,当检测到可疑人员出现在高频案发空间区域时,则通过预先记录的联系方式,向民警推送提醒消息。
其中,提醒消息中可以包含可疑人员的人脸图像信息、车辆信息、 MAC信息等。
通过向周边民警推送提醒消息,可以便于民警对该可疑人员进行重点关注。当该可疑人员作案时,周边民警可以更有针对性的进行人员搜索,提高案件现场抓获率。
图4为本发明实施例提供的一种基于时空数据的可疑人员识别装置的结构示意图,包括分类单元41、案件划分单元42、人员划分单元 43和筛选单元44;
分类单元41,用于对提取的历史案件数据进行分类处理,得到多个数据组;
案件划分单元42,用于按照预先设定的时空维度,对各数据组进行维度划分,以得到案件分布数据;其中,每个数据组有其对应的一个案件分布数据;
人员划分单元43,用于按照时空维度,对获取的人员活动数据进行维度划分,得到人员停留时间分布数据;
筛选单元44,用于依据案件分布数据、人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员。
可选地,还包括过滤单元;
过滤单元,用于在按照预先设定的时空维度,对各数据组进行维度划分,以得到案件分布数据之后,将案件分布数据中不满足案件数量过滤规则的数据置零,得到过滤后的案件分布数据;
相应的,筛选单元具体用于依据过滤后的案件分布数据、人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员。
可选地,还包括处理单元;
处理单元,用于在按照所述时空维度,对获取的人员活动数据进行维度划分,得到人员停留时间分布数据之后,将人员停留时间分布数据中停留时间小于预设时间阈值的数据置零,得到处理后的人员停留时间分布数据;
相应的,筛选单元具体用于依据过滤后的案件分布数据、处理后的人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员。
可选地,筛选单元包括拟合子单元、分析子单元和标记子单元;
拟合子单元,用于对预设时间段内获取的案件分布数据和人员停留时间分布数据进行拟合,筛选出初始可疑人员和高频案发时空维度;
分析子单元,用于利用轨迹相似度算法对初始可疑人员的活动轨迹进行分析,得出可疑人员在预设时间段内的轨迹离散度;
标记子单元,用于将轨迹离散度大于预设阈值的初始可疑人员标记为可疑人员。
可选地,分析子单元具体用于
根据所述初始可疑人员在各时间区段的空间点位,确定出在所述预设时间段内所述初始可疑人员的中心点位;其中,所有所述时间区段构成所述预设时间段;
依据所述初始可疑人员的空间点位和中心点位,计算出所述初始可疑人员的轨迹相似度;
依据所述初始可疑人员的轨迹相似度以及所述初始可疑人员在所述预设时间段内的轨迹相似度的平均值,得出所述初始可疑人员在所述预设时间段内的轨迹离散度。
可选地,还包括提示子单元;
提示子单元,用于当检测到可疑人员在高频案发时空维度出现时,进行报警提示。
可选地,还包括删除子单元;
删除子单元,用于在按照预先设定的时空维度,对各数据组进行维度划分,以得到案件分布数据之前,将各数据组中缺少案件时间信息或案件空间信息的案件数据删除。
图4所对应实施例中特征的说明可以参见图1和图2所对应实施例的相关说明,这里不再一一赘述。
由上述技术方案可以看出,对提取的历史案件数据进行分类处理,得到多个数据组;按照预先设定的时空维度,对各数据组进行维度划分,以得到案件分布数据;其中,每个数据组有其对应的一个案件分布数据。案件分布数据反映了同种类型的案件在时间和空间上的分布情况。按照时空维度,对获取的人员活动数据进行维度划分,得到人员停留时间分布数据。人员停留时间分布数据反映了人员在不同的时间和空间所停留的时间。人员活动轨迹的离散度反映了人员日常活动轨迹的异常情况。依据案件分布数据、人员停留时间分布数据以及人员活动轨迹的离散度,可以筛选出可疑人员。在该技术方案中,通过案件与人员的时空规律分析,可以拟合出具有嫌疑的人员,并结合人员活动轨迹的离散度,排除掉具有个人重复轨迹特性的人员,从而可以准确的筛选出可疑人员。
图5为本发明实施例提供的一种基于时空数据的可疑人员识别系统50的结构示意图,包括:
存储器51,用于存储计算机程序;
处理器52,用于执行所述计算机程序以实现如上述任意实施例所述的基于时空数据的可疑人员识别方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意实施例所述的基于时空数据的可疑人员识别方法的步骤
以上对本发明实施例所提供的一种基于时空数据的可疑人员识别方法、装置、系统和计算机可读存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程 ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
Claims (9)
1.一种基于时空数据的可疑人员识别方法,其特征在于,包括:
对提取的历史案件数据进行分类处理,得到多个数据组;
按照预先设定的时空维度,对各所述数据组进行维度划分,以得到案件分布数据;其中,每个数据组有其对应的一个案件分布数据;
按照所述时空维度,对获取的人员活动数据进行维度划分,以得到人员停留时间分布数据;
依据所述案件分布数据、所述人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员;
所述依据所述案件分布数据、所述人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员包括:
对预设时间段内获取的所述案件分布数据和所述人员停留时间分布数据进行拟合,筛选出初始可疑人员和高频案发时空维度;所述拟合指的是选取出案件分布数据和人员停留时间分布数据在同一时间区段、同一空间区域下取值均不为零的数据;
利用轨迹相似度算法对所述初始可疑人员的活动轨迹进行分析,得出所述可疑人员在所述预设时间段内的轨迹离散度;
将所述轨迹离散度大于预设阈值的初始可疑人员标记为可疑人员。
2.根据权利要求1所述的方法,其特征在于,在所述按照预先设定的时空维度,对各所述数据组进行维度划分,以得到案件分布数据之后还包括:
将所述案件分布数据中不满足案件数量过滤规则的数据置零,得到过滤后的案件分布数据;
相应的,所述依据所述案件分布数据、所述人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员包括:
依据所述过滤后的案件分布数据、所述人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员。
3.根据权利要求2所述的方法,其特征在于,在所述按照所述时空维度,对获取的人员活动数据进行维度划分,得到人员停留时间分布数据之后还包括:
将所述人员停留时间分布数据中停留时间小于预设时间阈值的数据置零,得到处理后的人员停留时间分布数据;
相应的,所述依据所述案件分布数据、所述人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员包括:
依据所述过滤后的案件分布数据、所述处理后的人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员。
4.根据权利要求1所述的方法,其特征在于,所述利用轨迹相似度算法对所述初始可疑人员的活动轨迹进行分析,得出所述可疑人员在所述预设时间段内的轨迹离散度包括:
根据所述初始可疑人员在各时间区段的空间点位,确定出在所述预设时间段内所述初始可疑人员的中心点位;其中,所有所述时间区段构成所述预设时间段;
依据所述初始可疑人员的空间点位和中心点位,计算出所述初始可疑人员的轨迹相似度;
依据所述初始可疑人员的轨迹相似度以及所述初始可疑人员在所述预设时间段内的轨迹相似度的平均值,得出所述初始可疑人员在所述预设时间段内的轨迹离散度。
5.根据权利要求1所述的方法,其特征在于,在所述依据所述案件分布数据、所述人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员之后还包括:
当检测到所述可疑人员在所述高频案发时空维度出现时,进行报警提示。
6.根据权利要求1-5任意一项所述的方法,其特征在于,在所述按照预先设定的时空维度,对各所述数据组进行维度划分,以得到案件分布数据之前还包括:
将各所述数据组中缺少案件时间信息或案件空间信息的案件数据删除。
7.一种基于时空数据的可疑人员识别装置,其特征在于,包括分类单元、案件划分单元、人员划分单元和筛选单元;
所述分类单元,用于对提取的历史案件数据进行分类处理,得到多个数据组;
所述案件划分单元,用于按照预先设定的时空维度,对各所述数据组进行维度划分,以得到案件分布数据;其中,每个数据组有其对应的一个案件分布数据;
所述人员划分单元,用于按照所述时空维度,对获取的人员活动数据进行维度划分,得到人员停留时间分布数据;
所述筛选单元,用于依据所述案件分布数据、所述人员停留时间分布数据以及人员活动轨迹的离散度,筛选出可疑人员;
所述筛选单元包括拟合子单元、分析子单元和标记子单元;
拟合子单元,用于对预设时间段内获取的案件分布数据和人员停留时间分布数据进行拟合,筛选出初始可疑人员和高频案发时空维度;所述拟合指的是选取出案件分布数据和人员停留时间分布数据在同一时间区段、同一空间区域下取值均不为零的数据;
分析子单元,用于利用轨迹相似度算法对初始可疑人员的活动轨迹进行分析,得出可疑人员在预设时间段内的轨迹离散度;
标记子单元,用于将轨迹离散度大于预设阈值的初始可疑人员标记为可疑人员。
8.一种基于时空数据的可疑人员识别系统,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1至6任意一项所述基于时空数据的可疑人员识别方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任意一项所述基于时空数据的可疑人员识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010213220.8A CN113450236B (zh) | 2020-03-24 | 2020-03-24 | 基于时空数据的可疑人员识别方法、装置、系统和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010213220.8A CN113450236B (zh) | 2020-03-24 | 2020-03-24 | 基于时空数据的可疑人员识别方法、装置、系统和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113450236A CN113450236A (zh) | 2021-09-28 |
CN113450236B true CN113450236B (zh) | 2022-12-23 |
Family
ID=77806450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010213220.8A Active CN113450236B (zh) | 2020-03-24 | 2020-03-24 | 基于时空数据的可疑人员识别方法、装置、系统和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113450236B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009055139A (ja) * | 2007-08-23 | 2009-03-12 | Hitachi Kokusai Electric Inc | 人物追跡システム、人物追跡装置および人物追跡プログラム |
JP2013088870A (ja) * | 2011-10-13 | 2013-05-13 | Toyota Infotechnology Center Co Ltd | 不審者検知装置、不審者検知方法およびプログラム |
CN105991598A (zh) * | 2015-02-15 | 2016-10-05 | 中兴通讯股份有限公司 | 用户获取方法及装置 |
CN108595606A (zh) * | 2018-04-20 | 2018-09-28 | 广东亿迅科技有限公司 | 基于运营商数据的公安案件时空分析方法及装置 |
CN108664600A (zh) * | 2018-05-09 | 2018-10-16 | 山东合天智汇信息技术有限公司 | 一种用于识别特殊场所嫌疑人的方法和装置 |
CN109614418A (zh) * | 2018-11-23 | 2019-04-12 | 武汉烽火众智数字技术有限责任公司 | 基于大数据的挖掘嫌疑目标的方法及系统 |
-
2020
- 2020-03-24 CN CN202010213220.8A patent/CN113450236B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009055139A (ja) * | 2007-08-23 | 2009-03-12 | Hitachi Kokusai Electric Inc | 人物追跡システム、人物追跡装置および人物追跡プログラム |
JP2013088870A (ja) * | 2011-10-13 | 2013-05-13 | Toyota Infotechnology Center Co Ltd | 不審者検知装置、不審者検知方法およびプログラム |
CN105991598A (zh) * | 2015-02-15 | 2016-10-05 | 中兴通讯股份有限公司 | 用户获取方法及装置 |
CN108595606A (zh) * | 2018-04-20 | 2018-09-28 | 广东亿迅科技有限公司 | 基于运营商数据的公安案件时空分析方法及装置 |
CN108664600A (zh) * | 2018-05-09 | 2018-10-16 | 山东合天智汇信息技术有限公司 | 一种用于识别特殊场所嫌疑人的方法和装置 |
CN109614418A (zh) * | 2018-11-23 | 2019-04-12 | 武汉烽火众智数字技术有限责任公司 | 基于大数据的挖掘嫌疑目标的方法及系统 |
Non-Patent Citations (2)
Title |
---|
李智等.点模式条件下的犯罪嫌疑人时空同现模式挖掘与分析.《地球信息科学学报》.2018,(第06期), * |
王永坤等.面向公共安全的时空数据挖掘综述.《重庆邮电大学学报(自然科学版)》.2018,(第01期), * |
Also Published As
Publication number | Publication date |
---|---|
CN113450236A (zh) | 2021-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220092881A1 (en) | Method and apparatus for behavior analysis, electronic apparatus, storage medium, and computer program | |
CN109165237B (zh) | 伴随对象确定方法、装置以及电子设备 | |
CN111522995B (zh) | 目标对象分析方法、装置及电子设备 | |
CN106780250B (zh) | 一种基于物联网技术的智慧社区安全事件处理方法及系统 | |
CN107665289B (zh) | 一种运营商数据的处理方法及系统 | |
CN111090777B (zh) | 一种视频数据的管理方法、管理设备及计算机存储介质 | |
CN111221991B (zh) | 人员身份属性的确定方法、装置和电子设备 | |
CN110969215A (zh) | 聚类处理方法和装置、存储介质及电子装置 | |
CN112597858A (zh) | 一种监控方法、装置及可读存储介质 | |
CN111767432B (zh) | 共现对象的查找方法和装置 | |
CN111291596A (zh) | 一种基于人脸识别的预警方法及装置 | |
CN111369792B (zh) | 一种交通事件的分析方法、装置及电子设备 | |
CN111367906A (zh) | 异常车辆识别方法、装置、设备及计算机可读存储介质 | |
CN112637548B (zh) | 一种基于摄像机的信息关联预警方法及装置 | |
CN113450236B (zh) | 基于时空数据的可疑人员识别方法、装置、系统和介质 | |
CN112052337A (zh) | 基于时空关联的目标关系探测方法、系统及存储介质 | |
CN111460246A (zh) | 基于数据挖掘和密度检测的实时活动异常人员发现方法 | |
KR101848367B1 (ko) | 모션벡터와 dct 계수를 이용한 메타데이터 기반 의심영상 구분식별 방식의 영상 관제 방법 | |
CN114726623B (zh) | 一种高级威胁攻击评估方法、装置、电子设备及存储介质 | |
CN114090909A (zh) | 一种图码联侦关联方法、装置、计算机设备及存储介质 | |
CN110309878B (zh) | 一种信息处理方法及装置、存储介质 | |
CN114495275A (zh) | 异常行为预警方法、装置及应用 | |
CN111222587A (zh) | 基于特征融合的失证人员危险驾驶行为预测方法及系统 | |
Ways et al. | Evaluating the effectiveness of CCTV in Baltimore, Maryland | |
CN112040411A (zh) | 一种数据分析方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |