CN111241305A - 数据处理方法和装置、电子设备及计算机可读存储介质 - Google Patents

数据处理方法和装置、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN111241305A
CN111241305A CN202010047889.4A CN202010047889A CN111241305A CN 111241305 A CN111241305 A CN 111241305A CN 202010047889 A CN202010047889 A CN 202010047889A CN 111241305 A CN111241305 A CN 111241305A
Authority
CN
China
Prior art keywords
data
target
suspect
space
public security
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010047889.4A
Other languages
English (en)
Inventor
高海龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhizhi Heshu Technology Co.,Ltd.
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN202010047889.4A priority Critical patent/CN111241305A/zh
Publication of CN111241305A publication Critical patent/CN111241305A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Educational Administration (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供的数据处理方法和装置、电子设备及计算机可读存储介质,涉及数据处理技术领域。在本申请实施例中,首先,获取与至少一个目标嫌疑人相关的泛感知数据。其次,对所述泛感知数据进行分析处理,得到各所述目标嫌疑人的档案数据,并根据各所述目标嫌疑人的档案数据构建公安知识图谱。然后,根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理。通过上述方法,可以提高数据处理的效率。

Description

数据处理方法和装置、电子设备及计算机可读存储介质
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种数据处理方法和装置、电子设备及计算机可读存储介质。
背景技术
公安领域汇聚大量内部、外部数据资源,很多显性的关系,可以通过数据治理的方式加以提取,但这类数据大多是静态数据,提取后很难保证其实时有效性。在海量数据背后还隐藏着更多动态的、没有明显特征的、具有很强隐匿特性的隐性关系,此类关系更能完整反映真实世界的客观存在,实战价值更高,对民警办案的帮助更直接,但获取难度大,需要借助更广泛有效的数据采集来源和更复杂的数据分析挖掘手段,才能被发现和利用。
但是,经发明人研究发现,在现有技术中,传统数据库预先定义了数据表模式,无法灵活改变实体和关系的属性,查询关系时需要大量连接操作,从而存在着数据处理的效率低的问题。
发明内容
有鉴于此,本申请的目的在于提供一种数据处理方法和装置、电子设备及计算机可读存储介质,以改善现有技术中存在的问题。
为实现上述目的,本申请实施例采用如下技术方案:
一种数据处理方法,包括:
获取与至少一个目标嫌疑人相关的泛感知数据;
对所述泛感知数据进行分析处理,得到各所述目标嫌疑人的档案数据,并根据各所述目标嫌疑人的档案数据构建公安知识图谱;
根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理。
在本申请实施例较佳的选择中,所述目标嫌疑人包括重点嫌疑人,所述根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理的步骤,包括:
根据所述公安知识图谱获取每个所述目标嫌疑人的人像轨迹和多维轨迹;
对每个所述目标嫌疑人的人像轨迹和多维轨迹进行结合得到该目标嫌疑人的时空轨迹,以对该目标嫌疑人进行定位。
在本申请实施例较佳的选择中,所述根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理的步骤,还包括:
根据所述公安知识图谱获取每个所述目标嫌疑人的关联人员;
通过所述关联人员的时空轨迹确定所述关联人员是否为所述目标嫌疑人的团伙成员,并在确定所述关联人员为所述目标嫌疑人的团伙成员时,根据所述关联人员的时空轨迹对所述关联人员进行定位。
在本申请实施例较佳的选择中,所述通过所述关联人员的时空轨迹确定所述关联人员是否为所述目标嫌疑人的团伙成员的步骤,包括:
判断所述关联人员的时空轨迹与所述目标嫌疑人的时空轨迹的重合度是否大于预设阈值;
若所述关联人员的时空轨迹与所述目标嫌疑人的时空轨迹的重合度大于所述预设阈值,则判定所述关联人员为所述重点嫌疑人的团伙成员;
若所述关联人员的时空轨迹与所述目标嫌疑人的时空轨迹的重合度不大于所述预设阈值,则判定所述关联人员不为所述重点嫌疑人的团伙成员。
在本申请实施例较佳的选择中,所述目标嫌疑人包括非重点嫌疑人,所述根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理的步骤,包括:
根据所述公安知识图谱获取每个所述目标嫌疑人的时空轨迹;
通过预设的人脸识别模型判断每个所述目标嫌疑人的时空轨迹是否异常;
若所述目标嫌疑人的时空轨迹异常,则根据所述目标嫌疑人的时空轨迹对所述目标嫌疑人进行定位。
在本申请实施例较佳的选择中,所述根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理的步骤,还包括:
根据所述公安知识图谱获取所述目标嫌疑人的关联人员,并通过预设的人脸识别模型判断所述关联人员的时空轨迹是否异常;
若所述关联人员的时空轨迹异常,则根据所述关联人员的时空轨迹对所述关联人员进行定位。
在本申请实施例较佳的选择中,所述泛感知数据包括视频数据,所述对所述泛感知数据进行分析处理的步骤,包括:
对所述视频数据进行结构化处理。
本申请实施例还提供了一种数据处理装置,包括:
数据获取模块,用于获取与至少一个目标嫌疑人相关的泛感知数据;
数据处理模块,用于对所述泛感知数据进行分析处理,得到各所述目标嫌疑人的档案数据,并根据各所述目标嫌疑人的档案数据构建公安知识图谱;
案件处理模块,用于根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理。
本申请实施例还提供了一种电子设备,包括存储器和处理器,所述处理器用于执行所述存储器中存储的可执行的计算机程序,以实现上述的数据处理方法。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被执行时实现上述数据处理方法的步骤。
本申请实施例提供的数据处理方法和装置、电子设备及计算机可读存储介质,通过对与目标嫌疑人相关的泛感知数据进行分析处理以构建公安知识图谱,并根据公安知识图谱对目标嫌疑人对应的案件进行处理,从而改善了现有技术中传统数据库预先定义了数据表模式,无法灵活改变实体和关系的属性,查询关系时需要大量连接操作,所导致的数据处理的效率低的问题。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的电子设备的结构框图。
图2为本申请实施例提供的数据处理方法的流程示意图。
图3为本申请实施例提供的数据处理方法的另一流程示意图。
图4为本申请实施例提供的数据处理装置的结构框图。
图标:10-电子设备;12-存储器;14-处理器;100-数据处理装置;110-数据获取模块;120-数据处理模块;130-案件处理模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
如图1所示,本申请实施例提供了一种电子设备10。其中,所述电子设备10可以包括存储器12、处理器14和数据处理装置100。
详细地,所述存储器12和处理器14之间直接或间接地电性连接,以实现数据的传输或交互。例如,相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述数据处理装置100包括至少一个可以软件或固件(firmware)的形式存储于所述存储器12中的软件功能模块。所述处理器14用于执行所述存储器12中存储的可执行的计算机程序,例如,所述数据处理装置100所包括的软件功能模块及计算机程序等,以实现数据处理方法。
其中,所述存储器12可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
所述处理器14可能是一种集成电路芯片,具有信号的处理能力。上述的处理器14可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)、片上系统(System on Chip,SoC)等。
可以理解,图1所示的结构仅为示意,所述电子设备10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
结合图2,本申请实施例还提供一种可应用于上述电子设备10的数据处理方法。其中,所述数据处理方法有关的流程所定义的方法步骤可以由所述电子设备10实现,下面将对图2所示的具体流程进行详细阐述。
步骤S110,获取与至少一个目标嫌疑人相关的泛感知数据。
在本申请实施例中,所述泛感知数据可以有多种获取方式,例如,可以通过用户输入的数据得到。
步骤S120,对所述泛感知数据进行分析处理,得到各所述目标嫌疑人的档案数据,并根据各所述目标嫌疑人的档案数据构建公安知识图谱。
在本申请实施例中,通过步骤S110获取所述泛感知数据后,可以对所述泛感知数据进行分析处理,得到各所述目标嫌疑人的档案数据,并根据各所述目标嫌疑人的档案数据构建公安知识图谱。
步骤S130,根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理。
在本申请实施例中,通过步骤S120得到所述公安知识图谱之后,可以根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理。
通过以上方法,通过对与目标嫌疑人相关的泛感知数据进行分析处理以构建公安知识图谱,并根据公安知识图谱对目标嫌疑人对应的案件进行处理,从而改善了现有技术中传统数据库预先定义了数据表模式,无法灵活改变实体和关系的属性,查询关系时需要大量连接操作,所导致的数据处理的效率低的问题。
在现有技术中构建公安图谱,主要是利用汽车、旅店、网吧、案件、卡口、WIFI、电子围栏、核查核录等多类轨迹数据,实现对各类轨迹信息进行数据分析挖掘,从而建立人与人、人与车、车与车的隐性关系。这类数据一定程度上反映了物理世界的真实关系存在,但是往往这部分数据都是历史数据,构建的公安图谱关系网不够鲜活。
传统解决方案,通过知识图谱获取隐性关系获取难度比较大。传统数据库预先定义了数据表模式,无法灵活改变实体和关系的属性。查询关系时需要大量连接(join)操作,在数据量很大时,效率很低,甚至无法返回结果。例如查询重点人的关系网络:需要在不同的实体表(人、车、户籍、案件等表)间进行大量的连接操作,从而存在以下问题:
1)这些数据的场景只覆盖了社会活动中的一小部分;
2)这些数据有时不够鲜活;
3)挖掘出的关系占真实世界客观存在关系总量比例不高;
4)犯罪嫌疑人的反侦察意识提升,刻意规避这些场景的关系。
5)由于各种历史原因,这些系统中的数据通常存在数据质量差、数据标准不统一、元数据描述缺乏、数据字典不全、数据一致性不完备等问题。
本申请实施例可以通过泛感知公安知识图谱的建设可对接各类感知数据,公安知识图谱数据库基于对公安数据的理解和治理经验,全网多维度理解数据,高度抽象数据在各种业务场景下的本质意义和业务内涵。并且充分运用字段关联、多ID融合、多类型数据打通,真正实现一个入口,一个出口的目标,通过公安知识图谱数据库可以跨系统的感知同一ID的多维属性。并且基于数据的融合,利用业务规则和模型,将数据提炼成为包含推理能力的多维档案和人员画像,从根本上帮助民警沉淀业务知识、快速形成业务理解,升华对于数据的认知,使得每一位民警都能像肌肉记忆一样的具有研判思维。
首先是视频、感知设备数据采集,这方面现在做的非常好也是我们构建泛感知知识图谱的基础。其次是全域数据汇聚,目前各级公安大数据部门已经在科信部门、网安部门以及各个专业警种整合数据了,接下来就是如何将感知数据,特别是结构化之后的高质量数据融合打通的问题。有了第二步基础,就是在汇聚的海量数据上构建知识,基于数据形成知识,基于知识构建数据,这其中考虑到数据的不同类型、不同业务目标,综合运用数据语义分析、数据时序分析、数据关联分析、数据挖掘算法等,进行综合的数据知识抽取和构建。还要考虑知识的存储和高性能计算、检索查询的问题。最后,就是在这些基础之上的应用,检索、分析、推理、研判等业务。
对于步骤S110,需要说明的是,进行数据接入以获取与至少一个目标嫌疑人相关的泛感知数据。在接入社区知识图谱构建所需要的各类数据资源时,平台提供了多种数据接入手段,可支持不同类型(结构化、半结构化、文本等)数据、不同种类(结构化数据库表、格式化数据文件等)数据源、不同形态(实时流、批量等)数据的灵活接入。
可选地,所述泛感知数据的具体内容不受限制,可以根据实际应用需求进行设置。例如,可以包括,但不限于视频结构化数据、人脸数据、手机WIFI围栏、手机IMSI、门禁数据、卡口数据、传感器数据等数据。
对于步骤S120,需要说明的是,在数据接入之后,可以进行数据处理。面向社区大数据的具体数据资源(如结构化数据记录、半结构化网页文本、非结构化视频语义等),提出标准化、规范化的处理流程,满足数据提取、清洗、关联、标识等数据处理环节的使用需求。
可选地,所述对所述泛感知数据进行分析处理的具体方式不受限制,可以根据根据所述泛感知数据包括的具体数据的类型进行具体设置。例如,在所述泛感知数据包括视频数据时,步骤S120可以包括以下子步骤:
对所述视频数据进行结构化处理。
进一步地,可以将各所述泛感知数据进行ID融合与关联。
详细地,可以实现身份证号、车牌号、手机设备(MAC、IMEI)、手机号码(IMSI)、护照号、Face ID、虚拟账号(银行账号、微信、QQ等)等多类实体间的关联计算,将多个不同的实体ID关联到具体的人员上,并给出关联指数和关联关系的展示。通过合理确定人脸、WIFI、电子围栏等前端感知设备的位置,配置恰当的技术参数,获取出入人员的手机MAC地址和IMIS等电子身份信息,并与出入信息进行大数据分析比对,将虚拟的电子设备信息与现实的人员身份信息相关联,实现电子身份信息的落地。利用一人一档案技术形成的线下人员档案,在实名档案基础上实现身份证号、人脸、车牌号、手机MAC、手机IMSI/IMEI、虚拟账号等关联,统一到具体的人员上,形成超级档案,并给出关联指数和关联关系的展示。
具体地,前端视频摄像机对人脸进行采集、视频结构化后,人脸识别算法对图片中的人脸提取特征,与底库的人脸特征进行比对,比对成功后可以对人像库中有同身份证号的聚合为一个档案,以身份ID为单位,后台以任务形式聚合。但是,若没有人像库中身份比对成功,则说明是没有身份证ID的情况,此类每张人像单独成为一个档案,从此形成未知的档案形成路人库档案。此时我们利用时空大数据模型算法,通过合理确定人脸、WIFI、电子围栏等前端感知设备的位置,配置恰当的技术参数,获取出入人员的手机MAC地址和IMIS等电子身份信息,并与出入信息进行大数据分析比对,将虚拟的电子设备信息与现实的人员身份信息相关联,实现电子身份信息的落地,反哺到人脸身份的落地,实现对未知人员的身份核实,从而可以落地到人像库中,后续可以对未知人员的档案进行实时归档。
在本申请实施例中,ID融合能解决如下问题:
(1)将关联关系动态化;
其中,任何一种ID的关联关系都不是一成不变的,根据实际的业务数据将关联关系动态地展现出来。
(2)融合结果可解释可溯源;
从关联指数和关联关系两个角度解释了融合结果的可信程度。每个融合出来的ID都能追溯到源头数据,方便用户决策。
隐形关系的挖掘和构建是公安知识图谱里面比较核心的一个功能,它其实是把数据里面隐藏的关系提炼出来,具有比较高的应用价值。例如两个人之间既不是家人,也不是亲属,也不是同事,很多时候这两个人之间找不到关联。我们通过事件、通过轨迹数据,把它的关系找到,有实战价值。原本没有关联的两个人,我们建立起关联,不一定这两个人是有很强的关联,但是两个人之间有过联系的。接下来做关联分析、做团伙挖掘、有一些特定的模型,通过这种隐性关系把他们的关系通路打通,如果关系链路中间出现中断的话,两个人就无法建立关联。
因此,利用视频算法可以基本准确的给出某人(带身份信息的人员或经过人脸特征聚类的人员档案ID)在某个时间某个地点(摄像机)出现过。利用这样的轨迹数据,我们就可以挖掘寻找人与人、多个人之间的同行关系,基本规则为:时间相差N分钟(参数设定)超过N次(参数设定)以上的若干人在同一个地点(摄像机点位)出现,建立人与人的同出现关系。概括一下就是基于视频算法的轨迹数据,结合规则或者机器学习模型,提炼出人与人、车与车之间的隐性关系,客户可以通过平台直接查询相关实体之间的关系。
可选地,数据的更新频率不受限制,可以根据实际应用需求进行设置。例如,在一种可以替代的示例中,业务数据可以按天/周/月更新,感知数据可以7x24全天候更新。
与此同时结构化数据抽取模块能够大规模自动化的采集、清洗、归类、关联所有数据,形成统一数据视图给后续系统服务。“关联”是核心的定义,在进行大数据挖掘之前,往往需要把关系型数据的Schema关联起来。我们把泛感知数据与业务数据经过数据治理后形成标准数据后,以人为核心进行ID融合关联。
其中,我们的方案是完全基于Spark/Hadoop平台构建,扩展性非常好。同时基于机器学习的数据转换能够将大量从事数据治理工作的人力解放,投入到真正的业务实现工作中去。
也就是说,视频网和公安信息网的内容融合趋势愈发强烈,构建全域感知图谱的时机日益成熟,因此基于泛感知数据以及视频数据不断构建和拓展多维感知网,在此基础上,对身份证号、手机MAC、IMEI、IMSI、车牌号、虚拟账号等各类ID进行融合和关联计算,构建以感知视频为手段,以公安内网业务数据为基础,实现公安泛感知知识图谱的构建,同时基于时空计算引擎构建多维轨迹技战法、模型分析应用。
此次泛感知公安知识图谱的建设,借助视频结构化技术、人脸识别、车辆识别、大数据碰撞等技术,将高度整合车辆系统、人脸系统、结构化系统等业务,打破平台信息孤岛,实现全方位获取、全网络汇聚、全维度整合的海量数据资源融合体系。通过智能应用服务,打破部门警种壁垒、汇聚有全国性共享需求的公安内部数据、其他部门数据、社会行业数据、互联网数据和物联网数据等等,从而促成公安内部数据资源池的汇聚。
对于知识图谱,需要说明的是,随着互联网的发展,网络数据内容呈现爆炸式增长的态势。由于互联网内容的大规模、异质多元、组织结构松散的特点,给人们有效获取信息和知识提出了挑战。知识图谱(Knowledge Graph)以其强大的语义处理能力和开放组织能力,为互联网时代的知识化组织和智能应用奠定了基础。知识图谱的初衷是为了提高搜索引擎的能力,改善用户的搜索质量以及搜索体验。随着人工智能的技术发展和应用,知识图谱作为关键技术之一,已被广泛应用于智能搜索、智能问答、个性化推荐、内容分发等领域。
本质上,知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成,现在的知识图谱已被用来泛指各种大规模的知识库。
其中,实体指的是具有可区别性且独立存在的某种事物。如某一个人、某一个城市、某一种植物等、某一种商品等等,世界万物有具体事物组成,此指实体。实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。语义类(概念)为具有同种特性的实体构成的集合,如书籍、电脑等。概念主要指集合、类别、对象类型、事物的种类,例如人物、地理等。内容通常作为实体和语义类的名字、描述、解释等,可以由文本、图像、音视频等来表达。属性(值)指的是从一个实体指向它的属性值,不同的属性类型对应于不同类型属性的边,属性值主要指对象指定属性的值。关系指的是形式化为一个函数,它把kk个点映射到一个布尔值。在知识图谱上,关系则是一个把kk个图节点(实体、语义类、属性值)映射到布尔值的函数。
基于上述定义,三元组是知识图谱的一种通用表示方式,即知识库中的实体集合,共包含|E|种不同实体;知识库中的关系集合,共包含|R|种不同关系。三元组的基本形式主要包括(实体-关系-实体)和(实体-属性-属性值)等。每个实体(概念的外延)可用一个全局唯一确定的ID来标识,每个属性-属性值对(attribute-value pair,AVP)可用来刻画实体的内在特性,而关系可用来连接两个实体,刻画它们之间的关联。
因此,对于解决数据关联性问题,建设行业知识图谱成为了公安大数据应用的主流方向。知识图谱是解决数据梳理和组织成知识库的技术,是一种应用语义理解技术实现更高质量、可计算、计算机可理解的大数据结构,用于提高对数据、信息、情报的搜索查询能力。知识图谱与大数据分析和视频结构化分析同属于软件应用类服务,但存在着明显区别,视频结构化分析是通过计算机视觉技术,将非结构化的视频数据进行处理,变为机器可识别的数据集,是知识图谱上游的数据来源之一,可以说,视频结构化分析实现的是人眼及人右脑视觉区域所解决的部分问题,而知识图谱更像是人的左脑,通过对右脑存储信息的分析进行知识构建和调用;大数据分析实现的是数据结构化及关联,知识图谱是在大数据分析的基础上,通过语义理解将“点线面”的数据关联与事物现实中非简单指向性的复杂关系相联结,而形成的实用型认知应用。
对于步骤S120,需要说明的是,所述目标嫌疑人的具体类型不受限制,可以根据实际应用需求进行设置。
例如,在一种可以替代的示例中,所述目标嫌疑人可以包括重点嫌疑人。结合图3,在所述目标嫌疑人包括重点嫌疑人时,步骤S130可以包括步骤S131和步骤S132。
步骤S131,根据所述公安知识图谱获取每个所述目标嫌疑人的人像轨迹和多维轨迹。
步骤S132,对每个所述目标嫌疑人的人像轨迹和多维轨迹进行结合得到该目标嫌疑人的时空轨迹,以对该目标嫌疑人进行定位。
详细地,在已知重点人的人像并且在重点人布控库中时,可以通过动态人脸抓拍机或者视频流摄像机对人员可疑度的分析判定,及时预警,通过人脸识别系统抓拍到重点人员,与人像库比中发现其身份信息。并且,可以通过ID融合技术找到重点人员手机信息等关联信息,人像轨迹与多维轨迹相结合,通过时空轨迹还原其轨迹信息。
进一步地,在所述重点嫌疑人存在对应的关联人员时,步骤S130还可以包括以下子步骤:
根据所述公安知识图谱获取每个所述目标嫌疑人的关联人员;
通过所述关联人员的时空轨迹确定所述关联人员是否为所述目标嫌疑人的团伙成员,并在确定所述关联人员为所述目标嫌疑人的团伙成员时,根据所述关联人员的时空轨迹对所述关联人员进行定位。
其中,所述通过所述关联人员的时空轨迹确定所述关联人员是否为所述目标嫌疑人的团伙成员的具体方式不受限制,可以根据实际应用需求进行设置。
例如,在一种可以替代的示例中,所述通过所述关联人员的时空轨迹确定所述关联人员是否为所述目标嫌疑人的团伙成员的步骤,可以包括以下子步骤:
首先,判断所述关联人员的时空轨迹与所述目标嫌疑人的时空轨迹的重合度是否大于预设阈值。其次,若所述关联人员的时空轨迹与所述目标嫌疑人的时空轨迹的重合度大于所述预设阈值,则判定所述关联人员为所述重点嫌疑人的团伙成员。然后,若所述关联人员的时空轨迹与所述目标嫌疑人的时空轨迹的重合度不大于所述预设阈值,则判定所述关联人员不为所述重点嫌疑人的团伙成员。
详细地,可以通过知识图谱找到三度内关系人,发现与其显性、隐形关系,通过其关系网找到与其相关的重点人员,发现其团伙。通过知识图谱关系挖掘,找到与重点人有关联的人员后,可以通过时空大数据分析关联人员的轨迹,研判是否是团伙作案,提前踩点等。通过知识图谱团伙关系,集合视频人脸轨迹拟合分析,判断团伙活跃度、聚集度、危险度。
需要说明的是,一度人脉指的是双方直接是好友。二度人脉指的是双方有一个以上共同的好友,这时朋友网可以计算出你们有几个共同的好友并且呈现数字给你,你们的关系是:你-朋友-陌生人。三度人脉指的是你朋友的朋友的朋友就是这个陌生人,你们的关系是:你-朋友-朋友-陌生人。
进一步地,在所述目标嫌疑人为非重点嫌疑人时,步骤S130可以包括以下子步骤:
首先,根据所述公安知识图谱获取每个所述目标嫌疑人的时空轨迹。其次,通过预设的人脸识别模型判断每个所述目标嫌疑人的时空轨迹是否异常。然后,若所述目标嫌疑人的时空轨迹异常,则根据所述目标嫌疑人的时空轨迹对所述目标嫌疑人进行定位。
详细地,在抓拍到的人员非重点嫌疑人时,可以根据模型发现行为轨迹异常,判断是可疑对象,但与人像库没有比对出相关信息,可以通过人脸识别模型算法,发现所述非重点嫌疑人有行为轨迹异常。
进一步地,在所述非重点嫌疑人存在对应的关联人员时,步骤S130还可以包括以下子步骤:
首先,根据所述公安知识图谱获取所述目标嫌疑人的关联人员,并通过预设的人脸识别模型判断所述关联人员的时空轨迹是否异常。其次,若所述关联人员的时空轨迹异常,则根据所述关联人员的时空轨迹对所述关联人员进行定位。
详细地,可以通过时空大数据计算引擎,关联所述非重点嫌疑人的人脸与手机ID,ID融合后发现其手机号码找到人员信息,反补到人像系统。通过人像系统找到所述非重点嫌疑人对应的同行人员,根据关联关系算法,找到其关联人员。并且,可以通过知识图谱发现可疑人员与同行人员都有过上访记录,通过图找到与他们有关联的隐形上访人员,把相关人员进行时空轨迹数据还原,发现团伙活动区域,进行比对碰撞,发现其落脚点等相关信息。
也就是说,通过构建海量数据智能挖掘引擎,帮助警务大脑实现在海量数据上的规律及特征挖掘,获取隐藏在大数据下的知识,通过提供一体化、并行化的高效数据挖掘工具和模型应用平台,集成大量的经典及历史算法,管理模型类知识的全生命周期,并将知识进行积累、连接形成智慧感知能力。感知预警能力建设的主要工作是通过机器学习进行建模挖掘,采用人机结合的半监督学习方式,充分挖掘蕴含在大数据中的案、事、人、时空等特征,并基于实战业务进行模型构建,突破现有的条件碰撞预警功能的局限性,实现场景化的综合预警能力。相关应用包括基于知识图谱挖掘模型的相关高危人员挖掘、团伙挖掘及犯罪行为预测(侵财、盗抢骗等)、隐形重点人(涉恐隐性重点人、拐卖妇女儿童隐性重点人、涉毒隐性重点人等)挖掘等应用功能。
例如,在民警接到报案称孩子走失后,可以在视频系统检索孩子图像,发现最后出现的可疑地点、人及驾驶的车辆。首先,可以通过检索车辆,发现登记车辆与现场车辆不符,判断为套牌车,至此,车辆线索中断。其次,对图片中的女子进行静态库撞库,因为图片女子戴帽子,面部有些遮挡,系统推出2个相似女子。然后,对两个女子进行知识图谱分析,高相似度的嫌疑人A没有发现可疑。最后,对第二个女子进行知识图谱分析,发现在该人两度关系人内,存在前科人员(重点人),并且还有一人与该女子及前科人员近期关系密切,且该人在案发位置附近有通话行为。通过知识图谱数据库获得嫌疑人的手机、车辆信息,发现车辆与现场车辆一致,于是对该嫌疑人和对应的前科人员实施布控,三天内嫌疑人落网。
因此,结合大数据处理技术既可实现海量时空感知数据的汇聚接入,也可实现基于ID融合的多维布控、智能预警、时空碰撞、轨迹研判、深度挖掘、全息档案等业务功能,实现自定义研判建模、可视化热点展示、多级联动协同作战等功能,为寻找案件规律、实现案件串并提供支撑。整合视频结构化系统、人脸识别系统、车辆识别系统等业务,可以做到重点区域、重点目标、重点事件实时管控、生成轨迹、及时预警等功能,助力在防控工作过程中及时掌握目标人物、目标车辆的活动轨迹。
结合图4,本发明实施例还提供了一种数据处理装置100,可以应用于上述的电子设备10。其中,该数据处理装置100可以包括数据获取模块110、数据处理模块120和案件处理模块130。
所述数据获取模块110,用于获取与至少一个目标嫌疑人相关的泛感知数据。在本实施例中,所述数据获取模块110可以用于执行图2所示的步骤S110,关于所述数据获取模块110的相关内容可以参照前文对步骤S110的具体描述。
所述数据处理模块120,用于对所述泛感知数据进行分析处理,得到各所述目标嫌疑人的档案数据,并根据各所述目标嫌疑人的档案数据构建公安知识图谱。在本实施例中,所述数据处理模块120可以用于执行图2所示的步骤S120,关于所述数据处理模块120的相关内容可以参照前文对步骤S120的具体描述。
所述案件处理模块130,用于根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理。在本实施例中,所述案件处理模块130可以用于执行图2所示的步骤S130,关于所述案件处理模块130的相关内容可以参照前文对步骤S130的具体描述。
在本申请实施例中,对应于上述的数据处理方法,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,该计算机程序运行时执行上述数据处理方法的各个步骤。
其中,前述计算机程序运行时执行的各步骤,在此不再一一赘述,可参考前文对所述数据处理方法的解释说明。
综上所述,本申请实施例提供的数据处理方法和装置、电子设备及计算机可读存储介质,通过对与目标嫌疑人相关的泛感知数据进行分析处理以构建公安知识图谱,并根据公安知识图谱对目标嫌疑人对应的案件进行处理,从而改善了现有技术中传统数据库预先定义了数据表模式,无法灵活改变实体和关系的属性,查询关系时需要大量连接操作,所导致的数据处理的效率低的问题。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获取与至少一个目标嫌疑人相关的泛感知数据;
对所述泛感知数据进行分析处理,得到各所述目标嫌疑人的档案数据,并根据各所述目标嫌疑人的档案数据构建公安知识图谱;
根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理。
2.如权利要求1所述的数据处理方法,其特征在于,所述目标嫌疑人包括重点嫌疑人,所述根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理的步骤,包括:
根据所述公安知识图谱获取每个所述目标嫌疑人的人像轨迹和多维轨迹;
对每个所述目标嫌疑人的人像轨迹和多维轨迹进行结合得到该目标嫌疑人的时空轨迹,以对该目标嫌疑人进行定位。
3.如权利要求2所述的数据处理方法,其特征在于,所述根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理的步骤,还包括:
根据所述公安知识图谱获取每个所述目标嫌疑人的关联人员;
通过所述关联人员的时空轨迹确定所述关联人员是否为所述目标嫌疑人的团伙成员,并在确定所述关联人员为所述目标嫌疑人的团伙成员时,根据所述关联人员的时空轨迹对所述关联人员进行定位。
4.如权利要求3所述的数据处理方法,其特征在于,所述通过所述关联人员的时空轨迹确定所述关联人员是否为所述目标嫌疑人的团伙成员的步骤,包括:
判断所述关联人员的时空轨迹与所述目标嫌疑人的时空轨迹的重合度是否大于预设阈值;
若所述关联人员的时空轨迹与所述目标嫌疑人的时空轨迹的重合度大于所述预设阈值,则判定所述关联人员为所述重点嫌疑人的团伙成员;
若所述关联人员的时空轨迹与所述目标嫌疑人的时空轨迹的重合度不大于所述预设阈值,则判定所述关联人员不为所述重点嫌疑人的团伙成员。
5.如权利要求1所述的数据处理方法,其特征在于,所述目标嫌疑人包括非重点嫌疑人,所述根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理的步骤,包括:
根据所述公安知识图谱获取每个所述目标嫌疑人的时空轨迹;
通过预设的人脸识别模型判断每个所述目标嫌疑人的时空轨迹是否异常;
若所述目标嫌疑人的时空轨迹异常,则根据所述目标嫌疑人的时空轨迹对所述目标嫌疑人进行定位。
6.如权利要求5所述的数据处理方法,其特征在于,所述根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理的步骤,还包括:
根据所述公安知识图谱获取所述目标嫌疑人的关联人员,并通过预设的人脸识别模型判断所述关联人员的时空轨迹是否异常;
若所述关联人员的时空轨迹异常,则根据所述关联人员的时空轨迹对所述关联人员进行定位。
7.如权利要求1所述的数据处理方法,其特征在于,所述泛感知数据包括视频数据,所述对所述泛感知数据进行分析处理的步骤,包括:
对所述视频数据进行结构化处理。
8.一种数据处理装置,其特征在于,包括:
数据获取模块,用于获取与至少一个目标嫌疑人相关的泛感知数据;
数据处理模块,用于对所述泛感知数据进行分析处理,得到各所述目标嫌疑人的档案数据,并根据各所述目标嫌疑人的档案数据构建公安知识图谱;
案件处理模块,用于根据所述公安知识图谱对各所述目标嫌疑人对应的案件进行处理。
9.一种电子设备,其特征在于,包括存储器和处理器,所述处理器用于执行所述存储器中存储的可执行的计算机程序,以实现权利要求1-7任意一项所述的数据处理方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,该程序被执行时实现权利要求1-7任意一项所述数据处理方法的步骤。
CN202010047889.4A 2020-01-16 2020-01-16 数据处理方法和装置、电子设备及计算机可读存储介质 Pending CN111241305A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010047889.4A CN111241305A (zh) 2020-01-16 2020-01-16 数据处理方法和装置、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010047889.4A CN111241305A (zh) 2020-01-16 2020-01-16 数据处理方法和装置、电子设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111241305A true CN111241305A (zh) 2020-06-05

Family

ID=70864114

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010047889.4A Pending CN111241305A (zh) 2020-01-16 2020-01-16 数据处理方法和装置、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111241305A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111666426A (zh) * 2020-06-10 2020-09-15 北京海致星图科技有限公司 一种知识图谱多场景图谱数据获取方法、系统及设备
CN111881301A (zh) * 2020-07-15 2020-11-03 北京百度网讯科技有限公司 一种数据处理方法、装置、电子设备和存储介质
CN112215441A (zh) * 2020-11-17 2021-01-12 北京明略软件系统有限公司 预测模型训练方法及系统
CN112231488A (zh) * 2020-09-22 2021-01-15 京东城市(北京)数字科技有限公司 数据处理的方法、装置、设备及计算机可读存储介质
CN112256667A (zh) * 2020-09-16 2021-01-22 珠海市新德汇信息技术有限公司 多生物特征归一方法
CN112269819A (zh) * 2020-10-12 2021-01-26 苏州市公安局 大数据分析方法、装置及电子设备
CN112612908A (zh) * 2021-01-05 2021-04-06 上海云扣科技发展有限公司 自然资源知识图谱构建方法、装置、服务器及可读存储器
CN113254659A (zh) * 2021-02-04 2021-08-13 天津德尔塔科技有限公司 一种基于知识图谱技术的档案研判方法及系统
CN114491078A (zh) * 2022-02-16 2022-05-13 松立控股集团股份有限公司 基于知识图谱的社区项目人员落脚点和同行人员分析方法
CN115345390A (zh) * 2022-10-19 2022-11-15 武汉大数据产业发展有限公司 一种行为轨迹预测方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180082183A1 (en) * 2011-02-22 2018-03-22 Thomson Reuters Global Resources Machine learning-based relationship association and related discovery and search engines
CN109191281A (zh) * 2018-08-21 2019-01-11 重庆富民银行股份有限公司 一种基于知识图谱的团体欺诈识别系统
CN109344260A (zh) * 2018-08-28 2019-02-15 北京明略软件系统有限公司 一种基于时空轨迹的隐性关系挖掘方法、系统和终端
CN110175217A (zh) * 2019-05-16 2019-08-27 武汉数矿科技股份有限公司 一种用于确定嫌疑人的感知数据分析方法和装置
CN110209835A (zh) * 2019-05-09 2019-09-06 四川九洲电器集团有限责任公司 一种异常检测方法及装置、计算机存储介质及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180082183A1 (en) * 2011-02-22 2018-03-22 Thomson Reuters Global Resources Machine learning-based relationship association and related discovery and search engines
CN109191281A (zh) * 2018-08-21 2019-01-11 重庆富民银行股份有限公司 一种基于知识图谱的团体欺诈识别系统
CN109344260A (zh) * 2018-08-28 2019-02-15 北京明略软件系统有限公司 一种基于时空轨迹的隐性关系挖掘方法、系统和终端
CN110209835A (zh) * 2019-05-09 2019-09-06 四川九洲电器集团有限责任公司 一种异常检测方法及装置、计算机存储介质及电子设备
CN110175217A (zh) * 2019-05-16 2019-08-27 武汉数矿科技股份有限公司 一种用于确定嫌疑人的感知数据分析方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
孙利宇 等: "公安知识图谱助力智慧警务落地", 《数字通信世界》 *
武鸿浩: "公安领域中知识图谱的构建与应用研究", 《网络安全技术与应用》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111666426A (zh) * 2020-06-10 2020-09-15 北京海致星图科技有限公司 一种知识图谱多场景图谱数据获取方法、系统及设备
CN111881301A (zh) * 2020-07-15 2020-11-03 北京百度网讯科技有限公司 一种数据处理方法、装置、电子设备和存储介质
CN111881301B (zh) * 2020-07-15 2024-06-04 北京百度网讯科技有限公司 一种数据处理方法、装置、电子设备和存储介质
CN112256667B (zh) * 2020-09-16 2024-03-22 珠海市新德汇信息技术有限公司 多生物特征归一方法
CN112256667A (zh) * 2020-09-16 2021-01-22 珠海市新德汇信息技术有限公司 多生物特征归一方法
CN112231488A (zh) * 2020-09-22 2021-01-15 京东城市(北京)数字科技有限公司 数据处理的方法、装置、设备及计算机可读存储介质
CN112231488B (zh) * 2020-09-22 2024-06-21 京东城市(北京)数字科技有限公司 数据处理的方法、装置、设备及计算机可读存储介质
CN112269819A (zh) * 2020-10-12 2021-01-26 苏州市公安局 大数据分析方法、装置及电子设备
CN112215441A (zh) * 2020-11-17 2021-01-12 北京明略软件系统有限公司 预测模型训练方法及系统
CN112612908A (zh) * 2021-01-05 2021-04-06 上海云扣科技发展有限公司 自然资源知识图谱构建方法、装置、服务器及可读存储器
CN113254659A (zh) * 2021-02-04 2021-08-13 天津德尔塔科技有限公司 一种基于知识图谱技术的档案研判方法及系统
CN114491078B (zh) * 2022-02-16 2022-08-02 松立控股集团股份有限公司 基于知识图谱的社区项目人员落脚点和同行人员分析方法
CN114491078A (zh) * 2022-02-16 2022-05-13 松立控股集团股份有限公司 基于知识图谱的社区项目人员落脚点和同行人员分析方法
CN115345390A (zh) * 2022-10-19 2022-11-15 武汉大数据产业发展有限公司 一种行为轨迹预测方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN111241305A (zh) 数据处理方法和装置、电子设备及计算机可读存储介质
CN110688495B (zh) 一种事件信息的知识图谱模型构建方法、装置、存储介质
Xu et al. Video structured description technology based intelligence analysis of surveillance videos for public security applications
US8041743B2 (en) Systems and methods for providing semantically enhanced identity management
US20220092881A1 (en) Method and apparatus for behavior analysis, electronic apparatus, storage medium, and computer program
TWI743835B (zh) 一種資訊處理方法及裝置、儲存介質
TWI747341B (zh) 檔案應用方法及裝置、儲存媒體
CN111427968A (zh) 一种基于知识图谱的重点人员全息档案构建方法及装置
CN111291589A (zh) 信息的关联分析方法及装置、储存介质、电子装置
CN108269331A (zh) 一种智能视频大数据处理系统
CN111930868A (zh) 一种基于多维数据采集的大数据行为轨迹分析方法
Lwowski et al. Geospatial event detection by grouping emotion contagion in social media
CN110727805A (zh) 社区知识图谱构建方法及系统
CN111405249A (zh) 监控方法、装置及服务器和计算机可读存储介质
Rodrigues et al. Smaframework: Urban data integration framework for mobility analysis in smart cities
CN111861830B (zh) 一种情报云平台
Vu et al. Ask, don't search: A social help engine for online social network mobile users
Yousfi et al. Smart big data framework for insight discovery
CN115293477A (zh) 基于大数据的社会安全预警系统、方法、设备及存储介质
Bhuyan et al. Crime predictive model using big data analytics
CN112925899A (zh) 排序模型建立方法、案件线索推荐方法、装置及介质
CN111260526A (zh) 人物轨迹行为分析预估方法和装置
US20230306282A1 (en) Construction method of human-object-space interaction model based on knowledge graph
CN112306985A (zh) 一种数字视网膜多模态特征联合精准检索方法
CN111797175A (zh) 数据存储方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210916

Address after: 100000 room 650, 6th floor, building 11, Huashan Garden Cultural Media Industrial Park, 1376 folk culture street, Gaobeidian village, Gaobeidian Township, Chaoyang District, Beijing

Applicant after: Beijing Zhizhi Heshu Technology Co.,Ltd.

Address before: No.310, building 4, courtyard 8, Dongbei Wangxi Road, Haidian District, Beijing

Applicant before: MININGLAMP SOFTWARE SYSTEMS Co.,Ltd.

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200605