CN113919544B - 犯罪预警方法、装置、计算机设备及存储介质 - Google Patents

犯罪预警方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN113919544B
CN113919544B CN202111003285.0A CN202111003285A CN113919544B CN 113919544 B CN113919544 B CN 113919544B CN 202111003285 A CN202111003285 A CN 202111003285A CN 113919544 B CN113919544 B CN 113919544B
Authority
CN
China
Prior art keywords
data
crime
modal
deep learning
learning network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111003285.0A
Other languages
English (en)
Other versions
CN113919544A (zh
Inventor
丁伟杰
沈旭晨
周建达
陈丰
张静
王勋
郑滋椀
刘伟棠
操涛涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Police College
Original Assignee
Zhejiang Police College
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Police College filed Critical Zhejiang Police College
Priority to CN202111003285.0A priority Critical patent/CN113919544B/zh
Publication of CN113919544A publication Critical patent/CN113919544A/zh
Application granted granted Critical
Publication of CN113919544B publication Critical patent/CN113919544B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Computer Security & Cryptography (AREA)
  • Educational Administration (AREA)
  • Alarm Systems (AREA)

Abstract

本发明实施例公开了犯罪预警方法、装置、计算机设备及存储介质。所述方法包括:获取案件数据;将所述案件数据输入至多模态犯罪预警模型内进行犯罪识别,以得到识别结果;其中,所述多模态犯罪预警模型是通过对若干多源数据进行预处理和分组后形成的样本集训练多模态深度学习网络所得的。通过实施本发明实施例的方法可实现充分利用到多源异构数据的潜在信息主动挖掘有效特征,提高犯罪预警的准确率。

Description

犯罪预警方法、装置、计算机设备及存储介质
技术领域
本发明涉及犯罪预警技术领域,更具体地说是指犯罪预警方法、装置、计算机设备及存储介质。
背景技术
社会高速发展的同时,各类犯罪的表现形式也越发多样,如果能够对犯罪行为进行精确预警,就能提前做好防控措施。如何避免和预防犯罪行为的发生,是现阶段亟需解决的问题。犯罪预警是指使用特定的方法,从大量历史数据中挖掘犯罪规律,并且在犯罪行为发生之前进行提前警告的过程。
数据挖掘技术和人工智能相关算法能够从海量的数据中快速、高效的挖掘犯罪特征并预测未来的行为,公安行业是涉及国家和社会安全的关键领域,经过多年的信息化建设,公安机关已有效实现对“人、车、事、物”的全面实时感知和管控,积累了海量数据,如公安视频、指纹、DNA、GPS、车辆卡口、网吧记录、犯罪案事件等,其数据的整合和串联,蕴藏着巨大的公安情报价值。然而,这些高价值数据普遍呈现出多源异构的特点,多源主要指的是数据来源多样化,分散在各单位、各警种、各业务系统中,成为了一个个割裂、分散的“数据孤岛”。异构主要是指数据结构上的差异性,不同系统中的数据类型高度多样化,既包含结构化数据,也有大量文本、图片、视频等非结构化数据。
中国专利202010601748.2仅专注于视频流数据,对于历史犯罪数据中的多源数据并未得到很好的利用。此方案仅适用于较为简单的特定场景,对于业务较复杂,犯罪类别较多的场景,预警的准确性要求无法满足。中国专利201911045354.7仅限于训练多头神经网络模型。对于如何获取犯罪数据特征等关键步骤并未涉及。且该方法对于非结构化数据建模并未涉及,尚未充分利用公安警务多源数据信息,由此可见,传统多模态犯罪预警模型大部分都是依赖经验总结的逻辑特征和相互关联,再结合具体的数值特征建立传统的有监督分析模型,数据结构单一,获取信息有限,没有充分利用到多源异构数据的潜在信息主动挖掘有效特征,训练出来的模型在进行犯罪预警时准确率不高。
因此,有必要设计一种新的方法,实现充分利用到多源异构数据的潜在信息主动挖掘有效特征,提高犯罪预警的准确率。
发明内容
本发明的目的在于克服现有技术的缺陷,提供犯罪预警方法、装置、计算机设备及存储介质。
为实现上述目的,本发明采用以下技术方案犯罪预警方法,包括:
获取案件数据;
将所述案件数据输入至多模态犯罪预警模型内进行犯罪识别,以得到识别结果;
其中,所述多模态犯罪预警模型是通过对若干多源数据进行预处理和分组后形成的样本集训练多模态深度学习网络所得的。
其进一步技术方案为:所述将所述案件数据输入至多模态犯罪预警模型内进行犯罪识别,以得到识别结果,包括:
对所述案件数据进行预处理,以得到预处理结果;
将所述预处理结果输入至所述多模态犯罪预警模型内进行犯罪识别,以得到识别结果。
其进一步技术方案为:所述对所述案件数据进行预处理,以得到预处理结果,包括:
对所述案件数据进行质量探查,以得到探查结果,其中,所述探查结果包括数据量、空值率、重复率以及异常率;
对所述探查结果进行重复值处理、缺失值处理和异常值处理,以得到预处理结果。
其进一步技术方案为:所述多模态犯罪预警模型通过对若干多源数据进行预处理和分组后形成的样本集训练多模态深度学习网络所得的,包括:
对若干多源数据进行预处理,并对预处理后的数据进行分组,以得到样本集;
划分所述样本集,以得到训练集以及测试集;
构建所述多模态深度学习网络;
采用所述训练集训练所述多模态深度学习网络;
利用所述测试集对训练后的多模态深度学习网络进行测试,以调整多模态深度学习网络的参数,以得到所述多模态犯罪预警模型。
其进一步技术方案为:所述多模态深度学习网络包括第一模态深度学习网络、第二模态深度学习网络以及分类器;
所述采用所述训练集训练所述多模态深度学习网络,包括:
对所述训练集内的结构化数据输入至第一模态深度学习网络内进行特征向量的提取,以得到第一特征向量;
对所述训练集内的文本数据输入至第二模态深度学习网络内进行特征向量的提取,以得到第二特征向量;
融合所述第一特征向量以及第二特征向量,以得到目标融合结果;
采用分类器对目标融合结果进行犯罪类别的概率计算,以得到犯罪类别。
其进一步技术方案为:所述对所述训练集内的结构化数据输入至第一模态深度学习网络内进行特征向量的提取,以得到第一特征向量,包括:
对所述训练集内的结构化数据采用输入层构建训练数据集;
对训练数据集输入至隐藏层进行特征抽象,以得到抽象结果;
对抽象结果进行批量归一化、特征向量提取以及融合,以得到第一特征向量。
其进一步技术方案为:所述第二模态深度学习网络包括BERT模型。
本发明还提供了犯罪预警装置,包括:
数据获取单元,用于获取案件数据;
识别单元,用于将所述案件数据输入至多模态犯罪预警模型内进行犯罪识别,以得到识别结果;
还包括:
模型获取单元,用于通过对若干多源数据进行预处理和分组后形成的样本集训练多模态深度学习网络,以得到多模态犯罪预警模型。
本发明还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
本发明还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述的方法。
本发明与现有技术相比的有益效果是:本发明通过获取多源异构的案件数据,将案件数据输入至多模态犯罪预警模型内进行犯罪识别,其中,在识别时先进行数据的预处理后,采用深度学习网络构成的第一模态深度学习网络以及BERT模型构成的第二模态深度学习网络,分别进行特征提取再融合,采用分类器进行概率计算,确定犯罪类型,形成识别结果,实现充分利用到多源异构数据的潜在信息主动挖掘有效特征,提高犯罪预警的准确率。
下面结合附图和具体实施例对本发明作进一步描述。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的犯罪预警方法的应用场景示意图;
图2为本发明实施例提供的犯罪预警方法的流程示意图;
图3为本发明实施例提供的犯罪预警方法的子流程示意图;
图4为本发明实施例提供的犯罪预警方法的子流程示意图;
图5为本发明实施例提供的犯罪预警方法的子流程示意图;
图6为本发明实施例提供的犯罪预警方法的子流程示意图;
图7为本发明实施例提供的犯罪预警方法的子流程示意图;
图8为本发明实施例提供的犯罪预警装置的示意性框图;
图9为本发明实施例提供的犯罪预警装置的识别单元的示意性框图;
图10为本发明实施例提供的犯罪预警装置的预处理子单元的示意性框图;
图11为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的犯罪预警方法的应用场景示意图。图2为本发明实施例提供的犯罪预警方法的示意性流程图。该犯罪预警方法应用于服务器中。该服务器与终端进行数据交互,从终端获取到案件数据,对案件数据采用多模态犯罪预警模型进行犯罪识别,以反馈识别结果。
图2是本发明实施例提供的犯罪预警方法的流程示意图。如图2所示,该方法包括以下步骤S110至S120。
S110、获取案件数据。
在本实施例中,案件数据是指终端输入的案件的相关数据,包括监控数据、车辆及数据(含违章)、通联数据、出行数据、场所数据、常驻暂住人口数据、交通卡口数据等。
该案件数据是指多源异构数据,多源主要指数据来源多样化,异构主要指数据结构上的差异性,多源异构数据即数据来源广泛且数据格式不一的数据。
S120、将所述案件数据输入至多模态犯罪预警模型内进行犯罪识别,以得到识别结果。
在本实施例中,识别结果是指犯罪类别。
在一实施例中,请参阅图3,上述的步骤S120可包括步骤S121~S122。
S121、对所述案件数据进行预处理,以得到预处理结果。
在本实施例中,预处理结果是指对所述案件数据从数据量,空值率,重复率、各字段值的异常情况等方面进行探查分析,并进行重复值处理、缺失值处理和异常值处理。
在一实施例中,请参阅图4,上述的步骤S121可包括步骤S1211~S122。
S1211、对所述案件数据进行质量探查,以得到探查结果,其中,所述探查结果包括数据量、空值率、重复率以及异常率。
良好的数据质量是建模的基础,因此首先对案件数据进行数据质量探查,包括数据字段的数据量、空值率、重复率、异常率。对案件数据,以表为单位,从数据量,空值率,重复率、各字段值的异常情况等方面进行探查分析。
对案件数据分别统计每个数据源的数据量M,分别统计各案件数据源的每个字段的空值数量Ni,i为字段名称,每个字段的空值率为Pi=Ni/M,分别统计各数据源的每个字段的重复值数量Ni,i为字段名称,每个字段的空值率为Pi=Ni/M,分别统计各数据源的每个字段的重复值数量Ni,i为字段名称,每个字段的空值率为Pi=Ni/M。
S1212、对所述探查结果进行重复值处理、缺失值处理和异常值处理,以得到预处理结果。
重复值处理是指针对重复的每一行进行去重操作,删除多余的重复数据,只保留一行;缺失值处理是指针对数据中存在的缺失值,主要采用删除或填充的方式进行处理,其中,缺失值删除:当包含缺失值的属性中含有大量缺失值而仅仅包含极少量有效值时采用直接删除的方式处理。如某一行数据含有M个属性,其中N个属性缺失,当N/M>k时,直接删除此行数据,k为被允许的最大空值率;缺失值填充:当包含缺失值的属性中含有少量缺失值时采用填充的方式进行处理,即N/M<k,如常见处理方法为均值填充,即计算该属性所有数据的均值作为填充数据。
异常值处理:异常值是在数据探查分析中会经常遇到的一种特殊情况,所谓的异常值就是非正常数据。首先需要识别异常值,采用3σ原则识别异常值。σ是代表待识别维度所有数据的标准差,3σ即3倍标准差;经过上述方法识别出数据中存在的异常值,对于异常值处理方法与缺失值处理方法相同,其中,异常值删除:当包含异常值的属性中含有大量异常值而仅仅包含异常量有效值时采用直接删除的方式处理。如某一行数据含有M个属性,其中N个属性缺失,当N/M>k时,直接删除此行数据,k为被允许的最大空值率;异常值替换:当包含异常值的属性中含有少量异常值时采用填充的方式进行处理,即N/M<k。如常见处理方法为均值填充,即计算该属性所有数据的均值作为填充数据。
S122、将所述预处理结果输入至所述多模态犯罪预警模型内进行犯罪识别,以得到识别结果。
其中,所述多模态犯罪预警模型是通过对若干多源数据进行预处理和分组后形成的样本集训练多模态深度学习网络所得的。
在一实施例中,请参阅图5,上述的多模态犯罪预警模型是通过对若干多源数据进行预处理和分组后形成的样本集训练多模态深度学习网络所得的,可包括步骤S1221~S1225。
S1221、对若干多源数据进行预处理,并对预处理后的数据进行分组,以得到样本集。
良好的数据质量是建模的基础,因此首先对案件数据进行数据质量探查,包括数据字段的数据量、空值率、重复率、异常率以及警情案件数据文本长度等,根据警情案件数据文本长度设置模型参数值,其中,此处模型参数值指的是文本的最大长度。
对若干多源数据的预处理可以参阅步骤S121,此处不再赘述。对预处理后的数据按照每一个犯罪类型进行分组,分别构成样本集。
S1222、划分所述样本集,以得到训练集以及测试集。
样本集按照7:3的比例划分为训练集和测试集。
S1223、构建所述多模态深度学习网络。
在本实施例中,所述多模态深度学习网络包括第一模态深度学习网络、第二模态深度学习网络以及分类器;多模态深度学习网络是指机器从文本、图像、语音、视频等多个领域获取信息,实现信息转换和融合,从而提升模型性能的技术。
采用第一模态深度学习网络和第二模态深度学习网络分别对重点人员、卡口数据、场所数据等结构化数据和案件数据、警情数据等相关文本数据进行多模态建模。
其中第一模态深度学习网络又分为多个单模态模型,分别对重点人员、卡口数据、场所数据等相关结构化数据进行建模,进而将每个单模态模型生成的特征向量进行融合。同理,第二模态深度学习网络分别对案件、警情等文本数据进行建模,进而将每个单模态模型生成的特征向量进行融合。
将第一模态深度学习网络和第二模态深度学习网络生成的特征向量进行融合,进而使用softmax函数计算数据样本属于每一个类别的概率,选取最大概率所对应的类别作为犯罪类别。
S1224、采用所述训练集训练所述多模态深度学习网络。
在一实施例中,请参阅图6,上述的步骤S1224可包括步骤S12241~S12244。
S12241、对所述训练集内的结构化数据输入至第一模态深度学习网络内进行特征向量的提取,以得到第一特征向量。
在本实施例中,第一特征向量是指根据结构化数据提取所得的特征向量,具体地,采用深度神经网络算法,获取重点人员、卡口数据、场所数据等结构化数据的潜在信息,分别提取各结构化数据的特征向量,进而进行融合所得的结果。
在一实施例中,请参阅图7,上述的步骤S12241可包括步骤S122411~S122413。
S122411、对所述训练集内的结构化数据采用输入层构建训练数据集。
在本实施例中,训练数据集是指用于采用网络进行特征提取的原始数据。
具体地,分别从历史犯罪、监控、车辆、通联、出行、场所、常驻暂住人口、交通卡口等结构化数据选取N组数据,每组犯罪类别数量为M个,构建训练数据集:Train={a1,a2...aN},其中an为一维数组:an=[x1 (n),x2 (n),...,xi (n),y(n)],其中,i为每组数据的维度,n指的是每组样本,y为每组数据的犯罪类别。
S122412、对训练数据集输入至隐藏层进行特征抽象,以得到抽象结果。
在本实施例中,抽象结果是指把输入数据的特征抽象到另一个维度空间的结果。
隐藏层的目的是把输入数据的特征抽象到另一个维度空间,来展现其更抽象化的特征,这些特征能更好的进行线性划分,多个隐藏层其实是对输入特征多层次的抽象,最终的目的是为了更好的线性划分不同类型的数据。
S122413、对抽象结果进行批量归一化、特征向量提取以及融合,以得到第一特征向量。
具体地,批量归一化也被成为BN(批标准化,Batch Normalization)层,在网络的每一层输入的时候,又插入了一个归一化层,也就是先做一个归一化处理(归一化至:均值0、方差为1),然后再进入网络的下一层。一层有d维输入:x=(x(1)...x(d)),d代表输入向量的维度,归一化每一维:
Figure BDA0003236274990000091
其中,k代表输入向量的每一个维度,E[x(k)]代表每一维的均值,Var[x(k)]代表每一维的方差。
特征向量提取由神经网络隐藏层的权重构成,生成特征向量的过程就是使用训练数据构建优化模型时参数更新的过程,因此,在此处使用输入层到隐藏层的权重作为特征向量。
采用向量拼接法融合各个单模态模型产生的特征向量,向量拼接法是通用的特征融合方法,数学表达为:现有特征向量v1、v2,v1∈Rn,v2∈Rm,Rn、Rm指的是实数域上向量的维度,将其在同一个阶进行拼接融合特征向量v=[v1,v2]∈Rn+m,此处Rn+m指的是向量在实数域上的维度,例如v1=[0.1,0.3,0.5],v2=[0.2,0.3],拼接后向量v=[0.1,0.3,0.5,0.2,0.3]。拼接之后采用线性映射转换成v′=Wv,其中v′∈Rn,v∈Rn+m
Figure BDA0003236274990000092
W代表实数域上的n×m阶矩阵。
在本实施例中,使用的是深度神经网络技术进行构建第一模态深度学习网络,提取特征向量。此外,还可以使用传统机器学习相关算法如逻辑回归、支持向量机等分类算法以及其他深度学习算法,如循环神经网络、长短记忆神经网络等构建第一模态深度学习网络。
S12242、对所述训练集内的文本数据输入至第二模态深度学习网络内进行特征向量的提取,以得到第二特征向量。
在本实施例中,所述第二模态深度学习网络包括BERT模型。第二特征向量是指通过BERT模型对文本数据进行特征提取的结果,具体地,采用语义分析的方式,获取案件、警情等文本数据的语义信息,分别提取各文本数据的特征向量,进而进行融合所形成的结果。
目前顶级的BERT语言模型已在海量数据集中进行了预训练,具备强大的语义获取能力,为使得BERT语言模型更加适配于案件、警情等文本数据,本方案首先使用千万数据量级别的案件、警情等文本数据按照其最初的预训练方法对BERT语言模型再次进行预训练,进一步提升其案件、警情等文本数据的语义获取能力。
具体地,第二模态深度学习网络是对预训练的BERT语言模型进行模型参数微调,使其适用于警情案件文本分类任务,构造训练样本集,分别选取N组案件、警情等数据,每组案件类别数量为M个,构建训练样本集:Train={a1,a2...aN},其中an代表实数域上的L×E阶矩阵:
Figure BDA0003236274990000101
其中L代表训练样本集的文本长度,E代表词向量维度。
将训练样本集在BERT模型中进行计算得到样本的语义向量:sem=(cls,token1,token2...tokenL,sep),其中,cls=(x1,x2...xE)代表该训练样本的语义,tokeni=(x1,x2...xE)代表训练样本中每个字的语义。使用全连接层计算得到训练样本语义cls分别属于两个类别的语义特征:
Figure BDA0003236274990000102
Figure BDA0003236274990000103
其中
Figure BDA0003236274990000104
b1和b2均是全连接层参数,使用向量拼接法对语义特征进行融合,以形成对应的第二特征向量。
S12243、融合所述第一特征向量以及第二特征向量,以得到目标融合结果。
在本实施例中,目标融合结果是指第一特征向量以及第二特征向量融合所得的结果。具体地,使用向量拼接法对第一特征向量以及第二特征向量进行融合。
特征向量融合的目的是在保留各类型数据有效特征的基础上进行特征向量融合,本实施例采用的是采用向量拼接法进行特征向量融合。此外还可以使用逐个位相加法进行特征向量融合。逐个位相加法:即直接将待融合的特征向量进行对位相加,使用此方法的前提是这两个特征向量的维度是相同的。例如:待融合向量v1=[0.1,0.3,0.5,0.2],v2=[0.2,0.3,0.1,0.3],融合后向量v=[0.3,0.6,0.6,0.5]。
S12244、采用分类器对目标融合结果进行犯罪类别的概率计算,以得到犯罪类别。
使用如下公式所示的Softmax函数计算该训练样本分别属于每个犯罪类别的概率:
Figure BDA0003236274990000105
其中,Zi是分类器前级输出单元的输出。j代表类别索引,总的类别个数为c。proi分别属于每个犯罪类别的概率,选取最大概率所对应的类别作为犯罪类别。
S1225、利用所述测试集对训练后的多模态深度学习网络进行测试,以调整多模态深度学习网络的参数,以得到所述多模态犯罪预警模型。
从多源异构数据中使用多模态神经网络建模技术,通过计算机自动对案件涉及到的历史犯罪数据、监控数据、车辆及数据(含违章)、通联数据、出行数据、场所数据、常驻暂住人口数据、交通卡口数据等数据进行自动建模,每个单模态模型学习得到数据的多层表示与抽象,进而将数据转换成神经网络的高层抽象特征。通过多源数据抽象特征的互补融合,联合学习各数据的潜在共享信息,进而提升犯罪预警模型任务的有效性。
在本实施例中,测试集对训练后的多模态深度学习网络进行测试,以调整多模态深度学习网络的参数,以得到所述多模态犯罪预警模型。具体通过如下公式计算训练样本的预测类别和真实类别之间的交叉熵损失函数值,通过损失函数值进行反向传播调整模型参数;损失函数loss=-[yi·log(pi)+(1-yi)·log(1-Pi)],其中,yi表示样本i的标签,正类为1,负类为0;pi表示样本i预测为正类的概率。
以挖掘多源异构警务大数据为出发点,结合数据挖掘和人工智能技术,提出一种基于多源异构数据的多模态深度学习犯罪预警方法。针对公安系统中高度多样化警务数据,包括结构化数据和文本数据,自动提取有效特征,实现预测犯罪行为,达到精准防控的目的。
基于上述训练生成的多模态模型,选取多源数据中没有明确标记案件类别的数据作为测试数据集:
案件数据经预处理后,分别进入对应的结构化数据多模态模型和文本数据多模态模型,最终生成特征向量Test={b1,b2...bK},其中bi同样代表实数域上的L×E阶矩阵,使用softmax函数计算得到测试样本i属于每一个犯罪类别的概率,选取最大概率值所对应的类别作为样本i的预测的犯罪类别。
在本实施例中,多模态犯罪预警模型是基于多源异构公安警务大数据建模,使用多源异构公安警务大数据建模,能够有效联合学习各数据潜在的共享信息,提高应用场景,提升犯罪预警模型任务的有效性。充分利用多源异构公安警务数据的潜在信息,实现了信息转换和融合,增加了模型可解释性。多模态深度学习技术能够从文本、图像、语音、视频等多个领域获取信息,实现信息转换和融合,使用技术结合历史犯罪数据、监控数据、车辆及数据(含违章)、通联数据、出行数据、场所数据、常驻暂住人口数据、交通卡口数据等结构化数据和案件、警情等非结构化文本数据,获取各类型数据有效信息,实现信息转换和融合,从而提升模型的性能。使用深度神经网络模型提取有效特征。并使用了批量归一化技术对每个神经元做归一化处理,在一定程度上提高了模型的训练速度。为获取公安警务数据中案件、警情等文本数据的进行语义信息,使用在BERT预训练模型的基础上使用千万级别的案件、警情等文本数据按照其最初的预训练方法对BERT语言模型再次进行预训练,进一步提升其案件、警情等文本数据的语义获取能力。由于公安警务大数据较为分散,使用多模态深度学习模型建模过程中,各个单模态模型只针对统一类型数据。因此需要在充分保留各类型数据的有效特征的基础上对各个单模态模型产生的特征向量进行融合。
本实施例使用数据挖掘和人工智能相关技术,提升模型性能的技术。基于多模态深度学习技术能够充分利用多源异构的警务数据建模,达到犯罪行为精准预警的目的。以挖掘多源异构警务大数据及数据中蕴含的犯罪规律分析与挖掘为出发点,利用数据挖掘和人工智能相关技术,提出一种基于公安领域多源异构数据的多模态深度学习犯罪预警方法。结合案件涉及到历史犯罪数据、监控数据、车辆及数据(含违章)、通联数据、出行数据、场所数据、常驻暂住人口数据、交通卡口数据等结构化和非结构化数据。构建多模态深度学习模型,充分利用多源异构警务数据,自动提取有效信息构建犯罪预警模型。实现多场景犯罪行为预警,样本数据多元化,增加模型可解释性,达到精准防控的目的。
上述的犯罪预警方法,通过获取多源异构的案件数据,将案件数据输入至多模态犯罪预警模型内进行犯罪识别,其中,在识别时先进行数据的预处理后,采用深度学习网络构成的第一模态深度学习网络以及BERT模型构成的第二模态深度学习网络,分别进行特征提取再融合,采用分类器进行概率计算,确定犯罪类型,形成识别结果,实现充分利用到多源异构数据的潜在信息主动挖掘有效特征,提高犯罪预警的准确率。
图8是本发明实施例提供的一种犯罪预警装置300的示意性框图。如图8所示,对应于以上犯罪预警方法,本发明还提供一种犯罪预警装置300。该犯罪预警装置300包括用于执行上述犯罪预警方法的单元,该装置可以被配置于服务器中。具体地,请参阅图8,该犯罪预警装置300包括数据获取单元301以及识别单元302。
数据获取单元301,用于获取案件数据;识别单元302,用于将所述案件数据输入至多模态犯罪预警模型内进行犯罪识别,以得到识别结果;
还包括:
模型获取单元,用于通过对若干多源数据进行预处理和分组后形成的样本集训练多模态深度学习网络,以得到多模态犯罪预警模型。
在一实施例中,如图9所示,所述识别单元302包括预处理子单元3021以及犯罪识别子单元3022。
预处理子单元3021,用于对所述案件数据进行预处理,以得到预处理结果;犯罪识别子单元3022,用于将所述预处理结果输入至所述多模态犯罪预警模型内进行犯罪识别,以得到识别结果。
在一实施例中,如图10所示,所述预处理子单元3021包括质量探查模块30211以及处理模块30212。
质量探查模块30211,用于对所述案件数据进行质量探查,以得到探查结果,其中,所述探查结果包括数据量、空值率、重复率以及异常率;处理模块30212,用于对所述探查结果进行重复值处理、缺失值处理和异常值处理,以得到预处理结果。
在一实施例中,所述模型获取单元包括样本集构建子单元、划分子单元、网络构建子单元、训练子单元以及测试子单元。
样本集构建子单元,用于对若干多源数据进行预处理,并对预处理后的数据进行分组,以得到样本集;划分子单元,用于划分所述样本集,以得到训练集以及测试集;网络构建子单元,用于构建所述多模态深度学习网络;训练子单元,用于采用所述训练集训练所述多模态深度学习网络;测试子单元,用于利用所述测试集对训练后的多模态深度学习网络进行测试,以调整多模态深度学习网络的参数,以得到所述多模态犯罪预警模型。
在一实施例中,所述训练子单元包括第一提取模块、第二提取模块、融合模块以及分类模块。
第一提取模块,用于对所述训练集内的结构化数据输入至第一模态深度学习网络内进行特征向量的提取,以得到第一特征向量;第二提取模块,用于对所述训练集内的文本数据输入至第二模态深度学习网络内进行特征向量的提取,以得到第二特征向量;融合模块,用于融合所述第一特征向量以及第二特征向量,以得到目标融合结果;分类模块,用于采用分类器对目标融合结果进行犯罪类别的概率计算,以得到犯罪类别。
在一实施例中,所述第一提取模块包括输入层处理子模块、抽象子模块以及结果处理子模块。
输入层处理子模块,用于对所述训练集内的结构化数据采用输入层构建训练数据集;抽象子模块,用于对训练数据集输入至隐藏层进行特征抽象,以得到抽象结果;结果处理子模块,用于对抽象结果进行批量归一化、特征向量提取以及融合,以得到第一特征向量。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述犯罪预警装置300和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述犯罪预警装置300可以实现为一种计算机程序的形式,该计算机程序可以在如图11所示的计算机设备上运行。
请参阅图11,图11是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是服务器,其中,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图11,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032包括程序指令,该程序指令被执行时,可使得处理器502执行一种犯罪预警方法。
该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种犯罪预警方法。
该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:
获取案件数据;将所述案件数据输入至多模态犯罪预警模型内进行犯罪识别,以得到识别结果;
其中,所述多模态犯罪预警模型是通过对若干多源数据进行预处理和分组后形成的样本集训练多模态深度学习网络所得的。
在一实施例中,处理器502在实现所述将所述案件数据输入至多模态犯罪预警模型内进行犯罪识别,以得到识别结果步骤时,具体实现如下步骤:
对所述案件数据进行预处理,以得到预处理结果;将所述预处理结果输入至所述多模态犯罪预警模型内进行犯罪识别,以得到识别结果。
在一实施例中,处理器502在实现所述对所述案件数据进行预处理,以得到预处理结果步骤时,具体实现如下步骤:
对所述案件数据进行质量探查,以得到探查结果,其中,所述探查结果包括数据量、空值率、重复率以及异常率;对所述探查结果进行重复值处理、缺失值处理和异常值处理,以得到预处理结果。
在一实施例中,处理器502在实现所述多模态犯罪预警模型通过对若干多源数据进行预处理和分组后形成的样本集训练多模态深度学习网络所得的步骤时,具体实现如下步骤:
对若干多源数据进行预处理,并对预处理后的数据进行分组,以得到样本集;划分所述样本集,以得到训练集以及测试集;构建所述多模态深度学习网络;采用所述训练集训练所述多模态深度学习网络;利用所述测试集对训练后的多模态深度学习网络进行测试,以调整多模态深度学习网络的参数,以得到所述多模态犯罪预警模型。
其中,所述多模态深度学习网络包括第一模态深度学习网络、第二模态深度学习网络以及分类器。
在一实施例中,处理器502在实现所述采用所述训练集训练所述多模态深度学习网络步骤时,具体实现如下步骤:
对所述训练集内的结构化数据输入至第一模态深度学习网络内进行特征向量的提取,以得到第一特征向量;对所述训练集内的文本数据输入至第二模态深度学习网络内进行特征向量的提取,以得到第二特征向量;融合所述第一特征向量以及第二特征向量,以得到目标融合结果;采用分类器对目标融合结果进行犯罪类别的概率计算,以得到犯罪类别。
其中,所述第二模态深度学习网络包括BERT模型。
在一实施例中,处理器502在实现所述对所述训练集内的结构化数据输入至第一模态深度学习网络内进行特征向量的提取,以得到第一特征向量步骤时,具体实现如下步骤:
对所述训练集内的结构化数据采用输入层构建训练数据集;对训练数据集输入至隐藏层进行特征抽象,以得到抽象结果;对抽象结果进行批量归一化、特征向量提取以及融合,以得到第一特征向量。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中该计算机程序被处理器执行时使处理器执行如下步骤:
获取案件数据;将所述案件数据输入至多模态犯罪预警模型内进行犯罪识别,以得到识别结果;
其中,所述多模态犯罪预警模型是通过对若干多源数据进行预处理和分组后形成的样本集训练多模态深度学习网络所得的。
在一实施例中,所述处理器在执行所述计算机程序而实现所述将所述案件数据输入至多模态犯罪预警模型内进行犯罪识别,以得到识别结果步骤时,具体实现如下步骤:
对所述案件数据进行预处理,以得到预处理结果;将所述预处理结果输入至所述多模态犯罪预警模型内进行犯罪识别,以得到识别结果。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对所述案件数据进行预处理,以得到预处理结果步骤时,具体实现如下步骤:
对所述案件数据进行质量探查,以得到探查结果,其中,所述探查结果包括数据量、空值率、重复率以及异常率;对所述探查结果进行重复值处理、缺失值处理和异常值处理,以得到预处理结果。
在一实施例中,所述处理器在执行所述计算机程序而实现所述多模态犯罪预警模型通过对若干多源数据进行预处理和分组后形成的样本集训练多模态深度学习网络所得的步骤时,具体实现如下步骤:
对若干多源数据进行预处理,并对预处理后的数据进行分组,以得到样本集;划分所述样本集,以得到训练集以及测试集;构建所述多模态深度学习网络;采用所述训练集训练所述多模态深度学习网络;利用所述测试集对训练后的多模态深度学习网络进行测试,以调整多模态深度学习网络的参数,以得到所述多模态犯罪预警模型。
其中,所述多模态深度学习网络包括第一模态深度学习网络、第二模态深度学习网络以及分类器。
在一实施例中,所述处理器在执行所述计算机程序而实现所述采用所述训练集训练所述多模态深度学习网络步骤时,具体实现如下步骤:
对所述训练集内的结构化数据输入至第一模态深度学习网络内进行特征向量的提取,以得到第一特征向量;对所述训练集内的文本数据输入至第二模态深度学习网络内进行特征向量的提取,以得到第二特征向量;融合所述第一特征向量以及第二特征向量,以得到目标融合结果;采用分类器对目标融合结果进行犯罪类别的概率计算,以得到犯罪类别。
其中,所述第二模态深度学习网络包括BERT模型。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对所述训练集内的结构化数据输入至第一模态深度学习网络内进行特征向量的提取,以得到第一特征向量步骤时,具体实现如下步骤:
对所述训练集内的结构化数据采用输入层构建训练数据集;对训练数据集输入至隐藏层进行特征抽象,以得到抽象结果;对抽象结果进行批量归一化、特征向量提取以及融合,以得到第一特征向量。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (5)

1.犯罪预警方法,其特征在于,包括:
获取案件数据;
将所述案件数据输入至多模态犯罪预警模型内进行犯罪识别,以得到识别结果;
其中,所述多模态犯罪预警模型是通过对若干多源数据进行预处理和分组后形成的样本集训练多模态深度学习网络所得的;
其中,所述案件数据为数据来源多样化且格式不一的多源异构数据;
所述将所述案件数据输入至多模态犯罪预警模型内进行犯罪识别,以得到识别结果,包括:
对所述案件数据进行预处理,以得到预处理结果;
将所述预处理结果输入至所述多模态犯罪预警模型内进行犯罪识别,以得到识别结果;
所述对所述案件数据进行预处理,以得到预处理结果,包括:
对所述案件数据进行质量探查,以得到探查结果,其中,所述探查结果包括数据量、空值率、重复率以及异常率;
对所述探查结果进行重复值处理、缺失值处理和异常值处理,以得到预处理结果;
所述多模态犯罪预警模型通过对若干多源数据进行预处理和分组后形成的样本集训练多模态深度学习网络所得的,包括:
对若干多源数据进行预处理,并对预处理后的数据进行分组,以得到样本集;
划分所述样本集,以得到训练集以及测试集;
构建所述多模态深度学习网络;
采用所述训练集训练所述多模态深度学习网络;
利用所述测试集对训练后的多模态深度学习网络进行测试,以调整多模态深度学习网络的参数,以得到所述多模态犯罪预警模型;
所述多模态深度学习网络包括第一模态深度学习网络、第二模态深度学习网络以及分类器;
所述采用所述训练集训练所述多模态深度学习网络,包括:
对所述训练集内的结构化数据输入至第一模态深度学习网络内进行特征向量的提取,以得到第一特征向量;
对所述训练集内的文本数据输入至第二模态深度学习网络内进行特征向量的提取,以得到第二特征向量;
融合所述第一特征向量以及第二特征向量,以得到目标融合结果;
采用分类器对目标融合结果进行犯罪类别的概率计算,以得到犯罪类别;
所述对所述训练集内的结构化数据输入至第一模态深度学习网络内进行特征向量的提取,以得到第一特征向量,包括:
对所述训练集内的结构化数据采用输入层构建训练数据集;
对训练数据集输入至隐藏层进行特征抽象,以得到抽象结果;
对抽象结果进行批量归一化、特征向量提取以及融合,以得到第一特征向量。
2.根据权利要求1所述的犯罪预警方法,其特征在于,所述第二模态深度学习网络包括BERT模型。
3.犯罪预警装置,其特征在于,包括:
数据获取单元,用于获取案件数据;
识别单元,用于将所述案件数据输入至多模态犯罪预警模型内进行犯罪识别,以得到识别结果;
还包括:
模型获取单元,用于通过对若干多源数据进行预处理和分组后形成的样本集训练多模态深度学习网络,以得到多模态犯罪预警模型;
其中,所述案件数据为数据来源多样化且格式不一的多源异构数据;
所述将所述案件数据输入至多模态犯罪预警模型内进行犯罪识别,以得到识别结果,包括:
对所述案件数据进行预处理,以得到预处理结果;
将所述预处理结果输入至所述多模态犯罪预警模型内进行犯罪识别,以得到识别结果;
所述对所述案件数据进行预处理,以得到预处理结果,包括:
对所述案件数据进行质量探查,以得到探查结果,其中,所述探查结果包括数据量、空值率、重复率以及异常率;
对所述探查结果进行重复值处理、缺失值处理和异常值处理,以得到预处理结果;
所述多模态犯罪预警模型通过对若干多源数据进行预处理和分组后形成的样本集训练多模态深度学习网络所得的,包括:
对若干多源数据进行预处理,并对预处理后的数据进行分组,以得到样本集;
划分所述样本集,以得到训练集以及测试集;
构建所述多模态深度学习网络;
采用所述训练集训练所述多模态深度学习网络;
利用所述测试集对训练后的多模态深度学习网络进行测试,以调整多模态深度学习网络的参数,以得到所述多模态犯罪预警模型;
所述多模态深度学习网络包括第一模态深度学习网络、第二模态深度学习网络以及分类器;
所述采用所述训练集训练所述多模态深度学习网络,包括:
对所述训练集内的结构化数据输入至第一模态深度学习网络内进行特征向量的提取,以得到第一特征向量;
对所述训练集内的文本数据输入至第二模态深度学习网络内进行特征向量的提取,以得到第二特征向量;
融合所述第一特征向量以及第二特征向量,以得到目标融合结果;
采用分类器对目标融合结果进行犯罪类别的概率计算,以得到犯罪类别;
所述对所述训练集内的结构化数据输入至第一模态深度学习网络内进行特征向量的提取,以得到第一特征向量,包括:
对所述训练集内的结构化数据采用输入层构建训练数据集;
对训练数据集输入至隐藏层进行特征抽象,以得到抽象结果;
对抽象结果进行批量归一化、特征向量提取以及融合,以得到第一特征向量。
4.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至2中任一项所述的方法。
5.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现如权利要求1至2中任一项所述的方法。
CN202111003285.0A 2021-08-30 2021-08-30 犯罪预警方法、装置、计算机设备及存储介质 Active CN113919544B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111003285.0A CN113919544B (zh) 2021-08-30 2021-08-30 犯罪预警方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111003285.0A CN113919544B (zh) 2021-08-30 2021-08-30 犯罪预警方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN113919544A CN113919544A (zh) 2022-01-11
CN113919544B true CN113919544B (zh) 2022-05-27

Family

ID=79233500

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111003285.0A Active CN113919544B (zh) 2021-08-30 2021-08-30 犯罪预警方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN113919544B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114267003B (zh) * 2022-03-02 2022-06-10 城云科技(中国)有限公司 道路破损检测方法、装置及应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105022835A (zh) * 2015-08-14 2015-11-04 武汉大学 一种群智感知大数据公共安全识别方法及系统
CN109034020A (zh) * 2018-07-12 2018-12-18 重庆邮电大学 一种基于物联网与深度学习的社区风险监测和防范方法
CN112070112A (zh) * 2020-07-28 2020-12-11 浙江警察学院 涉网犯罪分类方法、装置、计算机设备及存储介质
CN112069392A (zh) * 2020-07-28 2020-12-11 浙江警察学院 涉网犯罪防控方法、装置、计算机设备及存储介质
CN112699273A (zh) * 2019-10-23 2021-04-23 霍尼韦尔国际公司 基于多模态分析预测潜在突发事件数据结构

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101830522B1 (ko) * 2016-08-22 2018-02-21 가톨릭대학교 산학협력단 빅 데이터를 이용한 예측 대상 지역의 범죄 발생 예측 방법
CN107403067A (zh) * 2017-07-31 2017-11-28 京东方科技集团股份有限公司 基于医学知识库的智能分诊服务器、终端及系统
CN108960488B (zh) * 2018-06-13 2022-03-04 国网山东省电力公司经济技术研究院 一种基于深度学习与多源信息融合的饱和负荷空间分布精准预测方法
CN110728298A (zh) * 2019-09-05 2020-01-24 北京三快在线科技有限公司 多任务分类模型训练方法、多任务分类方法及装置
CN111177743B (zh) * 2019-12-06 2022-02-22 西安交通大学 一种面向信用大数据的风险控制方法及其系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105022835A (zh) * 2015-08-14 2015-11-04 武汉大学 一种群智感知大数据公共安全识别方法及系统
CN109034020A (zh) * 2018-07-12 2018-12-18 重庆邮电大学 一种基于物联网与深度学习的社区风险监测和防范方法
CN112699273A (zh) * 2019-10-23 2021-04-23 霍尼韦尔国际公司 基于多模态分析预测潜在突发事件数据结构
CN112070112A (zh) * 2020-07-28 2020-12-11 浙江警察学院 涉网犯罪分类方法、装置、计算机设备及存储介质
CN112069392A (zh) * 2020-07-28 2020-12-11 浙江警察学院 涉网犯罪防控方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN113919544A (zh) 2022-01-11

Similar Documents

Publication Publication Date Title
Yuan et al. Real-time crash risk prediction using long short-term memory recurrent neural network
Chen et al. A survey on an emerging area: Deep learning for smart city data
US8660368B2 (en) Anomalous pattern discovery
CN113822494A (zh) 风险预测方法、装置、设备及存储介质
US20160171369A1 (en) Technical and semantic signal processing in large, unstructured data fields
CN110458324B (zh) 风险概率的计算方法、装置和计算机设备
CN105518656A (zh) 用于多传感器数据融合的认知神经语言学行为辨识系统
Azhar et al. Detection and prediction of traffic accidents using deep learning techniques
CN111800289B (zh) 通信网络故障分析方法和装置
CN111177367B (zh) 案件分类方法、分类模型训练方法及相关产品
CN112015901A (zh) 文本分类方法及装置、警情分析系统
Ghankutkar et al. Modelling machine learning for analysing crime news
Zhu et al. Spatio-temporal point processes with attention for traffic congestion event modeling
CN113919544B (zh) 犯罪预警方法、装置、计算机设备及存储介质
CN115659244A (zh) 故障预测方法、装置及存储介质
CN115495744A (zh) 威胁情报分类方法、装置、电子设备及存储介质
Mounica et al. Social media data analysis for intelligent transportation systems
Yousfi et al. Smart big data framework for insight discovery
CN116304891B (zh) 基于多源数据迁移学习的类别预测方法和装置
CN116186288A (zh) 一种基于地点和语义的知识图谱反馈方法
CN115619245A (zh) 一种基于数据降维方法的画像构建和分类方法及系统
CN114579876A (zh) 虚假信息检测方法、装置、设备及介质
Wang et al. A driver abnormal behavior warning method based on isolated forest algorithm.
Sangeetha et al. Crime Rate Prediction and Prevention: Unleashing the Power of Deep Learning
CN110705597A (zh) 基于事件因果关系抽取的网络苗头事件检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant