CN111369417A - 一种基于技战法模型的案件线索获取方法及装置 - Google Patents

一种基于技战法模型的案件线索获取方法及装置 Download PDF

Info

Publication number
CN111369417A
CN111369417A CN202010148692.XA CN202010148692A CN111369417A CN 111369417 A CN111369417 A CN 111369417A CN 202010148692 A CN202010148692 A CN 202010148692A CN 111369417 A CN111369417 A CN 111369417A
Authority
CN
China
Prior art keywords
case
tactical
technical
model
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010148692.XA
Other languages
English (en)
Inventor
尹鲁杰
郝旭宁
毕晓辉
杜保坤
莫明娟
刘见
刘晓军
黄金花
孙论强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense TransTech Co Ltd
Original Assignee
Hisense TransTech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense TransTech Co Ltd filed Critical Hisense TransTech Co Ltd
Priority to CN202010148692.XA priority Critical patent/CN111369417A/zh
Publication of CN111369417A publication Critical patent/CN111369417A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及公共安全技术领域,特别地,涉及一种基于技战法模型的案件线索获取方法及装置。本申请提供的一种基于技战法模型的案件线索获取方法,包括以下步骤:对新案件录入的基本信息进行特征工程分析得到所述新案件的特征向量;通过计算所述特征向量和语料库中历史案件文档的余弦相似度,得到与所述新案件相似度最高的历史案件对应的推荐技战法模型;将所述特征向量输入所述推荐技战法模型进行连环技战法分析得到案件线索。一定程度上可以解决办案人员由于经验不足无法选择最佳技战法的问题,还可以解决技战法参数手动调节难度大,无法自动排查案件线索的问题。

Description

一种基于技战法模型的案件线索获取方法及装置
技术领域
本申请涉及公共安全技术领域,特别地,涉及一种基于技战法模型的案件线索获取方法及装置。
背景技术
案件线索是公安侦查办案人员根据其监督检查职权对案件进行检查、侦破发现的有关嫌疑人、嫌疑人团伙、嫌疑车辆的线索信息。技战法是公安侦查办案人员为了获取案件线索在视频侦查系统中采用的电子技术手段。
目前公安系统在侦破案件的过程中普遍应用视频侦查系统,其包含多种不同的技战法。当需要排查案件线索时,侦查办案人员根据所采集的案件基本信息、办案人员自身的侦查办案经验、以及侦查办案人员对视频侦查系统中技战法的参数掌握程度来选择应用不同的技战法和对技战法进行手动操作以获得案件线索。
但是,当侦查办案人员的经验不足、或对视频侦查系统中技战法参数使用不够熟练时,经常会发生侦查办案人员选择的技战法与实际情况不符、或即使能够成功选择最优技战法但无法正确高效的调整参数使用技战法,导致技战法利用率不高,不能充分利用技战法挖掘案件线索,造成案件线索单一且质量不高。
发明内容
本申请提供了一种基于技战法模型的案件线索获取方法及装置,通过将案件的基本信息转换为计算机可读的特征向量,比对并输出推荐技战法模型,然后进行连环接战法分析,一定程度上可以解决办案人员由于经验不足无法选择最佳技战法的问题,还可以解决技战法参数手动调节难度大,无法自动排查案件线索的问题。
本申请的实施例是这样实现的:
本申请实施例的第一方面提供一种基于技战法模型的案件线索获取方法,包括以下步骤:
对新案件录入的基本信息进行特征工程分析得到所述新案件的特征向量;
通过计算所述特征向量和语料库中历史案件文档的余弦相似度,得到与所述新案件相似度最高的历史案件对应的推荐技战法模型;
将所述特征向量输入所述推荐技战法模型进行连环技战法分析得到案件线索。
本申请实施例的第二方面提供一种基于技战法模型的案件线索获取装置,包括:
案件录入模块,用于录入新案件的基本信息;
信息分析模块,用于对所述基本信息进行特征工程分析得到所述新案件的特征向量;
智能技战法模块,用于通过计算所述特征向量和语料库中历史案件文档的余弦相似度,得到与所述新案件相似度最高的历史案件对应的推荐技战法模型;
将所述特征向量输入所述推荐技战法模型进行连环技战法分析得到案件线索。
本申请的有益效果在于:通过将案件的基本信息转换为计算机可读的特征向量,可以提高视频侦查业务的信息化与自动化;进一步通过比对新案件与历史案件的相似度得到推荐技战法模型,可以使得经验不足的办案人员也能够正确的选择最佳技战法;进一步通过连环技战法分析得到案件线索,可以实现技战法模型自动排查获取案件线索,实现节省警力、提高办案效率的有益效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请实施例一种基于技战法模型的案件线索获取系统100的示意图;
图2示出了本申请实施例一种计算设备200的示意图;
图3示出了本申请实施例一种基于技战法模型的案件线索获取方法的流程示意图;
图4示出了本申请实施例一种基于技战法模型的案件线索获取方法中特征工程分析的流程示意图;
图5示出了本申请实施例基于双向长短期记忆神经网络与条件随机场结合的文本分词模型结构示意图;
图6示出了本申请实施例一种基于技战法模型的案件线索获取方法中连环技战法分析流程示意图;
图7示出了本申请实施例一种基于技战法模型的案件线索获取装置结构示意图。
具体实施方式
为使本申请示例性实施例的目的、技术方案和优点更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施例中的技术方案进行清楚、完整地描述,显然,所描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。
基于本申请中示出的示例性实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。此外,虽然本申请中公开内容按照示范性一个或几个实例来介绍,但应理解,可以就这些公开内容的各个方面也可以单独构成一个完整技术方案。
应当理解,本申请中说明书和权利要求书及上述附图中的术语″第一"、″第二″、″第三"等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。
此外,术语″包括"和″具有"以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的那些组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
本申请中使用的术语″模块",是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。。
本说明书通篇提及的″多个实施例"、″一些实施例"、″一个实施例"或″实施例"等,意味着结合该实施例描述的具体特征、结构或特性包括在至少一个实施例中。因此,本说明书通篇出现的短语″在多个实施例中"、″在一些实施例中"、″在至少另一个实施例中"或″在实施例中"等并不一定都指相同的实施例。此外,在一个或多个实施例中,具体特征、结构或特性可以任何合适的方式进行组合。因此,在无限制的情形下,结合一个实施例示出或描述的具体特征、结构或特性可全部或部分地与一个或多个其他实施例的特征、结构或特性进行组合。这种修改和变型旨在包括在本申请的范围之内。
图1示出了本申请实施例一种基于技战法模型的案件线索获取系统100的示意图。基于技战法模型的案件线索获取系统100是一个可以自动进行案件线索获取的系统。
基于技战法模型的案件线索获取系统100可以包括一个服务器110、至少一个存储设备120、至少一个网络130、一个或多个案件信息录入设备150-1、150-2......150-N。服务器110可以包括一个处理引擎112。
在一些实施例中,服务器110可以是一个单独的服务器或者一个服务器群组。所述服务器群可以是集中式的或分布式的(例如,服务器110可以是一个分布式的系统)。在一些实施例中,服务器110可以是本地的或远程的。例如,服务器110可以通过网络130访问存储在存储设备120中的数据。服务器110可以直接连接到存储设备120访问存储数据。在一些实施例中,服务器110可以在一个云平台上实现。所述云平台可以包括私有云、公共云、混合云、社区云、分布云、多重云等或上述举例的任意组合。
在一些实施例中,服务器110和案件线索获取系统可以在与本申请图2所示的计算设备上实现,包括计算设备200中的一个或多个部件。
在一些实施例中,服务器110可以包括一个处理引擎112。处理引擎112可以处理与服务请求相关的信息和/或数据以执行本申请描述的一个或多个功能。例如,处理引擎112可以基于获取案件信息录入设备150采集的信息,并通过网络130发送至存储设备120,用于更新存储在其中的数据。在一些实施例中,处理引擎112可以包括一个或多个处理器。处理引擎112可以包括一个或多个硬件处理器,例如中央处理器(CPU)、专用集成电路(ASIC)、专用指令集处理器(ASIP)、图像处理器(GPU)、物理运算处理器(PPU)、数字信号处理器(DSP)、现场可编辑门阵列(FPGA)、可编辑逻辑器件(PLD)、控制器、微控制器单元、精简指令集计算机(RISC)、微处理器等或上述举例的任意组合。
存储设备120可以存储数据和/或指令。在一些实施例中,存储设备120可以存储从案件信息录入设备150获得的数据。在一些实施例中,存储设备120可以存储供服务器110执行或使用的数据和/或指令,服务器110可以通过执行或使用所述数据和/或指令以实现本申请描述的实施例方法。在一些实施例中,存储设备120可以包括大容量存储器、可移动存储器、挥发性读写存储器、只读存储器(ROM)等或上述举例的任意组合。在一些实施例中,存储设备120可以在一个云平台上实现。例如所述云平台可以包括私有云、公共云、混合云、社区云、分布云、多重云等或上述举例的任意组合。
在一些实施例中,存储设备120可以与网络130连接以实现与基于技战法模型的案件线索获取系统100中的一个或多个部件之间的通信。基于技战法模型的案件线索获取系统100的一个或多个部件可以通过网络130访问存储在存储设备120中的数据或指令。在一些实施例中,存储设备120可以直接与基于技战法模型的案件线索获取系统100的一个或多个部件连接或通信。在一些实施例中,存储设备120可以是服务器110的一部分。
网络130可以促进信息和/或数据的交换。在一些实施例中,基于技战法模型的案件线索获取系统100中的一个或多个部件可以通过网络130向基于技战法模型的案件线索获取系统100中的其他部件发送信息和/或数据。例如,服务器110可以通过网络130从案件信息录入设备150获取/得到请求。在一些实施例中,网络130可以是有线网络或无线网络中的任意一种,或其组合。在一些实施例中,网络130可以包括一个或多个网络接入点。例如,网络130可能包括有线或无线网络接入点,如基站和/或互联网交换点130-1、130-2等等。通过接入点,基于技战法模型的案件线索获取系统100的一个或多个部件可能连接到网络130以交换数据和/或信息。
案件信息录入设备150可以包括计算机终端设备、移动终端设备、软件终端等。在一些实施例中,案件信息录入设备150可以通过人工录入或接警平台录入的方式采集案件的基本信息。在一些实施例中,案件信息录入设备150可以将采集到的各种案件基本信息发送到基于技战法模型的案件线索获取系统100中的一个或多个设备中。例如案件信息录入设备150可以将案件的基本信息发送至服务器110进行处理,或存储设备120中进行存储。
图2是根据本申请的一些实施例所示的一种示例性计算设备200的示意图。
服务器110、存储设备120可以在计算设备200上实现。例如,处理引擎112可以在计算设备200上实现并被配置为实现本申请中所披露的功能。
计算设备200可以包括用来实现本申请所描述的系统的任意部件。例如,处理引擎112可以在计算设备200上通过其硬件、软件程序、固件或其组合实现。为了方便起见图中仅绘制了一台计算机,但是本申请所描述的基于技战法模型的案件线索获取系统100相关的计算功能可以以分布的方式、由一组相似的平台所实施,以分散系统的处理负荷。
计算设备200可以包括与网络连接的通信端口250,用于实现数据通信。计算设备200可以包括一个处理器220,可以以一个或多个处理器的形式执行程序指令。示例性的电脑平台可以包括一个内部总线210、不同形式的程序存储器和数据存储器包括,例如,硬盘270、和只读存储器(ROM)230或随机存储器(RAM)240,用于存储由计算机处理和/或传输的各种各样的数据文件。示例性的计算设备可以包括存储在只读存储器230、随机存储器240和/或其他类型的非暂时性存储介质中的由处理器220执行的程序指令。本申请的方法和/或流程可以以程序指令的方式实现。计算设备200也包括输入/输出部件260,用于支持电脑与其他部件之间的输入/输出。计算设备200也可以通过网络通讯接收本披露中的程序和数据。
为理解方便,图2中仅示例性绘制了一个处理器。然而,需要注意的是,本申请中的计算设备200可以包括多个处理器,因此本申请中描述的由一个处理器实现的操作和/或方法也可以共同地或独立地由多个处理器实现。例如,如果在本申请中,计算设备200的处理器执行步骤1和步骤2,应当理解的是,步骤1和步骤2也可以由计算设备200的两个不同的处理器共同地或独立地执行。
图3示出了本申请实施例一种基于技战法模型的案件线索获取方法的流程示意图。
在步骤301中,对新案件录入的基本信息进行特征工程分析得到所述新案件的特征向量。
对新案件的基本信息进行录入,案件线索获取装置将所述基本信息转换为计算机可读的特征向量。
在一些实施例中,所述基本信息包括但不限于文字内容。例如,基本信息可以包括案件类型、案件特点、案发时间、案发地点、案件详情等。
所述案件类型包括但不限于:盗窃、诈骗、故意伤害、抢劫、抢夺、寻衅滋事、交通肇事、涉恐案件、扰乱社会秩序、损毁公私财物等。
案件特点对案件的主要特征进行概括描述,包括但不限于:案件多发时间、作案交通工具、侵害人目标情况、外地车作案、尾随作案、作案后隐匿、假套牌车作案、踩点作案、团伙作案、流窜作案等。
案发时间是案件发生的时间段;案发地点是案件发生的具体地址;案件详情以文本的方式记录案件发生的详细过程。
在一些实施例中,新案件的基本信息可以通过人工录入的方式进行。办案人员将案件的基本信息以文本的方式录入基于技战法模型的案件线索获取装置。
在一些实施例中,新案件的基本信息还可以通过接警平台录入。例如,通过接警平台的数据输出端口与基于技战法模型的案件线索获取装置的数据输入端口建立连接进行数据导入。所述接警平台在一些实现方式中可以利用已有系统,例如城市110接警系统等。
图4示出了本申请实施例一种基于技战法模型的案件线索获取方法中特征工程分析的流程示意图。
特征工程分析可以将案件的基本信息进行识别和提炼,分析得到新案件的案件特点、案件类型,以及不同案件类型之间具有的相同案件特点,从而解析出计算机可读的时间、人物、地点、事件等关键信息的逻辑顺序,最终将基本信息转换为特征向量来表示。
在步骤401中,将所述基本信息的文本字序列进行分词预处理得到文本词序列。
新案件的基本信息以文本字序列的形式录入案件线索获取装置,通过文本分词的方式对其进行预处理,可以得到所述基本信息的文本词序列形式。所述文本分词是指将连续的字符序列按照一定的规则重新组合成单词序列的过程。
新案件的基本信息进行特征向量转换时,首先需要做分词预处理。文本词序列通过计算机从文本字序列中自动提取能够代表该文本主体含义的词汇、或短语集合以实现文本表示的过程。
在一些实施例中,将文本字序列进行分词预处理得到文本词序列,通过采用基于双向长短期记忆神经网络(BI-LSTM)与条件随机场(CRF)结合的方法,并结合语料库进行分析;然后对和语料库中比对相同的字进行嵌入得到字嵌入特征;进一步将所述字嵌入特征输入至双向LSTM模型,神经网络模型的输出层输出深度学习训练后的特征,并输入给CRF层完成分词,具体分词过程如下:
对文本字序列进行分词之前对语料库进行标注预处理。本实施例中所述语料库可以包括PFR人民日报标注语料库、技战法有关的文本语料库。利用视频侦查系统已有的公安专有词库,对语料库的内容进行读取并标注分词信息。将文本字序列中的每个文字标注,分为4种类型:S(0),B(1)、M(2)、E(3)。
其中,S(Single)代表文本的单个字;B(Begin)代表文本词的第一个字,即本文词的开始;M(Middle)代表文本词的中间部分字;E(End)代表文本词的最后一个字,即文本词的结束。
然后,将语料库的数据进行随机划分,选取其中90%的数据作为训练集,选取其中10%的数据作为验证集以评估技战法模型的准确性,下面将对文本分词的原理进一步详细阐述。
图5示出了本申请实施例基于双向长短期记忆神经网络与条件随机场结合的文本分词模型结构示意图。
Bi-LSTM+CRF模型包括三层,分别为单词嵌入层(word embeddings),双向长短期记忆神经网络层(Bi-LSTM encoder)和条件随机场层(CRF Layer)。
其中,单次嵌入层用于在神经网络模型中将词文本序列的向量在上下文的表示、以及上下文与目标词之间的关联建立模型;利用Bi-LSTM层输出维度tag size,相当于文本词序列中每个词ωi映射到维度tag的发射概率值,假设Bi-LSTM层的输出矩阵为P,其中Pi,j代表词ωi映射到tagj的非归一化概率;利用CRF层来学习最优路径,对于CRF层来说,假定存在一个转移矩阵A,则Ai,j代表tagi转移到tagj的转移概率。
对于输入序列X对应的输出tag序列y,定义分数表示为:
Figure BDA0002401675390000071
利用Softmax函数,为每一个正确的tag序列y定义一个概率值,YX代表所有的tag序列,包括不可能出现的序列,似然概率p(y|X)表示为:
Figure BDA0002401675390000072
在神经网络模型的训练中,只需要最大化似然概率p(y|X)即可,利用对数似然表示为:
Figure BDA0002401675390000081
将损失函数定义为-log(p(y|x)),通过梯度下降法来进行网络的学习。
表1示出了本申请所述基于双向长短期记忆神经网络与条件随机场结合的文本分词模型模型输出的分词的一个示例结果
Figure BDA0002401675390000082
表1
继续参考图4,在步骤402中,对所述文本词序列进行特征工程分析得到计算机可读的特征向量。
得到到所述文本词序列后,对所述文本词序列进行特征工程计算生成计算机可读、可计算分析的特征向量。
在一些实施例中,通过采用LDA(Latent Dirichlet Allocation:隐合狄利克雷分布)主题模型算法提取所述特征向量,该算法基于贝叶斯理论,是一种无监督的词袋模型。
假设案件的文本词序列为一个文档,每个文档有其独有的″主题″,每个主题下的词,即单词有着不同的概率分布。根据贝叶斯理论,可得到以下链式关系:
P(词|文档)=P(词|主题)P(主题|文档)
在同一文档中,主题t出现的概率,可以表示为文档d的主题分布θd;在同一主题下,词w出现的概率可以表示为主题t的词语分布φt;将上述两个概率进行乘积可以得到同一文档出现某个词的概率,其表达式如下:
P(w|d)=P(w|t)*P(t|d)
其中,w表示词,d表示文档,t表示主题。
LDA主题模型算法主要针对上述两个分布进行训练,其过程阐述如下:
LDA主题模型算法开始时,先随机地给θd,φt赋值;
针对特定的文档ds中的第i单词ωi,如果令该单词对应的主题为tj,则上述公式可以表示为:
Figure BDA0002401675390000091
列举t主题,得到所有的
Figure BDA0002401675390000092
,根据这些概率值的结果,其中结果为ds的第i个单词ωi进一步选择主题,在本实施例中,假设
Figure BDA0002401675390000093
概率最大的主题为tj
如果ds中的第i个单词ωi选择一个与原先不同的主题,会对θd
Figure BDA0002401675390000094
有影响,它们的变化反过来也会影响P(w|d)的计算。
对文档集合D中的所有文档d的所有w进行一次P(w|d)计算,并重新选择主题,完成一次迭代。同时,高维分布采样通过使用吉布斯采样(Gibbs Sampling)算法,构造马氏链转移矩阵,使其满足细致平稳条件。当迭代n次之后即可收敛,计算″主题-词"同时出现的频率矩阵,从而得到LDA主题模型。通过所述LDA主题模型,计算出每个案件文档对应的特征向量表示。
在步骤302中,通过计算所述特征向量和语料库中历史案件文档的余弦相似度,得到与所述新案件相似度最高的历史案件对应的推荐技战法模型。
通过LDA主题模型分析新案件的文档,保持吉布斯(Gibbs Sampling)采样公式中的参数稳定不变,计算得到所述新案件文档的主题特征向量;然后计算所述特征向量与原始案件语料库中各个文档的余弦相似度,进而输出与所述新案件相似度最高的历史案件以及其对应的技战法。在一些实施例中,所述语料库包括原始案件语料库以及公安专有词库。
余弦相似度是指通过测量两个向量的夹角的余弦值来度量它们之间的相似性。0度角的余弦值是1,而其他任何角度的余弦值都小于等于1,并且其最小值是-1。从而可以通过两个向量之间角度的余弦值确定两个向量是否大致指向相同的方向。
两个向量有相同的方向时,余弦相似度的值为1;两个向量夹角为90°时,余弦相似度的值为0;两个向量指向完全相反时,余弦相似度的值为-1。余弦相似度的结果与向量的长度无关,仅与向量的指向方向有关。余弦相似度通常用于正空间,因此给出的值为-1到1之间。需要说明的是,上下边界对任何维度的向量空间都适用,而余弦相似度最常用于高维正空间。例如,在信息检索中,每个词项被赋予不同的维度,而一个维度由一个向量表示,其各个维度上的值对应于该词项在文档中出现的频率。余弦相似度可以给出两篇文档在其主题方面的相似度。
余弦相似度的计算方法表示如下:
Figure BDA0002401675390000101
在步骤303中,将所述特征向量输入至所述推荐技战法模型进行连环技战法分析输出得到案件线索。
将上述步骤得到的特征向量输入推荐技战法模型中,进行连环技战法分析,在每一环节的分析中得到涉案视图信息,最终输出案件线索。下面将对所述模型内部的流程进行详细的阐述。
图6示出了本申请实施例一种基于技战法模型的案件线索获取方法中连环技战法分析流程示意图。
在步骤601中,根据所述特征向量对新案件赋予相应的案件标签。
通过对特征向量的分析,可以得到案件类型、作案手段、案件特点、进一步标识案件的案件标签,所述案件标签可以用于快速匹配技战法。
对于同一案件类型,通过具体分析作案手段、案件特点来标识案件标签。在案件侦办的拆解过程中,分析每类案件的案件特点,所述案件特点包括:案件多发时间、作案交通工具、侵害人目标情况、外地车作案、尾随作案、作案后隐匿、假套牌车作案、踩点作案、团伙作案、流窜作案等。下面将以盗窃类案件为例说明其案件标签的获取过程。
表2示出了案件类型为盗窃、作案手段、案件特点、案件标签的对应关系。
办案人员通过确定作案手段,对案件特点进行分析,然后将分析结果与案件特点字典库(下表第三列)内的已有特点进行匹配,再根据大量实际案件进行训练修正,可以得到对应于案件类型、作案手段的通用案件标签(下表第四列),具体表示如下:
Figure BDA0002401675390000102
Figure BDA0002401675390000111
Figure BDA0002401675390000121
表2
在步骤602中,基于所述案件标签,在所述新案件的在前侦办阶段计算输出在前涉案视图信息。
案件在侦破过程中包括多个侦办阶段,在不同的侦办阶段根据不同的案件标签和涉案视图信息可以选择不同的技战法。
通常所述侦办阶段包括:视频排查阶段、线索研判-视频网阶段、线索研判-公安网阶段。
通常案件标签包括:模糊搜索、精准搜索、人脸、身份核实,身份标签,确认身份、轨迹、车辆异常行为、车辆核实、尾随、流窜、犯罪惯性、团伙、关系确认、落脚点、敏感时间、夜间、异常行为等。
通常技战法包括:模糊特征碰撞、精准追踪(轨迹分析)、遮挡面部检测、身份鉴别、智能检索、同行分析、图谱分析、落脚点分析、敏感时间出没、昼伏夜出等,其中:
遮挡面部检测,主要用于夜间查询驾驶人员故意遮挡面部、或面部不清晰等异常行为,适用于追捕肇事逃逸、或有预谋作案后通过遮挡面部逃避稽查的嫌疑人。
身份鉴别,适用于已获取人脸图片,与目标数据库比对,快速确认身份。
智能检索,适用于已知嫌疑车辆/人脸/行人等特征信息,可检索相关嫌疑目标。
模糊特征碰撞,主要针对流窜作案,查找不同地域、不同时间均出现的伪装犯罪嫌疑人。
精准追踪(轨迹分析),适用于通过人脸抓拍、卡口过车、视频监控数据,结合人脸聚类算法,分析嫌疑目标轨迹,并发现其人脸、定位,以便找出更多线索。
同行分析,主要针对尾随犯罪、或同伙犯罪,适用于查找犯罪嫌疑人、或同伙。
图谱分析,适用于进一步确认嫌疑目标的身份,全面展示嫌疑目标、车辆及关系网信息等。
落脚点分析,适用于在一段时间内,根据所经点位、行进线路、落脚时长等条件分析嫌疑目标落脚点,快速锁定其落脚点,进行抓捕活动。
敏感时间出没,适用于针对嫌疑目标作案时间异常,一般为非正常时段出没,运用人脸抓拍、卡口过车、WiFi接入记录、视频监控数据,找出在敏感时间段出现的人员。
昼伏夜出,适用于针对嫌疑人目标作案特点,运用人脸抓拍、卡口过车、视频监控数据,定位夜晚作案白天隐匿的嫌疑车辆、人脸。
表3示出了技战法匹配的业务场景、案件标签和案件侦办阶段。
Figure BDA0002401675390000131
Figure BDA0002401675390000141
表3
通过LDA主题模型进行分析,同时结合对应的案件标签、侦办阶段选择相应的技战法。在不同的案件侦办阶段,系统根据上述表格的对应关系,智能推荐适用的技战法。
在每一环节、每一侦办阶段输出涉案视图信息,在本实施例中,案件的在前侦办阶段产生的涉案视图信息称为在前涉案视图信息;所述在前涉案视图信息可作为案件的下一个侦办阶段的输入信息,从而为在后侦办阶段选择技战法提供数据支持,便于再次研判技战法和获取案件线索,实现环环相扣的连环技战法分析。其有益效果在于可以提高技战法的用户粘度和使用率,实现案件线索的快速排查。
在步骤603中,基于所述在前涉案视图信息,在所述新案件的在后侦办阶段根据所述案件标签选择匹配的技战法,再次进行计算输出在后涉案视图信息,直至得到案件线索。
使用在前涉案视图信息在接下来的侦办阶段中进行研判,结合案件标签以及所在侦办阶段选择当匹配的技战法,再次输出涉案视图信息,也称为在后涉案视图信息,重复这个过程进行迭代研判选择技战法,直至得到案件线索。
在一些实施例中,以案件类型为盗窃的案件进行说明。其具体的作案手段为盗窃车内财物,此类案件具有的案件特点为:案件多发时间不固定、无固定作案交通工具、侵害目标为车辆、外地车作案、尾随作案、作案后不隐匿、不使用假套牌车作案、踩点作案和团伙作案。对应的,其通用作案标签为:模糊搜索、异常行为、犯罪惯性、团伙作案及流窜性。
首先,在视频排查阶段,根据模糊搜索案件标签匹配智能检索技战法,通过已知嫌疑车辆/人脸/行人等特征信息,计算得到相关嫌疑目标,该环节保障在后侦办阶段会出现所述相关嫌疑目标;
然后,根据犯罪惯性、模糊搜索、流窜性等案件标签匹配模糊特征碰撞技战法,根据上述步骤得到的嫌疑目标特征信息排查出在不同时间地点均出现的伪装人员;然后对所述伪装人员使用精准追踪技战法,发现其清晰人脸,并将案件推送至公安网进行线索研判;
最后,根据尾随案件标签、以及上述涉案视图信息的人脸,进一步匹配同行分析技战法,可以寻找其他嫌疑人的涉案视图信息;然后根据所述其他嫌疑人涉案视图信息,进一步匹配图谱分析技战法,得到嫌疑人的关系网,最终确认嫌疑目标身份,全面展示嫌疑目标、车辆及关系网信息,成功获取案件线索。其有益效果在于,通过应用技战法模型进行技战法连环分析,可以快速、合理、高效的锁定犯罪团伙。
在一些实施例中,案件线索可以为人脸图像,行人图像,车辆图像中的一种或几种组合。所述推荐技战法模型可以通过神经网络模型训练获取。例如,采用基于人工智能、深度学习的样本训练方法,结合实战修正,固化连环技战法分析得到连环技战法专题模型。在一些实施例中,可以使用深度学习中的监督学习训练方法,在上述案件自动分析的基础上,采用实际案例形成海量训练样本,同时通过大数据技术及民警辅助修正,实现迭代训练和模型的自学习优化,达到最终优化模型的目的。例如以连续盗窃车内财物案专题模型为例,训练样本可以采用某地公安分局2017年至今的所有案件。
本申请还提供一种基于技战法模型的案件线索获取装置,包括:案件录入模块、信息分析模块和智能技战法模块,如图7所示。其中,案件录入模块,用于录入新案件的基本信息;信息分析模块,用于对所述基本信息进行特征工程分析得到所述新案件的特征向量;智能技战法模块,用于通过计算所述特征向量和语料库中历史案件文档的余弦相似度,得到与所述新案件相似度最高的历史案件对应的推荐技战法模型;将所述特征向量输入至所述推荐技战法模型进行连环技战法分析输出得到案件线索。
在一些实施例中,本申请所述基于技战法模型的案件线索获取装置还包括一些通用模块,例如权限控制,操作日志,系统维护,网络配置,信息安全和数据存储等模块。
本申请的有益效果在于,通过将案件的基本信息转换为计算机可读的特征向量,可以提高视频侦查业务的信息化与自动化;进一步通过比对新案件与历史案件的相似度得到推荐技战法模型,可以使得经验不足的办案人员也能够正确的选择最佳技战法;进一步通过连环技战法分析得到案件线索,可以实现技战法模型自动排查获取案件线索,实现节省警力、提高办案效率的有益效果。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为″数据块"、″模块"、″引擎"、″单元"、″组件"或″系统"。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内合有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN)、或连接至外部计算机(例如通过因特网)、或在云计算环境中、或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外,对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是,如果本申请附属材料中的描述、定义、和/或术语的使用与本申请所述内容有不一致或冲突的地方,以本申请的描述、定义和/或术语的使用为准。

Claims (9)

1.一种基于技战法模型的案件线索获取方法,其特征在于,包括以下步骤:
对新案件录入的基本信息进行特征工程分析得到所述新案件的特征向量;
通过计算所述特征向量和语料库中历史案件文档的余弦相似度,得到与所述新案件相似度最高的历史案件对应的推荐技战法模型;
将所述特征向量输入所述推荐技战法模型进行连环技战法分析得到案件线索。
2.如权利要求1所述的基于技战法模型的案件线索获取方法,其特征在于,所述基本信息为案件类型,案件特点,案发时间,案发地点,案件详情中的一种或几种组合。
3.如权利要求1所述的基于技战法模型的案件线索获取方法,其特征在于,所述特征工程分析,具体包括:
将所述基本信息的文本字序列进行分词预处理得到文本词序列;
对所述文本词序列进行特征工程分析得到计算机可读的特征向量。
4.如权利要求1所述的基于技战法模型的案件线索获取方法,其特征在于,所述语料库,具体包括:原始案件语料库以及公安专有词库。
5.如权利要求1所述的基于技战法模型的案件线索获取方法,其特征在于,所述连环技战法分析,具体包括:
根据所述特征向量对新案件赋予相应的案件标签;
基于所述案件标签,在所述新案件的在前侦办阶段计算输出在前涉案视图信息;
基于所述在前涉案视图信息,在所述新案件的在后侦办阶段,根据所述案件标签选择匹配的技战法,再次进行计算输出在后涉案视图信息,直至得到案件线索。
6.如权利要求1所述的基于技战法模型的案件线索获取方法,其特征在于,所述案件线索为人脸图像,行人图像,车辆图像中的一种或几种组合。
7.如权利要求1所述的基于技战法模型的案件线索获取方法,其特征在于,所述推荐技战法模型通过神经网络模型训练获取。
8.如权利要求7所述的基于技战法模型的案件线索获取方法,其特征在于,所述推荐技战法模型通过大数据技术及民警辅助修正实现迭代训练和模型的自学习优化。
9.一种基于技战法模型的案件线索获取装置,其特征在于,包括:
案件录入模块,用于录入新案件的基本信息;
信息分析模块,用于对所述基本信息进行特征工程分析得到所述新案件的特征向量;
智能技战法模块,用于通过计算所述特征向量和语料库中历史案件文档的余弦相似度,得到与所述新案件相似度最高的历史案件对应的推荐技战法模型;
将所述特征向量输入所述推荐技战法模型进行连环技战法分析得到案件线索。
CN202010148692.XA 2020-03-05 2020-03-05 一种基于技战法模型的案件线索获取方法及装置 Pending CN111369417A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010148692.XA CN111369417A (zh) 2020-03-05 2020-03-05 一种基于技战法模型的案件线索获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010148692.XA CN111369417A (zh) 2020-03-05 2020-03-05 一种基于技战法模型的案件线索获取方法及装置

Publications (1)

Publication Number Publication Date
CN111369417A true CN111369417A (zh) 2020-07-03

Family

ID=71210377

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010148692.XA Pending CN111369417A (zh) 2020-03-05 2020-03-05 一种基于技战法模型的案件线索获取方法及装置

Country Status (1)

Country Link
CN (1) CN111369417A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112256788A (zh) * 2020-10-09 2021-01-22 珠海市新德汇信息技术有限公司 侦查智慧脑图方法
CN113420045A (zh) * 2021-07-21 2021-09-21 中睿信数字技术有限公司 一种基于交互式分析的技战法模型构建方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923549A (zh) * 2009-07-29 2010-12-22 北京航天理想科技有限公司 自定义可视化智能轨迹线索分析系统及建立方法
CN104572615A (zh) * 2014-12-19 2015-04-29 深圳中创华安科技有限公司 案件在线侦查处理方法及其系统
CN107967348A (zh) * 2017-12-13 2018-04-27 武汉烽火众智数字技术有限责任公司 基于多网数据融合应用提高视频侦查效率的系统及其方法
CN108052882A (zh) * 2017-11-30 2018-05-18 广东云储物联视界科技有限公司 一种智能安防监控系统的操作方法
CN109325176A (zh) * 2018-08-29 2019-02-12 武汉市星盟科技有限公司 一种基于合成作战平台的战法智能推荐系统
US20190155940A1 (en) * 2017-11-17 2019-05-23 Accenture Global Solutions Limited Real-time prediction and explanation of sequences of abnormal events
CN110176311A (zh) * 2019-05-17 2019-08-27 北京印刷学院 一种基于对抗神经网络的自动医疗方案推荐方法和系统
CN110489611A (zh) * 2019-08-23 2019-11-22 杭州安恒信息技术股份有限公司 一种智能的线索分析方法及系统
CN110619064A (zh) * 2019-08-29 2019-12-27 苏州千视通视觉科技股份有限公司 一种基于深度学习的案件研判方法及装置
CN110674238A (zh) * 2019-09-26 2020-01-10 四川科瑞软件有限责任公司 一种基于大数据的禁毒情报研判系统
CN110716957A (zh) * 2019-09-23 2020-01-21 珠海市新德汇信息技术有限公司 类案可疑对象智能挖掘分析方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923549A (zh) * 2009-07-29 2010-12-22 北京航天理想科技有限公司 自定义可视化智能轨迹线索分析系统及建立方法
CN104572615A (zh) * 2014-12-19 2015-04-29 深圳中创华安科技有限公司 案件在线侦查处理方法及其系统
US20190155940A1 (en) * 2017-11-17 2019-05-23 Accenture Global Solutions Limited Real-time prediction and explanation of sequences of abnormal events
CN108052882A (zh) * 2017-11-30 2018-05-18 广东云储物联视界科技有限公司 一种智能安防监控系统的操作方法
CN107967348A (zh) * 2017-12-13 2018-04-27 武汉烽火众智数字技术有限责任公司 基于多网数据融合应用提高视频侦查效率的系统及其方法
CN109325176A (zh) * 2018-08-29 2019-02-12 武汉市星盟科技有限公司 一种基于合成作战平台的战法智能推荐系统
CN110176311A (zh) * 2019-05-17 2019-08-27 北京印刷学院 一种基于对抗神经网络的自动医疗方案推荐方法和系统
CN110489611A (zh) * 2019-08-23 2019-11-22 杭州安恒信息技术股份有限公司 一种智能的线索分析方法及系统
CN110619064A (zh) * 2019-08-29 2019-12-27 苏州千视通视觉科技股份有限公司 一种基于深度学习的案件研判方法及装置
CN110716957A (zh) * 2019-09-23 2020-01-21 珠海市新德汇信息技术有限公司 类案可疑对象智能挖掘分析方法
CN110674238A (zh) * 2019-09-26 2020-01-10 四川科瑞软件有限责任公司 一种基于大数据的禁毒情报研判系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙茂松 等: "自然语言处理研究前沿", 上海交通大学出版社, pages: 81 - 84 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112256788A (zh) * 2020-10-09 2021-01-22 珠海市新德汇信息技术有限公司 侦查智慧脑图方法
CN112256788B (zh) * 2020-10-09 2024-04-19 珠海市新德汇信息技术有限公司 侦查智慧脑图方法
CN113420045A (zh) * 2021-07-21 2021-09-21 中睿信数字技术有限公司 一种基于交互式分析的技战法模型构建方法及系统
CN113420045B (zh) * 2021-07-21 2022-02-18 中睿信数字技术有限公司 一种基于交互式分析的技战法模型构建方法及系统

Similar Documents

Publication Publication Date Title
Chen et al. A survey on an emerging area: Deep learning for smart city data
Safat et al. Empirical analysis for crime prediction and forecasting using machine learning and deep learning techniques
CN110020770A (zh) 基于人工智能的风险和知识管理
CN111259112B (zh) 医疗事实的验证方法和装置
CN114550053A (zh) 一种交通事故定责方法、装置、计算机设备及存储介质
EP3929800A1 (en) Skill word evaluation method and device, electronic device, and computer readable medium
CN111369417A (zh) 一种基于技战法模型的案件线索获取方法及装置
Le et al. Deep learning approach for receipt recognition
Cheng et al. Spatial-temporal recurrent neural network for anomalous trajectories detection
CN117036843A (zh) 目标检测模型训练方法、目标检测方法和装置
Cheng et al. An Image‐Based Deep Learning Approach with Improved DETR for Power Line Insulator Defect Detection
CN115034315A (zh) 基于人工智能的业务处理方法、装置、计算机设备及介质
CN117236826A (zh) 物流托盘的码放识别方法、装置、设备及存储介质
CN111898528A (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN115982388A (zh) 案件质控图谱建立、案件文书质检方法、设备及存储介质
Xu et al. Detection of ship targets in photoelectric images based on an improved recurrent attention convolutional neural network
Rai et al. Vehicle theft identification using machine learning and OCR
Anekar et al. Automated gate system using number plate recognition (NPR)
CN111695117B (zh) 一种webshell脚本检测方法及装置
Khurat et al. An open-source based automatic car detection system using iot
CN113822684A (zh) 黑产用户识别模型训练方法、装置、电子设备及存储介质
Astawa et al. Convolutional Neural Network Method Implementation for License Plate Recognition in Android
Rajasekar et al. Automatic Number Plate Recognition Using Convolution Neural Network
Shin et al. Towards a deep learning powered query engine for urban planning
CN117953313B (zh) 基于人工智能实现矿山数据的异常识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination