CN104346355A - 系列性公安案件的智能检索方法及其系统 - Google Patents

系列性公安案件的智能检索方法及其系统 Download PDF

Info

Publication number
CN104346355A
CN104346355A CN201310322686.1A CN201310322686A CN104346355A CN 104346355 A CN104346355 A CN 104346355A CN 201310322686 A CN201310322686 A CN 201310322686A CN 104346355 A CN104346355 A CN 104346355A
Authority
CN
China
Prior art keywords
case
public security
information
history
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310322686.1A
Other languages
English (en)
Other versions
CN104346355B (zh
Inventor
梅峰
汪洋
常爱平
曹志勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing ZNV Software Co Ltd
Original Assignee
Nanjing ZNV Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing ZNV Software Co Ltd filed Critical Nanjing ZNV Software Co Ltd
Priority to CN201310322686.1A priority Critical patent/CN104346355B/zh
Publication of CN104346355A publication Critical patent/CN104346355A/zh
Application granted granted Critical
Publication of CN104346355B publication Critical patent/CN104346355B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Abstract

本发明公开了一种系列性公安案件的智能检索方法及其系统,所述方法包括:获取案件检索信息,并对案件检索信息分别进行特征提取以形成案件特征多维向量组;计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息。采用本发明可以快速的执行系列性案件的串并案分析,提高了效率,从而可以为公安机关或侦查人员快速侦破案件提供帮助。

Description

系列性公安案件的智能检索方法及其系统
技术领域
本发明涉及公安案件检索技术领域,具体而言,涉及一种系列性公安案件的智能检索方法及其系统。
背景技术
系列性案件是指同一个犯罪主体连续多次作案的案件,从近些年来的犯罪统计来看,系列性案件在整个公安案件中所占的比例呈逐年上升的态势,其社会危害性也越来越严重。
一般而言,系列性案件的发展具有一定的规律性,特别是系列性案件越发展到后期,其案件的性质则越加严重,其案犯作案手段越加残忍,其作案人员的反侦查意识也越强,从而导致其犯罪危害性也相应的加大。因此,如若公安机关或其他侦查机关能够在系列性案件发生的早期就能将该案件予以侦破,无疑其对社会的和谐稳定所做出的贡献是巨大的。
对于系列性案件的侦查工作,一个重要的侦查手段是案件的串并案分析,所谓串并案分析是指通过对案件的作案手段、痕迹、物证等进行分析,将存在联系的案件放在一起侦破的侦查方法。通过串并案分析可以获取犯罪主体的大量信息,对系列性案件的侦破起到极大的作用。
传统方法中通常需要侦查人员通过手动的方式,从以往案件的数据库中进行人工串并案分析,然而,由于当前犯罪案件的数量不断增加,公安信息系统里存储的案件数据日趋庞大,除此之外,一些无效的冗余数据也不断增加,侦查人员要想从庞杂的公安案件数据库中通过人工的方式查找到跟查找的案件有关的案件的困难程度也在不断增加,其查找效率无疑也是十分低下的,基于该传统的串并案分析方法,往往会导致最终的串并案分析不够全面、且在及时性方面不够及时,例如应串并案件未能串并或及时串并,从而贻误最佳的案件侦破时机,严重时还会致使该系列性案件的犯罪主体继续逍遥法外,制造更多的犯罪,从而破坏社会的和谐稳定。
发明内容
为了解决现有技术中系列性案件进行串并案分析时需要侦查人员手动地从海量的历史公安案件中进行查找,导致费时费力并且效率低下的问题,本发明实施例的目的在于提供一种系列性公安案件的智能检索方法及其系统。
为了达到本发明的目的,本发明实施例采用以下技术方案实现:
本发明实施例提供的一种系列性公安案件的智能检索方法,其包括:
获取案件检索信息,并对案件检索信息分别进行特征提取以形成案件特征多维向量组;
计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息。
优选地,所述案件检索信息包括案发时间信息、案发地点信息、案件类型信息或案件描述信息中的一种或多种。
进一步优选地,对案件检索信息分别进行特征提取的方法为:
将案件检索信息的案发时间信息、案发地点信息以及案件类型信息直接表述为案发时间向量、案发地点向量及案件类型向量;对案件检索信息的案件描述信息进行特征提取,形成案件描述特征向量组。
进一步优选地,对案件检索信息的案件描述信息进行特征提取形成案件描述特征向量组的步骤包括:
对案件描述信息进行预处理,以去除无用描述因子;
依次采用以下数学式计算经预处理后的案件描述信息j中的第i个描述因子ki的权值Wi,j
W i , j = freq i , j max l freq l , j * log N n i ,
其中,l=1,2,…,N;为描述因子ki的逆向文档频率IDF值;N为公安案件数据库中历史公安案件的总数目;ni为公安案件数据库中包含描述因子ki的案件数目;freqi,j为案件描述信息j中出现描述因子ki的次数;
依据计算的权值Wi,j得到案件描述特征向量组Din,其中所述案件描述特征向量组Din采用以下数学式表示:
Din=(W1,j,W2,j,…Wt,j)。
进一步优选地,在对案件检索信息的案件描述信息进行特征提取,形成案件描述特征向量组之后,还包括:
对案件描述特征向量组进行向量维度约减,得到约减后的案件描述特征向量组。
进一步优选地,计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息的方法为:
采取以下数学式计算该案件特征多维向量组与公安案件数据库中第j个历史公安案件的历史案件特征多维向量组之间的相关系数Rj,其中j=1,2,…N,N为公安案件数据库中历史公安案件的总数目:
R j = Σ 4 x i ;
其中,x1=Tin·Tn,Tin为案件特征多维向量组的案发时间向量,Tn为公安案件数据库中第n条历史公安案件信息的案发时间向量;
x2=Pin·Pn,Pin为案件特征多维向量组的案发地点向量,Pn为公安案件数据库中第n条历史公安案件信息的案发地点坐标向量;
x3=Kin·Kn,Kin为案件特征多维向量组的案件类型向量,Kn为公安案件数据库中第n条历史公安案件信息的案件类型向量;
x4=Din·Di,Din为案件特征多维向量组的经约减的案件描述特征向量组,Di为公安案件数据库中第n条历史公安案件信息的经约减的案件描述特征向量组;
当Rj>Rset时,则输出第j个历史公安案件,其中,所述Rset为预先设定的相关系数阈值。
优选地,在获取案件检索信息,并对案件检索信息分别进行特征提取以形成案件特征多维向量组之后,所述系列性公安案件的智能检索方法还包括:
将与所述案件检索信息相对应的案件特征多维向量组存储至公安案件数据库。
本发明实施例提供的一种系列性公安案件的智能检索系统,其包括:
输入单元,用于获取案件检索信息;
处理单元,用于对案件检索信息分别进行特征提取以形成案件特征多维向量组;以及进一步用于计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息;
公安案件数据库,用于存储历史公安案件的历史案件特征多维向量组;
显示单元,用于显示处理单元输出的历史公安案件信息。
优选地,所述案件检索信息包括案发时间信息、案发地点信息、案件类型信息或案件描述信息中的一种或多种。
优选地,所述处理单元包括:
特征提取单元,用于将案件检索信息的案发时间信息、案发地点信息以及案件类型信息直接表述为案发时间向量、案发地点向量及案件类型向量;以及进一步用于对案件检索信息的案件描述信息进行特征提取,以形成案件描述特征向量组;
组合单元,用于将案发时间向量、案发地点向量、案件类型向量以及案件描述特征向量组组合成案件特征多维向量组;
交互单元,用于与公安案件数据库进行数据交互;
计算单元,用于计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数;
输出单元,用于输出相关系数超出预先设定的相关系数阈值的历史公安案件信息。
优选地,所述处理单元还包括:
约减单元,用于将特征提取单元提取的案件描述特征向量组进行约减,并将约减后的案件描述特征向量组发送至组合单元。
本发明提供的系列性公安案件的智能检索方法和系统,通过对案件检索信息分别进行特征提取以形成案件特征多维向量组,然后计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,并输出相关系数超出预先设定的相关系数阈值的历史公安案件信息,可以快速的执行系列性案件的串并案分析,提高了效率,从而可以为公安机关或侦查人员快速侦破案件提供帮助。
附图说明
图1为本发明实施例提供的系列性公安案件的智能检索方法流程示意图;
图2为本发明实施例中对案件检索信息的案件描述信息进行特征提取形成案件描述特征向量组的流程示意图;
图3为本发明另一实施例提供的系列性公安案件的智能检索方法流程示意图;
图4为本发明实施例提供的系列性公安案件的智能检索系统结构示意图;
图5为本发明实施例提供的系列性公安案件的智能检索系统其处理单元的结构示意图。
本发明目的的实现、功能特点及优异效果,下面将结合具体实施例以及附图做进一步的说明。
具体实施方式
下面结合附图和具体实施例对本发明所述技术方案作进一步的详细描述,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
本发明的发明人发现,系列性案件通常都具有一个明显的特点:对于同一个犯罪主体来说,在其连续作案的多起案件中,其作案方法、手段往往会表现出相对的稳定性。本发明正式基于系列性案件这一特点,通过对案件的作案方法、手段等因素进行比较,从而可以快速的实现案件的串并案。
具体地,如图1所示,本发明实施例提供的一种系列性公安案件的智能检索方法,其包括如下步骤:
S10、获取案件检索信息,并对案件检索信息分别进行特征提取以形成案件特征多维向量组;
S20、计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息。
本实施例中,在所述步骤S10中,所述案件检索信息包括案发时间信息、案发地点信息、案件类型信息或案件描述信息中的一种或多种。
更为具体地,在本实施例中,所述的案发时间信息采用24小时计时法;所述的案发地点为基于GIS(Geographic Information System,地理信息系统)系统而获取的地理位置信息,通过点击GIS系统地图上任意一个位置,可以获取该目标位置的经纬度;所述的案件类型依据全国公安机关受理案件分类表进行分类,由符合规则的6位十进制数据编码而成,当然所述案件类型也可以依据其他国家或地区或者其他组织制定的案件分类规则而设置;所述的案件描述为文本描述信息,其为案件案情的详细文本描述,所述文本可以为外文也可以为汉语,除此之外,其也可以为其他可以被本领域技术人员所理解的代码串或符号串。
本实施例中,在所述步骤S10中,对案件检索信息分别进行特征提取的方法为:
将案件检索信息的案发时间信息、案发地点信息以及案件类型信息直接表述为案发时间向量、案发地点向量及案件类型向量;对案件检索信息的案件描述信息进行特征提取,形成案件描述特征向量组。
具体地,如图2所示,对案件检索信息的案件描述信息进行特征提取形成案件描述特征向量组的步骤包括:
S101、对案件描述信息进行预处理,以去除无用描述因子,例如当案件描述信息为文本信息时,去除该案件描述文本信息中的常用虚词和语气词等无用词;
S102、依次采用以下TF-IDF(term frequency–inverse documentfrequency,特征性频率-倒排文档频率加权法)数学式计算经预处理后的案件描述信息j中的第i个描述因子ki的权值Wi,j
W i , j = freq i , j max l freq l , j * log N n i ,
其中,l=1,2,…,N;为描述因子ki的逆向文档频率IDF值;N为公安案件数据库中历史公安案件的总数目;ni为公安案件数据库中包含描述因子ki的案件数目;freqi,j为案件描述信息j中出现描述因子ki的次数;
S103、依据计算的权值Wi,j得到案件描述特征向量组Din,其中所述案件描述特征向量组Din采用以下数学式表示:
Din=(W1,j,W2,j,…Wt,j)。
进一步优选地,在执行所述步骤S103对案件检索信息的案件描述信息进行特征提取,形成案件描述特征向量组之后,还包括:
S104、对案件描述特征向量组进行向量维度约减,得到约减后的案件描述特征向量组。
具体地,本实施例中,采用逐步回归法对案件描述特征向量组进行向量维度约减,其具体步骤包括:
步骤1、将案件检索信息的案件描述特征向量组Din′表示为1个n维的向量组(W1,j,W2,j,…Wt,j),并构建出案件描述特征向量组的回归模型,如下:
Din′=β1y12y2+…+βnyn
其中,y1,y2…yn为构建的n个变量,β1,β2…βn分别对应为变量y1,y2…yn的权值系数;
步骤2、选取第i个变量,i=0,计算各自变量的偏回归平方和:
其中,j=1,2,…,n;
步骤3、进行变量入选判断,如存在则变量yk1入选,此时则进行下一步骤,否则,i=i+1,并返回步骤2;
步骤4、进行统计量判断,采用以下数学式计算变量yk1的统计量F(k1):
其中为预先设置的判断阈值,则变量yk1入选回归方程,否则,则将变量yk1剔除掉,此时,i=i+1,并返回步骤2;
步骤5、当没有变量可以选择时,得到约减后的案件的回归方程Din及l维向量组(W1,j,W2,j,…Wl,j):
D in = β k 1 ( 1 ) y k 1 + . . . + β kl ( l ) y kl = ( W 1 , j , W 2 , j , . . . W l , j ) ;
其中yk1,yk2…ykn为构建的n个变量,分别对应为变量yk1,yk2…ykn的权值系数。
本实施例中,在所述步骤S20中,计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息的方法为:
采取以下数学式计算该案件特征多维向量组与公安案件数据库中第j个历史公安案件的历史案件特征多维向量组之间的相关系数Rj,其中j=1,2,…N,N为公安案件数据库中历史公安案件的总数目:
R j = Σ 4 x i ;
其中,x1=Tin·Tn,Tin为案件特征多维向量组的案发时间向量,Tn为公安案件数据库中第n条历史公安案件信息的案发时间向量;
x2=Pin·Pn,Pin为案件特征多维向量组的案发地点向量,Pn为公安案件数据库中第n条历史公安案件信息的案发地点坐标向量;
x3=Kin·Kn,Kin为案件特征多维向量组的案件类型向量,Kn为公安案件数据库中第n条历史公安案件信息的案件类型向量;
x4=Din·Di,Din为案件特征多维向量组的经约减的案件描述特征向量组,Di为公安案件数据库中第n条历史公安案件信息的经约减的案件描述特征向量组;
当Rj>Rset时,则输出第j个历史公安案件,其中,所述Rset为预先设定的相关系数阈值。
1、具体地,根据所述案发时间向量得到案发时间计算因子x1的运算方式如下:
设Tin为输入案件检索信息中的案发时间向量,Tn为数据库中第n条案件信息的案发时间向量,其运算方式如下:
x 1 = T in · T n = 1 | T in - T n | + 1 ;
其中,本实施例中|Tin-Tn|以天为单位。
2、根据所述案发地点向量得到案发地点计算因子x2的运算方式如下:
x 2 = P in · P n = 1 ( x - x n ) 2 + ( y - y n ) 2 + 1 ;
其中,Pin(x,y)为输入案件检索信息中的案发地点坐标,其中x,y为其经纬度数据,Pn(xn,yn)为数据库中第n条案件信息的案发地点坐标。
3、根据所述案件类型向量得到案件类型计算因子x3的运算方式如下:
设Kin为输入案件检索信息中的案件类型,其为6位十进制数据,由高到低位记为AABBCC,Kn为数据库中第n条案件信息的案件类型数据,记为aabbcc,其运算方式如下:
x 3 = K in · K n = 1 α | AA - aa | + β | BB - bb | + γ | CC - cc | + 1 ;
其中,α、β、γ为常数。
假设部分案件类型如下表所示:
一级案件类型 二级案件类型 三级案件类型
刑事案件10 杀人1001 入室杀人100101
刑事案件10 杀人1001 盗窃杀人100102
刑事案件10 诈骗1002 假药诈骗100201
刑事案件10 诈骗1002 征婚诈骗100202
如用户输入的案发类型为入室杀人(100101),数据库中一个公安案件案发为盗窃杀人(100102), 取α、β、γ分别为0.5、0.3、0.2,则得到的案发地点向量运算结果x3为0.83。
4、根据所述案件描述特征向量组得到案件类型计算因子x4的运算方式如下:
x 4 = D in · D i = cos ( θ ) = Σ j = 1 l W j · W j , i Σ j = 1 l W j · W j Σ j = 1 l W j , i · W j , i ;
其中,Din=(W1,W2,…Wl)为约减后的l维案件描述特征向量组,Di=(W1,i,W2,i,…Wt,i)为数据库中第i条案件信息的案件描述数据, i=1,2,…N,N为数据库案件的总数目。
优选地,本实施例中,如图3所示,在执行步骤S10之后,即在获取案件检索信息,并对案件检索信息分别进行特征提取以形成案件特征多维向量组之后,所述系列性公安案件的智能检索方法还包括:
S11、将与所述案件检索信息相对应的案件特征多维向量组存储至公安案件数据库。
如图4所示,本发明实施例提供的一种系列性公安案件的智能检索系统,其包括:
输入单元10,用于获取案件检索信息;
处理单元20,用于对案件检索信息分别进行特征提取以形成案件特征多维向量组;以及进一步用于计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息;
公安案件数据库30,用于存储历史公安案件的历史案件特征多维向量组;
显示单元40,用于显示处理单元20输出的历史公安案件信息。
本实施例中,所述案件检索信息包括案发时间信息、案发地点信息、案件类型信息或案件描述信息中的一种或多种。其中,所述的案发时间信息采用24小时计时法;所述的案发地点为基于GIS(GeographicInformation System,地理信息系统)系统而获取的地理位置信息,通过点击GIS系统地图上任意一个位置,可以获取该目标位置的经纬度;所述的案件类型依据全国公安机关受理案件分类表进行分类,由符合规则的6位十进制数据编码而成,当然所述案件类型也可以依据其他国家或地区或者其他组织制定的案件分类规则而设置;所述的案件描述为文本描述信息,其为案件案情的详细文本描述,所述文本可以为外文也可以为汉语,除此之外,其也可以为其他可以被本领域技术人员所理解的代码串或符号串。
本实施例中,如图5所示,所述处理单元包括:
特征提取单元201,用于将案件检索信息的案发时间信息、案发地点信息以及案件类型信息直接表述为案发时间向量、案发地点向量及案件类型向量;以及进一步用于对案件检索信息的案件描述信息进行特征提取,以形成案件描述特征向量组;
组合单元203,用于将案发时间向量、案发地点向量、案件类型向量以及案件描述特征向量组组合成案件特征多维向量组;
交互单元204,用于与公安案件数据库进行数据交互;
计算单元205,用于计算该案件特征多维向量组与公安案件数据库30中每个历史公安案件的历史案件特征多维向量组之间的相关系数;
输出单元206,用于输出相关系数超出预先设定的相关系数阈值的历史公安案件信息。
优选实施方式中,所述处理单元还包括:
约减单元202,用于将特征提取单元201提取的案件描述特征向量组进行约减,并将约减后的案件描述特征向量组发送至组合单元。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (11)

1.一种系列性公安案件的智能检索方法,其特征在于,包括:
获取案件检索信息,并对案件检索信息分别进行特征提取以形成案件特征多维向量组;
计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息。
2.如权利要求1所述的系列性公安案件的智能检索方法,其特征在于,所述案件检索信息包括案发时间信息、案发地点信息、案件类型信息或案件描述信息中的一种或多种。
3.如权利要求2所述的系列性公安案件的智能检索方法,其特征在于,对案件检索信息分别进行特征提取的方法为:
将案件检索信息的案发时间信息、案发地点信息以及案件类型信息直接表述为案发时间向量、案发地点向量及案件类型向量;对案件检索信息的案件描述信息进行特征提取,形成案件描述特征向量组。
4.如权利要求3所述的系列性公安案件的智能检索方法,其特征在于,对案件检索信息的案件描述信息进行特征提取形成案件描述特征向量组的步骤包括:
对案件描述信息进行预处理,以去除无用描述因子;
依次采用以下数学式计算经预处理后的案件描述信息j中的第i个描述因子ki的权值Wi,j
W i , j = freq i , j max l freq l , j * log N n i ,
其中,l=1,2,…,N;为描述因子ki的逆向文档频率IDF值;N为公安案件数据库中历史公安案件的总数目;ni为公安案件数据库中包含描述因子ki的案件数目;freqi,j为案件描述信息j中出现描述因子ki的次数;
依据计算的权值Wi,j得到案件描述特征向量组Din,其中所述案件描述特征向量组Din采用以下数学式表示:
Din=(W1,j,W2,j,…Wt,j)。
5.如权利要求3或4所述的系列性公安案件的智能检索方法,其特征在于,在对案件检索信息的案件描述信息进行特征提取,形成案件描述特征向量组之后,还包括:
对案件描述特征向量组进行向量维度约减,得到约减后的案件描述特征向量组。
6.如权利要求5所述的系列性公安案件的智能检索方法,其特征在于,计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息的方法为:
采取以下数学式计算该案件特征多维向量组与公安案件数据库中第j个历史公安案件的历史案件特征多维向量组之间的相关系数Rj,其中j=1,2,…N,N为公安案件数据库中历史公安案件的总数目:
R j = Σ 4 x i ;
其中,x1=Tin·Tn,Tin为案件特征多维向量组的案发时间向量,Tn为公安案件数据库中第n条历史公安案件信息的案发时间向量;
x2=Pin·Pn,Pin为案件特征多维向量组的案发地点向量,Pn为公安案件数据库中第n条历史公安案件信息的案发地点坐标向量;
x3=Kin·Kn,Kin为案件特征多维向量组的案件类型向量,Kn为公安案件数据库中第n条历史公安案件信息的案件类型向量;
x4=Din·Di,Din为案件特征多维向量组的经约减的案件描述特征向量组,Di为公安案件数据库中第n条历史公安案件信息的经约减的案件描述特征向量组;
当Rj>Rset时,则输出第j个历史公安案件,其中,所述Rset为预先设定的相关系数阈值。
7.如权利要求1所述的系列性公安案件的智能检索方法,其特征在于,在获取案件检索信息,并对案件检索信息分别进行特征提取以形成案件特征多维向量组之后,所述方法还包括:
将与所述案件检索信息相对应的案件特征多维向量组存储至公安案件数据库。
8.一种系列性公安案件的智能检索系统,其特征在于,包括:
输入单元,用于获取案件检索信息;
处理单元,用于对案件检索信息分别进行特征提取以形成案件特征多维向量组;以及进一步用于计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息;
公安案件数据库,用于存储历史公安案件的历史案件特征多维向量组;
显示单元,用于显示处理单元输出的历史公安案件信息。
9.如权利要求8所述的系列性公安案件的智能检索系统,其特征在于,所述案件检索信息包括案发时间信息、案发地点信息、案件类型信息或案件描述信息中的一种或多种。
10.如权利要求8所述的系列性公安案件的智能检索系统,其特征在于,所述处理单元包括:
特征提取单元,用于将案件检索信息的案发时间信息、案发地点信息以及案件类型信息直接表述为案发时间向量、案发地点向量及案件类型向量;以及进一步用于对案件检索信息的案件描述信息进行特征提取,以形成案件描述特征向量组;
组合单元,用于将案发时间向量、案发地点向量、案件类型向量以及案件描述特征向量组组合成案件特征多维向量组;
交互单元,用于与公安案件数据库进行数据交互;
计算单元,用于计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数;
输出单元,用于输出相关系数超出预先设定的相关系数阈值的历史公安案件信息。
11.如权利要求10所述的系列性公安案件的智能检索系统,其特征在于,所述处理单元还包括:
约减单元,用于将特征提取单元提取的案件描述特征向量组进行约减,并约减后的案件描述特征向量组发送至组合单元。
CN201310322686.1A 2013-07-26 2013-07-26 系列性公安案件的智能检索方法及其系统 Active CN104346355B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310322686.1A CN104346355B (zh) 2013-07-26 2013-07-26 系列性公安案件的智能检索方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310322686.1A CN104346355B (zh) 2013-07-26 2013-07-26 系列性公安案件的智能检索方法及其系统

Publications (2)

Publication Number Publication Date
CN104346355A true CN104346355A (zh) 2015-02-11
CN104346355B CN104346355B (zh) 2019-03-08

Family

ID=52501980

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310322686.1A Active CN104346355B (zh) 2013-07-26 2013-07-26 系列性公安案件的智能检索方法及其系统

Country Status (1)

Country Link
CN (1) CN104346355B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127241A (zh) * 2016-06-17 2016-11-16 中国电子科技集团公司第二十八研究所 一种串并案分类方法及串并案分类系统
CN106294319A (zh) * 2016-08-04 2017-01-04 武汉数为科技有限公司 一种串并案识别方法
CN106778817A (zh) * 2016-11-25 2017-05-31 杭州中奥科技有限公司 一种事件的自动分类方法
CN107145895A (zh) * 2017-03-13 2017-09-08 东方网力科技股份有限公司 基于k‑means算法的公安犯罪类案研判方法
CN107342987A (zh) * 2017-06-20 2017-11-10 深圳安巽科技有限公司 一种网络反电信诈骗系统
CN109872259A (zh) * 2019-03-08 2019-06-11 南阳市烟草公司城区分公司 涉烟案件的分析方法、装置及电子设备
CN109947824A (zh) * 2019-03-21 2019-06-28 赖雪英 求孤数据应用处理系统及其方法
CN110019663A (zh) * 2017-09-30 2019-07-16 北京国双科技有限公司 一种案件信息的推送方法、系统、存储介质和处理器
CN110019374A (zh) * 2019-03-26 2019-07-16 杭州数梦工场科技有限公司 基于特征的数据项处理方法、装置、存储介质及计算机设备
CN111242237A (zh) * 2020-01-20 2020-06-05 北京明略软件系统有限公司 Bert模型训练、分类方法、系统、介质和计算机设备
CN111259951A (zh) * 2020-01-13 2020-06-09 北京明略软件系统有限公司 案件检测方法、装置、电子设备及可读存储介质
CN112925899A (zh) * 2021-02-09 2021-06-08 重庆中科云从科技有限公司 排序模型建立方法、案件线索推荐方法、装置及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101187927A (zh) * 2007-12-17 2008-05-28 电子科技大学 一种刑事案件的串并案智能分析方法
CN101655860A (zh) * 2009-09-16 2010-02-24 北京中盾安全技术开发公司 一种刑侦破案视频辅助分析方法及系统
CN102147816A (zh) * 2011-04-21 2011-08-10 中国电子信息产业集团有限公司第六研究所 一种案件统计及趋势分析系统
CN102591955A (zh) * 2011-12-29 2012-07-18 北京城市系统工程研究中心 网格化城市管理数据分析方法
CN102789482B (zh) * 2012-06-29 2014-12-17 安科智慧城市技术(中国)有限公司 一种利用口供识别嫌疑人的方法、系统及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101187927A (zh) * 2007-12-17 2008-05-28 电子科技大学 一种刑事案件的串并案智能分析方法
CN101187927B (zh) * 2007-12-17 2010-12-15 电子科技大学 一种刑事案件的串并案智能分析方法
CN101655860A (zh) * 2009-09-16 2010-02-24 北京中盾安全技术开发公司 一种刑侦破案视频辅助分析方法及系统
CN102147816A (zh) * 2011-04-21 2011-08-10 中国电子信息产业集团有限公司第六研究所 一种案件统计及趋势分析系统
CN102591955A (zh) * 2011-12-29 2012-07-18 北京城市系统工程研究中心 网格化城市管理数据分析方法
CN102789482B (zh) * 2012-06-29 2014-12-17 安科智慧城市技术(中国)有限公司 一种利用口供识别嫌疑人的方法、系统及电子设备

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127241A (zh) * 2016-06-17 2016-11-16 中国电子科技集团公司第二十八研究所 一种串并案分类方法及串并案分类系统
CN106294319A (zh) * 2016-08-04 2017-01-04 武汉数为科技有限公司 一种串并案识别方法
CN106778817A (zh) * 2016-11-25 2017-05-31 杭州中奥科技有限公司 一种事件的自动分类方法
CN107145895A (zh) * 2017-03-13 2017-09-08 东方网力科技股份有限公司 基于k‑means算法的公安犯罪类案研判方法
CN107342987A (zh) * 2017-06-20 2017-11-10 深圳安巽科技有限公司 一种网络反电信诈骗系统
CN110019663A (zh) * 2017-09-30 2019-07-16 北京国双科技有限公司 一种案件信息的推送方法、系统、存储介质和处理器
CN109872259A (zh) * 2019-03-08 2019-06-11 南阳市烟草公司城区分公司 涉烟案件的分析方法、装置及电子设备
CN109947824A (zh) * 2019-03-21 2019-06-28 赖雪英 求孤数据应用处理系统及其方法
CN110019374A (zh) * 2019-03-26 2019-07-16 杭州数梦工场科技有限公司 基于特征的数据项处理方法、装置、存储介质及计算机设备
CN111259951A (zh) * 2020-01-13 2020-06-09 北京明略软件系统有限公司 案件检测方法、装置、电子设备及可读存储介质
CN111242237A (zh) * 2020-01-20 2020-06-05 北京明略软件系统有限公司 Bert模型训练、分类方法、系统、介质和计算机设备
CN112925899A (zh) * 2021-02-09 2021-06-08 重庆中科云从科技有限公司 排序模型建立方法、案件线索推荐方法、装置及介质

Also Published As

Publication number Publication date
CN104346355B (zh) 2019-03-08

Similar Documents

Publication Publication Date Title
CN104346355A (zh) 系列性公安案件的智能检索方法及其系统
Paule et al. On fine-grained geolocalisation of tweets and real-time traffic incident detection
Su et al. Categorizing social vulnerability patterns in Chinese coastal cities
CN105468605B (zh) 一种实体信息图谱生成方法及装置
CN106126732A (zh) 基于兴趣相似模型的作者影响力传播能力预测方法
US20140195518A1 (en) System and Method for Data Mining Using Domain-Level Context
CN106407208A (zh) 一种城市管理本体知识库的构建方法及系统
Ignatov et al. Can triconcepts become triclusters?
CN111899089A (zh) 基于知识图谱的企业风险预警方法及系统
Bahrami et al. Twitter reveals: using twitter analytics to predict public protests
Wang et al. Crime risk analysis through big data algorithm with urban metrics
Grover et al. Prediction model for influenza epidemic based on Twitter data
CN103150383A (zh) 一种短文本数据的事件演化分析方法
Farooqi et al. Global progress in climate change and biodiversity conservation research
Ma et al. AK-Modes: A weighted clustering algorithm for finding similar case subsets
Tan et al. Bibliometric research on the development of climate change in the BRI regions
Luo et al. An analysis of the crucial indicators impacting the risk of terrorist attacks: A predictive perspective
CN103440308B (zh) 一种基于形式概念分析的数字论文检索方法
Ristoski et al. Analyzing Statistics with Background Knowledge from Linked Open Data.
Wang et al. Generalized RCINAR (p) process with signed thinning operator
CN104518930A (zh) 一种面向微博的异常用户和消息同时检测方法
Nagy et al. First results in modelling objective well-being in Hungary at lower territorial level
Andrei et al. Evolution of Romania’s Economic Structure and Environment Degradation–An Assessment Through LMDI Decomposition Approach
Corso et al. Big social data and GIS: visualize predictive crime
Kryszkiewicz* Generalized disjunction-free representation of frequent patterns with negation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant