CN104346355B - 系列性公安案件的智能检索方法及其系统 - Google Patents
系列性公安案件的智能检索方法及其系统 Download PDFInfo
- Publication number
- CN104346355B CN104346355B CN201310322686.1A CN201310322686A CN104346355B CN 104346355 B CN104346355 B CN 104346355B CN 201310322686 A CN201310322686 A CN 201310322686A CN 104346355 B CN104346355 B CN 104346355B
- Authority
- CN
- China
- Prior art keywords
- case
- public security
- information
- vector
- history
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000000605 extraction Methods 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims description 14
- 230000002123 temporal effect Effects 0.000 claims description 14
- 230000003993 interaction Effects 0.000 claims description 3
- 230000002452 interceptive effect Effects 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 7
- 210000000056 organ Anatomy 0.000 abstract description 6
- 241001269238 Data Species 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011835 investigation Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000003962 counterfeit drug Substances 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Human Resources & Organizations (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种系列性公安案件的智能检索方法及其系统,所述方法包括:获取案件检索信息,并对案件检索信息分别进行特征提取以形成案件特征多维向量组;计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息。采用本发明可以快速的执行系列性案件的串并案分析,提高了效率,从而可以为公安机关或侦查人员快速侦破案件提供帮助。
Description
技术领域
本发明涉及公安案件检索技术领域,具体而言,涉及一种系列性公安案件的智能检索方法及其系统。
背景技术
系列性案件是指同一个犯罪主体连续多次作案的案件,从近些年来的犯罪统计来看,系列性案件在整个公安案件中所占的比例呈逐年上升的态势,其社会危害性也越来越严重。
一般而言,系列性案件的发展具有一定的规律性,特别是系列性案件越发展到后期,其案件的性质则越加严重,其案犯作案手段越加残忍,其作案人员的反侦查意识也越强,从而导致其犯罪危害性也相应的加大。因此,如若公安机关或其他侦查机关能够在系列性案件发生的早期就能将该案件予以侦破,无疑其对社会的和谐稳定所做出的贡献是巨大的。
对于系列性案件的侦查工作,一个重要的侦查手段是案件的串并案分析,所谓串并案分析是指通过对案件的作案手段、痕迹、物证等进行分析,将存在联系的案件放在一起侦破的侦查方法。通过串并案分析可以获取犯罪主体的大量信息,对系列性案件的侦破起到极大的作用。
传统方法中通常需要侦查人员通过手动的方式,从以往案件的数据库中进行人工串并案分析,然而,由于当前犯罪案件的数量不断增加,公安信息系统里存储的案件数据日趋庞大,除此之外,一些无效的冗余数据也不断增加,侦查人员要想从庞杂的公安案件数据库中通过人工的方式查找到跟查找的案件有关的案件的困难程度也在不断增加,其查找效率无疑也是十分低下的,基于该传统的串并案分析方法,往往会导致最终的串并案分析不够全面、且在及时性方面不够及时,例如应串并案件未能串并或及时串并,从而贻误最佳的案件侦破时机,严重时还会致使该系列性案件的犯罪主体继续逍遥法外,制造更多的犯罪,从而破坏社会的和谐稳定。
发明内容
为了解决现有技术中系列性案件进行串并案分析时需要侦查人员手动地从海量的历史公安案件中进行查找,导致费时费力并且效率低下的问题,本发明实施例的目的在于提供一种系列性公安案件的智能检索方法及其系统。
为了达到本发明的目的,本发明实施例采用以下技术方案实现:
本发明实施例提供的一种系列性公安案件的智能检索方法,其包括:
获取案件检索信息,并对案件检索信息分别进行特征提取以形成案件特征多维向量组;
计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息。
优选地,所述案件检索信息包括案发时间信息、案发地点信息、案件类型信息或案件描述信息中的一种或多种。
进一步优选地,对案件检索信息分别进行特征提取的方法为:
将案件检索信息的案发时间信息、案发地点信息以及案件类型信息直接表述为案发时间向量、案发地点向量及案件类型向量;对案件检索信息的案件描述信息进行特征提取,形成案件描述特征向量组。
进一步优选地,对案件检索信息的案件描述信息进行特征提取形成案件描述特征向量组的步骤包括:
对案件描述信息进行预处理,以去除无用描述因子;
依次采用以下数学式计算经预处理后的案件描述信息j中的第i个描述因子ki的权值Wi,j:
其中,l=1,2,…,N;为描述因子ki的逆向文档频率IDF值;N为公安案件数据库中历史公安案件的总数目;ni为公安案件数据库中包含描述因子ki的案件数目;freqi,j为案件描述信息j中出现描述因子ki的次数;
依据计算的权值Wi,j得到案件描述特征向量组Din,其中所述案件描述特征向量组Din采用以下数学式表示:
Din=(W1,j,W2,j,…Wt,j)。
进一步优选地,在对案件检索信息的案件描述信息进行特征提取,形成案件描述特征向量组之后,还包括:
对案件描述特征向量组进行向量维度约减,得到约减后的案件描述特征向量组。
进一步优选地,计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息的方法为:
采取以下数学式计算该案件特征多维向量组与公安案件数据库中第j个历史公安案件的历史案件特征多维向量组之间的相关系数Rj,其中j=1,2,…N,N为公安案件数据库中历史公安案件的总数目:
其中,x1=Tin·Tn,Tin为案件特征多维向量组的案发时间向量,Tn为公安案件数据库中第n条历史公安案件信息的案发时间向量;
x2=Pin·Pn,Pin为案件特征多维向量组的案发地点向量,Pn为公安案件数据库中第n条历史公安案件信息的案发地点坐标向量;
x3=Kin·Kn,Kin为案件特征多维向量组的案件类型向量,Kn为公安案件数据库中第n条历史公安案件信息的案件类型向量;
x4=Din·Di,Din为案件特征多维向量组的经约减的案件描述特征向量组,Di为公安案件数据库中第n条历史公安案件信息的经约减的案件描述特征向量组;
当Rj>Rset时,则输出第j个历史公安案件,其中,所述Rset为预先设定的相关系数阈值。
优选地,在获取案件检索信息,并对案件检索信息分别进行特征提取以形成案件特征多维向量组之后,所述系列性公安案件的智能检索方法还包括:
将与所述案件检索信息相对应的案件特征多维向量组存储至公安案件数据库。
本发明实施例提供的一种系列性公安案件的智能检索系统,其包括:
输入单元,用于获取案件检索信息;
处理单元,用于对案件检索信息分别进行特征提取以形成案件特征多维向量组;以及进一步用于计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息;
公安案件数据库,用于存储历史公安案件的历史案件特征多维向量组;
显示单元,用于显示处理单元输出的历史公安案件信息。
优选地,所述案件检索信息包括案发时间信息、案发地点信息、案件类型信息或案件描述信息中的一种或多种。
优选地,所述处理单元包括:
特征提取单元,用于将案件检索信息的案发时间信息、案发地点信息以及案件类型信息直接表述为案发时间向量、案发地点向量及案件类型向量;以及进一步用于对案件检索信息的案件描述信息进行特征提取,以形成案件描述特征向量组;
组合单元,用于将案发时间向量、案发地点向量、案件类型向量以及案件描述特征向量组组合成案件特征多维向量组;
交互单元,用于与公安案件数据库进行数据交互;
计算单元,用于计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数;
输出单元,用于输出相关系数超出预先设定的相关系数阈值的历史公安案件信息。
优选地,所述处理单元还包括:
约减单元,用于将特征提取单元提取的案件描述特征向量组进行约减,并将约减后的案件描述特征向量组发送至组合单元。
本发明提供的系列性公安案件的智能检索方法和系统,通过对案件检索信息分别进行特征提取以形成案件特征多维向量组,然后计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,并输出相关系数超出预先设定的相关系数阈值的历史公安案件信息,可以快速的执行系列性案件的串并案分析,提高了效率,从而可以为公安机关或侦查人员快速侦破案件提供帮助。
附图说明
图1为本发明实施例提供的系列性公安案件的智能检索方法流程示意图;
图2为本发明实施例中对案件检索信息的案件描述信息进行特征提取形成案件描述特征向量组的流程示意图;
图3为本发明另一实施例提供的系列性公安案件的智能检索方法流程示意图;
图4为本发明实施例提供的系列性公安案件的智能检索系统结构示意图;
图5为本发明实施例提供的系列性公安案件的智能检索系统其处理单元的结构示意图。
本发明目的的实现、功能特点及优异效果,下面将结合具体实施例以及附图做进一步的说明。
具体实施方式
下面结合附图和具体实施例对本发明所述技术方案作进一步的详细描述,以使本领域的技术人员可以更好的理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
本发明的发明人发现,系列性案件通常都具有一个明显的特点:对于同一个犯罪主体来说,在其连续作案的多起案件中,其作案方法、手段往往会表现出相对的稳定性。本发明正式基于系列性案件这一特点,通过对案件的作案方法、手段等因素进行比较,从而可以快速的实现案件的串并案。
具体地,如图1所示,本发明实施例提供的一种系列性公安案件的智能检索方法,其包括如下步骤:
S10、获取案件检索信息,并对案件检索信息分别进行特征提取以形成案件特征多维向量组;
S20、计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息。
本实施例中,在所述步骤S10中,所述案件检索信息包括案发时间信息、案发地点信息、案件类型信息或案件描述信息中的一种或多种。
更为具体地,在本实施例中,所述的案发时间信息采用24小时计时法;所述的案发地点为基于GIS(Geographic Information System,地理信息系统)系统而获取的地理位置信息,通过点击GIS系统地图上任意一个位置,可以获取该目标位置的经纬度;所述的案件类型依据全国公安机关受理案件分类表进行分类,由符合规则的6位十进制数据编码而成,当然所述案件类型也可以依据其他国家或地区或者其他组织制定的案件分类规则而设置;所述的案件描述为文本描述信息,其为案件案情的详细文本描述,所述文本可以为外文也可以为汉语,除此之外,其也可以为其他可以被本领域技术人员所理解的代码串或符号串。
本实施例中,在所述步骤S10中,对案件检索信息分别进行特征提取的方法为:
将案件检索信息的案发时间信息、案发地点信息以及案件类型信息直接表述为案发时间向量、案发地点向量及案件类型向量;对案件检索信息的案件描述信息进行特征提取,形成案件描述特征向量组。
具体地,如图2所示,对案件检索信息的案件描述信息进行特征提取形成案件描述特征向量组的步骤包括:
S101、对案件描述信息进行预处理,以去除无用描述因子,例如当案件描述信息为文本信息时,去除该案件描述文本信息中的常用虚词和语气词等无用词;
S102、依次采用以下TF-IDF(term frequency–inverse document frequency,特征性频率-倒排文档频率加权法)数学式计算经预处理后的案件描述信息j中的第i个描述因子ki的权值Wi,j:
其中,l=1,2,…,N;为描述因子ki的逆向文档频率IDF值;N为公安案件数据库中历史公安案件的总数目;ni为公安案件数据库中包含描述因子ki的案件数目;freqi,j为案件描述信息j中出现描述因子ki的次数;
S103、依据计算的权值Wi,j得到案件描述特征向量组Din,其中所述案件描述特征向量组Din采用以下数学式表示:
Din=(W1,j,W2,j,…Wt,j)。
进一步优选地,在执行所述步骤S103对案件检索信息的案件描述信息进行特征提取,形成案件描述特征向量组之后,还包括:
S104、对案件描述特征向量组进行向量维度约减,得到约减后的案件描述特征向量组。
具体地,本实施例中,采用逐步回归法对案件描述特征向量组进行向量维度约减,其具体步骤包括:
步骤1、将案件检索信息的案件描述特征向量组Din′表示为1个n维的向量组(W1,j,W2,j,…Wt,j),并构建出案件描述特征向量组的回归模型,如下:
Din′=β1y1+β2y2+…+βnyn,
其中,y1,y2…yn为构建的n个变量,β1,β2…βn分别对应为变量y1,y2…yn的权值系数;
步骤2、选取第i个变量,i=0,计算各自变量的偏回归平方和:
其中,j=1,2,…,n;
步骤3、进行变量入选判断,如存在则变量yk1入选,此时则进行下一步骤,否则,i=i+1,并返回步骤2;
步骤4、进行统计量判断,采用以下数学式计算变量yk1的统计量F统(k1):
若其中为预先设置的判断阈值,则变量yk1入选回归方程,否则,则将变量yk1剔除掉,此时,i=i+1,并返回步骤2;
步骤5、当没有变量可以选择时,得到约减后的案件的回归方程Din及l维向量组(W1,j,W2,j,…Wl,j):
其中yk1,yk2…ykn为构建的n个变量,分别对应为变量yk1,yk2…ykn的权值系数。
本实施例中,在所述步骤S20中,计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息的方法为:
采取以下数学式计算该案件特征多维向量组与公安案件数据库中第j个历史公安案件的历史案件特征多维向量组之间的相关系数Rj,其中j=1,2,…N,N为公安案件数据库中历史公安案件的总数目:
其中,x1=Tin·Tn,Tin为案件特征多维向量组的案发时间向量,Tn为公安案件数据库中第n条历史公安案件信息的案发时间向量;
x2=Pin·Pn,Pin为案件特征多维向量组的案发地点向量,Pn为公安案件数据库中第n条历史公安案件信息的案发地点坐标向量;
x3=Kin·Kn,Kin为案件特征多维向量组的案件类型向量,Kn为公安案件数据库中第n条历史公安案件信息的案件类型向量;
x4=Din·Di,Din为案件特征多维向量组的经约减的案件描述特征向量组,Di为公安案件数据库中第n条历史公安案件信息的经约减的案件描述特征向量组;
当Rj>Rset时,则输出第j个历史公安案件,其中,所述Rset为预先设定的相关系数阈值。
1、具体地,根据所述案发时间向量得到案发时间计算因子x1的运算方式如下:
设Tin为输入案件检索信息中的案发时间向量,Tn为数据库中第n条案件信息的案发时间向量,其运算方式如下:
其中,本实施例中|Tin-Tn|以天为单位。
2、根据所述案发地点向量得到案发地点计算因子x2的运算方式如下:
其中,Pin(x,y)为输入案件检索信息中的案发地点坐标,其中x,y为其经纬度数据,Pn(xn,yn)为数据库中第n条案件信息的案发地点坐标。
3、根据所述案件类型向量得到案件类型计算因子x3的运算方式如下:
设Kin为输入案件检索信息中的案件类型,其为6位十进制数据,由高到低位记为AABBCC,Kn为数据库中第n条案件信息的案件类型数据,记为aabbcc,其运算方式如下:
其中,α、β、γ为常数。
假设部分案件类型如下表所示:
一级案件类型 | 二级案件类型 | 三级案件类型 |
刑事案件10 | 杀人1001 | 入室杀人100101 |
刑事案件10 | 杀人1001 | 盗窃杀人100102 |
刑事案件10 | 诈骗1002 | 假药诈骗100201 |
刑事案件10 | 诈骗1002 | 征婚诈骗100202 |
如用户输入的案发类型为入室杀人(100101),数据库中一个公安案件案发为盗窃杀人(100102), 取α、β、γ分别为0.5、0.3、0.2,则得到的案发地点向量运算结果x3为0.83。
4、根据所述案件描述特征向量组得到案件类型计算因子x4的运算方式如下:
其中,Din=(W1,W2,…Wl)为约减后的l维案件描述特征向量组,Di=(W1,i,W2,i,…Wt,i)为数据库中第i条案件信息的案件描述数据, i=1,2,…N,N为数据库案件的总数目。
优选地,本实施例中,如图3所示,在执行步骤S10之后,即在获取案件检索信息,并对案件检索信息分别进行特征提取以形成案件特征多维向量组之后,所述系列性公安案件的智能检索方法还包括:
S11、将与所述案件检索信息相对应的案件特征多维向量组存储至公安案件数据库。
如图4所示,本发明实施例提供的一种系列性公安案件的智能检索系统,其包括:
输入单元10,用于获取案件检索信息;
处理单元20,用于对案件检索信息分别进行特征提取以形成案件特征多维向量组;以及进一步用于计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息;
公安案件数据库30,用于存储历史公安案件的历史案件特征多维向量组;
显示单元40,用于显示处理单元20输出的历史公安案件信息。
本实施例中,所述案件检索信息包括案发时间信息、案发地点信息、案件类型信息或案件描述信息中的一种或多种。其中,所述的案发时间信息采用24小时计时法;所述的案发地点为基于GIS(Geographic Information System,地理信息系统)系统而获取的地理位置信息,通过点击GIS系统地图上任意一个位置,可以获取该目标位置的经纬度;所述的案件类型依据全国公安机关受理案件分类表进行分类,由符合规则的6位十进制数据编码而成,当然所述案件类型也可以依据其他国家或地区或者其他组织制定的案件分类规则而设置;所述的案件描述为文本描述信息,其为案件案情的详细文本描述,所述文本可以为外文也可以为汉语,除此之外,其也可以为其他可以被本领域技术人员所理解的代码串或符号串。
本实施例中,如图5所示,所述处理单元包括:
特征提取单元201,用于将案件检索信息的案发时间信息、案发地点信息以及案件类型信息直接表述为案发时间向量、案发地点向量及案件类型向量;以及进一步用于对案件检索信息的案件描述信息进行特征提取,以形成案件描述特征向量组;
组合单元203,用于将案发时间向量、案发地点向量、案件类型向量以及案件描述特征向量组组合成案件特征多维向量组;
交互单元204,用于与公安案件数据库进行数据交互;
计算单元205,用于计算该案件特征多维向量组与公安案件数据库30中每个历史公安案件的历史案件特征多维向量组之间的相关系数;
输出单元206,用于输出相关系数超出预先设定的相关系数阈值的历史公安案件信息。
优选实施方式中,所述处理单元还包括:
约减单元202,用于将特征提取单元201提取的案件描述特征向量组进行约减,并将约减后的案件描述特征向量组发送至组合单元。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种系列性公安案件的智能检索方法,其特征在于,包括:
获取案件检索信息,并对案件检索信息分别进行特征提取以形成案件特征多维向量组,其中,所述案件检索信息包括案发时间信息、案发地点信息、案件类型信息或案件描述信息中的一种或多种;
计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息;
对案件检索信息分别进行特征提取的方法包括:
将案件检索信息的案发时间信息、案发地点信息以及案件类型信息直接表述为案发时间向量、案发地点向量及案件类型向量;对案件检索信息的案件描述信息进行特征提取,形成案件描述特征向量组。
2.如权利要求1所述的系列性公安案件的智能检索方法,其特征在于,对案件检索信息的案件描述信息进行特征提取形成案件描述特征向量组的步骤包括:
对案件描述信息进行预处理,以去除无用描述因子;
依次采用以下数学式计算经预处理后的案件描述信息j中的第i个描述因子ki的权值Wi,j:
其中,l=1,2,...,N;为描述因子ki的逆向文档频率IDF值;N为公安案件数据库中历史公安案件的总数目;ni为公安案件数据库中包含描述因子ki的案件数目;freqi,j为案件描述信息j中出现描述因子ki的次数;
依据计算的权值Wi,j得到案件描述特征向量组Din,其中所述案件描述特征向量组Din采用以下数学式表示:
Din=(W1,j,W2,j,…Wt,j)。
3.如权利要求1或2所述的系列性公安案件的智能检索方法,其特征在于,在对案件检索信息的案件描述信息进行特征提取,形成案件描述特征向量组之后,还包括:
对案件描述特征向量组进行向量维度约减,得到约减后的案件描述特征向量组。
4.如权利要求3所述的系列性公安案件的智能检索方法,其特征在于,计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息的方法为:
采取以下数学式计算该案件特征多维向量组与公安案件数据库中第j个历史公安案件的历史案件特征多维向量组之间的相关系数Rj,其中j=1,2,…N,N为公安案件数据库中历史公安案件的总数目:
其中,x1=Tin·Tn,Tin为案件特征多维向量组的案发时间向量,Tn为公安案件数据库中第n条历史公安案件信息的案发时间向量;
x2=Pin·Pn,Pin为案件特征多维向量组的案发地点向量,Pn为公安案件数据库中第n条历史公安案件信息的案发地点坐标向量;
x3=Kin·Kn,Kin为案件特征多维向量组的案件类型向量,Kn为公安案件数据库中第n条历史公安案件信息的案件类型向量;
x4=Din·Di,Din为案件特征多维向量组的经约减的案件描述特征向量组,Di为公安案件数据库中第n条历史公安案件信息的经约减的案件描述特征向量组;
当Rj>Rset时,则输出第j个历史公安案件,其中,所述Rset为预先设定的相关系数阈值。
5.如权利要求1所述的系列性公安案件的智能检索方法,其特征在于,在获取案件检索信息,并对案件检索信息分别进行特征提取以形成案件特征多维向量组之后,所述方法还包括:
将与所述案件检索信息相对应的案件特征多维向量组存储至公安案件数据库。
6.一种系列性公安案件的智能检索系统,其特征在于,包括:
输入单元,用于获取案件检索信息,其中,所述案件检索信息包括案发时间信息、案发地点信息、案件类型信息或案件描述信息中的一种或多种;
处理单元,用于对案件检索信息分别进行特征提取以形成案件特征多维向量组;以及进一步用于计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数,输出相关系数超出预先设定的相关系数阈值的历史公安案件信息;
公安案件数据库,用于存储历史公安案件的历史案件特征多维向量组;
显示单元,用于显示处理单元输出的历史公安案件信息;
其中,所述处理单元包括特征提取单元,用于将案件检索信息的案发时间信息、案发地点信息以及案件类型信息直接表述为案发时间向量、案发地点向量及案件类型向量;以及进一步用于对案件检索信息的案件描述信息进行特征提取,以形成案件描述特征向量组。
7.如权利要求6所述的系列性公安案件的智能检索系统,其特征在于,所述处理单元包括:
组合单元,用于将案发时间向量、案发地点向量、案件类型向量以及案件描述特征向量组组合成案件特征多维向量组;
交互单元,用于与公安案件数据库进行数据交互;
计算单元,用于计算该案件特征多维向量组与公安案件数据库中每个历史公安案件的历史案件特征多维向量组之间的相关系数;
输出单元,用于输出相关系数超出预先设定的相关系数阈值的历史公安案件信息。
8.如权利要求7所述的系列性公安案件的智能检索系统,其特征在于,所述处理单元还包括:约减单元,用于将特征提取单元提取的案件描述特征向量组进行约减,并
约减后的案件描述特征向量组发送至组合单元。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310322686.1A CN104346355B (zh) | 2013-07-26 | 2013-07-26 | 系列性公安案件的智能检索方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310322686.1A CN104346355B (zh) | 2013-07-26 | 2013-07-26 | 系列性公安案件的智能检索方法及其系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104346355A CN104346355A (zh) | 2015-02-11 |
CN104346355B true CN104346355B (zh) | 2019-03-08 |
Family
ID=52501980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310322686.1A Active CN104346355B (zh) | 2013-07-26 | 2013-07-26 | 系列性公安案件的智能检索方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104346355B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106127241A (zh) * | 2016-06-17 | 2016-11-16 | 中国电子科技集团公司第二十八研究所 | 一种串并案分类方法及串并案分类系统 |
CN106294319A (zh) * | 2016-08-04 | 2017-01-04 | 武汉数为科技有限公司 | 一种串并案识别方法 |
CN106778817A (zh) * | 2016-11-25 | 2017-05-31 | 杭州中奥科技有限公司 | 一种事件的自动分类方法 |
CN107145895A (zh) * | 2017-03-13 | 2017-09-08 | 东方网力科技股份有限公司 | 基于k‑means算法的公安犯罪类案研判方法 |
CN107342987B (zh) * | 2017-06-20 | 2018-08-17 | 深圳安巽科技有限公司 | 一种网络反电信诈骗系统 |
CN110019663B (zh) * | 2017-09-30 | 2022-05-17 | 北京国双科技有限公司 | 一种案件信息的推送方法、系统、存储介质和处理器 |
CN109872259A (zh) * | 2019-03-08 | 2019-06-11 | 南阳市烟草公司城区分公司 | 涉烟案件的分析方法、装置及电子设备 |
CN109947824A (zh) * | 2019-03-21 | 2019-06-28 | 赖雪英 | 求孤数据应用处理系统及其方法 |
CN110019374B (zh) * | 2019-03-26 | 2021-03-12 | 杭州数梦工场科技有限公司 | 基于特征的数据项处理方法、装置、存储介质及计算机设备 |
CN111259951A (zh) * | 2020-01-13 | 2020-06-09 | 北京明略软件系统有限公司 | 案件检测方法、装置、电子设备及可读存储介质 |
CN111242237A (zh) * | 2020-01-20 | 2020-06-05 | 北京明略软件系统有限公司 | Bert模型训练、分类方法、系统、介质和计算机设备 |
CN112925899B (zh) * | 2021-02-09 | 2023-06-23 | 重庆中科云从科技有限公司 | 排序模型建立方法、案件线索推荐方法、装置及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101187927A (zh) * | 2007-12-17 | 2008-05-28 | 电子科技大学 | 一种刑事案件的串并案智能分析方法 |
CN101655860A (zh) * | 2009-09-16 | 2010-02-24 | 北京中盾安全技术开发公司 | 一种刑侦破案视频辅助分析方法及系统 |
CN102147816A (zh) * | 2011-04-21 | 2011-08-10 | 中国电子信息产业集团有限公司第六研究所 | 一种案件统计及趋势分析系统 |
CN102591955A (zh) * | 2011-12-29 | 2012-07-18 | 北京城市系统工程研究中心 | 网格化城市管理数据分析方法 |
CN102789482B (zh) * | 2012-06-29 | 2014-12-17 | 安科智慧城市技术(中国)有限公司 | 一种利用口供识别嫌疑人的方法、系统及电子设备 |
-
2013
- 2013-07-26 CN CN201310322686.1A patent/CN104346355B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101187927A (zh) * | 2007-12-17 | 2008-05-28 | 电子科技大学 | 一种刑事案件的串并案智能分析方法 |
CN101655860A (zh) * | 2009-09-16 | 2010-02-24 | 北京中盾安全技术开发公司 | 一种刑侦破案视频辅助分析方法及系统 |
CN102147816A (zh) * | 2011-04-21 | 2011-08-10 | 中国电子信息产业集团有限公司第六研究所 | 一种案件统计及趋势分析系统 |
CN102591955A (zh) * | 2011-12-29 | 2012-07-18 | 北京城市系统工程研究中心 | 网格化城市管理数据分析方法 |
CN102789482B (zh) * | 2012-06-29 | 2014-12-17 | 安科智慧城市技术(中国)有限公司 | 一种利用口供识别嫌疑人的方法、系统及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN104346355A (zh) | 2015-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104346355B (zh) | 系列性公安案件的智能检索方法及其系统 | |
US20230409638A1 (en) | Method and system for abstracting information for use in link analysis | |
López-Robles et al. | Understanding the intellectual structure and evolution of Competitive Intelligence: A bibliometric analysis from 1984 to 2017 | |
Zhang et al. | Subject clustering analysis based on ISI category classification | |
CN104318340B (zh) | 基于文本履历信息的信息可视化方法及智能可视分析系统 | |
US8706739B1 (en) | Joining user profiles across online social networks | |
US8458105B2 (en) | Method and apparatus for analyzing and interrelating data | |
Elzinga et al. | Terrorist threat assessment with formal concept analysis | |
US20140195518A1 (en) | System and Method for Data Mining Using Domain-Level Context | |
Baboo | An enhanced algorithm to predict a future crime using data mining | |
CN110533212A (zh) | 基于大数据的城市内涝舆情监测预警方法 | |
Helbich et al. | Exploration of unstructured narrative crime reports: an unsupervised neural network and point pattern analysis approach | |
TW201426360A (zh) | 文字串流訊息分析系統和方法 | |
Osorio et al. | Enhancing the Detection of Criminal Organizations in Mexico using ML and NLP | |
Noel et al. | Applicability of Latent Dirichlet Allocation to multi-disk search | |
CN103761286B (zh) | 一种基于用户兴趣的服务资源检索方法 | |
Hammond et al. | Use of text search to effectively identify lifetime prevalence of suicide attempts among veterans | |
Huang et al. | A Low‐Cost Named Entity Recognition Research Based on Active Learning | |
CN112508376A (zh) | 一种指标体系构建方法 | |
Ma et al. | AK-Modes: A weighted clustering algorithm for finding similar case subsets | |
CN103440308B (zh) | 一种基于形式概念分析的数字论文检索方法 | |
CN105205075B (zh) | 基于协同自扩展的命名实体集合扩展方法及查询推荐方法 | |
Shen et al. | The application research of OLAP in police intelligence decision system | |
Hui et al. | Analysis of decision tree classification algorithm based on attribute reduction and application in criminal behavior | |
Ozgul et al. | Comparison of feature-based criminal network detection models with k-core and n-clique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |