CN106294319A - 一种串并案识别方法 - Google Patents
一种串并案识别方法 Download PDFInfo
- Publication number
- CN106294319A CN106294319A CN201610631053.2A CN201610631053A CN106294319A CN 106294319 A CN106294319 A CN 106294319A CN 201610631053 A CN201610631053 A CN 201610631053A CN 106294319 A CN106294319 A CN 106294319A
- Authority
- CN
- China
- Prior art keywords
- case
- similarity
- related cases
- place
- merit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Abstract
本发明公开了一种串并案识别方法及系统,其方法包括预处理步骤,对案件的案情描述进行分词与词性标注,并去除停用词;对预处理后的案情描述,通过基于规则和字典相结合的方法提取案件的重要特征,将案件文本转化成特征向量;根据特征向量,采用案件特征相似度计算方法获得案件的综合相似度,通过综合相似度进行聚类,找到相关案件的密集簇,识别出串并案件;通过本发明提供的方法及系统,基于特征密度进行聚类,改进了传统聚类算法应用于数值型向量的局限性;克服了从案情文本库获取可能的串并案簇的难点;将该方法及系统应用于案件侦查可提高侦查效率。
Description
技术领域
本发明属于计算机自然语言处理以及数据挖掘技术领域,更具体地,涉及一种串并案识别方法。
背景技术
串并案分析作为打击系列犯罪案件的重要方法,可以挖掘案件之间的内在联系,减轻分析人员的工作量,提高破案效率。刑事案件文本包含了案件时间、案发地点、作案手法和工具等信息,利用这些信息结合数据挖掘方法挖掘案件之间的内在联系,发现案件的聚集簇,可以减轻分析人员的工作量,提高破案效率。
传统的发现密集簇的技术主要是利用聚类方法,其中,基于密度的聚类方法能够发现任意形状的簇。如经典的基于密度的聚类算法DBSCAN,将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇,将簇定义为密度相连的点的最大集合;OPTICS算法在经典DBSCAN基础上进行了改进,可以通过该聚类算法得到不同密度的聚类。
传统的聚类算法虽然可以发现任意形状及密度的簇,但其应用对象主要针对数值型多维向量空间中的点;刑事案件文本篇幅短小,包含大量重要信息,但属于自由文本,没有固定格式,无法直接通过传统聚类方法发现案件之间的关联。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种串并案识别方法,根据案情特征把不同地域、不同时间发生的多起案件进行合并分析,识别出其中的串并案。
为实现上述目的,按照本发明的一个方面,提供了一种串并案识别方法,包括案情预处理步骤、案件特征提取步骤和基于特征密度的聚类步骤,具体如下:
(1)案情预处理步骤:对案件的案情描述文本进行分词与词性标注,并去除停用词;
其中,停用词包括无用词、无用词性,以及专有停用词;
(2)案件特征提取步骤:根据预处理后的案情描述文本,通过基于规则和字典相结合的方法提取案件的重要特征,将案情描述文本转化成案件的特征向量;
其中,重要特征包括案件的时间、地点以及案件类别;
其中,案件类别包括一级类别和二级类别;一级类别指案件所属的大类,二级类别指案件所属的大类中的小类;
(3)基于特征密度的聚类步骤:根据上述特征向量,采用案件特征相似度计算方法获得案件的综合相似度;通过综合相似度进行聚类,找到相关案件的密集簇,识别出串并案件。
优选地,上述串并案识别方法,其步骤(1)包括如下子步骤:
(1.1)采用分词器对案情描述文本进行分词与词性标注;
(1.2)根据分词及词性标注的结果,结合无用词性字典以及专业停用词典,去除停用词以及无意义的词,包括拟声词、语气词。
优选地,上述串并案识别方法,其步骤(2)包括如下子步骤:
(2.1)根据预设规则进行特征提取,获得案情的特征向量,包括案件的时间、地点、类别;
(2.2)利用字典从预处理后的案情描述文本中抽取案件的时间、地点、类别;
(2.3)将上述两个步骤抽取到的案件的时间、地点、类别进行合并,并进行去重处理,获得案件的特征向量。
优选地,上述串并案识别方法,其步骤(3)包括如下子步骤:
(3.1)根据案件的时间、地点、类别,获取案件P与案件Q之间的综合相似度相似度
sim(P,Q)=α*sim_type(P,Q)+β*sim_time(P,Q)+γ*sim_place(P,Q);
其中,sim_type(P,Q)是指案件之间的类别相似度,sim_time(P,Q)是指案件之间的时间相似度,sim_place(P,Q)是指案件之间的地点相似度;
α是指类别相似度的权重值,β是指时间相似度的权重值,γ是指地点相似度的权重值;
上述各权重值采用层次分析法AHP(Analytic Hierarchy Process)获取,该方法是将与决策相关的元素分解成目标、准则和方案等层次,并在此基础上进行定性和定量的分析;
(3.2)根据上述综合相似度进行聚类处理,识别出相关案件的密集簇;并根据密集簇识别出串并案件。
优选地,上述串并案识别方法,所述类别相似度
优选地,上述串并案识别方法,所述时间相似度
其中,案发时段相同时,λ=1;案发时段不同时,λ=0.5。
优选地,上述串并案识别方法,所述地点相似度
其中,μ是指案件场所系数,当案发场所相同时μ=1,否则μ=0.5。
为实现本发明目的,按照本发明的另一个方面,提供了一种串并案分析系统,包括预处理模块、特征提取模块和聚类模块;
其中,预处理模块用于对案情进行初始处理,包括进行分词及词性标注,无用词性过滤以及专有停顿词剔除;
特征提取模块用于从案情描述中抽取重要特征,包括案发时间、案发地点以及案件类别,构成案件的特征向量;
聚类模块用于将案件的特征向量进行聚类,找到相关案件的密集簇,识别出串并系案件。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
本发明提供的串并案识别方法及系统,根据案件的时间、地点、类别获取案件间的综合相似度,将案情中最重要的三个维度:时间、地点和案件类别利用层次分析法同时应用在相似度计算中,使得案件距离的描述更加准确;并根据综合相似度基于特征密度进行聚类,改进了传统聚类算法应用于数值型向量的局限性;通过本发明提供的方法及系统,克服了从案情文本库得到可能的串并案簇的难点;将该方法及系统应用于案件侦查可提高侦查的效率。
附图说明
图1是为本发明实施例提供的串并案识别方法的流程示意图;
图2为本发明实施例中的预处理的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
实施例提供的串并案识别方法,包括案情预处理步骤,案情特征提取步骤,基于特征密度的聚类步骤;首先根据案情语料库得到案情描述文本,对案情描述文本进行分词及词性标注、去除停用词性和专有停顿词等预处理操作;对预处理后的案情描述文本进行特征提取,采用基于规则和字典相结合的抽取方法,得到案情描述的特征向量;然后利用特征向量获取案件的综合相似度,并利用基于特征密度的聚类方法对案情特征向量进行聚类分析;其流程如图1所示,具体如下:
(1)案情预处理:对案情进行初始处理,其流程如图2所示,包括分词及词性标注,无用词性过滤以及专有停顿词剔除;
实施例中,采用中科院分词系统ICTCLAS对文本进行分词及词性标注;
无用词性过滤是指根据词性剔除对文本分类无用的词,例如拟声词、副词、介词和连词;
专用停顿词剔除是指根据应用场景和原始文档集特点,去除出现频率非常高但对分类无用的领域专用停顿词,如“犯罪嫌疑人”、“受害人”、“价值”、“报案”等公安领域专用停顿词;
(2)案情特征提取:采用基于规则和字典相结合的抽取方法进行特征提取:
实施例中,对案发时间采用正则表达式“[\d]{4}年[\d]{2}月([\d]日)?”提取;利用某地区的街道字典提取出案发地点;采用与时间地点相同的基于规则和字典相结合的方法提取出案件类别,或者可以利用案件本身的类别维度提取出案件类别:例如一级案件类别盗窃案包括了若干个二级案件类别,采用二级分类器的分类方法对案情进行二级分类;
将根据规则与字典抽取到的案件的时间、地点、类别进行合并,并进行去重处理,获得案件的特征向量;
(3)基于特征密度进行聚类;其中,案件之间的综合相似度获取方法如下:
(I)时间相似度与案件发生的日期和时段相关,案件发生的日期相差天数越小,发生具体时段越相近,时间相似度越高;
实施例中,时间相似度
其中,当案发时段相同时,λ=1;当案发时段不同时λ=0.5;时段字典如以下表1所列;
表1案发时段字典
时段 | 时钟时间 |
凌晨 | 1:00~4:00 |
早晨 | 5:00~7:00 |
上午 | 8:00~10:00 |
中午 | 11:00~13:00 |
下午 | 14:00~16:00 |
傍晚 | 17:00~19:00 |
晚上 | 20:00~22:00 |
午夜 | 23:00~0:00 |
(II)地点相似度与案件发生的地理位置信息和案发场所信息相关;案件发生地点之间的地表距离越近,表明它们是串并案件的可能性越大;案件发生的场所相同,则是串并案件的可能性较大;
实施例中,地点相似度
其中,μ表示案件场所系数,当案发场所相同时μ=1,否则μ=0.5;案发场所包括“学校”、“小区”和“地铁”等;地表距离的基本单位是公里;
(III)类别相似度与案件的一级类别和二级类别相关,若两个案件不属于同一个一级类别,则类别相似度为0;若同属于一个一级案件类别,则计算其二级案件类别的相似度;实施例中,利用JACCARD相似度计算方法获取类别相似度,
(Ⅳ)利用层次分析法获取上述三个维度的相似度的权重;根据权重与各维度的相似度,获取案件之间的综合相似度
sim(P,Q)=α*sim_type(P,Q)+β*sim_time(P,Q)+γ*sim_place(P,Q)。
根据上述综合相似度采用基于概率密度的聚类算法进行聚类处理,识别出相关案件的密集簇;并根据密集簇识别出串并案件;基于概率密度的聚类算法能够识别任意形状的类簇,克服了其他基于距离的聚类算法仅能发现“类圆形”簇的缺陷,符合刑事案件分布的不规则性特征。
实施例提供的串并案分析系统包括预处理模块,特征提取模块以及聚类模块;
其中,预处理模块用于对案情进行初始处理;主要包括分词及词性标注,无用词性过滤以及专有停顿词剔除;
特征提取模块用于从案情描述中抽取重要特征,包括案发时间、案发地点以及案件类别,构成案件的特征向量;具体是采用基于规则和字典相结合的抽取方法,先根据规则进行特征提取,然后利用字典查漏补缺;
聚类模块用于将案件的特征向量进行聚类,从而找到相关案件的密集簇,发现串并案件;具体的,该模块识别任意形状的簇,在传统聚类算法OPTICS基础上,引入特征相似度计算方法,综合考虑案发时间、案发地点和案件类别三个维度特征,计算综合特征相似度,从而识别出串并案件的密集簇。
以下结合一个公安串并案分析的实例具体阐述本发明提供的串并案识别方法,具体包括如下步骤:
(1)案情预处理:
对案件的案情描述文本进行预处理,包括中文分词及词性标注、停用词去除两部分;
实施例中,原始案情描述文本为:“2013年5月6日上午,青山街13号王某家中遭到撬门入室盗窃,损失人民币两万余元”,经过预处理后得到关键词向量(2013年、5月、6日、上午、青山街、13号、家中、撬门、入室盗窃、损失、人民币、两万、余元);
(2)案件特征提取:根据预处理后的文本,对案发时间采用正则表达式“[\d]{4}年[\d]{2}月([\d]日)?”提取为“2013年5月6日上午”;利用地区的街道字典可提取出案发地点为“青山街13号家中”;案件类别为撬门入室盗窃;通过案件特征提取步骤,将案件文本转化成特征向量;
(3)基于特征密度的聚类:
实施例中,两个案件特征向量分别为(2013年5月6日上午,青山街13号家中,撬门入室盗窃);和(2013年5月8日下午,发展大道116号酒店,溜门入室盗窃);两个案件之间的时间相似度与案件发生的日期和时段相关,案件发生的日期相差天数越小,发生具体时段越相近,时间相似度越高,计算获得案件时间相似度sim_time(P,Q)为0.1667;
地点相似度与案件发生的地理位置信息和案发场所信息相关;案件发生地点之间的地表距离越近,表明它们是串并案件的可能性越大;案件发生的场所相同,也表明是串并案件的可能性较大,计算获得案件地点相似度sim_place(P,Q)为0.05(两地的地表距离为9公里);
计算获得案件类别相似度sim_type(P,Q)为0.7143;
利用层次分析法AHP,根据初始判断矩阵A确定时间、地点和类别这三个维度相似度的权重分别为0.1676、0.0944和0.7380;其中,
根据三个维度的权重以及三个维度的相似度,获得两个案件的综合相似度
sim(P,Q)=0.7380*sim_type(P,Q)+0.1676*sim_time(P,Q)+0.0944*sim_place(P,Q);其具体值为0.5598,以案件之间的综合相似度作为距离对案情件征向量进行聚类,得到串并案件的密集簇,识别出串并案件。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种串并案识别方法,其特征在于,包括如下步骤:
(1)对案件的案情描述文本进行预处理,包括分词与词性标注、停用词去除;
(2)通过基于规则和字典相结合的方法,从预处理后的案情描述文本中获取案件特征向量;
(3)采用案件特征相似度计算方法,根据所述特征向量获得案件的综合相似度;并通过所述综合相似度进行聚类处理,找到相关案件的密集簇,识别出串并案件。
2.如权利要求1所述的串并案识别方法,其特征在于,所述步骤(1)包括如下子步骤:
(1.1)采用分词器对案情描述文本进行分词与词性标注;
(1.2)根据分词及词性标注的结果,结合无用词性字典以及专业停用词典,去除停用词以及无意义的词。
3.如权利要求1或2所述的串并案识别方法,其特征在于,所述步骤(2)包括如下子步骤:
(2.1)根据预设规则进行特征提取,获得案情的特征向量,包括案件的时间、地点、类别;
(2.2)利用字典从预处理后的案情描述文本中抽取案件的时间、地点、类别;
(2.3)将所述步骤(2.1)与步骤(2.2)抽取到的案件的时间、地点、类别进行合并,并进行去重处理,获得案件的特征向量。
4.如权利要求1或2所述的串并案识别方法,其特征在于,所述步骤(3)包括如下子步骤:
(3.1)根据案件的时间、地点、类别,获取案件P与案件Q之间的综合相似度sim(P,Q)=α*sim_type(P,Q)+β*sim_time(P,Q)+γ*sim_place(P,Q);
其中,sim_type(P,Q)是指案件之间的类别相似度,sim_time(P,Q)是指案件之间的时间相似度,sim_place(P,Q)是指案件之间的地点相似度;
α是指类别相似度的权重值,β是指时间相似度的权重值,γ是指地点相似度的权重值;
(3.2)根据所述综合相似度进行聚类处理,识别出相关案件的密集簇;并根据密集簇识别出串并案件。
5.如权利要求4所述的串并案识别方法,其特征在于,所述类别相似度
6.如权利要求4所述的串并案识别方法,其特征在于,所述时间相似度
其中,案发时段相同时,λ=1;案发时段不同时,λ=0.5。
7.如权利要求4所述的串并案识别方法,其特征在于,所述地点相似度
其中,μ是指案件场所系数,当案发场所相同时μ=1,否则μ=0.5。
8.一种串并案分析系统,其特征在于,包括依次连接的预处理模块、特征提取模块和聚类模块;
所述预处理模块用于对案情进行预处理,包括进行分词及词性标注,无用词性过滤以及专有停顿词剔除;
所述特征提取模块用于从预处理后的案情描述文本中抽取重要特征构成案件的特征向量;
所述聚类模块用于根据所述特征向量进行聚类,找到相关案件的密集簇,识别出串并系案件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610631053.2A CN106294319A (zh) | 2016-08-04 | 2016-08-04 | 一种串并案识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610631053.2A CN106294319A (zh) | 2016-08-04 | 2016-08-04 | 一种串并案识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106294319A true CN106294319A (zh) | 2017-01-04 |
Family
ID=57664483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610631053.2A Pending CN106294319A (zh) | 2016-08-04 | 2016-08-04 | 一种串并案识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106294319A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108614860A (zh) * | 2018-03-27 | 2018-10-02 | 成都律云科技有限公司 | 一种律师信息处理方法和系统 |
CN109190498A (zh) * | 2018-08-09 | 2019-01-11 | 安徽四创电子股份有限公司 | 一种基于人脸识别的案件智能化串并的方法 |
CN109684628A (zh) * | 2018-11-23 | 2019-04-26 | 武汉烽火众智数字技术有限责任公司 | 基于案情语义分析的案件智能推送方法及系统 |
CN109710712A (zh) * | 2018-12-17 | 2019-05-03 | 中国人民公安大学 | 一种基于案件要素分析的犯罪热点特征挖掘方法及系统 |
CN109918674A (zh) * | 2019-03-14 | 2019-06-21 | 武汉烽火普天信息技术有限公司 | 一种基于案件要素相似性建模的案件串并方法 |
CN110609961A (zh) * | 2018-05-29 | 2019-12-24 | 南京大学 | 一种基于词嵌入的协同过滤推荐方法 |
CN110990523A (zh) * | 2018-09-30 | 2020-04-10 | 北京国双科技有限公司 | 一种法律文书的确定方法及系统 |
CN111382769A (zh) * | 2018-12-29 | 2020-07-07 | 阿里巴巴集团控股有限公司 | 信息处理方法、装置及系统 |
CN112347249A (zh) * | 2020-10-30 | 2021-02-09 | 中科曙光南京研究院有限公司 | 一种警情要素提取系统及其提取方法 |
CN112925872A (zh) * | 2019-12-05 | 2021-06-08 | 北京沃东天骏信息技术有限公司 | 一种数据搜索方法和装置 |
CN113139061A (zh) * | 2021-05-14 | 2021-07-20 | 东北大学 | 一种基于词向量聚类的案件特征提取方法 |
CN113159802A (zh) * | 2021-04-15 | 2021-07-23 | 武汉白虹软件科技有限公司 | 一种实现涉诈应用收集和特征提取聚类的算法模型及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070112713A1 (en) * | 2005-11-10 | 2007-05-17 | Motorola, Inc. | Method and apparatus for profiling a potential offender of a criminal incident |
CN101187927A (zh) * | 2007-12-17 | 2008-05-28 | 电子科技大学 | 一种刑事案件的串并案智能分析方法 |
US20130346440A1 (en) * | 2008-01-24 | 2013-12-26 | Case Global, Inc | Incident tracking systems and methods |
CN104346355A (zh) * | 2013-07-26 | 2015-02-11 | 南京中兴力维软件有限公司 | 系列性公安案件的智能检索方法及其系统 |
-
2016
- 2016-08-04 CN CN201610631053.2A patent/CN106294319A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070112713A1 (en) * | 2005-11-10 | 2007-05-17 | Motorola, Inc. | Method and apparatus for profiling a potential offender of a criminal incident |
CN101187927A (zh) * | 2007-12-17 | 2008-05-28 | 电子科技大学 | 一种刑事案件的串并案智能分析方法 |
US20130346440A1 (en) * | 2008-01-24 | 2013-12-26 | Case Global, Inc | Incident tracking systems and methods |
CN104346355A (zh) * | 2013-07-26 | 2015-02-11 | 南京中兴力维软件有限公司 | 系列性公安案件的智能检索方法及其系统 |
Non-Patent Citations (3)
Title |
---|
中国科学技术协会主编: "《2012-2013 地理学学科发展报告(地图学与地理信息系统)》", 30 April 2014 * |
李涛: "《数字图像处理之红外弱目标分割方法研究》", 30 June 2016 * |
高精錬: "《电子商务领域事件语义形式化描写研究》", 31 October 2015, 世界图书出版广东有限公司 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108614860A (zh) * | 2018-03-27 | 2018-10-02 | 成都律云科技有限公司 | 一种律师信息处理方法和系统 |
CN110609961A (zh) * | 2018-05-29 | 2019-12-24 | 南京大学 | 一种基于词嵌入的协同过滤推荐方法 |
CN109190498A (zh) * | 2018-08-09 | 2019-01-11 | 安徽四创电子股份有限公司 | 一种基于人脸识别的案件智能化串并的方法 |
CN110990523A (zh) * | 2018-09-30 | 2020-04-10 | 北京国双科技有限公司 | 一种法律文书的确定方法及系统 |
CN109684628A (zh) * | 2018-11-23 | 2019-04-26 | 武汉烽火众智数字技术有限责任公司 | 基于案情语义分析的案件智能推送方法及系统 |
CN109710712A (zh) * | 2018-12-17 | 2019-05-03 | 中国人民公安大学 | 一种基于案件要素分析的犯罪热点特征挖掘方法及系统 |
CN111382769B (zh) * | 2018-12-29 | 2023-09-22 | 阿里巴巴集团控股有限公司 | 信息处理方法、装置及系统 |
CN111382769A (zh) * | 2018-12-29 | 2020-07-07 | 阿里巴巴集团控股有限公司 | 信息处理方法、装置及系统 |
CN109918674B (zh) * | 2019-03-14 | 2022-12-30 | 武汉烽火普天信息技术有限公司 | 一种基于案件要素相似性建模的案件串并方法 |
CN109918674A (zh) * | 2019-03-14 | 2019-06-21 | 武汉烽火普天信息技术有限公司 | 一种基于案件要素相似性建模的案件串并方法 |
CN112925872A (zh) * | 2019-12-05 | 2021-06-08 | 北京沃东天骏信息技术有限公司 | 一种数据搜索方法和装置 |
CN112347249A (zh) * | 2020-10-30 | 2021-02-09 | 中科曙光南京研究院有限公司 | 一种警情要素提取系统及其提取方法 |
CN112347249B (zh) * | 2020-10-30 | 2024-02-27 | 中科曙光南京研究院有限公司 | 一种警情要素提取系统及其提取方法 |
CN113159802A (zh) * | 2021-04-15 | 2021-07-23 | 武汉白虹软件科技有限公司 | 一种实现涉诈应用收集和特征提取聚类的算法模型及系统 |
CN113139061A (zh) * | 2021-05-14 | 2021-07-20 | 东北大学 | 一种基于词向量聚类的案件特征提取方法 |
CN113139061B (zh) * | 2021-05-14 | 2023-07-21 | 东北大学 | 一种基于词向量聚类的案件特征提取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106294319A (zh) | 一种串并案识别方法 | |
CN108073569B (zh) | 一种基于多层级多维度语义理解的法律认知方法、装置和介质 | |
Sathyadevan et al. | Crime analysis and prediction using data mining | |
CN107220295A (zh) | 一种人民矛盾调解案例搜索和调解策略推荐方法 | |
CN104182805A (zh) | 基于服刑人员行为特征集成学习模型的危险倾向预测方法 | |
CN111538741B (zh) | 一种面向警情大数据的深度学习分析方法及系统 | |
CN106127231A (zh) | 一种基于信息交互网络的犯罪个体识别方法 | |
CN110188192A (zh) | 一种多任务网络构建与多尺度的罪名法条联合预测方法 | |
Basilio et al. | A model of policing strategy choice: The integration of the Latent Dirichlet Allocation (LDA) method with ELECTRE I | |
Pradhan et al. | Exploratory data analysis and crime prediction for smart cities | |
Yang et al. | DBSCAN clustering algorithm applied to identify suspicious financial transactions | |
CN106649262A (zh) | 一种社交媒体中企业硬件设施敏感信息防护方法 | |
CN105337842B (zh) | 一种与内容无关的垃圾邮件过滤方法 | |
Mishra et al. | Improving the efficacy of clustering by using far enhanced clustering algorithm | |
Bykov et al. | The automated speaker recognition system of critical use | |
Bharathi et al. | A supervised learning approach for criminal identification using similarity measures and K-Medoids clustering | |
KR102405799B1 (ko) | 사이버 공간에서 실시간 공격 탐지를 위한 시간에 따른 지속적인 적응형 학습을 제공하는 방법 및 시스템 | |
Gao et al. | Statistics and Analysis of Targeted Poverty Alleviation Information Integrated with Big Data Mining Algorithm | |
Abdo et al. | Mining Forensic Medicine Data for Crime Prediction | |
Qiu et al. | An ex-convict recognition method based on text mining | |
Wang et al. | Front-Page News Classification Model Based on the Stacking of Textual Context and Attribute Information | |
CN109634991A (zh) | 一种基于大数据的搜索方法 | |
Walteros-Alcázar et al. | General crime from the data mining point of view. A systematic literature review | |
Abiodun et al. | Terrorism prevention: A mathematical model for assessing individuals with profiling | |
KR102473115B1 (ko) | 신고 데이터 분석 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170104 |
|
RJ01 | Rejection of invention patent application after publication |