CN110837601A - 一种警情的自动分类与预测方法 - Google Patents

一种警情的自动分类与预测方法 Download PDF

Info

Publication number
CN110837601A
CN110837601A CN201911021249.XA CN201911021249A CN110837601A CN 110837601 A CN110837601 A CN 110837601A CN 201911021249 A CN201911021249 A CN 201911021249A CN 110837601 A CN110837601 A CN 110837601A
Authority
CN
China
Prior art keywords
alarm
words
module
word
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911021249.XA
Other languages
English (en)
Inventor
赵粉玉
田远东
鲁立虹
张慧娟
赵伯亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Xujian Science And Technology Co Ltd
Original Assignee
Hangzhou Xujian Science And Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Xujian Science And Technology Co Ltd filed Critical Hangzhou Xujian Science And Technology Co Ltd
Priority to CN201911021249.XA priority Critical patent/CN110837601A/zh
Publication of CN110837601A publication Critical patent/CN110837601A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety

Abstract

本发明提供一种警情的自动分类与预测方法,接收单条警情数据输入,通过警情分类系统,返回警情类型;警情分类系统包括:警情数据模块(1),关键词获取和筛选模块(2),犯罪类型统计筛选模块(3),警情类型评估统计(4),警情类型近义词模块(5),警情类型相似词模块(6),警情数据类型关联模块(7),警情分类模型训练模块(8);本发明有益效果:当前警情录入系统需要工作人员记录案情时根据经验自己选择案件类型并保存,而且记录警情时系统给出的警情类型种类不够全面。使用本发明的警情分类系统,输入警情数据会得到一个正确有效的分类结果,分类结果可以关联到相关的法律法规以及相关办案经验,以提高工作人员办案效率。

Description

一种警情的自动分类与预测方法
技术领域
本发明涉及大数据处理技术领域,尤其是涉及一种警情的自动分类与预测方法。
背景技术
随着我国经济社会的迅猛发展,许多社会问题不断涌现,社会治安问题日益突出,各类警情也随之不断增多,目前未有警情的自动分类系统,现有系统需要工作人员记录案情时根据经验自己选择案件类型并保存,而且记录警情时系统给出的警情类型种类不够全面。警情的正确有效分类可以关联相关的法律法规以及相关办案经验,以提高工作人员办案效率。
发明内容
为解决上述技术问题,本发明提供一种警情的自动分类与预测方法,能够自动对输入的警情数据进行分类,以便警情数据统计分析以及相关案情研判。
本发明提供一种警情的自动分类与预测方法,接收单条警情数据输入,通过警情分类系统,返回警情类型;
警情分类系统包括:警情数据模块(1),关键词获取和筛选模块(2),犯罪类型统计筛选模块(3),警情类型评估统计(4),警情类型近义词模块(5),警情类型相似词模块(6),警情数据类型关联模块(7),警情分类模型训练模块(8);
警情数据模块(1),是所有警情数据的集合;例如:南巷六号,有一群人拿着棍子打架。被视为一条警情信息。
关键词获取和筛选模块(2),是用来获取警情数据中的关键词,根据实际情况剔除噪音词后规范化后形成警情类别;如获取的关键词中有手机、打架等相关词语,手机为噪音词,打架替换成为规范化术语打架斗殴后保存为一种警情类别;
犯罪类型统计筛选模块(3)是根据刑法罪名以及治安案件类型作为参考对警情类型做相应补充;例如:补充饲养动物干扰正常生活,阻碍执行职务等类型,以防止警情类型缺失。
警情类型评估统计(4)是在得到关键词集合后,整理出如纠纷、被盗、闹事、丢失、扰民等,名词根据修饰词再做详细区分,如纠纷可分为邻里纠纷、家庭纠纷、物业纠纷等,然后将其它词根据治安法案件类型、刑法案件类型或案件命名规则对其进行同义替换,如被盗替换为盗窃。
根据具体情况将警情类型聚类,例如:殴打他人、聚众斗殴、家庭暴力可统称为打架斗殴,训练模型时标签使用聚类后的警情类型,训练后通过句式分析再得到其具体的类型;
警情数据类型关联模块(7)是根据警情类别对警情训练样本设置标签,形成语料集(X,Y),X为特征即警情数据,Y为标签即警情类型;
警情类型近义词模块(5)是获取每类警情关键词的近义词,近义词通过相似词林或词典获取;如:盗窃类警情关键词是盗窃,其近义词组为“偷盗/偷窃/扒窃/摸风”。
警情类型相似词模块(6)是获取每类警情关键词的相似词,下载维基百科语料,语料通过jieba分词将并去除停用词,使用word2vec工具将处理好的词汇映射成n维的向量,再通过向量间余弦相似度评估词之间的相似程度,如盗窃类警情关键词是盗窃,其相似词组为“强盗/偷窃/窃贼/偷盗/窃盗/盗取/偷/盗”。
警情数据类型关联模块(7)将警情类别的相关词、近义词作为关键词群后,通过模糊匹配方式得到一批有标签的数据,其中匹配方式为多词或单词模式;例如:警情类型为盗窃,关键词为盗窃,近义词组为“偷盗/偷窃/扒窃/摸风”,相关词组为“强盗/偷窃/窃贼/偷盗/窃盗/盗取/偷/盗”。警情:万达某店,报警人称保洁工偷盗财物。通过模糊匹配方式可以将此警情标记为盗窃。
在部分类型数据量少的情况下,伪造类似数据扩大训练样本量,以提高准确率。
警情分类模型训练模块(8)是训练一种基于textCNN的警情分类模型。
作为优选的,关键词获取和筛选模块(2)的具体方法如下:
步骤(1.1)、将原数据拆分成词组,对词语数组的进行词性标注;
步骤(1.2)、每个词组过滤掉停用词,最终只保留词性为名词、动词的单词;如警情信息“南巷六号,有一群人拿着棍子打架。”中文分词后得到词组:南巷/六号/,/有/一群人/拿着/棍子/打架,去掉停用词以及执行此行过滤后变为一群人/拿着/棍子/打架;
步骤(1.3)、将所有结果整合得到单词的集合;
步骤(1.4)、构建词图G=(v,e),其中V为节点集合,由以上步骤生成的词组成,然后采用共现关系构造任两点之间的边,两个节点之间存在边仅当它们对应的词汇在长度为K的窗口中共现,e为上述边的集合,K表示窗口大小;即从单词组中循环选择一个单词,将其与其后面k-1个单词分别组合成k-1条边,如词组为“有/一群人/拿着/棍子/打架”,如果k为2,选择单词为“拿着”,则此时窗口为[“拿着”,”棍子”],会产生(“拿着”,1,“棍子”)一条边,边权值为1,当这条边在之后再次出现时,权值再在基础上加1;最后通过TextRank迭代算法公式计算各节点的权重,直至收敛,最终不同词语会有不同的权重值,权重值高的的词语为关键词;
TextRank迭代算法计算公式为:
Figure BDA0002247293850000031
WS(Vi)是词语i的权重值;d是阻尼系数,取值范围为0到1,代表从图中某一特定点指向其他任意点的概率,一般设置为0.85;In(Vi)是存在指向词语i的链接的词语集合;
Out(Vj)是词语j中的链接存在的链接指向的词语的集合;权重项ωji,用来表示两个词语之间的边有不同的重要程度;
步骤(1.5)、根据关键词的词频过滤掉词频统计值DF小于阀值(如DFM取值20)的值以及噪音词(如手机等)。
作为优选的,警情分类模型训练模块(8)的具体方法如下:
步骤(2.1)、文本的预处理,样本分词后去除无意义的符号信息、地址、数字、停用词等冗余信息;
步骤(2.2)、文本数值化:使用word2vec工具获取特征集的词向量模型,将文本数据向量化;
步骤(2.3)、输入样本的向量化数据,使用深度学习模型Text-CNN模型进行分类训练,即通过卷积层提取语句的特征,将提取的特征输入到分类器中进行分类;
步骤(2.4)、根据结果调整参数,保存最终模型。
与现有技术相比,本发明的技术方案具有如下有益效果:
当前警情录入系统需要工作人员记录案情时根据经验自己选择案件类型并保存,而且记录警情时系统给出的警情类型种类不够全面。使用本发明的警情分类系统,输入警情数据会得到一个正确有效的分类结果,分类结果可以关联到相关的法律法规以及相关办案经验,以提高工作人员办案效率。
附图说明
图1为本发明提供的一种警情自动分类的结构示意图;
图2为本发明实现一种警情分类系统的功能结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1~2所示,本发明提供一种警情的自动分类与预测方法的具体实施例,如图1所示,接收单条警情数据输入,通过警情分类系统,返回警情类型;
如图2所示,警情分类系统包括:警情数据模块(1),关键词获取和筛选模块(2),犯罪类型统计筛选模块(3),警情类型评估统计(4),警情类型近义词模块(5),警情类型相似词模块(6),警情数据类型关联模块(7),警情分类模型训练模块(8);
警情数据模块(1),是所有警情数据的集合;例如:南巷六号,有一群人拿着棍子打架。被视为一条警情信息;
关键词获取和筛选模块(2),是用来获取警情数据中的关键词,根据实际情况剔除噪音词后规范化后形成警情类别;如获取的关键词中有手机、打架等相关词语,手机为噪音词,打架替换成为规范化术语打架斗殴后保存为一种警情类别,具体方法如下:
1.1)、将原数据拆分成词组,对词语数组的进行词性标注;
1.2)、每个词组过滤掉停用词,最终只保留词性为名词、动词的单词;如警情信息“南巷六号,有一群人拿着棍子打架。”中文分词后得到词组:南巷/六号/,/有/一群人/拿着/棍子/打架,去掉停用词以及执行此行过滤后变为一群人/拿着/棍子/打架;
1.3)、将所有结果整合得到单词的集合;
1.4)、构建词图G=(v,e),其中V为节点集合,由以上步骤生成的词组成,然后采用共现关系构造任两点之间的边,两个节点之间存在边仅当它们对应的词汇在长度为K的窗口中共现,e为上述边的集合,K表示窗口大小;即从单词组中循环选择一个单词,将其与其后面k-1个单词分别组合成k-1条边,如词组为“有/一群人/拿着/棍子/打架”,如果k为2,选择单词为“拿着”,则此时窗口为[“拿着”,”棍子”],会产生(“拿着”,1,“棍子”)一条边,边权值为1,当这条边在之后再次出现时,权值再在基础上加1;最后通过TextRank迭代算法公式计算各节点的权重,直至收敛,最终不同词语会有不同的权重值,权重值高的的词语为关键词;
TextRank迭代算法计算公式为:
Figure BDA0002247293850000051
WS(Vi)是词语i的权重值;d是阻尼系数,取值范围为0到1,代表从图中某一特定点指向其他任意点的概率,一般设置为0.85;In(Vi)是存在指向词语i的链接的词语集合;Out(Vj)是词语j中的链接存在的链接指向的词语的集合;权重项ωji,用来表示两个词语之间的边有不同的重要程度;
1.5)、根据关键词的词频过滤掉词频统计值DF小于阀值(如DFM取值20)的值以及噪音词(如手机等);
犯罪类型统计筛选模块(3)是根据刑法罪名以及治安案件类型作为参考对警情类型做相应补充;例如:补充饲养动物干扰正常生活,阻碍执行职务等类型,以防止警情类型缺失;
警情类型评估统计(4)是在得到关键词集合后,整理出如纠纷、被盗、闹事、丢失、扰民等,名词根据修饰词再做详细区分,如纠纷可分为邻里纠纷、家庭纠纷、物业纠纷等,然后将其它词根据治安法案件类型、刑法案件类型或案件命名规则对其进行同义替换,如被盗替换为盗窃。
根据具体情况将警情类型聚类,例如:殴打他人、聚众斗殴、家庭暴力可统称为打架斗殴,训练模型时标签使用聚类后的警情类型,训练后通过句式分析再得到其具体的类型;
警情数据类型关联模块(7)是根据警情类别对警情训练样本设置标签,形成语料集(X,Y),X为特征即警情数据,Y为标签即警情类型;
警情类型近义词模块(5)是获取每类警情关键词的近义词,近义词通过相似词林或词典获取;如:盗窃类警情关键词是盗窃,其近义词组为“偷盗/偷窃/扒窃/摸风”。
警情类型相似词模块(6)是获取每类警情关键词的相似词,下载维基百科语料,语料通过jieba分词将并去除停用词,使用word2vec工具将处理好的词汇映射成n维的向量,再通过向量间余弦相似度评估词之间的相似程度,如盗窃类警情关键词是盗窃,其相似词组为“强盗/偷窃/窃贼/偷盗/窃盗/盗取/偷/盗”。
警情数据类型关联模块(7)将警情类别的相关词、近义词作为关键词群后,通过模糊匹配方式得到一批有标签的数据,其中匹配方式为多词或单词模式;例如:警情类型为盗窃,关键词为盗窃,近义词组为“偷盗/偷窃/扒窃/摸风”,相关词组为“强盗/偷窃/窃贼/偷盗/窃盗/盗取/偷/盗”。警情:万达某店,报警人称保洁工偷盗财物。通过模糊匹配方式可以将此警情标记为盗窃。
在部分类型数据量少的情况下,伪造类似数据扩大训练样本量,以提高准确率。
警情分类模型训练模块(8)是训练一种基于textCNN的警情分类模型;具体方法如下:
2.1)、文本的预处理,样本分词后去除无意义的符号信息、地址、数字、停用词等冗余信息。
2.2)、文本数值化:使用word2vec工具获取特征集的词向量模型,将文本数据向量化。
2.3)、输入样本的向量化数据,使用深度学习模型Text-CNN模型进行分类训练,即通过卷积层提取语句的特征,将提取的特征输入到分类器中进行分类。
2.4)、根据结果调整参数,保存最终模型。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实例的说明只是用于帮助理解本发明的方法及其核心思想,以上所述仅是本发明的优选实施方式,应当指出,由于文字表达的有限性,而客观上存在无限的具体结构,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进、润饰或变化,也可以将上述技术特征以适当的方式进行组合;这些改进润饰、变化或组合,或未经改进将发明的构思和技术方案直接应用于其它场合的,均应视为本发明的保护范围。

Claims (3)

1.一种警情的自动分类与预测方法,其特征在于,接收单条警情数据输入,通过警情分类系统,返回警情类型;
警情分类系统包括:警情数据模块(1),关键词获取和筛选模块(2),犯罪类型统计筛选模块(3),警情类型评估统计(4),警情类型近义词模块(5),警情类型相似词模块(6),警情数据类型关联模块(7),警情分类模型训练模块(8);
警情数据模块(1),是所有警情数据的集合;
关键词获取和筛选模块(2),是用来获取警情数据中的关键词,根据实际情况剔除噪音词后规范化后形成警情类别;
犯罪类型统计筛选模块(3)是根据刑法罪名以及治安案件类型作为参考对警情类型做相应补充;
警情类型评估统计(4)是在得到关键词集合后,整理出如纠纷、被盗、闹事、丢失、扰民等,名词根据修饰词再做详细区分,然后将其它词根据治安法案件类型、刑法案件类型或案件命名规则对其进行同义替换;
根据具体情况将警情类型聚类,训练模型时标签使用聚类后的警情类型,训练后通过句式分析再得到其具体的类型;
警情数据类型关联模块(7)是根据警情类别对警情训练样本设置标签,形成语料集(X,Y),X为特征即警情数据,Y为标签即警情类型;
警情类型近义词模块(5)是获取每类警情关键词的近义词,近义词通过相似词林或词典获取;
警情类型相似词模块(6)是获取每类警情关键词的相似词,下载维基百科语料,语料通过jieba分词将并去除停用词,使用word2vec工具将处理好的词汇映射成n维的向量,再通过向量间余弦相似度评估词之间的相似程度;
警情数据类型关联模块(7)将警情类别的相关词、近义词作为关键词群后,通过模糊匹配方式得到一批有标签的数据,其中匹配方式为多词或单词模式;
警情分类模型训练模块(8)是训练一种基于textCNN的警情分类模型。
2.根据权利要求1中所述的一种警情的自动分类与预测方法,其特征在于,关键词获取和筛选模块(2)的具体方法如下:
步骤(1.1)、将原数据拆分成词组,对词语数组的进行词性标注;
步骤(1.2)、每个词组过滤掉停用词,最终只保留词性为名词、动词的单词;
步骤(1.3)、将所有结果整合得到单词的集合;
步骤(1.4)、构建词图G=(v,e),其中V为节点集合,由以上步骤生成的词组成,然后采用共现关系构造任两点之间的边,两个节点之间存在边仅当它们对应的词汇在长度为K的窗口中共现,e为上述边的集合,K表示窗口大小;最后通过TextRank迭代算法公式计算各节点的权重,直至收敛,最终不同词语会有不同的权重值,权重值高的的词语为关键词;
TextRank迭代算法计算公式为:
Figure FDA0002247293840000021
WS(Vi)是词语i的权重值;d是阻尼系数,取值范围为0到1,代表从图中某一特定点指向其他任意点的概率,一般设置为0.85;In(Vi)是存在指向词语i的链接的词语集合;
Out(Vj)是词语j中的链接存在的链接指向的词语的集合;权重项ωji,用来表示两个词语之间的边有不同的重要程度;
步骤(1.5)、根据关键词的词频过滤掉词频统计值DF小于阀值(如DFM取值20)的值以及噪音词。
3.根据权利要求1中所述的一种警情的自动分类与预测方法,其特征在于,警情分类模型训练模块(8)的具体方法如下:
步骤(2.1)、文本的预处理,样本分词后去除无意义的符号信息、地址、数字、停用词等冗余信息;
步骤(2.2)、文本数值化:使用word2vec工具获取特征集的词向量模型,将文本数据向量化;
步骤(2.3)、输入样本的向量化数据,使用深度学习模型Text-CNN模型进行分类训练,即通过卷积层提取语句的特征,将提取的特征输入到分类器中进行分类;
步骤(2.4)、根据结果调整参数,保存最终模型。
CN201911021249.XA 2019-10-25 2019-10-25 一种警情的自动分类与预测方法 Pending CN110837601A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911021249.XA CN110837601A (zh) 2019-10-25 2019-10-25 一种警情的自动分类与预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911021249.XA CN110837601A (zh) 2019-10-25 2019-10-25 一种警情的自动分类与预测方法

Publications (1)

Publication Number Publication Date
CN110837601A true CN110837601A (zh) 2020-02-25

Family

ID=69575659

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911021249.XA Pending CN110837601A (zh) 2019-10-25 2019-10-25 一种警情的自动分类与预测方法

Country Status (1)

Country Link
CN (1) CN110837601A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111444353A (zh) * 2020-04-03 2020-07-24 杭州叙简科技股份有限公司 一种警情知识图谱的构建及使用方法
CN112069324A (zh) * 2020-08-27 2020-12-11 北京灵汐科技有限公司 一种分类标签添加方法、装置、设备及存储介质
CN112434580A (zh) * 2020-11-13 2021-03-02 珠海大横琴科技发展有限公司 一种视频统计分析方法和装置
CN112927809A (zh) * 2021-03-04 2021-06-08 武汉未康未病医学有限公司 一种用于舌头诊断App的辨证论治数学模型
CN113297834A (zh) * 2021-06-18 2021-08-24 苏州智汇谷科技服务有限公司 基于警情间语义相似度判断串并案的方法及装置
CN115168594A (zh) * 2022-09-08 2022-10-11 北京星天地信息科技有限公司 警情信息处理方法和装置、电子设备和存储介质
CN115525803A (zh) * 2022-09-16 2022-12-27 深圳市海邻科信息技术有限公司 处警方法、系统、车载设备及计算机可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107894981A (zh) * 2017-12-13 2018-04-10 武汉烽火普天信息技术有限公司 一种案件语义要素的自动抽取方法
CN108241741A (zh) * 2017-12-29 2018-07-03 深圳市金立通信设备有限公司 一种文本分类方法、服务器及计算机可读存储介质
CN109033351A (zh) * 2018-07-25 2018-12-18 北京神州泰岳软件股份有限公司 案情数据的归并方法及装置
CN109255118A (zh) * 2017-07-11 2019-01-22 普天信息技术有限公司 一种关键词提取方法及装置
US20190057191A1 (en) * 2017-08-21 2019-02-21 International Business Machines Corporation Cognitive framework to identify medical case safety reports in free form text
CN109783639A (zh) * 2018-12-24 2019-05-21 银江股份有限公司 一种基于特征提取的调解案件智能分派方法及系统
CN110059311A (zh) * 2019-03-27 2019-07-26 银江股份有限公司 一种面向司法文本数据的关键词提取方法及系统
CN110196977A (zh) * 2019-05-31 2019-09-03 广西南宁市博睿通软件技术有限公司 一种智能警情督导处理系统及方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255118A (zh) * 2017-07-11 2019-01-22 普天信息技术有限公司 一种关键词提取方法及装置
US20190057191A1 (en) * 2017-08-21 2019-02-21 International Business Machines Corporation Cognitive framework to identify medical case safety reports in free form text
CN107894981A (zh) * 2017-12-13 2018-04-10 武汉烽火普天信息技术有限公司 一种案件语义要素的自动抽取方法
CN108241741A (zh) * 2017-12-29 2018-07-03 深圳市金立通信设备有限公司 一种文本分类方法、服务器及计算机可读存储介质
CN109033351A (zh) * 2018-07-25 2018-12-18 北京神州泰岳软件股份有限公司 案情数据的归并方法及装置
CN109783639A (zh) * 2018-12-24 2019-05-21 银江股份有限公司 一种基于特征提取的调解案件智能分派方法及系统
CN110059311A (zh) * 2019-03-27 2019-07-26 银江股份有限公司 一种面向司法文本数据的关键词提取方法及系统
CN110196977A (zh) * 2019-05-31 2019-09-03 广西南宁市博睿通软件技术有限公司 一种智能警情督导处理系统及方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111444353A (zh) * 2020-04-03 2020-07-24 杭州叙简科技股份有限公司 一种警情知识图谱的构建及使用方法
CN111444353B (zh) * 2020-04-03 2023-02-28 杭州叙简科技股份有限公司 一种警情知识图谱的构建及使用方法
CN112069324A (zh) * 2020-08-27 2020-12-11 北京灵汐科技有限公司 一种分类标签添加方法、装置、设备及存储介质
CN112434580A (zh) * 2020-11-13 2021-03-02 珠海大横琴科技发展有限公司 一种视频统计分析方法和装置
CN112927809A (zh) * 2021-03-04 2021-06-08 武汉未康未病医学有限公司 一种用于舌头诊断App的辨证论治数学模型
CN113297834A (zh) * 2021-06-18 2021-08-24 苏州智汇谷科技服务有限公司 基于警情间语义相似度判断串并案的方法及装置
CN115168594A (zh) * 2022-09-08 2022-10-11 北京星天地信息科技有限公司 警情信息处理方法和装置、电子设备和存储介质
CN115525803A (zh) * 2022-09-16 2022-12-27 深圳市海邻科信息技术有限公司 处警方法、系统、车载设备及计算机可读存储介质
CN115525803B (zh) * 2022-09-16 2024-02-23 深圳市海邻科信息技术有限公司 处警方法、系统、车载设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN110837601A (zh) 一种警情的自动分类与预测方法
CN109190117B (zh) 一种基于词向量的短文本语义相似度计算方法
CN105824959B (zh) 舆情监控方法及系统
CN103631834B (zh) 发掘可疑帐号的分身群组的方法与系统
CN112131863B (zh) 一种评论观点主题抽取方法、电子设备及存储介质
CN106776562A (zh) 一种关键词提取方法和提取系统
CN104281702B (zh) 基于电力关键词分词的数据检索方法及装置
CN107729468A (zh) 基于深度学习的答案抽取方法及系统
CN111950273A (zh) 基于情感信息抽取分析的网络舆情突发事件自动识别方法
CN106126619A (zh) 一种基于视频内容的视频检索方法及系统
CN112256939A (zh) 一种针对化工领域的文本实体关系抽取方法
CN111045847A (zh) 事件审计方法、装置、终端设备以及存储介质
CN111027323A (zh) 一种基于主题模型和语义分析的实体指称项识别方法
CN108038099B (zh) 基于词聚类的低频关键词识别方法
CN109635107A (zh) 多数据源的语义智能分析及事件场景还原的方法及装置
CN112131352A (zh) 一种网页文本类不良信息的检测方法与检测系统
CN111930933A (zh) 一种基于人工智能的检务案件处理方法及装置
Prabowo et al. Hierarchical multi-label classification to identify hate speech and abusive language on Indonesian twitter
CN114756675A (zh) 文本分类方法、相关设备及可读存储介质
CN109857869A (zh) 一种基于Ap增量聚类和网络基元的热点话题预测方法
CN109033351A (zh) 案情数据的归并方法及装置
CN112307364B (zh) 一种面向人物表征的新闻文本发生地抽取方法
JP2009237640A (ja) 情報抽出装置、情報抽出方法および情報抽出プログラム
CN106484672A (zh) 词汇识别方法和词汇识别系统
Butnaru BAM: A combination of deep and shallow models for German Dialect Identification.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200225