CN113779969A - 基于人工智能的案件信息处理方法、装置、设备及介质 - Google Patents

基于人工智能的案件信息处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN113779969A
CN113779969A CN202111087207.3A CN202111087207A CN113779969A CN 113779969 A CN113779969 A CN 113779969A CN 202111087207 A CN202111087207 A CN 202111087207A CN 113779969 A CN113779969 A CN 113779969A
Authority
CN
China
Prior art keywords
case information
case
information
historical
adjudication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111087207.3A
Other languages
English (en)
Inventor
罗斯洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An International Smart City Technology Co Ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202111087207.3A priority Critical patent/CN113779969A/zh
Publication of CN113779969A publication Critical patent/CN113779969A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请为人工智能技术领域,本申请提供了一种基于人工智能的案件信息处理方法、装置、设备及介质,其中,所述方法包括:获取案件信息,提取案件信息中的文本信息,对文本信息进行分词处理,得到多个词;根据预先构建的行政处罚案例库,从多个词中筛选出文本信息的特征词;分别计算案件信息与行政处罚案例库中的每一个历史案件信息的关联度,将与案件信息关联度最大的历史案件信息作为参考历史案件信息,并获取参考历史案件信息的参考裁定结果;将文本信息、特征词、参考历史案件信息及参考裁定结果输入案件裁定模型,所述案件裁定模型输出案件信息的目标裁定结果,将目标裁定结果发送给用户,以提高案件的裁定效率。

Description

基于人工智能的案件信息处理方法、装置、设备及介质
技术领域
本申请涉及人工智能技术领域,具体而言,本申请涉及一种基于人工智能的案件信息处理方法、装置、设备及介质。
背景技术
目前的执法人员在执法过程中,面临着案情工作量大,情况复杂,裁量尺度难以把握的问题,已经完成的行政处罚面临大量的行政复议和行政诉讼,需要执法人员花费大量的时间对案件进行裁定,人工裁定方式的效率较低。
发明内容
本申请的主要目的为提供一种基于人工智能的案件信息处理方法、装置、设备及介质,以提高案件的裁定效率。
为了实现上述发明目的,本申请提供一种基于人工智能的案件信息处理方法,其包括以下步骤:
获取案件信息,提取所述案件信息中的文本信息,对所述文本信息进行分词处理,得到多个词;
根据预先构建的行政处罚案例库,从所述多个词中筛选出所述文本信息的特征词;其中,所述行政处罚案例库中预存有已裁定的历史案件信息的特征词;
分别计算所述案件信息与所述行政处罚案例库中的每一个历史案件信息的关联度,将关联度最大的历史案件信息作为参考历史案件信息,并获取所述参考历史案件信息的参考裁定结果;
将所述文本信息、所述特征词、所述参考历史案件信息及所述参考裁定结果输入案件裁定模型,所述案件裁定模型输出所述案件信息的目标裁定结果;其中,所述案件裁定模型为训练好的神经网络模型,用于对输入的案件信息进行裁定;
将所述目标裁定结果发送给用户。
进一步地,所述将所述文本信息、所述特征词、所述参考历史案件信息及所述参考裁定结果输入案件裁定模型之前,还包括:
获取所有历史案件信息每个历史案件信息及已确定的裁定结果;
计算所有历史案件信息之间的关联度,将关联度最大的每两个历史案件信息进行绑定,生成历史案件信息集;
将所述历史案件信息集及对应的裁定结果输入预先构建的神经网络模型进行训练;
判断所述神经网络模型输出的训练结果是否满足要求;
若是,将当前训练结果满足要求的神经网络模型作为所述案件裁定模型。
进一步地,所述将所述历史案件信息集及对应的裁定结果输入预先构建的神经网络模型进行训练之前,还包括:
统计每个历史案件信息的字符长度,确定所述所有历史案件信息中的最长字符长度;
搭建神经网络模型,所述神经网络模型分为输入层、隐藏层和输出层;其中,所述神经网络模型的输入层尺寸为所述所有历史案件信息中的最长字符长度。
优选地,所述分别计算所述案件信息与所述行政处罚案例库中的每一个历史案件信息的关联度,包括:
从所述案件信息中提取出第一特征词,从各个所述历史案件信息中分别提取出第二特征词;
将所述第一特征词转换为第一词向量,将各个所述历史案件信息的第二特征词转换为第二词向量;
分别计算所述第一词向量与各个所述历史案件信息的第二词向量的余弦距离;
根据所述余弦距离确定所述案件信息与各个历史案件信息的关联度。
优选地,所述从所述案件信息中提取出第一特征词,包括:
提取出所述案件信息中用于反映案源、案由和/或案情的所有词汇;
统计各个所述词汇在所述案件信息中的词频;
按词频由大到小的顺序对每个所述词汇进行排序;
将词频排在前N位的词汇作为所述第一特征词;其中,所述N为正整数。
优选地,所述第一特征词包括多个,所述将所述第一特征词转换为第一词向量,包括:
将每个所述第一特征词分别转换为词向量;
计算所有所述第一特征词的词向量的平均向量,将所述平均向量作为所述第一词向量。
优选地,所述将所述目标裁定结果发送给用户,包括:
根据预先构建的规范用语库,检测所述目标裁定结果中是否存在不规范的用语;
若是,对所述不规范的用语进行规范用语替换,将替换后的所述目标裁定结果发送给用户。
本申请还提供一种基于人工智能的案件信息处理装置,其包括:
获取模块,用于获取案件信息,提取所述案件信息中的文本信息,对所述文本信息进行分词处理,得到多个词;
筛选模块,用于根据预先构建的行政处罚案例库,从所述多个词中筛选出所述文本信息的特征词;其中,所述行政处罚案例库中预存有已裁定的历史案件信息的特征词;
计算模块,用于分别计算所述案件信息与所述行政处罚案例库中的每一个历史案件信息的关联度,将关联度最大的历史案件信息作为参考历史案件信息,并获取所述参考历史案件信息的参考裁定结果;
输入模块,用于将所述文本信息、所述特征词、所述参考历史案件信息及所述参考裁定结果输入案件裁定模型,所述案件裁定模型输出所述案件信息的目标裁定结果;其中,所述案件裁定模型为训练好的神经网络模型,用于对输入的案件信息进行裁定;
发送模块,用于将所述目标裁定结果发送给用户。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述任一项所述方法的步骤。
本申请所提供的一种基于人工智能的案件信息处理方法、装置、设备及介质,通过获取案件信息,提取案件信息中的文本信息,对文本信息进行分词处理,得到多个词;根据预先构建的行政处罚案例库,从多个词中筛选出文本信息的特征词;计算案件信息与行政处罚案例库中的所有历史案件信息的关联度,将与案件信息关联度最大的历史案件信息作为参考历史案件信息,并获取参考历史案件信息的参考裁定结果;将文本信息、特征词、参考历史案件信息及参考裁定结果输入案件裁定模型,所述案件裁定模型输出案件信息的目标裁定结果,将目标裁定结果发送给用户。本申请在对案件信息进行裁定时,通过筛选出与案件信息关联度最高的历史案件信息及其裁定结果,输入案件裁定模型中,以参考关联度最高的历史案件信息的裁定结果对案件信息进行裁定,提高裁定的准确性;同时通过案件裁定模型实现对案件信息的自动裁定,并通过预先将案件信息的文本信息进行特征词提取,利用特征词对案件信息进行裁定,减少数据的处理量,提高裁定效率。
附图说明
图1为本申请一实施例的基于人工智能的案件信息处理方法的流程示意图;
图2为本申请一实施例的基于人工智能的案件信息处理装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
参考图1,本申请提出一种基于人工智能的案件信息处理方法,以服务器为执行主体,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
本申请中,该基于人工智能的案件信息处理方法用于提高案件的裁定效率,参照图1,其中一个实施例中,该基于人工智能的案件信息处理方法包括如下步骤:
S11、获取案件信息,提取所述案件信息中的文本信息,对所述文本信息进行分词处理,得到多个词;
S12、根据预先构建的行政处罚案例库,从所述多个词中筛选出所述文本信息的特征词;其中,所述行政处罚案例库中预存有已裁定的历史案件信息的特征词;
S13、分别计算所述案件信息与所述行政处罚案例库中的每一个历史案件信息的关联度,将关联度最大的历史案件信息作为参考历史案件信息,并获取所述参考历史案件信息的参考裁定结果;
S14、将所述文本信息、所述特征词、所述参考历史案件信息及所述参考裁定结果输入案件裁定模型,所述案件裁定模型输出所述案件信息的目标裁定结果;其中,所述案件裁定模型为训练好的神经网络模型,用于对输入的案件信息进行裁定;
S15、将所述目标裁定结果发送给用户。
如上述步骤S11所述,当需要对案件进行裁定时,获取该案件的案件信息,提取出案件信息中的文本信息,对文本信息进行分词处理,获得多个词。具体的,可采用最大逆向匹配法对文本信息进行分词处理,该分词算法的准确度较高,有利于提高分词的准确性。此外,还可采用结巴分词工具对文本信息进行分词处理,得到文本信息的多个词。
如上述步骤S12所述,本实施例预先构建行政处罚案例库,该行政处罚案例库汇聚执法行政处罚过程数据、案源、案情数据、历史案件信息及其对应的词,并用于记录执法区域内的各类主体的执法处罚结果。同时还可构建行政处罚反馈知识库,用于汇聚执法行政处罚后处罚执行反馈时间、相关行政复议和诉讼结果数据,还可记录执法区域内的各类主体的执法处罚效果。
本实施例根据行政处罚案例库,从多个词中筛选出行政处罚案例库存在的词,得到所述文本信息的特征词。
如上述步骤S13所述,本实施例分别计算该案件信息与行政处罚案例库中每一个历史案件信息的关联度,该关联度表征案件信息与历史案件信息的相关性,当案件信息与历史案件信息越相似时,则两者的关联度越大。根据关联度,将与案件信息关联度最大的历史案件信息作为参考历史案件信息,并获取参考历史案件信息的参考裁定结果,以基于参考历史案件信息及其参考裁定结果作为案件裁定模型的输入数据,以使案件裁定模型基于参考历史案件信息及其参考裁定结果对该案件信息作出精确裁定。
如上述步骤S14所述,通过将文本信息、特征词、参考历史案件信息及参考裁定结果输入案件裁定模型,利用案件裁定模型对案件信息进行处理,获得所述案件信息对应的目标裁定结果。其中,所述案件裁定模型是以至少一个裁判文书的案件信息和已确定的裁定结果作为训练样本,经过深度学习训练获得的。
其中,案件裁定模型可以采用不同类型的模型,例如BiBloSAN模型等。该案件信息的目标裁定结果可包括以下中的至少一项:犯罪嫌疑人姓名、是否死刑、是否无期徒刑、刑期长短、罚金数额、罪名及相关法条。
在一实施例中,可将目标裁定结果按照不同的裁定维度进行设定,其中,裁定维度可包括:涉及的法条、刑期、罪名、罚金等等。
如上述步骤S15所述,本实施例将目标裁定结果发送给用户,该用户可以是执法人员,以辅助执法人员做出判断。具体的,可通过历史业务经验积累,构建监管关键词库,如食品安全业务相关的案情信息:散装白酒、注水、抗生素超标、甲醛等检查指标,及行政处罚结果相关的:勒令整改、罚款500元、停业整顿等。同时整合手动标识和自动切词结果,优化切词依据,并通过行政处罚案例库,结合贝叶斯算法,关联当前案情与历史类似特征案件信息、及被处罚主体特征的关系。比如当对一个设立在体育场门口的销售包子的餐饮个体工商户进行处罚时,案情是“营业执照过期1个月”“未佩戴口罩”,可采集案件信息,将案件信息输入案件裁定模型,案件裁定模型可通过贝叶斯算法,关联体育场附近的个体工商户的处罚情况,同时关联历史该个体工商户的处罚情况,及本市其他食品个体工商户的处罚情况,结合对应历史案情的处罚判定结果,生成对本次案情的推荐清单,再结合行政处罚反馈知识库中处罚反馈最快,行政诉讼和行政复议最少的处罚裁量结果,形成最终行政处罚的目标裁定结果。
本申请所提供的一种基于人工智能的案件信息处理方法,通过获取案件信息,提取案件信息中的文本信息,对文本信息进行分词处理,得到多个词;根据预先构建的行政处罚案例库,从多个词中筛选出文本信息的特征词;计算案件信息与行政处罚案例库中的所有历史案件信息的关联度,将与案件信息关联度最大的历史案件信息作为参考历史案件信息,并获取参考历史案件信息的参考裁定结果;将文本信息、特征词、参考历史案件信息及参考裁定结果输入案件裁定模型,所述案件裁定模型输出案件信息的目标裁定结果,将目标裁定结果发送给用户。本申请在对案件信息进行裁定时,通过筛选出与案件信息关联度最高的历史案件信息及其裁定结果,输入案件裁定模型中,以参考关联度最高的历史案件信息的裁定结果对案件信息进行裁定,提高裁定的准确性;同时通过案件裁定模型实现对案件信息的自动裁定,并通过预先将案件信息的文本信息进行特征词提取,利用特征词对案件信息进行裁定,减少数据的处理量,提高裁定效率。
在一实施例中,所述将所述文本信息、所述特征词、所述参考历史案件信息及所述参考裁定结果输入案件裁定模型之前,还可包括:
获取所有历史案件信息每个历史案件信息及已确定的裁定结果;
计算所有历史案件信息之间的关联度,将关联度最大的每两个历史案件信息进行绑定,生成历史案件信息集;
将所述历史案件信息集及对应的裁定结果输入预先构建的神经网络模型进行训练;
判断所述神经网络模型输出的训练结果是否满足要求;
若是,将当前训练结果满足要求的神经网络模型作为所述案件裁定模型。
本实施例在对案件裁定模型进行训练时,通过获取所有历史案件信息及已人工确定的裁定结果,然后计算所有历史案件信息之间的关联度,对于任一历史案件信息,将与其关联度最大的历史案件信息进行绑定,以实现将关联度最大的两个历史案件信息进行两两绑定,因此,一个历史案件信息可以绑定一个其他历史案件信息;也可以绑定多个其他历史案件信息,且在绑定时,分别与每个其他历史案件信息进行两两绑定,然后将两两绑定的历史案件信息作为一个历史案件信息集,因此,对于每个历史案件信息集中的某个历史案件信息,与其绑定的是关联度最大的其他历史案件信息。例如,若有M个历史案件信息,对于M个历史案件信息中的历史案件信息A、B和C,如果与A关联度最大的是B,与C关联度最大的也是B,则将A与B进行绑定,得到一个历史案件信息集,同时将B与C也进行绑定,得到另一个历史案件信息集。
最后将所述历史案件信息集及对应的裁定结果输入神经网络模型中进行多次训练,并计算每次训练之后的神经网络模型的损失值是否低于预设值,若是,则判定神经网络模型输出的训练结果满足要求,并将当前训练结果满足要求的神经网络模型作为案件裁定模型,以利用训练好的案件裁定模型对案件信息进行裁定,提高案件信息裁定的准确度。
在一实施例中,所述将所述历史案件信息集及对应的裁定结果输入预先构建的神经网络模型进行训练之前,还包括:
统计每个历史案件信息的字符长度,确定所述所有历史案件信息中的最长字符长度;
搭建神经网络模型,所述神经网络模型分为输入层、隐藏层和输出层;其中,所述神经网络模型的输入层尺寸为所述所有历史案件信息中的最长字符长度。
本实施例搭建神经网络,采用多层感知机模型,进行训练,多层感知机深度学习模型的结构,分为输入层、隐藏层和输出层,模型输入层尺寸为所有历史案件信息中字符长度最长的最长字符长度,以确保能对大量的案件信息进行裁定。
对于案件信息中的罚款金额的裁定,由于罚款金额预测是预测连续值的回归问题,因此神经网络模型的输出层可设置为只有一个神经元节点,并且只需线性变换,无需激活函数。
在一实施例中,在步骤S13中,所述分别计算所述案件信息与所述行政处罚案例库中的每一个历史案件信息的关联度,可具体包括:
S131、从所述案件信息中提取出第一特征词,从各个所述历史案件信息中分别提取出第二特征词;
S132、将所述第一特征词转换为第一词向量,将各个所述历史案件信息的第二特征词转换为第二词向量;
S133、分别计算所述第一词向量与各个所述历史案件信息的第二词向量的余弦距离;
S134、根据所述余弦距离确定所述案件信息与各个历史案件信息的关联度。
本实施例可从案件信息中提取出最具代表性的第一特征词,该第一特征词用于反映案件信息的案情,并提取出每个历史案件信息的特征词,得到第二特征词,然后利用词向量工具将第一特征词转换为词向量,得到第一词向量,将多个第二特征词也转换为词向量,得到每个第二特征词对应的第二词向量;最后分别计算所述第一词向量与多个所述第二词向量的余弦距离,根据所述余弦距离确定所述案件信息与所述行政处罚案例库中的所有历史案件信息的关联度,以精准地筛选出与案件信息最相关的历史案件信息,作为参考。其中,该关联度与余弦距离成正比。
在一实施例中,在步骤S131中,所述从所述案件信息中提取出第一特征词,可具体包括:
S1311、提取出所述案件信息中用于反映案源、案由和/或案情的所有词汇;
S1312、统计各个所述词汇在所述案件信息中的词频;
S1313、按词频由大到小的顺序对每个所述词汇进行排序;
S1314、将词频排在前N位的词汇作为所述第一特征词;其中,所述N为正整数。
本实施例在提取第一特征词时,可提取出案件信息的所有词汇,且所有词汇都是用于反映案件信息的案源、案由和/或案情,如时间、位置、事件,然后计算每个词汇在案件信息的词频,即每个词汇在案件信息出现的次数,按词频由大到小的顺序对每个词汇进行排序,并将词频排在最前列的词汇作为所述第一特征词,从而从案件信息中精确地筛选出用于反映案情的词汇。
其中,案由指的是政府执法部门对特定违法行为进行处罚的职权。基于违法事实,识别与该违法事实相对应的案由,可以提高执法人员在执法过程中的工作效率,并且能够防止由于执法人员因为业务不熟练导致对案由的错误判定;对于执法监督人员来说,案由识别同样有意义。
在一实施例中,所述第一特征词包括多个,所述将所述第一特征词转换为第一词向量,包括:
将每个所述第一特征词分别转换为词向量;
计算所有所述第一特征词的词向量的平均向量,将所述平均向量作为所述第一词向量。
本实施例可利用预先训练好的Word2Vec词向量模型将每个所述第一特征词分别转换为词向量,得到各个所述第一特征词对应的词向量,并计算所有所述第一特征词的词向量的平均向量,将平均向量作为第一词向量。其中,所述计算所有所述第一特征词的词向量的平均向量,包括将各个所述第一特征词的词向量进行列平均。此处列平均即分别将各个第一特征词的词向量的各个位置的数值与其他第一特征词的词向量的同一个位置的数值求平均值,最后得到一个与各个词向量长度相同的平均向量,作为所述第一词向量。
其中,Word2Vec词向量模型是从大量文本中学习语义知识的一种模型,采用无监督的方式。其通过训练大量文本,将文本中的词用向量形式表示,这个向量我们称之为词向量,可以通过计算两个词的词向量之间的距离,从而得知两个词之间的联系。
此外,还可直接从词向量库中查询每个所述第一特征词对应的词向量,所述词向量库包括多个基于GloVe训练的词向量。GloVe的全称叫Global Vectors for WordRepresentation,它是一个基于全局词频统计的词表征工具,它可以把一个单词表达成一个由实数组成的向量,这些向量捕捉到了单词之间一些语义特性,比如相似性、类比性等。
在一实施例中,在步骤S15中,所述将所述目标裁定结果发送给用户,可具体包括:
S151、根据预先构建的规范用语库,检测所述目标裁定结果中是否存在不规范的用语;
S152、若是,对所述不规范的用语进行规范用语替换,将替换后的所述目标裁定结果发送给用户。
在本实施例中,裁定结果一般为文本信息,记录了案件信息人员是否存在违法行为,由于裁定结果属于法律范畴,因此需对裁定结果进行规范用语检测,具体可根据预先构建的规范用语库检测裁定结果中是否存在不规范的用语,如裁定结果中是否存在方言、口语或逻辑错误的词汇,若是,则参照规范用语库,对所述不规范的用语进行规范用语替换,将替换后的述裁定结果发送给用户,以确保裁定结果符合用语要求。
参照图2,本申请实施例中还提供一种基于人工智能的案件信息处理装置,包括:
获取模块11,用于获取案件信息,提取所述案件信息中的文本信息,对所述文本信息进行分词处理,得到多个词;
筛选模块12,用于根据预先构建的行政处罚案例库,从所述多个词中筛选出所述文本信息的特征词;其中,所述行政处罚案例库中预存有已裁定的历史案件信息的特征词;
计算模块13,用于分别计算所述案件信息与所述行政处罚案例库中的每一个历史案件信息的关联度,将关联度最大的历史案件信息作为参考历史案件信息,并获取所述参考历史案件信息的参考裁定结果;
输入模块14,用于将所述文本信息、所述特征词、所述参考历史案件信息及所述参考裁定结果输入案件裁定模型,所述案件裁定模型输出所述案件信息的目标裁定结果;其中,所述案件裁定模型为训练好的神经网络模型,用于对输入的案件信息进行裁定;
发送模块15,用于将所述目标裁定结果发送给用户。
本实施例中,当需要对案件进行裁定时,获取该案件的案件信息,提取出案件信息中的文本信息,对文本信息进行分词处理,获得多个词。具体的,可采用最大逆向匹配法对文本信息进行分词处理,该分词算法的准确度较高,有利于提高分词的准确性。此外,还可采用结巴分词工具对文本信息进行分词处理,得到文本信息的多个词。
本实施例预先构建行政处罚案例库,该行政处罚案例库汇聚执法行政处罚过程数据、案源、案情数据、历史案件信息及其对应的词,并用于记录执法区域内的各类主体的执法处罚结果。同时还可构建行政处罚反馈知识库,用于汇聚执法行政处罚后处罚执行反馈时间、相关行政复议和诉讼结果数据,还可记录执法区域内的各类主体的执法处罚效果。
本实施例根据行政处罚案例库,从多个词中筛选出行政处罚案例库存在的词,得到所述文本信息的特征词。
本实施例分别计算该案件信息与行政处罚案例库中每一个历史案件信息的关联度,该关联度表征案件信息与历史案件信息的相关性,当案件信息与历史案件信息越相似时,则两者的关联度越大。根据关联度,将与案件信息关联度最大的历史案件信息作为参考历史案件信息,并获取参考历史案件信息的参考裁定结果,以基于参考历史案件信息及其参考裁定结果作为案件裁定模型的输入数据,以使案件裁定模型基于参考历史案件信息及其参考裁定结果对该案件信息作出精确裁定。
此外,通过将文本信息、特征词、参考历史案件信息及参考裁定结果输入案件裁定模型,利用案件裁定模型对案件信息进行处理,获得所述案件信息对应的目标裁定结果。其中,所述案件裁定模型是以至少一个裁判文书的案件信息和已确定的裁定结果作为训练样本,经过深度学习训练获得的。
其中,案件裁定模型可以采用不同类型的模型,例如BiBloSAN模型等。该案件信息的目标裁定结果可包括以下中的至少一项:犯罪嫌疑人姓名、是否死刑、是否无期徒刑、刑期长短、罚金数额、罪名及相关法条。
在一实施例中,可将目标裁定结果按照不同的裁定维度进行设定,其中,裁定维度可包括:涉及的法条、刑期、罪名、罚金等等。
本实施例将目标裁定结果发送给用户,该用户可以是执法人员,以辅助执法人员做出判断。具体的,可通过历史业务经验积累,构建监管关键词库,如食品安全业务相关的案情信息:散装白酒、注水、抗生素超标、甲醛等检查指标,及行政处罚结果相关的:勒令整改、罚款500元、停业整顿等。同时整合手动标识和自动切词结果,优化切词依据,并通过行政处罚案例库,结合贝叶斯算法,关联当前案情与历史类似特征案件信息、及被处罚主体特征的关系。比如当对一个设立在体育场门口的销售包子的餐饮个体工商户进行处罚时,案情是“营业执照过期1个月”“未佩戴口罩”,可采集案件信息,将案件信息输入案件裁定模型,案件裁定模型可通过贝叶斯算法,关联体育场附近的个体工商户的处罚情况,同时关联历史该个体工商户的处罚情况,及本市其他食品个体工商户的处罚情况,结合对应历史案情的处罚判定结果,生成对本次案情的推荐清单,再结合行政处罚反馈知识库中处罚反馈最快,行政诉讼和行政复议最少的处罚裁量结果,形成最终行政处罚的目标裁定结果。
如上所述,可以理解地,本申请中提出的所述基于人工智能的案件信息处理装置的各组成部分可以实现如上所述基于人工智能的案件信息处理方法任一项的功能,具体结构不再赘述。
参照图3,本申请实施例中还提供一种计算机设备,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质存储有操作系统、计算机程序和数据库。该内存器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储文本信息、目标裁定结果等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的案件信息处理方法。
上述处理器执行上述的基于人工智能的案件信息处理方法,包括:
获取案件信息,提取所述案件信息中的文本信息,对所述文本信息进行分词处理,得到多个词;
根据预先构建的行政处罚案例库,从所述多个词中筛选出所述文本信息的特征词;其中,所述行政处罚案例库中预存有已裁定的历史案件信息的特征词;
分别计算所述案件信息与所述行政处罚案例库中的每一个历史案件信息的关联度,将关联度最大的历史案件信息作为参考历史案件信息,并获取所述参考历史案件信息的参考裁定结果;
将所述文本信息、所述特征词、所述参考历史案件信息及所述参考裁定结果输入案件裁定模型,所述案件裁定模型输出所述案件信息的目标裁定结果;其中,所述案件裁定模型为训练好的神经网络模型,用于对输入的案件信息进行裁定;
将所述目标裁定结果发送给用户。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种基于人工智能的案件信息处理方法,包括步骤:
获取案件信息,提取所述案件信息中的文本信息,对所述文本信息进行分词处理,得到多个词;
根据预先构建的行政处罚案例库,从所述多个词中筛选出所述文本信息的特征词;其中,所述行政处罚案例库中预存有已裁定的历史案件信息的特征词;
分别计算所述案件信息与所述行政处罚案例库中的每一个历史案件信息的关联度,将关联度最大的历史案件信息作为参考历史案件信息,并获取所述参考历史案件信息的参考裁定结果;
将所述文本信息、所述特征词、所述参考历史案件信息及所述参考裁定结果输入案件裁定模型,所述案件裁定模型输出所述案件信息的目标裁定结果;其中,所述案件裁定模型为训练好的神经网络模型,用于对输入的案件信息进行裁定;
将所述目标裁定结果发送给用户。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
综上所述,本申请的最大有益效果在于:
本申请所提供的一种基于人工智能的案件信息处理方法、装置、设备及介质,通过获取案件信息,提取案件信息中的文本信息,对文本信息进行分词处理,得到多个词;根据预先构建的行政处罚案例库,从多个词中筛选出文本信息的特征词;计算案件信息与行政处罚案例库中的所有历史案件信息的关联度,将与案件信息关联度最大的历史案件信息作为参考历史案件信息,并获取参考历史案件信息的参考裁定结果;将文本信息、特征词、参考历史案件信息及参考裁定结果输入案件裁定模型,所述案件裁定模型输出案件信息的目标裁定结果,将目标裁定结果发送给用户。本申请在对案件信息进行裁定时,通过筛选出与案件信息关联度最高的历史案件信息及其裁定结果,输入案件裁定模型中,以参考关联度最高的历史案件信息的裁定结果对案件信息进行裁定,提高裁定的准确性;同时通过案件裁定模型实现对案件信息的自动裁定,并通过预先将案件信息的文本信息进行特征词提取,利用特征词对案件信息进行裁定,减少数据的处理量,提高裁定效率。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种基于人工智能的案件信息处理方法,其特征在于,包括:
获取案件信息,提取所述案件信息中的文本信息,对所述文本信息进行分词处理,得到多个词;
根据预先构建的行政处罚案例库,从所述多个词中筛选出所述文本信息的特征词;其中,所述行政处罚案例库中预存有已裁定的历史案件信息的特征词;
分别计算所述案件信息与所述行政处罚案例库中的每一个历史案件信息的关联度,将关联度最大的历史案件信息作为参考历史案件信息,并获取所述参考历史案件信息的参考裁定结果;
将所述文本信息、所述特征词、所述参考历史案件信息及所述参考裁定结果输入案件裁定模型,所述案件裁定模型输出所述案件信息的目标裁定结果;其中,所述案件裁定模型为训练好的神经网络模型,用于对输入的案件信息进行裁定;
将所述目标裁定结果发送给用户。
2.根据权利要求1所述的方法,其特征在于,所述将所述文本信息、所述特征词、所述参考历史案件信息及所述参考裁定结果输入案件裁定模型之前,还包括:
获取所有历史案件信息每个历史案件信息及已确定的裁定结果;
计算所有历史案件信息之间的关联度,将关联度最大的每两个历史案件信息进行绑定,生成历史案件信息集;
将所述历史案件信息集及对应的裁定结果输入预先构建的神经网络模型进行训练;
判断所述神经网络模型输出的训练结果是否满足要求;
若是,将当前训练结果满足要求的神经网络模型作为所述案件裁定模型。
3.根据权利要求2所述的方法,其特征在于,所述将所述历史案件信息集及对应的裁定结果输入预先构建的神经网络模型进行训练之前,还包括:
统计每个历史案件信息的字符长度,确定所述所有历史案件信息中的最长字符长度;
搭建神经网络模型,所述神经网络模型分为输入层、隐藏层和输出层;其中,所述神经网络模型的输入层尺寸为所述所有历史案件信息中的最长字符长度。
4.根据权利要求1所述的方法,其特征在于,所述分别计算所述案件信息与所述行政处罚案例库中的每一个历史案件信息的关联度,包括:
从所述案件信息中提取出第一特征词,从各个所述历史案件信息中分别提取出第二特征词;
将所述第一特征词转换为第一词向量,将各个所述历史案件信息的第二特征词转换为第二词向量;
分别计算所述第一词向量与各个所述历史案件信息的第二词向量的余弦距离;
根据所述余弦距离确定所述案件信息与各个历史案件信息的关联度。
5.根据权利要求4所述的方法,其特征在于,所述从所述案件信息中提取出第一特征词,包括:
提取出所述案件信息中用于反映案源、案由和/或案情的所有词汇;
统计各个所述词汇在所述案件信息中的词频;
按词频由大到小的顺序对每个所述词汇进行排序;
将词频排在前N位的词汇作为所述第一特征词;其中,所述N为正整数。
6.根据权利要求4所述的方法,其特征在于,所述第一特征词包括多个,所述将所述第一特征词转换为第一词向量,包括:
将每个所述第一特征词分别转换为词向量;
计算所有所述第一特征词的词向量的平均向量,将所述平均向量作为所述第一词向量。
7.根据权利要求1所述的方法,其特征在于,所述将所述目标裁定结果发送给用户,包括:
根据预先构建的规范用语库,检测所述目标裁定结果中是否存在不规范的用语;
若是,对所述不规范的用语进行规范用语替换,将替换后的所述目标裁定结果发送给用户。
8.一种基于人工智能的案件信息处理装置,其特征在于,包括:
获取模块,用于获取案件信息,提取所述案件信息中的文本信息,对所述文本信息进行分词处理,得到多个词;
筛选模块,用于根据预先构建的行政处罚案例库,从所述多个词中筛选出所述文本信息的特征词;其中,所述行政处罚案例库中预存有已裁定的历史案件信息的特征词;
计算模块,用于分别计算所述案件信息与所述行政处罚案例库中的每一个历史案件信息的关联度,将关联度最大的历史案件信息作为参考历史案件信息,并获取所述参考历史案件信息的参考裁定结果;
输入模块,用于将所述文本信息、所述特征词、所述参考历史案件信息及所述参考裁定结果输入案件裁定模型,所述案件裁定模型输出所述案件信息的目标裁定结果;其中,所述案件裁定模型为训练好的神经网络模型,用于对输入的案件信息进行裁定;
发送模块,用于将所述目标裁定结果发送给用户。
9.一种计算机设备,其特征在于,包括:
处理器;
存储器;
计算机程序,其中所述计算机程序被存储在所述存储器中并被配置为由所述处理器执行,所述计算机程序配置用于执行根据权利要求1至7任一项所述的基于人工智能的案件信息处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现权利要求1-7任一项所述的基于人工智能的案件信息处理方法。
CN202111087207.3A 2021-09-16 2021-09-16 基于人工智能的案件信息处理方法、装置、设备及介质 Pending CN113779969A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111087207.3A CN113779969A (zh) 2021-09-16 2021-09-16 基于人工智能的案件信息处理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111087207.3A CN113779969A (zh) 2021-09-16 2021-09-16 基于人工智能的案件信息处理方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN113779969A true CN113779969A (zh) 2021-12-10

Family

ID=78851397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111087207.3A Pending CN113779969A (zh) 2021-09-16 2021-09-16 基于人工智能的案件信息处理方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113779969A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115525734A (zh) * 2022-09-19 2022-12-27 雅安市生态环境局 一种用于法制审查的文本生成方法、系统、介质及设备
CN117592818A (zh) * 2024-01-17 2024-02-23 武汉理工大学 一种非法捕捞事件的辅助决策方法及装置
CN117609487A (zh) * 2024-01-19 2024-02-27 武汉百智诚远科技有限公司 基于人工智能的法律条文快速检索方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111242307A (zh) * 2018-11-13 2020-06-05 北大方正集团有限公司 基于深度学习的裁判结果获取方法、装置及存储介质
CN111506727A (zh) * 2020-04-16 2020-08-07 腾讯科技(深圳)有限公司 文本内容类别获取方法、装置、计算机设备和存储介质
WO2021012645A1 (zh) * 2019-07-22 2021-01-28 创新先进技术有限公司 推送信息的生成方法及装置
CN112288604A (zh) * 2020-11-19 2021-01-29 平安国际智慧城市科技股份有限公司 司法案件数据处理方法、装置、电子设备及可读存储介质
WO2021042560A1 (zh) * 2019-09-03 2021-03-11 平安科技(深圳)有限公司 一种案件辅助信息的提示方法、装置、存储介质和服务器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111242307A (zh) * 2018-11-13 2020-06-05 北大方正集团有限公司 基于深度学习的裁判结果获取方法、装置及存储介质
WO2021012645A1 (zh) * 2019-07-22 2021-01-28 创新先进技术有限公司 推送信息的生成方法及装置
WO2021042560A1 (zh) * 2019-09-03 2021-03-11 平安科技(深圳)有限公司 一种案件辅助信息的提示方法、装置、存储介质和服务器
CN111506727A (zh) * 2020-04-16 2020-08-07 腾讯科技(深圳)有限公司 文本内容类别获取方法、装置、计算机设备和存储介质
CN112288604A (zh) * 2020-11-19 2021-01-29 平安国际智慧城市科技股份有限公司 司法案件数据处理方法、装置、电子设备及可读存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115525734A (zh) * 2022-09-19 2022-12-27 雅安市生态环境局 一种用于法制审查的文本生成方法、系统、介质及设备
CN117592818A (zh) * 2024-01-17 2024-02-23 武汉理工大学 一种非法捕捞事件的辅助决策方法及装置
CN117592818B (zh) * 2024-01-17 2024-04-09 武汉理工大学 一种非法捕捞事件的辅助决策方法及装置
CN117609487A (zh) * 2024-01-19 2024-02-27 武汉百智诚远科技有限公司 基于人工智能的法律条文快速检索方法及系统
CN117609487B (zh) * 2024-01-19 2024-04-09 武汉百智诚远科技有限公司 基于人工智能的法律条文快速检索方法及系统

Similar Documents

Publication Publication Date Title
CN113779969A (zh) 基于人工智能的案件信息处理方法、装置、设备及介质
CN104182805B (zh) 基于服刑人员行为特征集成学习模型的危险倾向预测方法
WO2020147395A1 (zh) 基于情感的文本分类处理方法、装置和计算机设备
JP6306400B2 (ja) クラウドソーシングにおける作業者のスキルを評価するスキル評価装置、プログラム及び方法
KR20210075511A (ko) 재난대응 추천방법 및 그 장치
CN111126233B (zh) 基于距离值的通话通道构建方法、装置和计算机设备
CN115828112A (zh) 一种故障事件的响应方法、装置、电子设备及存储介质
CN113724819B (zh) 医疗命名实体识别模型的训练方法、装置、设备及介质
CN114007131A (zh) 视频监控方法、装置及相关设备
CN114399379A (zh) 基于人工智能的催收行为识别方法、装置、设备及介质
CN110770781A (zh) 法律信息处理系统、方法和程序
CN113704396A (zh) 短文本分类方法、装置、设备及存储介质
CN113889262A (zh) 基于模型的数据预测方法、装置、计算机设备和存储介质
CN115658905A (zh) 一种跨篇章的事件多维画像生成方法
CN114881173A (zh) 基于自注意力机制的简历分类方法和装置
CN114639175A (zh) 考试作弊行为预测方法、装置、设备及存储介质
CN113918679A (zh) 一种知识问答方法、装置及工程机械
CN113435753A (zh) 高危行业中企业风险判定方法、装置、设备及介质
Blackmore et al. Data mining of missing persons data
CN114648688A (zh) 高铁沿线景观等级评估方法、系统、设备及可读存储介质
CN113343699A (zh) 日志安全风险的监测方法、装置、电子设备及介质
CN116756324B (zh) 基于庭审音频的关联度挖掘方法、装置、设备及存储介质
CN112069806A (zh) 简历筛选方法、装置、电子设备及存储介质
CN115936431B (zh) 再犯罪风险评估方法、装置、计算机设备及可读存储介质
CN117056836B (zh) 程序分类模型的训练、程序类目识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination