CN115099213A - 一种信息处理方法和信息处理系统 - Google Patents

一种信息处理方法和信息处理系统 Download PDF

Info

Publication number
CN115099213A
CN115099213A CN202110572694.6A CN202110572694A CN115099213A CN 115099213 A CN115099213 A CN 115099213A CN 202110572694 A CN202110572694 A CN 202110572694A CN 115099213 A CN115099213 A CN 115099213A
Authority
CN
China
Prior art keywords
documents
preset information
comparison
compared
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110572694.6A
Other languages
English (en)
Inventor
朱瑞作
刘军
李建鹏
周春
张宏
李颖姝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
People's Procuratorate Of Qingdao City Shandong Province
Beijing Zetyun Tech Co ltd
Original Assignee
People's Procuratorate Of Qingdao City Shandong Province
Beijing Zetyun Tech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by People's Procuratorate Of Qingdao City Shandong Province, Beijing Zetyun Tech Co ltd filed Critical People's Procuratorate Of Qingdao City Shandong Province
Priority to CN202110572694.6A priority Critical patent/CN115099213A/zh
Publication of CN115099213A publication Critical patent/CN115099213A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/168Details of user interfaces specifically adapted to file systems, e.g. browsing and visualisation, 2d or 3d GUIs

Abstract

本发明提供一种信息处理方法和信息处理系统,涉及信息处理领域,该信息处理方法包括:获取待比对的案件文书;将所述待比对案件文书的预设信息类型对应的内容进行比对;显示比对结果;其中,所述待比对的案件文书包括:起诉意见文书、起诉文书和判决文书中的至少两项。本发明实施例通过自动进行三种文书对比,以提高办案效能,减少瑕疵案件,并节约人力成本。

Description

一种信息处理方法和信息处理系统
技术领域
本发明涉及信息处理技术领域,尤其涉及一种信息处理方法和信息处理系统。
背景技术
一个案件,通常对应三个文书,包括司法机关的起诉意见书、司法机关的起诉书、司法机关的判决书。处理案件时为保证每案必审、每案必准,通常需要做起诉意见书、起诉书、判决书三个文书之间的对比,判断文书之间是否有差异。若有差异,则需要对该案件进行复查,检查案件是否存在瑕疵;若无差异,则认为该案件不存在问题,可进行结案处理。当前的方式是人工进行三种文书对比,耗时、耗力,而且容易出错。
发明内容
本发明实施例提供一种信息处理方法和数据处理系统,可以解决当前案件处理过程中三书对比步骤耗时、耗力、容易出错的问题。
为解决上述技术问题,本发明提供一种信息处理方法,所述方法包括
获取待比对的案件文书;
将所述待比对案件文书的预设信息类型对应的内容进行比对;
显示比对结果。
可选的,上述信息处理方法中,所述将所述待比对案件文书的预设信息类型对应的内容进行比对的步骤之前,所述方法还包括:
对所述待比对的案件文书进行预处理,得到目标案件文书。
可选的,上述信息处理方法中,所述对所述待比对的案件文书进行预处理,得到目标案件文书的步骤之后,所述方法还包括:
对所述目标案件文书进行文本处理,得到所述目标案件文书的预设信息类型对应的内容。
可选的,上述信息处理方法中,所述对所述目标案件文书进行文本处理,得到所述目标案件文书的预设信息类型对应的内容的步骤包括:
从所述目标案件文书提取所述预设信息类型对应的文本内容所在的文本段落;
基于与所述预先信息类型对应的关键词提取方式从所述文本段落中提取所述预设信息类型对应的关键词。
可选的,上述信息处理方法中,所述将所述待比对案件文书的所述预设信息类型对应的内容进行比对的步骤包括:基于提取出的所述关键词,对所述预设信息类型对应的内容进行比对。
可选的,上述信息处理方法中,其特征在于,所述预设信息类型包括如下至少一项:人员基本信息、罪名信息、引用法条、特定关键词、刑期刑种与量刑建议和主要犯罪事实。
可选的,上述信息处理方法中,若所述预设信息类型为所述特定关键词,所述基于与所述预先信息类型对应的关键词提取方式从所述文本段落中提取所述预设信息类型对应的关键词的步骤包括:
确定所述文本段落中是否存在与所述预设特定关键词词典对应的特定关键词;
若存在,从所述文本段落中提取所述预设信息类型对应的特定关键词。
可选的,上述信息处理方法中,若所述预设信息类型为所述刑期刑种与量刑建议,所述将所述各个待比对案件文书的所述预设信息类型对应的内容进行比对的步骤包括:
获取量刑建议表;
提取所述量刑建议表中的第一刑期刑种;
将所述待比对的案件文书中的所述刑期刑种与量刑建议与所述第一刑期刑种进行比对。
可选的,上述信息处理方法中,若所述预设信息类型为主要犯罪事实,所述将所述待比对案件文书的所述预设信息类型对应的内容进行比对的步骤包括:
通过正则表达式从所述各个目标案件文书提取各个所述主要犯罪事实的文本内容;
将各个所述主要犯罪事实的文本内容分割为句子;
计算所述待比对的案件文书的句子之间的相似度;
根据计算出的相似度对所述主要犯罪事实进行比对。
可选的,上述信息处理方法中,所述显示比对结果的步骤包括:
若比对结果为不一致,显示比对不一致的预设信息类型以及预设信息类型对应的待比对文书。
本发明提供一种信息处理系统,所述信息处理系统包括:
获取模块,用于获取待比对的案件文书;
比对模块,用于将所述待比对案件文书的预设信息类型对应的内容进行比对;
显示模块,用于显示比对结果。
可选的,所述信息处理系统还包括:
预处理模块,用于对所述待比对的案件文书进行预处理,得到目标案件文书。
可选的,所述信息处理系统还包括:
文本处理模块,用于对所述目标案件文书进行文本处理,得到所述目标案件文书的预设信息类型对应的内容。
可选的,所述文本处理模块包括:
第一提取子模块,用于从所述目标案件文书提取所述预设信息类型对应的文本内容所在的文本段落;
第二提取子模块,用于基于与所述预先信息类型对应的关键词提取方式从所述文本段落中提取所述预设信息类型对应的关键词;
所述比对模块具体用于:
基于提取出的所述关键词,对所述预设信息类型对应的内容进行比对。
可选的,所述预设信息类型包括如下至少一项:人员基本信息、罪名信息、引用法条、特定关键词、刑期刑种与量刑建议和主要犯罪事实。
可选的,若所述预设信息类型为所述特定关键词,所述第二提取模块具体用于:
确定所述文本段落中是否存在与所述预设特定关键词词典对应的特定关键词;
若存在,从所述文本段落中提取所述预设信息类型对应的特定关键词。
可选的,若所述预设信息类型为刑期刑种与量刑建议,所述比对模块具体用于:
获取量刑建议表;
提取所述量刑建议表中的第一刑期刑种;
将所述待比对的案件文书中的所述刑期刑种与量刑建议与所述第一刑期刑种进行比对。
可选的,若所述预设信息类型为主要犯罪事实,所述比对模块具体用于:
通过正则表达式从所述各个目标案件文书提取各个所述主要犯罪事实的文本内容;
将各个所述主要犯罪事实的文本内容分割为句子;
计算所述待比对的案件文书的句子之间的相似度;
根据计算出的相似度对所述主要犯罪事实进行比对。
可选的,所述显示模块具体用于:
若比对结果为不一致,显示比对不一致的预设信息类型以及预设信息类型对应的待比对文书。
本发明还提供一种信息处理系统,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述处理方法的步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上述信息处理方法的步骤。
本发明实施例通过自动进行三种文书对比,提高办案效能,减少瑕疵案件,节约人力成本。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简要介绍,显而易见地,下述附图仅仅是本发明的一些实施例。对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,可根据附图获取其他的附图。
图1是本发明实施例提供的一种信息方法的流程图;
图2是本发明实施例提供的一种信息处理系统的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明实施例提供的信息处理方法的流程图,所述数据处理方法应用于信息处理系统,如图1所示,所述信息处理方法包括以下步骤:
步骤101,获取待比对的案件文书。
具体的,所述待比对的案件文书包括:起诉意见文书、起诉文书和判决文书中的至少两项。其中,起诉意见文书起诉文书和判决文书均是由司法机关书写的。
步骤102,将所述待比对案件文书的预设信息类型对应的内容进行比对。
具体的,所述预设信息类型包括如下至少一项:人员基本信息、罪名信息、引用法条、特定关键词、刑期刑种与量刑建议和主要犯罪事实。其中,人员的基本信息包括人员的身份证号、姓名、强制措施等;罪名和法条是存在于国家机关颁布的罪名词典和法律条文中的规范名称。案件中特定关键词比对是对三种文书中涉及的特定关键词进行比对。特定关键词包含有从重情节,加重情节,从轻情节,减轻情节,累犯,前科,自首立功,重大立功退赃,积极缴纳罚金,积极赔偿,和解谅解等,其中,特定关键词是用户输入的。刑期刑种与结构化数据中的量刑建议比对是针对判决书中的刑期刑种与存在检察机关的业务数据库中的量刑建议的比对。主要犯罪事实是否一致是针对不同案件文书中的犯罪事实分别进行比对后得出的。
所述将所述待比对案件文书的预设信息类型对应的内容进行比对的步骤之前,所述方法还包括:对所述待比对的案件文书进行预处理,得到目标案件文书;
其中,所述预处理包括以下至少一项:字符替换和删除特殊字符。
可选的,所述对所述待比对的案件文书进行预处理,得到目标案件文书的步骤之后,所述方法还包括:
对所述目标案件文书进行文本处理,得到所述目标案件文书的预设信息类型对应的内容。
可选的,所述对所述目标案件文书进行文本处理,得到所述目标案件文书的预设信息类型对应的内容的步骤包括:
从所述目标案件文书提取所述预设信息类型对应的文本内容所在的文本段落;
基于与所述预先信息类型对应的关键词提取方式从所述文本段落中提取所述预设信息类型对应的关键词。
其中,所述将所述待比对案件文书的所述预设信息类型对应的内容进行比对的步骤包括:基于提取出的所述关键词,对所述预设信息类型对应的内容进行比对。
可选的是,从所述目标案件文书提取所述预设信息类型对应的文本内容所在的文本段落包括:根据与该预设信息类型对应的正则表达式从目标案件文书中获取对应的文本段落;或者,还可以搜索预设信息类型包含的信息,定位目标文本段落,从而确定该目标文本段落为预设信息类型对应的文本内容所在的文本段落。其中,上述获取预设信息类型对应的文本内容所在的文本段落的方式为本发明提供的可行的实现方式,本发明对于获取预设信息类型对应的文本内容所在的文本段落的实现方式不做限定。
具体的,所述预设信息类型包括人员基本信息时,所述将所述各个待比对案件文书的所述预设信息类型对应的内容进行比对的步骤包括:
将所述待比对的案件文书中所述人员基本信息对应的关键词进行比对,得到第一比对结果。
具体的,对获取的待比对的案件文书做预处理。例如,把文书当中的英文标点符号替换成中文的标点符号、去除文件中的空格、Tab键等。根据正则表达式技术,分别从待比对的案件文书中提取人员基础信息所在的段落。然后根据关键词提取技术,分别从待比对的案件文书中提取所需关键词即人员基础信息,包括:人员的身份证号、姓名、强制措施。其中,关键词提取技术包括:正则表达式、LDA算法、文本匹配等,本发明实施例优选使用正则表达式提取相关信息。例如,身份证号提取是利用正则表达式技术来提取人员基础信息的关键词中的身份证号;姓名提取是利用文本处理技术提取人员基础信息的关键词中的姓名;强制措施提取是利用文本匹配技术提取人员基础信息的关键词中的强制措施。将起诉意见书中的人员基础信息、起诉书中的人员基础信息、判决书中的人员基础信息分别进行对比。若都一致,案件文书的人员基础信息对比结束。若不完全一致,则对人员基础信息进行两两对比。人员基础信息对比结果可以存储到数据库中的人员基础信息对比表中。人员基础信息对比表共有 5个字段,包括:部门受案号,对比接口标识(1代表三种文书进行对比;2代表起诉意见书、起诉书进行对比;3代表起诉意见书、判决书进行对比;4代表起诉书、判决书进行对比;5代表无法进行对比),对比结果标识(0是对比结果一致,1是对比结果不一致),对比详情,数据插入时间(该时间为案件文书对比结果插入司法机关数据库的时间,即得到案件文书对比结果的时间)。
具体的,所述预设信息类型包括罪名信息时,所述将所述待比对案件文书的所述预设信息类型对应的内容进行比对的步骤包括:
将所述待比对的案件文书中所述罪名信息对应的关键词进行比对,得到第二比对结果。
具体的,对获取的待比对的案件文书做预处理。例如把文书当中的英文标点符号替换成中文的标点符号、去除文件中的空格、Tab键等。根据正则表达式技术,分别从案件文书中提取罪名所在的段落根据关键词提取技术,分别从案件文书中提取所需关键词即罪名。其中,关键词提取技术包括:正则表达式、 LDA算法、文本匹配等,本发明实施例优选的是通过正则表达式提取相关信息。若起诉意见书中的罪名、起诉书中的罪名、判决书中的罪名进行对比,若都一致,案件文书的罪名对比结束。若不完全一致,再对任意两种文书中的罪名进行两两比对。罪名对比结果可以存储到数据库中的罪名对比表中罪名对比表共有5个字段,包括,部门受案号,案件文书对比类别,对比结果,对比详情,数据插入时间,其中,该数据插入时间为案件文书对比结果插入司法机关数据库的时间,即得到案件文书对比结果的时间。例如,案件文书对比类别可以用对比接口标识表示进行对比的文书类别,如1代表三种文书进行对比,2代表起诉意见书、起诉书进行对比,3代表起诉意见书、判决书进行对比,4代表起诉书、判决书进行对比,5代表无法进行对比;对比结果可以用对比结果标识表示对比结果,例如0是表示对比结果一致,1是表示对比结果不一致。
可选的,所述预设信息类型包括引用法条,所述将所述待比对案件文书的所述预设信息类型对应的内容进行比对的步骤包括:
将所述待比对的案件文书中所述引用法条对应的关键词进行比对,得到第三比对结果。
具体的,对获取的待比对的案件文书做预处理。比如把文书当中的英文标点符号替换成中文的标点符号、去除文件中的空格、Tab键等。根据正则表达式技术,分别从案件文书中提取法条所在的段落根据关键词提取技术,分别从案件文书中提取所需关键词即法条,其中,关键词提取技术包括:正则表达式、 LDA算法、文本匹配等,本发明优先的是通过正则表达式提取相关信息。起诉意见书中的法条、起诉书中的法条、判决书中的法条进行对比,若都一致,三种文书的法条对比结束。若不完全一致,再对任意两种文书中的法条进行两两对比。法条对比结果可以存储到数据库中的法条对比表中。法条对比表共有5 个字段,包括:部门受案号,案件文书对比类别,对比结果,对比详情,数据插入时间,其中,该数据插入时间为案件文书对比结果插入司法机关数据库的时间,即得到案件文书对比结果的时间。例如,案件文书对比类别可以用1代表三种文书进行对比;2代表起诉意见书、起诉书进行对比;3代表起诉意见书、判决书进行对比;4代表起诉书、判决书进行对比;5代表无法进行对比,对比结果可以用对比结果标识表示对比结果,例如0是对比结果一致,1是对比结果不一致。
可选的,若所述预设信息类型为所述特定关键词,所述基于与所述预先信息类型对应的关键词提取方式从所述文本段落中提取所述预设信息类型对应的关键词的步骤包括:
确定所述文本段落中是否存在与所述预设特定关键词词典对应的特定关键词;
若存在,从所述文本段落中提取所述预设信息类型对应的特定关键词。
可选的,若所述预设信息类型为特定关键词,所述将所述各个待比对案件文书的所述预设信息类型对应的内容进行比对的步骤包括:
将所述待比对的案件文书中的所述特定关键词进行比对,得到第四比对结果。
具体的,对获取的待比对的案件文书做预处理。比如把文书当中的英文标点符号替换成中文的标点符号、去除文件中的空格、Tab键等。根据文本匹配技术,分别从案件文书中提取特定关键词,其中,特定关键词包括但不限于下述至少之一:从重情节,加重情节,从轻情节,减轻情节,累犯,前科,自首立功,重大立功,退赃,积极缴纳罚金,积极赔偿,和解谅解等。
具体的,案件文书对比模块中预存用户录入的特定关键词词典,案件文书对比模块根据特定关键词词典,利用文本匹配技术,确定文件中是否存在特定关键词。若存在,该特定关键词获取成功。将起诉意见书中的特定关键词、起诉书中的特定关键词、判决书中的特定关键词进行对比。若一致,三种文书的特定关键词对比结束。若不完全一致,再对任意二种文书中的特定关键词进行两两对比。特定关键词对比结果,可以存储到Oracle数据库中的特定关键词对比表中。特定关键词对比表共有5个字段,包括,部门受案号,案件文书对比类别,对比结果,对比详情,数据插入时间,其中,该数据插入时间为三书对比结果插入司法机关数据库的时间,即得到三书对比结果的时间。例如,案件文书对比类别可以用对比接口标识表示进行对比的文书类别,如1代表三种文书进行对比;2代表起诉意见书、起诉书进行对比;3代表起诉意见书、判决书进行对比;4代表起诉书、判决书进行对比;5代表无法进行对比,对比结果可以用对比结果标识表示对比结果,例如0是对比结果一致,1是对比结果不一致。
可选的,若所述预设信息类型为刑期刑种与量刑建议,所述将所述各个待比对案件文书的所述预设信息类型对应的内容进行比对的步骤包括:
获取量刑建议表;
提取所述量刑建议表中的第一刑期刑种;
将所述待比对的案件文书中的所述刑期刑种与量刑建议与所述第一刑期刑种进行比对,得到第五比对结果。
具体的,从业务系统获取预先存储的量刑建议表,读取量刑建议。对判决书做文本处理,例如把文书当中的英文标点符号替换成中文的标点符号、去除文件中的空格、Tab键等。根据正则表达式技术,从判决书中提取刑期刑种所在的段落根据中文分词、词性标注、语法树解析、短语块提取等技术,提取判决书中的刑期刑种,例如提取下面一句话的刑期刑种:“被告人冯某犯走私废物罪,判处有期徒刑二年,并处罚金人民币十万元”这样就会把刑期刑种“有期徒刑二年”提取出来。根据字符串分割、中文分词、词性标注、语法树解析、短语块提取等技术,提取量刑建议中的刑期刑种。对判决书中刑种、量刑建议中的刑种进行比对;把判决书中的刑期以及量刑建议中的刑期都转换粒度为天,刑期进行比对。若判决书中的刑期刑种与量刑建议中的刑期刑种都一致,则对比一致,否则不一致。刑期刑种、量刑建议对比结果,可以存储到数据库中的刑期刑种、量刑建议对比表中。刑期刑种、量刑建议对比表共有4个字段,包括部门受案号,案件文书对比类别,对比结果,对比详情,数据插入时间,其中,该数据插入时间为三书对比结果插入司法机关数据库的时间,即得到三书对比结果的时间。例如,案件文书对比类别可以用对比接口标识表示进行对比的文书类别,如1代表三种文书进行对比,2代表起诉意见书、起诉书进行对比,3代表起诉意见书、判决书进行对比,4代表起诉书、判决书进行对比,5 代表无法进行对比;对比结果可以用对比结果标识表示对比结果,例如0是对比结果一致,1是对比结果不一致。
可选的,若所述预设信息类型为主要犯罪事实,所述将所述各个待比对案件文书的所述预设信息类型对应的内容进行比对的步骤包括:
通过正则表达式从所述目标案件文书提取各个所述主要犯罪事实的文本内容;
将各个所述主要犯罪事实的文本内容分割为句子;
计算所述待比对的案件文书的句子之间的相似度;
根据计算出的相似度对所述主要犯罪事实进行比对。
具体的,对待比对案件文书做文本预处理,例如把文书当中的英文标点符号替换成中文的标点符号、去除文件中的空格、Tab键等。根据正则表达式技术,从案件文书中分别提取对应的犯罪事实文本。把整个犯罪事实文本分割成句子,去掉句子中的停用词。以三个文书犯罪事实的文本作为训练输入,训练词嵌入模型,使用的词嵌入模型是FastText模型。分别计算第一个文本的每一个句子,与第二个文本的句子的相似度。句子与句子之间相似度的计算方法: (1)使用FastText模型先把句子分词,然后把各个分词的词向量加起来,得到句子的词向量。再用余弦距离,计算句子与句子之间的相似度。(2)以第一个文本的一个句子,作为基准,循环计算该句子与所有第二个文本的句子之间的相似度,然后取一系列相似度的最大值,作为第一个文本的一个句子与第二个文本句子的相似度。取第一个文本的每一个句子与第二个文本句子之间相似度的平均值作为二个文本的相似度。将起诉意见书中的犯罪事实、起诉书中的犯罪事实、判决书中的犯罪事实进行对比,若一致(两两文本相似度都大于0.8),三种文书的犯罪事实对比结束。若不完全一致(两两文本相似度小于等于0.8),再对任意二种文书中的犯罪事实进行两两对比。两两比对是为找出相似度小于 0.8的二种文书。犯罪事实对比结果可以存储到e数据库中的犯罪事实对比表中。犯罪事实对比表共有5个字段,包括:部门受案号,案件文书对比类别,对比结果,对比详情,数据插入时间,其中,该数据插入时间为三书对比结果插入司法机关数据库的时间,即得到三书对比结果的时间。例如,案件文书对比类别可以用对比接口标识表示进行对比的文书类别,如1代表三书进行对比;2 代表起诉意见书、起诉书进行对比;3代表起诉意见书、判决书进行对比;4代表起诉书、判决书进行对比;5代表无法进行对比,对比结果可以用对比结果标识表示对比结果,例如0是对比结果一致,1是对比结果不一致。
步骤103,显示比对结果。
其中,所述显示比对结果的步骤包括:若比对结果为不一致,显示比对不一致的预设信息类型以及预设信息类型对应的待比对文书。
可以以列表、图表、文本等多样的展示方式比对结果。具体的,统计三种文书对比结果中比较结果为不一致的预设信息类型,以及导致比较结果不一致的情况,以表格或图表形式进行展示。其中,导致比较结果不一致的原因情况包括:三种文书均不一致、判决书与起诉书不一致,判决书与起诉意见书不一致,起诉书与起诉意见书不一致。另外,还可以将结果为不一致的文书内容提取出来,并通过文本形式进行展示。
例如,起诉意见书中人员姓名为冯XX,性别为男性,48岁,起诉书中人员姓名为赵XX,性别为男性,48岁,判决书中人员姓名为冯XX,性别为女性, 38岁。上述三书对比结果以列表展示为:
预设信息类型 原因
人员基本信息 三书均不一致
本发明实施例通过自动进行三种文书对比,提高办案效能,减少瑕疵案件数量,节约人力成本。
基于同一发明构思,请参考图2,本发明实施例还提供一种信息处理系统,所述信息处理系统包括:
获取模块201,用于获取待比对的案件文书;
比对模块202,用于将所述待比对案件文书的预设信息类型对应的内容进行比对;
显示模块203,用于显示比对结果。
可选的,所述信息处理系统还包括:
预处理模块,用于对所述待比对的案件文书进行预处理,得到目标案件文书。
可选的,所述信息处理系统还包括:
文本处理模块,用于对所述目标案件文书进行文本处理,得到所述目标案件文书的预设信息类型对应的内容。
可选的,所述文本处理模块包括:
第一提取子模块,用于从所述目标案件文书提取所述预设信息类型对应的文本内容所在的文本段落;
第二提取子模块,用于基于与所述预先信息类型对应的关键词提取方式从所述文本段落中提取所述预设信息类型对应的关键词。
所述比对模块202具体用于:
基于提取出的所述关键词,对所述预设信息类型对应的内容进行比对。
可选的,所述预设信息类型包括如下至少一项:人员基本信息、罪名信息、引用法条、特定关键词、刑期刑种与量刑建议和主要犯罪事实。
可选的,若所述预设信息类型为所述特定关键词,所述第二提取模块具体用于:
确定所述文本段落中是否存在与所述预设特定关键词词典对应的特定关键词;
若存在,则从所述文本段落中提取所述预设信息类型对应的特定关键词。
可选的,若所述预设信息类型为刑期刑种与量刑建议,所述比对模块202 具体用于:
获取量刑建议表;
提取所述量刑建议表中的第一刑期刑种;
将所述待比对的案件文书中的所述刑期刑种与量刑建议与所述第一刑期刑种进行比对。
可选的,若所述预设信息类型为主要犯罪事实,所述比对模块202具体用于:
通过正则表达式从所述目标案件文书提取各个所述主要犯罪事实的文本内容;
将各个所述主要犯罪事实的文本内容分割成为句子;
计算所述待比对的案件文书的句子之间的相似度;
根据计算出的相似度对所述主要犯罪事实进行比对。
可选的,所述显示模块303具体用于:
若比对结果为不一致,显示比对不一致的预设信息类型以及预设信息类型对应的待比对文书。
本发明实施例提供一种信息处理系统,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述实施例所述的信息处理方法的步骤。
本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上述实施例所述的信息处理方法的步骤。
本发明实施例还提供一种可读存储介质,可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述信息处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种信息处理方法,其特征在于,所述方法包括:
获取待比对的案件文书;
将所述待比对案件文书的预设信息类型对应的内容进行比对;
显示比对结果。
2.根据权利要求1所述的信息处理方法,其特征在于,所述将所述待比对案件文书的预设信息类型对应的内容进行比对的步骤之前,所述方法还包括:
对所述待比对的案件文书进行预处理,得到各个目标案件文书。
3.根据权利要求2所述的信息处理方法,其特征在于,所述对所述待比对的案件文书进行预处理,得到各个目标案件文书的步骤之后,所述方法还包括:
对所述各个目标案件文书进行文本处理,得到所述各个目标案件文书的预设信息类型对应的内容。
4.根据权利要求3所述的信息处理方法,其特征在于,所述对所述各个目标案件文书进行文本处理,得到所述各个目标案件文书的预设信息类型对应的内容的步骤包括:
从所述各个目标案件文书提取所述预设信息类型对应的文本内容所在的文本段落;
基于与所述预先信息类型对应的关键词提取方式从所述文本段落中提取所述预设信息类型对应的关键词。
5.根据权利要求1-4任一项所述的信息处理方法,其特征在于,所述显示比对结果的步骤包括:
若比对结果为不一致,显示比对不一致的预设信息类型以及预设信息类型对应的待比对文书。
6.一种信息处理系统,其特征在于,所述信息处理系统包括:
获取模块,用于获取待比对的案件文书;
比对模块,用于将所述待比对案件文书的预设信息类型对应的内容进行比对;
显示模块,用于显示比对结果。
7.根据权利要求6所述的信息处理系统,其特征在于,所述信息处理系统还包括:
预处理模块,用于对所述待比对的案件文书进行预处理,得到各个目标案件文书。
8.根据权利要求7所述的信息处理系统,其特征在于,所述信息处理系统还包括:
文本处理模块,用于对所述各个目标案件文书进行文本处理,得到所述各个目标案件文书的预设信息类型对应的内容。
9.根据权利要求8所述的信息处理系统,其特征在于,所述文本处理模块包括:
第一提取子模块,用于从所述各个目标案件文书提取所述预设信息类型对应的文本内容所在的文本段落;
第二提取子模块,用于基于与所述预先信息类型对应的关键词提取方式从所述文本段落中提取所述预设信息类型对应的关键词。
10.根据权利要求6-9任一项所述的信息处理系统,其特征在于,所述显示模块具体用于:
若比对结果为不一致,显示比对不一致的预设信息类型以及预设信息类型对应的待比对文书。
CN202110572694.6A 2021-05-25 2021-05-25 一种信息处理方法和信息处理系统 Pending CN115099213A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110572694.6A CN115099213A (zh) 2021-05-25 2021-05-25 一种信息处理方法和信息处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110572694.6A CN115099213A (zh) 2021-05-25 2021-05-25 一种信息处理方法和信息处理系统

Publications (1)

Publication Number Publication Date
CN115099213A true CN115099213A (zh) 2022-09-23

Family

ID=83287192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110572694.6A Pending CN115099213A (zh) 2021-05-25 2021-05-25 一种信息处理方法和信息处理系统

Country Status (1)

Country Link
CN (1) CN115099213A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116629804A (zh) * 2023-06-06 2023-08-22 河北华正信息工程有限公司 一种信访督查跟踪管理系统及管理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116629804A (zh) * 2023-06-06 2023-08-22 河北华正信息工程有限公司 一种信访督查跟踪管理系统及管理方法
CN116629804B (zh) * 2023-06-06 2024-01-09 河北华正信息工程有限公司 一种信访督查跟踪管理系统及管理方法

Similar Documents

Publication Publication Date Title
US11687719B2 (en) Post-filtering of named entities with machine learning
CN110163478B (zh) 一种合同条款的风险审查方法及装置
CN110597964B (zh) 一种双录质检语义分析方法、装置及双录质检系统
KR102289935B1 (ko) 인공지능 기반의 법률 문서 분석 시스템 및 방법
CN111209411B (zh) 一种文档分析的方法及装置
EP3591539A1 (en) Parsing unstructured information for conversion into structured data
CN112632989B (zh) 一种合同文本中风险信息的提示方法、装置及设备
US11880435B2 (en) Determination of intermediate representations of discovered document structures
CN113935710A (zh) 一种合同审核的方法、装置、电子设备及存储介质
CN117114514A (zh) 一种基于大数据的人才信息分析管理方法、系统及装置
US20210390488A1 (en) Citation and policy based document classification
CN110610003A (zh) 用于辅助文本标注的方法和系统
CN115099213A (zh) 一种信息处理方法和信息处理系统
CN113392637A (zh) 基于tf-idf的主题词提取方法、装置、设备及存储介质
CN110955796A (zh) 一种基于笔录信息的案件特征信息提取方法及装置
CN113449083B (zh) 作业安全管理方法、装置、设备及存储介质
CN112989820B (zh) 法律文书定位方法、装置、设备及存储介质
CN111191049B (zh) 信息推送方法、装置、计算机设备和存储介质
WO2021137166A1 (en) Domain based text extraction
CN115098642A (zh) 数据处理方法、装置、计算机设备及存储介质
CN115130459A (zh) 一种用于文档的自动化信息抽象处理的方法和系统
BR102019008715A2 (pt) método de identificação de fraude de endereço em um documento eletrônico de comprovante de residência.
CN113204710A (zh) 一种舆情分析方法、装置、终端设备及存储介质
CN115147854A (zh) 一种文本处理方法及装置
WO2022191769A1 (en) Kyc method and kyc platform for correction of raw text without use of text regions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination