CN111241274B - 刑事法律文书处理方法和装置、存储介质和电子设备 - Google Patents
刑事法律文书处理方法和装置、存储介质和电子设备 Download PDFInfo
- Publication number
- CN111241274B CN111241274B CN201911421891.7A CN201911421891A CN111241274B CN 111241274 B CN111241274 B CN 111241274B CN 201911421891 A CN201911421891 A CN 201911421891A CN 111241274 B CN111241274 B CN 111241274B
- Authority
- CN
- China
- Prior art keywords
- case
- label
- sample
- criminal
- types
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 15
- 238000013145 classification model Methods 0.000 claims abstract description 46
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000012216 screening Methods 0.000 claims description 26
- 238000000605 extraction Methods 0.000 claims description 20
- 230000000007 visual effect Effects 0.000 claims description 17
- 238000012512 characterization method Methods 0.000 claims description 10
- 230000014509 gene expression Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 description 14
- 229940079593 drug Drugs 0.000 description 12
- 239000003814 drug Substances 0.000 description 12
- 239000013598 vector Substances 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 238000011840 criminal investigation Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 244000025254 Cannabis sativa Species 0.000 description 2
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 2
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 2
- GVGLGOZIDCSQPN-PVHGPHFFSA-N Heroin Chemical compound O([C@H]1[C@H](C=C[C@H]23)OC(C)=O)C4=C5[C@@]12CCN(C)[C@@H]3CC5=CC=C4OC(C)=O GVGLGOZIDCSQPN-PVHGPHFFSA-N 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 235000009120 camo Nutrition 0.000 description 2
- 235000005607 chanvre indien Nutrition 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 229960002069 diamorphine Drugs 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 239000011487 hemp Substances 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Alarm Systems (AREA)
Abstract
本公开涉及一种刑事法律文书处理方法和装置、存储介质和电子设备,所述方法包括:将刑事法律文书输入预训练的标签分类模型;获取所述标签分类模型输出的案件标签;其中,所述标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签。
Description
技术领域
本公开涉及文本处理领域,具体地,涉及一种刑事法律文书处理方法和装置、存储介质和电子设备。
背景技术
在刑事案件的办理过程中,涉及到许多非结构化的法律文书,例如起诉书、判决书、刑事自述状等,在这些法律文书中,案情相关的信息散布在各种语段中,难以系统地提取到案情相关的信息。当用户需要查看案情相关的信息时,需要将这些文件一一浏览并手动提取有用的信息,不仅效率较低,而且容易因漏读而忽略相关的信息。
发明内容
本公开的目的是提供一种刑事法律文书处理方法和装置、存储介质和电子设备,以解决上述的技术问题。
为了实现上述目的,本公开的第一方面,提供一种刑事法律文书处理方法。
可选地,所述方法包括:将刑事法律文书输入预训练的标签分类模型;获取所述标签分类模型输出的案件标签;其中,所述标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签。
可选地,所述方法还包括:将所述刑事法律文书和所述案件标签作为一个案件信息,存入案件数据库。
可选地,所述方法还包括:根据所述案件数据库中的案件信息,生成可视化的展示结果,所述展示结果用于展示所述案件数据库中的案件数量和/ 或所述案件信息的所述案件标签。
本公开的第二方面,提供一种刑事法律文书处理装置。所述装置包括:输入模块,用于将刑事法律文书输入预训练的标签分类模型;获取模块,用于获取所述标签分类模型输出的案件标签;其中,所述标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签。
可选地,所述装置还包括:存储模块,用于将所述刑事法律文书和所述案件标签作为一个案件信息,存入案件数据库。
可选地,所述装置还包括:展示模块,用于根据所述案件数据库中的案件信息,生成可视化的展示结果,所述展示结果用于展示所述案件数据库中的案件数量和/或所述案件信息的所述案件标签。
可选地,所述装置还包括:筛选模块,用于获取筛选条件,并根据所述筛选条件和所述案件标签,从案件数据库中确定目标案件信息;所述展示模块,用于根据目标案件信息生成可视化的展示结果;其中,所述筛选条件包括时间段条件、案件类型条件、涉案人员条件、案件地区条件、经案人员条件、涉案金额条件、作案次数条件。
本公开的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开的第一方面中任一项所述方法的步骤。
本公开的第四方面,提供一种电子设备,包括:存储器,其上存储有计算机程序;处理器,用于执行所述存储器中的所述计算机程序,以实现本公开的第一方面中任一项所述方法的步骤。
通过上述技术方案,通过使用样本法律文书、样本案件类型和样本标签训练得到的标签分类模型自动从刑事法律文书中提取案情相关的案件标签,使用户在需要查看案件情况时能够快速地提取到案件中的有效信息,提高了用户对刑事法律文书中的信息的提取及处理效率,且整个过程减少了人工参与,从而减少了案件信息被遗漏的风险。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是根据一示例性公开实施例示出的一种刑事法律文书处理方法的流程图。
图2是根据一示例性公开实施例示出的一种刑事法律文书处理方法的流程图。
图3是根据一示例性公开实施例示出的一种刑事法律文书处理装置的框图。
图4是根据一示例性公开实施例示出的一种电子设备的框图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
图1是根据一示例性公开实施例示出的一种刑事法律文书处理方法的流程图。该方法可以应用于检务相关的软件、应用程序、系统中,如图1所示,该方法包括以下步骤:
S11、将刑事法律文书输入预训练的标签分类模型。
其中,刑事法律文书可以是起诉书、判决书、刑事自述状、逮捕状等各种在刑事案件中可能使用到的文书资料,并且,在本实施例中,对一个案件而言,不拘于是输入一个法律文书(如仅输入一份起诉书),还是输入案件相关的所有法律文书,标签分类模型可以对一次输入的所有文件进行处理,得到一个案件相关的案件标签。
S12、获取所述标签分类模型输出的案件标签。
案件标签可以是以“标签类型:标签结果值”的形式生成的,例如,对一个毒品犯罪案件而言,该案件标签可以包括以下的内容:
涉案人员(主犯):李某
涉案人员(从犯):无
毒品类型:大麻700g
毒品类型:海洛因1000g
犯罪类型:走私毒品
作案时间:20XX年X月X日
量刑:死刑(缓期两年执行)
减轻情节:无
加重情节:累犯
经案人员:张某(法官)、王某(检察官)、徐某(书记员)
对于一个故意伤害罪而言,该案件标签可以包括以下的内容:
涉案人员(主犯):李某
涉案人员(从犯):无
作案时间:20XX年X月X日
作案工具:水果刀
被害人情况:死亡
量刑:无期徒刑
减轻情节:自首
加重情节:致人死亡
经案人员:张某(法官)、王某(检察官)、徐某(书记员)
值得说明的是,上述案件类型和案件类型对应的标签类型仅作为举例说明,并非对本公开中的案件类型与标签类型的对应关系的限定。并且,对于不同案件类型的刑事法律文书,其得到的标签类型也不相同,例如只有毒品犯罪才会涉及毒品类型标签,只有人身伤害类型的犯罪才会涉及作案工具标签。案件类型与标签类型的对应关系可以是预先存储的对应表格,在输入了刑事法律文书时,标签分类模型先确定该刑事法律文书对应的案件类型,再从表格中查询该案件类型对应的标签类型;该案件类型与标签类型的对应关系也可以是通过标签分类模型对样本法律文书、样本案件类型及样本标签训练得到的。
标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签。
标签分类模型包括了语言表征模块、属性抽取模块、关系提取模块。
语言表征模块的其编码器由一个多头的自注意力机制和全连接的前馈网络构成,多头自注意力机制可以在多个文本信息子空间提取注意力信息,使得模型的注意力并不仅仅局限于单个的信息源,而是同时注意到输入序列的多个位置上的输入,并且在输入层加入了词向量的位置编码信息。解码器将编码器的输出馈送至另一个多头注意力机制,最后下层依然是一个前馈网络。通过语言表征模块,可以将刑事法律文书转换成模型的其他模块可以处理的文字编码文件。
属性抽取模块采用了基于层级注意力机制的弱监督属性抽取方法,先使用粗粒度的句子级别注意力机制选择几个与属性类型相关的句子,然后使用分段卷积神经网络和词级别的注意力机制提取每个句子的特征,最后使用细粒度的句子级别注意力机制筛选与实体之间的属性语义关系更相关的句子特征,得到整个句子集合的向量表示,并将该向量表示传给一个分类器来预测实体之间的属性语义关系。
关系提取模块首先使用双向长短期记忆网络来提取词之间的依赖信息;其次使用卷积神经网络来获取句子的更抽象的特征表示,并将该特征表示传给一个多标签分类器来预测句子中包含的语义关系;最后将双向长短期记忆网络提取的词向量与多标签分类器预测的关系向量进行联合,并传递给另一个长短期记忆网络来预测每个词的标签,得到每个关系对应的实体对。
通过上述三个模块对样本法律文书、样本案件类型和样本标签的学习,标签分类模型可以学习到不同的样本标签与文字表述之间的关系,从而在获取到输入的刑事法律文书后,通过分析刑事法律文书中的文字表述,生成对应的案件标签。
在一种可能的实施方式中,在获得了案件标签之后,还可以将所述刑事法律文书和所述案件标签作为一个案件信息,存入案件数据库。
案件数据库中存有多个案件信息,每个案件信息中都包括一组刑事法律文书以及对应的案件标签。
在应用时,可以直接对单个案件的案件信息进行展示,或者对单个案件的案件标签进行展示。还可以根据所述案件数据库中的案件信息,生成可视化的展示结果,所述展示结果用于展示所述案件数据库中的案件数量和/或所述案件信息的所述案件标签。
该可视化的展示结果可以以饼状图、折线图、柱状图、人物关系网络等方式展示。例如,可以根据数据库中的案件的涉案人员年龄段,生成犯罪年龄段占比的饼状图,可以根据数据库中的案件的数量变化,生成犯罪数量月变化折线图,可以根据数据库中的同类案件的量刑情况生成柱状图进行对比查看,还可以根据相同的涉案人员或经案人员生成标注了不同案件情况的人物关系网络图。这样,可以使生成的案件标签更直观地展示给用户,进一步提高用户提取刑事法律文书中的案情信息的效率。
通过上述技术方案,通过使用样本法律文书、样本案件类型和样本标签训练得到的标签分类模型自动从刑事法律文书中提取案情相关的案件标签,使用户在需要查看案件情况时能够快速地提取到案件中的有效信息,提高了用户对刑事法律文书中的信息的提取及处理效率,且整个过程减少了人工参与,从而减少了案件信息被遗漏的风险。
图2是根据一示例性公开实施例示出的一种刑事法律文书处理方法的流程图。该方法可以应用于检务相关的软件、应用程序、系统中,如图2所示,该方法包括以下步骤:
S21、将刑事法律文书输入预训练的标签分类模型。
其中,刑事法律文书可以是起诉书、判决书、刑事自述状、逮捕状等各种在刑事案件中可能使用到的文书资料,并且,在本实施例中,对一个案件而言,不拘于是输入一个法律文书(如仅输入一份起诉书),还是输入案件相关的所有法律文书,标签分类模型可以对一次输入的所有文件进行处理,得到一个案件相关的案件标签。
S22、获取所述标签分类模型输出的案件标签。
案件标签可以是以“标签类型:标签结果值”的形式生成的,例如,对一个毒品犯罪案件而言,该案件标签可以包括以下的内容:
涉案人员(主犯):李某
涉案人员(从犯):无
毒品类型:大麻700g
毒品类型:海洛因1000g
犯罪类型:走私毒品
作案时间:20XX年X月X日
量刑:死刑(缓期两年执行)
减轻情节:无
加重情节:累犯
经案人员:张某(法官)、王某(检察官)、徐某(书记员)
对于一个故意伤害罪而言,该案件标签可以包括以下的内容:
涉案人员(主犯):李某
涉案人员(从犯):无
作案时间:20XX年X月X日
作案工具:水果刀
被害人情况:死亡
量刑:无期徒刑
减轻情节:自首
加重情节:致人死亡
经案人员:张某(法官)、王某(检察官)、徐某(书记员)
值得说明的是,上述案件类型和案件类型对应的标签类型仅作为举例说明,并非对本公开中的案件类型与标签类型的对应关系的限定。并且,对于不同案件类型的刑事法律文书,其得到的标签类型也不相同,例如只有毒品犯罪才会涉及毒品类型标签,只有人身伤害类型的犯罪才会涉及作案工具标签。案件类型与标签类型的对应关系可以是预先存储的对应表格,在输入了刑事法律文书时,标签分类模型先确定该刑事法律文书对应的案件类型,再从表格中查询该案件类型对应的标签类型;该案件类型与标签类型的对应关系也可以是通过标签分类模型对样本法律文书、样本案件类型及样本标签训练得到的。
标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签。
标签分类模型包括了语言表征模块、属性抽取模块、关系提取模块。
语言表征模块的其编码器由一个多头的自注意力机制和全连接的前馈网络构成,多头自注意力机制可以在多个文本信息子空间提取注意力信息,使得模型的注意力并不仅仅局限于单个的信息源,而是同时注意到输入序列的多个位置上的输入,并且在输入层加入了词向量的位置编码信息。解码器将编码器的输出馈送至另一个多头注意力机制,最后下层依然是一个前馈网络。通过语言表征模块,可以将刑事法律文书转换成模型的其他模块可以处理的文字编码文件。
属性抽取模块采用了基于层级注意力机制的弱监督属性抽取方法,先使用粗粒度的句子级别注意力机制选择几个与属性类型相关的句子,然后使用分段卷积神经网络和词级别的注意力机制提取每个句子的特征,最后使用细粒度的句子级别注意力机制筛选与实体之间的属性语义关系更相关的句子特征,得到整个句子集合的向量表示,并将该向量表示传给一个分类器来预测实体之间的属性语义关系。
关系提取模块首先使用双向长短期记忆网络来提取词之间的依赖信息;其次使用卷积神经网络来获取句子的更抽象的特征表示,并将该特征表示传给一个多标签分类器来预测句子中包含的语义关系;最后将双向长短期记忆网络提取的词向量与多标签分类器预测的关系向量进行联合,并传递给另一个长短期记忆网络来预测每个词的标签,得到每个关系对应的实体对。
通过上述三个模块对样本法律文书、样本案件类型和样本标签的学习,标签分类模型可以学习到不同的样本标签与文字表述之间的关系,从而在获取到输入的刑事法律文书后,通过分析刑事法律文书中的文字表述,生成对应的案件标签。
S23、将所述刑事法律文书和所述案件标签作为一个案件信息,存入案件数据库。
案件数据库中存有多个案件信息,每个案件信息中都包括一组刑事法律文书以及对应的案件标签。
S24、获取筛选条件。
在使用数据库中的数据生成可视化的展示结果前,可以先获取用户输入的筛选条件,其中,所述筛选条件包括时间段条件、案件类型条件、涉案人员条件、案件地区条件、经案人员条件、涉案金额条件、作案次数条件。
S25、根据所述筛选条件和所述案件标签,从案件数据库中确定目标案件信息。
通过筛选对案件标签的筛选,可以从案件数据库中确定多个目标案件信息。例如,当获取到用户输入的“涉案人员:张某”的筛选条件时,可以从案件数据库中筛选案件标签包括了“涉案人员:张某”标签的案件信息作为目标案件信息;当获取到用户输入的“案件地区:北京”的筛选条件时,可以从案件数据库中筛选案件标签包括了“案件地区:北京”标签的案件信息作为目标案件信息;当在2019年12月31日获取到了用户输入的“案件时间:一年内”的筛选条件时,可以从案件数据库中筛选案件标签的作案时间 (或判决时间)标签结果为“2018年12月31日”至“2019年12月31日”之间的案件信息作为目标案件信息。
S26、根据目标案件信息生成可视化的展示结果。
该可视化的展示结果可以以饼状图、折线图、柱状图、人物关系网络等方式展示。例如,可以根据数据库中的案件的涉案人员年龄段,生成犯罪年龄段占比的饼状图,可以根据数据库中的案件的数量变化,生成犯罪数量月变化折线图,可以根据数据库中的同类案件的量刑情况生成柱状图进行对比查看,还可以根据相同的涉案人员或经案人员生成标注了不同案件情况的人物关系网络图。这样,可以使生成的案件标签更直观地展示给用户,进一步提高用户提取刑事法律文书中的案情信息的效率。
通过上述技术方案,通过使用样本法律文书、样本案件类型和样本标签训练得到的标签分类模型自动从刑事法律文书中提取案情相关的案件标签,使用户在需要查看案件情况时能够快速地提取到案件中的有效信息,提高了用户对刑事法律文书中的信息的提取及处理效率,且整个过程减少了人工参与,从而减少了案件信息被遗漏的风险,并且,可以根据用户输入的筛选条件确定符合筛选条件的案件信息,并根据这些案件信息生成可视化的展示结果,使生成的案件标签更直观地展示给用户,进一步提高用户提取刑事法律文书中的案情信息的效率。
图3是根据一示例性公开实施例示出的一种刑事法律文书处理装置的框图。该装置可以应用于检务相关的软件、应用程序、系统中,如图3所示,所述装置300包括:
输入模块301,用于将刑事法律文书输入预训练的标签分类模型。
获取模块302,用于获取所述标签分类模型输出的案件标签。
其中,所述标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签。
可选地,所述装置还包括:存储模块,用于将所述刑事法律文书和所述案件标签作为一个案件信息,存入案件数据库。
可选地,所述装置还包括:展示模块,用于根据所述案件数据库中的案件信息,生成可视化的展示结果,所述展示结果用于展示所述案件数据库中的案件数量和/或所述案件信息的所述案件标签。
可选地,所述装置还包括:筛选模块,用于获取筛选条件,并根据所述筛选条件和所述案件标签,从案件数据库中确定目标案件信息;所述展示模块,用于根据目标案件信息生成可视化的展示结果;其中,所述筛选条件包括时间段条件、案件类型条件、涉案人员条件、案件地区条件、经案人员条件、涉案金额条件、作案次数条件。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
通过上述技术方案,通过使用样本法律文书、样本案件类型和样本标签训练得到的标签分类模型自动从刑事法律文书中提取案情相关的案件标签,使用户在需要查看案件情况时能够快速地提取到案件中的有效信息,提高了用户对刑事法律文书中的信息的提取及处理效率,且整个过程减少了人工参与,从而减少了案件信息被遗漏的风险,并且,可以根据用户输入的筛选条件确定符合筛选条件的案件信息,并根据这些案件信息生成可视化的展示结果,使生成的案件标签更直观地展示给用户,进一步提高用户提取刑事法律文书中的案情信息的效率。
图4是根据一示例性实施例示出的一种电子设备400的框图。如图4所示,该电子设备400可以包括:处理器401,存储器402。该电子设备400 还可以包括多媒体组件403,输入/输出(I/O)接口404,以及通信组件405 中的一者或多者。
其中,处理器401用于控制该电子设备400的整体操作,以完成上述的刑事法律文书处理方法中的全部或部分步骤。存储器402用于存储各种类型的数据以支持在该电子设备400的操作,这些数据例如可以包括用于在该电子设备400上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器402可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称 EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件403可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器402或通过通信组件405发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口404为处理器401 和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件405用于该电子设备400与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G、4G、NB-IOT、 eMTC、或其他5G等等,或它们中的一种或几种的组合,在此不做限定。因此相应的该通信组件405可以包括:Wi-Fi模块,蓝牙模块,NFC模块等等。
在一示例性实施例中,电子设备400可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器 (DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的刑事法律文书处理方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的刑事法律文书处理方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器402,上述程序指令可由电子设备400的处理器401执行以完成上述的刑事法律文书处理方法。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。
Claims (6)
1.一种刑事法律文书处理方法,其特征在于,所述方法包括:
将刑事法律文书输入预训练的标签分类模型,所述标签分类模型包括语言表征模块、属性抽取模块、关系提取模块;
获取所述标签分类模型输出的案件标签;
其中,所述标签分类模型通过所述语言表征模块、所述属性抽取模块和所述关系提取模块对样本法律文书、样本案件类型和样本标签的学习,学习到不同的样本标签与文字表述之间的关系,在获取到输入的刑事法律文书后,通过分析刑事法律文书中的文字表述,生成对应的案件标签,所述标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签,案件类型与标签类型的对应关系是通过标签分类模型对样本法律文书、样本案件类型及样本标签训练得到的;
将所述刑事法律文书和所述案件标签作为一个案件信息,存入案件数据库;
根据所述案件数据库中的案件信息,生成可视化的展示结果,所述展示结果用于展示所述案件数据库中的案件数量和/或所述案件信息的所述案件标签。
2.根据权利要求1所述的方法,其特征在于,所述根据所述案件数据库中的案件信息,生成可视化的展示结果之前,所述方法还包括:
获取筛选条件;
根据所述筛选条件和所述案件标签,从案件数据库中确定目标案件信息;
所述根据所述案件数据库中的案件信息,生成可视化的展示结果,包括:
根据目标案件信息生成可视化的展示结果;
其中,所述筛选条件包括时间段条件、案件类型条件、涉案人员条件、案件地区条件、经案人员条件、涉案金额条件、作案次数条件。
3.一种刑事法律文书处理装置,其特征在于,所述装置包括:
输入模块,用于将刑事法律文书输入预训练的标签分类模型,所述标签分类模型包括语言表征模块、属性抽取模块、关系提取模块;
获取模块,用于获取所述标签分类模型输出的案件标签;
其中,所述标签分类模型通过所述语言表征模块、所述属性抽取模块和所述关系提取模块对样本法律文书、样本案件类型和样本标签的学习,学习到不同的样本标签与文字表述之间的关系,在获取到输入的刑事法律文书后,通过分析刑事法律文书中的文字表述,生成对应的案件标签,所述标签分类模型由样本法律文书、样本案件类型和样本标签训练得到,所述标签分类模型用于确定所述刑事法律文书的案件类型,并根据预设的案件类型与标签类型的对应关系确定所述刑事法律文书的至少一个标签类型,并从所述刑事法律文书中提取所述标签类型对应的标签结果值,其中,每一组所述标签类型与所述标签结果值的集合为一个所述案件标签,案件类型与标签类型的对应关系是通过标签分类模型对样本法律文书、样本案件类型及样本标签训练得到的;
存储模块,用于将所述刑事法律文书和所述案件标签作为一个案件信息,存入案件数据库;
展示模块,用于根据所述案件数据库中的案件信息,生成可视化的展示结果,所述展示结果用于展示所述案件数据库中的案件数量和/或所述案件信息的所述案件标签。
4.根据权利要求3所述的装置,其特征在于,所述装置还包括:
筛选模块,用于获取筛选条件,并根据所述筛选条件和所述案件标签,从案件数据库中确定目标案件信息;
所述展示模块,用于根据目标案件信息生成可视化的展示结果;
其中,所述筛选条件包括时间段条件、案件类型条件、涉案人员条件、案件地区条件、经案人员条件、涉案金额条件、作案次数条件。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-2中任一项所述方法的步骤。
6.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-2中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911421891.7A CN111241274B (zh) | 2019-12-31 | 2019-12-31 | 刑事法律文书处理方法和装置、存储介质和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911421891.7A CN111241274B (zh) | 2019-12-31 | 2019-12-31 | 刑事法律文书处理方法和装置、存储介质和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111241274A CN111241274A (zh) | 2020-06-05 |
CN111241274B true CN111241274B (zh) | 2023-11-28 |
Family
ID=70865424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911421891.7A Active CN111241274B (zh) | 2019-12-31 | 2019-12-31 | 刑事法律文书处理方法和装置、存储介质和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111241274B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111967229B (zh) * | 2020-09-01 | 2024-09-06 | 申建常 | 一种高效标签式数据分析方法及分析系统 |
CN113160000A (zh) * | 2021-04-22 | 2021-07-23 | 广州广电运通信息科技有限公司 | 法务信息分析方法、系统、装置及存储介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006113660A (ja) * | 2004-10-12 | 2006-04-27 | Fujitsu Ltd | プロセス可視化プログラム、プロセス可視化装置およびプロセス可視化方法 |
JP2012068844A (ja) * | 2010-09-22 | 2012-04-05 | Fuji Xerox Co Ltd | 文書比較処理装置及び文書比較処理プログラム |
CN106227863A (zh) * | 2016-07-29 | 2016-12-14 | 浪潮软件集团有限公司 | 在案件串并和嫌疑人排查中的数据挖掘方法 |
CN108009284A (zh) * | 2017-12-22 | 2018-05-08 | 重庆邮电大学 | 采用半监督卷积神经网络的法律文本分类方法 |
CN108038091A (zh) * | 2017-10-30 | 2018-05-15 | 上海思贤信息技术股份有限公司 | 一种基于图的裁判文书案件相似计算与检索方法及系统 |
CN108334500A (zh) * | 2018-03-05 | 2018-07-27 | 上海思贤信息技术股份有限公司 | 一种基于机器学习算法的裁判文书标注方法及装置 |
CN108763542A (zh) * | 2018-05-31 | 2018-11-06 | 中国华戎科技集团有限公司 | 一种基于联合学习的文本情报分类方法、装置及计算机设备 |
CN109344187A (zh) * | 2018-08-28 | 2019-02-15 | 合肥工业大学 | 一种司法判决书案情信息结构化处理系统 |
CN109460468A (zh) * | 2018-10-23 | 2019-03-12 | 出门问问信息科技有限公司 | 法律相关文本的归类方法、归类装置及相应的电子设备 |
CN109471922A (zh) * | 2018-09-29 | 2019-03-15 | 平安科技(深圳)有限公司 | 基于深度学习模型的案件类型识别方法、装置、设备及介质 |
CN109871452A (zh) * | 2019-01-31 | 2019-06-11 | 深度好奇(北京)科技有限公司 | 确定犯罪特征的方法、装置以及存储介质 |
CN110209828A (zh) * | 2018-02-12 | 2019-09-06 | 北大方正集团有限公司 | 案件查询方法及案件查询装置、计算机设备和存储介质 |
CN110309296A (zh) * | 2018-03-09 | 2019-10-08 | 北京国双科技有限公司 | 一种事件提取方法及装置 |
WO2019242124A1 (zh) * | 2018-06-19 | 2019-12-26 | 平安科技(深圳)有限公司 | 金额信息的提取方法、装置、终端设备及介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090144277A1 (en) * | 2007-12-03 | 2009-06-04 | Microsoft Corporation | Electronic table of contents entry classification and labeling scheme |
WO2015118618A1 (ja) * | 2014-02-04 | 2015-08-13 | 株式会社Ubic | 文書分析システム及び文書分析方法並びに文書分析プログラム |
-
2019
- 2019-12-31 CN CN201911421891.7A patent/CN111241274B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006113660A (ja) * | 2004-10-12 | 2006-04-27 | Fujitsu Ltd | プロセス可視化プログラム、プロセス可視化装置およびプロセス可視化方法 |
JP2012068844A (ja) * | 2010-09-22 | 2012-04-05 | Fuji Xerox Co Ltd | 文書比較処理装置及び文書比較処理プログラム |
CN106227863A (zh) * | 2016-07-29 | 2016-12-14 | 浪潮软件集团有限公司 | 在案件串并和嫌疑人排查中的数据挖掘方法 |
CN108038091A (zh) * | 2017-10-30 | 2018-05-15 | 上海思贤信息技术股份有限公司 | 一种基于图的裁判文书案件相似计算与检索方法及系统 |
CN108009284A (zh) * | 2017-12-22 | 2018-05-08 | 重庆邮电大学 | 采用半监督卷积神经网络的法律文本分类方法 |
CN110209828A (zh) * | 2018-02-12 | 2019-09-06 | 北大方正集团有限公司 | 案件查询方法及案件查询装置、计算机设备和存储介质 |
CN108334500A (zh) * | 2018-03-05 | 2018-07-27 | 上海思贤信息技术股份有限公司 | 一种基于机器学习算法的裁判文书标注方法及装置 |
CN110309296A (zh) * | 2018-03-09 | 2019-10-08 | 北京国双科技有限公司 | 一种事件提取方法及装置 |
CN108763542A (zh) * | 2018-05-31 | 2018-11-06 | 中国华戎科技集团有限公司 | 一种基于联合学习的文本情报分类方法、装置及计算机设备 |
WO2019242124A1 (zh) * | 2018-06-19 | 2019-12-26 | 平安科技(深圳)有限公司 | 金额信息的提取方法、装置、终端设备及介质 |
CN109344187A (zh) * | 2018-08-28 | 2019-02-15 | 合肥工业大学 | 一种司法判决书案情信息结构化处理系统 |
CN109471922A (zh) * | 2018-09-29 | 2019-03-15 | 平安科技(深圳)有限公司 | 基于深度学习模型的案件类型识别方法、装置、设备及介质 |
CN109460468A (zh) * | 2018-10-23 | 2019-03-12 | 出门问问信息科技有限公司 | 法律相关文本的归类方法、归类装置及相应的电子设备 |
CN109871452A (zh) * | 2019-01-31 | 2019-06-11 | 深度好奇(北京)科技有限公司 | 确定犯罪特征的方法、装置以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111241274A (zh) | 2020-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220156464A1 (en) | Intelligently summarizing and presenting textual responses with machine learning | |
O'dea et al. | A linguistic analysis of suicide-related Twitter posts | |
US9449287B2 (en) | System and method for predicting personality traits using disc profiling and big five personality techniques | |
US10685741B2 (en) | Method and system for exploring the associations between drug side-effects and therapeutic indications | |
KR101982081B1 (ko) | 대응 메시지 추천 시스템 | |
Sufi | Identifying the drivers of negative news with sentiment, entity and regression analysis | |
CN111241274B (zh) | 刑事法律文书处理方法和装置、存储介质和电子设备 | |
Alabdulkreem | Prediction of depressed Arab women using their tweets | |
CN111858905B (zh) | 模型训练方法、信息识别方法、装置、电子设备及存储介质 | |
CN107992602A (zh) | 搜索结果展示方法和装置 | |
CN108984514A (zh) | 词语的获取方法及装置、存储介质、处理器 | |
CN114637842A (zh) | 企业行业分类方法、装置、存储介质及电子设备 | |
Scudder et al. | A law enforcement intelligence framework for use in predictive DNA phenotyping | |
EP3364364A1 (en) | Method to detect incidents from social network use | |
EP3139327A1 (en) | Random index pattern matching based email relations finder system | |
Fisk et al. | Controversial new sciences in the media: Content analysis of global reporting of nanotechnology during the last decade | |
Nanda et al. | Semi-automated text mining strategies for identifying rare causes of injuries from emergency room triage data | |
CN118013963A (zh) | 敏感词的识别和替换方法及其装置 | |
JP2009157450A (ja) | メール分類システム、メール検索システム、メール宛先分類システム | |
CN107330076A (zh) | 一种网络舆情信息展示系统及方法 | |
Dashtipour et al. | Public perception of the fifth generation of cellular networks (5G) on social media | |
CN113870998A (zh) | 问诊方法、装置、电子设备和存储介质 | |
CN116450814A (zh) | 基于事件处理模型的事件处理方法、装置、设备及介质 | |
CN113849723A (zh) | 搜索方法及搜索装置 | |
CN117522538A (zh) | 招投标信息处理方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |