CN114661858A - 法律文书中存疑法条的识别方法、装置及相关设备 - Google Patents
法律文书中存疑法条的识别方法、装置及相关设备 Download PDFInfo
- Publication number
- CN114661858A CN114661858A CN202011538704.6A CN202011538704A CN114661858A CN 114661858 A CN114661858 A CN 114661858A CN 202011538704 A CN202011538704 A CN 202011538704A CN 114661858 A CN114661858 A CN 114661858A
- Authority
- CN
- China
- Prior art keywords
- legal
- standard
- fact
- law
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000004891 communication Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000000712 assembly Effects 0.000 description 4
- 238000000429 assembly Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开公开了一种法律文书中存疑法条的识别方法、装置及相关设备,可以获得待检测的法律文书中的事实关键词及适用法条;从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词;从所述数据库中确定与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条;将所述待检测的法律文书中的适用法条与所述目标法条对比,根据对比结果从所述待检测的法律文书中的适用法条中识别到存疑法条。本公开可以快捷准确的自动识别存疑法条。
Description
技术领域
本公开涉及文本处理领域,尤其涉及法律文书中存疑法条的识别方法、装置及相关设备。
背景技术
法律文书是指一个国家的公安机关(含国家安全机关)、检察院、法院、监狱或劳改机关以及公证机关、仲裁机关依法制作的处理各类诉讼案件和非诉讼案件的法律文书和案件当事人、律师及律师事务所自书或代书的具有法律效力或法律意义的文书的总称。裁判文书即为法律文书的一种。法律文书依据法律、法规给出具体法律结论、法律意见,如裁判文书根据相关法律给出审判结果。法律文书中常将其法律结论、法律意见所依据的适用法条在法律文书中进行说明。
但由于诸多原因,法律文书中的适用法条有可能是错误的。
发明内容
鉴于上述问题,本公开提供一种克服上述问题或者至少部分地解决上述问题的法律文书中存疑法条的识别方法、装置及相关设备,方案如下:
一种法律文书中存疑法条的识别方法,包括:
获得待检测的法律文书中的事实关键词及适用法条;
从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词,其中,所述数据库中保存有从标准法律文书中提取的多个事实关键词及适用法条,同一所述标准法律文书中的事实关键词和适用法条具有对应关系;
从所述数据库中确定与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条;
将所述待检测的法律文书中的适用法条与所述目标法条对比,根据对比结果从所述待检测的法律文书中的适用法条中识别到存疑法条。
可选的,所述数据库中保存有多个标准词组,每一个所述标准词组由一个所述标准法律文书中的事实关键词构成,
所述从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词,包括:
确定所述待检测的法律文书中的各事实关键词构成的第一词组分别与各所述标准词组的匹配度;
将所述匹配度满足第一预设要求的所述标准词组中的事实关键词确定为与所述待检测的法律文书中的事实关键词匹配的目标关键词。
可选的,所述确定所述待检测的法律文书中的各事实关键词构成的第一词组分别与各所述标准词组的匹配度,包括:
对任一所述标准词组:获得第一词组与该标准词组的交集,将所述交集与所述第一词组和/或该标准词组对比,获得对比结果,根据所述对比结果确定所述第一词组与所述标准词组的匹配度,其中,所述第一词组由所述待检测的法律文书中的各事实关键词构成。
可选的,所述数据库中保存有多个标准词组,每一个所述标准词组由一个所述标准法律文书中的事实关键词构成,
所述从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词,包括:
确定第一词组分别与各所述标准词组的匹配类型及在所述匹配类型下的匹配度,其中,所述第一词组由所述待检测的法律文书中的各事实关键词构成;
按照所述匹配类型下的匹配度,调整所述匹配类型相同的各所述标准词组之间的排序,按照所述匹配类型,调整所述匹配类型不同的各所述标准词组之间的排序;
将所述排序满足第二预设要求的所述标准词组中的事实关键词确定为与所述待检测的法律文书中的事实关键词匹配的目标关键词。
可选的,所述数据库中保存有多个标准法条组,每一个所述标准法条组由一个所述标准法律文书中的适用法条构成,同一个标准法律文书中的所述标准法条组和所述标准词组具有对应关系,
所述从所述数据库中确定与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条,包括:
从所述数据库中,确定与满足预设要求的所述标准词组对应的标准法条组;
将从所述数据库中确定的各标准法条组中的至少部分适用法条确定为目标法条。
可选的,所述数据库中保存有事实关键词及分别与各所述事实关键词对应的法条列表,与一个所述事实关键词对应的所述法条列表包括出现该事实关键词的各所述标准法律文书中的各适用法条,
所述从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词,包括:从数据库中确定与所述待检测的法律文书中的事实关键词相同的目标关键词;
所述从所述数据库中确定与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条,包括:
将所述目标关键词对应的法条列表中的适用法条,确定为与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条。
可选的,所述将所述待检测的法律文书中的适用法条与所述目标法条对比,根据对比结果从所述待检测的法律文书中的适用法条中识别到存疑法条,包括:
将所述待检测的法律文书中的适用法条与所述目标法条对比,根据对比结果确定出现在所述待检测的法律文书中且未出现在目标法条组中的至少一个法条,将所述至少一个法条确定为存疑法条。
一种法律文书中存疑法条的识别装置,包括:
信息获得单元,被配置为执行:获得待检测的法律文书中的事实关键词及适用法条;
关键词确定单元,被配置为执行:从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词,其中,所述数据库中保存有从标准法律文书中提取的多个事实关键词及适用法条,同一所述标准法律文书中的事实关键词和适用法条具有对应关系;
目标法条确定单元,被配置为执行:从所述数据库中确定与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条;
存疑法条确定单元,被配置为执行:将所述待检测的法律文书中的适用法条与所述目标法条对比,根据对比结果从所述待检测的法律文书中的适用法条中识别到存疑法条。
可选的,所述数据库中保存有多个标准词组,每一个所述标准词组由一个所述标准法律文书中的事实关键词构成,
关键词确定单元,被具体配置为执行:确定所述待检测的法律文书中的各事实关键词构成的第一词组分别与各所述标准词组的匹配度;将所述匹配度满足第一预设要求的所述标准词组中的事实关键词确定为与所述待检测的法律文书中的事实关键词匹配的目标关键词。
可选的,关键词确定单元确定所述待检测的法律文书中的各事实关键词构成的第一词组分别与各所述标准词组的匹配度,被具体配置为执行:
对任一所述标准词组:获得第一词组与该标准词组的交集,将所述交集与所述第一词组和/或该标准词组对比,获得对比结果,根据所述对比结果确定所述第一词组与所述标准词组的匹配度,其中,所述第一词组由所述待检测的法律文书中的各事实关键词构成。
可选的,所述数据库中保存有多个标准词组,每一个所述标准词组由一个所述标准法律文书中的事实关键词构成,
关键词确定单元,被具体配置为执行:确定第一词组分别与各所述标准词组的匹配类型及在所述匹配类型下的匹配度,其中,所述第一词组由所述待检测的法律文书中的各事实关键词构成;按照所述匹配类型下的匹配度,调整所述匹配类型相同的各所述标准词组之间的排序,按照所述匹配类型,调整所述匹配类型不同的各所述标准词组之间的排序;将所述排序满足第二预设要求的所述标准词组中的事实关键词确定为与所述待检测的法律文书中的事实关键词匹配的目标关键词。
可选的,所述数据库中保存有多个标准法条组,每一个所述标准法条组由一个所述标准法律文书中的适用法条构成,同一个标准法律文书中的所述标准法条组和所述标准词组具有对应关系,
目标法条确定单元,被具体配置为执行:从所述数据库中,确定与满足预设要求的所述标准词组对应的标准法条组;将从所述数据库中确定的各标准法条组中的至少部分适用法条确定为目标法条。
可选的,所述数据库中保存有事实关键词及分别与各所述事实关键词对应的法条列表,与一个所述事实关键词对应的所述法条列表包括出现该事实关键词的各所述标准法律文书中的各适用法条,
关键词确定单元,被具体配置为执行:从数据库中确定与所述待检测的法律文书中的事实关键词相同的目标关键词;
目标法条确定单元,被具体配置为执行:将所述目标关键词对应的法条列表中的适用法条,确定为与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条。
可选的,所述存疑法条确定单元,被具体配置为执行:
将所述待检测的法律文书中的适用法条与所述目标法条对比,根据对比结果确定出现在所述待检测的法律文书中且未出现在目标法条组中的至少一个法条,将所述至少一个法条确定为存疑法条。
可选的,存疑法条确定单元根据对比结果确定出现在所述待检测的法律文书中且未出现在目标法条组中的至少一个法条,将所述至少一个法条确定为存疑法条,被具体执行为:
根据对比结果,确定出现在所述待检测的法律文书中且未出现在目标法条组中的法条的第一数量,其中,所述目标法条组由各所述目标法条构成;当所述第一数量与所述待检测的法律文书中的法条数量之比大于预设比例时,则将出现在所述待检测的法律文书中且未出现在目标法条组中的至少一个法条确定为存疑法条。
可选的,所述法律文书中存疑法条的识别装置还包括:修改法条确定单元,被配置为执行:将至少一个所述目标法条确定为所述存疑法条的修改建议法条。
一种电子设备,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述的任一种法律文书中存疑法条的识别方法。
一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述的任一种法律文书中存疑法条的识别方法。
借由上述技术方案,本公开提供的一种法律文书中存疑法条的识别方法、装置及相关设备,可以获得待检测的法律文书中的事实关键词及适用法条;从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词;从所述数据库中确定与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条;将所述待检测的法律文书中的适用法条与所述目标法条对比,根据对比结果从所述待检测的法律文书中的适用法条中识别到存疑法条。本公开可以快捷准确的自动识别存疑法条。
上述说明仅是本公开技术方案的概述,为了能够更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为了让本公开的上述和其它目的、特征和优点能够更明显易懂,以下特举本公开的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本公开的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本公开示例性实施例提供的一种法律文书中存疑法条的识别方法的流程图;
图2示出了本公开示例性实施例提供的另一种法律文书中存疑法条的识别方法的流程图;
图3示出了本公开示例性实施例提供的另一种法律文书中存疑法条的识别方法的流程图;
图4示出了本公开示例性实施例提供的另一种法律文书中存疑法条的识别方法的流程图;
图5示出了本公开示例性实施例提供的一种法律文书中存疑法条的识别装置的结构示意图;
图6示出了本公开示例性实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示,本公开实施例提供的一种法律文书中存疑法条的识别方法,可以包括:
S100、获得待检测的法律文书中的事实关键词及适用法条。
本领域技术人员可知的是,法律文书可以包括:裁判文书、公证法律文书、诉讼法律文书、非诉法律文书、公司管理文书、公司清算文书、常用法律文书等,其中,裁判文书可以包括:民商裁决文书、行政裁决文书、刑事裁决文书、仲裁法律文书等。
其中,事实关键词为用于表示法律文书所涉事件的关键性特征的情况事实,如:法律文书为贷款合同,则该贷款合同的事实关键词可以包括:贷款人民币拾万圆整。当法律文书为裁判文书时,事实关键词为裁判文书中关键性特征的案情事实,如:交通肇事案件的裁判文书中的事实关键词可以为:酒后驾驶。
可以理解的是,一个法律文书中的事实关键词可以有一个或多个。本公开可以将从待检测的法律文书中获得的事实关键词确定为一个词组。
其中,适用法条是法律文书中的法律结论、法律意见所依据的法律、法规的具体条文,如:《专利法》第二十三条第二款。一个法律文书中的适用法条可以有一个或多个。本公开可以将从待检测的法律文书中获得的适用法条确定为一个法条组。
可选的,本公开可以通过多种方式获得待检测的法律文书中的事实关键词及适用法条。例如:可以通过正则表达式识别事实关键词及适用法条;再如:通过预先训练的机器学习模型识别事实关键词及适用法条。
由于各法律文书所涉事件众多且事项众多,因此本公开可以对事实关键词进行精简。可选的,本公开可以预先建立事实关键词与精简关键词的对应关系,将多个事实关键词转换为一个精简关键词。在实际应用中,本公开还可以对事实关键词进行转换,将从法律文书中提取的原始关键词转换为精简关键词。例如:原始关键词“借款30000元”和原始关键词“借款40000元”,均与精简关键词“借款十万元以下”对应。这样,当从法律文书中提取的原始关键词为“借款30000元”时,本公开将它转换为精简关键词“借款十万元以下”。通过这种处理,可以有效减少关键词的数量,便于减小后续处理所涉及的数据量。
可选的,对于适用法条,本公开可以从法律文书中提取完整和原始的适用法条的文本,如:法律文书中的适用法条的原始文本为:“《中华人民共和国婚姻法》(2020修正版本)第一条”,则本公开可以不对其进行精简,直接将该原始文本提取即可。通过获得适用法条的原始文本,可以校验法条的书写错误等形式问题。
当然,在其他实施例中,本公开也可以对其进行精简,如:精简为:“婚姻法(2020)第一条”。
本公开发明人研究发现:法律文书涵盖的内容较多,事实关键词及适用法条往往存在于法律文书中的法律结论部分或法律意见部分。因此,本公开可以从法律文书的法律结论部分或法律意见部分,获得事实关键词及适用法条。在实际应用中,本公开可以首先从法律文书中识别法律结论部分或法律意见部分,然后再从法律文书的法律结论部分或法律意见部分,获得事实关键词及适用法条。可选的,本公开可以通过机器学习模型从法律文书中识别法律结论部分或法律意见部分。
可选的,裁判文书中的法律结论部分为裁判结果段落。
在实际应用中,本公开可以将多个法律文书作为训练样本,并为训练样本中的法律结论部分和法律意见部分添加第一标注(可选的,还可以为非法律结论部分和非法律意见部分添加第二标注),然后适用机器学习模型对添加有标注的训练样本进行学习,从而获得可以从法律文书中识别法律结论部分和法律意见部分的机器学习模型。具体的,本公开可以根据TF-IDF技术,将法律文书中的各段落转换为词向量,将词向量输入机器学习模型进行训练。相应的,在机器学习模型训练结束后,可以将待检测的法律文书的各段落转化为词向量,将词向量输入机器学习模型,以识别法律结论部分、法律意见部分所在的段落。
可选的,本公开可以使用逻辑回归算法建立和训练机器学习模型。逻辑回归算法可以分析自变量X和因变量Y之间的关系,或者说自变量X对因变量Y的影响程度,并对因变量Y进行预测。本公开获得的词向量即可以为自变量X,因变量Y为一个段落属于法律结论部分、法律意见部分所在的段落的概率。
S200、从数据库中确定与待检测的法律文书中的事实关键词匹配的目标关键词,其中,数据库中保存有从标准法律文书中提取的多个事实关键词及适用法条,同一标准法律文书中的事实关键词和适用法条具有对应关系。
可选的,标准法律文书为适用法条使用正确的法律文书。在实际应用中,本公开可以筛选多个标准法律文书,例如:筛选最近N年的标准法律文书。进一步,由于法律文书的类型有多种,因此本公开可以分别筛选至少一种类型的标准法律文书,并分别根据各类型的标准法律文书构建该种类型的法律文书对应的数据库。例如:对于裁判文书而言,本公开可以筛选多个标准裁判文书并根据筛选到的标准裁判文书构建裁判文书的数据库。当然,本公开还可以对某种类型的标准法律文书继续进行分类,例如:将裁判文书分为:民事、刑事、行政等案件类型的裁判文书。本公开可以在数据库中为标准法律文书添加类型信息,也可以为每一种类型的标准法律文书单独构建数据库。例如:为民事类型的标准裁判文书构建一个数据库,为刑事类型的标准裁判文书构建一个数据库。
可以理解的是,通过筛选最近N年的标准法律文书,可以有效保证标准法律文书的时效性,提高存疑法条的识别效果。
通过按照类型对法律文书进行分类并构建数据库,本公开可以有效提高数据库与法律文书的匹配度,从而有效提高关键词的匹配效果以及存疑法条的识别效果。
可选的,本公开可以从标准法律文书中提取事实关键词及适用法条,并对应存储于数据库中。本公开从标准法律文书中提取事实关键词及适用法条的方法,可以和从待检测的法律文书中的事实关键词及适用法条的方法相同或不同。
事实关键词及适用法条在数据库中的存储方式及对应方式至少可以包括如下两种:
第一种、数据库中保存有多个标准词组和多个标准法条组,每一个标准词组由一个标准法律文书中的事实关键词构成,每一个标准法条组由一个标准法律文书中的适用法条构成,同一个标准法律文书中的标准法条组和标准词组具有对应关系。
当一个标准法条组和一个标准词组具有对应关系时,该标准法条组中的适用法条和该标准词组中的事实关键词来自同一个标准法律文书。
第二种、数据库中保存有事实关键词及分别与各事实关键词对应的法条列表,与一个事实关键词对应的法条列表包括出现该事实关键词的各标准法律文书中的各适用法条。
对于第二种,本公开可以首先建立同一标准法律文书中的各事实关键词分别和各适用法条的对应关系,例如:某标准法律文书中出现了事实关键词A和事实关键词B,且该标准法律文书中出现了适用法条C和适用法条D,则本公开可以建立如下四个对应关系:
事实关键词A和适用法条C的对应关系;
事实关键词B和适用法条C的对应关系;
事实关键词A和适用法条D的对应关系;
事实关键词B和适用法条D的对应关系。
当然,由于标准法律文书可以为多个,因此每个标准法律文书中,本公开都可以建立多个对应关系,然后根据这些对应关系构建与各事实关键词对应的法条列表。例如根据上述四个对应关系构建的法条列表可以为:
事实关键词A对应的法条列表为:{适用法条C、适用法条D};
事实关键词B对应的法条列表为:{适用法条C、适用法条D}。
可选的,法条列表中的各适用法条可以按照其在构建法条列表所使用的各对应关系中出现的次数由多到少的顺序进行排列。
可选的,数据库中还可以保存有法律文书标识,该法律文书标识可以和事实关键词、适用法条对应;或者,该法律文书标识可以和标准词组、标准法条组对应;或者,该法律文书标识可以和事实关键词、法条列表对应。
可选的,本公开中的数据库可以为各种类型的数据库,如:Elasticsearch数据库。
可选的,本公开可以将数据库中与待检测的法律文书中的事实关键词相同的关键词确定为目标关键词。在其他实施例中,本公开也可以根据从待检测的法律文书中获得的事实关键词构成的词组与数据库中的标准词组的匹配度,从数据库的标准词组中确定目标关键词。
S300、从数据库中确定与目标关键词对应的适用法条,从确定的适用法条中确定目标法条。
由于数据库中的事实关键词与适用法条具有对应关系,因此本公开可以选择与目标关键词对应的部分或全部适用法条作为目标法条。
可选的,当数据库中事实关键词与适用法条的对应关系通过事实关键词与法条列表的对应关系体现时,本公开可以将目标关键词对应的法条列表中出现次数较多的N个适用法条确定为目标法条。
可选的,当数据库中事实关键词与适用法条的对应关系通过标准词组与标准法条组的对应关系体现时,本公开可以将目标关键词所在的标准词组对应的标准法条组中的部分或全部适用法条作为目标法条。具体的,本公开可以将目标关键词所在的标准词组对应的标准法条组中的各适用法条的出现次数进行统计,并将出现次数较多的N个适用法条确定为目标法条。
S400、将待检测的法律文书中的适用法条与目标法条对比,根据对比结果从待检测的法律文书中的适用法条中识别到存疑法条。
可选的,当待检测的法律文书中的第一适用法条未出现在目标法条中时,本公开可以将第一适用法条识别为存疑法条。
可选的,步骤S400可以具体包括:
将待检测的法律文书中的适用法条与目标法条对比,根据对比结果确定出现在待检测的法律文书中且未出现在目标法条组中的至少一个法条,将至少一个法条确定为存疑法条。
可选的,根据对比结果确定出现在待检测的法律文书中且未出现在目标法条组中的至少一个法条,将至少一个法条确定为存疑法条,可以包括:
根据对比结果,确定出现在待检测的法律文书中且未出现在目标法条组中的法条的第一数量,其中,目标法条组由各目标法条构成;
当第一数量与待检测的法律文书中的法条数量之比大于预设比例时,则将出现在待检测的法律文书中且未出现在目标法条组中的至少一个法条确定为存疑法条。
上述预设比例可以为50%或其他比例,当第一数量与待检测的法律文书中的法条数量之比大于预设比例时,说明待检测的法律文书中的很多法条未出现在目标法条组中。这种情况下,待检测的法律文书的未出现在目标法条组中的法条有可能是有问题的,可以确定为存疑法条。
可选的,本公开可以设置存疑法条的显示效果,使其具有区别于其他法条的显示效果,例如:本公开可以为存疑法条添加预设标识。
可选的,在本公开其他实施例中,本公开实施例提供的一种法律文书中存疑法条的识别方法,还可以包括:
将至少一个目标法条确定为存疑法条的修改建议法条。
可选的,本公开可以将各目标法条按照出现次数排序并将排序后的至少一个目标法条确定为存疑法条的修改建议法条。本公开可以将修改建议法条显示输出。具体的,可以显示在与存疑法条匹配的区域。
本公开实施例提供的一种法律文书中存疑法条的识别方法,可以获得待检测的法律文书中的事实关键词及适用法条;从数据库中确定与待检测的法律文书中的事实关键词匹配的目标关键词;从数据库中确定与目标关键词对应的适用法条,从确定的适用法条中确定目标法条;将待检测的法律文书中的适用法条与目标法条对比,根据对比结果从待检测的法律文书中的适用法条中识别到存疑法条。本公开可以快捷准确的自动识别存疑法条。
如图2所示,本公开实施例提供的另一种法律文书中存疑法条的识别方法中,数据库中保存有多个标准词组,每一个标准词组由一个标准法律文书中的事实关键词构成,该方法可以包括:
S100、获得待检测的法律文书中的事实关键词及适用法条。
图2所示方法中,步骤S100、步骤S300和步骤S400与图1所示方法的相应步骤相同,不再赘述。
S201、确定待检测的法律文书中的各事实关键词构成的第一词组分别与各标准词组的匹配度,其中,数据库中保存有从标准法律文书中提取的多个事实关键词及适用法条,同一标准法律文书中的事实关键词和适用法条具有对应关系。
具体的,步骤S201中的匹配度可以根据两个词组中共同具有的事实关键词的数量占词组中全部事实关键词的比例确定。该比例越高,则匹配度越高。
可选的,步骤S201可以具体包括:
对任一标准词组:获得第一词组与该标准词组的交集,将交集与第一词组和/或该标准词组对比,获得对比结果,根据对比结果确定第一词组与标准词组的匹配度,其中,第一词组由待检测的法律文书中的各事实关键词构成。
可以理解的是,当第一词组与某标准词组完全相同时,其交集占第一词组的比例为100%,相应的,其交集占该标准词组的比例为100%。
可选的,上述将交集与第一词组和/或该标准词组对比,获得对比结果,根据对比结果确定第一词组与标准词组的匹配度,可以包括:
确定交集占第一词组的第一比例;
根据第一比例确定第一词组与标准词组的匹配度。
可选的,上述将交集与第一词组和/或该标准词组对比,获得对比结果,根据对比结果确定第一词组与标准词组的匹配度,可以包括:
确定交集占该标准词组的第二比例;
根据第二比例确定第一词组与标准词组的匹配度。
可选的,上述将交集与第一词组和/或该标准词组对比,获得对比结果,根据对比结果确定第一词组与标准词组的匹配度,可以包括:
确定交集占第一词组的第一比例;
确定交集占该标准词组的第二比例;
根据第一比例和第二比例确定第一词组与标准词组的匹配度。
S202、将匹配度满足第一预设要求的标准词组中的事实关键词确定为与待检测的法律文书中的事实关键词匹配的目标关键词。
其中,第一预设要求可以为匹配度高于阈值,也可以为匹配度排名为前N名。上述匹配度排名为按照匹配度从高到低的排名。
其中,步骤S201和步骤S202可以为图1所示方法中步骤S200的一种具体执行过程。
S300、从数据库中确定与目标关键词对应的适用法条,从确定的适用法条中确定目标法条。
S400、将待检测的法律文书中的适用法条与目标法条对比,根据对比结果从待检测的法律文书中的适用法条中识别到存疑法条。
如图3所示,本公开实施例提供的另一种法律文书中存疑法条的识别方法中,数据库中保存有多个标准词组,每一个标准词组由一个标准法律文书中的事实关键词构成,
S100、获得待检测的法律文书中的事实关键词及适用法条。
图3所示方法中,步骤S100、步骤S300和步骤S400与图1所示方法的相应步骤相同,不再赘述。
S211、确定第一词组分别与各标准词组的匹配类型及在匹配类型下的匹配度,其中,第一词组由待检测的法律文书中的各事实关键词构成;,其中,数据库中保存有从标准法律文书中提取的多个事实关键词及适用法条,同一标准法律文书中的事实关键词和适用法条具有对应关系。
步骤S211、步骤S212和步骤S213为图1所示方法中步骤S200的一种具体执行过程。
可选的,上述匹配类型可以包括:完全匹配、包含匹配、被包含匹配、部分匹配中的至少一种。
下面以第一词组与第一标准词组为例说明上述四种匹配类型的含义:
完全匹配是指第一词组中的事实关键词与第一标准词组中的事实关键词完全一致。包含匹配是指第一词组包含了第一标准词组的全部事实关键词,且第一词组中的事实关键词数量多于第一标准词组。被包含匹配是指第一标准词组包含了第一词组的全部事实关键词,且第一标准词组中的事实关键词数量多于第一词组。部分匹配是指第一词组只包含了第一标准词组的部分事实关键词,同时第一标准词组也只包含了第一词组的部分事实关键词。
可以理解的是,在匹配类型下的匹配度的计算方式可以与图2所示方法中步骤S201相同,即:根据交集占比确定匹配度。对于完全匹配,本公开可以确定其匹配度为100%。对于包含匹配,本公开可以将两个词组的交集占第一词组中全部事实关键词的比例确定为匹配度。对于被包含匹配,本公开可以将两个词组的交集占第一标准词组中全部事实关键词的比例确定为匹配度。对于部分匹配,本公开可以确定第一标准词组中事实关键词的第一数量以及第一词组中事实关键词的第二数量的平均值,将两个词组的交集包含的事实关键词数量与上述平均值之比确定为匹配度。
S212、按照匹配类型下的匹配度,调整匹配类型相同的各标准词组之间的排序,按照匹配类型,调整匹配类型不同的各标准词组之间的排序。
可选的,完全匹配类型的标准词组的排序可以先于包含匹配类型的标准词组。可选的,包含匹配类型的标准词组的排序可以先于被包含匹配类型的标准词组。被包含匹配类型的标准词组的排序可以先于部分匹配类型的标准词组。
对于匹配类型相同的各标准词组,本公开可以根据匹配度从高到底的顺序对其进行排序。
S213、将排序满足第二预设要求的标准词组中的事实关键词确定为与待检测的法律文书中的事实关键词匹配的目标关键词。
其中,第二预设要求可以为排序高于预设排序位置。
S300、从数据库中确定与目标关键词对应的适用法条,从确定的适用法条中确定目标法条。
S400、将待检测的法律文书中的适用法条与目标法条对比,根据对比结果从待检测的法律文书中的适用法条中识别到存疑法条。
可选的,在本公开其他实施例中,数据库中保存有多个标准法条组,每一个标准法条组由一个标准法律文书中的适用法条构成,同一个标准法律文书中的标准法条组和标准词组具有对应关系。在此基础上,图2和/或图3所示方法中的步骤S300可以具体包括:
从数据库中,确定与满足预设要求的标准词组对应的标准法条组;
将从数据库中确定的各标准法条组中的至少部分适用法条确定为目标法条。
其中,上述预设要求可以为本公开实施例中的第一预设要求或第二预设要求,也可以为其他预设要求。
可选的,本公开可以将与满足预设要求的标准词组对应的各标准法条组中的适用法条,按照在数据库中确定的各标准法条组中的出现次数进行排序,将排序前M个适用法条确定为目标法条。
如图4所示,本公开实施例提供的另一种法律文书中存疑法条的识别方法中,数据库中保存有事实关键词及分别与各事实关键词对应的法条列表,与一个事实关键词对应的法条列表包括出现该事实关键词的各标准法律文书中的各适用法条,该方法可以包括:
S100、获得待检测的法律文书中的事实关键词及适用法条。
图4所示步骤S100、S400分别与图1所示实施例中S100、S400相同,不再赘述。
S221、从数据库中确定与待检测的法律文书中的事实关键词相同的目标关键词,数据库中保存有从标准法律文书中提取的多个事实关键词及适用法条,同一标准法律文书中的事实关键词和适用法条具有对应关系。
步骤S221为图1所示方法中步骤S200的一种具体执行过程。
S301、将目标关键词对应的法条列表中的适用法条,确定为与目标关键词对应的适用法条,从确定的适用法条中确定目标法条。
步骤S301为图1所示方法中步骤S300的一种具体执行过程。
具体的,可以从确定的适用法条中排序前N个法条确定为目标法条。可选的,法条列表中的适用法条可以按照出现次数排序。
S400、将待检测的法律文书中的适用法条与目标法条对比,根据对比结果从待检测的法律文书中的适用法条中识别到存疑法条。
与上述方法实施例相对应,本公开实施例还提供了一种法律文书中存疑法条的识别装置。
如图5所示,本公开实施例提供的一种法律文书中存疑法条的识别装置,可以包括:
信息获得单元100,被配置为执行:获得待检测的法律文书中的事实关键词及适用法条;
关键词确定单元200,被配置为执行:从数据库中确定与待检测的法律文书中的事实关键词匹配的目标关键词,其中,数据库中保存有从标准法律文书中提取的多个事实关键词及适用法条,同一标准法律文书中的事实关键词和适用法条具有对应关系;
目标法条确定单元300,被配置为执行:从数据库中确定与目标关键词对应的适用法条,从确定的适用法条中确定目标法条;
存疑法条确定单元400,被配置为执行:将待检测的法律文书中的适用法条与目标法条对比,根据对比结果从待检测的法律文书中的适用法条中识别到存疑法条。
可选的,数据库中保存有多个标准词组,每一个标准词组由一个标准法律文书中的事实关键词构成,
关键词确定单元200,被具体配置为执行:确定待检测的法律文书中的各事实关键词构成的第一词组分别与各标准词组的匹配度;将匹配度满足第一预设要求的标准词组中的事实关键词确定为与待检测的法律文书中的事实关键词匹配的目标关键词。
可选的,关键词确定单元200确定待检测的法律文书中的各事实关键词构成的第一词组分别与各标准词组的匹配度,被具体配置为执行:
对任一标准词组:获得第一词组与该标准词组的交集,将交集与第一词组和/或该标准词组对比,获得对比结果,根据对比结果确定第一词组与标准词组的匹配度,其中,第一词组由待检测的法律文书中的各事实关键词构成。
可选的,数据库中保存有多个标准词组,每一个标准词组由一个标准法律文书中的事实关键词构成,
关键词确定单元200,被具体配置为执行:确定第一词组分别与各标准词组的匹配类型及在匹配类型下的匹配度,其中,第一词组由待检测的法律文书中的各事实关键词构成;按照匹配类型下的匹配度,调整匹配类型相同的各标准词组之间的排序,按照匹配类型,调整匹配类型不同的各标准词组之间的排序;将排序满足第二预设要求的标准词组中的事实关键词确定为与待检测的法律文书中的事实关键词匹配的目标关键词。
可选的,数据库中保存有多个标准法条组,每一个标准法条组由一个标准法律文书中的适用法条构成,同一个标准法律文书中的标准法条组和标准词组具有对应关系,
目标法条确定单元300,被具体配置为执行:从数据库中,确定与满足预设要求的标准词组对应的标准法条组;将从数据库中确定的各标准法条组中的至少部分适用法条确定为目标法条。
可选的,数据库中保存有事实关键词及分别与各事实关键词对应的法条列表,与一个事实关键词对应的法条列表包括出现该事实关键词的各标准法律文书中的各适用法条,
关键词确定单元200,被具体配置为执行:从数据库中确定与待检测的法律文书中的事实关键词相同的目标关键词;
目标法条确定单元300,被具体配置为执行:将目标关键词对应的法条列表中的适用法条,确定为与目标关键词对应的适用法条,从确定的适用法条中确定目标法条。
可选的,存疑法条确定单元400,被具体配置为执行:
将待检测的法律文书中的适用法条与目标法条对比,根据对比结果确定出现在待检测的法律文书中且未出现在目标法条组中的至少一个法条,将至少一个法条确定为存疑法条。
可选的,存疑法条确定单元400根据对比结果确定出现在待检测的法律文书中且未出现在目标法条组中的至少一个法条,将至少一个法条确定为存疑法条,被具体执行为:
根据对比结果,确定出现在待检测的法律文书中且未出现在目标法条组中的法条的第一数量,其中,目标法条组由各目标法条构成;当第一数量与待检测的法律文书中的法条数量之比大于预设比例时,则将出现在待检测的法律文书中且未出现在目标法条组中的至少一个法条确定为存疑法条。
可选的,图5所示的法律文书中存疑法条的识别装置还包括:修改法条确定单元,被配置为执行:将至少一个目标法条确定为存疑法条的修改建议法条。
本公开实施例提供的一种法律文书中存疑法条的识别装置,可以获得待检测的法律文书中的事实关键词及适用法条;从数据库中确定与待检测的法律文书中的事实关键词匹配的目标关键词;从数据库中确定与目标关键词对应的适用法条,从确定的适用法条中确定目标法条;将待检测的法律文书中的适用法条与目标法条对比,根据对比结果从待检测的法律文书中的适用法条中识别到存疑法条。本公开可以快捷准确的自动识别存疑法条。
所述法律文书中存疑法条的识别装置包括处理器和存储器,上述信息获得单元、关键词确定单元、目标法条确定单元和存疑法条确定单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来确定存疑法条。
本公开实施例提供了一种计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如本公开实施例提供的任一种法律文书中存疑法条的识别方法。
本公开实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行本公开实施例提供的任一种法律文书中存疑法条的识别方法。
如图6所示,本公开实施例提供了一种电子设备70,电子设备70包括至少一个处理器701、以及与处理器701连接的至少一个存储器702、总线703;其中,处理器701、存储器702通过总线703完成相互间的通信;处理器701用于调用存储器702中的程序指令,以执行本公开实施例提供的任一种法律文书中存疑法条的识别方法。本文中的电子设备70可以是服务器、PC、PAD、手机等。
本公开还提供了一种计算机程序产品,当在电子设备上执行时,适于执行初始化有如下方法步骤的程序:
一种法律文书中存疑法条的识别方法,包括:
获得待检测的法律文书中的事实关键词及适用法条;
从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词,其中,所述数据库中保存有从标准法律文书中提取的多个事实关键词及适用法条,同一所述标准法律文书中的事实关键词和适用法条具有对应关系;
从所述数据库中确定与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条;
将所述待检测的法律文书中的适用法条与所述目标法条对比,根据对比结果从所述待检测的法律文书中的适用法条中识别到存疑法条。
可选的,所述数据库中保存有多个标准词组,每一个所述标准词组由一个所述标准法律文书中的事实关键词构成,
所述从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词,包括:
确定所述待检测的法律文书中的各事实关键词构成的第一词组分别与各所述标准词组的匹配度;
将所述匹配度满足第一预设要求的所述标准词组中的事实关键词确定为与所述待检测的法律文书中的事实关键词匹配的目标关键词。
可选的,所述确定所述待检测的法律文书中的各事实关键词构成的第一词组分别与各所述标准词组的匹配度,包括:
对任一所述标准词组:获得第一词组与该标准词组的交集,将所述交集与所述第一词组和/或该标准词组对比,获得对比结果,根据所述对比结果确定所述第一词组与所述标准词组的匹配度,其中,所述第一词组由所述待检测的法律文书中的各事实关键词构成。
可选的,所述数据库中保存有多个标准词组,每一个所述标准词组由一个所述标准法律文书中的事实关键词构成,
所述从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词,包括:
确定第一词组分别与各所述标准词组的匹配类型及在所述匹配类型下的匹配度,其中,所述第一词组由所述待检测的法律文书中的各事实关键词构成;
按照所述匹配类型下的匹配度,调整所述匹配类型相同的各所述标准词组之间的排序,按照所述匹配类型,调整所述匹配类型不同的各所述标准词组之间的排序;
将所述排序满足第二预设要求的所述标准词组中的事实关键词确定为与所述待检测的法律文书中的事实关键词匹配的目标关键词。
可选的,所述数据库中保存有多个标准法条组,每一个所述标准法条组由一个所述标准法律文书中的适用法条构成,同一个标准法律文书中的所述标准法条组和所述标准词组具有对应关系,
所述从所述数据库中确定与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条,包括:
从所述数据库中,确定与满足预设要求的所述标准词组对应的标准法条组;
将从所述数据库中确定的各标准法条组中的至少部分适用法条确定为目标法条。
可选的,所述数据库中保存有事实关键词及分别与各所述事实关键词对应的法条列表,与一个所述事实关键词对应的所述法条列表包括出现该事实关键词的各所述标准法律文书中的各适用法条,
所述从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词,包括:从数据库中确定与所述待检测的法律文书中的事实关键词相同的目标关键词;
所述从所述数据库中确定与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条,包括:
将所述目标关键词对应的法条列表中的适用法条,确定为与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条。
可选的,所述将所述待检测的法律文书中的适用法条与所述目标法条对比,根据对比结果从所述待检测的法律文书中的适用法条中识别到存疑法条,包括:
将所述待检测的法律文书中的适用法条与所述目标法条对比,根据对比结果确定出现在所述待检测的法律文书中且未出现在目标法条组中的至少一个法条,将所述至少一个法条确定为存疑法条。
本公开是参照根据本公开实施例的方法、装置、电子设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程设备的处理器以产生一个机器,使得通过计算机或其他可编程设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在一个典型的配置中,电子设备包括一个或多个处理器(CPU)、存储器和总线。电子设备还可以包括输入/输出接口、网络接口等。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本公开的实施例可提供为方法、系统或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本公开的实施例而已,并不用于限制本公开。对于本领域技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本公开的权利要求范围之内。
Claims (10)
1.一种法律文书中存疑法条的识别方法,其特征在于,包括:
获得待检测的法律文书中的事实关键词及适用法条;
从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词,其中,所述数据库中保存有从标准法律文书中提取的多个事实关键词及适用法条,同一所述标准法律文书中的事实关键词和适用法条具有对应关系;
从所述数据库中确定与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条;
将所述待检测的法律文书中的适用法条与所述目标法条对比,根据对比结果从所述待检测的法律文书中的适用法条中识别到存疑法条。
2.根据权利要求1所述的方法,其特征在于,所述数据库中保存有多个标准词组,每一个所述标准词组由一个所述标准法律文书中的事实关键词构成,
所述从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词,包括:
确定所述待检测的法律文书中的各事实关键词构成的第一词组分别与各所述标准词组的匹配度;
将所述匹配度满足第一预设要求的所述标准词组中的事实关键词确定为与所述待检测的法律文书中的事实关键词匹配的目标关键词。
3.根据权利要求2所述的方法,其特征在于,所述确定所述待检测的法律文书中的各事实关键词构成的第一词组分别与各所述标准词组的匹配度,包括:
对任一所述标准词组:获得第一词组与该标准词组的交集,将所述交集与所述第一词组和/或该标准词组对比,获得对比结果,根据所述对比结果确定所述第一词组与所述标准词组的匹配度,其中,所述第一词组由所述待检测的法律文书中的各事实关键词构成。
4.根据权利要求1所述的方法,其特征在于,所述数据库中保存有多个标准词组,每一个所述标准词组由一个所述标准法律文书中的事实关键词构成,
所述从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词,包括:
确定第一词组分别与各所述标准词组的匹配类型及在所述匹配类型下的匹配度,其中,所述第一词组由所述待检测的法律文书中的各事实关键词构成;
按照所述匹配类型下的匹配度,调整所述匹配类型相同的各所述标准词组之间的排序,按照所述匹配类型,调整所述匹配类型不同的各所述标准词组之间的排序;
将所述排序满足第二预设要求的所述标准词组中的事实关键词确定为与所述待检测的法律文书中的事实关键词匹配的目标关键词。
5.根据权利要求2至4中任一项所述的方法,其特征在于,所述数据库中保存有多个标准法条组,每一个所述标准法条组由一个所述标准法律文书中的适用法条构成,同一个标准法律文书中的所述标准法条组和所述标准词组具有对应关系,
所述从所述数据库中确定与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条,包括:
从所述数据库中,确定与满足预设要求的所述标准词组对应的标准法条组;
将从所述数据库中确定的各标准法条组中的至少部分适用法条确定为目标法条。
6.根据权利要求1所述的方法,其特征在于,所述数据库中保存有事实关键词及分别与各所述事实关键词对应的法条列表,与一个所述事实关键词对应的所述法条列表包括出现该事实关键词的各所述标准法律文书中的各适用法条,
所述从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词,包括:从数据库中确定与所述待检测的法律文书中的事实关键词相同的目标关键词;
所述从所述数据库中确定与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条,包括:
将所述目标关键词对应的法条列表中的适用法条,确定为与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条。
7.根据权利要求1所述的方法,其特征在于,所述将所述待检测的法律文书中的适用法条与所述目标法条对比,根据对比结果从所述待检测的法律文书中的适用法条中识别到存疑法条,包括:
将所述待检测的法律文书中的适用法条与所述目标法条对比,根据对比结果确定出现在所述待检测的法律文书中且未出现在目标法条组中的至少一个法条,将所述至少一个法条确定为存疑法条。
8.一种法律文书中存疑法条的识别装置,其特征在于,包括:
信息获得单元,被配置为执行:获得待检测的法律文书中的事实关键词及适用法条;
关键词确定单元,被配置为执行:从数据库中确定与所述待检测的法律文书中的事实关键词匹配的目标关键词,其中,所述数据库中保存有从标准法律文书中提取的多个事实关键词及适用法条,同一所述标准法律文书中的事实关键词和适用法条具有对应关系;
目标法条确定单元,被配置为执行:从所述数据库中确定与所述目标关键词对应的适用法条,从确定的适用法条中确定目标法条;
存疑法条确定单元,被配置为执行:将所述待检测的法律文书中的适用法条与所述目标法条对比,根据对比结果从所述待检测的法律文书中的适用法条中识别到存疑法条。
9.一种电子设备,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行权利要求1至7中任一项所述的法律文书中存疑法条的识别方法。
10.一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至7中任一项所述的法律文书中存疑法条的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011538704.6A CN114661858A (zh) | 2020-12-23 | 2020-12-23 | 法律文书中存疑法条的识别方法、装置及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011538704.6A CN114661858A (zh) | 2020-12-23 | 2020-12-23 | 法律文书中存疑法条的识别方法、装置及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114661858A true CN114661858A (zh) | 2022-06-24 |
Family
ID=82025575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011538704.6A Pending CN114661858A (zh) | 2020-12-23 | 2020-12-23 | 法律文书中存疑法条的识别方法、装置及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114661858A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116451660A (zh) * | 2023-04-11 | 2023-07-18 | 浙江法之道信息技术有限公司 | 一种法律文本专业性审查与智能批注系统 |
-
2020
- 2020-12-23 CN CN202011538704.6A patent/CN114661858A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116451660A (zh) * | 2023-04-11 | 2023-07-18 | 浙江法之道信息技术有限公司 | 一种法律文本专业性审查与智能批注系统 |
CN116451660B (zh) * | 2023-04-11 | 2023-09-19 | 浙江法之道信息技术有限公司 | 一种法律文本专业性审查与智能批注系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11392591B2 (en) | Systems and methods for automatic clustering and canonical designation of related data in various data structures | |
EP3985578A1 (en) | Method and system for automatically training machine learning model | |
CN110458324B (zh) | 风险概率的计算方法、装置和计算机设备 | |
CN105787025B (zh) | 网络平台公共账号分类方法及装置 | |
CN112182246B (zh) | 通过大数据分析建立企业画像的方法、系统、介质及应用 | |
CN109558541B (zh) | 一种信息处理的方法、装置及计算机存储介质 | |
CN106651057A (zh) | 一种基于安装包序列表的移动端用户年龄预测方法 | |
CN109739844B (zh) | 基于衰减权重的数据分类方法 | |
CN112199602B (zh) | 岗位推荐方法、推荐平台及服务器 | |
US11755766B2 (en) | Systems and methods for detecting personally identifiable information | |
CN112052396A (zh) | 课程匹配方法、系统、计算机设备和存储介质 | |
CN111680506A (zh) | 数据库表的外键映射方法、装置、电子设备和存储介质 | |
CN104317837A (zh) | 一种基于主题模型的跨模态检索方法 | |
CN114661858A (zh) | 法律文书中存疑法条的识别方法、装置及相关设备 | |
US11308130B1 (en) | Constructing ground truth when classifying data | |
Choi et al. | Fake review identification and utility evaluation model using machine learning | |
CN116189215A (zh) | 自动审核方法、装置、电子设备及存储介质 | |
CN112560433B (zh) | 一种信息处理的方法及装置 | |
CN114676253A (zh) | 一种基于机器学习算法的元数据分级分类方法 | |
CN113837836A (zh) | 模型推荐方法、装置、设备及存储介质 | |
CN112732891A (zh) | 办公课程推荐方法、装置、电子设备及介质 | |
CN110309313B (zh) | 生成事件转移图谱的方法及装置 | |
CN110543910A (zh) | 信用状态监测系统和监测方法 | |
CN110825847A (zh) | 目标人物间亲密度识别方法、装置、电子设备及存储介质 | |
van Delden et al. | Searching for business websites |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: No. 05-501, 5th floor, No. 229, Middle North Fourth Ring Road (South podium building of Haitai building), Haidian District, Beijing 100083 Applicant after: Beijing guoshuangqianli Technology Co.,Ltd. Address before: No. 05-501, 5th floor, No. 229, Middle North Fourth Ring Road (South podium building of Haitai building), Haidian District, Beijing 100083 Applicant before: Beijing Qianli Richeng Technology Co.,Ltd. |