CN110414007A - 一种基于法理图规则引擎的法律概念识别方法 - Google Patents
一种基于法理图规则引擎的法律概念识别方法 Download PDFInfo
- Publication number
- CN110414007A CN110414007A CN201910714738.7A CN201910714738A CN110414007A CN 110414007 A CN110414007 A CN 110414007A CN 201910714738 A CN201910714738 A CN 201910714738A CN 110414007 A CN110414007 A CN 110414007A
- Authority
- CN
- China
- Prior art keywords
- legal
- concept
- rule
- law
- principle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000008569 process Effects 0.000 claims description 13
- 238000005070 sampling Methods 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 7
- 150000001875 compounds Chemical class 0.000 claims description 6
- 238000009795 derivation Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 230000009471 action Effects 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 238000012986 modification Methods 0.000 claims description 3
- 230000004048 modification Effects 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 2
- 230000007717 exclusion Effects 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 claims description 2
- 230000033228 biological regulation Effects 0.000 abstract description 14
- 206010039203 Road traffic accident Diseases 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000035622 drinking Effects 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Abstract
本发明公开了一种基于法理图规则引擎的法律概念识别方法,本发明将代表法律专家知识的法律图和规则引擎结合起来,实现了逻辑关系推理的法律概念识别;本发明构建一个法律概念法理逻辑图,每个法律概念可以看成是法理图上的一个结点,法理图确定了法律概念间的逻辑关系,使用法理图来指导法律概念识别的逻辑正确性。本发明在生成法律概念规则树步骤中,将法律专家整理的规则生成法律概念规则树,使得法律概念识别逻辑更加直观,更加具有可解释性。本发明创造性的提出了BSFC算法,实现了法理图的广度优先条件遍历。
Description
技术领域
本发明涉及自然语言分析处理技术领域,涉及一种法律文本法律概念识别系统实现方法。
背景技术
目前,实现类似法律概念识别这样的系统,主要是靠人工定义一套法律概念集,使用关键词定义其语义匹配模式,通过由关键词生成的正则表达式规则来匹配法律概念,这种方法由于其实现简单,准确性高等优势,为工业界普遍采用。但是,法律概念纷繁冗杂,需要考虑输入的法律文本是一个法律文书中的段落文本,还是一个口语化得法律问答文本;具体的案由和法律场景;法律概念之间的逻辑关系,如并列关系、互斥关系、推理关系等。综合考虑这些错综复杂的关系,才能实现一个较好的法律概念识别结果。
现有技术中,这种方式的缺点是,简单基于正则表达式的模式匹配,准确率高,但是没有考虑法律概念间的逻辑依存和推理关系,得到的结果往往和最基本的逻辑相违背。究其原因是因为法律概念知识庞杂,很多法律概念存在互斥和推理的关系,一味的使用关键词匹配,不考虑它们之间的逻辑,就会出现明显的违背逻辑的情况。
因此,本发明提供了一种基于法理图规则引擎的法律概念识别方法,以解决上述背景技术中提出的问题。
发明内容
本发明的目的在于提供一种基于法理图规则引擎的法律概念识别方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于法理图规则引擎的法律概念识别方法,其特征在于,其包括以下步骤:
(1)划分数据集:
按照案由和场景将待处理的数据进行划分,这个是法律上的划分,方便后面处理;比如根据涉及的案由,法律文本可以分为刑事、民事、行政等。刑事案由,继续细分又可分成很多子类,如盗窃罪、抢劫罪、交通肇事罪等;民事案由又可以继续划分成离婚纠纷、合同纠纷等等。场景就是更加细分的问题域,比如民事案由下的离婚纠纷,可以根据具体情况继续划分,如请求财产分割、请求子女抚养权等
(2)数据准备和预处理:
法律专家使用法律概念编辑管理工具进行法律概念整理,主要是对法律概念识别的规则做基本限定,同时针对具体的法律场景,法律专家进行法律图的构建;
(3)生成法律概念规则树:
根据法律概念识别规则生成法律概念规则树,使得法律概念识别逻辑更加直观,更加具有可解释性;
(4)集成法理图和规则树,生成法理图规则引擎;
(5)在指定数据集上测试规则引擎;
(6)抽样检查,并使用准确率、召回率、F1值进行评价;
(7)如果评价结果未达标,则转到步骤(8),否则转到步骤(9);
(8)调整规则树和法理图,转到步骤(4);
(9)整理并交付数据。
进一步,作为优选,在所述步骤(2)中,法律概念编辑管理工具至少能够实现法律概念的新建、修改、删除、查询功能。
进一步,作为优选,在所述步骤(6)中,抽样检查采取两种抽样策略,一种是自助抽样,用于发现法律概念识别错误的样本;另一种是使用关联规则方法,用于发现未召回的错误样本。
进一步,作为优选,在所述步骤(4)中,法理图上的结点包含场景结点、法律概念结点、逻辑结点、隐含的法律概念结点;其中场景结点表示一种细分的问题领域,比如离婚纠纷下分成请求分割财产、请求子女抚养权等具体的场景;法律概念结点指的是具体场景下的需要标注的法律概念,通常是专家总结的法律术语,比如请求分割财产场景下,‘房产’、‘婚前购买’、‘婚后购买’、‘房屋登记在一方名下’等等,都是属于法律概念。逻辑结点用于表示法理图上其他结点的关系,是一种边结点。如场景结点和法律概念结点之间的包含关系,法律概念结点和隐含的法律概念结点间的推理关系等。隐含的法律概念结点指的是那些不需要直接标注但能通过其他法律概念节点间接推理得到。如数值推理中,根据‘盗窃次数’的具体数值,可以推理出是否是‘多次盗窃’,交通肇事罪中,根据‘酒精含量’的具体数值,可以推理出是否是‘醉酒驾驶’。
进一步,作为优选,在所述步骤(3)中,法律概念识别是对法律实践活动过程中产生的各种法律文件的内容进行概念识别,将非结构化或半结构化的法律文本转换成结构化的法律数据,并最终将这些法律数据用于支撑法条案例检索、法律问答、判案量刑、类案搜索需求。
进一步,作为优选,规则引擎是应用系统中用来完成推理功能的模块,其包括调度器,执行器和一致性协调器三部分;调度器控制整个推理流程,使得推理可以按照一定的流程进行下去;执行器执行调度器所选定的动作,并且负责读取知识库中的知识和全局黑板中的信息;一致性协调器保持推理中间结果的一致性,主要用于反向推理中。
进一步,作为优选,在所述步骤(4)中,对于法理图上的所有节点,采用基于广度优先遍历算法的基础上采用一种广度优先条件遍历算法,以便于在广度优先遍历的基础上,加入逻辑判断,针对逻辑结点的逻辑关系,确定其临接结点的遍历方式。
与现有技术相比,本发明的有益效果是:
(1)对每个法律概念构建规则树,定义法律概念的包括案由、场景、段落、关键词等限定规则,这部分用于实现单个法律概念的识别。同时,针对特定的场景,本发明构建一个法律概念法理逻辑图(以下简称法理图),每个法律概念可以看成是法理图上的一个结点,法理图确定了法律概念间的逻辑关系,使用法理图来指导法律概念识别的逻辑正确性
(2)本发明在生成法律概念规则树步骤中,本发明将法律专家整理的规则生成法律概念规则树,使得法律概念识别逻辑更加直观,更加具有可解释性。在集成法理图和规则树,生成法理图规则引擎步骤中,实现了一个通用规则引擎框架,用于集成法律概念识别规则树和法理图的遍历逻辑,其中本发明创造性的提出了BSFC算法,实现了法理图的广度优先条件遍历。在抽样检查,并使用准确率、召回率、F1值进行评价步骤中,进行了抽样和评价,本发明创造性的使用关联规则挖掘方法,发现规则引擎未召回的法律文本样本,方便进一步的调整规则树和模型。
附图说明
图1为一种基于法理图规则引擎的法律概念识别方法的整体结构示意图;
图2为一种基于法理图规则引擎的法律概念识别方法中的法律概念规则树的实施例结构示意图;
图3为一种基于法理图规则引擎的法律概念识别方法中交通肇事法律概念识别法理逻辑结构图。
图4为一种基于法理图规则引擎的法律概念识别方法的流程结构示意图;
具体实施方式
请参阅图1~4,本发明实施例中,一种基于法理图规则引擎的法律概念识别方法,其具体包括以下步骤:
(1)划分数据集
按照案由和场景将待处理的数据进行划分,这个是法律上的划分,方便后面处理;比如根据涉及的案由,法律文本可以分为刑事、民事、行政等。刑事案由,继续细分又可分成很多子类,如盗窃罪、抢劫罪、交通肇事罪等;民事案由又可以继续划分成离婚纠纷、合同纠纷等等。场景就是更加细分的问题域,比如民事案由下的离婚纠纷,可以根据具体情况继续划分,如请求财产分割、请求子女抚养权等
(2)数据准备和预处理
法律专家使用法律概念编辑管理工具进行法律概念整理,该工具实现法律概念的新建、修改、删除、查询等功能,,主要是对法律概念识别的规则做基本限定,比如交通肇事罪这个案由下面有一个法律概念酒后驾驶,对于这个法律概念,通常在‘一审指控’、‘本院认为’段落出现,并且法律文本中通常会包含‘酒后’‘饮酒’‘驾’等关键词出现,这些都是规则限定。同时针对具体的法律场景,法律专家进行法律图的构建。
(3)生成法律概念规则树
根据法律概念识别规则生成法律概念规则树,具体参见图2。
计算机内部处理的规则表示如下:
法律概念规则=AND[条件型复合规则,文本匹配型复合规则]
以‘酒后驾驶’为例,
条件型复合规则::=OR[<condition段落=本院查明>,<condition段落=本院认为>];
文本匹配型复合规则::=OR[<regex rule r’酒后.*?驾’>,OR<regex rule r’醉酒.*?驾’>,<regex rule r’饮酒后.*?驾’>,<regex rule r’酒驾’>]
其中AND表示逻辑与关系,0R表示逻辑或关系,condition表示条件类型的规则,regex表示文本匹配型的规则。
(4)集成法理图和规则树,生成法理图规则引擎
本发明开发了一套用于实现一个规则引擎的框架,这个框架包含文本匹配与内容提取的完备规则设计、规则解析引擎、图的生成与遍历。其中的文本匹配与内容提取完备规则设计本质上是一种实现引用功能的可扩展正则语言,规则解析引擎包括规则管理、规则表达式解析、复合规则解析等核心模块,图的遍历通过BSFC算法实现。
以需要标注‘“致人死亡’这个法律概念为例,
法律专家编写的规则文本如下:
规则名称:导致
规则类型:EXRE文本
规则内容:导致|造成致
规则名称:死亡
规则类型:EXRE文本
规则内容:死亡|重伤<any>抢救无效死亡
变量名称:死亡人数
变量类型:number
规则名称:致一人死亡_1
规则类型:EXRE文本
规则内容:致人<死亡>
规则名称:致一人死亡
规则类型:EXRE文本
规则内容:<致一人死亡{死亡人数=1}>
规则名称:致多人死亡
规则类型:EXRE文本
规则内容:<导致><死亡人数>人<死亡>
规则引擎生成的规则如下:
(?:导致|造成|致)(?P<死亡人数>.*?)人(?:死亡|重伤(?:.*?)抢救无效死亡)
该框架能自动根据法律专家制定的规则生成组合规则树,并结合法理图,形成完整的法律概念识别规则引擎。对于法理图上的所有节点,本发明基于广度优先遍历算法(BFS),提出了一种广度优先条件遍历算法(BFSC),该算法主要的思想是在广度优先遍历的基础上,加入逻辑判断,针对逻辑结点的逻辑关系,确定其临接结点的遍历方式。
(5)在指定数据集上测试规则引擎;
(6)抽样检查,并使用准确率、召回率、F1值进行评价;
要解释以上三个评价指标,我们需要先看一下混淆矩阵的概念
实际/预测 | 预测值=1 | 预测值=0 |
实际值=1 | TP | FN |
实际值=0 | FP | TN |
其中,TP表示真阳性,FP表示假阳性,FN表示假阴性,TN表示真阴性
那么,准确率、召回率、F1值分别定义如下:
准确率=(TP+TN)/(TP+TN+FN+TN)
召回率=TP/(TP+FN)
F1值=2*TP/(2*TP+FP+FN)
本发明采取了两种抽样策略,一种是自助抽样,在统计学中,自助抽样法是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中,对于小数据集,自助法效果好。该方法用于发现法律概念识别错误的样本来反映总体的错误率情况;另一种是使用关联规则方法,关联规则是一种数据挖掘方法,其挖掘过程主要包含两个阶段:第一阶段必须先从资料集合中找出所有的高频组合,第二阶段再由这些高频组合中产生关联规则。该方法可以帮助我们发现哪些法律概念的组合可能会同时出现,从而发现可能未召回的错误样本。
(7)如果评价结果未达标,则转到(8),否则转到(9);
(8)调整规则树和法理图,转到(4)
(9)整理并交付数据。具体的总体流程图如图4所示。
本发明做了两组测试,第一组是完全使用关键词规则进行扁平化的法律概念识别,第二组是使用法律图规则引擎的方法结合推理进行识别,下面是两组实验的结果:
从实验的结果,很容易发现,基于法理图的法律概念识别的准确率比不考虑法律概念间的逻辑关系的识别准确率高出接近百分之十,同时召回率也提升了接近百分之四。实验结果表明,本发明能在很大程度上提高法律概念识别的准确率,同时能在一定程度上提高法律概念识别的召回率。
下面对相关关概念和术语进行说明与限定。
1.法律文本
法律文本泛指在法律活动过程中产生的一种规范化得文本。它是立法制度或程序运作的产物,而非个人的自由创作。如法律法规、司法解释、裁判文书等。
2.法律概念
法律概念其实就是对一段法律文本的归纳总结性的表达,是法律行业沟通的术语。常见的交通肇事罪相关的法律概念如:醉酒驾车导致重大交通事故;酒后驾驶;逃逸;全部责任;车辆类型;积极赔偿但没有取得谅解;尽管没有赔偿,但取得谅解的;自首;防卫过当等。有一定法律知识的人应该可以理解上面这些法律概念表达的含义。
3.法理图
法理图是一种用于表达各种法律概念之间关系的有向无循环图。法理图上的结点包含场景结点、法律概念结点、逻辑结点、隐含的法律概念结点。其中逻辑结点又包含并列关系结点、互斥关系结点、逻辑蕴含结点等。隐含的法律概念结点指的是不能直接识别的法律概念,但是可以通过其他的已经识别出来的法律概念通过逻辑推理得出的隐含的法律概念。
4.规则引擎
规则是一种知识,其典型的应用场景是通过实际情况,根据给出的一组规则,得出结论。规则的这种运用过程叫做推理,使用计算机程序来处理推理过程,该程序可以认为是推理引擎。其实,推理引擎就是应用系统中用来完成推理功能的模块。推理引擎一般包括调度器,执行器和一致性协调器三部分。调度器控制整个推理流程,使得推理可以按照一定的流程进行下去;执行器执行调度器所选定的动作,并且负责读取知识库中的知识和全局黑板中的信息;一致性协调器保持推理中间结果的一致性,主要用于反向推理中。
推理引擎根据知识表示的不同采取的控制策略也是不同的,在这里本发明所实现的是基于产生式规则集的知识表示。选择这种知识表示是因为其具有很多的优点,尤其是其易于理解、易于获取、易于管理,并且在现今的大多数智能应用系统中都采用了这种知识表示方法。基于这种知识表示的推理引擎采用“识别-动作″的方式来循环执行规则。
推理引擎还有其他的知识表示类型,包括基于神经网络和基于案例。但基于规则的推理引擎实现最为简单,使用最为广泛,又称为规则引擎。
规则引擎可以将规则的定义从代码中分离出来,将推理过程封装到规则引擎内部进行处理,这带来几个好处:
(1)规则外部化,即有利于规则知识的复用,也可避免改变规则时带来的代码变更问题;
(2)规则引擎使用某种算法进行推理过程,不需要编写复杂晦涩的逻辑判断代码;
(3)开发人员的不需要过多关注逻辑判断,可以专注于逻辑处理。
5.法律概念识别
法律概念识别就是要对法律实践活动过程中产生的各种法律文件的内容进行概念识别,将非结构化或半结构化的法律文本转换成结构化的法律数据,并最终将这些法律数据用于支撑法条案例检索、法律问答、判案量刑、类案搜索等需求。
本发明通过基于法理图规则引擎的法律概念识别方法实现了给定一个法律文本,可以识别出文本中包含的法律概念集。
本发明将代表法律专家知识的法律图和规则引擎结合起来,实现了逻辑关系推理的法律概念识别;本发明详细阐述了基于法理图规则引擎进行法律概念识别的完整实现步骤。对每个法律概念构建规则树,定义法律概念的包括案由、场景、段落、关键词等限定规则,这部分用于实现单个法律概念的识别。同时,针对特定的场景,本发明构建一个法律概念法理逻辑图,每个法律概念可以看成是法理图上的一个结点,法理图确定了法律概念间的逻辑关系,使用法理图来指导法律概念识别的逻辑正确性。本发明在生成法律概念规则树步骤中,将法律专家整理的规则生成法律概念规则树,使得法律概念识别逻辑更加直观,更加具有可解释性。在集成法理图和规则树,生成法理图规则引擎步骤中,实现了一个通用规则引擎框架,用于集成法律概念识别规则树和法理图的遍历逻辑,其中本发明创造性的提出了BSFC算法,实现了法理图的广度优先条件遍历。在抽样检查,并使用准确率、召回率、F1值进行评价步骤中,进行了抽样和评价,本发明创造性的使用关联规则挖掘方法,发现规则引擎未召回的法律文本样本,方便进一步的调整规则树和模型。
以上所述的,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (9)
1.一种基于法理图规则引擎的法律概念识别方法,其特征在于,其包括以下步骤:
(1)划分数据集:
按照案由和场景将待处理的数据进行划分,这个是法律上的划分,方便后面处理;
(2)数据准备和预处理:
法律专家使用法律概念编辑管理工具进行法律概念整理,主要是对法律概念识别的规则进行编写,同时针对具体的法律场景,法律专家进行法律图的构建;
(3)生成法律概念规则树和法理图:
根据法律概念识别规则生成法律概念规则树,使得法律概念识别逻辑更加直观,更加具有可解释性;
(4)集成规则树和法理图,生成法理图规则引擎;
(5)在指定数据集上测试规则引擎;
(6)抽样检查,并使用准确率、召回率、F1值进行评价;
对于以上三个评价指标,先看一下混淆矩阵的概念
其中,TP表示真阳性,FP表示假阳性,FN表示假阴性,TN表示真阴性
那么,准确率、召回率、F1值分别定义如下:
准确率=(TP+TN)/(TP+TN+FN+TN)
召回率=TP/(TP+FN)
F1值=2*TP/(2*TP+FP+FN)
(7)如果评价结果未达标,则转到步骤(8),否则转到步骤(9);
(8)调整规则树和法理图,转到步骤(4);
(9)整理并交付数据。
2.根据权利要求1所述的一种基于法理图规则引擎的法律概念识别方法,其特征在于,在所述步骤(2)、(3)、(4)中,法律概念规则编写和法理图的构建;法律概念规则的编写使用文本匹配规则编写语言,通过原子规则和逻辑组合生成复合规则;法理图的构建根据具体的案由和场景,采用推理、互斥等关系连接法律概念规则。
3.根据权利要求2所述的一种基于法理图规则引擎的法律概念识别方法,其特征在于一种可扩展的文本匹配的描述语言,其基于正则表达式的语法并加入了引用的功能,在这种可扩展的性在于在该文本中可以引用其他文本,增加表达的可复用性。
4.根据权利要求2所述的一种基于法理图规则引擎的法律概念识别方法,其特征在于,根据具体的案由和场景构建法理图,法理图上的结点包含场景结点、法律概念结点、逻辑结点、隐含的法律概念结点;其中场景结点表示一种细分的问题领域,比如离婚纠纷下分成请求分割财产、请求子女抚养权等具体的场景;法律概念结点指的是具体场景下的需要标注的法律概念,通常是专家总结的法律术语,比如请求分割财产场景下,‘房产’、‘婚前购买’、‘婚后购买’、‘房屋登记在一方名下’等等,都是属于法律概念;逻辑结点用于表示法理图上其他结点的关系,是一种边结点,如场景结点和法律概念结点之间的包含关系,法律概念结点和隐含的法律概念结点间的推理关系等,隐含的法律概念结点指的是那些不需要直接标注但能通过其他法律概念节点间接推理得到,如数值推理中,根据‘盗窃次数’的具体数值,可以推理出是否是‘多次盗窃’,交通肇事罪中,根据‘酒精含量’的具体数值,可以推理出是否是‘醉酒驾驶’;
其中逻辑结点至少包含并列关系结点、互斥关系结点、逻辑蕴含结点;
隐含的法律概念结点是不能直接识别的法律概念,其可通过其他的已经识别出来的法律概念通过逻辑推理得出的隐含的法律概念。
5.根据权利要求3所述的一种基于法理图规则引擎的法律概念识别方法,其特征在于,法律概念编辑管理工具,该工具能够实现法律概念规则的新建、修改、删除、查询功能;同时能够基于法律概念规则构建法理图。
6.根据权利要求4所述的一种基于法理图规则引擎的法律概念识别方法,其特征在于,对于法理图上的所有节点,采用一种广度优先条件遍历算法,该算法基于广度优先遍历算法,加入逻辑判断,针对逻辑结点的逻辑关系,确定其临接结点的遍历方式。
7.根据权利要求1所述的一种基于法理图规则引擎的法律概念识别方法,其特征在于,在所述步骤(6)中,抽样检查采取两种抽样策略,一种是自助抽样,用于发现法律概念识别错误的样本;另一种是使用关联规则方法,用于发现未召回的错误样本。
8.根据权利要求4所述的一种基于法理图规则引擎的法律概念识别方法,其特征在于,构建法理图规则引擎对法律实践活动过程中产生的各种法律文件的内容进行概念识别,将非结构化或半结构化的法律文本转换成结构化的法律数据,并最终将这些法律数据用于支撑法条案例检索、法律问答、判案量刑、类案搜索需求。
9.根据权利要求1所述的一种基于法理图规则引擎的法律概念识别方法,其特征在于,划分数据集时,根据涉及的案由,法律文本分为刑事、民事、行政等;刑事案由,继续细分又分成包括盗窃罪、抢劫罪、交通肇事罪在内的子类;民事案由又继续划分成离婚纠纷、合同纠纷,场景就是更加细分的问题域,比如民事案由下的离婚纠纷,根据具体情况继续划分,如请求财产分割、请求子女抚养权。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910714738.7A CN110414007A (zh) | 2019-08-02 | 2019-08-02 | 一种基于法理图规则引擎的法律概念识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910714738.7A CN110414007A (zh) | 2019-08-02 | 2019-08-02 | 一种基于法理图规则引擎的法律概念识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110414007A true CN110414007A (zh) | 2019-11-05 |
Family
ID=68365544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910714738.7A Pending CN110414007A (zh) | 2019-08-02 | 2019-08-02 | 一种基于法理图规则引擎的法律概念识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110414007A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111797232A (zh) * | 2020-06-11 | 2020-10-20 | 南京擎盾信息科技有限公司 | 法律事件图谱构建方法、法律事件推理方法、装置和电子设备 |
CN111898361A (zh) * | 2020-07-14 | 2020-11-06 | 南京擎盾信息科技有限公司 | 法律文本解析方法、装置、设备和存储介质 |
CN115858507A (zh) * | 2022-08-25 | 2023-03-28 | 中国司法大数据研究院有限公司 | 一种刑事量刑规则自动化评估、纠错与补全的方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040117395A1 (en) * | 2002-12-11 | 2004-06-17 | International Business Machines Corporation | Method and knowledge structures for reasoning about concepts, relations, and rules |
CN105022733A (zh) * | 2014-04-18 | 2015-11-04 | 中科鼎富(北京)科技发展有限公司 | Dinfo-oec文本分析挖掘方法与设备 |
CN107908671A (zh) * | 2017-10-25 | 2018-04-13 | 南京擎盾信息科技有限公司 | 基于法律数据的知识图谱构建方法及系统 |
CN108073569A (zh) * | 2017-06-21 | 2018-05-25 | 北京华宇元典信息服务有限公司 | 一种基于多层级多维度语义理解的法律认知方法、装置和介质 |
-
2019
- 2019-08-02 CN CN201910714738.7A patent/CN110414007A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040117395A1 (en) * | 2002-12-11 | 2004-06-17 | International Business Machines Corporation | Method and knowledge structures for reasoning about concepts, relations, and rules |
CN105022733A (zh) * | 2014-04-18 | 2015-11-04 | 中科鼎富(北京)科技发展有限公司 | Dinfo-oec文本分析挖掘方法与设备 |
CN108073569A (zh) * | 2017-06-21 | 2018-05-25 | 北京华宇元典信息服务有限公司 | 一种基于多层级多维度语义理解的法律认知方法、装置和介质 |
CN107908671A (zh) * | 2017-10-25 | 2018-04-13 | 南京擎盾信息科技有限公司 | 基于法律数据的知识图谱构建方法及系统 |
Non-Patent Citations (1)
Title |
---|
乔钢柱 等: "基于知识图谱的盗窃案件法律文书智能推理研究", 《计算机系统应用 》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111797232A (zh) * | 2020-06-11 | 2020-10-20 | 南京擎盾信息科技有限公司 | 法律事件图谱构建方法、法律事件推理方法、装置和电子设备 |
CN111898361A (zh) * | 2020-07-14 | 2020-11-06 | 南京擎盾信息科技有限公司 | 法律文本解析方法、装置、设备和存储介质 |
CN115858507A (zh) * | 2022-08-25 | 2023-03-28 | 中国司法大数据研究院有限公司 | 一种刑事量刑规则自动化评估、纠错与补全的方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fan et al. | In plain sight: Media bias through the lens of factual reporting | |
Al-Abdulkarim et al. | A methodology for designing systems to reason with legal cases using abstract dialectical frameworks | |
CN110334178B (zh) | 数据检索方法、装置、设备及可读存储介质 | |
CN111538844B (zh) | 目标领域知识库的生成、问题解答方法及装置 | |
CN110414007A (zh) | 一种基于法理图规则引擎的法律概念识别方法 | |
CA2952549A1 (en) | Ontology mapping method and apparatus | |
Cui et al. | Benefits of ontologies in real time data access | |
CN111427968A (zh) | 一种基于知识图谱的重点人员全息档案构建方法及装置 | |
US20180067987A1 (en) | Database capable of integrated query processing and data processing method thereof | |
CN106227788A (zh) | 一种以Lucene为基础的数据库查询方法 | |
KR100800460B1 (ko) | 웹 온톨로지 검색/분류 시스템 및 방법 | |
CN112883286A (zh) | 基于bert的新冠肺炎疫情微博情感分析方法、设备、介质 | |
Casanovas | Semantic web regulatory models: Why ethics matter | |
Kwon et al. | Proactive development of emerging technology in a socially responsible manner: Data-driven problem solving process using latent semantic analysis | |
He et al. | A heuristic grafting strategy for manufacturing knowledge graph extending and completion based on nature language processing: KnowTree | |
McNeill et al. | Communication in emergency management through data integration and trust: an introduction to the CEM-DIT system | |
Korger et al. | The SECCO ontology for the retrieval and generation of security concepts | |
CN114997624A (zh) | 智能化全员安全生产责任制管理系统 | |
Katz et al. | Data system design alters meaning in ecological data: salmon habitat restoration across the US Pacific Northwest | |
CN112308464B (zh) | 业务流程数据处理方法和装置 | |
Meisenbacher et al. | Transforming unstructured text into data with context rule assisted machine learning (CRAML) | |
Guizzardi et al. | Relational contexts and conceptual model clustering | |
EP3547154B1 (en) | Constraint satisfaction software tool for database tables | |
Okoye | Linked open data: State-of-the-art mechanisms and conceptual framework | |
Al Saiyd et al. | Semantic-based retrieving model of reuse software component |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191105 |