CN112559766A - 一种法律知识图谱构建系统 - Google Patents
一种法律知识图谱构建系统 Download PDFInfo
- Publication number
- CN112559766A CN112559766A CN202011445442.9A CN202011445442A CN112559766A CN 112559766 A CN112559766 A CN 112559766A CN 202011445442 A CN202011445442 A CN 202011445442A CN 112559766 A CN112559766 A CN 112559766A
- Authority
- CN
- China
- Prior art keywords
- legal
- law
- ontology
- module
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010276 construction Methods 0.000 title claims abstract description 20
- 238000004364 calculation method Methods 0.000 claims abstract description 22
- 238000013075 data extraction Methods 0.000 claims abstract description 20
- 238000010801 machine learning Methods 0.000 claims abstract description 20
- 238000012795 verification Methods 0.000 claims abstract description 16
- 239000000463 material Substances 0.000 claims abstract description 10
- 239000000284 extract Substances 0.000 claims abstract description 9
- 238000009411 base construction Methods 0.000 claims abstract description 6
- 238000013524 data verification Methods 0.000 claims abstract description 4
- 238000005516 engineering process Methods 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 8
- 238000000034 method Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 238000003058 natural language processing Methods 0.000 claims description 7
- 238000007726 management method Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 238000007619 statistical method Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims 1
- 230000001502 supplementing effect Effects 0.000 claims 1
- 230000006399 behavior Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005293 physical law Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- Mathematical Physics (AREA)
- Technology Law (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Animal Behavior & Ethology (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种法律知识图谱构建系统,该系统包括法律本体库构建模块、数据抽取模块、图谱构建模块和要件事实证明模块等;法律本体库构建模块由法律专家确定本体范围并定义法律本体库中概念,将概念的属性定义为参数,将概念之间的关系定义为公式,然后创建实例构建法律本体库,通过机器学习进行迭代更新;数据抽取模块对原始证据文件进行文字提取,构建法律语义库,并与法律本体库进行实体链接;图谱构建模块批量填充实体属性数据以构建法律知识图谱;要件事实证明模块从法律知识图谱中读取参数对应的参数值,并根据公式批量进行自动数据校验与计算,将校验与计算结果填充到知识图谱中,同时也作为机器学习的素材对法律本体库进行更新。
Description
技术领域
本发明涉及知识图谱领域,尤其涉及一种法律知识图谱构建系统。
背景技术
知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。知识图谱的每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效表示方式。
而伴随着知识图谱的兴起是人工智能领域的机器学习技术以及相关概念。其核心要点在于通过搜集一系列大数量级的结构化数据或非结构化数据,继而基于领域专业性对数据进行分析建模,并通过机器计算从中找出规律——通常是该领域的规律,最后机器可以识别该规律并进行学习,形成之后生成相关数据的计算规则。
本体(Ontology)作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,已被广泛应用于知识工程、系统建模、信息处理、数字图书馆、自然语言理解、语义web等领域中。知识图谱分为数据层和模式层,数据层是由一系列事实数据构成,而模式层则用来从数据中构建实体、属性、关系,是知识图谱的核心。法律本体库被广泛用于构建知识图谱数据层,由法律本体库构建的知识图谱冗余较小,结构层次强。
图形数据库是NoSQL数据库的一种类型,它应用图形理论存储实体之间的关系信息。图形数据库是一种非关系型数据库,它应用图形理论存储实体之间的关系信息。关系型数据库用于存储“关系型”数据的效果并不好,其查询复杂、缓慢、超出预期,而图形数据库的独特设计恰恰弥补了这个缺陷。
在一个图形数据库中,最主要的组成有两种,结点集和连接结点的关系。结点集就是图中一系列结点的集合,比较接近于关系数据库中所最常使用的表,而关系则是图形数据库所特有的组成。
现有知识图谱大都采用自底向上构建的方式搭建知识图谱,主要步骤如下:
1、识别原始法律数据,并生成带有法律特征的文本语义库;
2、利用所述文本语义库以及法律法规库识别法律实体和/或法律关系,进行法律规则处理并生成法律知识特征库;
3、梳理建立法律规则模型,利用所述法律规则模型识别法律概念,并作为法律知识特征存储于所述法律知识特征库;
4、基于所述文本语义库进行语意理解和/或识别文本意图,对文本语义上下文语境分析抽取文本特征并存储于所述法律知识特征库;
5、利用所述法律知识特征库进行机器学习训练,并对机器学习训练后的法律特征存储于所述法律知识特征库;
6、利用自然语言理解模块抽取得到的文本特征、特征机器学习模块得到的法律知识特征和/或知识工程模块识别得到的法律概念,识别法律知识点,并通过法律概念框架建立法律知识点的关联;
7、展示通过已进行关联处理的法律知识点的法律知识图谱并保存所述法律知识图谱。
现有技术的缺点如下:
1、机器无法明白图谱内在的逻辑:现有技术是通过聚类搭建起来的知识图谱,没有法律本体库和实际的法律理论作指导,机器无法理解人类的思维方式,也就无法实现像法律人一样审案和裁决。
2、无法重现案件过程:现有技术的业务数据,大部分来源于裁判文书网的裁判文书,仅有裁判文书就只能取得文书上的数据,而没法取得其他起到辅助作用但不体现在文书中的业务数据,这样就无法重构整个案件的法律行为过程。
3、准确性不高:现有技术搭建的知识图谱,因为机器学习的特性,准确率上很难达到90%以上,但是法律文书的要求是绝对正确,所以准确率达不到要求的文书还是无法使用的。
4、技术应用片面:目前只能根据已有的文书来生成类似文书,无法推理出新品类的文书,同时提取的数据因为数据源的片面,导致图谱只能应用在智能问答、法律咨询等准确率不高的场景中。
发明内容
本发明目的在于针对现有技术的不足,提出一种法律知识图谱构建系统,通过构建法律本体库,使机器能够理解法律,以法律人的思维方式进行审案,能够批量快速校验同类案件证据并出具审核结果,根据请求权的不同,自动组合生成法律文书,并大幅提高文书的准确率,构建知识图谱,使系统具有了一个智能化的可扩展的底层支撑系统,后续发展具有无限可能。
本发明的目的是通过以下技术方案来实现的:一种法律知识图谱构建系统,该系统包括法律本体库构建模块、参数与公式管理模块、数据抽取模块、图谱构建模块、要件事实证明模块、法律文书生成模块和知识推理模块;
所述法律本体库构建模块由法律专家确定本体范围并定义法律本体库中概念,将概念的属性定义为参数,将概念之间的关系定义为公式,然后创建实例构建法律本体库,针对参数与公式进行机器学习对法律本体库内容进行智能迭代更新;
所述数据抽取模块对原始证据文件进行文字提取,构建法律语义库,并与法律本体库进行实体链接;
所述图谱构建模块根据法律本体库,以数据抽取模块抽取到的数据为基础,通过实体链接的方式批量填充实体属性数据以构建法律知识图谱;
所述要件事实证明模块从法律本体库读取参数与公式,然后从构建的法律知识图谱中读取参数对应的参数值,并根据公式批量进行自动数据校验与计算,将校验与计算结果填充到知识图谱中,同时也作为机器学习的更新参数对法律本体库进行更新。
进一步地,法律语义库与法律本体库的实体链接具体为从法律语义库提取带词性的单词短语的文字信息,和法律本体库里面的某个概念关联。
进一步地,所述法律本体库构建模块由法律专家根据要件事实论确定本体范围并定义法律本体库中概念,然后定义请求权-要件-法律事实的概念分类层次,通过对创建的实例以及实际个案数据进行汇总与统计,并根据统计结果匹配法律专家的概念分类,根据匹配结果,分类通知法律专家对法律本体库内容进行迭代更新。
进一步地,该系统还包括参数与公式管理模块:法律本体库中的参数与公式进行统一管理,并将属性和公式的运行结果作为参数,知识图谱仅有参数与公式组成,将参数与公式更新到法律本体库中。参数与公式是法律本体库可维护的最小单元,也是机器可识别与运算的基础单元与执行依据。同时参数定义了来源与引用,为法律文书中每一个数据提供了数据溯源功能。
进一步地,所述数据抽取模块利用OCR文字识别技术及NLP自然语言处理技术对原始证据文件进行文字提取与分词,通过人工神经网络进行语义的深度学习构建法律语义库,之后采用CRF条件随机场技术实现命名实体识别功能,采用实体消歧与共指消解技术实现提取数据到法律本体库的实体链接。通过法律专家标注及提取技术,参照法律本体库对证据文件进行标注并由机器批量提取获取个案数据作为图谱的素材,同时对提取结果进行比对,以提高数据抽取的准确率并修正数据抽取模块的偏差。
进一步地,所述图谱构建模块采用图数据库,实现法律知识图谱的存储与应用。
进一步地,所述要件事实证明模块的校验结果作为实体间关系,多个公式从数据库实体中读取需要用的参数,进行校验和计算,校验结果即多条关系组合成为要件事实的证明条件,用以补充与完善知识图谱;同时公式计算结果也作为新的参数,结果的数值作为参数值,填充到知识图谱中。校验与计算的结果则作为机器学习的素材以更新法律本体库。
进一步地,该系统还包括法律文书生成模块:基于人工神经网络(包括模糊神经网络)的知识处理。通过神经网络的学习训练,利用学习结果以及法律本体库参数与公式,生成当事人、律师等人员所撰写的申请文书以及法院、仲裁机构等依法制作的法律文书。并可由法律专家结合知识图谱对文书生成结果进行用词的准确性修正。
进一步地,该系统还包括知识推理模块:根据知识图谱中数据进行机器学习以及数据统计分析,并通过对学习结果进行人工干预,以人工与机器结合的方式完善法律本体库,也进一步完善知识图谱的应用能力。
本发明的有益效果:
1、法律专家根据民事要件论构建法律本体库,其搭建的知识图谱符合法律人的思维逻辑,易于理解,准确率也更高。
2、知识图谱简化为由参数与公式构成,正好契合知识图谱的实体与关系,可以完美实现法律知识从人到机器的转变,使机器可以识别并理解法律知识,为下一步发展奠定基础。
3、通过人工神经网络进行样本的深度学习得到训练语义材料,再利用自然语言处理组件中的信息抽取、词性标注、命名实体、指代消解、词义消歧等技术提取图谱数据,能把非结构化数据转换成结构化数据,大幅提升从证据中获取数据的效率与准确性,同时也使所有数据可溯源。
4、大量高标准、重复性大、可定量的数据,使计算机得到大量可读的数据来构成知识图谱,而知识图谱的构建可以使批量校验类案证据、批量生成类案法律文书等基于知识图谱的功能得以实现,从而大幅度提高了法律工作人员的效率。
5、知识图谱将法律规定、法律文书、证据材料及其他法律资料中的法律知识点以一定的法律逻辑连接在一起形成概念框架,并通过机器学习与人工介入,使知识图谱自成在概念框架中,以一个自反馈系统的模式不断地自我完善与补充。
附图说明
图1为本发明法律知识图谱构建系统的结构示意图;
图2为本发明具体实例示意图。
具体实施方式
以下结合附图对本发明具体实施方式作进一步详细说明。
本发明提供一种法律知识图谱构建系统,该系统包括法律本体库构建模块、参数与公式管理模块、数据抽取模块、图谱构建模块、要件事实证明模块、法律文书生成模块和知识推理模块;
所述法律本体库构建模块由法律专家确定本体范围并定义法律本体库中概念,将概念的属性定义为参数,将概念之间的关系定义为公式,然后创建实例构建法律本体库,针对参数与公式进行机器学习对法律本体库内容进行智能迭代更新;
所述数据抽取模块对原始证据文件进行文字提取,构建法律语义库,并与法律本体库进行实体链接;法律语义库与法律本体库的实体链接具体为从法律语义库提取带词性的单词短语的文字信息,和法律本体库里面的某个概念关联。
所述图谱构建模块根据法律本体库,以数据抽取模块抽取到的数据为基础,通过实体链接的方式批量填充实体属性数据以构建法律知识图谱;
所述要件事实证明模块从法律本体库读取参数与公式,然后从构建的法律知识图谱中读取参数对应的参数值,并根据公式批量进行自动数据校验与计算,将校验与计算结果填充到知识图谱中,同时也作为机器学习的更新参数对法律本体库进行更新。
所述法律本体库构建模块由法律专家根据要件事实论确定本体范围并定义法律本体库中概念,然后定义请求权-要件-法律事实的概念分类层次,通过对创建的实例以及实际个案数据进行汇总与统计,并根据统计结果匹配法律专家的概念分类,根据匹配结果,分类通知法律专家对法律本体库内容进行迭代更新。
要件事实是指产生法律效果所必需的实体法要件对应的具体事实。要件事实论是指在明确要件事实在法律上具有何种性质的基础上,对法律的内容、构造以及裁判的构造进行思考的理论。
法律知识图谱构建系统还包括参数与公式管理模块:法律本体库中的参数与公式进行统一管理,并将属性和公式的运行结果作为参数,知识图谱仅有参数与公式组成,将参数与公式更新到法律本体库中。参数与公式是法律本体库可维护的最小单元,也是机器可识别与运算的基础单元与执行依据。同时参数定义了来源与引用,为法律文书中每一个数据提供了数据溯源功能。
参数分为多个来源,有些来源于书面文件的数据抽取,有些是当事人陈述,更多的是参数之间通过公式进行计算的结果,这部分也会作为图谱的一部分进行保存与使用。
所述数据抽取模块利用OCR文字识别技术及NLP自然语言处理技术对原始证据文件进行文字提取与分词,通过人工神经网络进行样本的深度学习构建法律语义库,之后采用CRF条件随机场技术实现命名实体识别功能,采用实体消歧与共指消解技术实现提取数据到法律本体库的实体链接。通过法律专家标注及提取技术,参照法律本体库对证据文件进行高精度标注并由机器批量提取获取大量个案数据作为图谱的素材,同时对提取结果进行比对,以提高数据抽取的准确率并修正数据抽取模块的偏差。
所述图谱构建模块采用图数据库,实现法律知识图谱的存储与应用。
所述要件事实证明模块的校验结果作为实体间关系,多个公式从数据库实体中读取需要用的参数,进行校验和计算,校验结果即多条关系组合成为要件事实的证明条件,用以补充与完善知识图谱;同时公式计算结果也作为新的参数,结果的数值作为参数值,填充到知识图谱中。校验与计算的结果则作为机器学习的素材以更新法律本体库。
法律知识图谱构建系统还包括法律文书生成模块:基于人工神经网络(包括模糊神经网络)的知识处理。通过神经网络的学习训练,利用样本性知识以及法律本体库参数与公式,自动生成当事人、律师等人员所撰写的申请文书以及法院、仲裁机构等依法制作的法律文书。并可由法律专家结合知识图谱对文书生成结果进行用词的准确性修正。
法律知识图谱构建系统还包括知识推理模块:根据知识图谱中数据进行机器学习以及数据统计分析,并通过对学习结果进行人工干预,以人工与机器结合的方式完善法律本体库,也进一步完善知识图谱的应用能力。
本发明的一个具体实例如下:
针对借贷案件,法律专家首先解构,定义请求权->一层要件->二层要件->法律事实。
定义涉及到的法律行为人为借款人与出借人;
定义涉及到的证据文件为借贷合意的借款合同/借条/欠条以及出借款项交付证明;
定义涉及到的参数,参数分为原始数据与公式计算结果;
定义涉及到的公式;
最后定义生成的文书。
以上定义构成法律本体库中一个本体。
然后根据本体,在案件材料中提取个案用到的数据,生成证据实体;
读取本体的公式和参数,并获取原始参数赋值,然后通过公式计算后给计算结果对应参数赋值。
证据与行为人之间存在的关系即为校验规则,读取参数进行校验后,校验结果也作为关系属性的一部分保存在关系中。
最后个案中的参数与公式实体,就是法律文书的组成部分,用来组合生成法律文书,最终法律专家只需要修改文书中的具体措辞即可。
多个同类型案件汇总后,可以得到一个汇总的模型,每一部分可以有重复率等等,再和法律专家手工构建的作比较,比较结果后,推给法律专家,法律专家考虑是直接修改还是采用系统汇总出来的结果等。
另外,公式如果使用频度很高,也会被筛选出来给法律专家,由法律专家考虑是否可以更新到法律本体库中,作为校验规则等。
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。
Claims (9)
1.一种法律知识图谱构建系统,其特征在于,该系统包括法律本体库构建模块、参数与公式管理模块、数据抽取模块、图谱构建模块、要件事实证明模块、法律文书生成模块和知识推理模块;
所述法律本体库构建模块由法律专家确定本体范围并定义法律本体库中概念,将概念的属性定义为参数,将概念之间的关系定义为公式,然后创建实例构建法律本体库,针对参数与公式进行机器学习对法律本体库内容进行智能迭代更新;
所述数据抽取模块对原始证据文件进行文字提取,构建法律语义库,并与法律本体库进行实体链接;
所述图谱构建模块根据法律本体库,以数据抽取模块抽取到的数据为基础,通过实体链接的方式批量填充实体属性数据以构建法律知识图谱;
所述要件事实证明模块从法律本体库读取参数与公式,然后从构建的法律知识图谱中读取参数对应的参数值,并根据公式批量进行自动数据校验与计算,将校验与计算结果填充到知识图谱中,同时也作为机器学习的更新参数对法律本体库进行更新。
2.根据权利要求1所述的一种法律知识图谱构建系统,其特征在于,法律语义库与法律本体库的实体链接具体为从法律语义库提取带词性的单词短语的文字信息,和法律本体库里面的某个概念关联。
3.根据权利要求1所述的一种法律知识图谱构建系统,其特征在于,所述法律本体库构建模块由法律专家根据要件事实论确定本体范围并定义法律本体库中概念,然后定义请求权-要件-法律事实的概念分类层次,通过对创建的实例以及实际个案数据进行汇总与统计,并根据统计结果匹配法律专家的概念分类,根据匹配结果,分类通知法律专家对法律本体库内容进行迭代更新。
4.根据权利要求1所述的一种法律知识图谱构建系统,其特征在于,该系统还包括参数与公式管理模块:法律本体库中的参数与公式进行统一管理,并将本体库中的实体属性和公式的运行结果作为参数,知识图谱仅由参数与公式组成,将参数与公式更新到法律本体库中。参数与公式是法律本体库可维护的最小单元,也是机器可识别与运算的基础单元与执行依据。同时参数定义了来源与引用,为法律文书中每一个数据提供了数据溯源功能。
5.根据权利要求1所述的一种法律知识图谱构建系统,其特征在于,所述数据抽取模块利用OCR文字识别技术及NLP自然语言处理技术对原始证据文件进行文字提取与分词,通过人工神经网络进行语义的深度学习构建法律语义库,之后采用CRF条件随机场技术实现命名实体识别功能,采用实体消歧与共指消解技术实现提取数据到法律本体库的实体链接。通过法律专家标注及提取技术,参照法律本体库对证据文件进行标注并由机器批量提取获取个案数据作为图谱的素材,同时对提取结果进行比对,以提高数据抽取的准确率并修正数据抽取模块的偏差。
6.根据权利要求1所述的一种法律知识图谱构建系统,其特征在于,所述图谱构建模块采用图数据库,实现法律知识图谱的存储与应用。
7.根据权利要求1所述的一种法律知识图谱构建系统,其特征在于,所述要件事实证明模块的校验结果作为实体间关系,多个公式从数据库实体中读取需要用的参数,进行校验和计算,校验结果即多条关系组合成为要件事实的证明条件,用以补充与完善知识图谱;同时公式计算结果也作为新的参数,结果的数值作为参数值,填充到知识图谱中。校验与计算的结果则作为机器学习的素材以更新法律本体库。
8.根据权利要求1所述的一种法律知识图谱构建系统,其特征在于,该系统还包括法律文书生成模块:基于人工神经网络(包括模糊神经网络)的知识处理。通过神经网络的学习训练,利用学习结果以及法律本体库参数与公式,生成当事人、律师等人员所撰写的申请文书以及法院、仲裁机构等依法制作的法律文书。并可由法律专家结合知识图谱对文书生成结果进行用词的准确性修正。
9.根据权利要求1所述的一种法律知识图谱构建系统,其特征在于,该系统还包括知识推理模块:根据知识图谱中数据进行机器学习以及数据统计分析,并通过对学习结果进行人工干预,以人工与机器结合的方式完善法律本体库,也进一步完善知识图谱的应用能力。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011445442.9A CN112559766B (zh) | 2020-12-08 | 2020-12-08 | 一种法律知识图谱构建系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011445442.9A CN112559766B (zh) | 2020-12-08 | 2020-12-08 | 一种法律知识图谱构建系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112559766A true CN112559766A (zh) | 2021-03-26 |
CN112559766B CN112559766B (zh) | 2022-08-26 |
Family
ID=75062884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011445442.9A Active CN112559766B (zh) | 2020-12-08 | 2020-12-08 | 一种法律知识图谱构建系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112559766B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113220878A (zh) * | 2021-05-06 | 2021-08-06 | 西安电子科技大学 | 一种基于知识图谱的ocr识别结果分类方法 |
CN114896472A (zh) * | 2022-05-27 | 2022-08-12 | 中国科学院空天信息创新研究院 | 一种基于多源时空数据的知识图谱机器推理系统和方法 |
CN115203441A (zh) * | 2022-09-19 | 2022-10-18 | 江西风向标智能科技有限公司 | 高中数学公式的解析方法、系统、存储介质及设备 |
CN116069948A (zh) * | 2023-01-17 | 2023-05-05 | 人民网股份有限公司 | 内容风控知识库构建方法、装置、设备及存储介质 |
CN116244315A (zh) * | 2022-12-08 | 2023-06-09 | 南京擎盾信息科技有限公司 | 一种法律法规数据库时效性动态更新的方法和系统 |
CN117150049A (zh) * | 2023-09-15 | 2023-12-01 | 上海歆广数据科技有限公司 | 一种个案图谱架构系统 |
CN117763156A (zh) * | 2023-11-24 | 2024-03-26 | 上海歆广数据科技有限公司 | 一种动态全息个案管理系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105574098A (zh) * | 2015-12-11 | 2016-05-11 | 百度在线网络技术(北京)有限公司 | 知识图谱的生成方法及装置、实体对比方法及装置 |
US20180082183A1 (en) * | 2011-02-22 | 2018-03-22 | Thomson Reuters Global Resources | Machine learning-based relationship association and related discovery and search engines |
CN108073673A (zh) * | 2017-05-15 | 2018-05-25 | 北京华宇元典信息服务有限公司 | 一种基于机器学习的法律知识图谱构建方法、装置、系统和介质 |
US20180210913A1 (en) * | 2017-01-23 | 2018-07-26 | International Business Machines Corporation | Crowdsourced discovery of paths in a knowledge graph |
CN109977237A (zh) * | 2019-05-27 | 2019-07-05 | 南京擎盾信息科技有限公司 | 一种面向法律领域的动态法律事件图谱构建方法 |
CN110008288A (zh) * | 2019-02-19 | 2019-07-12 | 武汉烽火技术服务有限公司 | 用于网络故障分析的知识图谱库的构建方法及其应用 |
CN110781254A (zh) * | 2020-01-02 | 2020-02-11 | 四川大学 | 一种案情知识图谱自动构建方法及系统及设备及介质 |
CN110825721A (zh) * | 2019-11-06 | 2020-02-21 | 武汉大学 | 大数据环境下高血压知识库构建与系统集成方法 |
CN110956026A (zh) * | 2019-11-28 | 2020-04-03 | 北京华宇元典信息服务有限公司 | 法律文书生成方法、生成装置和电子设备 |
-
2020
- 2020-12-08 CN CN202011445442.9A patent/CN112559766B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180082183A1 (en) * | 2011-02-22 | 2018-03-22 | Thomson Reuters Global Resources | Machine learning-based relationship association and related discovery and search engines |
CN105574098A (zh) * | 2015-12-11 | 2016-05-11 | 百度在线网络技术(北京)有限公司 | 知识图谱的生成方法及装置、实体对比方法及装置 |
US20180210913A1 (en) * | 2017-01-23 | 2018-07-26 | International Business Machines Corporation | Crowdsourced discovery of paths in a knowledge graph |
CN108073673A (zh) * | 2017-05-15 | 2018-05-25 | 北京华宇元典信息服务有限公司 | 一种基于机器学习的法律知识图谱构建方法、装置、系统和介质 |
CN110008288A (zh) * | 2019-02-19 | 2019-07-12 | 武汉烽火技术服务有限公司 | 用于网络故障分析的知识图谱库的构建方法及其应用 |
CN109977237A (zh) * | 2019-05-27 | 2019-07-05 | 南京擎盾信息科技有限公司 | 一种面向法律领域的动态法律事件图谱构建方法 |
CN110825721A (zh) * | 2019-11-06 | 2020-02-21 | 武汉大学 | 大数据环境下高血压知识库构建与系统集成方法 |
CN110956026A (zh) * | 2019-11-28 | 2020-04-03 | 北京华宇元典信息服务有限公司 | 法律文书生成方法、生成装置和电子设备 |
CN110781254A (zh) * | 2020-01-02 | 2020-02-11 | 四川大学 | 一种案情知识图谱自动构建方法及系统及设备及介质 |
Non-Patent Citations (1)
Title |
---|
乔钢柱等: "基于知识图谱的盗窃案件法律文书智能推荐研究", 《计算机系统应用》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113220878A (zh) * | 2021-05-06 | 2021-08-06 | 西安电子科技大学 | 一种基于知识图谱的ocr识别结果分类方法 |
CN114896472A (zh) * | 2022-05-27 | 2022-08-12 | 中国科学院空天信息创新研究院 | 一种基于多源时空数据的知识图谱机器推理系统和方法 |
CN114896472B (zh) * | 2022-05-27 | 2023-09-22 | 中国科学院空天信息创新研究院 | 一种基于多源时空数据的知识图谱机器推理系统和方法 |
CN115203441B (zh) * | 2022-09-19 | 2022-12-20 | 江西风向标智能科技有限公司 | 高中数学公式的解析方法、系统、存储介质及设备 |
CN115203441A (zh) * | 2022-09-19 | 2022-10-18 | 江西风向标智能科技有限公司 | 高中数学公式的解析方法、系统、存储介质及设备 |
CN116244315A (zh) * | 2022-12-08 | 2023-06-09 | 南京擎盾信息科技有限公司 | 一种法律法规数据库时效性动态更新的方法和系统 |
CN116244315B (zh) * | 2022-12-08 | 2023-11-10 | 南京擎盾信息科技有限公司 | 一种法律法规数据库时效性动态更新的方法和系统 |
CN116069948A (zh) * | 2023-01-17 | 2023-05-05 | 人民网股份有限公司 | 内容风控知识库构建方法、装置、设备及存储介质 |
CN116069948B (zh) * | 2023-01-17 | 2024-01-09 | 人民网股份有限公司 | 内容风控知识库构建方法、装置、设备及存储介质 |
CN117150049A (zh) * | 2023-09-15 | 2023-12-01 | 上海歆广数据科技有限公司 | 一种个案图谱架构系统 |
CN117150049B (zh) * | 2023-09-15 | 2024-03-22 | 上海峻思寰宇数据科技有限公司 | 一种个案图谱架构系统 |
CN117763156A (zh) * | 2023-11-24 | 2024-03-26 | 上海歆广数据科技有限公司 | 一种动态全息个案管理系统 |
CN117763156B (zh) * | 2023-11-24 | 2024-05-07 | 上海歆广数据科技有限公司 | 一种动态全息个案管理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112559766B (zh) | 2022-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112559766B (zh) | 一种法律知识图谱构建系统 | |
WO2021196520A1 (zh) | 一种面向税务领域知识图谱的构建方法及系统 | |
CN108897857B (zh) | 面向领域的中文文本主题句生成方法 | |
CN111488465A (zh) | 一种知识图谱构建方法及相关装置 | |
CN108874878A (zh) | 一种知识图谱的构建系统及方法 | |
CN103440287B (zh) | 一种基于产品信息结构化的Web问答检索系统 | |
CN110990590A (zh) | 一种基于强化学习和迁移学习的动态金融知识图谱构建方法 | |
CN106919689A (zh) | 基于术语释义知识单元的专业领域知识图谱动态构建方法 | |
CN106663101A (zh) | 本体映射方法和设备 | |
CN112667820B (zh) | 全流程可追溯生态链监管知识图谱的深度学习构建方法 | |
CN107103363A (zh) | 一种基于lda的软件故障专家系统的构建方法 | |
CN112613611A (zh) | 一种基于知识图谱的税务知识库系统 | |
Wątróbski | Ontology learning methods from text-an extensive knowledge-based approach | |
CN114238524B (zh) | 基于增强样本模型的卫星频轨数据信息抽取方法 | |
CN115438199A (zh) | 一种基于智慧城市场景数据中台技术的知识平台系统 | |
CN115952298A (zh) | 供应商履约风险分析方法及相关设备 | |
CN110147552B (zh) | 基于自然语言处理的教育资源质量评价挖掘方法及系统 | |
CN111428502A (zh) | 一种面向军事语料的命名实体标注方法 | |
CN112966057B (zh) | 知识图谱构建方法、系统、信息处理系统、终端及介质 | |
CN115878818B (zh) | 一种地理知识图谱构建方法、装置、终端及存储介质 | |
CN117010373A (zh) | 一种电力设备资产管理数据所属类别和组的推荐方法 | |
CN116595191A (zh) | 一种交互式低代码知识图谱的构建方法及装置 | |
CN115964468A (zh) | 一种基于多层次模板匹配的乡村信息智能问答方法及装置 | |
Kalfoglou et al. | FCA in knowledge technologies: experiences and opportunities | |
CN116561264A (zh) | 一种基于知识图谱的智能问答系统的构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |