CN111143521A - 基于知识图谱的法条检索方法、系统、装置及存储介质 - Google Patents
基于知识图谱的法条检索方法、系统、装置及存储介质 Download PDFInfo
- Publication number
- CN111143521A CN111143521A CN201911031835.2A CN201911031835A CN111143521A CN 111143521 A CN111143521 A CN 111143521A CN 201911031835 A CN201911031835 A CN 201911031835A CN 111143521 A CN111143521 A CN 111143521A
- Authority
- CN
- China
- Prior art keywords
- legal
- entity
- provision
- legal provision
- search text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004364 calculation method Methods 0.000 claims abstract description 6
- 230000011218 segmentation Effects 0.000 claims description 21
- 238000001914 filtration Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 7
- 239000002585 base Substances 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Technology Law (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Animal Behavior & Ethology (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于知识图谱的法条检索方法、系统、装置及存储介质通过获取法律相关的语料,并构建得到法律知识图谱,获取法律法条数据库,检测法律法条数据库中的每条法律法条在法律知识图谱的关系,获取输入的搜索文本,检测搜索文本在法律知识图谱的关系,根据所述搜索文本分别与各所述法律法条之间的相似权重,对各所述法律法条按照预设的排列方式进行排列,形成得到法条检索结果。本发明通过构建法律知识图谱,并基于法律知识图谱对搜索文本与法律法条进行相似计算,从而能快速得出推荐的法律法条,并且还能大大提高法律的检索准确性。本发明可广泛应用于法律检索领域中。
Description
技术领域
本发明涉及知识工程技术领域,尤其涉及一种基于知识图谱的法条检索方法、系统、装置及存储介质。
背景技术
知识图谱,2012年由谷歌正式发布,是一种知识库,用于知识的管理,以便于有关领域知识的采集、整理以及提取。知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成。现在的知识图谱已被用来泛指各种大规模的知识库。
一方面,随着语义Web数据的数量激增,产生了大量的RDF数据。互联网变成包含大量描述各种实体和实体之间丰富关系的数据万维网。在此基础上,以谷歌为代表的各大检索引擎公司纷纷构建知识图谱来改善检索质量,从而拉开了语义检索的序幕。知识图谱显著提高检索引擎和检索系统的质量。
另一方面,随着深度学习的发展,自然语言处理领域的难题也不断突破,机器正在理解人类的语言,这使得自动构建大型知识图谱成为可能。WordNet、DBpedia、Freebase、WikiData等大型通用知识图谱相继发布。先进的技术在我们的生活中创造越来越多的价值。法制社会更是与每个人的生活息息相关。但由于需要领域专家的大量人工干预,基于法律领域的知识图谱的构建,进展却一直十分缓慢。
追溯起来,人工智能和法律的结合始于1987年在美国波士顿的东北大学举办的首届国际人工智能与法律会议,建立基于法律和案例的推理模型或知识系统等应用是精准、高效办案的迫切需求。由于法律是一种概括、普遍、严谨的行为规范,这种规范由特殊的逻辑所构成,目前并没有相关的技术或方法,直接基于法律文本构建知识图谱,从而法律检索的准确性得不到有效的提升。
发明内容
为了解决上述技术问题,本发明的目的是提供一种能提高检索准确性的静基于知识图谱的法条检索方法、系统、装置及存储介质。
第一方面,本发明实施例提供了一种基于知识图谱的法条检索方法,包括以下步骤:
获取法律相关的语料,并构建得到法律知识图谱;
获取法律法条数据库,检测法律法条数据库中的每条法律法条在法律知识图谱的关系,得出每条法律法条对应的第一实体关系集合列表;
获取输入的搜索文本,检测搜索文本在法律知识图谱的关系,得出第二实体关系集合列表;
计算各所述法律法条对应的第一实体关系集合列表中实体关系集合与第二实体关系集合列表中实体关系集合的交集,得到多个交集;
根据得到的多个交集,计算得出所述搜索文本分别与各所述法律法条之间的相似权重;
根据所述搜索文本分别与各所述法律法条之间的相似权重,对各所述法律法条按照预设的排列方式进行排列,形成得到法条检索结果。
作为所述的一种基于知识图谱的法条检索方法的进一步改进,所述的获取法律相关的语料,并构建得到法律知识图谱,这一步骤具体包括:
获取法律相关的文档作为语料;
对所述文档进行预处理,得出实体词库;
通过词袋模型将所述文档进行向量化处理,得到文档向量;
对所述文档向量作为训练集,使用预设的词向量模型通过所述训练集进行训练,得到训练后的词向量模型;
遍历实体词库中的每个实体,通过训练后的词向量模型计算与各实体之间关系相近的实体,形成“实体-相近关系-实体”的三元组结构,构建得到法律知识图谱。
作为所述的一种基于知识图谱的法条检索方法的进一步改进,所述的对所述文档进行预处理,得出实体词库,这一步骤具体包括:
对所述语料中的各所述文档进行分词处理,得到第一分词;
对所述第一分词进行词性标注;
根据标注的词性,按照预设的词性要求对所述第一分词进行提取处理,得到第二分词;
对所述第二分词过滤处理,得到过滤后的第二分词;
将过滤后的第二分词作为实体并构成实体词库。
作为所述的一种基于知识图谱的法条检索方法的进一步改进,所述的获取法律法条数据库,检测法律法条数据库中的每条法律法条在法律知识图谱的关系,得出每条法律法条对应的第一实体关系集合列表,这一步骤具体包括:
获取法律法条数据库,并对法律法条数据库中的各法律法条进行分词处理,得到第一法条分词;
对所述各法律法条的第一法条分词依次进行词性标注、提取和过滤处理,得到各法律法条的第二法条分词;
检测各法律法条的第二法条分词在法律知识图谱中的关系,得出第二法条分词对应的实体关系集合,进而得到第一实体关系集合列表。
作为所述的一种基于知识图谱的法条检索方法的进一步改进,所述的获取输入的搜索文本,检测搜索文本在法律知识图谱的关系,得出第二实体关系集合列表,这一步骤具体包括:
获取输入的搜索文本,并对所述搜索文本进行分词处理,得到第一文本分词;
对所述第一文本分词依次进行词性标注、提取和过滤处理,得到各法律法条的第二文本分词;
检测所述第二文本分词在法律知识图谱中的关系,得出第二文本分词对应的实体关系集合,进而得到第二实体关系集合列表。
作为所述的一种基于知识图谱的法条检索方法的进一步改进,所述的根据得到的多个交集,计算得出所述搜索文本分别与各所述法律法条之间的相似权重,这一步骤具体包括:
根据得到的多个交集,检测各交集中最大的相近关系;
根据各交集中最大的相近关系,计算得出所述搜索文本分别与各所述法律法条之间的相似权重。
作为所述的一种基于知识图谱的法条检索方法的进一步改进,所述相似权重的计算公式为:
W=0.6*n+(1-0.6)*(R1+R2+R3+…+Rn);
其中,W表示相似权重,R1……Rn分别表示第1个交集最大的相近关系到第n个交集最大的相近关系。
第二方面,本发明实施例提供了一种基于知识图谱的法条检索系统,包括:
第一获取单元,用于获取法律相关的语料,并构建得到法律知识图谱;
第二获取单元,用于获取法律法条数据库,检测法律法条数据库中的每条法律法条在法律知识图谱的关系,得出每条法律法条对应的第一实体关系集合列表;
第三获取单元,用于获取输入的搜索文本,检测搜索文本在法律知识图谱的关系,得出第二实体关系集合列表;
第一处理单元,用于计算各所述法律法条对应的第一实体关系集合列表中实体关系集合与第二实体关系集合列表中实体关系集合的交集,得到多个交集;
第二处理单元,用于根据得到的多个交集,计算得出所述搜索文本分别与各所述法律法条之间的相似权重;
第三处理单元,用于根据所述搜索文本分别与各所述法律法条之间的相似权重,对各所述法律法条按照预设的排列方式进行排列,形成得到法条检索结果。
第三方面,本发明实施例提供了一种基于知识图谱的法条检索装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述一种基于知识图谱的法条检索方法。
第四方面,本发明实施例提供了一种存储介质,其中存储有处理器可执行的指令,其特征在于,所述处理器可执行的指令在由处理器执行时用于执行所述一种基于知识图谱的法条检索方法。
本发明的有益效果是:
本发明一种基于知识图谱的法条检索方法、系统、装置及存储介质通过构建法律知识图谱,并基于法律知识图谱对搜索文本与法律法条进行相似计算,从而能快速得出推荐的法律法条,并且还能大大提高法律的检索准确性。
附图说明
图1是本发明实施例一种基于知识图谱的法条检索方法一个实施例的步骤流程图;
图2是本发明实施例一种基于知识图谱的法条检索系统一个实施例的模块方框图;
图3是本发明实施例一种基于知识图谱的法条检索装置一个实施例的结构方框图;
具体实施方式
下面结合附图和具体实施例对本发明做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。而且需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
参考图1,本发明实施例提供了一种基于知识图谱的法条检索方法,包括以下步骤:
S101、获取法律相关的语料,并构建得到法律知识图谱;
本实施例中,为了连接法律条文中的实体与日常生活中的实体的距离。所述法律相关的语料必须具备两面性,一面立足与法律条文,一面面向普通大众,例如可以是法律科普、法律解读、政策解读等。所述语料的具体获取方式可以是通过合法的爬虫技术从互联网上爬取公开的政策及新闻、普法专栏、专家解读作为语料。
S102、获取法律法条数据库,检测法律法条数据库中的每条法律法条在法律知识图谱的关系,得出每条法律法条对应的第一实体关系集合列表;
S103、获取输入的搜索文本,检测搜索文本在法律知识图谱的关系,得出第二实体关系集合列表;
S104、计算各所述法律法条对应的第一实体关系集合列表中实体关系集合与第二实体关系集合列表中实体关系集合的交集,得到多个交集;
S105、根据得到的多个交集,计算得出所述搜索文本分别与各所述法律法条之间的相似权重;
S106、根据所述搜索文本分别与各所述法律法条之间的相似权重,对各所述法律法条按照预设的排列方式进行排列,形成得到法条检索结果。
本实施例中预设的排列方式为倒序排列,所述法条检索结果采用列表方式呈现,则根据相似权重对各所述法律法条倒序排列,形成得到法律法条搜索推荐列表,大大提高法律的检索准确性。
进一步作为本实施例的优选实施方式,本实施例中所述的获取法律相关的语料,并构建得到法律知识图谱,这一步骤具体包括:
S1011、获取法律相关的文档作为语料;
S1012、对所述文档进行预处理,得出实体词库;
本实施例中,所述预处理包括分词处理、词性标注、提取和过滤处理。
S1013、通过词袋模型将所述文档进行向量化处理,得到文档向量;
本实施例中,所述词袋模型可采用doc2bow模型。
S1014、对所述文档向量作为训练集,使用预设的词向量模型通过所述训练集进行训练,得到训练后的词向量模型;
本实施例中,所述词向量模型可采用word2vec模型。
S1015、遍历实体词库中的每个实体,通过训练后的词向量模型计算与各实体之间关系相近的实体,形成“实体-相近关系-实体”的三元组结构,构建得到法律知识图谱。
本实施例中,所述三元组结构具体表示为“(EA,R,EB)”,例如 (“军人”,0.96,“军队”)表示“军人”与“军队”存在某种关系,这种相近关系为0.96;如(“夫妻”,0.84,“婚姻”)表示“夫妻”与“婚姻”存在某种关系,这种相近关系为0.84。其中,相近关系R 通过实体EA的词向量OA和实体EB的词向量OB的夹角α的余弦值计算:R=cos(α)=OA·OB/|OB|*|OB|。
进一步作为本实施例的优选实施方式,本实施例中所述的对所述文档进行预处理,得出实体词库,这一步骤具体包括:
对所述语料中的各所述文档进行分词处理,得到第一分词;
本实施例中,可以采用结巴分词工具结合法律领域词典对所述语料的每一个文档去停用词和进行分词。
对所述第一分词进行词性标注;
根据标注的词性,按照预设的词性要求对所述第一分词进行提取处理,得到第二分词;
本实施例中,所述提取处理为提取其中的名词、名词短语、动词和动词短语作为实体或概念。
对所述第二分词过滤处理,得到过滤后的第二分词;
本实施例中,所述过滤处理为过滤其中人名地名等没有特别内涵的词。
将过滤后的第二分词作为实体并构成实体词库。其中,每个实体都具有一个唯一的整数索引。
进一步作为本实施例的优选实施方式,本实施例中所述的获取法律法条数据库,检测法律法条数据库中的每条法律法条在法律知识图谱的关系,得出每条法律法条对应的第一实体关系集合列表,这一步骤具体包括:
S1021、获取法律法条数据库,并对法律法条数据库中的各法律法条进行分词处理,得到第一法条分词;
S1022、对所述各法律法条的第一法条分词依次进行词性标注、提取和过滤处理,得到各法律法条的第二法条分词;
S1023、检测各法律法条的第二法条分词在法律知识图谱中的关系,得出第二法条分词对应的实体关系集合,进而得到第一实体关系集合列表。
进一步作为本实施例的优选实施方式,本实施例中所述的获取输入的搜索文本,检测搜索文本在法律知识图谱的关系,得出第二实体关系集合列表,这一步骤具体包括:
S1031、获取输入的搜索文本,并对所述搜索文本进行分词处理,得到第一文本分词;
S1032、对所述第一文本分词依次进行词性标注、提取和过滤处理,得到各法律法条的第二文本分词;
S1033、检测所述第二文本分词在法律知识图谱中的关系,得出第二文本分词对应的实体关系集合,进而得到第二实体关系集合列表。
其中,第二实体关系集合列表可以表现为[{(R1,1,EB1,1),(R1,2, EB1,2),(R1,3,EB1,3),…},{(R2,1,EB2,1),(R2,2,EB2,2),(R2,3,EB2,3),…}, {(R3,1,EB3,1),(R3,2,EB3,2),(R3,3,EB3,3),…},…,{(Rn,1,EBn,1),(Rn,2, EBn,2),(Rn,3,EBn,3),…}]。
进一步作为本实施例的优选实施方式,本实施例中所述的根据得到的多个交集,计算得出所述搜索文本分别与各所述法律法条之间的相似权重,这一步骤具体包括:
S1051、根据得到的多个交集,检测各交集中最大的相近关系;
S1052、根据各交集中最大的相近关系,计算得出所述搜索文本分别与各所述法律法条之间的相似权重。
进一步作为本实施例的优选实施方式,本实施例中所述相似权重的计算公式为:
W=0.6*n+(1-0.6)*(R1+R2+R3+…+Rn);
其中,W表示相似权重,R1……Rn分别表示第1个交集最大的相近关系到第n个交集最大的相近关系。
参考图2,本发明实施例提供了一种基于知识图谱的法条检索系统,包括:
第一获取单元,用于获取法律相关的语料,并构建得到法律知识图谱;
第二获取单元,用于获取法律法条数据库,检测法律法条数据库中的每条法律法条在法律知识图谱的关系,得出每条法律法条对应的第一实体关系集合列表;
第三获取单元,用于获取输入的搜索文本,检测搜索文本在法律知识图谱的关系,得出第二实体关系集合列表;
第一处理单元,用于计算各所述法律法条对应的第一实体关系集合列表中实体关系集合与第二实体关系集合列表中实体关系集合的交集,得到多个交集;
第二处理单元,用于根据得到的多个交集,计算得出所述搜索文本分别与各所述法律法条之间的相似权重;
第三处理单元,用于根据所述搜索文本分别与各所述法律法条之间的相似权重,对各所述法律法条按照预设的排列方式进行排列,形成得到法条检索结果。
可见,上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
参考图3,本发明实施例提供了一种基于知识图谱的法条检索装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现所述一种基于知识图谱的法条检索方法。
可见,上述方法实施例中的内容均适用于本装置实施例中,本装置实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
此外,本发明实施例提供了一种存储介质,其中存储有处理器可执行的指令,其特征在于,所述处理器可执行的指令在由处理器执行时用于执行所述一种基于知识图谱的法条检索方法。
从上述内容可知,本发明通过构建法律知识图谱,并基于法律知识图谱对搜索文本与法律法条进行相似计算,从而能快速得出推荐的法律法条,并且还能大大提高法律的检索准确性。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (10)
1.一种基于知识图谱的法条检索方法,其特征在于,包括以下步骤:
获取法律相关的语料,并构建得到法律知识图谱;
获取法律法条数据库,检测法律法条数据库中的每条法律法条在法律知识图谱的关系,得出每条法律法条对应的第一实体关系集合列表;
获取输入的搜索文本,检测搜索文本在法律知识图谱的关系,得出第二实体关系集合列表;
计算各所述法律法条对应的第一实体关系集合列表中实体关系集合与第二实体关系集合列表中实体关系集合的交集,得到多个交集;
根据得到的多个交集,计算得出所述搜索文本分别与各所述法律法条之间的相似权重;
根据所述搜索文本分别与各所述法律法条之间的相似权重,对各所述法律法条按照预设的排列方式进行排列,形成得到法条检索结果。
2.根据权利要求1所述的一种基于知识图谱的法条检索方法,其特征在于:所述的获取法律相关的语料,并构建得到法律知识图谱,这一步骤具体包括:获取法律相关的文档作为语料;
对所述文档进行预处理,得出实体词库;
通过词袋模型将所述文档进行向量化处理,得到文档向量;
对所述文档向量作为训练集,使用预设的词向量模型通过所述训练集进行训练,得到训练后的词向量模型;
遍历实体词库中的每个实体,通过训练后的词向量模型计算与各实体之间关系相近的实体,形成“实体-相近关系-实体”的三元组结构,构建得到法律知识图谱。
3.根据权利要求2所述的一种基于知识图谱的法条检索方法,其特征在于:所述的对所述文档进行预处理,得出实体词库,这一步骤具体包括:
对所述语料中的各所述文档进行分词处理,得到第一分词;
对所述第一分词进行词性标注;
根据标注的词性,按照预设的词性要求对所述第一分词进行提取处理,得到第二分词;
对所述第二分词过滤处理,得到过滤后的第二分词;
将过滤后的第二分词作为实体并构成实体词库。
4.根据权利要求1所述的一种基于知识图谱的法条检索方法,其特征在于:所述的获取法律法条数据库,检测法律法条数据库中的每条法律法条在法律知识图谱的关系,得出每条法律法条对应的第一实体关系集合列表,这一步骤具体包括:
获取法律法条数据库,并对法律法条数据库中的各法律法条进行分词处理,得到第一法条分词;
对所述各法律法条的第一法条分词依次进行词性标注、提取和过滤处理,得到各法律法条的第二法条分词;
检测各法律法条的第二法条分词在法律知识图谱中的关系,得出第二法条分词对应的实体关系集合,进而得到第一实体关系集合列表。
5.根据权利要求1所述的一种基于知识图谱的法条检索方法,其特征在于:所述的获取输入的搜索文本,检测搜索文本在法律知识图谱的关系,得出第二实体关系集合列表,这一步骤具体包括:
获取输入的搜索文本,并对所述搜索文本进行分词处理,得到第一文本分词;
对所述第一文本分词依次进行词性标注、提取和过滤处理,得到各法律法条的第二文本分词;
检测所述第二文本分词在法律知识图谱中的关系,得出第二文本分词对应的实体关系集合,进而得到第二实体关系集合列表。
6.根据权利要求1所述的一种基于知识图谱的法条检索方法,其特征在于:所述的根据得到的多个交集,计算得出所述搜索文本分别与各所述法律法条之间的相似权重,这一步骤具体包括:
根据得到的多个交集,检测各交集中最大的相近关系;
根据各交集中最大的相近关系,计算得出所述搜索文本分别与各所述法律法条之间的相似权重。
7.根据权利要求6所述的一种基于知识图谱的法条检索方法,其特征在于:所述相似权重的计算公式为:
W=0.6*n+(1-0.6)*(R1+R2+R3+…+Rn);
其中,W表示相似权重,R1……Rn分别表示第1个交集最大的相近关系到第n个交集最大的相近关系。
8.一种基于知识图谱的法条检索系统,其特征在于,包括:
第一获取单元,用于获取法律相关的语料,并构建得到法律知识图谱;
第二获取单元,用于获取法律法条数据库,检测法律法条数据库中的每条法律法条在法律知识图谱的关系,得出每条法律法条对应的第一实体关系集合列表;
第三获取单元,用于获取输入的搜索文本,检测搜索文本在法律知识图谱的关系,得出第二实体关系集合列表;
第一处理单元,用于计算各所述法律法条对应的第一实体关系集合列表中实体关系集合与第二实体关系集合列表中实体关系集合的交集,得到多个交集;
第二处理单元,用于根据得到的多个交集,计算得出所述搜索文本分别与各所述法律法条之间的相似权重;
第三处理单元,用于根据所述搜索文本分别与各所述法律法条之间的相似权重,对各所述法律法条按照预设的排列方式进行排列,形成得到法条检索结果。
9.一种基于知识图谱的法条检索装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-7任一项所述一种基于知识图谱的法条检索方法。
10.一种存储介质,其中存储有处理器可执行的指令,其特征在于,所述处理器可执行的指令在由处理器执行时用于执行如权利要求1-7任一项所述一种基于知识图谱的法条检索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911031835.2A CN111143521B (zh) | 2019-10-28 | 2019-10-28 | 基于知识图谱的法条检索方法、系统、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911031835.2A CN111143521B (zh) | 2019-10-28 | 2019-10-28 | 基于知识图谱的法条检索方法、系统、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111143521A true CN111143521A (zh) | 2020-05-12 |
CN111143521B CN111143521B (zh) | 2023-08-15 |
Family
ID=70516891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911031835.2A Active CN111143521B (zh) | 2019-10-28 | 2019-10-28 | 基于知识图谱的法条检索方法、系统、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111143521B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112148702A (zh) * | 2020-09-23 | 2020-12-29 | 平安直通咨询有限公司上海分公司 | 一种文件检索的方法及设备 |
CN112182184A (zh) * | 2020-09-29 | 2021-01-05 | 国网浙江省电力有限公司 | 一种基于审计数据库的精准匹配搜索方法 |
CN112417175A (zh) * | 2020-12-07 | 2021-02-26 | 北京明略软件系统有限公司 | 面向维修工单的文档检索方法、系统、计算机及存储介质 |
CN112528046A (zh) * | 2020-12-25 | 2021-03-19 | 网易(杭州)网络有限公司 | 新的知识图谱的构建方法、装置和信息检索方法、装置 |
CN112632226A (zh) * | 2020-12-29 | 2021-04-09 | 天津汇智星源信息技术有限公司 | 基于法律知识图谱的语义搜索方法、装置和电子设备 |
CN113032359A (zh) * | 2021-01-29 | 2021-06-25 | 厦门市法度信息科技有限公司 | 一种智能办案辅助系统及方法 |
CN113377906A (zh) * | 2021-06-08 | 2021-09-10 | 四川大学 | 一种相似法条智能搜索系统及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103971677A (zh) * | 2013-02-01 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 一种声学语言模型训练方法和装置 |
US20180082183A1 (en) * | 2011-02-22 | 2018-03-22 | Thomson Reuters Global Resources | Machine learning-based relationship association and related discovery and search engines |
CN108073673A (zh) * | 2017-05-15 | 2018-05-25 | 北京华宇元典信息服务有限公司 | 一种基于机器学习的法律知识图谱构建方法、装置、系统和介质 |
CN109213925A (zh) * | 2018-07-10 | 2019-01-15 | 深圳价值在线信息科技股份有限公司 | 法律文本搜索方法 |
US20190220749A1 (en) * | 2018-01-17 | 2019-07-18 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Text processing method and device based on ambiguous entity words |
CN110377715A (zh) * | 2019-07-23 | 2019-10-25 | 天津汇智星源信息技术有限公司 | 基于法律知识图谱的推理式精准智能问答方法 |
-
2019
- 2019-10-28 CN CN201911031835.2A patent/CN111143521B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180082183A1 (en) * | 2011-02-22 | 2018-03-22 | Thomson Reuters Global Resources | Machine learning-based relationship association and related discovery and search engines |
CN103971677A (zh) * | 2013-02-01 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 一种声学语言模型训练方法和装置 |
CN108073673A (zh) * | 2017-05-15 | 2018-05-25 | 北京华宇元典信息服务有限公司 | 一种基于机器学习的法律知识图谱构建方法、装置、系统和介质 |
US20190220749A1 (en) * | 2018-01-17 | 2019-07-18 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Text processing method and device based on ambiguous entity words |
CN109213925A (zh) * | 2018-07-10 | 2019-01-15 | 深圳价值在线信息科技股份有限公司 | 法律文本搜索方法 |
CN110377715A (zh) * | 2019-07-23 | 2019-10-25 | 天津汇智星源信息技术有限公司 | 基于法律知识图谱的推理式精准智能问答方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112148702A (zh) * | 2020-09-23 | 2020-12-29 | 平安直通咨询有限公司上海分公司 | 一种文件检索的方法及设备 |
CN112182184A (zh) * | 2020-09-29 | 2021-01-05 | 国网浙江省电力有限公司 | 一种基于审计数据库的精准匹配搜索方法 |
CN112417175A (zh) * | 2020-12-07 | 2021-02-26 | 北京明略软件系统有限公司 | 面向维修工单的文档检索方法、系统、计算机及存储介质 |
CN112528046A (zh) * | 2020-12-25 | 2021-03-19 | 网易(杭州)网络有限公司 | 新的知识图谱的构建方法、装置和信息检索方法、装置 |
CN112528046B (zh) * | 2020-12-25 | 2023-09-15 | 网易(杭州)网络有限公司 | 新的知识图谱的构建方法、装置和信息检索方法、装置 |
CN112632226A (zh) * | 2020-12-29 | 2021-04-09 | 天津汇智星源信息技术有限公司 | 基于法律知识图谱的语义搜索方法、装置和电子设备 |
CN113032359A (zh) * | 2021-01-29 | 2021-06-25 | 厦门市法度信息科技有限公司 | 一种智能办案辅助系统及方法 |
CN113377906A (zh) * | 2021-06-08 | 2021-09-10 | 四川大学 | 一种相似法条智能搜索系统及方法 |
CN113377906B (zh) * | 2021-06-08 | 2022-11-01 | 四川大学 | 一种相似法条智能搜索系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111143521B (zh) | 2023-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111143521B (zh) | 基于知识图谱的法条检索方法、系统、装置及存储介质 | |
CN106844658B (zh) | 一种中文文本知识图谱自动构建方法及系统 | |
JP6309644B2 (ja) | スマート質問回答の実現方法、システム、および記憶媒体 | |
Cañas et al. | Using WordNet for word sense disambiguation to support concept map construction | |
US9183274B1 (en) | System, methods, and data structure for representing object and properties associations | |
RU2591175C1 (ru) | Способ и система для глобальной идентификации в коллекции документов | |
CN110309393A (zh) | 数据处理方法、装置、设备及可读存储介质 | |
US8843476B1 (en) | System and methods for automated document topic discovery, browsable search and document categorization | |
CN109947952B (zh) | 基于英语知识图谱的检索方法、装置、设备及存储介质 | |
US10678820B2 (en) | System and method for computerized semantic indexing and searching | |
Pabitha et al. | Automatic question generation system | |
CN108038106B (zh) | 一种基于上下文语义的细粒度领域术语自学习方法 | |
Hakkoum et al. | Ontological approach for semantic modeling and querying the Qur’an | |
Dang et al. | Information retrieval from legal documents with ontology and graph embeddings approach | |
Hakkoum et al. | Advanced Search in the Qur'an using Semantic modeling | |
KR102256007B1 (ko) | 자연어 질의를 통한 문서 검색 및 응답 제공 시스템 및 방법 | |
Nguyen et al. | A semi-automatic approach to construct Vietnamese ontology from online text | |
CN117271558A (zh) | 语言查询模型构建方法、查询语言获取方法及相关装置 | |
CN107315735A (zh) | 用于笔记整理的方法及设备 | |
Khan | Addressing big data problems using semantics and natural language understanding | |
Šimko et al. | Automated educational course metadata generation based on semantics discovery | |
bin Rodzman et al. | Domain specific concept ontologies and text summarization as hierarchical fuzzy logic ranking indicator on malay text corpus | |
Karsdorp et al. | The love equation: Computational modeling of romantic relationships in french classical drama | |
Booshehri et al. | Towards adding linked data to ontology learning layers | |
Taghiyareh et al. | A Semantic Rule‑based Framework for Efficient Retrieval of Educational Materials |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |