CN117033721A

CN117033721A - 一种基于法律知识图谱的法律咨询报告生成系统及方法

Info

Publication number: CN117033721A
Application number: CN202310748051.1A
Authority: CN
Inventors: 刘思铭; 齐亮; 陈卓; 向晨韵; 修红鑫; 郝建伟
Original assignee: Changchun Handlebar Technology Co ltd
Current assignee: Changchun Handlebar Technology Co ltd
Priority date: 2023-06-25
Filing date: 2023-06-25
Publication date: 2023-11-10

Abstract

本发明公开了一种基于法律知识图谱的法律咨询报告生成系统及方法，涉及法律咨询技术领域，包括数据获取，法律咨询报告生成系统中存储和实时更新大量的法律相关数据，包括法律条文、案例、法律文书等；数据处理，通过自然语言处理技术对数据进行清洗和整理；构建知识图谱，通过知识图谱技术可以将海量的数据进行结构化和组织，构建出包括实体、属性、关系等信息的知识图谱；智能问答引擎；咨询报告的生成；报告评估；系统优化。本申请可以解决法律咨询服务过程中人力资源压力、人工法律知识储备有限、分析和解答效率低、有主观错误，服务质量低等问题，从而提供更加全面、高效和可靠的解决方案。

Description

一种基于法律知识图谱的法律咨询报告生成系统及方法

技术领域

本发明涉及法律咨询技术领域，更具体地说，涉及一种基于法律知识图谱的法律咨询报告生成系统及方法。

背景技术

随着人工智能和自然语言处理技术的发展，基于知识图谱的智能问答系统已经广泛应用于各个领域，如医疗、金融、教育等，且应用效果非常好。

传统的法律咨询服务往往需要人工对咨询问题进行分析和解答，而传统法律咨询机构通常依赖于有限的人力资源。律师等法律工作者需要逐个回答每个咨询问题，这意味着他们只能处理有限数量的案例。由于需求大于供给，且每个咨询案件在事实和法律适用上存在较大差异，律师等法律工作者可能需要投入更多的时间和精力来处理每个问题，这就导致法律咨询服务的人力成本增加、服务反应时间较长；法律是一个不断发展和变化的领域。律师等法律工作者需要不断更新和学习最新的法律法规、司法解释和相关案例，以保持他们的专业知识和能力，也需要投入大量时间和精力来跟进最新的法律动态。

此外，律师等法律工作者在分析和解答问题时，可能会受到自身主观意见、经验和偏见的影响，导致他们在解答问题时出现误判或偏颇的情况；同时由于人的疏忽、疲劳或理解错误，也可能会在分析问题、查找法律资料或解释法规时出现错误，导致咨询答案的不准确性或遗漏重要信息。

因此，将人工智能和自然语言处理技术引入法律咨询服务领域是一种高效、准确、专业的解决方案。

发明内容

针对现有技术中存在的问题，本发明的目的在于提供一种基于法律知识图谱的法律咨询报告生成系统及方法，它可以解决法律咨询服务过程中人力资源压力、人工法律知识储备有限、分析和解答效率低、有主观错误，服务质量低等问题，从而提供更加全面、高效和可靠的解决方案。

为解决上述问题，本发明采用如下的技术方案：

一种基于法律知识图谱的法律咨询报告生成系统及方法，包括：

数据获取，法律咨询报告生成系统中存储和实时更新大量的法律相关数据，包括法律条文、案例、法律文书等；

数据处理，通过自然语言处理技术对数据进行清洗和整理；

构建知识图谱，通过知识图谱技术可以将海量的数据进行结构化和组织，构建出包括实体、属性、关系等信息的知识图谱；

智能问答引擎，智能问答引擎可以通过自然语言处理技术和知识图谱技术，将用户提出的问题与知识图谱中的实体和关系进行匹配，快速生成相应的答案或建议；

咨询报告的生成，根据用户的咨询问题和匹配的法律知识图谱实体和关系，生成相应的法律咨询报告；

报告评估，法律咨询报告生成系统对生成的报告进行评估，包括报告的准确性、全面性、专业性等方面；

系统优化，根据用户的反馈和评估结果，进行优化和改进，包括算法优化、知识图谱更新、用户界面改进等方面。

作为本发明的一种优选方案，通过法律相关数据源订阅、网络爬虫自动抓取、合作伙伴数据共享等方式实时扩充本系统中的法律知识库，确保系统中的信息始终与最新的法律发展保持同步。

作为本发明的一种优选方案，自然语言处理技术可以将自然语言转化为计算机可处理的格式，并进行语义分析和语义理解，在法律咨询服务中，自然语言处理技术将用户提出的问题转化为计算机可处理的格式，并匹配相关的法律知识图谱实体和关系。

作为本发明的一种优选方案，在法律咨询服务中，知识图谱用来存储和管理法律相关的实体、属性和关系，并构建相应的分类体系和搜索引擎。

作为本发明的一种优选方案，知识图谱构建具体方式如下：

(1)确定知识图谱应用的领域范围，即法律咨询涉及的法律领域，离婚、劳动、继承等；

(2)根据步(1)确定的领域，梳理相关的法律法规，和全量的公开裁判文书，对裁判文书进行清理、筛选和整合，提取本院查明、本院认为、裁判结果等关键信息；

(3)基于嵌入层Att-BiLSTM-CRF模型来识别命名实体，采用余弦相似度和Viterbi最优路线算法，并结合法律专家对特定法律领域梳理的专家知识，对步骤二整理出的文本数据进行实体和关系的抽取，识别出文本中的命名实体和它们之间的关系，并将其转化为结构化的知识表示形式；

(4)将(3)抽取出来的实体和关系，以及它们的属性和语义信息，存储为图数据库或其他形式的知识表示形式，例如RDF、OWL等；

(5)基于知识图谱的推理引擎，对存储的知识进行推理和分析，对某个领域范围内共有的特征生成问答题目以及答案选项以及跳题规则；

(6)用户输入某个问题，系统进行分析，去除用户问题中的停用词、标点符号、数字等无关的信息，保留有意义的文本内容，再将这些词语进行词性标注和命名实体识别；

(7)通过句法分析，确定句子的结构和语法关系，再通过分析用户问题的关键词和语境，确定用户的意图；

(8)通过实体识别，识别出用户问题中的实体，例如：地点、时间、人物；

(9)通过将用户的问题与知识图谱中的数据进行匹配，确定用户涉及的法律领域范围；

(10)在(9)确定的领域下查找步骤五相关的问答题目，并对用户进行多轮问答，题目和选项之间有跳题规则，选择某些选项会跳转到不同的题目；

(11)将用户回答问题以及选择的选项生成向量特征，通过向量特征在图谱中进行检索，生成相应的法律咨询报告。

作为本发明的一种优选方案，嵌入层Att-BiLSTM-CRF模型的构成，如下：

模型第一层look-up层到第二层BiLSTM层：基于嵌入层+BiLSTM-CRF的命名实体识别模型；

模型第三层：attention层+tanh层；

Attention用来在文档级捕获相似的单词，在attention层，计算当前目标词与文档中所有词的相似度，引入矩阵来计算当前目标词与文档中所有词的相似度；

a_ij＝exp⁽score(x_i，x_j))/∑_kexp(score(x_t，x_k))

相似度权重：，其中Xt表示第t个当前目标词，Xj表示文档中的第j个已有词，文档级的全局向量将G和目标单词的BiLSTM输出连接为向量反馈传送到tanh函数以产生attention层输出z_t＝tanh(w_g[w_t；h_t])，然后tanh层预测具有每个可能标签的单词的置信度得分，作为神经网络的输出分数e_t＝tanh(W_t*Z_t)；

模型第四层：CRF层，

最后加入CRF层来解码所有可能的路径并选择出最佳路径，通过函数使正确标注序列的对数最大。

作为本发明的一种优选方案，在法律咨询服务中，智能问答引擎根据用户的咨询问题和匹配的法律知识图谱实体和关系，生成相应的法律咨询电子报告。

作为本发明的一种优选方案，法律咨询报告生成系统可以通过以下具体方式对生成的报告进行评估：

文本分析和语义理解：应用文本分析和自然语言处理技术，对报告中的文本进行分析和理解，通过识别关键词、实体、法律概念和语义关系，评估报告的全面性和专业性，同时检查报告中是否涵盖必要的法律要点、案例引用是否恰当、逻辑是否连贯等方面；

知识图谱和数据验证：系统与知识图谱和法律数据库进行交互，验证报告中引用的法律条文、案例或其他法律信息的准确性和最新性，通过与权威数据源的比对，评估报告中的法律引用是否准确，是否遵循最新的法律规定。

作为本发明的一种优选方案，一种基于法律知识图谱的法律咨询报告生成方法，实现步骤如下：

第一步：通过法律相关数据源订阅、网络爬虫自动抓取、合作伙伴数据共享等方式实时获取和更新法律知识库；

第二步：通过自然语言处理技术对数据进行清洗和整理，将用户提出的问题转化为计算机可处理的格式；

第三步：基于嵌入层Att-BiLSTM-CRF模型，利用法律知识库创建知识图谱；

第四步：用户通过智能问答引擎提出问题，智能问答引擎将问题与知识图谱中的实体和关系进行匹配，快速生成相应的答案或建议；

第五步：将生成的答案和建议进行整理和补充，并且进行报告评估，生成相应的法律咨询报告。

相比于现有技术，本发明的优点在于：

(1)提高法律咨询效率，传统的法律咨询需要人工处理，耗费时间和人力成本较高，而本发明的系统和方法可以自动化地处理用户的咨询问题，提高法律咨询的效率和准确度。

(2)提高法律咨询服务质量，本发明采用自然语言处理、知识图谱和深度学习等先进技术，能够提供更准确、全面和专业的法律咨询服务，使用户获得更好的服务体验。

(3)降低法律咨询成本，传统的法律咨询需要雇佣专业人员，成本较高，而本发明的系统和方法可以减少人工参与，降低法律咨询的成本。

(4)促进法律普及和法律意识的提高，本发明的系统和方法能够提供全面、准确的法律知识和案例，有助于促进公众对法律知识的了解和学习，提高法律意识和法律素养。本发明不仅能满足公众多层次、多领域、个性化法律服务需求，让社会公众享受免费、高效、便捷的法律服务，同时还能在推进法治社会建设和法治宣传方面发挥积极作用，强化法律权威地位，引导和支持人们理性表达诉求、依法维护权益、及时解决矛盾纠纷，引导人民群众学法守法、遇事找法、解决问题靠法。

附图说明

图1为本发明的系统框图；

图2为本发明的嵌入层Att-BiLSTM-CRF模型结构示意图。

具体实施方式

下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例

如图1-2所示，一种基于法律知识图谱的法律咨询报告生成系统及方法，包括：

数据处理，通过自然语言处理技术对数据进行清洗和整理；

具体的，通过法律相关数据源订阅、网络爬虫自动抓取、合作伙伴数据共享等方式实时扩充本系统中的法律知识库，确保系统中的信息始终与最新的法律发展保持同步。

具体的，自然语言处理技术可以将自然语言转化为计算机可处理的格式，并进行语义分析和语义理解，在法律咨询服务中，自然语言处理技术将用户提出的问题转化为计算机可处理的格式，并匹配相关的法律知识图谱实体和关系。

具体的，在法律咨询服务中，知识图谱用来存储和管理法律相关的实体、属性和关系，并构建相应的分类体系和搜索引擎。

具体的，知识图谱构建具体方式如下：

具体的，嵌入层Att-BiLSTM-CRF模型的构成，如下：

模型第三层：attention层+tanh层；

相似度权重：a_ij＝exp(score(x_i，x_j))/∑_kexp(score(x_t，x_k))，其中Xt表示第t个当前目标词，Xj表示文档中的第j个已有词，文档级的全局向量将G和目标单词的BiLSTM输出连接为向量反馈传送到tanh函数以产生attention层输出z_t＝tanh(w_g[w_t；h_t])，然后tanh层预测具有每个可能标签的单词的置信度得分，作为神经网络的输出分数e_t＝tanh(W_t*Z_t)；

模型第四层：CRF层，

具体的，在法律咨询服务中，智能问答引擎根据用户的咨询问题和匹配的法律知识图谱实体和关系，生成相应的法律咨询电子报告。

具体的，法律咨询报告生成系统可以通过以下具体方式对生成的报告进行评估：

具体的，知识图谱和数据验证：系统与知识图谱和法律数据库进行交互，验证报告中引用的法律条文、案例或其他法律信息的准确性和最新性，通过与权威数据源的比对，评估报告中的法律引用是否准确，是否遵循最新的法律规定。

具体的，一种基于法律知识图谱的法律咨询报告生成方法，实现步骤如下：

显然，本发明的上述实施例仅仅是为清楚地说明本发明所做的举例，而并非是对本发明实施方式的限定，对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动，这里无法对所有的实施方式予以穷举，凡是属于本发明的技术方案所引申出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims

1.一种基于法律知识图谱的法律咨询报告生成系统，其特征在于，包括：

数据处理，通过自然语言处理技术对数据进行清洗和整理；

2.根据权利要求1所述的基于法律知识图谱的法律咨询报告生成系统，其特征在于：通过法律相关数据源订阅、网络爬虫自动抓取、合作伙伴数据共享等方式实时扩充本系统中的法律知识库，确保系统中的信息始终与最新的法律发展保持同步。

3.根据权利要求1所述的基于法律知识图谱的法律咨询报告生成系统，其特征在于：自然语言处理技术可以将自然语言转化为计算机可处理的格式，并进行语义分析和语义理解，在法律咨询服务中，自然语言处理技术将用户提出的问题转化为计算机可处理的格式，并匹配相关的法律知识图谱实体和关系。

4.根据权利要求1所述的基于法律知识图谱的法律咨询报告生成系统，其特征在于：在法律咨询服务中，知识图谱用来存储和管理法律相关的实体、属性和关系，并构建相应的分类体系和搜索引擎。

5.根据权利要求1所述的基于法律知识图谱的法律咨询报告生成系统，其特征在于：知识图谱构建具体方式如下：

6.根据权利要求5所述的基于法律知识图谱的法律咨询报告生成系统，其特征在于：嵌入层Att-BiLSTM-CRF模型的构成，如下：

模型第三层：attention层+tanh层；

相似度权重：a_ij＝exp(score(x_i，x_j))/Σ_kexp(score(x_t，x_k))其中Xt表示第t个当前目标词，Xj表示文档中的第j个已有词，文档级的全局向量将G和目标单词的BiLSTM输出连接为向量反馈传送到tanh函数以产生attention层输出z_t＝tanh(w_g[w_t；h_t])，然后tanh层预测具有每个可能标签的单词的置信度得分，作为神经网络的输出分数e_t＝tanh(W_t*Z_t)；

模型第四层：CRF层，

7.根据权利要求1所述的基于法律知识图谱的法律咨询报告生成系统，其特征在于：在法律咨询服务中，智能问答引擎根据用户的咨询问题和匹配的法律知识图谱实体和关系，生成相应的法律咨询电子报告。

8.根据权利要求6所述的基于法律知识图谱的法律咨询报告生成系统，其特征在于：法律咨询报告生成系统可以通过以下具体方式对生成的报告进行评估：

9.根据权利要求6所述的基于法律知识图谱的法律咨询报告生成方法，其特征在于：实现步骤如下：