CN118093829A - 一种基于知识图谱增强的法律咨询方法 - Google Patents
一种基于知识图谱增强的法律咨询方法 Download PDFInfo
- Publication number
- CN118093829A CN118093829A CN202410368434.0A CN202410368434A CN118093829A CN 118093829 A CN118093829 A CN 118093829A CN 202410368434 A CN202410368434 A CN 202410368434A CN 118093829 A CN118093829 A CN 118093829A
- Authority
- CN
- China
- Prior art keywords
- legal
- model
- data
- key information
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000013145 classification model Methods 0.000 claims abstract description 29
- 230000002452 interceptive effect Effects 0.000 claims abstract description 4
- 238000012549 training Methods 0.000 claims description 76
- 230000008569 process Effects 0.000 claims description 21
- 239000013598 vector Substances 0.000 claims description 16
- QVFWZNCVPCJQOP-UHFFFAOYSA-N chloralodol Chemical compound CC(O)(C)CC(C)OC(O)C(Cl)(Cl)Cl QVFWZNCVPCJQOP-UHFFFAOYSA-N 0.000 claims description 14
- 238000005457 optimization Methods 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 5
- 230000001105 regulatory effect Effects 0.000 claims description 4
- 206010039203 Road traffic accident Diseases 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000004458 analytical method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 5
- 238000004140 cleaning Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 235000002198 Annona diversifolia Nutrition 0.000 description 3
- 241000282842 Lama glama Species 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Technology Law (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于知识图谱增强的法律咨询方法,涉及人工智能技术领域,具体步骤如下:对用户咨询数据通过分类模型进行分类,将分类后的类别和用户咨询数据输入到关键信息判定模型,以交互的方式收集用户的关键信息数据;基于关键信息数据,在外部知识库中检索相关的法律法规以及类似案件;将关键信息数据以及相关的法律法规以及类似案件输入到法律模型中,以生成对用户咨询数据的回复结果;该法律咨询方法中法律相关数据集更加全面,在数据处理时使用思维链的方式自动化的进行,并且新加入了法律知识图谱,使得大模型能够更好的记忆,理解,应用法律知识,产生更精准的法律回复,有效缓解繁重的法律问答工作。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于知识图谱增强的法律咨询方法。
背景技术
随着ChatGPT的出现,大语言模型在自然语言处理(NLP)和人工智能(AI)领域发挥着越来越重要的作用。像ChatGPT、GPT-4、LLaMA、中文的Baichuan等模型在许多下游任务比如文本生成、语义理解、问答系统等,展现出了惊人的表现。这些模型的架构和性能的优化使得它们在处理复杂、大规模数据方面都表现出色,为多种NLP任务提供了新的解决方案。
与此同时,大语言模型在法律领域的研究也已经成为推动行业进步的重要力量。在前期的工作中,Huang等人提出了基于LLaMA的法律大模型Laywer-LLaMA,他们借助了原始的LLaMA模型在通用NLP任务上的能力,使用大量的法律原始语料对模型进行继续预训练,然后在模型微调阶段加入经过处理的多源法律问答数据集,包括司法考试、法律咨询和多轮对话数据集来增加模型在法律领域的专业性。在此之后Cui等人提出了法律大模型ChatLaw,他们在构建自己的法律微调数据集的同时,构建了本地知识库。根据用户输入,通过一个关键词大模型抽取关键词,然后在本地知识库中进行检索增强法律大模型的回答质量,提供更精准等法律和案例依据,改善模型的幻觉问题。Yue等人提出了DISC-LawLLM,他们从构建法律服务系统的角度出发,针对不同场景、不同用户、不同任务需求设计更细致的微调数据集来提高模型对法律问题的推理能力和外部法律知识的检索和推断能力。这些模型的应用不仅缓解了繁重的法律文书工作,而且通过提供更智能、更精准的法律分析,给用户带来不一样的体验,从而提高了法律服务的质量和效率。
大模型可以处理大规模的数据,完成多种NLP任务,同时它也有很强的交互能力和泛化能力,通过少量样本学习快速适应新任务。在法律领域,大模型的应用已成为推动行业进步的重要力量,前期的工作也已经证明了法律大模型在法律问答、案例分析和判决预测等方面的表现特别突出,为之后的工作奠定了坚实的基础。但是大语言模型在现实法律领域的应用中仍然面临着一些关键挑战:
①因为缺乏事实知识,大模型所展现出的不同程度的胡编乱造现象一开始就为人所诟病,同时这也暴露出模型对训练数据的依赖性和潜在的模型偏见问题。在本发明中利用分类模型、关键信息判定模型和外部知识库来提供更准确的案件相关信息,模型根据这些信息可以产生更可靠的回答。
②此外,模型的决策过程往往缺乏透明度和可解释性。大模型将知识隐式的存储在参数中,这些参数通过复杂的方式相互作用以生成响应或执行任务,但我们并不能直观的看到或者理解这些内部的相互作用。可解释性对于在法律领域信任和有效使用大模型至关重要。如果不能解释模型是如何得出结论,那么在法律这种需要高度精准和可靠决策的领域可能会存在风险。这在某种程度上限制了其在法律领域的应用。因此,在本发明中利用知识图谱、NL2Cypher模型和法律大模型来提供可靠的、更有深度的回答
发明内容
基于背景技术存在的技术问题,本发明提出了一种基于知识图谱增强的法律咨询方法,不仅提供了文本分析还能链接到法律知识库,为用户提供更全面、更深入的法律意见。
本发明提出的一种基于知识图谱增强的法律咨询方法,包括如下步骤:
对用户咨询数据通过分类模型进行分类,将分类后的类别和用户咨询数据输入到关键信息判定模型,以交互的方式收集用户的输出关键信息数据;
基于关键信息数据,在外部知识库中检索相关的法律法规以及类似案件;
将关键信息数据以及相关的法律法规以及类似案件根据预先定义好的prompt模板组织后输入到法律模型中,以生成对用户咨询数据的回复结果。
进一步地,所述分类模型包括11个咨询问题类别,包括家庭与婚姻事物、雇佣冲突、交通事故、财务责任、合同纠纷、财产异议、公司立法、医疗纠纷、安置问题、行政诉讼和建筑案件,分类模型使用Baichuan2-7B-Base架构,为每个咨询问题类别设置相应的事件信息关键点,以触发关键信息判定模型中的关键元素;
分类模型训练过程:构建用户问答数据集,采用小样本学习方法对用户问答数据集进行分类,基于分类模型输出的分类结果更新分类模型参数。
进一步地,关键信息判定模型同样基于Baichuan2-7B-Base模型,关键信息判定模型的训练集由ChatGPT生成,使用ChatGPT标注裁判文书数据,然后由法律专业人士进行核验。
进一步地,所述法律模型的训练过程如下:
S1:构建多源异构的法律数据集,所述法律数据集包括原始法律数据、法律问答数据、法律知识图谱数据、开源通用数据、真实律师标注数据;
S2:采用Baichuan2-13B模型作为基础模型,使用原始法律数据对Baichuan2-13B模型进行训练,得到预训练模型;
S3:基于法律问答数据以及开源通用数据,使用Lora方法对预训练模型进行微调训练,得到微调模型;
S4:基于真实律师标注数据,采用直接偏好优化DPO方法对微调模型进行偏好训练,得到偏好对齐的法律模型。
进一步地,在步骤S3中,使用Lora方法对预训练模型进行微调训练,具体为:
给定预训练模型的权重W0∈Rd×k,梯度更新权重ΔW∈Rd×k,将权重ΔW低秩分解为ΔW=BA,B∈Rd×r,A∈Rr×k,其中d表示输入数据的维度,k表示输出数据的维度,A和B分别表示可训练参数,r表示新生成矩阵的秩;
在预训练模型微调训练过程中固定权重W0,训练数据的前向传递表示为:
h=W0x+ΔWx=W0x+BAx
其中,x为预训练模型的输入,训练开始时ΔW=BA=0,h表示微调模型的输出结果。
进一步地,外部知识库模块包括向量数据库Chroma、知识图谱数据库以及NL2Cypher模块,其中,基于关键信息数据,在外部知识库中检索相关的法律法规以及类似案件,具体为:
基于NL2Cypher模块将关键信息数据转换成向量数据库Chroma和知识图谱数据库的查询语句,从知识图谱数据库中检索出相关的案件信息;同时将关键信息数据转换成向量形式以从向量数据库Chroma中使用余弦相似度检索相关法律法规信息,最终得到与关键信息数据对应的相关法律法规以及类似案件。
进一步地,NL2Cypher模块,NL2Cypher模块以Baichuan-7B-Base模型作为基础,NL2Cypher模块的训练过程:
训练数据是由ChatGPT基于裁判文书生成的大量结构化数据集,并在Baichuan-7B-Base模型的基础上进行Lora微调得到;
在知识图谱数据库检索到数据被格式化成标准模版,最后这些查询到的结果送入法律模型;所述标准模版为关键信息数据和外部知识库模块输出的结果拼接得到。
本发明提供的一种基于知识图谱增强的法律咨询方法的优点在于:本发明结构中提供的一种基于知识图谱增强的法律咨询方法,法律相关数据集更加全面,并且新加入了法律知识图谱,使得大模型能够更好的记忆,理解,应用法律知识,产生更精准的法律回复,有效缓解繁重的法律问答工作。综合性的法律框架和创新训练技术,结合法律知识图谱与大语言模型,提供了深入的法律理解和精确的法律咨询。该法律框架利用小样本学习、精细化数据集注释和先进的优化方法,显著提高了模型在法律应用中的准确性和可靠性;同时高效的数据利用和定制化的应用策略。通过结构化的法律知识(外部知识库模块)有效减少了法律模型的幻觉问题,针对不同法律场景设计定制化应用策略和案例模版。这种方法确保的高质量输出与法律模型在法律领域的实用性和可信度。
附图说明
图1为本发明法律模型的训练流程示意图;
图2为分类模型的训练流程示意图;
图3为关键信息判定模型的训练流程示意图;
图4为外部知识库模块检索示意图;
图5为Lora方法对模型的微调过程。
具体实施方式
下面,通过具体实施例对本发明的技术方案进行详细说明,在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其他方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
如图1至5所示,本发明提出的一种基于知识图谱增强的法律咨询方法,包括:
对用户咨询数据通过分类模型进行分类,将分类后的类别和用户咨询数据输入到关键信息判定模型,以交互的方式收集用户的输出关键信息数据;
基于关键信息数据,在外部知识库中检索相关的法律法规以及类似案件;
将关键信息数据以及相关的法律法规以及类似案件输入到法律模型中,以生成对用户咨询数据的回复结果。
本实施例利用分类模型、关键信息判定模型和外部知识库来提供更准确的案件相关信息,模型根据这些信息可以产生更可靠的回答;同时利用知识图谱、NL2Cypher模型和法律大模型来提供可靠的、更有深度的回答。
本法律咨询方法主要包括多源异构的法律数据集构建,法律模型训练,下游任务对齐方法,以及外部知识库链接。针对多样复杂的法律数据,首先按照模型训练流程,广泛收集法律数据,并进行初步的数据清洗,然后根据任务需求将一部分数据转换成问答形式,同时保证数据的质量和准确性。接下来在模型预训练、微调和人类偏好强化学习阶段使用数据集,从而进一步提升模型在法律领域的专业性能。最后设计两个下游任务:法律分类和关键信息判定,来引导用户进行法律专业性提问。最后包括一个外部知识模块,旨在克服模型的幻觉问题,提升回答的深度和专业性。以下对分类模型、关键信息判定模型以及法律模型进行详细说明。
(1)构建多源异构的法律数据集,为了涵盖法律领域的大部分应用场景以及法律内容的深度和广度,收集并整理了四类法律数据集:原始法律语料、法律问答数据、法考选择题数据、法律知识图谱。
针对不同阶段,整理不同的训练数据集。原始法律数据主要包括:法律新闻、法律领域的论坛、社交媒体以及裁判文书网站上的大量法律数据。这些来源保证了现实世界法律文本的多样性和全面性,涵盖了各种法律问题和讨论。经过仔细的数据清洗和部分结构化处理后,比如数据去重复,使用思维链的方式,让ChatGPT根据法律三段论(大前提是法律,小前提是案件基本事实,结论是判决结果)对法律长文本进行总结,构建对话SFT数据集等,这些数据被应用于模型的预训练和微调阶段。法律问答数据是微调阶段的重要数据集,基于现行的法律法规和司法解释构建法律问答数据集。数据主要来源于现实生活中用户与律师的实际沟通,通过精心挑选相关法律文件和司法解释,确保数据集忠实于法律系统结构,并具有高度的内容准确性和实效性。法考选择题数据集覆盖了法律众多领域,包括对法律原则、概念及其实际应用的理解,将选择题的题目当作prompt,答案和解析作为response,这些数据主要用于微调和法律模型评估阶段。最后是法律知识图谱数据集,它包含了市面上现有的开源法律和知识图谱数据集,以及利用裁判文书网站中的非结构化数据构建的法律知识图谱。这些知识图片作为一个结构化的法律信息框架,增强了模型对法律概念理解以及法律在实际情境中的应用能力。图谱数据被应用于模型的预训练阶段以及知识图谱数据库构建。
(2)法律模型训练包括三个步骤:预训练过程、微调过程以及人类偏好强化学习过程;首先,使用法律语料进行法律模型预训练,以提升法律模型在法律领域的基础能力,然后对法律模型进行Lora微调,使得法律模型能够更好的适应法律领域的问答场景并且提升了法律模型对法律知识的学习能力。最后为了更加了解用户需求,符合用户的回答偏好,使用DPO技术进行最后一步的模型训练。
具体地,法律模型的训练过程如下
S1:构建多源异构的法律数据集,所述法律数据集包括原始法律数据、法律问答数据、法律知识图谱数据、开源通用数据、真实律师标注数据;
S2:采用Baichuan2-13B模型作为基础模型,使用原始法律数据对Baichuan2-13B模型进行训练,得到预训练模型;
因为Baichuan2-13B模型在前期训练已经包含了部分法律数据。首先使用大量的法律原始语料(原始法律数据),进行简单的数据清洗之后,用于模型的继续预训练当中,法律原始语料具体包括:中文通用语料,百度百科30K、中文维基25K,中文法律语料,裁判文书数据100K、法律法条20K、法考数据30K、法律知识图谱5K。设计了3个epochs,分词最大长度2048,得到预训练模型。此时将预训练模型与原始Baichuan-13B模型相比,在法考选择题准确率上得到更好的结果。
S3:基于法律问答数据以及开源通用数据,使用Lora方法对预训练模型进行微调训练,得到微调模型;
为了让预训练模型具有更多的法律知识和更准确的法律对话能力,使用Lora方法对预训练模型进行微调,训练数据包括:法律问答数据,开源数据集36K、裁判文书数据62K,法律选择题12K,中文通用数据集20K。设计了3个epochs以及相应的Lora参数,学习率2e-5,分词最大长度2048,训练得到微调模型。
使用Lora方法对预训练模型进行微调训练,具体为:
如图5所示,给定预训练模型的权重W0∈Rd×k,梯度更新权重ΔW∈Rd×k,将权重ΔW低秩分解为ΔW=BA,B∈Rd×r,A∈Rr×k,其中d表示输入数据的维度,k表示输出数据的维度,A和B分别表示可训练参数,两者初始化的方式不同,A矩阵的参数为随机高斯初始化,B矩阵的参数为零初始化,r表示新生成矩阵的秩;
在预训练模型微调训练过程中固定权重W0,训练数据的前向传递表示为:
h=W0x+ΔWx=W0x+BAx
其中,x为预训练模型的输入,训练开始时ΔW=BA=0,h表示微调模型的输出结果。
S4:基于真实律师标注数据,采用直接偏好优化DPO方法对微调模型进行偏好训练,得到偏好对齐的法律模型。
采用直接偏好优化DPO方法对微调模型进行训练,训练数据包括:真实律师标注数据5K,ChatGPT生成再由人类检查15K,得到最终的法律模型。法律模型训练流程如图1所示。
(3)分类模型和关键信息判定模型
(3)由于用户的提问更多是以口语化的方式表达的。法律模型直接回复往往容易产生偏差答案,不符合用户的预期和偏好。因此设计了两个法律任务:法律分类和关键信息判定,来引导用户进行法律专业性提问。其中,法律分类通过分类模型实现,关键信息判定通过关键信息判定模型实现。
分类模型:通过与法律专家合作,将现实生活中用户咨询的问题分为11个不同类别,包括家庭与婚姻事物、雇佣冲突、交通事故、财务责任、合同纠纷、财产异议、公司立法、医疗纠纷、安置问题、行政诉讼和建筑案件。分类模型使用Baichuan2-7B-Base架构,采用小样本学习(few-shot learning)方法对用户提出的问题进行分类。分类模型推理阶段,用户给予一些相关任务的示例,不更新分类模型参数,分类模型就能够产生正确的答案。此外,法律专家为每个咨询问题类别设置相应的事件信息关键点,为之后的关键信息判定奠定了基础。
关键信息判定主要是用来评估用户提出的法律问题是否缺少关键元素。当检测到缺失时,系统提示用户提供缺失的细节,用户需要补充这些细节,直到用户补充完整后关键信息判定输出关键信息数据,该关键信息数据中的数据不仅包括对原始用户咨询数据的数据收集,还包括对用户补充后数据的数据收集,另外用户补充的数据与原始用户咨询数据一致,均需要通分类模块进行分类,将分类后的类别和用户补充的数据输入到关键信息判定模型。关键信息判定模型同样基于Baichuan2-7B-Base模型,其数据集由ChatGPT生成,使用ChatGPT标注裁判文书数据,然后由法律专业人士进行核验,关键信息判定模型开发了详细的提示以提高模型回应的准确性。如图2和图3所示。
(4)链接的外部知识模块
尽管法律模型在提供准确的法律咨询方面表现出专业能力,但是提升回复的深度和专业性以及克服模型幻觉问题是必要的。为了实现这一目标,融合了法律法规,法律问答数据,法律案件的广泛知识,构建了外部知识库通过检索增强法律模型的性能。
如图4所示,外部知识库包括向量数据库Chroma和知识图谱数据库两部分。向量数据库中主要包括了现行的法律法规数据,知识图谱则是涵盖了大量的裁判文书数据。向量数据库中的句子向量使用bge-base模型编码得到,向量数据库可以支持基于语义相似度检索,MongoDB则存储更精准的法律原始文本。从司法文件构建的法律知识图谱能够增强法律模型的外部知识基础。在具体实践当中,对于用户提出的法律问题,首先从向量库中使用余弦相似度检索相关信息,同时引入NL2Cypher模块,将用户输入的法律问题转换成Cypher知识图谱数据库查询语句,进而从知识图谱数据库中检索数据。NL2Cypher模型的训练数据是由ChatGPT基于裁判文书生成的大量结构化数据集,并在Baichuan-7B-Base的基础上进行Lora方法微调得到的(具体微调详见上述Lora方法对预训练模型微调过程)。Cypher语句检索到的数据被格式化成标准模版,也就是说,将关键信息数据以及相关的法律法规以及类似案件根据预先定义好的prompt模板(例如图4右侧显示的模型输入,法律模型输入包括用户的输入user input,相关的法条reference,以及知识图谱的信息background,这些信息即为prompt模板定义好的)组织后输入到法律模型中,法律模型根据用户的提问,利用这些检索信息生成准确的回复。
实施例一
(a1)获取用户咨询数据,并将用户咨询数据输入到分类模型中;
(a2)分类模型基于11中分类类别对用户咨询数据进行分类,得到分类后的类别,该类别设置相应的事件信息关键点,以触发关键信息判定模型中的关键元素;
(a3)将分类后的类别和原始的用户咨询数据输入到关键信息判定模型中,关键信息判定模型基于类别对应的事件信息关键点遍历关键信息,得到该类别对应的关键信息,基于关键信息对原始的用户咨询数据的完整度进行判定,若原始的用户咨询数据完整对应到关键信息,则将关键信息输入到法律模型中,若原始的用户咨询数据不能完整对应到关键信息,则表明原始的用户咨询数据的完整度不够,将未对应上的关键信息的tips反馈给用户继续补充输入,直至原始的用户咨询数据完整对应到关键信息;
(a4)以关键信息作为法律模型的输入,生成对用户咨询数据的回复结果。
实施例二
(b1)获取用户咨询数据,并将用户咨询数据输入到分类模型中;
(b2)分类模型基于11中分类类别对用户咨询数据进行分类,得到分类后的类别,该类别设置相应的事件信息关键点,以触发关键信息判定模型中的关键元素;
(b3)将分类后的类别和原始的用户咨询数据输入到关键信息判定模型中,关键信息判定模型基于类别对应的事件信息关键点遍历关键信息,得到该类别对应的关键信息,基于关键信息对原始的用户咨询数据的完整度进行判定,若原始的用户咨询数据完整对应到关键信息,则将关键信息输入到外部知识库模块中,若原始的用户咨询数据不能完整对应到关键信息,则表明原始的用户咨询数据的完整度不够,将未对应上的关键信息的tips反馈给用户继续补充输入,直至原始的用户咨询数据完整对应到关键信息;
(b4)以关键信息作为外部知识库模块的输入,基于NL2Cypher模块将关键信息转换成Cypher知识图谱数据库查询语句,从知识图谱数据库中检索出相关的案件信息;同时将关键信息转换成向量形式以从向量数据库Chroma中使用余弦相似度检索相关法律法规信息,最终我们得到与关键信息数据对应的相关的法律法规和类似的案件,并将关键信息数据以及相关的法律法规和类似的案件根据预先定义的prompt组织并输入到法律模型中。
(b5)以关键信息数据以及相关的法律法规和类似的案件作为法律模型的输入,生成对用户咨询数据的回复结果。
其中两个实施例的区别在于,实施例二比实施例一多使用了外部知识库模块,外部知识库模块储存相应的法律法规以及类似案件,将有助于法律模型进行综合分析,以生成精准的回复。
在实施例二中,举例说明:首先用户输入法律问题,例如我现在想要离婚,我应该怎么做?然后分类模型根据用户的输入,将它分类为“婚姻家庭纠纷”,同时关键信息判定模型发现用户的输入不全面,则向用户提出反问,让他补充更多的信息点,比如婚姻时间,财产信息,有无子女等。在明确用户的法律问题之后,在外部知识库检索出相关的法律法规和类似的案件,最后法律模型综合以上信息生成精准的回复。
本发明提出了一个全面的法律模型框架,其中外部知识库可以有效的解决了法律模型的幻觉问题,法律分类和关键信息判定可以辅助法律模型生成回复,实现对于用户提问的精准分析,实践中可以减轻繁重法律问答任务,为法律行业提供更高效的服务。
本实施例采用完整的领域模型训练流程,包括法律数据集的收集,清洗,格式化等。之后通过模型预训练、参数高效微调、直接偏好学习等技术,更准确的给出符合用户的偏好和需求的回复。
与现有方法相比,本实施例的法律相关数据集更加全面,并且新加入了法律知识图谱,使得大模型能够更好的记忆,理解,应用法律知识,产生更精准的法律回复,有效缓解繁重的法律问答工作。综合性的法律框架和创新训练技术,结合法律知识图谱与大语言模型,提供了深入的法律理解和精确的法律咨询。该法律框架利用小样本学习、精细化数据集注释和先进的优化方法,显著提高了模型在法律应用中的准确性和可靠性。
同时高效的数据利用和定制化的应用策略。通过结构化的法律知识(外部知识库模块)有效减少了法律模型的幻觉问题,针对不同法律场景设计定制化应用策略和案例模版。这种方法确保的高质量输出与法律模型在法律领域的实用性和可信度。
通过预训练模型与Baichuan基座模型性能比较,法律模型的法考单项选择题准确率高于Baichuan基座模型,如下表1所示;
表示1法律模型与Baichuan基座模型性能比较
通过法律模型(表中的灵兮法律大模型)与其他通用模型性能比较,本申请的法律模型无论是语言质量、准确度和平均度都高于其他通用模型性能,具体如下表2所示;
表2灵兮法律大模型与其他通用模型性能比较
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (7)
1.一种基于知识图谱增强的法律咨询方法,其特征在于,包括如下步骤:
对用户咨询数据通过分类模型进行分类,将分类后的类别和用户咨询数据输入到关键信息判定模型,以交互的方式收集用户的关键信息数据;
基于关键信息数据,在外部知识库中检索相关的法律法规以及类似案件;
将关键信息数据以及相关的法律法规以及类似案件根据预先定义好的prompt模板组织后输入到法律模型中,以生成对用户咨询数据的回复结果。
2.根据权利要求1所述的基于知识图谱增强的法律咨询方法,其特征在于,所述分类模型包括11个咨询问题类别,包括家庭与婚姻事物、雇佣冲突、交通事故、财务责任、合同纠纷、财产异议、公司立法、医疗纠纷、安置问题、行政诉讼和建筑案件,分类模型使用Baichuan2-7B-Base架构,为每个咨询问题类别设置相应的事件信息关键点,以触发关键信息判定模型中的关键元素;
分类模型训练过程:构建用户问答数据集,采用小样本学习方法对用户问答数据集进行分类,基于分类模型输出的分类结果更新分类模型参数。
3.根据权利要求2所述的基于知识图谱增强的法律咨询方法,其特征在于,关键信息判定模型同样基于Baichuan2-7B-Base模型,关键信息判定模型的训练集由ChatGPT生成,使用ChatGPT标注裁判文书数据,然后由法律专业人士进行核验。
4.根据权利要求1所述的基于知识图谱增强的法律咨询方法,其特征在于,所述法律模型的训练过程如下:
S1:构建多源异构的法律数据集,所述法律数据集包括原始法律数据、法律问答数据、法律知识图谱数据、开源通用数据、真实律师标注数据;
S2:采用Baichuan2-13B模型作为基础模型,使用原始法律数据对Baichuan2-13B模型进行训练,得到预训练模型;
S3:基于法律问答数据以及开源通用数据,使用Lora方法对预训练模型进行微调训练,得到微调模型;
S4:基于真实律师标注数据,采用直接偏好优化DPO方法对微调模型进行偏好训练,得到偏好对齐的法律模型。
5.根据权利要求4所述的基于知识图谱增强的法律咨询方法,其特征在于,在步骤S3中,使用Lora方法对预训练模型进行微调训练,具体为:
给定预训练模型的权重W0∈Rd×k,梯度更新权重ΔW∈Rd×k,将权重ΔW低秩分解为ΔW=BA,B∈Rd×r,A∈Rr×k,其中d表示输入数据的维度,k表示输出数据的维度,A和B分别表示可训练参数,r表示新生成矩阵的秩;
在预训练模型微调训练过程中固定权重W0,训练数据的前向传递表示为:
h=W0x+ΔWx=W0x+BAx
其中,x为预训练模型的输入,训练开始时ΔW=BA=0,h表示微调模型的输出结果。
6.根据权利要求1所述的基于知识图谱增强的法律咨询方法,其特征在于,外部知识库模块包括向量数据库Chroma、知识图谱数据库以及NL2Cypher模块,其中,基于关键信息数据,在外部知识库中检索相关的法律法规以及类似案件,具体为:
基于NL2Cypher模块将关键信息数据转换成向量数据库Chroma和知识图谱数据库的查询语句,从知识图谱数据库中检索出相关的案件信息;同时将关键信息数据转换成向量形式以从向量数据库Chroma中使用余弦相似度检索相关法律法规信息,最终得到与关键信息数据对应的相关法律法规以及类似案件。
7.根据权利要求6所述的基于知识图谱增强的法律咨询方法,其特征在于,NL2Cypher模块以Baichuan-7B-Base模型作为基础,NL2Cypher模块的训练过程:
训练数据是由ChatGPT基于裁判文书生成的大量结构化数据集,并在Baichuan-7B-Base模型的基础上进行Lora微调得到;
在知识图谱数据库检索到数据被格式化成标准模版,最后这些查询到的结果送入法律模型;所述标准模版为关键信息数据和外部知识库模块输出的结果拼接得到。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410368434.0A CN118093829A (zh) | 2024-03-28 | 2024-03-28 | 一种基于知识图谱增强的法律咨询方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410368434.0A CN118093829A (zh) | 2024-03-28 | 2024-03-28 | 一种基于知识图谱增强的法律咨询方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118093829A true CN118093829A (zh) | 2024-05-28 |
Family
ID=91147852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410368434.0A Pending CN118093829A (zh) | 2024-03-28 | 2024-03-28 | 一种基于知识图谱增强的法律咨询方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118093829A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118277538A (zh) * | 2024-06-04 | 2024-07-02 | 杭州昊清科技有限公司 | 一种基于检索增强语言模型的法律智能问答方法 |
CN118586505A (zh) * | 2024-08-06 | 2024-09-03 | 数据空间研究院 | 一种结合矛盾纠纷知识图谱的智能问答系统 |
CN118585635A (zh) * | 2024-08-07 | 2024-09-03 | 山东大学 | 面向婴幼儿成长发育的智能问答方法、系统、介质及设备 |
-
2024
- 2024-03-28 CN CN202410368434.0A patent/CN118093829A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118277538A (zh) * | 2024-06-04 | 2024-07-02 | 杭州昊清科技有限公司 | 一种基于检索增强语言模型的法律智能问答方法 |
CN118277538B (zh) * | 2024-06-04 | 2024-10-01 | 杭州昊清科技有限公司 | 一种基于检索增强语言模型的法律智能问答方法 |
CN118586505A (zh) * | 2024-08-06 | 2024-09-03 | 数据空间研究院 | 一种结合矛盾纠纷知识图谱的智能问答系统 |
CN118586505B (zh) * | 2024-08-06 | 2024-10-18 | 数据空间研究院 | 一种结合矛盾纠纷知识图谱的智能问答系统 |
CN118585635A (zh) * | 2024-08-07 | 2024-09-03 | 山东大学 | 面向婴幼儿成长发育的智能问答方法、系统、介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020224097A1 (zh) | 智能语义文档推荐方法、装置及计算机可读存储介质 | |
CN110377715A (zh) | 基于法律知识图谱的推理式精准智能问答方法 | |
CN108563773B (zh) | 基于知识图谱的法律条文精准搜索排序方法 | |
CN110674252A (zh) | 一种面向司法领域的高精度语义搜索系统 | |
CN109960786A (zh) | 基于融合策略的中文词语相似度计算方法 | |
CN118093829A (zh) | 一种基于知识图谱增强的法律咨询方法 | |
CN112307182B (zh) | 一种基于问答系统的伪相关反馈的扩展查询方法 | |
Jotheeswaran et al. | OPINION MINING USING DECISION TREE BASED FEATURE SELECTION THROUGH MANHATTAN HIERARCHICAL CLUSTER MEASURE. | |
US11699034B2 (en) | Hybrid artificial intelligence system for semi-automatic patent infringement analysis | |
CN111581364B (zh) | 一种面向医疗领域的中文智能问答短文本相似度计算方法 | |
CN112328800A (zh) | 自动生成编程规范问题答案的系统及方法 | |
CN112417170B (zh) | 面向不完备知识图谱的关系链接方法 | |
CN114265926A (zh) | 一种基于自然语言的素材推荐方法、系统、设备及介质 | |
CN117609517A (zh) | 一种基于知识图谱的海洋数据检索平台及检索方法 | |
Reddy et al. | Convolutional recurrent neural network with template based representation for complex question answering | |
CN118410175A (zh) | 基于大语言模型和知识图谱智能制造能力诊断方法及装置 | |
CN116843162A (zh) | 一种矛盾调解方案推荐与评分系统及方法 | |
Liu et al. | Resume parsing based on multi-label classification using neural network models | |
Zadgaonkar et al. | An Approach for analyzing unstructured text data using topic modeling techniques for efficient information extraction | |
CN111581326B (zh) | 一种基于异构外部知识源图结构抽取答案信息的方法 | |
CN116341569A (zh) | 基于领域知识库的专业文档智能辅助阅读方法 | |
Brummerloh et al. | Boromir at Touché 2022: Combining Natural Language Processing and Machine Learning Techniques for Image Retrieval for Arguments. | |
Segura-Tinoco et al. | An Argument-based Search Framework: Implementation on a Spanish Corpus in the E-Participation Domain. | |
Maree | Semantics-based key concepts identification for documents indexing and retrieval on the web | |
Wang et al. | Question answering system of discipline inspection laws and regulations based on knowledge graph |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |