CN116719899A

CN116719899A - 一种针对大模型的领域知识更新系统及方法

Info

Publication number: CN116719899A
Application number: CN202310596576.8A
Authority: CN
Inventors: 周玉; 邓彪; 翟飞飞; 孙建
Original assignee: Beijing Zhongkefan Language Technology Co ltd
Current assignee: Beijing Zhongkefan Language Technology Co ltd
Priority date: 2023-05-25
Filing date: 2023-05-25
Publication date: 2023-09-08

Abstract

本发明公开了一种针对大模型的领域知识更新系统，包括对知识数据进行实体及关系抽取的实体关系联合抽取模型、对新知识进行储存的新知识向量库、句嵌入模块、以及对大模型输出结果进行优化的相似度分析模型；与现有技术相比，本发明通过设置独立的新知识向量库，与大模型相配合，在实现对大模型中知识更新的同时，弥补大模型在处理新任务时可能存在的缺陷或偏差，从而提高模型的准确性，同时新知识向量库中的知识内存可以提供先前学习到的知识和经验，帮助大模型快速适应新任务，降低训练成本和时间，进一步提高模型的泛化能力，随着时间的推移，通过不断更新外部知识内存中的内容，大模型可以保持对多领域的了解，从而提高模型的适应性。

Description

一种针对大模型的领域知识更新系统及方法

技术领域

本发明涉及自然语言处理领域，具体为一种针对大模型的领域知识更新系统及方法。

背景技术

大模型的训练数据主要来源于互联网上的海量文本，包括百科、新闻文章、小说、论坛帖子等等。经过预处理和训练，模型可以理解和生成多种语言的文本。

然而，由于大模型通常在海量数据上进行预训练，对一些垂直领域而言，由于缺少训练数据，导致存在大模型在该领域的泛化性较差的问题。同时，现实世界中的任务和场景变化很快，传统的机器学习方法需要重新收集和标注数据来训练新模型，使得大模型中存储的知识存在着一定的滞后性，大模型参数量巨大，通常有数亿个参数，难以解释它们每一个的作用，因此很难为了融入新知识而微调模型，难以对模型中可能存在的缺陷或偏差进行处理。

综上所述，需提供一个解决上述问题的技术方案。

发明内容

为解决上述问题，本发明提供如下技术方案：

一种针对大模型的领域知识更新系统，包括：

实体关系联合抽取模型，其用于对知识数据进行实体及关系的识别抽取；

新知识向量库，其用于对大模型中未记录的知识数据进行储存以及检索；

句嵌入模块，其用于对实体关系联合抽取模型所抽取的知识数据的实体及关系进行句向量的转化；

相似度分析模型，其能够根据句嵌入模块的句向量转化数据，分析有新任务输入的大模型初步输出结果与新知识向量库中储存数据的相似度。

在上述技术方案的基础上，本发明还可以做如下改进。

进一步的，所述新知识向量库能够对新任务输入大模型后得出的初步结果数据与新知识向量库中的知识相似度进行计算。

进一步的，所述新知识向量库能够将大模型中未记录知识数据的保存为三元组结构。

进一步的，所述实体关系联合抽取模型能够抽取出知识数据中的头实体、尾实体、以及头实体与尾实体的关系。

一种针对大模型的领域知识更新方法，包括如下步骤：

S1、实体关系联合抽取模型抽取领域知识数据中的实体与关系，并以此构建知识图谱。

S2、根据判断模板将知识图谱中的目标知识数据输入至大模型，由大模型判断其内部是否包含与目标知识数据对应的知识数据。

S3、将知识图谱中在大模型中未查询到的目标知识数据储存至新知识向量库；

S4、新任务输入至大模型，大模型输出初始结果数据。

S5、选取新知识向量库中与初始结果数据相似度最高的相近知识数据，计算初始结果数据与相近知识数据的相似度。

S6、根据相似度选择输出初始结果数据与相近知识数据中的其中一个。

在上述技术方案的基础上，本发明还可以做如下改进：

进一步的，所述S2中，知识图谱中的目标知识数据输入至大模型的判断模板为：

你是否知道{头实体}{关系}{尾实体}，只能回答“是”或“否”。

进一步的，所述S3中，将知识数据储存至新知识向量库中的方法包括如下步骤：

S2-1、对知识图谱中需要存入新知识向量库中的知识数据对应的三元组的实体和关系进行拼接。

S2-2、通过句嵌入模块对拼接后的结果进行向量化处理，并将处理结果存入新知识向量库。

进一步的，所述S5中，对新知识向量库中与初始结果数据相似度最高的相近知识数据的选取方法包括如下步骤：

S5-1-1、实体关系联合抽取模型对大模型的初始结果数据进行实体与关系的抽取，并以抽取的结果数据构建知识三元组，记作A。

S5-1-2、将实体关系联合抽取模型抽取到的实体与关系进行拼接，通过句嵌入模块对拼接后的结果进行编码，得到句向量，记作B。

S5-1-3、由新知识向量库计算B与新知识向量库向量库中其他知识的相似度，输出相似度最高的实体拼接数据以及对应的索引，相似度最高的实体拼接数据记作C。

进一步的，所述S5中，初始结果数据与相近知识数据相似度的计算方法包括如下步骤：

S5-2-1、抽取三元组A中的尾实体以及B与新知识向量库中相似度最高的实体拼接数据C中的尾实体。

S5-2-2、通过相似度分析模型对比由三元组A抽取出的尾实体与由相似度最高的实体拼接数据中抽取出的尾实体，计算二者的相似度。

进一步的，所述S6中，相似度大于设定阈值时，最终输出大模型输出的初始输出数据，若相似度小于设定阈值，则由A抽取出的尾实体替换C中抽取出的尾实体后，输出替换尾实体后的实体数据。

有益效果

与现有技术相比，本发明通过设置独立的新知识向量库，与大模型相配合，在实现对大模型中知识更新的同时，弥补大模型在处理新任务时可能存在的缺陷或偏差，从而提高模型的准确性，同时新知识向量库中的知识内存可以提供先前学习到的知识和经验，帮助大模型快速适应新任务，降低训练成本和时间，进一步提高模型的泛化能力，随着时间的推移，通过不断更新外部知识内存中的内容，大模型可以保持对多领域的了解，从而提高模型的适应性和可扩展性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为发明实施例的流程框图。

具体实施方式

为了便于理解本发明，下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是，本发明可以以许多不同的形式来实现，并不限于本文所描述的实施例。相反地，提供这些实施例的目的是使对本发明的公开内容更加透彻全面。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

本发明公开了一种针对大模型的领域知识更新系统，包括对知识数据进行实体及关系抽取的实体关系联合抽取模型、对新知识进行储存的新知识向量库、句嵌入模块、以及对大模型输出结果进行优化的相似度分析模型。

其中，新知识向量库能够用于对大模型中未记录的知识数据进行储存以及检索，句嵌入模块用于对实体关系联合抽取模型所抽取的知识数据的实体及关系进行句向量的转化，相似度分析模型能够根据句嵌入模块的句向量转化数据，分析有新任务输入的大模型初步输出结果与新知识向量库中储存数据的相似度。

通过设置的独立新知识向量库，能够对大模型中未记录或检索到的知识进行储存与更新，同时，新知识向量库能够对新任务输入大模型后得出的初步结果数据与新知识向量库中的知识相似度进行计算，经由新知识向量库来对大模型的输出结果进行一定程度的校正，提升大模型对不同领域知识任务的适应性。

为方便对新知识向量库中的知识数据进行分析，新知识向量库能够将大模型中未记录知识数据的保存为三元组结构，实体关系联合抽取模型能够抽取出知识数据中的头实体、尾实体、以及头实体与尾实体的关系。

进一步的，为对上述系统进行详细说明，现公开一种针对大模型的领域知识更新方法，请参阅图1，包括如下步骤：

其中，知识图谱中的目标知识数据输入至大模型的判断模板为：你是否知道{头实体}{关系}{尾实体}，只能回答“是”或“否”。

例如：你是否知道某国面积一千万平方公里，只能回答“是”或“否”。

S3、将知识图谱中在大模型中未查询到的目标知识数据储存至新知识向量库。

S3-1、对知识图谱中需要存入新知识向量库中的知识数据对应的三元组的实体和关系进行拼接。

S3-2、通过句嵌入模块对拼接后的结果进行向量化处理，并将处理结果存入新知识向量库。

S4、新任务输入至大模型，大模型输出初始结果数据。

S5、选取新知识向量库中与初始结果数据相似度最高的相近知识数据，并计算初始结果数据与相近知识数据的相似度。

S6、根据相似度选择输出初始结果数据与相近知识数据中的其中一个，在相似度大于设定阈值时，最终输出大模型输出的初始输出数据，若相似度小于设定阈值，则由A抽取出的尾实体替换C中抽取出的尾实体后，输出替换尾实体后的实体数据。

其中，设定阈值可为0～1中的任意值，优选为0.8。

上述方法通过设置独立新知识数据库向模型注入特定领域的知识数据，能够弥补模型与实际场景差距，相较于传统需要重新收集和标注数据来训练新模型的机器学习方法，本发明能够通过动态地增量学习、增量训练和知识库更新来快速适应新的任务和场景，进而对现实世界中快速变化的任务和场景进行快速的适应。

同时，本发明通过向大模型注入领域知识(例如本体论或规则)的数据，可以使得大模型更加稳定和可解释，并减少对训练数据的依赖，提高模型的可解释性和稳定性

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种针对大模型的领域知识更新系统，其特征在于，包括：

2.根据权利要求1所述的一种针对大模型的领域知识更新系统，其特征在于，所述新知识向量库能够对新任务输入大模型后得出的初步结果数据与新知识向量库中的知识相似度进行计算。

3.根据权利要求2所述的一种针对大模型的领域知识更新系统，其特征在于，所述新知识向量库能够将大模型中未记录知识数据的保存为三元组结构。

4.根据权利要求3所述的一种针对大模型的领域知识更新系统，其特征在于，所述实体关系联合抽取模型能够抽取出知识数据中的头实体、尾实体、以及头实体与尾实体的关系。

5.一种针对大模型的领域知识更新方法，其特征在于，包括如下步骤：

S1、实体关系联合抽取模型抽取领域知识数据中的实体与关系，并以此构建知识图谱；

S2、根据判断模板将知识图谱中的目标知识数据输入至大模型，由大模型判断其内部是否包含与目标知识数据对应的知识数据；

S4、新任务输入至大模型，大模型输出初始结果数据；

S5、选取新知识向量库中与初始结果数据相似度最高的相近知识数据，计算初始结果数据与相近知识数据的相似度；

6.根据权利要求5所述的一种针对大模型的领域知识更新方法，其特征在于，所述S2中，知识图谱中的目标知识数据输入至大模型的判断模板为：

7.根据权利要求5所述的一种针对大模型的领域知识更新方法，其特征在于，所述S3中，将知识数据储存至新知识向量库中的方法包括如下步骤：

S3-1、对知识图谱中需要存入新知识向量库中的知识数据对应的三元组的实体和关系进行拼接；

8.根据权利要求5所述的一种针对大模型的领域知识更新方法，其特征在于，所述S5中，对新知识向量库中与初始结果数据相似度最高的相近知识数据的选取方法包括如下步骤：

S5-1-1、实体关系联合抽取模型对大模型的初始结果数据进行实体与关系的抽取，并以抽取的结果数据构建知识三元组，记作A；

S5-1-2、将实体关系联合抽取模型抽取到的实体与关系进行拼接，通过句嵌入模块对拼接后的结果进行编码，得到句向量，记作B；

9.根据权利要求8所述的一种针对大模型的领域知识更新方法，其特征在于，所述S5中，初始结果数据与相近知识数据相似度的计算方法包括如下步骤：

S5-2-1、抽取三元组A中的尾实体以及C中的尾实体；

S5-2-2、通过相似度分析模型对比由A抽取出的尾实体与C中抽取出的尾实体，计算二者的相似度。

10.根据权利要求9所述的一种针对大模型的领域知识更新方法，其特征在于，所述S6中，相似度大于设定阈值时，最终输出大模型输出的初始输出数据，若相似度小于设定阈值，则由A抽取出的尾实体替换C中抽取出的尾实体后，输出替换尾实体后的实体数据。