CN117573850B - 基于知识图谱与内生知识融合的大模型问答方法及系统 - Google Patents
基于知识图谱与内生知识融合的大模型问答方法及系统 Download PDFInfo
- Publication number
- CN117573850B CN117573850B CN202410063983.7A CN202410063983A CN117573850B CN 117573850 B CN117573850 B CN 117573850B CN 202410063983 A CN202410063983 A CN 202410063983A CN 117573850 B CN117573850 B CN 117573850B
- Authority
- CN
- China
- Prior art keywords
- knowledge
- large model
- fusion
- module
- external
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 90
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000005065 mining Methods 0.000 claims description 56
- 238000000605 extraction Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 17
- 238000004458 analytical method Methods 0.000 claims description 11
- 230000007246 mechanism Effects 0.000 claims description 10
- 230000014509 gene expression Effects 0.000 claims description 9
- 238000007499 fusion processing Methods 0.000 claims description 8
- 230000001502 supplementing effect Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000238588 Balanus Species 0.000 description 1
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于知识图谱与内生知识融合的大模型问答方法及系统,涉及数据处理技术领域。本发明中,基于知识图谱获取待回答问题中的实体的相关知识,作为大模型外部知识,并获取大模型内与待回答问题相关的内部知识,将二者相融合后,得到关于待回答问题的答案,一方面利用实时更新的大模型外在知识,一方面通过让大模型回想出模型内部的内生文本信息,从而可以从多个维度增强大模型知识问答的准确性;并且,针对不同领域的大模型知识问答任务,只需调整相对应的外部知识图谱,即可快速、高效地完成不同领域之间的大模型问答系统,具有比较高的可扩展性。
Description
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种基于知识图谱与内生知识融合的大模型问答方法及系统。
背景技术
利用大模型进行知识问答是一种先进的自然语言处理技术,它能够让计算机理解并回答用户提出的问题,就像人类之间进行对话一样。这种技术的核心是采用深度学习模型,如GPT(Generative Pre-trained Transformer)系列模型,通过预训练和微调的方式,使计算机能够从大规模的文本数据中学习语言和知识,然后用于回答问题。利用大模型进行知识问答的优势在于它可以回答各种类型的问题,包括事实性问题、开放性问题和推理性问题。它还可以从大量文本中提取信息,因此可以回答广泛领域的问题。这种技术已经在教育、搜索引擎、客户支持、医疗保健等领域取得了广泛应用,为用户提供了便捷的信息获取途径。然而,它仍然面临挑战,在知识问答过程中容易出现回答错误的问题,回答准确性不高。
因此,目前亟需一种新的大模型问答方法。
发明内容
本发明实施例提供一种基于知识图谱与内生知识融合的大模型问答方法及系统,以至少部分解决相关技术中存在的问题。
本发明实施例第一方面提供了一种基于知识图谱与内生知识融合的大模型问答方法,所述方法包括:
对待回答问题进行实体抽取,得到一个或多个实体;
从知识图谱中,获取所有实体相关的三元组,作为大模型外部知识信息;
根据待回答问题进行大模型内生知识挖掘,得到大模型内与待回答问题相关的知识文档,作为大模型内部知识信息;
基于注意力机制对所述大模型外部知识信息和所述大模型内部知识信息进行融合,得到与所述待回答问题相关的融合知识,在融合过程中,利用大模型外部知识信息对大模型内部知识信息进行知识消歧;
通过大模型基于所述待回答问题结合所述融合知识,得到最终答案。
可选地,所述方法包括:
对待回答问题进行实体抽取,得到一个或多个实体;
从知识图谱中,获取所有实体相关的三元组,作为大模型外部知识信息;
根据待回答问题进行大模型内生知识挖掘,得到大模型内与待回答问题相关的知识文档,作为大模型内部知识信息;
基于注意力机制对所述大模型外部知识信息和所述大模型内部知识信息进行融合,得到与所述待回答问题相关的融合知识,在融合过程中,利用大模型外部知识信息对大模型内部知识信息进行知识消歧;
通过大模型基于所述待回答问题结合所述融合知识,得到最终答案。
可选地,所述系统还包括:实体抽取模块、外部知识挖掘模块、大模型内生知识挖掘模块和大模型总结分析模块;对待训练的注意力模块进行训练,包括:
通过实体抽取模块对样本问题进行实体抽取,得到一个或多个样本实体;
通过外部知识挖掘模块从知识图谱中,获取所有样本实体相关的三元组,作为样本大模型外部知识信息;
通过大模型内生知识挖掘模块根据样本问题进行大模型内生知识挖掘,得到大模型内与样本问题相关的样本知识文档,作为样本大模型内部知识信息;
通过注意力模块基于注意力机制对所述样本大模型外部知识信息和所述样本大模型内部知识信息进行融合,得到与所述待回答问题相关的样本融合知识;
大模型总结分析模块通过大模型基于所述样本问题结合所述样本融合知识,得到样本最终答案;
以最小化所述样本最终答案和样本答案之间的差异为目标,保持所述大模型内生知识挖掘模块和所述大模型总结分析模块的模型参数不变,对待训练的注意力模块进行训练,得到所述外部知识与内生知识融合模块。
可选地,基于注意力机制对所述大模型外部知识信息和所述大模型内部知识信息进行融合,得到与所述待回答问题相关的融合知识,包括:
在融合过程中,以所述大模型外部知识信息对所述大模型内部知识信息进行补充,在大模型外部知识信息与大模型内部知识信息存在分歧的情况下,将大模型外部知识信息作为融合知识。
可选地,所述实体抽取模块与外部知识挖掘模块相连接、所述外部知识挖掘模块与所述外部知识与内生知识融合模块相连接,所述外部知识挖掘模块基于以下表达式从知识图谱中,获取所有实体相关的三元组,作为大模型外部知识信息:
;
;
其中,表示实体,/> 表示实体相关的三元组中的关系,表示实体抽取模块,query表示待回答问题,/>表示从知识图谱中获取与实体相关的三元组信息。
可选地,所述大模型内生知识挖掘模块与所述的外部知识与内生知识融合模块相连,基于以下表达式,根据待回答问题进行大模型内生知识挖掘,得到大模型内与待回答问题相关的知识文档:
;
其中,表示大模型中存储的关于所述待回答问题query的文档信息,表示让大模型基于query生成相关知识文档。
可选地,所述外部知识与内生知识融合模块,与基于知识图谱的外部知识挖掘模块、外部知识与内生知识融合模块分别相连接,基于以下表达式对所述大模型外部知识信息和所述大模型内部知识信息进行融合:
;
其中表示融合结果,Attention表示外部知识与内生知识融合模块,根据所述待回答问题query、将从知识图谱中获取与实体相关的三元组信息与大模型中存储的关于待回答问题的文档信息相融合,得到融合知识。
本发明实施例第二方面提供了一种基于知识图谱与内生知识融合的大模型问答系统,实体抽取模块、外部知识挖掘模块、大模型内生知识挖掘模块、外部知识与内生知识融合模块,大模型总结分析模块,所述基于知识图谱与内生知识融合的大模型问答系统用于执行本发明第一方面所述的方法中的步骤。
本发明实施例第三方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本发明第一方面所述的方法中的步骤。
本发明实施例第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如本发明第一方面所述的方法中的步骤。
本发明实施例中,基于知识图谱获取待回答问题中的实体的相关知识,作为大模型外部知识,并获取大模型内与待回答问题相关的内部知识,将二者相融合后,得到关于待回答问题的答案。从而,本发明实施例中,一方面可以利用实时更新的大模型外部知识,一方面通过让大模型回想出模型内部的内生文本信息,可以从多个维度增强大模型知识问答的准确性;并且,本发明实施例中,针对不同领域的大模型知识问答任务,只需调整相对应的外部知识图谱,即可快速、高效地完成不同领域之间的大模型问答系统,具有比较高的可扩展性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例的基于知识图谱与内生知识融合的大模型问答方法的步骤流程图;
图2示出了本发明实施例提供的基于知识图谱与内生知识融合的大模型问答系统的结构示意图;
图3示出了本发明实施例提供的基于知识图谱与内生知识融合的大模型问答方法中得到大模型外部知识信息的流程示意图;
图4示出了本发明实施例提供的基于知识图谱与内生知识融合的大模型问答方法中得到大模型内部知识信息的流程示意图;
图5示出了本发明实施例中提供的基于知识图谱与内生知识融合的大模型问答方法中得到融合知识的流程示意图;
图6示出了本发明实施例中提供的基于知识图谱与内生知识融合的大模型问答方法中得到最终答案的流程示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明实施例的一种基于知识图谱与内生知识融合的大模型问答方法的步骤流程图,所述方法可以包括以下步骤:
S101,对待回答问题进行实体抽取,得到一个或多个实体。
S102,从知识图谱中,获取所有实体相关的三元组,作为大模型外部知识信息。
S103,根据待回答问题进行大模型内生知识挖掘,得到大模型内与待回答问题相关的知识文档,作为大模型内部知识信息。
S104,基于注意力机制对所述大模型外部知识信息和所述大模型内部知识信息进行融合,得到与所述待回答问题相关的融合知识,在融合过程中,利用大模型外部知识信息对大模型内部知识信息进行知识消歧。
S105,通过大模型基于所述待回答问题结合所述融合知识,得到最终答案。
知识图谱是一个用于表示、存储和推理知识的数据结构,它以图的形式表示真实世界中的实体和它们之间的关系。在知识图谱中,实体是指真实世界中的具体事物或抽象概念,可以是人、地点、事件、组织、产品等等。实体在知识图谱中由唯一的标识符表示,这样可以方便地在不同的知识图谱中进行交互和链接。
在知识图谱中,实体之间的关系被称为边,边表示实体之间的连接和关联。这些关系可以是层级关系、关联关系、相似关系等等。通过建立实体之间的关系,可以形成丰富的知识网络,使得知识图谱能够提供更加全面和深入的知识表示和推理能力。
本发明实施例中,在步骤S101中,可以采用相关技术中任意可行的方法进行实体识别,得到待回答问题query中包括的一个或多个实体。
本发明实施例中,确定待回答问题query中包括的实体之后,再将这些实体链接到知识图谱中,从知识图谱中获取到所有相关的三元组,其中,相关的三元组包括:所有头实体为这些实体的三元组和所有尾实体为这些实体的三元组。示例地,以输入问题:“从四川省出发,经过哪个省份,就可以到达内蒙古”为例,这个问句中的实体有四川省、内蒙古,然后在知识图谱中找到和实体相关的三元组,如:(四川,邻省,重庆)、(四川,邻省,甘肃)、(四川,邻省,青海)、(四川,邻省,云南)、(内蒙古,邻省,河北)、(内蒙古,邻省,吉林)、(内蒙古,邻省,甘肃)、(四川,邻省,山西)等这一系列知识图谱三元组都可以作为外部知识信息。
本发明实施例中,可以将待回答问题输入大模型,让大模型回想起与query相关的内容,本发明实施例中,大模型内生知识主要是指大模型训练语料中的相关知识。
示例地,还是以“从四川省出发,经过哪个省份,就可以到达内蒙古”为例,大模型可以根据输入的query回想出自身存储的知识,如大模型训练语料中的维基百科关于四川省的描述知识:“四川省(四川话拼音:Si3cuan1sen4;国际音标:[sɿ213tsʰuan55sən53]),简称川或蜀,是中华人民共和国西南地区一个省份,省会及最大城市是成都市。有“天府之国”之称。位于长江上游,由四川盆地和川西高原山地两大部分组成,全省人口绝大部分都聚居在四川盆地。”关于内蒙古的描述知识:“内蒙古位于中国北部边疆,范围横跨东北、华北、西北(三北),接邻七个省区:黑龙江、吉林、辽宁、山西、陕西、甘肃和宁夏,与陕西省同是中国邻省最多的省级行政区。内蒙古版图较为狭长,是中国跨经度最多的省级行政区,东西时差达2小时,南北也有不小的季节差距。接邻国家:蒙古国和俄罗斯。内蒙古有18个边境口岸,其中满洲里口岸是中国最大的陆路口岸,二连浩特是对蒙古国的最大边境口岸。主要城市:呼和浩特、包头、赤峰、通辽、乌海、呼伦贝尔、乌兰察布、鄂尔多斯、巴彦淖尔、满洲里、二连浩特、乌兰浩特、锡林浩特、巴彦浩特。”
本发明实施例中,可以将大模型内部存储的与待回答问题相关的内生知识,整理为知识文档,作为大模型内部知识信息。
在实际应用中,大模型由于“幻觉”问题可能会输出一些错误的叙述信息。具体的,大模型的“幻觉”问题是指在人工智能模型生成文本时,模型可能会产生虚假信息或不准确的结果,由于大语言模型是基于大量的训练数据进行学习的,在训练过程中,模型对输入数据的理解和处理方式,可能会造成信息的扭曲或误解。例如,在生成文本时,模型可能会误解某些词语的含义或上下文,导致生成的文本与实际事实不符或存在逻辑错误。
基于此,本发明实施例中,在步骤S104中,融合过程中,剔除掉与待回答问题相关性较小的内容,并且,借助大模型外部(来源于知识图谱)中准确无误的三元组信息纠正大模型输出的内部知识信息(知识文档)中的错误信息,将知识图谱的外部信息与大模型所描述的信息进行互相补充,得到更为完善的信息。
示例地,以上述内蒙古的相邻省份为例,在知识图谱三元组中,内蒙古的相邻省份有河北、甘肃、吉林、陕西,而在大模型所回想的描述文本中,有黑龙江、吉林、辽宁、山西、陕西、甘肃和宁夏,此时就可以将这两类知识融合,得到内蒙古相邻的八个省份。
本发明实施例中,在步骤S104中,进一步可以基于注意力机制得到外部知识与内部知识中关于待回答问题query相关的内容,作为融合知识,避免噪声信息影响大模型判断,最后在步骤S105中,大模型再根据融合知识根据query输出最终答案,作为待回答问题对应的答案。
本发明实施例中,基于知识图谱获取待回答问题中的实体的相关知识,作为大模型外部知识,并获取大模型内与待回答问题相关的内部知识,将二者相融合后,得到关于待回答问题的答案。从而,本发明实施例中,一方面可以利用实时更新的大模型外部知识,一方面通过让大模型回想出模型内部的内生文本信息,可以从多个维度增强大模型知识问答的准确性;并且,本发明实施例中,针对不同领域的大模型知识问答任务,只需调整相对应的外部知识图谱,即可快速、高效地完成不同领域之间的大模型问答系统,具有比较高的可扩展性。
本发明实施例中,还提供了另外一种基于知识图谱与内生知识融合的大模型问答方法,该方法应用于基于知识图谱与内生知识融合的大模型问答系统,所述系统至少包括:外部知识与内生知识融合模块,该方法可以结合上述实施例提供的方法,该方法还包括以下步骤:
S201,获取知识图谱中的已知三元组,将已知三元组中的任一实体隐藏,基于隐藏任一实体后的三元组构建样本问题;将该隐藏的实体作为样本答案。
S202,基于所述样本问题和样本答案,对待训练的注意力模块进行训练,得到所述外部知识与内生知识融合模块。
本发明实施例中,可以基于知识图谱中的已知三元组构建训练样本,对待训练的注意力模块进行训练,得到外部知识与内生知识融合模块。
本发明实施例中,针对不同领域的大模型知识问答任务,可以获取对应领域的知识图谱的已知三元组,并训练得到对应领域的外部知识与内生知识融合模块,从而该与知识领域相对应的外部知识与内生知识融合模块可以更加准确地处理相应领域的大模型知识问答任务。
本发明实施例中,也可以基于来自于不同领域的知识图谱的已知三元组构建训练样本,从而训练得到各个不同领域通用的外部知识与内生知识融合模块。
本发明实施例中,所述系统还包括:实体抽取模块、外部知识挖掘模块、大模型内生知识挖掘模块和大模型总结分析模块;上述步骤S202包括以下子步骤:
S2021,通过实体抽取模块对样本问题进行实体抽取,得到一个或多个样本实体。
S2022,通过外部知识挖掘模块从知识图谱中,获取所有样本实体相关的三元组,作为样本大模型外部知识信息。
S2023,通过大模型内生知识挖掘模块根据样本问题进行大模型内生知识挖掘,得到大模型内与样本问题相关的样本知识文档,作为样本大模型内部知识信息。
S2024,通过注意力模块基于注意力机制对所述样本大模型外部知识信息和所述样本大模型内部知识信息进行融合,得到与所述待回答问题相关的样本融合知识。
S2025,大模型总结分析模块通过大模型基于所述样本问题结合所述样本融合知识,得到样本最终答案。
S2026,以最小化所述样本最终答案和样本答案之间的差异为目标,保持所述大模型内生知识挖掘模块和所述大模型总结分析模块的模型参数不变,对待训练的注意力模块进行训练,得到所述外部知识与内生知识融合模块。
本发明实施例中,所述基于知识图谱与内生知识融合的大模型问答系统包括:实体抽取模块、外部知识挖掘模块、大模型内生知识挖掘模块、外部知识与内生知识融合模块和大模型总结分析模块。
其中,实体抽取模块用于对待回答问题进行实体抽取,得到一个或多个实体;外部知识挖掘模块用于从知识图谱中,获取所有实体相关的三元组,作为大模型外部知识信息;大模型内生知识挖掘模块用于根据待回答问题进行大模型内生知识挖掘,得到大模型内与待回答问题相关的知识文档,作为大模型内部知识信息;外部知识与内生知识融合模块用于基于注意力机制对所述大模型外部知识信息和所述大模型内部知识信息进行融合,得到与所述待回答问题相关的融合知识,在融合过程中,利用大模型外部知识信息对大模型内部知识信息进行知识消歧;大模型总结分析模块用于通过大模型基于所述待回答问题结合所述融合知识,得到最终答案。
本发明实施例中,所述外部知识与内生知识融合模块可以基于整个系统训练得到,其中,实体抽取模块和外部知识挖掘模块可以采用任意可行的实体抽取方法和知识图谱链接方法实现,不受训练过程影响。在训练过程中,保持大模型内生知识挖掘模块和大模型总结分析模块的模型参数不变,对待训练的注意力模块进行训练,得到外部知识与内生知识融合模块。
为了便于理解,结合图2、图3、图4、图5、图6对本发明实施例提供的基于知识图谱与内生知识融合的大模型问答方法进行解释,其中,图2示出了本发明实施例提供的基于知识图谱与内生知识融合的大模型问答系统的结构示意图;图3示出了本发明实施例提供的基于知识图谱与内生知识融合的大模型问答方法中得到大模型外部知识信息的流程示意图;图4示出了本发明实施例提供的基于知识图谱与内生知识融合的大模型问答方法中得到大模型内部知识信息的流程示意图;图5示出了本发明实施例中提供的基于知识图谱与内生知识融合的大模型问答方法中得到融合知识的流程示意图;图6示出了本发明实施例中提供的基于知识图谱与内生知识融合的大模型问答方法中得到最终答案的流程示意图。
如图2所示,本发明实施例中,上述实体抽取模块与外部知识挖掘模块相连接、所述外部知识挖掘模块与所述外部知识与内生知识融合模块相连接,所述外部知识挖掘模块基于以下表达式从知识图谱中,获取所有实体相关的三元组,作为大模型外部知识信息:
;
;
其中,表示实体,/> 表示实体相关的三元组中的关系,表示实体抽取模块,query表示待回答问题,/>表示从知识图谱中获取与实体相关的三元组信息。
具体的,如图3所示,可以将待回答问题输入实体抽取模块,由实体抽取模块,从待回答问题中抽取出若干个实体,再将抽取出的所有实体输入外部知识挖掘模块,由外部知识挖掘将所有的实体链接到知识图谱,从知识图谱中获取与这些实体相关的三元组信息,作为大模型外部知识信息。
如图2所示,本发明实施例中所述大模型内生知识挖掘模块与所述的外部知识与内生知识融合模块相连,基于以下表达式,根据待回答问题进行大模型内生知识挖掘,得到大模型内与待回答问题相关的知识文档:
;
其中,表示大模型中存储的关于所述待回答问题query的文档信息,表示让大模型基于query生成相关知识文档。
具体的,如图4所示,可以将待回答问题输入大模型内生知识挖掘模块,由大模型内生知识挖掘模块基于大模型原生的问答、推理能力,进行大模型内生知识挖掘,获取大模型内与待回答问题相关的内生知识1、内生知识2……内生知识n,进而得到相关知识文档,作为大模型内部知识信息。
具体的,如图2所示,所述外部知识与内生知识融合模块,与基于知识图谱的外部知识挖掘模块、外部知识与内生知识融合模块分别相连接,基于以下表达式对所述大模型外部知识信息和所述大模型内部知识信息进行融合:
;
其中表示融合结果,Attention表示外部知识与内生知识融合模块,根据所述待回答问题query、将从知识图谱中获取与实体相关的三元组信息与大模型中存储的关于待回答问题的文档信息相融合,得到融合知识。
具体的,本发明实施例中,在融合过程中,以所述大模型外部知识信息对所述大模型内部知识信息进行补充,在大模型外部知识信息与大模型内部知识信息存在分歧的情况下,将大模型外部知识信息作为融合知识。
如图5所示,可以基于大模型外部知识信息与大模型内部知识信息进行知识消歧,具体为:在大模型外部知识信息与大模型内部知识信息存在分歧的情况下,以大模型外部知识信息为准,再以所述大模型外部知识信息对所述大模型内部知识信息进行补充完成知识融合,得到融合知识。
具体的,如图2所示,所述外部知识与内生知识融合模块与大模型总结分析模块相连接,所述大模型总结分析过程中,如图6所示,可以由大模型基于所述待回答问题结合所述融合知识,得到最终答案。
基于同一发明构思,本发明实施例还提供了一种基于知识图谱与内生知识融合的大模型问答系统,所述基于知识图谱与内生知识融合的大模型问答系统包括:实体抽取模块、外部知识挖掘模块、大模型内生知识挖掘模块、外部知识与内生知识融合模块,大模型总结分析模块,所述基于知识图谱与内生知识融合的大模型问答系统用于执行上述任一实施例所述的方法中的步骤。
基于同一发明构思,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例所述的方法中的步骤。
基于同一发明构思,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一实施例所述的方法中的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程终端设备的处理器以产生一个机器,使得通过计算机或其他可编程终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种基于知识图谱与内生知识融合的大模型问答方法及系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (9)
1.一种基于知识图谱与内生知识融合的大模型问答方法,其特征在于,所述方法包括:
对待回答问题进行实体抽取,得到一个或多个实体;
从知识图谱中,获取所有所述待回答问题包括的实体相关的三元组,作为大模型外部知识信息;
根据待回答问题进行大模型内生知识挖掘,得到大模型内与待回答问题相关的知识文档,作为大模型内部知识信息;
基于注意力机制对所述大模型外部知识信息和所述大模型内部知识信息进行融合,得到与所述待回答问题相关的融合知识,在融合过程中,利用大模型外部知识信息对大模型内部知识信息进行知识消歧,以所述大模型外部知识信息对所述大模型内部知识信息进行补充,在大模型外部知识信息与大模型内部知识信息存在分歧的情况下,将大模型外部知识信息作为融合知识;
通过大模型基于所述待回答问题结合所述融合知识,得到最终答案。
2.根据权利要求1所述的基于知识图谱与内生知识融合的大模型问答方法,其特征在于,所述方法应用于基于知识图谱与内生知识融合的大模型问答系统,所述系统至少包括:外部知识与内生知识融合模块,所述方法还包括:
获取知识图谱中的已知三元组,将已知三元组中的任一实体隐藏,基于隐藏任一实体后的三元组构建样本问题;将该隐藏的实体作为样本答案;
基于所述样本问题和样本答案,对待训练的注意力模块进行训练,得到所述外部知识与内生知识融合模块。
3.根据权利要求2所述的基于知识图谱与内生知识融合的大模型问答方法,其特征在于,所述系统还包括:实体抽取模块、外部知识挖掘模块、大模型内生知识挖掘模块和大模型总结分析模块;对待训练的注意力模块进行训练,包括:
通过实体抽取模块对样本问题进行实体抽取,得到一个或多个样本实体;
通过外部知识挖掘模块从知识图谱中,获取所有样本实体相关的三元组,作为样本大模型外部知识信息;
通过大模型内生知识挖掘模块根据样本问题进行大模型内生知识挖掘,得到大模型内与样本问题相关的样本知识文档,作为样本大模型内部知识信息;
通过注意力模块基于注意力机制对所述样本大模型外部知识信息和所述样本大模型内部知识信息进行融合,得到与所述待回答问题相关的样本融合知识;
大模型总结分析模块通过大模型基于所述样本问题结合所述样本融合知识,得到样本最终答案;
以最小化所述样本最终答案和样本答案之间的差异为目标,保持所述大模型内生知识挖掘模块和所述大模型总结分析模块的模型参数不变,对待训练的注意力模块进行训练,得到所述外部知识与内生知识融合模块。
4.根据权利要求3所述的基于知识图谱与内生知识融合的大模型问答方法,其特征在于,所述实体抽取模块与外部知识挖掘模块相连接、所述外部知识挖掘模块与所述外部知识与内生知识融合模块相连接,所述外部知识挖掘模块基于以下表达式从知识图谱中,获取所有实体相关的三元组,作为大模型外部知识信息:
;
;
其中,表示实体,/> 表示实体相关的三元组中的关系,表示实体抽取模块,query表示待回答问题,/>表示从知识图谱中获取与实体相关的三元组信息。
5.根据权利要求4所述的基于知识图谱与内生知识融合的大模型问答方法,其特征在于,所述大模型内生知识挖掘模块与所述的外部知识与内生知识融合模块相连,基于以下表达式,根据待回答问题进行大模型内生知识挖掘,得到大模型内与待回答问题相关的知识文档:
;
其中,表示大模型中存储的关于所述待回答问题query的文档信息,表示让大模型基于query生成相关知识文档。
6.根据权利要求5所述的基于知识图谱与内生知识融合的大模型问答方法,其特征在于,所述外部知识与内生知识融合模块,与基于知识图谱的外部知识挖掘模块、外部知识与内生知识融合模块分别相连接,基于以下表达式对所述大模型外部知识信息和所述大模型内部知识信息进行融合:
;
其中表示融合结果,Attention表示外部知识与内生知识融合模块,根据所述待回答问题query、将从知识图谱中获取与实体相关的三元组信息与大模型中存储的关于待回答问题的文档信息相融合,得到融合知识。
7.一种基于知识图谱与内生知识融合的大模型问答系统,其特征在于,所述基于知识图谱与内生知识融合的大模型问答系统包括:实体抽取模块和外部知识挖掘模块、大模型内生知识挖掘模块、外部知识与内生知识融合模块、大模型总结分析模块,所述基于知识图谱与内生知识融合的大模型问答系统用于执行上述权利要求1-6任一项所述的基于知识图谱与内生知识融合的大模型问答方法。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-6任一项所述的基于知识图谱与内生知识融合的大模型问答方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-6任一项所述的基于知识图谱与内生知识融合的大模型问答方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410063983.7A CN117573850B (zh) | 2024-01-17 | 2024-01-17 | 基于知识图谱与内生知识融合的大模型问答方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410063983.7A CN117573850B (zh) | 2024-01-17 | 2024-01-17 | 基于知识图谱与内生知识融合的大模型问答方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117573850A CN117573850A (zh) | 2024-02-20 |
CN117573850B true CN117573850B (zh) | 2024-04-05 |
Family
ID=89895913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410063983.7A Active CN117573850B (zh) | 2024-01-17 | 2024-01-17 | 基于知识图谱与内生知识融合的大模型问答方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117573850B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114896377A (zh) * | 2022-04-07 | 2022-08-12 | 东南大学 | 一种基于知识图谱的答案获取方法 |
CN117332852A (zh) * | 2023-09-14 | 2024-01-02 | 浙江创邻科技有限公司 | 基于知识图谱的大模型训练部署方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220261668A1 (en) * | 2021-02-12 | 2022-08-18 | Tempus Labs, Inc. | Artificial intelligence engine for directed hypothesis generation and ranking |
-
2024
- 2024-01-17 CN CN202410063983.7A patent/CN117573850B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114896377A (zh) * | 2022-04-07 | 2022-08-12 | 东南大学 | 一种基于知识图谱的答案获取方法 |
CN117332852A (zh) * | 2023-09-14 | 2024-01-02 | 浙江创邻科技有限公司 | 基于知识图谱的大模型训练部署方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117573850A (zh) | 2024-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wen et al. | On the representation and embedding of knowledge bases beyond binary relations | |
CN110442718B (zh) | 语句处理方法、装置及服务器和存储介质 | |
Michaelsen | The limits of multiculturalism: Interrogating the origins of American anthropology | |
CN107423437B (zh) | 一种基于对抗网络强化学习的问答模型优化方法 | |
KR102259390B1 (ko) | 앙상블 질의 응답을 위한 시스템 및 방법 | |
CN110427478B (zh) | 一种基于知识图谱的问答搜索方法及系统 | |
CN107832439B (zh) | 多轮状态追踪的方法、系统及终端设备 | |
Chen et al. | An automatic knowledge graph construction system for K-12 education | |
CN110096567A (zh) | 基于qa知识库推理的多轮对话回复选择方法、系统 | |
CN109325040A (zh) | 一种faq问答库泛化方法、装置及设备 | |
CN110427629A (zh) | 半监督文本简化模型训练方法和系统 | |
CN113221530A (zh) | 一种基于circle loss的文本相似度匹配方法、装置、计算机设备和储存介质 | |
CN117370580A (zh) | 一种基于知识图谱增强大语言模型双碳领域服务方法 | |
Zhang et al. | Contextual similarity is more valuable than character similarity: An empirical study for chinese spell checking | |
CN117573850B (zh) | 基于知识图谱与内生知识融合的大模型问答方法及系统 | |
Tran et al. | Explain by evidence: An explainable memory-based neural network for question answering | |
Huang et al. | An effective method for constructing knowledge graph of online course | |
Murugathas et al. | Domain specific question & answer generation in tamil | |
CN109948156A (zh) | 一种融合构件和字信息的藏文词向量表示方法 | |
Kazi et al. | Uquad1. 0: development of an urdu question answering training data for machine reading comprehension | |
CN116266268A (zh) | 基于对比学习与语义感知的语义解析方法及装置 | |
Deng et al. | Practical Thinking of Neo-Confucianism in Qing Dynasty from the Scope of Practice Based on Deep Learning | |
CN117251555B (zh) | 一种语言生成模型训练方法和装置 | |
CN114880443B (zh) | 问题生成方法、装置、计算机设备和存储介质 | |
Zhao et al. | Chinese verb-object collocation knowledge graph construction and application |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |