CN117725188A - 基于人工智能的问答方法、装置、电子设备及存储介质 - Google Patents
基于人工智能的问答方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117725188A CN117725188A CN202410177461.XA CN202410177461A CN117725188A CN 117725188 A CN117725188 A CN 117725188A CN 202410177461 A CN202410177461 A CN 202410177461A CN 117725188 A CN117725188 A CN 117725188A
- Authority
- CN
- China
- Prior art keywords
- question
- answered
- entity
- determining
- answer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 30
- 238000004590 computer program Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 description 11
- 238000013135 deep learning Methods 0.000 description 6
- 238000002372 labelling Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 235000008694 Humulus lupulus Nutrition 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供了一种基于人工智能的问答方法、装置、电子设备及存储介质,涉及人工智能技术领域。该方法包括:获取待处理的知识图谱和待答复问题;通过第一大模型基于待答复问题,确定待答复问题对应的问题特征;确定知识图谱中与待答复问题中的问题实体匹配的目标标准实体,并基于目标标准实体,确定待答复问题对应的多个候选答案路径;通过第二大模型基于问题特征、待答复问题,以及多个候选答案路径,确定待答复问题对应的答案。本申请实施例通过结合知识图谱和大模型,提高了输出的答案的准确性;可以适用于不同的应用场景,提高了方法的通用性。
Description
技术领域
本申请涉及人工智能技术领域,具体而言,本申请涉及一种基于人工智能的问答方法、装置、电子设备及存储介质。
背景技术
大模型通过对大量语言数据的训练,学会了如何理解、生成和翻译人类语言,它可以自动生成文章、回答问题、进行对话等。问答场景是大模型的重要应用场景之一,大模型可以被用于构建智能问答系统,例如智能客服系统,以提供更加便捷和有效的服务。
在目前的相关技术中,一般是直接将用户的会话(待答复的问题)输入一个大模型,由大模型输出答案。大模型在训练过程中会吸收大量语言数据,以学习语言的语法、语义等,但是由于训练数据的影响,大模型往往也会学习到一些错误、偏见或不准确的信息,从而导致大模型输出的答案并不准确,即大模型的幻觉问题。
发明内容
本申请实施例提供了一种基于人工智能的问答方法、装置、电子设备及存储介质,可以解决现有技术中大模型的幻觉问题。
所述技术方案如下:
根据本申请实施例的一个方面,提供了一种基于人工智能的问答方法,该方法包括:
获取待处理的知识图谱和待答复问题;
通过第一大模型基于所述待答复问题,确定所述待答复问题对应的问题特征;所述问题特征用于表征所述待答复问题对应的知识图谱三元组;
确定所述知识图谱中与所述待答复问题中的问题实体匹配的目标标准实体,并基于所述目标标准实体,确定所述待答复问题对应的多个候选答案路径;
通过第二大模型基于所述问题特征、所述待答复问题,以及所述多个候选答案路径,确定所述待答复问题对应的答案。
可选地,所述通过第二大模型基于所述问题特征、所述待答复问题,以及所述多个候选答案路径,确定所述待答复问题对应的答案,包括:
将所述问题特征、所述待答复问题,以及所述多个候选答案路径输入至所述第二大模型,通过所述第二大模型对多个所述候选答案路径进行筛选,得到针对所述待答复问题的目标答案路径;
基于所述目标答案路径和所述知识图谱,确定所述待答复问题对应的答案。
可选地,所述基于所述目标答案路径和所述知识图谱,确定所述待答复问题对应的答案,包括:
基于所述目标答案路径和所述知识图谱,确定所述目标答案路径对应的目标图谱答案;
将所述目标图谱答案和所述待答复问题输入至第三大模型,通过所述第三大模型对所述目标图谱答案进行优化,得到所述待答复问题对应的答案。
可选地,所述方法还包括:
确定预设领域对应的所述知识图谱;
所述确定所述知识图谱中与所述待答复问题中的问题实体匹配的目标标准实体,包括:
基于所述预设领域对应的领域词典,确定所述知识图谱中与所述待答复问题中的问题实体匹配的目标标准实体。
可选地,所述领域词典是基于如下方式构建的:
基于所述知识图谱中的多个标准实体分别对应的多个标准名称,确定所述领域词典中的多个主词;
针对每个主词,确定所述主词对应的至少一个辅词;所述辅词为与所述主词语义相同的词语;
基于各个主词以及各个主词分别对应的至少一个辅词,构建所述领域词典。
可选地,所述基于预设的领域词典,确定所述知识图谱中与所述待答复问题中的问题实体匹配的目标标准实体,包括:
若所述问题实体的名称为所述领域词典中的任一主词,则将所述知识图谱中与所述问题实体的名称相同的标准实体作为所述目标标准实体;
若所述问题实体的名称为所述领域词典中的任一辅词,则确定所述问题实体对应的第一主词,并将所述知识图谱中与所述第一主词对应的标准实体作为所述目标标准实体;
若所述领域词典不包括所述问题实体的名称,则基于所述问题实体分别与所述知识图谱中各个标准实体之间的语义相似度,确定与所述问题实体匹配的目标标准实体。
可选地,所述基于所述目标标准实体,确定所述待答复问题对应的多个候选答案路径,包括:
确定所述知识图谱对应的至少一个预设路径模板;
以所述目标标准实体为中心,根据所述至少一个预设路径模板,从所述知识图谱中生成多个候选答案路径。
根据本申请实施例的另一个方面,提供了一种基于人工智能的问答装置,该装置包括:
数据获取模块,用于获取待处理的知识图谱和待答复问题;
特征提取模块,用于通过第一大模型基于所述待答复问题,确定所述待答复问题对应的问题特征;所述问题特征用于表征所述待答复问题对应的知识图谱三元组;
候选答案路径确定模块,用于确定所述知识图谱中与所述待答复问题中的问题实体匹配的目标标准实体,并基于所述目标标准实体,确定所述待答复问题对应的多个候选答案路径;
答案生成模块,用于通过第二大模型基于所述问题特征、所述待答复问题,以及所述多个候选答案路径,确定所述待答复问题对应的答案。
根据本申请实施例的另一个方面,提供了一种电子设备,该电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述任一种基于人工智能的问答方法的步骤。
根据本申请实施例的再一个方面,提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种基于人工智能的问答方法的步骤。
本申请实施例提供的技术方案带来的有益效果是:
通过从知识图谱中确定待答复问题对应的多个候选答案路径,并通过大模型从多个候选答案路径中确定待答复问题对应的答案,通过结合知识图谱和大模型,在知识图谱包括的准确的信息的基础上,利用了大模型的语义理解能力确定问题的答案,提高了输出的答案的准确性。同时,通过将待答复问题的问题特征输入至大模型,使得大模型能够利用待答复问题的语义信息和结构化信息等多个维度的信息来回答问题,进一步提高了输出的答案的准确性。
进一步地,本申请实施例中利用大模型对待答复问题进行问题特征提取,相较于现有的基于深度学习的知识图谱的问答方法,无需对模型进行额外的训练,避免了在特定的应用场景中,因缺乏标注数据或者标注数据较少导致模型的抽取准确性较低的问题,保证了提取的问题特征的准确性,有利于提高后续问答的准确性;而且可以适用于不同的应用场景,提高了方法的通用性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种基于人工智能的问答方法的流程示意图;
图2为本申请实施例提供的一种候选路径答案生成过程的示意图;
图3为本申请实施例提供的另一种基于人工智能的问答方法的流程示意图;
图4为本申请实施例提供的一种基于人工智能的问答装置的结构示意图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面结合本申请中的附图描述本申请的实施例。应理解,下面结合附图所阐述的实施方式,是用于解释本申请实施例的技术方案的示例性描述,对本申请实施例的技术方案不构成限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式 “一”、“一个”和“该”也可包括复数形式。应该进一步理解的是,本申请实施例所使用的术语“包括”以及“包含”是指相应特征可以实现为所呈现的特征、信息、数据、步骤、操作、元件和/或组件,但不排除实现为本技术领域所支持其他特征、信息、数据、步骤、操作、元件、组件和/或它们的组合等。应该理解,当我们称一个元件被“连接”或“耦接”到另一元件时,该一个元件可以直接连接或耦接到另一元件,也可以指该一个元件和另一元件通过中间元件建立连接关系。此外,这里使用的“连接”或 “耦接”可以包括无线连接或无线耦接。这里使用的术语“和/或”指示该术语所限定的项目中的至少一个,例如“A和/或B”可以实现为“A”,或者实现为“B”,或者实现为“A和B”。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
随着人工智能技术的快速发展,人机交互的现实应用日益广泛,问答场景是人机交互中的一个重要组成部分。目前,常见的问答方法包括基于知识图谱的问答方法和基于大模型的问答方法。
基于知识图谱的问答(Knowledge Base Question Answering,KBQA)方法作为人机交互的重要支撑,成为工业界与学术界共同关注的研究热点之一。相较于基于非结构化文本数据的问答(如文档检索、阅读理解等),知识图谱问答能借助知识图谱中精度高、关联性强的结构化知识,为给定的复杂事实型问句提供精确的语义理解或解析,并在知识图谱中查询推理来得到准确、简短的答案。
基于知识图谱的问答方法包括基于语义解析的方法、基于信息检索的方法和基于深度学习的方法。基于语义解析的方法可解释性更强,但这种方法需要标注大量的自然语言逻辑表达式;基于信息检索的方法更偏向端到端的方案,在复杂问题、少样本情况下表现更好,但若子图过大,会显著降低计算的速度;基于深度学习的方法需要在训练数据较为充分的情况下进行模型训练,当缺乏标注数据时,模型抽取效果受限,信息抽取不精准导致问答准确率较低。
基于大模型的问答方法通常是直接将用户的会话(待答复的问题)输入一个大模型,由大模型输出答案。大模型在训练过程中会吸收大量语言数据,以学习语言的语法、语义等,但是由于训练数据的影响,大模型往往也会学习到一些错误、偏见或不准确的信息,从而导致大模型输出的答案并不准确,即大模型的幻觉问题。
本申请提供的基于人工智能的问答方法、装置、电子设备及存储介质,旨在解决现有技术的如上技术问题。
下面通过对几个示例性实施方式的描述,对本申请实施例的技术方案以及本申请的技术方案产生的技术效果进行说明。需要指出的是,下述实施方式之间可以相互参考、借鉴或结合,对于不同实施方式中相同的术语、相似的特征以及相似的实施步骤等,不再重复描述。
图1为本申请实施例提供的一种基于人工智能的问答方法的流程示意图,如图1所示,该方法包括:
步骤S110,获取待处理的知识图谱和待答复问题。
具体地,本申请实施例提供的基于人工智能的问答方法可以应用于不同的应用场景,例如运营商资费查询、旅游信息查询等,针对特定的应用场景,可以基于与该应用场景相关的信息,构建对应的知识图谱,作为待处理的知识图谱。
待答复问题可以为问答场景中用户输入的会话信息,其中,待答复问题可以是文本形式的内容,例如,用户输入的至少一句话。在实际实施时,用户可以通过输入文本或非文本形式的内容提出问题,如果用户输入的信息为非文本形式,可以将非文本形式的输入转换为文本形式的内容。例如,在人机交互界面可以为用户提供语音输入选项,用户可以通过该选项输入语音形式的问题。再比如,用户输入的内容可以是多模态的内容,例如,用户的输入包括文本和图片,此时可以通过对图片的语义内容进行识别,基于用户输入的文本和图片的识别结果(如图片的文本描述)得到待答复问题,本申请实施例对待答复问题的获取方式不作限定。
步骤S120,通过第一大模型基于待答复问题,确定待答复问题对应的问题特征;问题特征用于表征待答复问题对应的知识图谱三元组。
具体地,在得到待答复问题之后,可以将待答复问题输入至第一大模型,通过第一大模型对待答复问题进行语义识别,得到待答复问题对应的问题特征,其中,问题特征可以用于表征待答复问题对应的知识图谱三元组,即待答复问题中实体、关系和属性分别对应的词语。
其中,第一大模型可以为任意类型的生成式语言模型,例如chatGPT(一种大语言模型)、chatGLM(一种大语言模型)等,本申请实施例对第一大模型的具体模型结构不作限制。大模型可以具备多种功能,可以通过输入不同的提示文本(prompt)来指示大模型具体执行何种功能。
可选地,可以将待答复问题和问题特征提取提示文本输入至第一大模型,通过问题特征提取提示文本指示第一大模型对待答复问题中的知识图谱三元组对应的特征词进行提取。
例如,待答复问题为“A的老婆的身高是多少?”,问题特征提取提示文本为“输出该问题中的实体、关系和属性分别对应的词语”,第一大模型通过对待答复问题进行语义识别,输出的结果为“该问题中A为实体,老婆为关系,身高为属性”,进而得到问题特征为“A-实体;老婆-关系;身高-属性”。
步骤S130,确定知识图谱中与待答复问题中的问题实体匹配的目标标准实体,并基于目标标准实体,确定待答复问题对应的多个候选答案路径。
具体地,可以将待答复问题包括的实体作为问题实体,其中,问题实体可以是对待答复问题进行命名实体识别得到的。命名实体识别(Named Entity Recognition,NER),是指识别文本中实体的边界和类别。命名实体识别是文本处理中的基础技术,广泛应用在自然语言处理、推荐系统、知识图谱等领域。命名实体一般有两种划分:3大类(实体类、时间类、数字类)和7小类(人名、地名、组织机构名、时间、日期、货币量、百分数)。
知识图谱可以包括多个实体,将知识图谱中的实体作为标准实体。在得到待答复问题中的问题实体之后,可以将问题实体与知识图谱包括的多个标准实体进行匹配,得到与问题实体匹配的目标标准实体,并根据目标标准实体,从知识图谱中抽取出与目标标准实体相关的多个子图,作为待答复问题对应的多个候选答案路径。
步骤S140,通过第二大模型基于问题特征、待答复问题,以及多个候选答案路径,确定待答复问题对应的答案。
具体地,在得到问题特征、待答复问题以及多个候选答案路径之后,可以将问题特征、待答复问题以及多个候选答案路径输入至第二大模型,通过第二大模型基于问题特征、待答复问题以及多个候选答案路径分别对应的语义信息,从多个候选答案路径中确定出待答复问题对应的答案。
其中,第二大模型可以是任意类型的生成式语言模型,第二大模型可以是与第一大模型相同的模型,也可以是与第一大模型不同的模型,本申请实施例对此不作限制。
本申请实施例中,通过从知识图谱中确定待答复问题对应的多个候选答案路径,并通过大模型从多个候选答案路径中确定待答复问题对应的答案,通过结合知识图谱和大模型,在知识图谱包括的准确的信息的基础上,利用了大模型的语义理解能力确定问题的答案,提高了输出的答案的准确性。同时,通过将待答复问题的问题特征输入至大模型,使得大模型能够利用待答复问题的语义信息和结构化信息等多个维度的信息来回答问题,进一步提高了输出的答案的准确性。
进一步地,本申请实施例中利用大模型对待答复问题进行问题特征提取,相较于现有的基于深度学习的知识图谱的问答方法,无需对模型进行额外的训练,避免了在特定的应用场景中,因缺乏标注数据或者标注数据较少导致模型的抽取准确性较低的问题,保证了提取的问题特征的准确性,有利于提高后续问答的准确性;而且可以适用于不同的应用场景,提高了方法的通用性。
作为一种可选实施例,通过第二大模型基于问题特征、待答复问题,以及多个候选答案路径,确定待答复问题对应的答案,包括:
将问题特征、待答复问题,以及多个候选答案路径输入至第二大模型,通过第二大模型对多个候选答案路径进行筛选,得到针对待答复问题的目标答案路径;
基于目标答案路径和知识图谱,确定待答复问题对应的答案。
具体地,在得到问题特征、待答复问题以及多个候选答案路径之后,可以将问题特征、待答复问题以及多个候选答案路径输入至第二大模型,通过答案筛选提示文本(例如“根据上述输入信息从这些候选答案路径中选出最符合上述问题的答案路径”)指示第二大模型基于问题特征和待答复问题对多个候选答案路径进行筛选,将与待答复问题匹配度最高的候选答案路径,作为待答复问题对应的目标答案路径。
在得到目标答案路径之后,可以按照目标答案路径在知识图谱中进行搜索,从而得到待答复问题对应的答案。
本申请实施例中,通过第二大模型基于问题特征和待答复问题对多个候选答案路径进行筛选,得到目标答案路径,并结合目标答案路径和知识图谱,得到待答复问题的答案,知识图谱通常包括具体应用场景对应领域的大量准确的知识,从而保证了基于知识图谱输出的答案的准确性,避免了大模型输出的答案不符合事实的幻觉问题。
作为一种可选实施例,基于目标答案路径和知识图谱,确定待答复问题对应的答案,包括:
基于目标答案路径和知识图谱,确定目标答案路径对应的目标图谱答案;
将目标图谱答案和待答复问题输入至第三大模型,通过第三大模型对目标图谱答案进行优化,得到待答复问题对应的答案。
具体地,在得到目标答案路径之后,可以结合知识图谱,得到目标答案路径对应的目标图谱答案,并将目标图谱答案和待答复问题输入至第三大模型,通过文本优化提示文本(例如“将该问题的答案调整为表达更流畅的形式,且不改变答案的语义信息”)指示第三大模型对目标图谱答案进行优化,进而得到待答复问题对应的答案。
其中,第三大模型可以为任意类型的生成式语言模型,第三大模型可以与第一大模型和第二大模型均不相同,也可以与第一大模型和第二大模型中的至少一种相同,本申请实施例对此不作具体限定。
本申请实施例中,通过大模型对目标图谱答案进行文本优化,得到待答复问题对应的答案,使得输出的答案表达得更自然流畅,更符合用户的表达习惯,提高了输出的答案的可读性,提高了用户的体验。
作为一种可选实施例,该方法还包括:
确定预设领域对应的知识图谱;
确定知识图谱中与待答复问题中的问题实体匹配的目标标准实体,包括:
基于预设领域对应的领域词典,确定知识图谱中与待答复问题中的问题实体匹配的目标标准实体。
具体地,对于预设领域(例如医疗、金融等)的问答场景,可以通过收集预设领域的大量专业知识,并通过对大量的专业知识进行结构化,得到预设领域对应的知识图谱。
可选地,针对预设领域中不同的应用场景,还可以针对不同的应用场景分别构建对应的知识图谱,例如,在医疗领域,针对医院导诊的应用场景,可以构建医院导诊对应的知识图谱;针对医学文献查询的应用场景,可以构建医学文献查询对应的知识图谱,知识图谱可以根据实际的应用需求进行具体设置。
在此基础上,还可以获取预设领域的领域词典,领域词典可以为某个特定领域中使用的词汇表,预设领域的领域词典可以包括预设领域中常见的术语、专业名词、缩略语和其他相关的词语。
可选地,预设领域的领域词典可以为预设领域中一个通用的领域词典;也可以是根据已经构建的知识图谱对应生成的,本申请实施例对此不作限定。
可以基于预设领域的领域词典对待答复问题进行命名实体识别,得到待答复问题中的问题实体,进而确定知识图谱中与问题实体匹配的目标标准实体。
本申请实施例中,基于与知识图谱在同一领域的领域词典对待答复问题中问题实体进行命名实体识别,只需要在领域词典中进行查找和匹配即可完成实体识别,计算量更小、处理速度更快,能够快速准确地识别出实体,提高了实体识别的效率,进而缩短了生成答案的时间,即缩短了问答系统的响应时间,提高了用户体验。
作为一种可选实施例,领域词典是基于如下方式构建的:
基于所述知识图谱中的多个标准实体分别对应的多个标准名称,确定所述领域词典中的多个主词;
针对每个主词,确定所述主词对应的至少一个辅词;所述辅词为与所述主词语义相同的词语;
基于各个主词以及各个主词分别对应的至少一个辅词,构建所述领域词典。
具体地,在构建得到知识图谱之后,还可以根据知识图谱,构建对应的领域词典。
可以获取知识图谱中多个标准实体分别对应的多个标准名称,作为领域词典中的多个主词;针对每个主词,可以确定与该主词对应的至少一个辅词,辅词可以为对应主词在语义上相同的词语,例如辅词可以为主词的同义词、缩略语、简称等;将各个主词以及各个主词分别对应的至少一个辅词,构建领域词典。
例如,知识图谱中包括一个标准实体的标准名称为“A弹性云主机”,则可以将“A弹性云主机”作为一个主词,将同义词“弹性云主机”、“云主机”作为该主词对应的两个辅词,从而使得待答复问题中不同表述的同一实体都可以与知识图谱中相同的标准实体进行匹配。
可选地,还可以针对知识图谱中多个关系或多个属性,构建对应的关系词库或属性词库,例如,将知识图谱中的一个关系的名称作为标准关系名称,将与该关系的名称语义相同的词语,例如同义词,作为与该标准关系名称相关的词语,从而构建得到关系词库。可以基于关系词库对待答复问题中的表示关系的词语替换为知识图谱中对应的标准关系名称,以供后续能够更好地与知识图谱进行匹配,同时能够处理不同类型的问题,提高问答系统的对不同问题的泛化能力。
例如,知识图谱中关系的标准名称为“配偶”,针对待答复问题“A的老婆的身高是多少?”中表示关系的词语为“老婆”,根据构建得到的关系词库中确定“老婆”与“配偶”是同义词,就可以将待答复问题中的“老婆”替换为“配偶”,从而能够快速准确地选出对应的答案路径。
可选地,还可以针对复杂的待答复问题,构建对应的关键词词典,例如,为比较类问题,构建对应的比较词(例如“更”)词典。
作为一种可选实施例,基于预设的领域词典,确定知识图谱中与待答复问题中的问题实体匹配的目标标准实体,包括:
若问题实体的名称为领域词典中的任一主词,则将知识图谱中与问题实体的名称相同的标准实体作为目标标准实体;
若问题实体的名称为领域词典中的任一辅词,则确定问题实体对应的第一主词,并将知识图谱中与第一主词对应的标准实体作为目标标准实体;
若领域词典不包括问题实体的名称,则基于问题实体分别与知识图谱中各个标准实体之间的语义相似度,确定与问题实体匹配的目标标准实体。
具体地,当领域词典是基于知识图谱构建得到时,领域词典可以包括知识图谱中各个标准实体分别对应的标准名称。
在得到待答复问题中的问题实体时,可以根据问题实体的名称与领域词典,对问题实体匹配至知识图谱中。
若问题实体的名称为领域词典中的任一主词,即该问题实体与某个标准实体的名称相同,则可以直接将知识图谱中与问题实体的名称相同的标准实体作为该问题实体对应的目标标准实体。
若问题实体的名称为领域词典中的任一辅词,则基于辅词与主词之间的对应关系,确定该问题实体对应的第一主词,并将知识图谱中名称为第一主词的标准实体作为目标标准实体。
若领域词典不包括问题实体的名称,则可以计算问题实体分别与各个标准实体之间的语义相似度,将相似度最高的标准实体作为对应的目标标准实体。
可选地,可以基于SimBERT模型来计算语义相似度,其中,SimBERT模型是基于BERT(Bidirectional Encoder Representations from Transformers,双向编码器表示的转换器)的一个改进版本,主要用于中文自然语言处理任务。
本申请实施例中,通过构建与知识图谱对应的领域词典,并基于领域词典,确定知识图谱中与领域词典匹配的目标标准实体,从而能够快速地建立待答复问题与知识图谱之间的联系,以供后续从知识图谱中确定多个候选答案路径,进而缩短了生成答案的时间,即缩短了问答系统的响应时间,提高了用户体验。
作为一种可选实施例,基于目标标准实体,确定待答复问题对应的多个候选答案路径,包括:
确定知识图谱对应的至少一个预设路径模板;
以目标标准实体为中心,根据至少一个预设路径模板,从知识图谱中生成多个候选答案路径。
具体地,在构建得到知识图谱之后,可以根据知识图谱的结构确定对应的至少一个预设路径模板。
基于知识图谱的问答,除去无答案的特殊情况,不论是简单问题还是复杂问题,答案通常存在于以主实体(topic entity)为中心的子图中,因此可以将预设路径模板作为候选答案路径。
预设路径模板信息如表1所示:
表1
上述预设路径模板涵盖了单实体两跳以内,双实体两跳以内,三实体三跳以内的路径情况,基本包括了知识图谱简单问答和复杂问答的绝大多数场景的答案候选范围。
在确定与待答复问题匹配的目标标准实体之后,可以以目标标准实体为中心,根据至少一个预设路径模板从知识图谱中抽取出多个子图,作为多个候选答案路径。
图2为本申请实施例提供的一种候选路径答案生成过程的示意图,如图2所示,以待答复问题为“A的老婆身高是多少?”为例,首先通过对待答复问题进行命名实体识别,得到该问题中的问题实体为“A”;然后将该问题实体与知识图谱中的多个实体进行匹配,即实体链接,得到知识图谱中与该问题实体匹配的标准实体“A”;随即以该标准实体“A”为中心,根据至少一个预设路径模板(例如“单实体单跳”、“单实体两跳”),得到多个候选答案路径。其中,候选答案路径的数量可以是预先设置,在图2所示的示例中,候选答案路径的数量可以设置为5。
作为一种可选实施例,图3为本申请实施例提供的一种基于人工智能的问答方法的流程示意图,如图3所示,以待答复问题为“A的老婆身高是多少?”为例,通过对待答复问题进行命名实体识别得到问题实体为“A”,并对待答复问题进行问题特征提取,得到该问题的问题特征:实体为“A”、关系为“老婆”以及属性为“身高”;将该问题实体“A”通过实体链接,得到知识图谱中与其匹配的标准实体“A”,并以标准实体“A”为中心,基于至少一个预设路径模板,从知识图谱中抽取出多个子图,作为多个候选答案路径;将待答复问题、问题特征和多个候选答案路径输入至大模型,得到大模型输出的目标答案路径;基于目标答案路径和知识图谱,得到目标图谱答案,并将目标图谱答案、待答复问题和文本优化提示文本输入至大模型,通过大模型对目标图谱答案进行文本优化,生成最终的待答复问题对应的答案。
本申请实施例提供的方法结合大模型和知识图谱,利用大模型实现答案候选答案路径的筛选和自然语言答案生成,缓解了深度学习方法在垂直领域需要大量语料训练语义相似度模型的困境,实现零样本、少样本的语义匹配,同时借助大模型提供更加顺畅的问题答案。
图4为本申请实施例提供的一种基于人工智能的问答装置的结构示意图,如图4所示,该装置包括:
数据获取模块210,用于获取待处理的知识图谱和待答复问题;
特征提取模块220,用于通过第一大模型基于所述待答复问题,确定所述待答复问题对应的问题特征;所述问题特征用于表征所述待答复问题对应的知识图谱三元组;
候选答案路径确定模块230,用于确定所述知识图谱中与所述待答复问题中的问题实体匹配的目标标准实体,并基于所述目标标准实体,确定所述待答复问题对应的多个候选答案路径;
答案生成模块240,用于通过第二大模型基于所述问题特征、所述待答复问题,以及所述多个候选答案路径,确定所述待答复问题对应的答案。
作为一种可选实施例,答案生成模块包括:
目标答案路径确定子模块,用于将所述问题特征、所述待答复问题,以及所述多个候选答案路径输入至所述第二大模型,通过所述第二大模型对多个所述候选答案路径进行筛选,得到针对所述待答复问题的目标答案路径;
答案生成子模块,用于基于所述目标答案路径和所述知识图谱,确定所述待答复问题对应的答案。
作为一种可选实施例,答案生成子模块,具体用于:
基于所述目标答案路径和所述知识图谱,确定所述目标答案路径对应的目标图谱答案;
将所述目标图谱答案和所述待答复问题输入至第三大模型,通过所述第三大模型对所述目标图谱答案进行优化,得到所述待答复问题对应的答案。
作为一种可选实施例,该装置还包括:
知识图谱获取模块,用于确定预设领域对应的所述知识图谱;
候选答案路径确定模块在执行确定所述知识图谱中与所述待答复问题中的问题实体匹配的目标标准实体时,具体用于:
基于所述预设领域对应的领域词典,确定所述知识图谱中与所述待答复问题中的问题实体匹配的目标标准实体。
作为一种可选实施例,该装置还包括:
领域词典构建模块,用于基于所述知识图谱中的多个标准实体分别对应的多个标准名称,确定所述领域词典中的多个主词;
针对每个主词,确定所述主词对应的至少一个辅词;所述辅词为与所述主词语义相同的词语;
基于各个主词以及各个主词分别对应的至少一个辅词,构建所述领域词典。
作为一种可选实施例,候选答案路径确定模块在执行所述基于预设的领域词典,确定所述知识图谱中与所述待答复问题中的问题实体匹配的目标标准实体时,具体用于:
若所述问题实体的名称为所述领域词典中的任一主词,则将所述知识图谱中与所述问题实体的名称相同的标准实体作为所述目标标准实体;
若所述问题实体的名称为所述领域词典中的任一辅词,则确定所述问题实体对应的第一主词,并将所述知识图谱中与所述第一主词对应的标准实体作为所述目标标准实体;
若所述领域词典不包括所述问题实体的名称,则基于所述问题实体分别与所述知识图谱中各个标准实体之间的语义相似度,确定与所述问题实体匹配的目标标准实体。
作为一种可选实施例,候选答案路径确定模块在所述基于所述目标标准实体,确定所述待答复问题对应的多个候选答案路径时,具体用于:
确定所述知识图谱对应的至少一个预设路径模板;
以所述目标标准实体为中心,根据所述至少一个预设路径模板,从所述知识图谱中生成多个候选答案路径。
本申请实施例的装置可执行本申请实施例所提供的方法,其实现原理相类似,本申请各实施例的装置中的各模块所执行的动作是与本申请各实施例的方法中的步骤相对应的,对于装置的各模块的详细功能描述具体可以参见前文中所示的对应方法中的描述,此处不再赘述。
本申请实施例中提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,该处理器执行上述计算机程序以实现上述基于人工智能的问答方法的步骤,与相关技术相比可实现:通过从知识图谱中确定待答复问题对应的多个候选答案路径,并通过大模型从多个候选答案路径中确定待答复问题对应的答案,通过结合知识图谱和大模型,在知识图谱包括的准确的信息的基础上,利用了大模型的语义理解能力确定问题的答案,提高了输出的答案的准确性。同时,通过将待答复问题的问题特征输入至大模型,使得大模型能够利用待答复问题的语义信息和结构化信息等多个维度的信息来回答问题,进一步提高了输出的答案的准确性。
进一步地,本申请实施例中利用大模型对待答复问题进行问题特征提取,相较于现有的基于深度学习的知识图谱的问答方法,无需对模型进行额外的训练,避免了在特定的应用场景中,因缺乏标注数据或者标注数据较少导致模型的抽取准确性较低的问题,保证了提取的问题特征的准确性,有利于提高后续问答的准确性;而且可以适用于不同的应用场景,提高了方法的通用性。
在一个可选实施例中提供了一种电子设备,如图5所示,图5所示的电子设备4000包括:处理器4001和存储器4003。其中,处理器4001和存储器4003相连,如通过总线4002相连。可选地,电子设备4000还可以包括收发器4004,收发器4004可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器4004不限于一个,该电子设备4000的结构并不构成对本申请实施例的限定。
处理器4001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线4002可包括一通路,在上述组件之间传送信息。总线4002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器4003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质、其他磁存储设备、或者能够用于携带或存储计算机程序并能够由计算机读取的任何其他介质,在此不做限定。
存储器4003用于存储执行本申请实施例的计算机程序,并由处理器4001来控制执行。处理器4001用于执行存储器4003中存储的计算机程序,以实现前述方法实施例所示的步骤。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”、“1”、“2”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除图示或文字描述以外的顺序实施。
应该理解的是,虽然本申请实施例的流程图中通过箭头指示各个操作步骤,但是这些步骤的实施顺序并不受限于箭头所指示的顺序。除非本文中有明确的说明,否则在本申请实施例的一些实施场景中,各流程图中的实施步骤可以按照需求以其他的顺序执行。此外,各流程图中的部分或全部步骤基于实际的实施场景,可以包括多个子步骤或者多个阶段。这些子步骤或者阶段中的部分或全部可以在同一时刻被执行,这些子步骤或者阶段中的每个子步骤或者阶段也可以分别在不同的时刻被执行。在执行时刻不同的场景下,这些子步骤或者阶段的执行顺序可以根据需求灵活配置,本申请实施例对此不限制。
以上所述仅是本申请部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请的方案技术构思的前提下,采用基于本申请技术思想的其他类似实施手段,同样属于本申请实施例的保护范畴。
Claims (10)
1.一种基于人工智能的问答方法,其特征在于,包括:
获取待处理的知识图谱和待答复问题;
通过第一大模型基于所述待答复问题,确定所述待答复问题对应的问题特征;所述问题特征用于表征所述待答复问题对应的知识图谱三元组;
确定所述知识图谱中与所述待答复问题中的问题实体匹配的目标标准实体,并基于所述目标标准实体,确定所述待答复问题对应的多个候选答案路径;
通过第二大模型基于所述问题特征、所述待答复问题,以及所述多个候选答案路径,确定所述待答复问题对应的答案。
2.根据权利要求1所述的基于人工智能的问答方法,其特征在于,所述通过第二大模型基于所述问题特征、所述待答复问题,以及所述多个候选答案路径,确定所述待答复问题对应的答案,包括:
将所述问题特征、所述待答复问题,以及所述多个候选答案路径输入至所述第二大模型,通过所述第二大模型对多个所述候选答案路径进行筛选,得到针对所述待答复问题的目标答案路径;
基于所述目标答案路径和所述知识图谱,确定所述待答复问题对应的答案。
3.根据权利要求2所述的基于人工智能的问答方法,其特征在于,所述基于所述目标答案路径和所述知识图谱,确定所述待答复问题对应的答案,包括:
基于所述目标答案路径和所述知识图谱,确定所述目标答案路径对应的目标图谱答案;
将所述目标图谱答案和所述待答复问题输入至第三大模型,通过所述第三大模型对所述目标图谱答案进行优化,得到所述待答复问题对应的答案。
4.根据权利要求1所述的基于人工智能的问答方法,其特征在于,所述方法还包括:
确定预设领域对应的所述知识图谱;
所述确定所述知识图谱中与所述待答复问题中的问题实体匹配的目标标准实体,包括:
基于所述预设领域对应的领域词典,确定所述知识图谱中与所述待答复问题中的问题实体匹配的目标标准实体。
5.根据权利要求4所述的基于人工智能的问答方法,其特征在于,所述领域词典是基于如下方式构建的:
基于所述知识图谱中的多个标准实体分别对应的多个标准名称,确定所述领域词典中的多个主词;
针对每个主词,确定所述主词对应的至少一个辅词;所述辅词为与所述主词语义相同的词语;
基于各个主词以及各个主词分别对应的至少一个辅词,构建所述领域词典。
6.根据权利要求5所述的基于人工智能的问答方法,其特征在于,所述基于预设的领域词典,确定所述知识图谱中与所述待答复问题中的问题实体匹配的目标标准实体,包括:
若所述问题实体的名称为所述领域词典中的任一主词,则将所述知识图谱中与所述问题实体的名称相同的标准实体作为所述目标标准实体;
若所述问题实体的名称为所述领域词典中的任一辅词,则确定所述问题实体对应的第一主词,并将所述知识图谱中与所述第一主词对应的标准实体作为所述目标标准实体;
若所述领域词典不包括所述问题实体的名称,则基于所述问题实体分别与所述知识图谱中各个标准实体之间的语义相似度,确定与所述问题实体匹配的目标标准实体。
7.根据权利要求1所述的基于人工智能的问答方法,其特征在于,所述基于所述目标标准实体,确定所述待答复问题对应的多个候选答案路径,包括:
确定所述知识图谱对应的至少一个预设路径模板;
以所述目标标准实体为中心,根据所述至少一个预设路径模板,从所述知识图谱中生成多个候选答案路径。
8.一种基于人工智能的问答装置,其特征在于,包括:
数据获取模块,用于获取待处理的知识图谱和待答复问题;
特征提取模块,用于通过第一大模型基于所述待答复问题,确定所述待答复问题对应的问题特征;所述问题特征用于表征所述待答复问题对应的知识图谱三元组;
候选答案路径确定模块,用于确定所述知识图谱中与所述待答复问题中的问题实体匹配的目标标准实体,并基于所述目标标准实体,确定所述待答复问题对应的多个候选答案路径;
答案生成模块,用于通过第二大模型基于所述问题特征、所述待答复问题,以及所述多个候选答案路径,确定所述待答复问题对应的答案。
9.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410177461.XA CN117725188A (zh) | 2024-02-08 | 2024-02-08 | 基于人工智能的问答方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410177461.XA CN117725188A (zh) | 2024-02-08 | 2024-02-08 | 基于人工智能的问答方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117725188A true CN117725188A (zh) | 2024-03-19 |
Family
ID=90211047
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410177461.XA Pending CN117725188A (zh) | 2024-02-08 | 2024-02-08 | 基于人工智能的问答方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117725188A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113641813A (zh) * | 2021-09-01 | 2021-11-12 | 上海明略人工智能(集团)有限公司 | 基于知识图谱的问答系统、方法、电子设备及存储介质 |
WO2023205478A1 (en) * | 2022-04-22 | 2023-10-26 | Nextnet Inc. | Data integration, knowledge extraction and methods thereof |
CN117009490A (zh) * | 2023-08-31 | 2023-11-07 | 之江实验室 | 基于知识库反馈的生成式大语言模型的训练方法和装置 |
CN117033608A (zh) * | 2023-09-28 | 2023-11-10 | 中国电子科技集团公司第十研究所 | 一种基于大语言模型的知识图谱生成式问答方法及系统 |
CN117332070A (zh) * | 2023-11-21 | 2024-01-02 | 华北水利水电大学 | 基于知识图谱和大模型的水利工程巡检智能问答方法 |
-
2024
- 2024-02-08 CN CN202410177461.XA patent/CN117725188A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113641813A (zh) * | 2021-09-01 | 2021-11-12 | 上海明略人工智能(集团)有限公司 | 基于知识图谱的问答系统、方法、电子设备及存储介质 |
WO2023205478A1 (en) * | 2022-04-22 | 2023-10-26 | Nextnet Inc. | Data integration, knowledge extraction and methods thereof |
CN117009490A (zh) * | 2023-08-31 | 2023-11-07 | 之江实验室 | 基于知识库反馈的生成式大语言模型的训练方法和装置 |
CN117033608A (zh) * | 2023-09-28 | 2023-11-10 | 中国电子科技集团公司第十研究所 | 一种基于大语言模型的知识图谱生成式问答方法及系统 |
CN117332070A (zh) * | 2023-11-21 | 2024-01-02 | 华北水利水电大学 | 基于知识图谱和大模型的水利工程巡检智能问答方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109284363B (zh) | 一种问答方法、装置、电子设备及存储介质 | |
CN110727779A (zh) | 基于多模型融合的问答方法及系统 | |
CN111708869B (zh) | 人机对话的处理方法及装置 | |
CN110297893B (zh) | 自然语言问答方法、装置、计算机装置及存储介质 | |
CN110968663A (zh) | 一种问答系统的答案展示方法及装置 | |
CN111339277A (zh) | 基于机器学习的问答交互方法及装置 | |
CN111046147A (zh) | 一种问答方法、装置及终端设备 | |
CN110020163B (zh) | 基于人机交互的搜索方法、装置、计算机设备和存储介质 | |
CN116244412A (zh) | 多意图识别方法及装置 | |
CN113127617B (zh) | 通用领域知识图谱的知识问答方法、终端设备及存储介质 | |
CN116743692B (zh) | 一种历史消息折叠方法和系统 | |
CN111125550A (zh) | 兴趣点分类方法、装置、设备及存储介质 | |
CN113505195A (zh) | 知识库及其构建、检索方法、基于其的出题方法和系统 | |
CN113505786A (zh) | 试题拍照评判方法、装置及电子设备 | |
CN112685544A (zh) | 电信信息的查询方法、装置、设备和介质 | |
CN113220854A (zh) | 机器阅读理解的智能对话方法及装置 | |
CN109684357B (zh) | 信息处理方法及装置、存储介质、终端 | |
CN114842982B (zh) | 一种面向医疗信息系统的知识表达方法、装置及系统 | |
CN110147358B (zh) | 自动问答知识库的建设方法及建设系统 | |
CN116662495A (zh) | 问答处理方法、训练问答处理模型的方法及装置 | |
CN113742447B (zh) | 基于查询路径生成的知识图谱问答方法、介质和设备 | |
CN115757720A (zh) | 基于知识图谱的项目信息搜索方法、装置、设备和介质 | |
CN117725188A (zh) | 基于人工智能的问答方法、装置、电子设备及存储介质 | |
CN114999599A (zh) | 数据处理方法、装置、电子设备及计算机可读存储介质 | |
CN112905752A (zh) | 一种智能交互方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |