CN117725190A - 基于大语言模型的多轮问答方法、系统、终端及存储介质 - Google Patents
基于大语言模型的多轮问答方法、系统、终端及存储介质 Download PDFInfo
- Publication number
- CN117725190A CN117725190A CN202410179941.XA CN202410179941A CN117725190A CN 117725190 A CN117725190 A CN 117725190A CN 202410179941 A CN202410179941 A CN 202410179941A CN 117725190 A CN117725190 A CN 117725190A
- Authority
- CN
- China
- Prior art keywords
- mind map
- target
- data
- sub
- generating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000002194 synthesizing effect Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 abstract description 9
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000011161 development Methods 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于大语言模型的多轮问答方法、系统、终端及存储介质,涉及人工智能技术领域。方法包括:抽取第一输入数据的第一关键词;根据第一关键词作为父节点构建目标思维导图;根据第一输入数据和目标思维导图生成第一回答数据;根据第一回答数据和子节点生成若干追问问题,若任一追问问题被选择,则将被选择的追问问题作为第二输入数据,抽取第二输入数据的第二关键词作为子节点更新目标思维导图;根据第二输入数据和更新后的目标思维导图生成第二回答数据。本发明通过思维导图来生成用户问题的回答,并通过追问问题来对用户问题进行深入分析和解答。可以准确地把握用户意图,有效地提升系统回答的准确性和全面性。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及的是基于大语言模型的多轮问答方法、系统、终端及存储介质。
背景技术
随着大语言模型技术的出现,智能问答系统逐渐成为用户与海量数据沟通的桥梁。用户通过自然语言与大语言模型对话,大语言模型返回用户易于理解的文字、图片、表格等信息。
然而现有的大语言模型通常是单轮对话服务,由于用户的提问很可能是模糊的,单轮对话无法准确的把握用户意图,进而难以对用户提出的问题进行深入分析和正确解答。
因此,现有技术还有待改进和发展。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供基于大语言模型的多轮问答方法、系统、终端及存储介质,旨在解决现有技术中单轮对话形式的大语言模型无法准确的把握用户意图,难以对用户提出的问题进行深入分析和正确解答的问题。
本发明解决问题所采用的技术方案如下:
第一方面,本发明实施例提供一种基于大语言模型的多轮问答方法,所述方法包括:
抽取第一输入数据的第一关键词;
根据所述第一关键词作为父节点构建目标思维导图,其中,所述目标思维导图包括至少一级的子节点;
根据所述第一输入数据和所述目标思维导图生成第一回答数据;
根据所述第一回答数据和所述子节点生成若干追问问题,若任一所述追问问题被选择,则将被选择的所述追问问题作为第二输入数据,抽取所述第二输入数据的第二关键词作为所述子节点更新所述目标思维导图;
根据所述第二输入数据和更新后的所述目标思维导图生成第二回答数据。
在一种实施方式中,所述根据所述第一关键词作为父节点构建目标思维导图,包括:
获取预设的思维导图数据库,其中,所述思维导图数据库中的思维导图模板以预设字符串进行存储,并建立索引;
根据所述第一关键词对所述思维导图数据库进行检索,得到若干候选思维导图模板;
根据所述第一关键词和各所述候选思维导图模板构建所述目标思维导图。
在一种实施方式中,所述根据所述第一关键词对所述思维导图数据库进行检索,得到若干候选思维导图模板,包括:
以所述第一关键词在所述思维导图数据库进行检索或者向量相似度检索,得到若干所述候选思维导图模板。
在一种实施方式中,所述根据所述第一关键词和各所述候选思维导图模板构建所述目标思维导图,包括:
根据所述第一关键词和各所述候选思维导图模板,合成提示数据;
将所述提示数据输入所述大语言模型,得到所述目标思维导图。
在一种实施方式中,所述根据所述第一输入数据和所述目标思维导图生成第一回答数据,包括:
针对每一所述子节点,根据所述第一输入数据和所述目标思维导图,生成所述子节点对应的子回答数据;
根据各所述子节点的所述子回答数据生成所述第一回答数据。
在一种实施方式中,所述根据所述第一输入数据和所述目标思维导图,生成所述子节点对应的子回答数据,包括:
获取所述子节点对应的语料数据;
根据所述目标思维导图确定所述子节点对应的节点路径;
根据所述第一输入数据、所述语料数据以及所述节点路径合成子提示数据,通过所述大语言模型基于所述子提示数据生成所述子节点对应的所述子回答数据。
在一种实施方式中,所述根据各所述子节点的所述子回答数据生成所述第一回答数据,包括:
根据各所述子节点的所述子回答数据生成回答摘要数据;
将所述回答摘要数据和各所述子节点的所述子回答数据作为所述第一回答数据。
在一种实施方式中,所述根据所述第一回答数据和所述子节点生成若干追问问题,包括:
将所述目标思维导图中所述第一关键词对应的下一级作为目标级;
根据所述第一回答数据和所述目标级的所述子节点生成若干所述追问问题。
在一种实施方式中,所述根据所述第一回答数据和所述目标级的所述子节点生成若干所述追问问题,包括:
根据所述第一回答数据和所述目标级的所述子节点,生成若干候选追问问题;
通过历史问答数据对各所述候选追问问题进行语义相关度计算,筛选得到若干所述追问问题。
在一种实施方式中,所述抽取所述第二输入数据的第二关键词作为所述子节点更新所述目标思维导图,包括:
将所述第二关键词作为所述子节点构建对应于所述子节点的子目标思维导图;
以所述子目标思维导图更新所述目标思维导图。
在一种实施方式中,所述以所述子目标思维导图更新所述目标思维导图,包括:
以所述子目标思维导图延伸或替换所述子节点,以更新所述目标思维导图。
第二方面,本发明实施例还提供一种基于大语言模型的多轮问答系统,所述系统包括:
抽取模块,用于抽取第一输入数据的第一关键词;
构建模块,用于根据所述第一关键词作为父节点构建目标思维导图,其中,所述目标思维导图包括至少一级的子节点;
回答模块,用于根据所述第一输入数据和所述目标思维导图生成第一回答数据;
追问模块,用于根据所述第一回答数据和所述子节点生成若干追问问题,若任一所述追问问题被选择,则将被选择的所述追问问题作为第二输入数据,抽取所述第二输入数据的第二关键词作为所述子节点更新所述目标思维导图;
循环模块,用于根据所述第二输入数据和更新后的所述目标思维导图生成第二回答数据。
第三方面,本发明实施例还提供一种终端,所述终端包括有存储器和一个以上处理器;所述存储器存储有一个以上的程序;所述程序包含用于执行如上述任一所述的基于大语言模型的多轮问答方法的指令;所述处理器用于执行所述程序。
第四方面,本发明实施例还提供一种计算机可读存储介质,其上存储有多条指令,所述指令适用于由处理器加载并执行,以实现上述任一所述的基于大语言模型的多轮问答方法的步骤。
本发明的有益效果:本发明实施例通过抽取第一输入数据的第一关键词;根据所述第一关键词作为父节点构建目标思维导图,其中,所述目标思维导图包括至少一级的子节点;根据所述第一输入数据和所述目标思维导图生成第一回答数据;根据所述第一回答数据和所述子节点生成若干追问问题,若任一所述追问问题被选择,则将被选择的所述追问问题作为第二输入数据,抽取所述第二输入数据的第二关键词作为所述子节点更新所述目标思维导图;根据所述第二输入数据和更新后的所述目标思维导图生成第二回答数据。本发明通过构建思维导图的方式来生成对用户问题的回答,并通过生成追问问题的方式来实现对用户问题的深入分析和解答。可以准确地把握用户意图,有效地提升系统回答的准确性和全面性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于大语言模型的多轮问答方法的流程示意图。
图2是本发明实施例提供的思维导图的参考示意图。
图3是本发明实施例提供的扩展后的思维导图的参考示意图。
图4是本发明实施例提供的基于大语言模型的多轮问答系统的模块示意图。
图5是本发明实施例提供的终端的原理框图。
具体实施方式
本发明公开了基于大语言模型的多轮问答方法、系统、终端及存储介质,为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
针对现有技术的上述缺陷,本发明提供一种基于大语言模型的多轮问答方法,所述方法包括:抽取第一输入数据的第一关键词;根据所述第一关键词作为父节点构建目标思维导图,其中,所述目标思维导图包括至少一级的子节点;根据所述第一输入数据和所述目标思维导图生成第一回答数据;根据所述第一回答数据和所述子节点生成若干追问问题,若任一所述追问问题被选择,则将被选择的所述追问问题作为第二输入数据,抽取所述第二输入数据的第二关键词作为所述子节点更新所述目标思维导图;根据所述第二输入数据和更新后的所述目标思维导图生成第二回答数据。本发明通过构建思维导图的方式来生成对用户问题的回答,并通过生成追问问题的方式来实现对用户问题的深入分析和解答。可以准确地把握用户意图,有效地提升系统回答的准确性和全面性。
举例说明,首先系统根据第一输入数据抽取的第一关键词为:A公司的发展情况。然后以第一关键词作为父节点构建目标思维导图:以A公司的发展情况为父节点,衍生出A公司的历史发现、技术创新、销售业绩、战略布局、未来展望等子节点。之后根据第一输入数据和目标思维导图数据生成与A公司的发展情况相关的第一回答数据,并将第一回答数据展示给用户。为了对A公司的发展情况进行深入分析,系统还可以根据第一回答数据和历史发现、技术创新、销售业绩、战略布局、未来展望等子节点生成多个追问问题供用户选择。若其中一个追问问题被选择,则将该追问问题作为第二输入数据,并抽取第二输入数据的第二关键词为:技术创新。根据技术创新这一子节点更新目标思维导图,并根据第二输入数据和更新后的目标思维导图生成与技术创新相关的第二回答数据。
如图1所示,所述方法包括:
步骤S100、抽取第一输入数据的第一关键词。
具体地,本实施例中的第一输入数据包括但不限于文本、语音等形式的数据。在实际应用场景中,系统会根据获取到的第一输入数据自动抽取出与用户问题相关的关键词,即得到第一关键词。
步骤S200、根据所述第一关键词作为父节点构建目标思维导图,其中,所述目标思维导图包括至少一级的子节点。
具体地,系统提取出第一关键词以后,会以第一关键词为父节点构建一个用于解答第一关键词反映的用户问题的目标思维导图。该目标思维导图结合图形与文字于一体,以第一关键词作为父节点,衍生出一个或者多个层级的子节点。目标思维导图可以直观地反映出用户问题对应的解决思路,从而辅助系统快速、准确地对用户问题进行解答。
在一种实现方式中,所述根据所述第一关键词作为父节点构建目标思维导图,包括:
获取预设的思维导图数据库,其中,所述思维导图数据库中的思维导图模板以预设字符串进行存储,并建立索引;
根据所述第一关键词对所述思维导图数据库进行检索,得到若干候选思维导图模板;
根据所述第一关键词和各所述候选思维导图模板构建所述目标思维导图。
具体地,本实施例预先采集了大量的思维导图作为思维导图模板,例如预先通过人工导入的方式或者爬虫技术获取大量的思维导图。并将这些思维导图模板以预设字符串的形式存储在思维导图数据库,例如采用json字符串(一种文本格式)存储思维导图模板。为了进一步提高检索速度,可以对思维导图数据库中存储的思维导图模板建立索引。在实际应用场景中,通过第一关键词对思维导图数据库进行检索,可以得到与第一关键词相关的多个候选思维导图模板。由于用户问题有可能是新出现的开放问题,为了更贴合当前的第一关键词,本实施例并不会直接采用已有的思维导图模板进行问题解答,而是通过大语言模型根据第一关键词和筛选出的各候选思维导图模板构建一个新的目标思维导图,从而更好地辅助系统解答第一关键词反映的用户问题。
在一种实现方式中,所述根据所述第一关键词对所述思维导图数据库进行检索,得到若干候选思维导图模板,包括:
以所述第一关键词在所述思维导图数据库进行检索或者向量相似度检索,得到若干所述候选思维导图模板。
具体地,思维导图数据库的检索方式为关键词检索或者向量相似度检索的方式。关键词检索可以通过各思维导图模板中是否包含第一关键词来筛选候选思维导图模板;向量相似度检索可以将第一关键词编码为向量表示、将各思维导图模板json格式的数据分别编码为向量表示,通过计算两者向量相似度来筛选候选思维导图模板。从而在思维导图数据库中检索k个与第一关键词最相关的思维导图模板作为候选思维导图模板。
在一种实现方式中,所述根据所述第一关键词和各所述候选思维导图构建所述目标思维导图,包括:
根据所述第一关键词和各所述候选思维导图模板,合成提示数据;
将所述提示数据输入所述大语言模型,得到所述目标思维导图。
本实施例预先构建了用于实现多轮问答的大语言模型,通过大语言模型生成第一关键词对应的目标思维导图。具体地,由于直接采用大语言模型构建目标思维导图的成功率和正确率较低,因此本实施例会结合第一关键词和检索到的多个候选思维导图模板来对大语言模型进行提示,即合成提示数据。将提示数据输入大语言模型以后,大语言模型会模仿提示数据构建出新的目标思维导图,该目标思维导图更能清楚表达用户输入数据想要表达的意思。
举例说明,提示数据prompt=【用户输入数据】+【候选思维导图模板1】+...+【候选思维导图模板k】。思维导图的输入格式为json字符串,如图2所示,输入格式为:{“A公司的发展情况”:{“发展历史”:{},“技术创新”:{},“销售业绩”:{},“战略布局”:{},“未来展望”:{}}},其中,{}中的内容表示思维导图各层级节点内容。将构建好的提示数据输入至大语言模型,通过大语言模型输出新的目标思维导图,输出的思维导图同样为json格式。
在一种实现方式中,可以采用echart(一种数据可视化图表库)画图语言对json格式的思维导图进行解析,并以可交互图片的形式返回给用户。
步骤S300、根据所述第一输入数据和所述目标思维导图生成第一回答数据。
具体地,由于目标思维导图可以直观地反映出问题解决思路,因此本实施例采用第一输入数据和目标思维导图相结合的方式来辅助系统快速、准确地解答问题,从而得到第一关键词反映的用户输入数据的第一回答数据。
在一种实现方式中,所述根据所述第一输入数据和所述目标思维导图生成第一回答数据,包括:
针对每一所述子节点,根据所述第一输入数据和所述目标思维导图,生成所述子节点对应的子回答数据;
根据各所述子节点的所述子回答数据生成所述第一回答数据。
具体地,本实施例中父节点是基于第一关键词确定的,各子节点则是在父节点的基础上衍生得到的,因此各子节点的形成可以看作是对第一关键词反映的第一输入数据的拆分。本实施例采用的解答方法是通过第一输入数据和目标思维导图通过大语言模型分别获取各子节点的子回答数据,再汇总生成第一回答数据。
在一种实现方式中,所述根据所述第一输入数据和所述目标思维导图,生成所述子节点对应的子回答数据,包括:
获取所述子节点对应的语料数据;
根据所述目标思维导图确定所述子节点对应的节点路径;
根据所述第一输入数据、所述语料数据以及所述节点路径合成子提示数据,通过所述大语言模型基于所述子提示数据生成所述子节点对应的所述子回答数据。
以一个子节点的处理逻辑为例:预先构建一个数据库用于存储新闻、研报等形式的语料数据。由于直接采用大语言模型进行问答可能会因为模型参数更新不及时等问题,出现无法回答或者回答错误的情况,因此本实施例首先通过检索数据库的方式获取该子节点的语料数据。然后通过目标思维导图确定父节点与该子节点之间的节点路径。结合第一输入数据、语料数据以及节点路径来生成大语言模型的输入提示数据,即该子节点的子提示数据。将该子提示数据输入大语言模型以后,大语言模型会基于该子提示数据进行解答,从而生成该子节点的子回答数据。
举例说明,假设生成的目标思维导图总共有N层共L个子节点。首先根据每个子节点在数据库中进行语料检索,得到语料数据,/>。然后将得到的语料数据与目标思维导图中对应的子节点进行拼接,得到大语言模型的输入提示:子提示数据/>=【用户输入数据】+【语料/>】+【根结点到对应子节点的节点路径】。最后,将子提示数据/>分多次输入到大语言模型,得到多个子节点对应的子回答数据/>。
在一种实现方式中,所述根据各所述子节点的所述子回答数据生成所述第一回答数据,包括:
根据各所述子节点的所述子回答数据生成回答摘要数据;
将所述回答摘要数据和各所述子节点的所述子回答数据作为所述第一回答数据。
具体地,本实施例可以将生成的所有子回答数据进行汇总,并输出返回给用户。为了便于用户阅读,本实施例还可以通过大语言模型对所有子回答数据进行总结形成回答摘要数据,再依次输出各个子回答数据。
在一种实现方式中,所述根据所述第一回答数据和所述子节点生成若干追问问题,包括:
将所述目标思维导图中所述第一关键词对应的下一级作为目标级;
根据所述第一回答数据和所述目标级的所述子节点生成若干所述追问问题。
具体地,为了进一步深入地分析第一关键词反映的用户问题,系统会向用户推荐一些追问问题,从而引导用户提出新的问题。本实施例采用的是逐级追问方式,将目标思维导图中第一关键词对应的下一级作为生成追问问题的目标级。然后结合目标级中的子节点和第一回答数据生成用于触发下一轮次问答的多个追问问题。
在一种实现方式中,所述根据所述第一回答数据和所述目标级的所述子节点生成若干所述追问问题,包括:
根据所述第一回答数据和所述目标级的所述子节点,生成若干候选追问问题;
通过历史问答数据对各所述候选追问问题进行语义相关度计算,筛选得到若干所述追问问题。
具体地,针对目标级中的每一子节点,本实施例均会根据该子节点和第一回答数据生成至少一个候选追问问题。由于候选追问问题的数量较多,为了便于用户选择,本实施例会根据历史问答数据从所有候选追问问题中筛选出一些相关性更高的追问问题供用户选择。
举例说明,根据第一回答数据和目标思维导图,生成n个追问问题推荐给用户选择,引导用户点击,从而实现对用户问题的深入分析和解答。对于目标思维导图中目标级的每个子节点i,,本实施例均生成一个候选追问问题,然后计算每一候选追问问题与历史问答数据的语义相关度,例如文本表示向量的余弦相似度。为了便于计算,也可以采用历史问答数据的汇总摘要对所有候选追问问题进行筛选。最后根据计算出的语义相关度对各候选追问问题进行排序,选择前n个追问问题返回给用户。
步骤S400、根据所述第一回答数据和所述子节点生成若干追问问题,若任一所述追问问题被选择,则将被选择的所述追问问题作为第二输入数据,抽取所述第二输入数据的第二关键词作为所述子节点更新所述目标思维导图。
具体地,若用户选择其中一个追问问题,则系统会自动将该追问问题作为第二输入数据,并抽取第二输入数据的关键词得到第二关键词。然后根据第二关键词确定目标思维导图中待更新的子节点,通过更新该子节点来实现更新目标思维导图,从而触发系统执行新一轮次的问答。
在一种实现方式中,所述抽取所述第二输入数据的第二关键词作为所述子节点更新所述目标思维导图,包括:
将所述第二关键词作为所述子节点构建对应于所述子节点的子目标思维导图;
以所述子目标思维导图更新所述目标思维导图。
具体地,由于本实施例是基于追问的形式产生多轮问答,因此每一轮次的关键词之间存在较强的关联性。为了使系统更准确地解答,本实施例会采用第二关键词构建一个子目标思维导图,即子目标思维导图是以第二关键词衍生出的思维导图。并将子目标思维导图反映的信息更新至前一轮次生成的目标思维导图上,更新后的目标思维导图即包含原有的目标思维导图和子目标思维导图的信息。更新后的目标思维导图可以为系统提供更全面有效的解题思路,辅助系统更准确地解答第二关键词反映的用户问题。
在一种实现方式中,所述以所述子目标思维导图更新所述目标思维导图,包括:
以所述子目标思维导图延伸或替换所述子节点,以更新所述目标思维导图。
具体地,用于构建子目标思维导图的子节点即为目标思维导图中待更新的子节点,为了将子目标思维导图所反映的信息更新至原有的目标思维导图中,本实施例判断目标思维导图中待更新的子节点之后是否具有延伸的子节点,若没有延伸的子节点,则采用延伸的方式在待更新的子节点之后增加子目标思维导图包含的子节点;若存在延伸的子节点,则采用替换的方式将待更新的子节点之后延伸的子节点替换为子目标思维导图包含的子节点。
举例说明,如图3所示,若用户选取的追问问题是技术创新,则采用技术创新构建子目标思维导图,并在已有的目标思维导图的基础上进行扩展。具体地,以技术创新作为第二关键词对思维导图数据库进行检索,例如检索到新的思维导图模板的json格式为:{研发投入: {2023年研发投入: {},研发人员数量: {}}}。根据检索结果进一步生成子目标思维导图,通过子目标思维导图在原有的目标思维导图上对技术创新的子节点进行展开,得到技术创新之后新的子节点。
步骤S500、根据所述第二输入数据和更新后的所述目标思维导图生成第二回答数据。
具体地,系统获得更新后的目标思维导图以后,会继续根据第二输入数据和更新后的目标思维导图生成第二回答数据,通过第二回答数据给予用户第二关键词相关的问题的解答。
在一种实现方式中,所述根据所述第二输入数据和更新后的所述目标思维导图生成第二回答数据,包括:
针对每一所述子节点,根据所述第二输入数据和更新后的所述目标思维导图,生成所述子节点对应的子回答数据;
根据各所述子节点的所述子回答数据生成所述第二回答数据。
具体地,本实施例会通过第二输入数据和更新后的目标思维导图重新获取各子节点的子回答数据,再汇总得到第二回答数据。
在一种实现方式中,所述根据所述第二输入数据和更新后的所述目标思维导图,生成所述子节点对应的子回答数据,包括:
获取所述子节点对应的语料数据;
根据更新后的所述目标思维导图确定所述子节点对应的节点路径;
根据所述第二输入数据、所述语料数据以及所述节点路径合成子提示数据,通过所述大语言模型基于所述子提示数据生成所述子节点对应的所述子回答数据。
具体地,以一个子节点的处理逻辑为例:在新一轮次的问答中,本实施例同样会通过检索数据库的方式获取该子节点的语料数据。然后通过更新后的目标思维导图确定父节点与该子节点之间的节点路径。结合第二输入数据、语料数据以及节点路径来生成大语言模型的输入提示,即该子节点的子提示数据。将该子提示数据输入大语言模型以后,大语言模型会参考该子提示数据进行解答,从而得到该子节点的子回答数据。
在一种实现方式中,所述根据各所述子节点的所述子回答数据生成所述第二回答数据,包括:
根据各所述子节点的所述子回答数据生成回答摘要数据;
将所述回答摘要数据和各所述子节点的所述子回答数据作为所述第二回答数据。
具体地,本实施例可以将生成的所有子回答数据进行汇总,并输出返回给用户。为了便于用户阅读,本实施例还可以通过大语言模型对所有子回答数据进行总结形成回答摘要数据,再依次输出各个子回答数据。
本发明的优点在于:
1.本发明提出一种通过大语言模型生成思维导图的方法,来引导系统对用户问题的回答,可以提升系统回答问题的全面性,并获得系统对用户问题的多层次、全面深入的解答。
2.本发明提出一种基于思维导图进行问题追问的方法,可以降低用户交互成本,引导用户明确问题并进行深入分析解答,从而提升回答的准确性,并有效地解决现有的问答系统难以处理新出现的开放问题的缺陷。
基于上述实施例,本发明还提供了一种基于大语言模型的多轮问答系统,如图4所示,所述系统包括:
抽取模块01,用于抽取第一输入数据的第一关键词;
构建模块02,用于根据所述第一关键词作为父节点构建目标思维导图,其中,所述目标思维导图包括至少一级的子节点;
回答模块03,用于根据所述第一输入数据和所述目标思维导图生成第一回答数据;
追问模块04,用于根据所述第一回答数据和所述子节点生成若干追问问题,若任一所述追问问题被选择,则将被选择的所述追问问题作为第二输入数据,抽取所述第二输入数据的第二关键词作为所述子节点更新所述目标思维导图;
循环模块05,用于根据所述第二输入数据和更新后的所述目标思维导图生成第二回答数据。
基于上述实施例,本发明还提供了一种终端,其原理框图可以如图5所示。该终端包括通过系统总线连接的处理器、存储器、网络接口、显示屏。其中,该终端的处理器用于提供计算和控制能力。该终端的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该终端的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现基于大语言模型的多轮问答方法。该终端的显示屏可以是液晶显示屏或者电子墨水显示屏。
本领域技术人员可以理解,图5中示出的原理框图,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的终端的限定,具体的终端可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一种实现方式中,所述终端的存储器中存储有一个以上的程序,且经配置以由一个以上处理器执行所述一个以上程序包含用于进行基于大语言模型的多轮问答方法的指令。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
综上所述,本发明公开了基于大语言模型的多轮问答方法、系统、终端及存储介质,涉及人工智能技术领域。所述方法包括:抽取第一输入数据的第一关键词;根据所述第一关键词作为父节点构建目标思维导图,其中,所述目标思维导图包括至少一级的子节点;根据所述第一输入数据和所述目标思维导图生成第一回答数据;根据所述第一回答数据和所述子节点生成若干追问问题,若任一所述追问问题被选择,则将被选择的所述追问问题作为第二输入数据,抽取所述第二输入数据的第二关键词作为所述子节点更新所述目标思维导图;根据所述第二输入数据和更新后的所述目标思维导图生成第二回答数据。本发明通过构建思维导图的方式来生成对用户问题的回答,并通过生成追问问题的方式来实现对用户问题的深入分析和解答。可以准确地把握用户意图,有效地提升系统回答的准确性和全面性。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (14)
1.一种基于大语言模型的多轮问答方法,其特征在于,所述方法包括:
抽取第一输入数据的第一关键词;
根据所述第一关键词作为父节点构建目标思维导图,其中,所述目标思维导图包括至少一级的子节点;
根据所述第一输入数据和所述目标思维导图生成第一回答数据;
根据所述第一回答数据和所述子节点生成若干追问问题,若任一所述追问问题被选择,则将被选择的所述追问问题作为第二输入数据,抽取所述第二输入数据的第二关键词作为所述子节点更新所述目标思维导图;
根据所述第二输入数据和更新后的所述目标思维导图生成第二回答数据。
2.根据权利要求1所述的基于大语言模型的多轮问答方法,其特征在于,所述根据所述第一关键词作为父节点构建目标思维导图,包括:
获取预设的思维导图数据库,其中,所述思维导图数据库中的思维导图模板以预设字符串进行存储,并建立索引;
根据所述第一关键词对所述思维导图数据库进行检索,得到若干候选思维导图模板;
根据所述第一关键词和各所述候选思维导图模板构建所述目标思维导图。
3.根据权利要求2所述的基于大语言模型的多轮问答方法,其特征在于,所述根据所述第一关键词对所述思维导图数据库进行检索,得到若干候选思维导图模板,包括:
以所述第一关键词在所述思维导图数据库进行检索或者向量相似度检索,得到若干所述候选思维导图模板。
4.根据权利要求2所述的基于大语言模型的多轮问答方法,其特征在于,所述根据所述第一关键词和各所述候选思维导图模板构建所述目标思维导图,包括:
根据所述第一关键词和各所述候选思维导图模板,合成提示数据;
将所述提示数据输入所述大语言模型,得到所述目标思维导图。
5.根据权利要求1所述的基于大语言模型的多轮问答方法,其特征在于,所述根据所述第一输入数据和所述目标思维导图生成第一回答数据,包括:
针对每一所述子节点,根据所述第一输入数据和所述目标思维导图,生成所述子节点对应的子回答数据;
根据各所述子节点的所述子回答数据生成所述第一回答数据。
6.根据权利要求5所述的基于大语言模型的多轮问答方法,其特征在于,所述根据所述第一输入数据和所述目标思维导图,生成所述子节点对应的子回答数据,包括:
获取所述子节点对应的语料数据;
根据所述目标思维导图确定所述子节点对应的节点路径;
根据所述第一输入数据、所述语料数据以及所述节点路径合成子提示数据,通过所述大语言模型基于所述子提示数据生成所述子节点对应的所述子回答数据。
7.根据权利要求5所述的基于大语言模型的多轮问答方法,其特征在于,所述根据各所述子节点的所述子回答数据生成所述第一回答数据,包括:
根据各所述子节点的所述子回答数据生成回答摘要数据;
将所述回答摘要数据和各所述子节点的所述子回答数据作为所述第一回答数据。
8.根据权利要求1所述的基于大语言模型的多轮问答方法,其特征在于,所述根据所述第一回答数据和所述子节点生成若干追问问题,包括:
将所述目标思维导图中所述第一关键词对应的下一级作为目标级;
根据所述第一回答数据和所述目标级的所述子节点生成若干所述追问问题。
9.根据权利要求8所述的基于大语言模型的多轮问答方法,其特征在于,所述根据所述第一回答数据和所述目标级的所述子节点生成若干所述追问问题,包括:
根据所述第一回答数据和所述目标级的所述子节点,生成若干候选追问问题;
通过历史问答数据对各所述候选追问问题进行语义相关度计算,筛选得到若干所述追问问题。
10.根据权利要求1所述的基于大语言模型的多轮问答方法,其特征在于,所述抽取所述第二输入数据的第二关键词作为所述子节点更新所述目标思维导图,包括:
将所述第二关键词作为所述子节点构建对应于所述子节点的子目标思维导图;
以所述子目标思维导图更新所述目标思维导图。
11.根据权利要求10所述的基于大语言模型的多轮问答方法,其特征在于,所述以所述子目标思维导图更新所述目标思维导图,包括:
以所述子目标思维导图延伸或替换所述子节点,以更新所述目标思维导图。
12.一种基于大语言模型的多轮问答系统,其特征在于,所述系统包括:
抽取模块,用于抽取第一输入数据的第一关键词;
构建模块,用于根据所述第一关键词作为父节点构建目标思维导图,其中,所述目标思维导图包括至少一级的子节点;
回答模块,用于根据所述第一输入数据和所述目标思维导图生成第一回答数据;
追问模块,用于根据所述第一回答数据和所述子节点生成若干追问问题,若任一所述追问问题被选择,则将被选择的所述追问问题作为第二输入数据,抽取所述第二输入数据的第二关键词作为所述子节点更新所述目标思维导图;
循环模块,用于根据所述第二输入数据和更新后的所述目标思维导图生成第二回答数据。
13.一种终端,其特征在于,所述终端包括有存储器和一个以上处理器;所述存储器存储有一个以上的程序;所述程序包含用于执行如权利要求1-11中任一所述的基于大语言模型的多轮问答方法的指令;所述处理器用于执行所述程序。
14.一种计算机可读存储介质,其上存储有多条指令,其特征在于,所述指令适用于由处理器加载并执行,以实现上述权利要求1-11任一所述的基于大语言模型的多轮问答方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410179941.XA CN117725190B (zh) | 2024-02-18 | 2024-02-18 | 基于大语言模型的多轮问答方法、系统、终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410179941.XA CN117725190B (zh) | 2024-02-18 | 2024-02-18 | 基于大语言模型的多轮问答方法、系统、终端及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117725190A true CN117725190A (zh) | 2024-03-19 |
CN117725190B CN117725190B (zh) | 2024-06-04 |
Family
ID=90209290
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410179941.XA Active CN117725190B (zh) | 2024-02-18 | 2024-02-18 | 基于大语言模型的多轮问答方法、系统、终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117725190B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017041372A1 (zh) * | 2015-09-07 | 2017-03-16 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN108647209A (zh) * | 2018-05-10 | 2018-10-12 | 北京理工大学珠海学院 | 一种基于思维导图的题目生成方法 |
CN111126553A (zh) * | 2019-12-25 | 2020-05-08 | 平安银行股份有限公司 | 智能机器人面试方法、设备、存储介质及装置 |
CN111753554A (zh) * | 2020-06-28 | 2020-10-09 | 深圳前海微众银行股份有限公司 | 一种意图知识库的生成方法及装置 |
CN112270182A (zh) * | 2020-11-12 | 2021-01-26 | 佰聆数据股份有限公司 | 一种基于多轮对话问答式的分析思路衍生方法、系统及存储介质 |
CN112328772A (zh) * | 2020-11-23 | 2021-02-05 | 上海尘微科技有限公司 | 一种基于思维导图的多轮对话设计方法 |
WO2021082982A1 (zh) * | 2019-10-29 | 2021-05-06 | 平安科技(深圳)有限公司 | 基于图谱化知识库的问答方法、设备、存储介质及装置 |
US20210406291A1 (en) * | 2020-06-24 | 2021-12-30 | Samsung Electronics Co., Ltd. | Dialog driven search system and method |
CN115409042A (zh) * | 2022-10-28 | 2022-11-29 | 北京果然智汇科技有限公司 | 一种基于思维导图的机器人问答方法及装置 |
CN115630146A (zh) * | 2022-10-10 | 2023-01-20 | 华南理工大学 | 基于人机交互的需求文档自动生成方法、装置和存储介质 |
CN116975336A (zh) * | 2023-07-20 | 2023-10-31 | 百度国际科技(深圳)有限公司 | 基于人工智能的图像处理方法、装置、设备及存储介质 |
CN116991996A (zh) * | 2023-07-21 | 2023-11-03 | 杭州师范大学 | 具有认知推理能力的问答交互模型的构建方法及应用 |
CN117194730A (zh) * | 2023-11-06 | 2023-12-08 | 北京枫清科技有限公司 | 一种意图识别和问答方法、装置、电子设备及存储介质 |
CN117271799A (zh) * | 2023-09-25 | 2023-12-22 | 中国电子科技集团公司第十研究所 | 一种基于知识图谱的多轮问答方法及系统 |
-
2024
- 2024-02-18 CN CN202410179941.XA patent/CN117725190B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017041372A1 (zh) * | 2015-09-07 | 2017-03-16 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN108647209A (zh) * | 2018-05-10 | 2018-10-12 | 北京理工大学珠海学院 | 一种基于思维导图的题目生成方法 |
WO2021082982A1 (zh) * | 2019-10-29 | 2021-05-06 | 平安科技(深圳)有限公司 | 基于图谱化知识库的问答方法、设备、存储介质及装置 |
CN111126553A (zh) * | 2019-12-25 | 2020-05-08 | 平安银行股份有限公司 | 智能机器人面试方法、设备、存储介质及装置 |
US20210406291A1 (en) * | 2020-06-24 | 2021-12-30 | Samsung Electronics Co., Ltd. | Dialog driven search system and method |
CN111753554A (zh) * | 2020-06-28 | 2020-10-09 | 深圳前海微众银行股份有限公司 | 一种意图知识库的生成方法及装置 |
CN112270182A (zh) * | 2020-11-12 | 2021-01-26 | 佰聆数据股份有限公司 | 一种基于多轮对话问答式的分析思路衍生方法、系统及存储介质 |
CN112328772A (zh) * | 2020-11-23 | 2021-02-05 | 上海尘微科技有限公司 | 一种基于思维导图的多轮对话设计方法 |
CN115630146A (zh) * | 2022-10-10 | 2023-01-20 | 华南理工大学 | 基于人机交互的需求文档自动生成方法、装置和存储介质 |
CN115409042A (zh) * | 2022-10-28 | 2022-11-29 | 北京果然智汇科技有限公司 | 一种基于思维导图的机器人问答方法及装置 |
CN116975336A (zh) * | 2023-07-20 | 2023-10-31 | 百度国际科技(深圳)有限公司 | 基于人工智能的图像处理方法、装置、设备及存储介质 |
CN116991996A (zh) * | 2023-07-21 | 2023-11-03 | 杭州师范大学 | 具有认知推理能力的问答交互模型的构建方法及应用 |
CN117271799A (zh) * | 2023-09-25 | 2023-12-22 | 中国电子科技集团公司第十研究所 | 一种基于知识图谱的多轮问答方法及系统 |
CN117194730A (zh) * | 2023-11-06 | 2023-12-08 | 北京枫清科技有限公司 | 一种意图识别和问答方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
陈金菊;王义真;欧石燕;: "基于道路法规知识图谱的多轮自动问答研究", 现代情报, no. 08, 1 August 2020 (2020-08-01) * |
Also Published As
Publication number | Publication date |
---|---|
CN117725190B (zh) | 2024-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9229927B2 (en) | Macro replacement of natural language input | |
CN110532397B (zh) | 基于人工智能的问答方法、装置、计算机设备及存储介质 | |
CN110457431A (zh) | 基于知识图谱的问答方法、装置、计算机设备和存储介质 | |
CN115422372A (zh) | 一种基于软件测试的知识图谱构建方法和系统 | |
CN117725895A (zh) | 文档生成方法、装置、设备及介质 | |
CN115878818B (zh) | 一种地理知识图谱构建方法、装置、终端及存储介质 | |
CN117725190B (zh) | 基于大语言模型的多轮问答方法、系统、终端及存储介质 | |
CN116974554A (zh) | 代码数据处理方法、装置、计算机设备和存储介质 | |
CN116383340A (zh) | 信息搜索方法、装置、电子设备和存储介质 | |
CN115658845A (zh) | 一种适用于开源软件供应链的智能问答方法及装置 | |
Dyvak et al. | System for web resources content structuring and recognizing with the machine learning elements | |
CN117540004B (zh) | 基于知识图谱和用户行为的工业领域智能问答方法及系统 | |
CN118070925B (zh) | 模型训练方法、装置、电子设备、存储介质及程序产品 | |
US11830081B2 (en) | Automated return evaluation with anomoly detection | |
CN116501841B (zh) | 数据模型模糊查询方法、系统及存储介质 | |
JP2019194759A (ja) | 対話システム補強装置及びコンピュータプログラム | |
CN111476037B (zh) | 文本处理方法、装置、计算机设备和存储介质 | |
CN113378543B (zh) | 数据分析方法、训练数据分析模型的方法及电子设备 | |
CN118193733A (zh) | 生成报告的方法、装置、电子设备和存储介质 | |
CN118261201A (zh) | 大语言模型的训练方法、利用大语言模型生成代码的方法 | |
CN118227655A (zh) | 数据库查询语句的生成方法、装置、设备及存储介质 | |
CN117852510A (zh) | 业务数据处理方法、装置、计算机设备和存储介质 | |
CN117493508A (zh) | 问答数据的生成方法、装置、计算机设备及存储介质 | |
CN117808124A (zh) | 一种基于Llama2的文本简化方法 | |
CN117008895A (zh) | 一种基于低代码开发平台的数据视图筛选方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |