CN116860938A

CN116860938A - 一种基于大语言模型的语音问答构建方法、装置及介质

Info

Publication number: CN116860938A
Application number: CN202310836892.8A
Authority: CN
Inventors: 陈开冉; 黎展; 陶峰
Original assignee: Guangzhou Tungee Technology Co ltd
Current assignee: Guangzhou Tungee Technology Co ltd
Priority date: 2023-07-07
Filing date: 2023-07-07
Publication date: 2023-10-10

Abstract

本发明公开了一种基于大语言模型的语音问答构建方法，包括：获取企业信息；根据所述企业信息构建企业prompt，将所述企业prompt输入大语言模型中获取若干第一行业知识点；对所述第一行业知识点进行知识凝练和知识去重获取第二行业知识点；根据所述第二行业知识点，构建问卷prompt，将所述问卷prompt输入大语言模型中获取话术问卷，通过所述话术问卷获取企业知识；根据所述企业知识构建话术prompt，将所述话术prompt输入大语言模型中获取应答话术；获取所述应答话术的语音答复信息，构建语音问答话术库，所述语音问答话术库包括问题以及对应的语音答复信息。本发明通过大语言模型自动挖掘行业知识并生成话术问卷快速搜集企业知识，以快速支撑话术冷启动。

Description

一种基于大语言模型的语音问答构建方法、装置及介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种基于大语言模型的语音问答构建方法、装置及介质。

背景技术

智能语音问答系统是一种根据用户问题自动进行答复的系统，目前，语音问答系统被广泛应用于企业的客服、销售等场景，由于采购方通常需要通过电话咨询的方式获取企业相关的产品或服务信息，因此企业的语音问答系统的回答质量会直接影响到采购方的成交意愿。

现有的企业语音问答系统在构建时，首先需要工作人员设计面向企业的问卷，问卷包含了采购方在通话中可能提及的产品相关问题，企业通过录音的方式回答问题，以实现适用于该企业的语音问答系统的冷启动，但现有技术往往面临如下问题：

1、工作人员对企业及其行业了解不深，工作人员需要花费精力了解行业知识，以使设计问卷难以贴合实际采购方所关注的知识点。

2、话术问卷构建过程繁琐，需要企业、工作人员多次配合，企业人员需要回答问卷问题并进行录音，降低了生成效率。

3、工作人员提供的问题不能覆盖到较冷门的知识点，在采购方询问时无法获得需要的信息。

发明内容

为了解决上述问题，本发明第一方面公开了一种基于大语言模型的语音问答构建方法，所述方法包括：

通过语音交互或文字交互获取企业信息，所述企业信息包括企业名称、话术名称及产品信息；

根据所述企业信息构建企业prompt，将所述企业prompt输入大语言模型中获取若干第一行业知识点；

对所述第一行业知识点进行知识凝练和知识去重，以获取第二行业知识点；

根据所述第二行业知识点，构建问卷prompt，将所述问卷prompt输入大语言模型中获取话术问卷，通过所述话术问卷获取企业知识；

根据所述企业知识构建话术prompt，将所述话术prompt输入大语言模型中获取应答话术；

获取所述应答话术的语音答复信息，构建语音问答话术库，所述语音问答话术库包括问题以及对应的语音答复信息。

进一步的实施例，所述企业prompt用于引导所述大语言模型在电销场景下询问所述产品信息相关的第一行业知识点。

进一步的实施例，所述问卷prompt用于引导所述大语言模型将所述第二行业知识点转化为问题以及参考回答要素，基于所述参考回答要素生成参考回答样例，结合所述问题、参考回答要素以及参考回答样例生成话术问卷。

进一步的实施例，所述话术prompt用于引导所述大语言模型将所述企业知识转化为基于客服角色的应答话术。

进一步的实施例，对所述第一行业知识点进行知识凝练时，使用语义匹配模型对数个所述第一行业知识点进行交叉匹配，并通过投票机制筛选出高频率的所述第一行业知识点。

进一步的实施例，对所述第一行业知识点进行知识去重时，对知识凝练后的所述第一行业知识点通过所述语义匹配模型进行重复判定以去除所述第一行业知识点中相同的知识点。

进一步的实施例，当所述语音问答话术库运行时，以设定的周期进行知识发现，所述知识发现包括：在所述语音问答话术库运行时，收集问题并通过所述语义匹配模型进行聚类，获取第三行业知识点，将所述第三行业知识点补充至所述第一行业知识点中。

进一步的实施例，在对所述第一行业知识点进行知识凝练和知识去重，获取第二行业知识点后，还包括：根据所述第二行业知识点构建问题prompt，所述问题prompt用于指导所述大语言模型获取对应所述第二行业知识点的若干问题形式；将所述第二行业知识点的若干问题形式补充至所述语音问答话术库。

进一步的实施例，获取所述应答话术的语音答复信息时，通过TTS接口将文本形式的所述应答话术转换为语音形式的所述语音答复信息。

本发明第二方面公开了一种基于大语言模型的语音问答构建装置，所述装置包括：

信息获取模块，其用于通过语音交互或文字交互获取企业信息，所述企业信息包括企业名称、话术名称及产品信息；

第一知识点模块，其用于根据所述企业信息构建企业prompt，将所述企业prompt输入大语言模型中获取若干第一行业知识点；

第二知识点模块，其用于对所述第一行业知识点进行知识凝练和知识去重，以获取第二行业知识点。

问卷生成模块，其用于根据所述第二行业知识点，构建问卷prompt，将所述问卷prompt输入大语言模型中获取话术问卷，通过所述话术问卷获取企业知识；

话术生成模块，其用于根据所述企业知识构建话术prompt，将所述话术prompt输入大语言模型中获取应答话术；

话术构建模块，其用于获取所述应答话术的语音答复信息，构建语音问答话术库，所述语音问答话术库包括问题以及对应的语音答复信息。

本发明第三方面公开了一种计算机存储介质，所述计算机存储介质存储有计算机指令，所述计算机指令被调用时，用于执行本发明第一方面公开的基于大语言模型的语音问答构建方法中的部分或全部步骤。

与现有技术相比，本发明实施例具有以下有益效果：

本发明实施例中，首先获取企业信息，以判断企业所在的行业知识；基于大语音模型构建企业prompt获取第一行业知识点，并根据第一行业知识点生成话术问卷；充分利用了大语言模型中包括了海量行业知识的优点，使得生成的第一行业知识点更加全面贴切，免去了工作人员了解行业知识的过程，提高了语音问答话术的制作效率。通过话术问卷收集企业知识，企业可以通过语音或者文字的方式将企业知识补充到对应的问题下，快速支撑话术的冷启动。通过知识凝练以及知识去重使得知识点更加贴合采购商所关注的热点，确保收集到的企业知识能够用于回答大部分问题。通过话术prompt将企业知识转化为正式回答，并进一步转化为语音形式的语音答复信息以回答采购商的问题，有效减少了企业的负担，帮助企业快速构建产品话术。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种基于大语言模型的语音问答构建方法的流程示意图；

图2是本发明实施例公开的一种基于大语言模型的语音问答构建装置的结构示意图；

图3是本发明实施例公开的一种计算机存储介质的结构示意图。

具体实施例

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或端没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本发明实施方式中的大语言模型是指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务，如文本分类、问答、对话等，是通向人工智能的一条重要途径。现有的大语言模型如ChatGPT、文心一言都提供了可供外部调用的接口。

prompt是人工智能提示词，是一种利用自然语言来指导或激发人工智能模型完成特定任务的方法。prompt的作用是给大语言模型提示输入信息的上下文和输入模型的参数信息。训练有监督学习或者无监督学习的模型时，prompt可以帮助模型更好地理解输入的意图，并作出相应的响应。

本发明公开了一种基于大语言模型的语音问答构建方法、装置及介质，本发明实施例中，首先获取企业信息，以判断企业所在的行业知识；基于大语音模型构建企业prompt获取第一行业知识点，并根据第一行业知识点生成话术问卷；充分利用了大语言模型中包括了海量行业知识的优点，使得生成的第一行业知识点更加全面贴切，免去了工作人员了解行业知识的过程，提高了语音问答话术的制作效率。通过话术问卷收集企业知识，企业可以通过语音或者文字的方式将企业知识补充到对应的问题下，快速支撑话术的冷启动。通过知识凝练以及知识去重使得知识点更加贴合采购商所关注的热点，确保收集到的企业知识能够用于回答大部分问题。通过话术prompt将企业知识转化为正式回答，并进一步转化为语音形式的语音答复信息以回答采购商的问题，有效减少了企业的负担，帮助企业快速构建产品话术。以下分别进行详细说明。

实施例一

请参阅图1，图1是本发明实施例公开的一种基于大语言模型的语音问答构建方法的流程示意图。如图1所示，该基于大语言模型的语音问答构建方法可以包括以下操作：

S1.通过语音交互或文字交互获取企业信息，企业信息包括企业名称、话术名称及产品信息；

S2.根据企业信息构建企业prompt，将企业prompt输入大语言模型中获取若干第一行业知识点；可以理解的是，企业prompt用于引导大语言模型在电销场景下询问产品信息相关的第一行业知识点，该步骤中通过企业prompt使大语言模型扮演采购员角色，针对企业所售卖商品或服务在电销场景下询问第一行业知识点。

S3.对第一行业知识点进行知识凝练和知识去重，以获取第二行业知识点；可以理解的是，大语言模型生成的第一行业知识点，部分属于冷门的行业知识，电销场景下采购员通常不会关心并进行咨询，将其作为问卷问题不仅降低了企业体验，同时也降低了问答话术在回答采购员时的准确性。因此还需要对第一行业知识点进行知识凝练，对第一行业知识点进行知识凝练时，通过多次询问大语言模型，获得数个第一行业知识点，使用语义匹配模型对数个第一行业知识点进行交叉匹配，并通过投票机制筛选出高频率的第一行业知识点。高频率的定义可以提前设定为该第一行业知识点出现的次数或占比达到一定阈值后才进行提取。通过知识凝练，使得话术问卷更加专注于行业热点知识，确保制作的话术更加贴合采购员实际的关切热点。

由于第一行业知识点中，会包含不同表达但具有近似或相同含义的知识点，因此还需要对第一行业知识点进行知识去重，对第一行业知识点进行知识去重时，对知识凝练后的第一行业知识点通过语义匹配模型进行重复性判定以去除第一行业知识点中相同的知识点。

S4.根据第二行业知识点，构建问卷prompt，将问卷prompt输入大语言模型中获取话术问卷，通过话术问卷获取企业知识；具体地，所述问卷prompt用于引导所述大语言模型将所述第二行业知识点转化为问题以及参考回答要素，基于所述参考回答要素生成参考回答样例，结合所述问题、参考回答要素以及参考回答样例生成话术问卷，该问卷prompt中，主要基于第三方顾问的角色将知识点转换为对应知识点的问题。进一步的，企业通过回答大语言模型所制作的话术问卷，向大语言模型提供企业知识，用于构建准确的答复话术。进一步的，通过分别提供参考回答要素及参考回答样例使得企业能够帮助企业快速生成不同问题的答复话术。

S5.根据企业知识构建话术prompt，将话术prompt输入大语言模型中获取应答话术；可以理解的，由于获取的企业知识语气、形式等不够准确清晰，难以满足作为回答采购员的话术的要求，仍需要大语言模型对企业知识进行整理，以获得正式的应答内容。具体地，话术prompt用于引导大语言模型将企业知识转化为基于客服角色的应答话术。

S6.获取应答话术的语音答复信息，构建语音问答话术库，语音问答话术库包括问题以及对应的语音答复信息。获取应答话术的语音答复信息时，通过TTS接口将文本形式的应答话术转换为语音形式的语音答复信息。可以理解的是，TTS接口仅为本实施例中提出的一个可行方案，其他能够将文本转换为语音的技术方案同样在本申请的保护范围中。构建的语音问答话术库能够直接用于企业回答采购商的问题。自动化生成语音答复信息，有效减轻了企业工作量，便于快速生成适用于企业产品或服务的话术。

可选的一实施例中，在对所述第一行业知识点进行知识凝练和知识去重，获取第二行业知识点后，还包括：根据所述第二行业知识点构建问题prompt，所述问题prompt用于指导所述大语言模型获取对应所述第二行业知识点的若干问题形式；将所述第二行业知识点的若干问题形式补充至所述语音问答话术库。具体地，通过上述方案，丰富了每个知识点对应的常见的采购商行业问法，进一步提高语音问答话术库的可靠性，避免语音问答话术库在面对采购商根据同一知识点的不同问法时，无法调用对应该知识点的语音答复信息的问题。

可选的一实施例中，为了能够获取实际应用中采购商还可能会关注的知识点，当语音问答话术库运行时，以设定的周期进行知识发现，知识发现包括：在语音问答话术库运行时，收集问题并通过语义匹配模型进行聚类，获取第三行业知识点，将第三行业知识点补充至第一行业知识点中。通过大语言模型自动分析、归纳实际应用中用户关注的知识点，对应答话术进行迭代，提高应答话术在实际应用的效果。

本申请的至少具有以下有益效果：

(1)本发明通过大语言模型自动挖掘行业知识并生成话术问卷快速搜集企业知识，以快速支撑话术冷启动。

(2)通过知识凝练，使得话术问卷更加专注于行业热点知识，确保制作的话术更加贴合采购员实际的关切热点。

(3)自动化生成语音答复信息，有效减轻了企业工作量，便于快速生成适用于企业产品或服务的话术。

可见，实施图1所描述的基于大语言模型的语音问答构建方法，首先通过获取企业信息，以判断企业所在的行业知识；基于大语音模型构建企业prompt获取第一行业知识点，并根据第一行业知识点生成话术问卷；充分利用了大语言模型中包括了海量行业知识的优点，使得生成的第一行业知识点更加全面贴切，免去了工作人员了解行业知识的过程，提高了语音问答话术的制作效率。通过话术问卷收集企业知识，企业可以通过语音或者文字的方式将企业知识补充到对应的问题下，快速支撑话术的冷启动。通过知识凝练以及知识去重使得知识点更加贴合采购商所关注的热点，确保收集到的企业知识能够用于回答大部分问题。通过话术prompt将企业知识转化为正式回答，并进一步转化为语音形式的语音答复信息以回答采购商的问题，有效减少了企业的负担，帮助企业快速构建产品话术。

实施例二

请参阅图2，图2是本发明实施例公开的一种基于大语言模型的语音问答构建装置的结构示意图。如图2所示，该基于大语言模型的语音问答构建装置可以包括：

信息获取模块201，其用于通过语音交互或文字交互获取企业信息，企业信息包括企业名称、话术名称及产品信息；

第一知识点模块202，其用于根据企业信息构建企业prompt，将企业prompt输入大语言模型中获取若干第一行业知识点；可以理解的是，企业prompt用于引导大语言模型在电销场景下询问产品信息相关的第一行业知识点，该步骤中通过企业prompt使大语言模型扮演采购员角色，针对企业所售卖商品或服务在电销场景下询问第一行业知识点。

第二知识点模块203，其用于对第一行业知识点进行知识凝练和知识去重，以获取第二行业知识点。可以理解的是，大语言模型生成的第一行业知识点，部分属于冷门的行业知识，电销场景下采购员通常不会关心并进行咨询，将其作为问卷问题不仅降低了企业体验，同时也降低了问答话术在回答采购员时的准确性。因此还需要对第一行业知识点进行知识凝练，对第一行业知识点进行知识凝练时，通过多次询问大语言模型，获得数个第一行业知识点，使用语义匹配模型对数个第一行业知识点进行交叉匹配，并通过投票机制筛选出高频率的第一行业知识点。高频率的定义可以提前设定为该第一行业知识点出现的次数或占比达到一定阈值后才进行提取。通过知识凝练，使得话术问卷更加专注于行业热点知识，确保制作的话术更加贴合采购员实际的关切热点。

问卷生成模块204，其用于根据第二行业知识点，构建问卷prompt，将问卷prompt输入大语言模型中获取话术问卷，通过话术问卷获取企业知识；具体地，所述问卷prompt用于引导所述大语言模型将所述第二行业知识点转化为问题以及参考回答要素，基于所述参考回答要素生成参考回答样例，结合所述问题、参考回答要素以及参考回答样例生成话术问卷，该问卷prompt中，主要基于第三方顾问的角色将知识点转换为对应知识点的问题。进一步的，企业通过回答大语言模型所制作的话术问卷，向大语言模型提供企业知识，用于构建准确的答复话术。进一步的，通过分别提供参考回答要素及参考回答样例使得企业能够帮助企业快速生成不同问题的答复话术。

话术生成模块205，其用于根据企业知识构建话术prompt，将话术prompt输入大语言模型中获取应答话术；可以理解的，由于获取的企业知识语气、形式等不够准确清晰，难以满足作为回答采购员的话术的要求，仍需要大语言模型对企业知识进行整理，以获得正式的应答内容。具体地，话术prompt用于引导大语言模型将企业知识转化为基于客服角色的应答话术。

话术构建模块206，其用于获取应答话术的语音答复信息，构建语音问答话术库，语音问答话术库包括问题以及对应的语音答复信息。可选的一实施例中，在对所述第一行业知识点进行知识凝练和知识去重，获取第二行业知识点后，还包括：根据所述第二行业知识点构建问题prompt，所述问题prompt用于指导所述大语言模型获取对应所述第二行业知识点的若干问题形式；将所述第二行业知识点的若干问题形式补充至所述语音问答话术库。具体地，通过上述方案，丰富了每个知识点对应的常见的采购商行业问法，进一步提高语音问答话术库的可靠性，避免语音问答话术库在面对采购商根据同一知识点的不同问法时，无法调用对应该知识点的语音答复信息的问题。

上述实施例在应用时基于多服务器多节点进行部署，使得该装置支持多个账号切换构建的大语言模型服务能力，确保单个大语言模型或服务器或节点故障时能够自动切换，稳定保障大语言模型的应用。

对于上述基于大语言模型的语音问答构建装置的具体描述可以参照上述基于大语言模型的语音问答构建方法的具体描述，在此不再一一赘述。

实施例三

请参阅图3，图3是本发明实施例公开的一种计算机存储介质的结构示意图。如图3所示，本发明实施例公开了一种计算机存储介质301，计算机存储介质301存储有计算机指令，该计算机指令被调用时，用于执行本发明实施例一公开的基于大语言模型的语音问答构建方法中的步骤。

以上所描述的装置实施例仅是示意性的，其中作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施例的具体描述，本领域的技术人员可以清楚地了解到各实施例可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-OnlyMemory，ROM)、随机存储器(RandomAccessMemory，RAM)、可编程只读存储器(ProgrammableRead-onlyMemory，PROM)、可擦除可编程只读存储器(ErasableProgrammableReadOnlyMemory，EPROM)、一次可编程只读存储器(One-timeProgrammableRead-OnlyMemory，OTPROM)、电子抹除式可复写只读存储器(Electrically-ErasableProgrammableRead-OnlyMemory，EEPROM)、只读光盘(CompactDiscRead-OnlyMemory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

最后应说明的是：本发明实施例公开的一种基于大语言模型的语音问答构建方法、装置及介质所揭露的仅为本发明较佳实施例而已，仅用于说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解；其依然可以对前述各项实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或替换，并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

Claims

1.一种基于大语言模型的语音问答构建方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于大语言模型的语音问答构建方法，其特征在于，所述企业prompt用于引导所述大语言模型在电销场景下询问所述产品信息相关的第一行业知识点。

3.根据权利要求1所述的基于大语言模型的语音问答构建方法，其特征在于，所述问卷prompt用于引导所述大语言模型将所述第二行业知识点转化为问题以及参考回答要素，基于所述参考回答要素生成参考回答样例，结合所述问题、参考回答要素以及参考回答样例生成话术问卷。

4.根据权利要求1所述的基于大语言模型的语音问答构建方法，其特征在于，所述话术prompt用于引导所述大语言模型将所述企业知识转化为基于客服角色的应答话术。

5.根据权利要求1所述的基于大语言模型的语音问答构建方法，其特征在于，对所述第一行业知识点进行知识凝练时，使用语义匹配模型对数个所述第一行业知识点进行交叉匹配，并通过投票机制筛选出高频率的所述第一行业知识点。

6.根据权利要求5所述的基于大语言模型的语音问答构建方法，其特征在于，对所述第一行业知识点进行知识去重时，对知识凝练后的所述第一行业知识点通过所述语义匹配模型进行重复判定以去除所述第一行业知识点中相同的知识点。

7.根据权利要求1所述的基于大语言模型的语音问答构建方法，其特征在于，当所述语音问答话术库运行时，以设定的周期进行知识发现，所述知识发现包括：在所述语音问答话术库运行时，收集问题并通过所述语义匹配模型进行聚类，获取第三行业知识点，将所述第三行业知识点补充至所述第一行业知识点中。

8.根据权利要求1所述的基于大语言模型的语音问答构建方法，其特征在于，在对所述第一行业知识点进行知识凝练和知识去重，获取第二行业知识点后，还包括：

根据所述第二行业知识点构建问题prompt，所述问题prompt用于指导所述大语言模型获取对应所述第二行业知识点的若干问题形式；

将所述第二行业知识点的若干问题形式补充至所述语音问答话术库。

9.根据权利要求1所述的基于大语言模型的语音问答构建方法，其特征在于，获取所述应答话术的语音答复信息时，通过TTS接口将文本形式的所述应答话术转换为语音形式的所述语音答复信息。

10.一种基于大语言模型的语音问答构建装置，其特征在于，所述装置包括：

11.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-8任一项所述的基于大语言模型的语音问答构建方法。