CN116860938A - 一种基于大语言模型的语音问答构建方法、装置及介质 - Google Patents
一种基于大语言模型的语音问答构建方法、装置及介质 Download PDFInfo
- Publication number
- CN116860938A CN116860938A CN202310836892.8A CN202310836892A CN116860938A CN 116860938 A CN116860938 A CN 116860938A CN 202310836892 A CN202310836892 A CN 202310836892A CN 116860938 A CN116860938 A CN 116860938A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- enterprise
- language model
- answer
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 28
- 230000004044 response Effects 0.000 claims abstract description 35
- 238000009833 condensation Methods 0.000 claims abstract description 21
- 230000005494 condensation Effects 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims description 28
- 230000003993 interaction Effects 0.000 claims description 12
- 230000001502 supplementing effect Effects 0.000 claims description 7
- 230000007246 mechanism Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims 2
- 239000000047 product Substances 0.000 description 14
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于大语言模型的语音问答构建方法,包括:获取企业信息;根据所述企业信息构建企业prompt,将所述企业prompt输入大语言模型中获取若干第一行业知识点;对所述第一行业知识点进行知识凝练和知识去重获取第二行业知识点;根据所述第二行业知识点,构建问卷prompt,将所述问卷prompt输入大语言模型中获取话术问卷,通过所述话术问卷获取企业知识;根据所述企业知识构建话术prompt,将所述话术prompt输入大语言模型中获取应答话术;获取所述应答话术的语音答复信息,构建语音问答话术库,所述语音问答话术库包括问题以及对应的语音答复信息。本发明通过大语言模型自动挖掘行业知识并生成话术问卷快速搜集企业知识,以快速支撑话术冷启动。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于大语言模型的语音问答构建方法、装置及介质。
背景技术
智能语音问答系统是一种根据用户问题自动进行答复的系统,目前,语音问答系统被广泛应用于企业的客服、销售等场景,由于采购方通常需要通过电话咨询的方式获取企业相关的产品或服务信息,因此企业的语音问答系统的回答质量会直接影响到采购方的成交意愿。
现有的企业语音问答系统在构建时,首先需要工作人员设计面向企业的问卷,问卷包含了采购方在通话中可能提及的产品相关问题,企业通过录音的方式回答问题,以实现适用于该企业的语音问答系统的冷启动,但现有技术往往面临如下问题:
1、工作人员对企业及其行业了解不深,工作人员需要花费精力了解行业知识,以使设计问卷难以贴合实际采购方所关注的知识点。
2、话术问卷构建过程繁琐,需要企业、工作人员多次配合,企业人员需要回答问卷问题并进行录音,降低了生成效率。
3、工作人员提供的问题不能覆盖到较冷门的知识点,在采购方询问时无法获得需要的信息。
发明内容
为了解决上述问题,本发明第一方面公开了一种基于大语言模型的语音问答构建方法,所述方法包括:
通过语音交互或文字交互获取企业信息,所述企业信息包括企业名称、话术名称及产品信息;
根据所述企业信息构建企业prompt,将所述企业prompt输入大语言模型中获取若干第一行业知识点;
对所述第一行业知识点进行知识凝练和知识去重,以获取第二行业知识点;
根据所述第二行业知识点,构建问卷prompt,将所述问卷prompt输入大语言模型中获取话术问卷,通过所述话术问卷获取企业知识;
根据所述企业知识构建话术prompt,将所述话术prompt输入大语言模型中获取应答话术;
获取所述应答话术的语音答复信息,构建语音问答话术库,所述语音问答话术库包括问题以及对应的语音答复信息。
进一步的实施例,所述企业prompt用于引导所述大语言模型在电销场景下询问所述产品信息相关的第一行业知识点。
进一步的实施例,所述问卷prompt用于引导所述大语言模型将所述第二行业知识点转化为问题以及参考回答要素,基于所述参考回答要素生成参考回答样例,结合所述问题、参考回答要素以及参考回答样例生成话术问卷。
进一步的实施例,所述话术prompt用于引导所述大语言模型将所述企业知识转化为基于客服角色的应答话术。
进一步的实施例,对所述第一行业知识点进行知识凝练时,使用语义匹配模型对数个所述第一行业知识点进行交叉匹配,并通过投票机制筛选出高频率的所述第一行业知识点。
进一步的实施例,对所述第一行业知识点进行知识去重时,对知识凝练后的所述第一行业知识点通过所述语义匹配模型进行重复判定以去除所述第一行业知识点中相同的知识点。
进一步的实施例,当所述语音问答话术库运行时,以设定的周期进行知识发现,所述知识发现包括:在所述语音问答话术库运行时,收集问题并通过所述语义匹配模型进行聚类,获取第三行业知识点,将所述第三行业知识点补充至所述第一行业知识点中。
进一步的实施例,在对所述第一行业知识点进行知识凝练和知识去重,获取第二行业知识点后,还包括:根据所述第二行业知识点构建问题prompt,所述问题prompt用于指导所述大语言模型获取对应所述第二行业知识点的若干问题形式;将所述第二行业知识点的若干问题形式补充至所述语音问答话术库。
进一步的实施例,获取所述应答话术的语音答复信息时,通过TTS接口将文本形式的所述应答话术转换为语音形式的所述语音答复信息。
本发明第二方面公开了一种基于大语言模型的语音问答构建装置,所述装置包括:
信息获取模块,其用于通过语音交互或文字交互获取企业信息,所述企业信息包括企业名称、话术名称及产品信息;
第一知识点模块,其用于根据所述企业信息构建企业prompt,将所述企业prompt输入大语言模型中获取若干第一行业知识点;
第二知识点模块,其用于对所述第一行业知识点进行知识凝练和知识去重,以获取第二行业知识点。
问卷生成模块,其用于根据所述第二行业知识点,构建问卷prompt,将所述问卷prompt输入大语言模型中获取话术问卷,通过所述话术问卷获取企业知识;
话术生成模块,其用于根据所述企业知识构建话术prompt,将所述话术prompt输入大语言模型中获取应答话术;
话术构建模块,其用于获取所述应答话术的语音答复信息,构建语音问答话术库,所述语音问答话术库包括问题以及对应的语音答复信息。
本发明第三方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明第一方面公开的基于大语言模型的语音问答构建方法中的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,首先获取企业信息,以判断企业所在的行业知识;基于大语音模型构建企业prompt获取第一行业知识点,并根据第一行业知识点生成话术问卷;充分利用了大语言模型中包括了海量行业知识的优点,使得生成的第一行业知识点更加全面贴切,免去了工作人员了解行业知识的过程,提高了语音问答话术的制作效率。通过话术问卷收集企业知识,企业可以通过语音或者文字的方式将企业知识补充到对应的问题下,快速支撑话术的冷启动。通过知识凝练以及知识去重使得知识点更加贴合采购商所关注的热点,确保收集到的企业知识能够用于回答大部分问题。通过话术prompt将企业知识转化为正式回答,并进一步转化为语音形式的语音答复信息以回答采购商的问题,有效减少了企业的负担,帮助企业快速构建产品话术。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种基于大语言模型的语音问答构建方法的流程示意图;
图2是本发明实施例公开的一种基于大语言模型的语音问答构建装置的结构示意图;
图3是本发明实施例公开的一种计算机存储介质的结构示意图。
具体实施例
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或端没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明实施方式中的大语言模型是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等,是通向人工智能的一条重要途径。现有的大语言模型如ChatGPT、文心一言都提供了可供外部调用的接口。
prompt是人工智能提示词,是一种利用自然语言来指导或激发人工智能模型完成特定任务的方法。prompt的作用是给大语言模型提示输入信息的上下文和输入模型的参数信息。训练有监督学习或者无监督学习的模型时,prompt可以帮助模型更好地理解输入的意图,并作出相应的响应。
本发明公开了一种基于大语言模型的语音问答构建方法、装置及介质,本发明实施例中,首先获取企业信息,以判断企业所在的行业知识;基于大语音模型构建企业prompt获取第一行业知识点,并根据第一行业知识点生成话术问卷;充分利用了大语言模型中包括了海量行业知识的优点,使得生成的第一行业知识点更加全面贴切,免去了工作人员了解行业知识的过程,提高了语音问答话术的制作效率。通过话术问卷收集企业知识,企业可以通过语音或者文字的方式将企业知识补充到对应的问题下,快速支撑话术的冷启动。通过知识凝练以及知识去重使得知识点更加贴合采购商所关注的热点,确保收集到的企业知识能够用于回答大部分问题。通过话术prompt将企业知识转化为正式回答,并进一步转化为语音形式的语音答复信息以回答采购商的问题,有效减少了企业的负担,帮助企业快速构建产品话术。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种基于大语言模型的语音问答构建方法的流程示意图。如图1所示,该基于大语言模型的语音问答构建方法可以包括以下操作:
S1.通过语音交互或文字交互获取企业信息,企业信息包括企业名称、话术名称及产品信息;
S2.根据企业信息构建企业prompt,将企业prompt输入大语言模型中获取若干第一行业知识点;可以理解的是,企业prompt用于引导大语言模型在电销场景下询问产品信息相关的第一行业知识点,该步骤中通过企业prompt使大语言模型扮演采购员角色,针对企业所售卖商品或服务在电销场景下询问第一行业知识点。
S3.对第一行业知识点进行知识凝练和知识去重,以获取第二行业知识点;可以理解的是,大语言模型生成的第一行业知识点,部分属于冷门的行业知识,电销场景下采购员通常不会关心并进行咨询,将其作为问卷问题不仅降低了企业体验,同时也降低了问答话术在回答采购员时的准确性。因此还需要对第一行业知识点进行知识凝练,对第一行业知识点进行知识凝练时,通过多次询问大语言模型,获得数个第一行业知识点,使用语义匹配模型对数个第一行业知识点进行交叉匹配,并通过投票机制筛选出高频率的第一行业知识点。高频率的定义可以提前设定为该第一行业知识点出现的次数或占比达到一定阈值后才进行提取。通过知识凝练,使得话术问卷更加专注于行业热点知识,确保制作的话术更加贴合采购员实际的关切热点。
由于第一行业知识点中,会包含不同表达但具有近似或相同含义的知识点,因此还需要对第一行业知识点进行知识去重,对第一行业知识点进行知识去重时,对知识凝练后的第一行业知识点通过语义匹配模型进行重复性判定以去除第一行业知识点中相同的知识点。
S4.根据第二行业知识点,构建问卷prompt,将问卷prompt输入大语言模型中获取话术问卷,通过话术问卷获取企业知识;具体地,所述问卷prompt用于引导所述大语言模型将所述第二行业知识点转化为问题以及参考回答要素,基于所述参考回答要素生成参考回答样例,结合所述问题、参考回答要素以及参考回答样例生成话术问卷,该问卷prompt中,主要基于第三方顾问的角色将知识点转换为对应知识点的问题。进一步的,企业通过回答大语言模型所制作的话术问卷,向大语言模型提供企业知识,用于构建准确的答复话术。进一步的,通过分别提供参考回答要素及参考回答样例使得企业能够帮助企业快速生成不同问题的答复话术。
S5.根据企业知识构建话术prompt,将话术prompt输入大语言模型中获取应答话术;可以理解的,由于获取的企业知识语气、形式等不够准确清晰,难以满足作为回答采购员的话术的要求,仍需要大语言模型对企业知识进行整理,以获得正式的应答内容。具体地,话术prompt用于引导大语言模型将企业知识转化为基于客服角色的应答话术。
S6.获取应答话术的语音答复信息,构建语音问答话术库,语音问答话术库包括问题以及对应的语音答复信息。获取应答话术的语音答复信息时,通过TTS接口将文本形式的应答话术转换为语音形式的语音答复信息。可以理解的是,TTS接口仅为本实施例中提出的一个可行方案,其他能够将文本转换为语音的技术方案同样在本申请的保护范围中。构建的语音问答话术库能够直接用于企业回答采购商的问题。自动化生成语音答复信息,有效减轻了企业工作量,便于快速生成适用于企业产品或服务的话术。
可选的一实施例中,在对所述第一行业知识点进行知识凝练和知识去重,获取第二行业知识点后,还包括:根据所述第二行业知识点构建问题prompt,所述问题prompt用于指导所述大语言模型获取对应所述第二行业知识点的若干问题形式;将所述第二行业知识点的若干问题形式补充至所述语音问答话术库。具体地,通过上述方案,丰富了每个知识点对应的常见的采购商行业问法,进一步提高语音问答话术库的可靠性,避免语音问答话术库在面对采购商根据同一知识点的不同问法时,无法调用对应该知识点的语音答复信息的问题。
可选的一实施例中,为了能够获取实际应用中采购商还可能会关注的知识点,当语音问答话术库运行时,以设定的周期进行知识发现,知识发现包括:在语音问答话术库运行时,收集问题并通过语义匹配模型进行聚类,获取第三行业知识点,将第三行业知识点补充至第一行业知识点中。通过大语言模型自动分析、归纳实际应用中用户关注的知识点,对应答话术进行迭代,提高应答话术在实际应用的效果。
本申请的至少具有以下有益效果:
(1)本发明通过大语言模型自动挖掘行业知识并生成话术问卷快速搜集企业知识,以快速支撑话术冷启动。
(2)通过知识凝练,使得话术问卷更加专注于行业热点知识,确保制作的话术更加贴合采购员实际的关切热点。
(3)自动化生成语音答复信息,有效减轻了企业工作量,便于快速生成适用于企业产品或服务的话术。
可见,实施图1所描述的基于大语言模型的语音问答构建方法,首先通过获取企业信息,以判断企业所在的行业知识;基于大语音模型构建企业prompt获取第一行业知识点,并根据第一行业知识点生成话术问卷;充分利用了大语言模型中包括了海量行业知识的优点,使得生成的第一行业知识点更加全面贴切,免去了工作人员了解行业知识的过程,提高了语音问答话术的制作效率。通过话术问卷收集企业知识,企业可以通过语音或者文字的方式将企业知识补充到对应的问题下,快速支撑话术的冷启动。通过知识凝练以及知识去重使得知识点更加贴合采购商所关注的热点,确保收集到的企业知识能够用于回答大部分问题。通过话术prompt将企业知识转化为正式回答,并进一步转化为语音形式的语音答复信息以回答采购商的问题,有效减少了企业的负担,帮助企业快速构建产品话术。
实施例二
请参阅图2,图2是本发明实施例公开的一种基于大语言模型的语音问答构建装置的结构示意图。如图2所示,该基于大语言模型的语音问答构建装置可以包括:
信息获取模块201,其用于通过语音交互或文字交互获取企业信息,企业信息包括企业名称、话术名称及产品信息;
第一知识点模块202,其用于根据企业信息构建企业prompt,将企业prompt输入大语言模型中获取若干第一行业知识点;可以理解的是,企业prompt用于引导大语言模型在电销场景下询问产品信息相关的第一行业知识点,该步骤中通过企业prompt使大语言模型扮演采购员角色,针对企业所售卖商品或服务在电销场景下询问第一行业知识点。
第二知识点模块203,其用于对第一行业知识点进行知识凝练和知识去重,以获取第二行业知识点。可以理解的是,大语言模型生成的第一行业知识点,部分属于冷门的行业知识,电销场景下采购员通常不会关心并进行咨询,将其作为问卷问题不仅降低了企业体验,同时也降低了问答话术在回答采购员时的准确性。因此还需要对第一行业知识点进行知识凝练,对第一行业知识点进行知识凝练时,通过多次询问大语言模型,获得数个第一行业知识点,使用语义匹配模型对数个第一行业知识点进行交叉匹配,并通过投票机制筛选出高频率的第一行业知识点。高频率的定义可以提前设定为该第一行业知识点出现的次数或占比达到一定阈值后才进行提取。通过知识凝练,使得话术问卷更加专注于行业热点知识,确保制作的话术更加贴合采购员实际的关切热点。
由于第一行业知识点中,会包含不同表达但具有近似或相同含义的知识点,因此还需要对第一行业知识点进行知识去重,对第一行业知识点进行知识去重时,对知识凝练后的第一行业知识点通过语义匹配模型进行重复性判定以去除第一行业知识点中相同的知识点。
问卷生成模块204,其用于根据第二行业知识点,构建问卷prompt,将问卷prompt输入大语言模型中获取话术问卷,通过话术问卷获取企业知识;具体地,所述问卷prompt用于引导所述大语言模型将所述第二行业知识点转化为问题以及参考回答要素,基于所述参考回答要素生成参考回答样例,结合所述问题、参考回答要素以及参考回答样例生成话术问卷,该问卷prompt中,主要基于第三方顾问的角色将知识点转换为对应知识点的问题。进一步的,企业通过回答大语言模型所制作的话术问卷,向大语言模型提供企业知识,用于构建准确的答复话术。进一步的,通过分别提供参考回答要素及参考回答样例使得企业能够帮助企业快速生成不同问题的答复话术。
话术生成模块205,其用于根据企业知识构建话术prompt,将话术prompt输入大语言模型中获取应答话术;可以理解的,由于获取的企业知识语气、形式等不够准确清晰,难以满足作为回答采购员的话术的要求,仍需要大语言模型对企业知识进行整理,以获得正式的应答内容。具体地,话术prompt用于引导大语言模型将企业知识转化为基于客服角色的应答话术。
话术构建模块206,其用于获取应答话术的语音答复信息,构建语音问答话术库,语音问答话术库包括问题以及对应的语音答复信息。可选的一实施例中,在对所述第一行业知识点进行知识凝练和知识去重,获取第二行业知识点后,还包括:根据所述第二行业知识点构建问题prompt,所述问题prompt用于指导所述大语言模型获取对应所述第二行业知识点的若干问题形式;将所述第二行业知识点的若干问题形式补充至所述语音问答话术库。具体地,通过上述方案,丰富了每个知识点对应的常见的采购商行业问法,进一步提高语音问答话术库的可靠性,避免语音问答话术库在面对采购商根据同一知识点的不同问法时,无法调用对应该知识点的语音答复信息的问题。
上述实施例在应用时基于多服务器多节点进行部署,使得该装置支持多个账号切换构建的大语言模型服务能力,确保单个大语言模型或服务器或节点故障时能够自动切换,稳定保障大语言模型的应用。
对于上述基于大语言模型的语音问答构建装置的具体描述可以参照上述基于大语言模型的语音问答构建方法的具体描述,在此不再一一赘述。
实施例三
请参阅图3,图3是本发明实施例公开的一种计算机存储介质的结构示意图。如图3所示,本发明实施例公开了一种计算机存储介质301,计算机存储介质301存储有计算机指令,该计算机指令被调用时,用于执行本发明实施例一公开的基于大语言模型的语音问答构建方法中的步骤。
以上所描述的装置实施例仅是示意性的,其中作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施例的具体描述,本领域的技术人员可以清楚地了解到各实施例可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-OnlyMemory,ROM)、随机存储器(RandomAccessMemory,RAM)、可编程只读存储器(ProgrammableRead-onlyMemory,PROM)、可擦除可编程只读存储器(ErasableProgrammableReadOnlyMemory,EPROM)、一次可编程只读存储器(One-timeProgrammableRead-OnlyMemory,OTPROM)、电子抹除式可复写只读存储器(Electrically-ErasableProgrammableRead-OnlyMemory,EEPROM)、只读光盘(CompactDiscRead-OnlyMemory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
最后应说明的是:本发明实施例公开的一种基于大语言模型的语音问答构建方法、装置及介质所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。
Claims (11)
1.一种基于大语言模型的语音问答构建方法,其特征在于,所述方法包括:
通过语音交互或文字交互获取企业信息,所述企业信息包括企业名称、话术名称及产品信息;
根据所述企业信息构建企业prompt,将所述企业prompt输入大语言模型中获取若干第一行业知识点;
对所述第一行业知识点进行知识凝练和知识去重,以获取第二行业知识点;
根据所述第二行业知识点,构建问卷prompt,将所述问卷prompt输入大语言模型中获取话术问卷,通过所述话术问卷获取企业知识;
根据所述企业知识构建话术prompt,将所述话术prompt输入大语言模型中获取应答话术;
获取所述应答话术的语音答复信息,构建语音问答话术库,所述语音问答话术库包括问题以及对应的语音答复信息。
2.根据权利要求1所述的基于大语言模型的语音问答构建方法,其特征在于,所述企业prompt用于引导所述大语言模型在电销场景下询问所述产品信息相关的第一行业知识点。
3.根据权利要求1所述的基于大语言模型的语音问答构建方法,其特征在于,所述问卷prompt用于引导所述大语言模型将所述第二行业知识点转化为问题以及参考回答要素,基于所述参考回答要素生成参考回答样例,结合所述问题、参考回答要素以及参考回答样例生成话术问卷。
4.根据权利要求1所述的基于大语言模型的语音问答构建方法,其特征在于,所述话术prompt用于引导所述大语言模型将所述企业知识转化为基于客服角色的应答话术。
5.根据权利要求1所述的基于大语言模型的语音问答构建方法,其特征在于,对所述第一行业知识点进行知识凝练时,使用语义匹配模型对数个所述第一行业知识点进行交叉匹配,并通过投票机制筛选出高频率的所述第一行业知识点。
6.根据权利要求5所述的基于大语言模型的语音问答构建方法,其特征在于,对所述第一行业知识点进行知识去重时,对知识凝练后的所述第一行业知识点通过所述语义匹配模型进行重复判定以去除所述第一行业知识点中相同的知识点。
7.根据权利要求1所述的基于大语言模型的语音问答构建方法,其特征在于,当所述语音问答话术库运行时,以设定的周期进行知识发现,所述知识发现包括:在所述语音问答话术库运行时,收集问题并通过所述语义匹配模型进行聚类,获取第三行业知识点,将所述第三行业知识点补充至所述第一行业知识点中。
8.根据权利要求1所述的基于大语言模型的语音问答构建方法,其特征在于,在对所述第一行业知识点进行知识凝练和知识去重,获取第二行业知识点后,还包括:
根据所述第二行业知识点构建问题prompt,所述问题prompt用于指导所述大语言模型获取对应所述第二行业知识点的若干问题形式;
将所述第二行业知识点的若干问题形式补充至所述语音问答话术库。
9.根据权利要求1所述的基于大语言模型的语音问答构建方法,其特征在于,获取所述应答话术的语音答复信息时,通过TTS接口将文本形式的所述应答话术转换为语音形式的所述语音答复信息。
10.一种基于大语言模型的语音问答构建装置,其特征在于,所述装置包括:
信息获取模块,其用于通过语音交互或文字交互获取企业信息,所述企业信息包括企业名称、话术名称及产品信息;
第一知识点模块,其用于根据所述企业信息构建企业prompt,将所述企业prompt输入大语言模型中获取若干第一行业知识点;
第二知识点模块,其用于对所述第一行业知识点进行知识凝练和知识去重,以获取第二行业知识点。
问卷生成模块,其用于根据所述第二行业知识点,构建问卷prompt,将所述问卷prompt输入大语言模型中获取话术问卷,通过所述话术问卷获取企业知识;
话术生成模块,其用于根据所述企业知识构建话术prompt,将所述话术prompt输入大语言模型中获取应答话术;
话术构建模块,其用于获取所述应答话术的语音答复信息,构建语音问答话术库,所述语音问答话术库包括问题以及对应的语音答复信息。
11.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8任一项所述的基于大语言模型的语音问答构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310836892.8A CN116860938A (zh) | 2023-07-07 | 2023-07-07 | 一种基于大语言模型的语音问答构建方法、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310836892.8A CN116860938A (zh) | 2023-07-07 | 2023-07-07 | 一种基于大语言模型的语音问答构建方法、装置及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116860938A true CN116860938A (zh) | 2023-10-10 |
Family
ID=88229949
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310836892.8A Pending CN116860938A (zh) | 2023-07-07 | 2023-07-07 | 一种基于大语言模型的语音问答构建方法、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116860938A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117609444A (zh) * | 2023-11-08 | 2024-02-27 | 天讯瑞达通信技术有限公司 | 一种基于大模型的搜索问答方法 |
-
2023
- 2023-07-07 CN CN202310836892.8A patent/CN116860938A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117609444A (zh) * | 2023-11-08 | 2024-02-27 | 天讯瑞达通信技术有限公司 | 一种基于大模型的搜索问答方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11087094B2 (en) | System and method for generation of conversation graphs | |
KR102431754B1 (ko) | 인공지능기반 상담지원장치 | |
US8626520B2 (en) | Apparatus and method for processing service interactions | |
US7406413B2 (en) | Method and system for the processing of voice data and for the recognition of a language | |
US11189267B2 (en) | Intelligence-driven virtual assistant for automated idea documentation | |
US11798539B2 (en) | Systems and methods relating to bot authoring by mining intents from conversation data via intent seeding | |
CN115665325B (zh) | 一种智能外呼的方法、装置、电子设备及存储介质 | |
KR102100214B1 (ko) | 음성 인식 기반의 세일즈 대화 분석 방법 및 장치 | |
US20040002868A1 (en) | Method and system for the processing of voice data and the classification of calls | |
CN112235470B (zh) | 基于语音识别的来电客户跟进方法、装置及设备 | |
CN113297365B (zh) | 一种用户意向判定方法、装置、设备及存储介质 | |
CN112397061B (zh) | 线上互动方法、装置、设备和存储介质 | |
CN115643341A (zh) | 人工智能客服应答系统 | |
CN111402071B (zh) | 保险业智能客服机器人系统以及设备 | |
CN111858897A (zh) | 一种客服人员话术引导方法及系统 | |
US20040006464A1 (en) | Method and system for the processing of voice data by means of voice recognition and frequency analysis | |
Buddhika et al. | Voicer: A crowd sourcing tool for speech data collection | |
CN110047473A (zh) | 一种人机协作交互方法及系统 | |
CN116860938A (zh) | 一种基于大语言模型的语音问答构建方法、装置及介质 | |
US20220182253A1 (en) | Supporting a meeting | |
US7343288B2 (en) | Method and system for the processing and storing of voice information and corresponding timeline information | |
JP6988756B2 (ja) | タグ推定装置、タグ推定方法、プログラム | |
KR102653266B1 (ko) | 인공지능 기반의 챗봇 대화 상담 시스템 및 그 방법 | |
CN116935839A (zh) | 基于人工智能的语音客服服务方法及系统 | |
CN117093685A (zh) | 智能客服应用方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |