CN117932009A - 基于ChatGLM模型的保险客服对话生成方法、装置、设备及介质 - Google Patents

基于ChatGLM模型的保险客服对话生成方法、装置、设备及介质 Download PDF

Info

Publication number
CN117932009A
CN117932009A CN202311604158.5A CN202311604158A CN117932009A CN 117932009 A CN117932009 A CN 117932009A CN 202311604158 A CN202311604158 A CN 202311604158A CN 117932009 A CN117932009 A CN 117932009A
Authority
CN
China
Prior art keywords
information
target
insurance
model
text information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311604158.5A
Other languages
English (en)
Inventor
唐青霜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202311604158.5A priority Critical patent/CN117932009A/zh
Publication of CN117932009A publication Critical patent/CN117932009A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种基于ChatGLM模型的保险客服对话生成方法、装置、设备及介质,该基于ChatGLM模型的保险客服对话生成方法包括:获取目标问题信息,将目标问题信息转换为目标问题文本信息;获取目标用户信息,对目标用户信息进行身份校验;在身份校验通过之后,根据目标用户信息和目标问题文本信息,在保险数据库集群中检索得到N个相似答案文本信息,N>2;根据目标用户信息、目标问题文本信息和N个相似答案文本信息,生成保险背景提示模板;将保险背景提示模板输入至已经进行保险知识训练好的ChatGLM模型中,输出目标答案文本信息。该方法提高了保险客服回答的准确性。

Description

基于ChatGLM模型的保险客服对话生成方法、装置、设备及 介质
技术领域
本发明涉及人工智能领域,尤其涉及一种基于ChatGLM模型的保险客服对话生成方法、装置、设备及介质。
背景技术
在现有的保险客服咨询系统中,主要是通过人工基于现有客服系统的问答记录整理归纳出用户咨询的问题信息,并针对这些问题信息提前标注好相应的答案,构建出答案数据库,当用户访问保险客服咨询系统时,通过提取用户咨询问题的关键字来对已建立的答案数据库进行检索的方法,返回答案给用户。该方法在答案数据库储备前期,通常需要投入大量的人力去维护更新答案数据库的信息,并且在返回答案给用户时,只能返回答案数据库中已存储的答案,当用户咨询的问题信息超出答案数据库的存储信息范围时,将无法准确的解答用户的咨询请求。
发明内容
基于此,提供一种基于ChatGLM模型的保险客服对话生成方法、装置、设备及介质,以解决现有技术中解答用户咨询请求准确性较低的问题。
第一方面,本发明实施例提供一种基于ChatGLM模型的保险客服对话生成方法,所述方法包括以下步骤:
获取目标问题信息,将所述目标问题信息转换为目标问题文本信息;
获取目标用户信息,根据所述目标用户信息进行身份校验;
在所述身份校验通过之后,根据所述目标用户信息和所述目标问题文本信息,在保险数据库集群中检索得到N个相似答案文本信息,N>2;
根据所述目标用户信息,所述目标问题文本信息,以及N个所述相似答案文本信息,生成保险背景提示模板;
将所述保险背景提示模板输入至已经进行保险知识训练好的ChatGLM模型中,输出目标答案文本信息。
第二方面,本发明实施例提供一种基于ChatGLM模型的保险客服对话生成装置,所述装置包括:
目标问题信息转换模块,用于获取目标问题信息,将所述目标问题信息转换为目标问题文本信息;
目标用户信息校验模块,用于获取目标用户信息,根据所述目标用户信息进行身份校验;
相似答案信息检索模块,用于在所述身份校验通过之后,根据所述目标用户信息和所述目标问题文本信息,在保险数据库集群中检索得到N个相似答案文本信息,N>2;
背景提示模板生成模块,用于根据所述目标用户信息,所述目标问题文本信息,以及N个所述相似答案文本信息,生成保险背景提示模板;
目标答案信息输出模块,用于将所述保险背景提示模板输入至已经进行保险知识训练好的ChatGLM模型中,输出目标答案文本信息。
第三方面,本发明实施例提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于ChatGLM模型的保险客服对话生成方法的步骤。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于ChatGLM模型的保险客服对话生成方法的步骤。
第五方面,本发明实施例提供一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述基于ChatGLM模型的保险客服对话生成方法的步骤。
上述基于ChatGLM模型的保险客服对话生成方法、装置、设备及介质,通过将目标问题信息转换为目标问题文本信息,对目标用户信息进行身份校验,并在身份校验通过之后,根据目标用户信息和目标问题文本信息在保险数据库集群中检索得到N个相似答案文本信息,根据目标用户信息、目标问题文本信息和N个相似答案文本信息生成保险背景提示模板,并将该保险背景提示模板输入训练好的ChatGLM模型中,输出目标答案文本信息。
通过上述步骤,与现有的保险客服咨询系统相比,本发明以包含相似答案文本信息的保险背景提示模板作为ChatGLM模型的输入,以使ChatGLM模型通过对保险背景提示模板中的已知相似答案文本信息的理解和学习,并结合模型预训练时所获得的语言知识,对学习到的相似答案文本信息进行合理的推理和扩充,生成多个候选回答,返回最合适的答案给用户,提高了目标答案文本信息的准确性,而ChatGLM模型生成的目标答案文本信息,可以用来扩充答案数据库,进而高效的降低了人力维护答案数据库的成本。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中基于ChatGLM模型的保险客服对话生成方法的一应用环境示意图;
图2是本发明一实施例中基于ChatGLM模型的保险客服对话生成方法的一流程图;
图3是本发明一实施例中基于ChatGLM模型的保险客服对话生成方法中目标问题信息转换的一流程图;
图4是本发明一实施例中基于ChatGLM模型的保险客服对话生成方法中目标用户进行身份校验的一流程图;
图5是本发明一实施例中基于ChatGLM模型的保险客服对话生成方法中检索相似答案文本信息的一流程图;
图6是本发明一实施例中基于ChatGLM模型的保险客服对话生成方法中生成保险背景提示模版的一流程图;
图7是本发明一实施例中基于ChatGLM模型的保险客服对话生成方法中输出目标答案文本信息的一流程图;
图8是本发明一实施例中基于ChatGLM模型的保险客服对话生成装置的一原理框图;
图9是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请提供的基于ChatGLM模型的保险客服对话生成方法,可应用在如图1的应用环境中,其中,客户端(计算机设备)通过网络与服务端进行通信。客户端获取保险客服对话生成请求,并将保险客服对话生成请求发送至服务器。服务端获取到保险客服对话生成请求后,基于保险客服对话生成请求进行相应地处理,并响应该保险客服对话生成请求。其中,计算机设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种基于ChatGLM模型的保险客服对话生成方法,以该方法应用在图1中的服务端为例进行说明,包括如下步骤:
S10:获取目标问题信息,将所述目标问题信息转换为目标问题文本信息。
具体地,用户可以通过文本聊天框、电话和视频等方式来进行保险客服咨询,其所对应的目标问题信息可以为目标问题文本信息、目标问题语音信息或目标问题图片信息,或者是目标问题文本信息、目标问题语音信息和目标问题图片信息中的任意两种组合,或者是目标问题文本信息、目标问题语音信息和目标问题图片信息的三种组合。为了能够准确的了解和分析用户的咨询请求,通常需要预先通过语音文字转换技术和图片文字转换技术,分别将目标问题语音信息和目标问题图片信息转换为目标问题文本信息。
S20:获取目标用户信息,根据所述目标用户信息进行身份校验。
目标用户信息是指目标用户的登录密码信息或者目标用户的指纹、人脸信息,其中,目标用户的登录密码信息包括用户名和/或身份证号码,以及必要的登录密码。
具体地,若目标用户通过登录密码信息来进行身份校验,首先需要根据预定义验证信息的格式要求对目标用户登录密码信息中的身份证号码和登录密码的长度和格式进行校验。然后,对通过格式校验的用户进行身份校验,确定目标用户的身份信息。若目标用户通过指纹和/或人脸信息来进行身份校验,首先需要从目标用户输入的指纹或人脸图像信息中提取出关键的特征点,并根据提取出来的关键特征与用户注册后存储在用户信息库中的指纹或人脸图像模板进行比对,通过将提取的指纹或人脸图像的关键特征与用户信息库中的指纹或人脸图像模板进行相似度计算,然后,根据相似度计算结果来确定目标用户的身份信息。
S30:在所述身份校验通过之后,根据所述目标用户信息和所述目标问题文本信息,在保险数据库集群中检索得到N个相似答案文本信息。
具体地,首先,对通过身份校验的目标用户,通过关键字提取算法提取其所咨询的目标问题文本信息的关键字,并对提取出的关键字进行分析来确定目标用户的保险咨询类型,其次,根据用户的保险咨询类型,在保险数据库集群中确定解答目标问题文本信息所需要访问的目标保险数据库,并对用户信息库中存储的用户数据库访问权限表进行查询,确定目标用户对目标保险数据库的访问权限,然后,若目标用户对该目标保险数据库具有访问权限,则通过相似度计算算法来计算该目标保险数据库中的信息与目标问题文本信息之间的相似度,并根据计算得到的相似度大小,从目标保险数据库中选取N个相似答案文本信息。
S40:根据所述目标用户信息,所述目标问题文本信息,以及N个所述相似答案文本信息,生成保险背景提示模板。
保险背景提示模板是指在使用大型语言模型回答特定领域的专业知识时,向模型提供的相关领域的专业背景信息,其中,该大型语言模型可以是ChatGLM(Chat-basedLanguage Model)模型、GPT(Generative Pre-trained Transformer)模型和BERT(Bidirectional Encoder Representations from Transformers)模型等。
具体地,本发明中的保险背景提示模板包括目标用户信息、目标问题文本信息和N个相似答案文本信息,可根据不同的应用场景和需求调用LangChain开源框架中的提示模板模块来生成特定的保险背景提示模板,只需要输入相应的保险背景提示模板内容即可。
S50:将所述保险背景提示模板输入至已经进行保险知识训练好的ChatGLM模型中,输出目标答案文本信息。
ChatGLM模型是指基于自然语言处理技术的大型语言模型,其通过大规模的保险专业知识训练,已经学习到语言的语义信息和统计特征,并且能够基于模式匹配和统计规律根据相似的句子和词语进行合理的推理和扩充,生成连贯且有意义的回答。
具体地,首先,将生成的保险背景提示模板通过LangChain开源框架中的提示模板模块与模型交互模块之间的第二数据链路发送至模型交互模块调用的ChatGLM模型中,其次,通过文字向量转换技术将保险背景提示模板的文本内容转换为向量表示,然后,ChatGLM模型通过对保险背景提示模板所提供的的背景信息的理解和推理,并结合预训练时获得的语言知识和统计特征,生成多个候选答案,最后,ChatGLM模型对生成的多个候选答案进行评估和排序,输出最合适的候选答案作为目标答案文本信息。
在本实施例中,通过将目标问题信息转换为目标问题文本信息,并对目标用户信息进行身份校验,在身份校验通过之后,根据目标用户信息和目标问题文本信息在保险数据库集群中检索得到N个相似答案文本信息,根据目标用户信息、目标问题文本信息和N个相似答案文本信息生成保险背景提示模板,并将该保险背景提示模板输入训练好的ChatGLM模型中,输出目标答案文本信息。通过上述步骤,与现有的保险客服咨询系统相比,本发明以包含相似答案文本信息的保险背景提示模板作为ChatGLM模型的输入,ChatGLM模型通过对保险背景提示模板中的已知相似答案文本信息的理解和学习,并结合模型预训练时所获得的语言知识,对学习到的相似答案文本信息进行合理的推理和扩充,生成多个候选回答,返回最合适的答案给用户,提高了目标答案文本信息的准确性,而ChatGLM模型生成的目标答案文本信息,可以用来扩充答案数据库,进而高效的降低了人力维护答案数据库的成本。
在一实施例中,如图3所示,步骤S10中,将所述目标问题信息转换为目标问题文本信息,包括如下步骤:
S11:所述目标问题信息包括目标问题语音信息和/或目标问题图片信息。
具体地,用户可以通过发送文字、语音、图片和视频电话的方式,与保险客服进行咨询交流,则其所对应的目标问题信息的形式主要分为目标问题语音信息和目标问题图片信息。
S12:通过语音文字转换技术,将所述目标问题语音信息转换为所述目标问题文本信息。
具体地,通过开源的ASR(Automatic Speech Recognition)语音识别技术将目标问题语音信息转换为目标问题文本信息。首先,对用户的目标问题语音信息进行降噪、信号增强等预处理操作,然后,对预处理过的目标问题语音信息进行特征提取,提取目标问题语音信息的时域特征和频域特征,最后,对提取到的特征信息进行识别,并解码输出目标问题语音信息的识别结果,该识别结果即为目标问题语音信息通过语音文字转换技术得到的目标问题文本信息。
S13:通过图片文字转换技术,将所述目标问题图片信息转换为所述目标问题文本信息。
具体地,通过OCR(Optical Character Recognition)插件实现目标问题图片信息向目标问题文本信息的转换。首先,对用户的目标问题图片信息进行降噪、去除背景、调整图片亮度和对比度等预处理操作,然后,通过文字检测算法在预处理过的目标图片上定位出文字的位置,并对该位置上的文字内容进行分割处理,提取出每个字符,最后,对提取出的每个字符进行识别,并将识别出的每个字符拼接为连贯的文本信息,作为最终转换得到的目标问题文本信息进行输出。
本实施例中,通过语音文字转换技术将目标问题语音信息转换为目标问题文本信息,通过图片文字转换技术将目标问题图片信息转换为目标问题文本信息,简化了后续提取目标用户问题信息关键字来明确用户保险咨询请求的复杂性,并且向用户提供了多种咨询问题的方式,提高了用户进行保险客服咨询的便捷性。
在一实施例中,如图4所示,步骤S20中,根据所述目标用户信息进行身份校验,包括如下步骤:
S21:根据预定义验证信息的格式要求对所述目标用户信息进行格式校验。
具体地,该格式校验主要是对目标用户登录密码信息中的身份证号码和登录密码的长度和格式进行校验。例如,根据预定义验证信息的格式要求,调用正则表达式函数检测身份证号码是否为18位或者15位,登录密码的长度是否在6到10个字符之间,以及登录密码的格式是否为字母、数字和特殊字符的组合,若是,则格式校验通过,若不是,则格式校验失败。
S22:在所述格式校验通过后,获取目标用户的验证信息,根据所述验证信息进行身份校验,输出身份校验结果。
若目标用户为新用户,则需要进行新用户注册处理,提取目标用户信息中的登录密码信息,并对目标用户信息中的登录密码进行哈希处理,转化为哈希密码存储在用户信息库中,并同时在用户信息库中创建用户的用户名和身份证号码等基本信息。
若目标用户已经进行过注册处理,则在目标用户通过格式校验之后,提取目标用户信息中的登录密码信息,并将目标用户的登录密码进行哈希处理转换为哈希密码,将该转换后的哈希密码与用户信息库中已存储的相应用户的哈希密码进行比较,若两个哈希密码相匹配,则表示用户身份校验成功,输出身份校验结果,否则,身份校验失败。
在本实施例中,先通过预定义验证信息的格式要求对用户信息进行格式校验,确保用户输入信息的格式正确性,然后,在格式校验通过之后,对用户进行身份校验,并输出身份校验结果。通过对目标用户的身份校验,保障了目标用户信息的安全性,且根据目标用户的身份校验结果,可以在用户信息库中查询得到目标用户的访问权限类型以及投保、理赔等保险相关信息,ChatGLM模型可以根据用户的个人信息,为解答用户咨询问题提供更全面的回答。
在一实施例中,如图5所示,步骤S30中,在所述身份校验通过之后,根据所述目标用户信息和所述目标问题文本信息,在保险数据库集群中检索得到N个相似答案文本信息,包括如下步骤:
S31:提取所述目标问题文本信息的关键字,确定所述目标问题文本信息所属的保险咨询类型。
具体地,可以通过Rake(Rapid Automatic Keyword Extraction)文本关键字提取算法提取目标问题文本信息的关键字。首先,对目标问题文本信息进行分词处理,将目标问题文本信息划分为单个词语的序列,并去除一些常见的无意义的词语,然后,依据每个词语在目标问题文本信息中出现的频率和位置,计算每个词语在目标问题文本信息中的得分,最后,通过排序算法对每个词语在目标问题文本中的得分进行排序,从高到底选择前几个词语作为目标问题文本信息的关键字,并依据所提取的关键字确定目标问题文本信息所属的保险咨询类型。
S32:根据所述目标问题文本信息所属的保险咨询类型,在所述保险数据库集群中确定所述目标问题文本信息所属的目标保险数据库。
其中,保险咨询类型主要包括投保咨询业务、保单查询业务、保险理赔业务和保险科普业务。
具体地,投保咨询业务,用于向用户提供保险产品的保额、保费、保障范围、保险期间和承保年龄等信息的咨询服务,方便用户根据自身情况进行投保选择,其所对应的目标数据库为保险产品信息库和/或代理人信息库。保单查询业务,用于向用户提供已投保的保险订单和保险合同的查询服务,其所对应的目标保险数据库为内部保单数据库。保险理赔业务,用于向用户提供保险理赔申请服务,以及向用户提供历史保险理赔信息的查询服务,其所对应的目标保险数据库为保险理赔数据库和/或代理人信息库。保险科普业务,用于向用户提供保险专业知识的查询服务,其所对应的目标保险数据库为保险产品信息库和/或保险知识库。
S33:获取目标用户的访问权限请求,确定目标用户对所述目标保险数据库的访问权限。
具体地,对通过身份校验的目标用户,获取其目标保险数据库的访问权限请求,通过检索用户信息库中存储的用户数据库访问权限表,确定目标用户对目标保险数据库的访问权限。其中,用户信息库中存储的用户数据库访问权限表记录了目标用户具有访问权限的数据库信息。
S34:若所述目标用户对所述目标保险数据库具有访问权限,则将所述目标问题文本信息和所述目标保险数据库中的所有待比对文本信息,分别转换为目标问题文本向量和待比对文本向量。
具体地,首先,通过langchain开源框架与目标保险数据库之间的数据链路读取目标保险数据库中的文本信息,然后,通过预训练的词嵌入模型,分别将从目标保险数据库中提取到的文本信息和用户咨询的目标问题文本信息分割成文本块,并将每个文本块映射到高维向量空间中的特定位置,即完成了所有待比对文本信息和目标问题信息向代比对文本向量和目标问题文本向量的转换。其中,每个文本块在高维向量空间的特定位置可以表示每个文本块的上下文语义信息,例如,具有相似含义的文本块在向量空间中会更加接近。
S35:计算所述目标问题文本向量和各个所述待比对文本向量之间的相似度。
具体地,可以通过余弦相似度来计算目标问题文本向量和各个代比对文本向量之间的相似度。首先,将目标问题文本向量和各个代比对文本向量以相同维度矩阵的形式进行表示,然后,通过余弦相似度的计算公式:相似度=向量A·向量B/(向量A的模长*向量B的模长),计算每个代比对文本向量和目标问题文本向量之间的相似度。
S36:根据所述相似度选取N个所述待比对文本信息,作为N个所述相似答案文本信息。
具体地,通过排序算法对各个待比对文本向量和目标问题文本向量之间的相似度大小进行排序,并根据排序结果选取N个待比对文本向量,然后,通过词向量反向编码的方式反向查询最接近的词语,将N个待比对文本向量转化为N个待比对文本信息,并将转化后的N个待比对文本信息,作为N个相似答案文本信息。
例如,可以通过选择排序算法对各个待比对文本向量和目标问题文本向量之间的相似度大小进行排序。从第一个待比对文本向量和目标问题文本向量之间的相似度开始遍历整个待排序相似度序列,假设当前相似度为最大值,并将该相似度标记为最大值索引,从当前相似度的下一个位置开始,与最大相似度进行比较,若找到比最大相似度更大的值,则更新最大值索引,直至遍历完整个待排序相似度序列,找到最大相似度,并重复以上步骤N次,依次确定未排序相似度中的最大值,将选取出的N个待比对文本向量作为N个相似答案文本向量,其中,所述N值可以根据实际情况进行设置。
在本实施例中,通过提取目标问题文本信息的的关键字,来定位解决目标问题所需要访问的目标保险数据库,并通过计算该目标保险数据库中存储的待比对文本信息与目标问题文本信息之间的相似度,选取N个最相似的答案文本信息,该选取的N个相似答案文本信息为ChatGLM模型回答目标问题文本信息提供了准确而全面的的背景信息,提高了ChatGLM模型回答用户咨询问题的效率和准确率。
在一实施例中,如图6所示,步骤S40中,根据所述目标用户信息,所述目标问题文本信息,以及N个所述相似答案文本信息,生成保险背景提示模板,包括如下步骤:
S41:根据LangChain开源框架中的索引模块与提示模板模块之间的第一数据链路,将由所述索引模块输出的N个所述相似答案文本信息发送至所述提示模板模块。
LangChain开源框架中的链是指将模型或系统间的多个组件组合起来的一条数据通路,LangChain开源框架中的索引模块是指用于创建和管理语言数据索引的组件,通过该索引模块可以快速的检索和访问保险数据库集群,LangChain开源框架中的提示模板模块是指用于生成和处理提示语句的组件,通过该提示模板模块可以根据预定义的提示信息生成特定类型的提示模版。
具体地,本发明中的第一数据链路将索引模块和提示模板模块链接起来,通过该第一数据链路,可以将由索引模块输出的N个相似答案文本信息发送至提示模板模块。
S42:通过所述提示模板模块将所述目标用户信息,所述目标问题文本信息,以及N个所述相似答案文本信息,生成所述保险背景提示模板。
具体地,可以通过调用LangChain开源框架中的提示模板工具来根据不同的应用场景和需求生成特定的保险背景提示模板,其中,保险背景提示模板的具体形式用户可根据具体情景进行设计。
例如,该保险背景提示模板可以为:
目标用户信息:李华410422187612136543
目标问题文本信息:我的车因发生意外被撞了,要申请理赔,想要咨询理赔申请流程。
{相似答案文本信息1:李华已于2001年3月3日购买某车险,并于2013年6月6日购买医疗险;
相似答案文本信息2:常规理赔流程一般为报案、提供资料证明、理赔审核、确认赔付、赔款支付;
相似答案文本信息3:医疗险可以帮助个人或家庭应对以外和突发疾病导致的医疗费用,减轻个人在医疗事件中的经济负担,确保及时得到医疗服务而不会因费用问题而影响治疗效果}
在本实施例中,通过将LangChain开源框架中的索引模块输出的N个相似答案文本信息发送至提示模板模块,并根据目标用户信息、目标问题文本信息和N个相似答案文本信息,生成保险背景提示模板。通过以上步骤,为ChatGLM模型的输入提供了清晰而全面的背景信息,ChatGLM模型依据该保险背景提示模板,可以将目标答案的范围限定在特定的保险咨询类型中,提高了ChatGLM模型回答信息的准确性。
在一实施例中,如图7所示,步骤S50中,将所述保险背景提示模板输入至已经进行保险知识训练好的ChatGLM模型中,输出目标答案文本信息,包括如下步骤:
S51:根据LangChain开源框架中的提示模板模块与模型交互模块之间的第二数据链路,将所述提示模板模块中的所述保险背景提示模板发送至所述模型交互模块调用的ChatGLM模型中,经过所述ChatGLM模型输出所述目标答案文本信息。
具体地,通过LangChain开源框架中的提示模板模块和模型交互模块之间的第二数据链路,将保险背景提示模板作为参数传递给模型交互模块调用的ChatGLM模型中,在输入保险背景提示模板之后,通过词嵌入技术对保险背景提示模板的内容进行编码处理,将其转换为ChatGLM模型可以理解和处理的向量形式,ChatGLM模型通过对保险背景提示模板的理解和分析,生成多个候选答案信息,并将最合适的答案通过解码器转化为文本输出给用户。
S52:将所述目标答案文本信息转换成目标答案语音信息,输出所述目标答案文本信息和/或所述目标答案语音信息。
具体地,通过TTS(Text-to-Speech)文字转语音技术将目标答案文本信息转换成目标答案语音信息。首先,对目标答案文本信息进行预处理,去除标点符号和特殊字符,其次,对预处理过的目标答案文本信息进行词语分析,确定每个词语的语音发音和语调等要素,并识别缩写词和数字,然后,根据词语分析结果将目标答案文本信息转换成音素序列,并通过语音合成技术将这些音素序列按照一定的顺序进行拼接和调整,生成连贯流畅的语音,最后,对生成的语音进行去噪、调整语速和音色等后处理操作,最终生成的语音即为目标答案语音信息,并根据实际的应用场景,输出目标答案文本信息和/或目标答案语音信息给用户。
在本实施例中,在LangChain开源框架下,通过将保险背景提示模板输入至模型交互模块调用的ChatGLM模型中,ChatGLM模型通过对保险背景提示模版的理解和推理,返回最合适的目标答案文本信息给用户。ChatGLM模型通过以保险背景信息作为输入,能够基于特定的保险咨询类型和用户的特定背景信息,为用户提供更全面、准确的回答,且该回答可以为语音或文字的形式,进一步的提高了保险客服咨询的便捷性。
在一实施例中,在步骤S30之前,该基于ChatGLM模型的保险客服对话生成方法还包括:
通过预设的数据采集技术实时更新所述保险数据库集群中的信息;
所述保险数据库集群包括:
用户信息库,用于存储保险用户的姓名、身份证号码等基本身份信息和用户数据库访问权限表,以及用户投保、理赔等相关的保险信息;
保险产品信息库,用于存储保险产品的类型、保险金额、保费等相关产品信息;
内部保单数据库,用于存储保险用户的投保产品、投保人、投保日期等先关保单信息;
保险理赔数据库,用于存储保险用户的理赔编号、理赔金额、理赔日期等相关理赔信息;
代理人信息库,用于存储保险代理人的姓名、联系电话、代理产品和代理状态等信息;
保险知识库,用于存储保险专业领域的知识信息。
具体地,通过预设的数据挖掘算法提取保险官方网站的信息来实时更新保险数据库集群中的信息。首先,向中国银行保险监督管理委员会、中国保险行业协会的官方网站发送获取网页内容的请求,然后,若该获取网页内容请求通过,则对目标网页的网页结构和内容进行解析,定位出将要提取的目标信息在网页中的路径,最后,根据目标信息在网页中的路径,定位出目标信息在网页中的位置,提取出目标信息并存储到数据库集群中相应的数据库中。另外,通过数据库触发器实现数据库之间的信息实时同步更新,例如,当内部保单数据库中新增用户保单信息时,通过使用数据库触发器,该用户的保单信息可以实时的更新到用户信息库以及代理人信息库中。
在本实施例中,通过预设的数据采集技术实时更新保险数据库集群中所存储的信息,其中预设的数据采集技术包括数据挖掘算法和数据库触发器,通过数据挖掘算法获取保险官方网站的变更保险信息,通过数据库触发器实现数据库集群之间的实时数据更新,确保了数据库集群能够及时的更新内容信息,为解答用户的咨询问题提供全面而实时的背景知识。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供了一种基于ChatGLM模型的保险客服对话生成装置,该基于ChatGLM模型的保险客服对话生成装置与上述实施例中基于ChatGLM模型的保险客服对话生成方法一一对应。如图8所示,该基于ChatGLM模型的保险客服对话生成装置包括目标问题信息转换模块81,目标用户信息校验模块82,相似答案信息检索模块83,背景提示模板生成模块84,目标答案信息输出模块85。各功能模块详细说明如下:
目标问题信息转换模块81,用于获取目标问题信息,将所述目标问题信息转换为目标问题文本信息;
目标用户信息校验模块82,用于获取目标用户信息,根据所述目标用户信息进行身份校验;
相似答案信息检索模块83,用于在所述身份校验通过之后,根据所述目标用户信息和所述目标问题文本信息,在保险数据库集群中检索得到N个相似答案文本信息;
背景提示模板生成模块84,用于根据所述目标用户信息,所述目标问题文本信息,以及N个所述相似答案文本信息,生成保险背景提示模板;
目标答案信息输出模块85,用于将所述保险背景提示模板输入至已经进行保险知识训练好的ChatGLM模型中,输出目标答案文本信息。
可选地,上述的目标问题信息转换模块81包括:
语音转换单元,用于通过语音文字转换技术,将所述目标问题语音信息转换为所述目标问题文本信息;
图片转换单元,用于通过图片文字转换技术,将所述目标问题图片信息转换为所述目标问题文本信息。
可选地,上述的目标用户信息校验模块82包括:
格式校验单元,用于通过在所述制动盘的轴节上固定安装的热成像仪,采集所述制动盘的温度分布云图;
温度获取单元,用于根据预定义验证信息的格式要求对所述目标用户信息进行格式校验;
身份校验单元,用于在所述格式校验通过后,获取目标用户的验证信息,根据所述验证信息进行身份校验,输出身份校验结果。
可选地,上述的相似答案信息检索模块83包括:
保险咨询类型确定单元,用于提取所述目标问题文本信息的关键字,确定所述目标问题文本信息所属的保险咨询类型;
目标保险数据库确定单元,用于根据所述目标问题文本信息所属的保险咨询类型,在所述保险数据库集群中确定所述目标问题文本信息所属的目标保险数据库;
访问权限确定单元,用于获取目标用户的访问权限请求,确定目标用户对所述目标保险数据库的访问权限;
向量转换单元,用于若所述目标用户对所述目标保险数据库具有访问权限,则将所述目标问题文本信息和所述目标保险数据库中的所有待比对文本信息,分别转换为目标问题文本向量和待比对文本向量;
相似度计算单元,用于计算所述目标问题文本向量和各个所述待比对文本向量之间的相似度;
相似答案文本信息获取单元,用于根据所述相似度选取N个所述待比对文本信息,作为N个所述相似答案文本信息。
可选地,上述的背景提示模板生成模块84包括:
相似答案文本信息发送单元,用于根据LangChain开源框架中的索引模块与提示模板模块之间的第一数据链路,将由所述索引模块输出的N个所述相似答案文本信息发送至所述提示模板模块;
保险背景提示模板生成单元:用于通过所述提示模板模块将所述目标用户信息,所述目标问题文本信息,以及N个所述相似答案文本信息,生成所述保险背景提示模板。
可选地,上述的目标答案信息输出模块85包括:
保险背景提示模板发送单元,用于根据LangChain开源框架中的提示模板模块与模型交互模块之间的第二数据链路,将所述提示模板模块中的所述保险背景提示模板发送至所述模型交互模块调用的ChatGLM模型中;
模型输出单元,用于通过所述ChatGLM模型输出所述目标答案文本信息;
目标答案文本信息转换单元,用于将所述目标答案文本信息转换成目标答案语音信息,输出所述目标答案文本信息和/或所述目标答案语音信息。
可选地,该基于ChatGLM模型的保险客服对话生成装置还包括:
数据库集群更新模块,用于通过预设的数据采集技术实时更新所述保险数据库集群中的信息。
关于基于ChatGLM模型的保险客服对话生成装置的具体限定可以参见上文中对于基于ChatGLM模型的保险客服对话生成方法的限定,在此不再赘述。上述基于ChatGLM模型的保险客服对话生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图9为本发明实施例四提供的一种终端设备的结构示意图。如图9所示,该实施例的终端设备包括:至少一个处理器(图9中仅示出一个)、存储器以及存储在存储器中并可在至少一个处理器上运行的计算机程序,处理器执行计算机程序时实现上述任意各个基于ChatGLM模型的保险客服咨询方法实施例中的步骤。
该终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,图9仅仅是终端设备的举例,并不构成对终端设备的限定,终端设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括网络接口、显示屏和输入装置等。
所称处理器可以是CPU,该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器包括可读存储介质、内存储器等,其中,内存储器可以是终端设备的内存,内存储器为可读存储介质中的操作系统和计算机可读指令的运行提供环境。可读存储介质可以是终端设备的硬盘,在另一些实施例中也可以是终端设备的外部存储设备,例如,终端设备上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,存储器还可以既包括终端设备的内部存储单元也包括外部存储设备。存储器用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,该其他程序如计算机程序的程序代码等。存储器还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质至少可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
本发明实现上述实施例方法中的全部或部分流程,也可以通过一种计算机程序产品来完成,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现可实现上述方法实施例中的步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上实施例仅用以说明本发明的技术方案,而非对其限制,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于ChatGLM模型的保险客服对话生成方法,其特征在于,所述基于ChatGLM模型的保险客服对话生成方法包括以下步骤:
获取目标问题信息,将所述目标问题信息转换为目标问题文本信息;
获取目标用户信息,根据所述目标用户信息进行身份校验;
在所述身份校验通过之后,根据所述目标用户信息和所述目标问题文本信息,在保险数据库集群中检索得到N个相似答案文本信息,N>2;
根据所述目标用户信息,所述目标问题文本信息,以及N个所述相似答案文本信息,生成保险背景提示模板;
将所述保险背景提示模板输入至已经进行保险知识训练好的ChatGLM模型中,输出目标答案文本信息。
2.如权利要求1所述的基于ChatGLM模型的保险客服对话生成方法,其特征在于,所述将所述目标问题信息转换为目标问题文本信息,包括:
所述目标问题信息包括目标问题语音信息和/或目标问题图片信息;
通过语音文字转换技术,将所述目标问题语音信息转换为所述目标问题文本信息;
通过图片文字转换技术,将所述目标问题图片信息转换为所述目标问题文本信息。
3.如权利要求1所述的基于ChatGLM模型的保险客服对话生成方法,其特征在于,所述根据所述目标用户信息进行身份校验,包括:
根据预定义验证信息的格式要求对所述目标用户信息进行格式校验;
在所述格式校验通过后,获取目标用户的验证信息,根据所述验证信息进行身份校验,输出身份校验结果。
4.如权利要求1所述的基于ChatGLM模型的保险客服对话生成方法,其特征在于,所述在所述身份校验通过之后,根据所述目标用户信息和所述目标问题文本信息,在保险数据库集群中检索得到N个相似答案文本信息,N>2,包括:
提取所述目标问题文本信息的关键字,确定所述目标问题文本信息所属的保险咨询类型;
根据所述目标问题文本信息所属的保险咨询类型,在所述保险数据库集群中确定所述目标问题文本信息所属的目标保险数据库;
获取目标用户的访问权限请求,确定目标用户对所述目标保险数据库的访问权限;
若所述目标用户对所述目标保险数据库具有访问权限,则将所述目标问题文本信息和所述目标保险数据库中的所有待比对文本信息,分别转换为目标问题文本向量和待比对文本向量;
计算所述目标问题文本向量和各个所述待比对文本向量之间的相似度;
根据所述相似度选取N个所述待比对文本信息,作为N个所述相似答案文本信息。
5.如权利要求1所述的基于ChatGLM模型的保险客服对话生成方法,其特征在于,所述根据所述目标用户信息,所述目标问题文本信息,以及N个所述相似答案文本信息,生成保险背景提示模板,包括:
根据LangChain开源框架中的索引模块与提示模板模块之间的第一数据链路,将由所述索引模块输出的N个所述相似答案文本信息发送至所述提示模板模块;
通过所述提示模板模块将所述目标用户信息,所述目标问题文本信息,以及N个所述相似答案文本信息,生成所述保险背景提示模板。
6.如权利要求1所述的基于ChatGLM模型的保险客服对话生成方法,其特征在于,所述将所述保险背景提示模板输入至已经进行保险知识训练好的ChatGLM模型中,输出目标答案文本信息,包括:
根据LangChain开源框架中的提示模板模块与模型交互模块之间的第二数据链路,将所述提示模板模块中的所述保险背景提示模板发送至所述模型交互模块调用的所述ChatGLM模型中,经过所述ChatGLM模型输出所述目标答案文本信息;
将所述目标答案文本信息转换成目标答案语音信息,输出所述目标答案文本信息和/或所述目标答案语音信息。
7.如权利要求1所述的基于ChatGLM模型的保险客服对话生成方法,其特征在于,所述在所述身份校验通过之后,根据所述目标用户信息和所述目标问题文本信息,在保险数据库集群中检索得到N个相似答案文本信息之前,所述基于ChatGLM模型的保险客服对话生成方法还包括:
通过预设的数据采集技术实时更新所述保险数据库集群中的信息;
所述保险数据库集群包括:
用户信息库,用于存储保险用户的姓名、身份证号码等基本身份信息和用户数据库访问权限表,以及用户投保、理赔等相关的保险信息;
保险产品信息库,用于存储保险产品的类型、保险金额、保费等相关产品信息;
内部保单数据库,用于存储保险用户的投保产品、投保人、投保日期等相关保单信息;
保险理赔数据库,用于存储保险用户的理赔编号、理赔金额、理赔日期等相关理赔信息;
代理人信息库,用于存储保险代理人的姓名、联系电话、代理产品和代理状态等信息;
保险知识库,用于存储保险专业领域的知识信息。
8.一种基于ChatGLM模型的保险客服对话生成装置,其特征在于,包括:
目标问题信息转换模块,用于获取目标问题信息,将所述目标问题信息转换为目标问题文本信息;
目标用户信息校验模块,用于获取目标用户信息,根据所述目标用户信息进行身份校验;
相似答案信息检索模块,用于在所述身份校验通过之后,根据所述目标用户信息和所述目标问题文本信息,在保险数据库集群中检索得到N个相似答案文本信息,N>2;
背景提示模板生成模块,用于根据所述目标用户信息,所述目标问题文本信息,以及N个所述相似答案文本信息,生成保险背景提示模板;
目标答案信息输出模块,用于将所述保险背景提示模板输入至已经进行保险知识训练好的ChatGLM模型中,输出目标答案文本信息。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于ChatGLM模型的保险客服对话生成方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于ChatGLM模型的保险客服对话生成方法的步骤。
CN202311604158.5A 2023-11-27 2023-11-27 基于ChatGLM模型的保险客服对话生成方法、装置、设备及介质 Pending CN117932009A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311604158.5A CN117932009A (zh) 2023-11-27 2023-11-27 基于ChatGLM模型的保险客服对话生成方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311604158.5A CN117932009A (zh) 2023-11-27 2023-11-27 基于ChatGLM模型的保险客服对话生成方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN117932009A true CN117932009A (zh) 2024-04-26

Family

ID=90769162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311604158.5A Pending CN117932009A (zh) 2023-11-27 2023-11-27 基于ChatGLM模型的保险客服对话生成方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN117932009A (zh)

Similar Documents

Publication Publication Date Title
CN112346567B (zh) 基于ai的虚拟交互模型生成方法、装置及计算机设备
CN111695352A (zh) 基于语义分析的评分方法、装置、终端设备及存储介质
CN111814466A (zh) 基于机器阅读理解的信息抽取方法、及其相关设备
CN112287069B (zh) 基于语音语义的信息检索方法、装置及计算机设备
WO2021218028A1 (zh) 基于人工智能的面试内容精炼方法、装置、设备及介质
CN111930914A (zh) 问题生成方法和装置、电子设备以及计算机可读存储介质
CN117520503A (zh) 基于llm模型的金融客服对话生成方法、装置、设备及介质
CN113656547A (zh) 文本匹配方法、装置、设备及存储介质
CN114780701A (zh) 自动问答匹配方法、装置、计算机设备及存储介质
CN113535925A (zh) 语音播报方法、装置、设备及存储介质
CN117520523A (zh) 数据处理方法、装置、设备及存储介质
CN112199958A (zh) 概念词序列生成方法、装置、计算机设备及存储介质
CN114842982B (zh) 一种面向医疗信息系统的知识表达方法、装置及系统
CN116909435A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN116186223A (zh) 一种金融文本处理方法、装置、设备和存储介质
CN113609330B (zh) 一种基于文本注意力和细粒度信息的视频问答系统、方法、计算机及存储介质
CN115618415A (zh) 敏感数据识别方法、装置、电子设备和存储介质
CN117932009A (zh) 基于ChatGLM模型的保险客服对话生成方法、装置、设备及介质
CN113269179A (zh) 数据处理方法、装置、设备及存储介质
CN110232328A (zh) 一种征信报告解析方法、装置及计算机可读存储介质
CN113868419B (zh) 基于人工智能的文本分类方法、装置、设备及介质
CN111783471B (zh) 自然语言的语义识别方法、装置、设备及存储介质
CN113255361B (zh) 语音内容的自动检测方法、装置、设备以及存储介质
CN115238046A (zh) 用户意图识别方法、装置、电子设备及存储介质
CN115878755A (zh) 文本处理方法、医疗文本处理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination