CN115544229A - 一种智能客服问答方法、装置、电子设备及存储介质 - Google Patents

一种智能客服问答方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115544229A
CN115544229A CN202211161896.2A CN202211161896A CN115544229A CN 115544229 A CN115544229 A CN 115544229A CN 202211161896 A CN202211161896 A CN 202211161896A CN 115544229 A CN115544229 A CN 115544229A
Authority
CN
China
Prior art keywords
online user
question
vectorization
corpus
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211161896.2A
Other languages
English (en)
Inventor
赵明月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Health Insurance Company of China Ltd
Original Assignee
Ping An Health Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Health Insurance Company of China Ltd filed Critical Ping An Health Insurance Company of China Ltd
Priority to CN202211161896.2A priority Critical patent/CN115544229A/zh
Publication of CN115544229A publication Critical patent/CN115544229A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种智能客服问答方法、装置、电子设备及计算机可读存储介质。本发明提供的智能客服问答方法,包括:利用预训练的字向量对训练集数据进行处理,得到处理后的训练集数据,将处理后的训练集数据输入至孪生神经网络模型的双向长短期记忆网络中,得到训练完备的孪生神经网络模型;根据离线语料库和训练完备的孪生神经网络模型,获取离线语料库中各句子的向量化表示,根据各句子的向量化表示确定语料矩阵;根据在线用户问和训练完备的孪生神经网络模型,得到在线用户问对应的向量化表示,根据语料矩阵和在线用户问对应的向量化表示,确定在线用户问的返回结果。本发明的智能客服问答方法,提高了智能客服问答的准确率。

Description

一种智能客服问答方法、装置、电子设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种智能客服问答方法、装置、电子设备及计算机可读存储介质。
背景技术
随着科技进步,经济社会发展对服务的依赖程度日益增强。客服系统在企业的生产经营活动中扮演着重要的角色,是紧密联系企业与客户的服务窗口,在产品销售、售后服务、技术支持、咨询和投诉方面起着非常重要的作用,能够针对客户提出的问题,高效解决问题。随着对于服务质量的要求的提高,一对一客服现在越来越流行,一对一客服提高了客户的服务体验,但是在客户较多的情况下,会出现人工客服无法及时为客户服务的情况。
在人工智能的商业化落地及实际应用中,智能客服问答已为众多行业进行了科技赋能,帮助众多企业完成了客服中心的智能化转型;但是现有智能客服问答方案的准确率较低,严重影响用户体验。
发明内容
本发明的目的在于提供一种智能客服问答方法、装置、电子设备及计算机可读存储介质,以解决现有技术中智能客服问答方案的准确率较低的技术问题。
本发明的技术方案如下,提供了一种智能客服问答方法,包括:
获取训练集数据,利用预训练的字向量对所述训练集数据进行处理,得到处理后的训练集数据,将所述处理后的训练集数据输入至孪生神经网络模型的双向长短期记忆网络中,以完成对所述孪生神经网络模型的训练,得到训练完备的孪生神经网络模型;
获取离线语料库,根据所述离线语料库和所述训练完备的孪生神经网络模型,获取所述离线语料库中各句子的向量化表示,根据所述各句子的向量化表示确定语料矩阵;
获取在线用户问,根据所述在线用户问和所述训练完备的孪生神经网络模型,得到所述在线用户问对应的向量化表示,根据所述语料矩阵和所述在线用户问对应的向量化表示,确定所述在线用户问的返回结果。
进一步地,所述获取训练集数据,包括:从预设语料库或/和线上日志中,获取多个句子数据,根据两两所述句子数据之间是否属于同一语义,对所述句子数据进行标记,得到带有标签的所述句子数据,以带有标签的所述句子数据形成训练集数据。
进一步地,将所述处理后的训练集数据输入至孪生神经网络模型的双向长短期记忆网络中,以完成对所述孪生神经网络模型的训练,包括:
将所述处理后的训练集数据输入至孪生神经网络模型的两层双向长短期记忆网络中,使每两个所述处理后的训练集数据对应输出两个句子向量化表示,根据所述两个句子向量化表示的距离,确定预测的标签,根据所述预测的标签与对应的所述处理后的训练集数据的标签,对所述孪生神经网络模型进行调整,以完成对所述孪生神经网络模型的训练。
进一步地,根据所述两个句子向量化表示的距离,确定预测的标签,包括:若所述两个句子向量化表示的距离大于第一预设阈值,则以同一语义对应的标签作为所述预测的标签,若所述两个句子向量化表示的距离小于或者等于所述第一预设阈值,以不同语义对应的标签作为所述预测的标签。
进一步地,在根据所述各句子的向量化表示确定语料矩阵之后,还包括,为所述语料矩阵建立索引;
相应的,根据所述语料矩阵和所述在线用户问对应的向量化表示,确定所述在线用户问的返回结果,包括:
通过所述索引,从所述语料矩阵中获取与在线用户问对应的向量化表示,距离最为接近的一个向量化表示,根据所述一个向量化表示,确定所述在线用户问的返回结果;或者,通过所述索引,从所述语料矩阵中获取与在线用户问对应的向量化表示,距离排名最靠前的多个向量化表示,根据所述多个向量化表示,确定所述在线用户问的返回结果。
进一步地,根据所述一个向量化表示,确定所述在线用户问的返回结果,包括,
若所述一个向量化表示与所述在线用户问对应的向量化表示的距离大于第二预设阈值,则以所述一个向量化表示对应的句子数据作为在线用户问对应的标准问,以所述标准问确定所述在线用户问的返回结果;
根据所述多个向量化表示,确定所述在线用户问的返回结果,包括,
若所述多个向量化表示分别与所述在线用户问对应的向量化表示的距离,均大于第三预设阈值,则以所述多个向量化表示对应的句子数据均作为相似问,以所述相似问确定所述在线用户问的返回结果;
若所述多个向量化表示分别与所述在线用户问对应的向量化表示的距离,部分大于第三预设阈值,则以,与所述在线用户问对应的向量化表示的距离,大于第三预设阈值的向量化表示,对应的句子数据作为相似问,以所述相似问确定所述在线用户问的返回结果。
进一步地,所述智能客服问答方法还包括,若所述一个向量化表示与所述在线用户问对应的向量化表示的距离不大于第二预设阈值,或者,所述多个向量化表示分别与所述在线用户问对应的向量化表示的距离,均不大于第三预设阈值;则将在线用户问导入ES中进行预处理和检索,获取ES对应语料库中与所述在线用户问最匹配的标准问,以该标准问确定所述在线用户问的返回结果。
本发明的另一技术方案如下,还提供了一种智能客服问答装置,包括模型训练模块、语料矩阵确定模块以及问答模块;
所述模型训练模块,用于获取训练集数据,利用预训练的字向量对所述训练集数据进行处理,得到处理后的训练集数据,将所述处理后的训练集数据输入至孪生神经网络模型的双向长短期记忆网络中,以完成对所述孪生神经网络模型的训练,得到训练完备的孪生神经网络模型;
所述语料矩阵确定模块,用于获取离线语料库,根据所述离线语料库和所述训练完备的孪生神经网络模型,获取所述离线语料库中各句子的向量化表示,根据所述各句子的向量化表示确定语料矩阵;
所述问答模块,用于获取在线用户问,根据所述在线用户问和所述训练完备的孪生神经网络模型,得到所述在线用户问对应的向量化表示,根据所述语料矩阵和所述在线用户问对应的向量化表示,确定所述在线用户问的返回结果。
本发明的另一技术方案如下,还提供了一种电子设备,包括存储器、处理器,所述存储器存储有可被所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一项技术方案所述的智能客服问答方法。
本发明的另一技术方案如下,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述任一项技术方案所述的智能客服问答方法。
本发明的有益效果在于:获取训练集数据,利用预训练的字向量对训练集数据进行处理,得到处理后的训练集数据,将处理后的训练集数据输入至孪生神经网络模型的双向长短期记忆网络中,以完成对孪生神经网络模型的训练,得到训练完备的孪生神经网络模型;获取离线语料库,根据离线语料库和训练完备的孪生神经网络模型,获取离线语料库中各句子的向量化表示,根据各句子的向量化表示确定语料矩阵;获取在线用户问,根据在线用户问和训练完备的孪生神经网络模型,得到在线用户问对应的向量化表示,根据语料矩阵和在线用户问对应的向量化表示,确定所述在线用户问的返回结果;通过上述技术方案,实现了智能客服问答,提高了智能客服问答的准确率。
附图说明
图1为本发明实施例的智能客服问答方法的流程示意图;
图2为本发明实施例的智能客服问答装置的结构示意图;
图3为本发明实施例的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请的描述中,“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。在本说明书中术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
需要说明的是,本申请实施例中,“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
图1是本发明实施例的智能客服问答方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的智能客服问答方法并不以图1所示的流程顺序为限。本实施例可适用于根据用户提出的问题,在问答数据库中获取匹配的答案信息,该方法可以由本发明实施例中智能客服问答装置来执行,该装置可以通过软件和/或硬件实现,并集成在服务器中,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络以及大数据和人工智能平台等基础云计算服务的云服务器。
如图1所示,该智能客服问答方法,主要包括以下步骤:
S1,获取训练集数据,利用预训练的字向量对所述训练集数据进行处理,得到处理后的训练集数据,将所述处理后的训练集数据输入至孪生神经网络模型的双向长短期记忆网络中,以完成对所述孪生神经网络模型的训练,得到训练完备的孪生神经网络模型;其中,预训练的字向量为静态字(词)向量,例如glove等,通过预训练的字向量对所述训练集数据进行处理(即初始化处理),将所述处理后的训练集数据输入至孪生神经网络模型的双向长短期记忆网络中,可以输出训练集数据的向量化表示;
S2,获取离线语料库,根据所述离线语料库和所述训练完备的孪生神经网络模型,获取所述离线语料库中各句子的向量化表示,根据所述各句子的向量化表示确定语料矩阵;其中,所述离线语料库可以是开源的语料库,也可以是通过收集句子数据而形成的语料库;
S3,获取在线用户问,根据所述在线用户问和所述训练完备的孪生神经网络模型,得到所述在线用户问对应的向量化表示,根据所述语料矩阵和所述在线用户问对应的向量化表示,确定所述在线用户问的返回结果。
本发明实施例,通过获取训练集数据,利用预训练的字向量对训练集数据进行处理,得到处理后的训练集数据,将处理后的训练集数据输入至孪生神经网络模型的双向长短期记忆网络中,以完成对孪生神经网络模型的训练,得到训练完备的孪生神经网络模型;获取离线语料库,根据离线语料库和训练完备的孪生神经网络模型,获取离线语料库中各句子的向量化表示,根据各句子的向量化表示确定语料矩阵;获取在线用户问,根据在线用户问和训练完备的孪生神经网络模型,得到在线用户问对应的向量化表示,根据语料矩阵和在线用户问对应的向量化表示,确定所述在线用户问的返回结果;实现了智能客服问答,提高了智能客服问答的准确率。
在一个可选的实施方式中,所述获取训练集数据,包括:从预设语料库或/和线上日志中,获取多个句子数据,根据两两所述句子数据之间是否属于同一语义,对所述句子数据进行标记,得到带有标签的所述句子数据,以带有标签的所述句子数据形成训练集数据。
需要说明的是,预设语料库可以是开源的语料库,也可以是通过收集句子数据而形成的语料库,所述离线语料库与预设语料库可以是相同的语料库也可以是不同的语料库,线上日志即为由线上用户问形成的日志。
一个具体实施例中,根据两两所述句子数据之间是否属于同一语义,对所述句子数据进行标记,可以为,若两个句子数据属于同一语义,则将这两个句子数据标记为同一标签,例如1;若两个句子数据不属于同一语义,则将这两个句子数据标记为不同标签,例如一个句子数据标记为2,另一个句子数据标记为-1。例如,两个句子数据分别为“e生保2020多少钱”和“我想买e生保2020,但我不知道多少钱”,这两个句子数据属于同一语义,则用同一标签标记这两个句子数据;又例如两个句子数据分别为“爱康保多少钱”和“爱康保的保障计划是什么”,这两个句子数据不属于同一语义,则用不同标签标记这两个句子数据。
在一个可选的实施方式中,将所述处理后的训练集数据输入至孪生神经网络模型的双向长短期记忆网络中,以完成对所述孪生神经网络模型的训练,包括:
将所述处理后的训练集数据输入至孪生神经网络模型的两层双向长短期记忆网络中,使每两个所述处理后的训练集数据对应输出两个句子向量化表示,根据所述两个句子向量化表示的距离,确定预测的标签,根据所述预测的标签与对应的所述处理后的训练集数据的标签,对所述孪生神经网络模型进行调整,以完成对所述孪生神经网络模型的训练。
其中,孪生神经网络是基于两个人工神经网络建立的耦合构架,孪生神经网络以两个样本数据为输入,输出其嵌入高维度空间的表征,以比较两个样本数据的相似程度;长短期记忆网络(Long Short-Term Memory,LSTM)是循环神经网络的形式之一,在单向长短期记忆网络中,实际上只考虑了上文的信息,而没有考虑到下文的信息,双向长短期记忆网络在单向长短期记忆网络的基础上,结合了输入序列在前向和后向两个方向上的信息。
一个具体实施例中,预训练的字向量对所述训练集数据进行处理,得到的处理后的训练集数据可以为向量化的数据,该向量化的数据与原始的所述训练集数据相对应;使每两个所述处理后的训练集数据对应输出两个句子向量化表示(句子向量),两个句子向量化表示的维度可以预设,句子向量化表示对应句子数据在语义空间中的位置,所述语义空间可以通过语料库形成。
在一个可选的实施方式中,根据所述两个句子向量化表示的距离,确定预测的标签,包括:若所述两个句子向量化表示的距离大于第一预设阈值,则以同一语义对应的标签作为所述预测的标签,若所述两个句子向量化表示的距离小于或者等于所述第一预设阈值,以不同语义对应的标签作为所述预测的标签。
需要说明的是,所述两个句子向量化表示的距离可以用余弦距离(cosinedistance)的来度量,根据所述两个句子向量化表示的距离,确定预测的标签,具体可以为,根据所述两个句子向量化表示的余弦距离的得分值,确定预测的标签。
在一个可选的实施方式中,在根据所述各句子的向量化表示确定语料矩阵之后,还包括,为所述语料矩阵建立索引;
相应的,根据所述语料矩阵和所述在线用户问对应的向量化表示,确定所述在线用户问的返回结果,包括:
通过所述索引,从所述语料矩阵中获取与在线用户问对应的向量化表示,距离最为接近的一个向量化表示,根据所述一个向量化表示,确定所述在线用户问的返回结果;或者,通过所述索引,从所述语料矩阵中获取与在线用户问对应的向量化表示,距离排名最靠前的多个向量化表示,根据所述多个向量化表示,确定所述在线用户问的返回结果。
需要说明的是,根据所述离线语料库和所述训练完备的孪生神经网络模型,获取所述离线语料库中各句子的向量化表示,具体为,将所述离线语料库的句子数据依次输入至所述训练完备的孪生神经网络模型,使得每一个句子数据都对应得到一个向量化表示。
一个具体实施例中,通过Faiss为所述语料矩阵建立索引,所述索引为Faiss中的IndexFlatIP类型索引,此索引为支持基于余弦距离的精确检索索引,可以根据具体需求,选择从所述语料矩阵中,获取与在线用户问对应的向量化表示,距离最为接近的一个向量化表示,还是选择从所述语料矩阵中获取与在线用户问对应的向量化表示,距离排名最靠前的多个向量化表示;其中,Faiss为相似向量检索库,可以为向量提供高效相似度搜索和聚类,检索的评分函数可以为余弦距离。
在一个可选的实施方式中,根据所述一个向量化表示,确定所述在线用户问的返回结果,包括,
若所述一个向量化表示与所述在线用户问对应的向量化表示的距离大于第二预设阈值,则以所述一个向量化表示对应的句子数据作为在线用户问对应的标准问,以所述标准问确定所述在线用户问的返回结果;
根据所述多个向量化表示,确定所述在线用户问的返回结果,包括,
若所述多个向量化表示分别与所述在线用户问对应的向量化表示的距离,均大于第三预设阈值,则以所述多个向量化表示对应的句子数据均作为相似问,以所述相似问确定所述在线用户问的返回结果;
若所述多个向量化表示分别与所述在线用户问对应的向量化表示的距离,部分大于第三预设阈值,则以,与所述在线用户问对应的向量化表示的距离,大于第三预设阈值的向量化表示,对应的句子数据作为相似问,以所述相似问确定所述在线用户问的返回结果。
一个具体实施例中,可以根据具体需求,确定标准问或者相似问,若需要确定标准问,则从所述语料矩阵中获取与在线用户问对应的向量化表示,距离最为接近的一个向量化表示;若所述一个向量化表示与所述在线用户问对应的向量化表示的距离大于第二预设阈值,以该一个向量化表示对应的句子数据作为标准问;若无法确定标准问或者只需要确定相似问,则从所述语料矩阵中获取与在线用户问对应的向量化表示,距离排名最靠前的多个向量化表示;若所述多个向量化表示分别与所述在线用户问对应的向量化表示的距离,全部或者部分大于第三预设阈值,则以,与所述在线用户问对应的向量化表示的距离,大于第三预设阈值的向量化表示,对应的句子数据作为相似问;相似问可以有一个也可以有多个。其中,一个向量化表示对应的句子数据和多个向量化表示对应的句子数据是指离线语料库(问答数据库)中的句子数据。
在一个可选的实施方式中,所述智能客服问答方法还包括,若所述一个向量化表示与所述在线用户问对应的向量化表示的距离不大于第二预设阈值,或者,所述多个向量化表示分别与所述在线用户问对应的向量化表示的距离,均不大于第三预设阈值;则将在线用户问导入ES中进行预处理和检索,获取ES对应语料库中与所述在线用户问最匹配的标准问,以该标准问确定所述在线用户问的返回结果。
一个具体实施例中,若无法确定标准问,即所述一个向量化表示与所述在线用户问对应的向量化表示的距离不大于第二预设阈值,或者无法确定相似问,即,所述多个向量化表示分别与所述在线用户问对应的向量化表示的距离,均不大于第三预设阈值,则将在线用户问导入ES中进行预处理和检索,获取ES对应语料库中与所述在线用户问最匹配的标准问,以该标准问确定所述在线用户问的返回结果。其中,确定标准问或者相似问之后,就根据所述标准问或者相似问确定返回答案,即确定所述在线用户问的返回结果。
另一个具体实施例中,将在线用户问导入ES中进行预处理和检索,获取ES对应语料库中与所述在线用户问最匹配的标准问,其中,ES即为Elasticsearch,ES是一种分布式搜索和分析引擎,预处理包括分词处理,分词处理即利用分词工具(例如jieba)将一个句子数据,分成几个词语,例如,将“今天天气很好”分成了“今天”、“天气”、“很”、“好”,ES可以计算每个词的权重,获取在线用户问后,ES将在线用户问(句子数据)进行分词处理,将所有词通过一定的方式结合起来,可以得到一个最终的得分,根据得分在语料库中,找到与在线用户问最匹配的标准问,然后根据标准问返回相应的答案。
本发明实施例提供了一种智能客服问答方法,通过获取训练集数据,利用预训练的字向量对训练集数据进行处理,得到处理后的训练集数据,将处理后的训练集数据输入至孪生神经网络模型的双向长短期记忆网络中,以完成对孪生神经网络模型的训练,得到训练完备的孪生神经网络模型;获取离线语料库,根据离线语料库和训练完备的孪生神经网络模型,获取离线语料库中各句子的向量化表示,根据各句子的向量化表示确定语料矩阵;获取在线用户问,根据在线用户问和训练完备的孪生神经网络模型,得到在线用户问对应的向量化表示,根据语料矩阵和在线用户问对应的向量化表示,确定所述在线用户问的返回结果;实现了智能客服问答,提高了智能客服问答的准确率。大多数咨询类问题都可以通过智能客服问答的方式直接进行答复,通过智能客服问答可以,更快的解决客户的问题。
本发明实施例提供的智能客服问答方法,可以基于人工智能进行构建,基于人工智能技术对相关的数据进行获取和处理,实现无人值守的人工智能的智能客服问答。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
图2是本发明实施例的智能客服问答装置的结构示意图,如图2所示,该智能客服问答装置20包括模型训练模块21、语料矩阵确定模块22以及问答模块23;
所述模型训练模块21,用于获取训练集数据,利用预训练的字向量对所述训练集数据进行处理,得到处理后的训练集数据,将所述处理后的训练集数据输入至孪生神经网络模型的双向长短期记忆网络中,以完成对所述孪生神经网络模型的训练,得到训练完备的孪生神经网络模型;
所述语料矩阵确定模块22,用于获取离线语料库,根据所述离线语料库和所述训练完备的孪生神经网络模型,获取所述离线语料库中各句子的向量化表示,根据所述各句子的向量化表示确定语料矩阵;
所述问答模块23,用于获取在线用户问,根据所述在线用户问和所述训练完备的孪生神经网络模型,得到所述在线用户问对应的向量化表示,根据所述语料矩阵和所述在线用户问对应的向量化表示,确定所述在线用户问的返回结果。
进一步地,所述模型训练模块21,还用于从预设语料库或/和线上日志中,获取多个句子数据,根据两两所述句子数据之间是否属于同一语义,对所述句子数据进行标记,得到带有标签的所述句子数据,以带有标签的所述句子数据形成训练集数据。
进一步地,所述模型训练模块21,还用于将所述处理后的训练集数据输入至孪生神经网络模型的两层双向长短期记忆网络中,使每两个所述处理后的训练集数据对应输出两个句子向量化表示,根据所述两个句子向量化表示的距离,确定预测的标签,根据所述预测的标签与对应的所述处理后的训练集数据的标签,对所述孪生神经网络模型进行调整,以完成对所述孪生神经网络模型的训练。
进一步地,所述模型训练模块21,还用于,在所述两个句子向量化表示的距离大于第一预设阈值时,以同一语义对应的标签作为所述预测的标签,在所述两个句子向量化表示的距离小于或者等于所述第一预设阈值时,以不同语义对应的标签作为所述预测的标签。
进一步地,该智能客服问答装置20还包括索引建立模块,所述索引建立模块用于在根据所述各句子的向量化表示确定语料矩阵之后,为所述语料矩阵建立索引;所述问答模块23,还用于通过所述索引,从所述语料矩阵中获取与在线用户问对应的向量化表示,距离最为接近的一个向量化表示,根据所述一个向量化表示,确定所述在线用户问的返回结果;或者,通过所述索引,从所述语料矩阵中获取与在线用户问对应的向量化表示,距离排名最靠前的多个向量化表示,根据所述多个向量化表示,确定所述在线用户问的返回结果。
进一步地,所述问答模块23还用于,在所述一个向量化表示与所述在线用户问对应的向量化表示的距离大于第二预设阈值时,以所述一个向量化表示对应的句子数据作为在线用户问对应的标准问,以所述标准问确定所述在线用户问的返回结果;
在所述多个向量化表示分别与所述在线用户问对应的向量化表示的距离,均大于第三预设阈值时,以所述多个向量化表示对应的句子数据均作为相似问,以所述相似问确定所述在线用户问的返回结果;
在所述多个向量化表示分别与所述在线用户问对应的向量化表示的距离,部分大于第三预设阈值时,以与所述在线用户问对应的向量化表示的距离,大于第三预设阈值的向量化表示,对应的句子数据作为相似问,以所述相似问确定所述在线用户问的返回结果。
进一步地,该智能客服问答装置20还包括引擎匹配模块,所述引擎匹配模块用于,在所述一个向量化表示与所述在线用户问对应的向量化表示的距离不大于第二预设阈值,或者,所述多个向量化表示分别与所述在线用户问对应的向量化表示的距离,均不大于第三预设阈值时;则将在线用户问导入ES中进行预处理和检索,获取ES对应语料库中与所述在线用户问最匹配的标准问,以该标准问确定所述在线用户问的返回结果。
本发明实施例提供提供了一种智能客服问答装置,通过模型训练模块21获取训练集数据,利用预训练的字向量对训练集数据进行处理,得到处理后的训练集数据,将处理后的训练集数据输入至孪生神经网络模型的双向长短期记忆网络中,以完成对孪生神经网络模型的训练,得到训练完备的孪生神经网络模型;通过语料矩阵确定模块22获取离线语料库,根据离线语料库和训练完备的孪生神经网络模型,获取离线语料库中各句子的向量化表示,根据各句子的向量化表示确定语料矩阵;通过问答模块23获取在线用户问,根据在线用户问和训练完备的孪生神经网络模型,得到在线用户问对应的向量化表示,根据语料矩阵和在线用户问对应的向量化表示,确定所述在线用户问的返回结果;实现了智能客服问答,提高了智能客服问答的准确率。
图3是本发明实施例的电子设备的结构示意图。如图3所示,该电子设备30包括处理器31及和处理器31通信连接的存储器32。
存储器32存储有用于实现上述任一实施例的所述智能客服问答方法的程序指令。
处理器31用于执行存储器32存储的程序指令以进行代码测试。
其中,处理器31还可以称为CPU(Central Processing Unit,中央处理单元)。处理器31可能是一种集成电路芯片,具有信号的处理能力。处理器31还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本发明实施例提供一种存储介质,本发明实施例的存储介质存储有能够实现上述所有方法的程序指令,所述存储介质可以是非易失性,也可以是易失性。其中,该程序指令可以以软件产品的形式存储在上述存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等终端设备。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。以上仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围。
以上所述的仅是本发明的实施方式,在此应当指出,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出改进,但这些均属于本发明的保护范围。

Claims (10)

1.一种智能客服问答方法,其特征在于,包括如下步骤:
获取训练集数据,利用预训练的字向量对所述训练集数据进行处理,得到处理后的训练集数据,将所述处理后的训练集数据输入至孪生神经网络模型的双向长短期记忆网络中,以完成对所述孪生神经网络模型的训练,得到训练完备的孪生神经网络模型;
获取离线语料库,根据所述离线语料库和所述训练完备的孪生神经网络模型,获取所述离线语料库中各句子的向量化表示,根据所述各句子的向量化表示确定语料矩阵;
获取在线用户问,根据所述在线用户问和所述训练完备的孪生神经网络模型,得到所述在线用户问对应的向量化表示,根据所述语料矩阵和所述在线用户问对应的向量化表示,确定所述在线用户问的返回结果。
2.根据权利要求1所述的智能客服问答方法,其特征在于,所述获取训练集数据,包括:从预设语料库或/和线上日志中,获取多个句子数据,根据两两所述句子数据之间是否属于同一语义,对所述句子数据进行标记,得到带有标签的所述句子数据,以带有标签的所述句子数据形成训练集数据。
3.根据权利要求2所述的智能客服问答方法,其特征在于,将所述处理后的训练集数据输入至孪生神经网络模型的双向长短期记忆网络中,以完成对所述孪生神经网络模型的训练,包括:
将所述处理后的训练集数据输入至孪生神经网络模型的两层双向长短期记忆网络中,使每两个所述处理后的训练集数据对应输出两个句子向量化表示,根据所述两个句子向量化表示的距离,确定预测的标签,根据所述预测的标签与对应的所述处理后的训练集数据的标签,对所述孪生神经网络模型进行调整,以完成对所述孪生神经网络模型的训练。
4.根据权利要求3所述的智能客服问答方法,其特征在于,根据所述两个句子向量化表示的距离,确定预测的标签,包括:若所述两个句子向量化表示的距离大于第一预设阈值,则以同一语义对应的标签作为所述预测的标签,若所述两个句子向量化表示的距离小于或者等于所述第一预设阈值,以不同语义对应的标签作为所述预测的标签。
5.根据权利要求1所述的智能客服问答方法,其特征在于,在根据所述各句子的向量化表示确定语料矩阵之后,还包括,为所述语料矩阵建立索引;
相应的,根据所述语料矩阵和所述在线用户问对应的向量化表示,确定所述在线用户问的返回结果,包括:
通过所述索引,从所述语料矩阵中获取与在线用户问对应的向量化表示,距离最为接近的一个向量化表示,根据所述一个向量化表示,确定所述在线用户问的返回结果;或者,通过所述索引,从所述语料矩阵中获取与在线用户问对应的向量化表示,距离排名最靠前的多个向量化表示,根据所述多个向量化表示,确定所述在线用户问的返回结果。
6.根据权利要求5所述的智能客服问答方法,其特征在于,根据所述一个向量化表示,确定所述在线用户问的返回结果,包括,
若所述一个向量化表示与所述在线用户问对应的向量化表示的距离大于第二预设阈值,则以所述一个向量化表示对应的句子数据作为在线用户问对应的标准问,以所述标准问确定所述在线用户问的返回结果;
根据所述多个向量化表示,确定所述在线用户问的返回结果,包括,
若所述多个向量化表示分别与所述在线用户问对应的向量化表示的距离,均大于第三预设阈值,则以所述多个向量化表示对应的句子数据均作为相似问,以所述相似问确定所述在线用户问的返回结果;
若所述多个向量化表示分别与所述在线用户问对应的向量化表示的距离,部分大于第三预设阈值,则以,与所述在线用户问对应的向量化表示的距离,大于第三预设阈值的向量化表示,对应的句子数据作为相似问,以所述相似问确定所述在线用户问的返回结果。
7.根据权利要求6所述的智能客服问答方法,其特征在于,还包括,若所述一个向量化表示与所述在线用户问对应的向量化表示的距离不大于第二预设阈值,或者,所述多个向量化表示分别与所述在线用户问对应的向量化表示的距离,均不大于第三预设阈值;则将在线用户问导入ES中进行预处理和检索,获取ES对应语料库中与所述在线用户问最匹配的标准问,以该标准问确定所述在线用户问的返回结果。
8.一种智能客服问答装置,其特征在于,包括模型训练模块、语料矩阵确定模块以及问答模块;
所述模型训练模块,用于获取训练集数据,利用预训练的字向量对所述训练集数据进行处理,得到处理后的训练集数据,将所述处理后的训练集数据输入至孪生神经网络模型的双向长短期记忆网络中,以完成对所述孪生神经网络模型的训练,得到训练完备的孪生神经网络模型;
所述语料矩阵确定模块,用于获取离线语料库,根据所述离线语料库和所述训练完备的孪生神经网络模型,获取所述离线语料库中各句子的向量化表示,根据所述各句子的向量化表示确定语料矩阵;
所述问答模块,用于获取在线用户问,根据所述在线用户问和所述训练完备的孪生神经网络模型,得到所述在线用户问对应的向量化表示,根据所述语料矩阵和所述在线用户问对应的向量化表示,确定所述在线用户问的返回结果。
9.一种电子设备,包括存储器、处理器,所述存储器存储有可被所述处理器执行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的智能客服问答方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的智能客服问答方法。
CN202211161896.2A 2022-09-23 2022-09-23 一种智能客服问答方法、装置、电子设备及存储介质 Pending CN115544229A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211161896.2A CN115544229A (zh) 2022-09-23 2022-09-23 一种智能客服问答方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211161896.2A CN115544229A (zh) 2022-09-23 2022-09-23 一种智能客服问答方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN115544229A true CN115544229A (zh) 2022-12-30

Family

ID=84730545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211161896.2A Pending CN115544229A (zh) 2022-09-23 2022-09-23 一种智能客服问答方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115544229A (zh)

Similar Documents

Publication Publication Date Title
CN112632385B (zh) 课程推荐方法、装置、计算机设备及介质
CN110795543B (zh) 基于深度学习的非结构化数据抽取方法、装置及存储介质
CN117033608B (zh) 一种基于大语言模型的知识图谱生成式问答方法及系统
CN109165291B (zh) 一种文本匹配方法及电子设备
CN109086265B (zh) 一种语义训练方法、短文本中多语义词消歧方法
CN113505586A (zh) 一种融合语义分类与知识图谱的坐席辅助问答方法与系统
CN112131883B (zh) 语言模型训练方法、装置、计算机设备和存储介质
CN113157863A (zh) 问答数据处理方法、装置、计算机设备及存储介质
CN113239169A (zh) 基于人工智能的回答生成方法、装置、设备及存储介质
CN112148831B (zh) 图文混合检索方法、装置、存储介质、计算机设备
CN115470338B (zh) 一种基于多路召回的多场景智能问答方法和系统
CN113342958B (zh) 问答匹配方法、文本匹配模型的训练方法和相关设备
CN114519397B (zh) 基于对比学习的实体链接模型的训练方法、装置、设备
CN113722512A (zh) 基于语言模型的文本检索方法、装置、设备及存储介质
CN112579666A (zh) 智能问答系统和方法及相关设备
CN115795018B (zh) 一种面向电网领域的多策略智能搜索问答方法及系统
CN116401344A (zh) 根据问句检索表格的方法和装置
CN115238077A (zh) 基于人工智能的文本分析方法、装置、设备及存储介质
CN112580348B (zh) 政策文本关联性分析方法及系统
CN115544229A (zh) 一种智能客服问答方法、装置、电子设备及存储介质
CN115017886A (zh) 文本匹配方法、文本匹配装置、电子设备及存储介质
CN116226320A (zh) 一种预测下文信息的方法、装置、电子设备及存储介质
CN114398482A (zh) 一种词典构造方法、装置、电子设备及存储介质
CN114547313A (zh) 资源类型识别方法以及装置
CN114186048A (zh) 基于人工智能的问答回复方法、装置、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination