CN110069607B - 用于客户服务的方法、装置、电子设备、计算机可读存储介质 - Google Patents

用于客户服务的方法、装置、电子设备、计算机可读存储介质 Download PDF

Info

Publication number
CN110069607B
CN110069607B CN201711339712.6A CN201711339712A CN110069607B CN 110069607 B CN110069607 B CN 110069607B CN 201711339712 A CN201711339712 A CN 201711339712A CN 110069607 B CN110069607 B CN 110069607B
Authority
CN
China
Prior art keywords
answer
question
auxiliary information
alternative
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711339712.6A
Other languages
English (en)
Other versions
CN110069607A (zh
Inventor
李岚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to CN201711339712.6A priority Critical patent/CN110069607B/zh
Priority to PCT/CN2018/116820 priority patent/WO2019114512A1/zh
Publication of CN110069607A publication Critical patent/CN110069607A/zh
Application granted granted Critical
Publication of CN110069607B publication Critical patent/CN110069607B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Signal Processing (AREA)
  • Development Economics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种用于客户服务的方法、装置、电子设备、计算机可读存储介质,属于智能客服技术领域。用于客户服务的方法包括:接收客户输入的原始问题;从预先建立的问答数据库中获取多个对应原始问题的备选回复答案及相应的置信度,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值;若置信度最高的备选回复答案的置信度不小于第一阈值,则向客户回复置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向人工客服展现多个对应原始问题的备选回复答案以及辅助信息。本发明能够减轻人工客服的工作量,提高问题回复的质量。

Description

用于客户服务的方法、装置、电子设备、计算机可读存储介质
技术领域
本发明涉及智能客服技术领域,特别是指一种用于客户服务的方法、装置、电子设备、计算机可读存储介质。
背景技术
在日常生活中,客户通常需要与人工客服或者客服机器人通过网络平台、电话或者面对面的交流以获得问题咨询、产品推荐、投诉等服务。但是受制于目前语义分析、多轮对话等自然语言处理领域的专业技术发展所限,目前客服机器人能回答的问题数量及满意程度还有一定限制;而人工客服通常较为繁忙,却又要处理很多重复的问题或流程。此外,由于客服人员各自熟悉的领域不同、客服人员流动性大、客服人员对前来咨询的客户背景信息不了解等问题,都会造成人工客服的服务水平也存在一定差距。
综上,现有客户服务系统存在如下问题需要解决:第一、如何减轻人工客服的工作量;第二、如何提高问题回复的质量。
发明内容
本发明要解决的技术问题是提供一种用于客户服务的方法、装置、电子设备、计算机可读存储介质,能够减轻人工客服的工作量,并能够提高问题回复的质量。
为解决上述技术问题,本发明的实施例提供技术方案如下:
一方面,提供一种用于客户服务的方法,包括:
接收客户输入的原始问题;
从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值;
若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及预先建立的辅助信息数据库辅助信息,所述辅助信息包括以下信息中的至少一种:所述原始问题中的关键词参考信息、客户数据、客户偏好、客户历史行为。
进一步地,所述从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度包括:
判断所述原始问题所对应的问题分类;
在所述问答数据库中对应的问题分类下查找与所述原始问题相似度最高的N个典型问题,N为大于1的整数,所述问答数据库中存储有典型问题及典型问题对应的备选回复答案;
获取每一典型问题对应的备选回复答案,并计算每一备选回复答案的置信度。
进一步地,所述计算每一备选回复答案的置信度包括:
在所述备选回复答案为纯文本答案时,获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的推荐度Rj,通过公式Cij=Si*Rj计算得到每一备选回复答案的置信度Cij
在所述备选回复答案为模板类答案时,获取所述模板类答案中k个辅助信息类别中每一辅助信息类别的最高推荐度RAIk,其中k个最高推荐度中的最小值为min(RAIk),获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的推荐度Rj,通过公式Cij=Si*Rj*min(RAIk)计算得到每一备选回复答案的置信度Cij
进一步地,所述方法还包括:
在人工客服回复所述原始问题后,获取人工客服回复的最终回复文本;或向所述客户回复所述置信度最高的备选回复答案作为最终回复文本,获取所述最终回复文本。
进一步地,获取所述最终回复文本之后,所述方法还包括:
判断客户是否继续输入原始问题;
若客户继续输入原始问题,转向所述接收客户输入的原始问题的步骤;
若客户不再输入原始问题,获取客户对所述最终回复文本的满意度,在所述客户对所述最终回复文本的满意度大于第二阈值时,根据所述最终回复文本更新问答训练缓存样本库以及辅助信息训练缓存样本库。
进一步地,所述根据所述最终回复文本更新问答训练缓存样本库以及辅助信息训练缓存样本库包括:
对所述最终回复文本进行分词;
根据分词结果确定所述最终回复文本所采纳的备选回复答案和辅助信息;
根据所述最终回复文本所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中,根据所述最终回复文本所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中。
进一步地,所述根据所述最终回复文本所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中包括:
根据分词结果判断所述最终回复文本是否采纳所述问答数据库中的备选回复答案;
若所述最终回复文本采纳所述问答数据库中的备选回复答案,则根据所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中;
若所述最终回复文本未采纳所述问答数据库中的备选回复答案,则根据所述最终回复文本生成所采纳的备选回复答案,根据生成的所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中;
其中,所述问答训练缓存样本包括:所述最终回复文本对应的原始问题、问题分类、匹配的典型问题和实际回复内容。
进一步地,将问答训练缓存样本存储至所述问答训练缓存样本库中之后,所述方法还包括:
判断所述问答训练缓存样本库是否满足预设的更新条件,在所述问答训练缓存样本库满足预设的更新条件时,利用所述问答训练缓存样本库中的问答训练缓存样本对所述问答数据库进行更新。
进一步地,所述利用所述问答训练缓存样本库中的问答训练缓存样本对所述问答数据库进行更新包括以下至少一种:
对所述问答数据库中的备选回复答案的推荐度进行更新;
对所述问答数据库的原问题分类器进行再训练;
对所述问答数据库的原问题相似度算法进行再训练。
进一步地,所述对所述问答数据库的原问题分类器进行再训练包括:
将所述问答训练缓存样本库中存储的每一问答训练缓存样本的原始问题和问题分类分别作为输入和输出对所述问答数据库的原问题分类器进行再训练。
进一步地,所述对所述问答数据库的原问题相似度算法进行再训练包括:
在所述问答训练缓存样本库中,选择问答训练缓存样本的原始问题以及匹配的典型问题这两组数据,对于相同的“原始问题-匹配的典型问题”的配对组合,统计其出现的频度;
以“原始问题-匹配的典型问题”的配对作为输入,以其频度作为输出,对所述问答数据库的原问题相似度算法的参数进行再训练。
进一步地,所述对所述问答数据库中的备选回复答案的推荐度进行更新包括:
在所述问答训练缓存样本库中,选择问答训练缓存样本的匹配的典型问题以及实际回复内容这两组数据;
对于每一个匹配的典型问题,统计其对应的各个实际回复内容的回复比例作为推荐度对所述问答数据库进行更新。
进一步地,所述根据所述最终回复文本所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中包括:
根据分词结果判断所述最终回复文本是否采纳所述辅助信息数据库中的辅助信息;
若所述最终回复文本采纳所述辅助信息数据库中的辅助信息,则根据所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中;
若所述最终回复文本未采纳所述辅助信息数据库中的辅助信息,则根据所述最终回复文本生成所采纳的辅助信息,根据生成的所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中;
其中,所述辅助信息训练缓存样本包括:所述最终回复文本对应的原始问题、问题分类、匹配的典型问题,辅助信息类别和辅助信息内容。
进一步地,将辅助信息训练样本存储至所述辅助信息训练缓存样本库之后,所述方法还包括:
判断所述辅助信息训练缓存样本库是否满足预设的更新条件,在所述辅助信息训练缓存样本库满足预设的更新条件时,利用所述辅助信息训练缓存样本库中的辅助信息训练样本对所述辅助信息数据库进行更新。
进一步地,所述利用所述辅助信息训练缓存样本库中的辅助信息训练样本对所述辅助信息数据库进行更新包括:
在所述辅助信息训练缓存样本库中,选择辅助信息训练样本的匹配的典型问题以及辅助信息内容这两组数据;
对于每一个匹配的典型问题,统计其对应的各个辅助信息内容的回复比例作为推荐度对所述辅助信息数据库进行更新。
进一步地,所述更新条件为所保存的样本数量大于第三阈值或达到预设的更新时间点。
本发明实施例还提供了一种用于客户服务的装置,包括:
接收模块,用于接收客户输入的原始问题;
判断模块,用于从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值;
处理模块,用于若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及预先建立的辅助信息数据库中的辅助信息,所述辅助信息包括以下信息中的至少一种:所述原始问题中的关键词参考信息、客户数据、客户偏好、客户历史行为。
本发明实施例还提供了一种用于客户服务的电子设备,包括:
处理器;和
存储器,在所述存储器中存储有计算机程序指令,
其中,在所述计算机程序指令被所述处理器运行时,使得所述处理器执行以下步骤:
接收客户输入的原始问题;
从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值;
若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及预先建立的辅助信息数据库中的辅助信息,所述辅助信息包括以下信息中的至少一种:所述原始问题中的关键词参考信息、客户数据、客户偏好、客户历史行为。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器运行时,使得所述处理器执行以下步骤:
接收客户输入的原始问题;
从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值;
若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及预先建立的辅助信息数据库中的辅助信息,所述辅助信息包括以下信息中的至少一种:所述原始问题中的关键词参考信息、客户数据、客户偏好、客户历史行为。
本发明的实施例具有以下有益效果:
上述方案中,首先接收客户输入的原始问题,从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值,若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及辅助信息。这样不仅在会话开始时可以使用问答数据库中的备选回复答案,而且在转接入人工客服后,仍能利用问答数据库提供快速答复;另一方面,即使是当前人工客服所不熟悉的领域,仍能为人工客服提供多种辅助信息,协助人工客服进行快速回复,从而能够减轻人工客服的工作量,并能够提高问题回复的质量。
附图说明
图1为本发明实施例用于客户服务的方法的流程示意图;
图2为本发明实施例用于客户服务的装置的结构框图;
图3为本发明实施例用于客户服务的电子设备的结构框图;
图4为本发明实施例用于客户服务的系统框图;
图5为本发明具体实施例用于客户服务的方法的流程示意图;
图6为本发明实施例获取备选回复答案的置信度并对备选回复答案进行排序的流程示意图;
图7为本发明实施例生成问答训练缓存样本和辅助信息训练样本的示意图;
图8为本发明实施例获取被采纳的备选回复答案和辅助信息的示意图。
具体实施方式
为使本发明的实施例要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
为了减轻人工客服的工作量,可以对应答机器人(即客服机器人)和人工客服进行问题的分配。首先,判断应答机器人是否知道聊天窗口中输入的问题的答案,若知道,则由应答机器人进行回复;若不知道,则反馈问题至应答服务端,由应答服务端向聊天服务器发送要求人工客服接入的请求。然后,聊天服务器通过一系列筛选、查找和判断分配最合适的人工客服与客户进行连接。其中,用于筛选和判断合适的人工客服人选的条件包括:是否具备回复此类别问题的技能、处于在线非挂起的状态、是否与该应答服务端最近一次建立过连接、人工客服当前正在接待的用户数是否小于阈值等。
但是上述方案仍然存在以下缺点:
客服机器人仅在一段会话的开始阶段有可能参与回答客户的问题,一旦由于客服机器人无法回答问题而转接至人工客服后,就不能再利用客服机器人辅助减轻人工客服的工作量。
由于在筛选人工客服时,判断是基于客户当前所提的问题类别,若客户后续又问到了其他类别的问题,仍可能超出所选人工客服的熟悉领域。虽然可以通过转接其他人工客服的方式解决此问题,但对于客户而言,等待转接的时间过长、需要重新描述问题等因素还是会影响用户体验,客户通常更倾向于在一个人工客服处解决所有问题。
现有方案并没有自我学习的功能,无法根据客户/人工客服的操作及反馈,对自身的知识库以及算法进行更新。
本发明的实施例提供一种用于客户服务的方法、装置、电子设备、计算机可读存储介质,能够减轻人工客服的工作量,并能够提高问题回复的质量。
实施例一
本发明的实施例提供一种用于客户服务的方法,如图1所示,包括:
步骤101:接收客户输入的原始问题;
步骤102:从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值;
步骤103:若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;
步骤104:若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及预先建立的辅助信息数据库中的辅助信息,所述辅助信息包括以下信息中的至少一种:所述原始问题中的关键词参考信息、客户数据、客户偏好、客户历史行为。
本实施例中,首先接收客户输入的原始问题,从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值,若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及辅助信息。这样不仅在会话开始时可以使用问答数据库中的备选回复答案,而且在转接入人工客服后,仍能利用问答数据库提供快速答复;另一方面,即使是当前人工客服所不熟悉的领域,仍能为人工客服提供多种辅助信息,协助人工客服进行快速回复,从而能够减轻人工客服的工作量,并能够提高问题回复的质量。
作为一个示例,所述从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度包括:
判断所述原始问题所对应的问题分类;
在所述问答数据库中对应的问题分类下查找与所述原始问题相似度最高的N个典型问题,N为大于1的整数,所述问答数据库中存储有典型问题及典型问题对应的备选回复答案;
获取每一典型问题对应的备选回复答案,并计算每一备选回复答案的置信度。
作为一个示例,所述计算每一备选回复答案的置信度包括:
在所述备选回复答案为纯文本答案时,获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的推荐度Rj,通过公式Cij=Si*Rj计算得到每一备选回复答案的置信度Cij
在所述备选回复答案为模板类答案时,获取所述模板类答案中k个辅助信息类别中每一辅助信息类别的最高推荐度RAIk,其中k个最高推荐度中的最小值为min(RAIk),获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的推荐度Rj,通过公式Cij=Si*Rj*min(RAIk)计算得到每一备选回复答案的置信度Cij
作为一个示例,所述方法还包括:
在人工客服回复所述原始问题后,获取人工客服回复的最终回复文本;或向所述客户回复所述置信度最高的备选回复答案作为最终回复文本,获取所述最终回复文本。
作为一个示例,获取所述最终回复文本之后,所述方法还包括:
判断客户是否继续输入原始问题;
若客户继续输入原始问题,转向所述接收客户输入的原始问题的步骤;
若客户不再输入原始问题,获取客户对所述最终回复文本的满意度,在所述客户对所述最终回复文本的满意度大于第二阈值时,根据所述最终回复文本更新问答训练缓存样本库以及辅助信息训练缓存样本库。
作为一个示例,所述根据所述最终回复文本更新问答训练缓存样本库以及辅助信息训练缓存样本库包括:
对所述最终回复文本进行分词;
根据分词结果确定所述最终回复文本所采纳的备选回复答案和辅助信息;
根据所述最终回复文本所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中,根据所述最终回复文本所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中。
作为一个示例,所述根据所述最终回复文本所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中包括:
根据分词结果判断所述最终回复文本是否采纳所述问答数据库中的备选回复答案;
若所述最终回复文本采纳所述问答数据库中的备选回复答案,则根据所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中;
若所述最终回复文本未采纳所述问答数据库中的备选回复答案,则根据所述最终回复文本生成所采纳的备选回复答案,根据生成的所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中;
其中,所述问答训练缓存样本包括:所述最终回复文本对应的原始问题、问题分类、匹配的典型问题和实际回复内容。
作为另外一个示例,获取所述最终回复文本之后,所述方法还包括:
根据所述最终回复文本更新问答训练缓存样本库以及辅助信息训练缓存样本库;
判断客户是否继续输入原始问题;
若客户继续输入原始问题,转向所述接收客户输入的原始问题的步骤;
若客户不再输入原始问题,获取客户对所述最终回复文本的满意度,在所述客户对所述最终回复文本的满意度不大于第二阈值时,丢弃问答训练缓存样本库以及辅助信息训练缓存样本库中缓存的样本。
其中,所述根据所述最终回复文本更新问答训练缓存样本库以及辅助信息训练缓存样本库包括:
对所述最终回复文本进行分词;
根据分词结果确定所述最终回复文本所采纳的备选回复答案和辅助信息;
根据所述最终回复文本所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中,根据所述最终回复文本所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中。
作为一个示例,所述根据所述最终回复文本所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中包括:
根据分词结果判断所述最终回复文本是否采纳所述问答数据库中的备选回复答案;
若所述最终回复文本采纳所述问答数据库中的备选回复答案,则根据所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中;
若所述最终回复文本未采纳所述问答数据库中的备选回复答案,则根据所述最终回复文本生成所采纳的备选回复答案,根据生成的所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中;
其中,所述问答训练缓存样本包括:所述最终回复文本对应的原始问题、问题分类、匹配的典型问题和实际回复内容。
进一步地,将问答训练缓存样本存储至所述问答训练缓存样本库中之后,所述方法还包括:
判断所述问答训练缓存样本库是否满足预设的更新条件,在所述问答训练缓存样本库满足预设的更新条件时,利用所述问答训练缓存样本库中的问答训练缓存样本对所述问答数据库进行更新。
进一步地,所述利用所述问答训练缓存样本库中的问答训练缓存样本对所述问答数据库进行更新包括以下至少一种:
对所述问答数据库的原问题分类器进行再训练;
对所述问答数据库的原问题相似度算法进行再训练;
对所述问答数据库中的备选回复答案的推荐度进行更新。
进一步地,所述对所述问答数据库的原问题分类器进行再训练包括:
将所述问答训练缓存样本库中存储的每一问答训练缓存样本的原始问题和问题分类分别作为输入和输出对所述问答数据库的原问题分类器进行再训练。
进一步地,所述对所述问答数据库的原问题相似度算法进行再训练包括:
在所述问答训练缓存样本库中,选择问答训练缓存样本的原始问题以及匹配的典型问题这两组数据,对于相同的“原始问题-匹配的典型问题”的配对组合,统计其出现的频度;
以“原始问题-匹配的典型问题”的配对作为输入,以其频度作为输出,对所述问答数据库的原问题相似度算法的参数进行再训练。
进一步地,所述对所述问答数据库中的备选回复答案的推荐度进行更新包括:
在所述问答训练缓存样本库中,选择问答训练缓存样本的匹配的典型问题以及实际回复内容这两组数据;
对于每一个匹配的典型问题,统计其对应的各个实际回复内容的回复比例作为推荐度对所述问答数据库进行更新。
作为一个示例,所述根据所述最终回复文本所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中包括:
根据分词结果判断所述最终回复文本是否采纳所述辅助信息数据库中的辅助信息;
若所述最终回复文本采纳所述辅助信息数据库中的辅助信息,则根据所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中;
若所述最终回复文本未采纳所述辅助信息数据库中的辅助信息,则根据所述最终回复文本生成所采纳的辅助信息,根据生成的所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中;
其中,所述辅助信息训练缓存样本包括:所述最终回复文本对应的原始问题、问题分类、匹配的典型问题,辅助信息类别和辅助信息内容。
进一步地,将辅助信息训练样本存储至所述辅助信息训练缓存样本库之后,所述方法还包括:
判断所述辅助信息训练缓存样本库是否满足预设的更新条件,在所述辅助信息训练缓存样本库满足预设的更新条件时,利用所述辅助信息训练缓存样本库中的辅助信息训练样本对所述辅助信息数据库进行更新。
进一步地,所述利用所述辅助信息训练缓存样本库中的辅助信息训练样本对所述辅助信息数据库进行更新包括:
在所述辅助信息训练缓存样本库中,选择辅助信息训练样本的匹配的典型问题以及辅助信息内容这两组数据;
对于每一个匹配的典型问题,统计其对应的各个辅助信息内容的回复比例作为推荐度对所述辅助信息数据库进行更新。
其中,上述更新条件具体可以为所保存的样本数量大于第三阈值或达到预设的更新时间点。可以根据需要设置第三阈值的值,比如将第三阈值设置为1000、2000等等。预设的更新时间点比如可以为每周的某一天,或者每月的某一号等等。
实施例二
本发明实施例还提供了一种用于客户服务的装置,如图2所示,包括:
接收模块21,用于接收客户输入的原始问题;
判断模块22,用于从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值;
处理模块23,用于若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及预先建立的辅助信息数据库中的辅助信息,所述辅助信息包括以下信息中的至少一种:所述原始问题中的关键词参考信息、客户数据、客户偏好、客户历史行为。
本实施例中,首先接收客户输入的原始问题,从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值,若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及辅助信息。这样不仅在会话开始时可以使用问答数据库中的备选回复答案,而且在转接入人工客服后,仍能利用问答数据库提供快速答复;另一方面,即使是当前人工客服所不熟悉的领域,仍能为人工客服提供多种辅助信息,协助人工客服进行快速回复,从而能够减轻人工客服的工作量,并能够提高问题回复的质量。
进一步地,所述判断模块22具体用于判断所述原始问题所对应的问题分类;在所述问答数据库中对应的问题分类下查找与所述原始问题相似度最高的N个典型问题,N为大于1的整数,所述问答数据库中存储有典型问题及典型问题对应的备选回复答案;获取每一典型问题对应的备选回复答案,并计算每一备选回复答案的置信度。
进一步地,所述判断模块22包括:
备选回复答案计算单元,用于在所述备选回复答案为纯文本答案时,获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的推荐度Rj,通过公式Cij=Si*Rj计算得到每一备选回复答案的置信度Cij;在所述备选回复答案为模板类答案时,获取所述模板类答案中k个辅助信息类别中每一辅助信息类别的最高推荐度RAIk,其中k个最高推荐度中的最小值为min(RAIk),获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的推荐度Rj,通过公式Cij=Si*Rj*min(RAIk)计算得到每一备选回复答案的置信度Cij
进一步地,如图2所示,所述装置还包括:
获取模块24,用于在人工客服回复所述原始问题后,获取人工客服回复的最终回复文本;或向所述客户回复所述置信度最高的备选回复答案作为最终回复文本,获取所述最终回复文本。
进一步地,所述装置还包括:
自学习训练样本缓存单元25,用于在获取人工客服回复的最终回复文本之后,判断客户是否继续输入原始问题;若客户不再输入原始问题,获取客户对所述最终回复文本的满意度,在所述客户对所述最终回复文本的满意度大于第二阈值时,根据所述最终回复文本更新问答训练缓存样本库以及辅助信息训练缓存样本库。
进一步地,所述自学习训练样本缓存单元25具体用于对所述最终回复文本进行分词;根据分词结果确定所述最终回复文本所采纳的备选回复答案和辅助信息;根据所述最终回复文本所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中,根据所述最终回复文本所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中。
进一步地,所述自学习训练样本缓存单元包括:
问答训练缓存样本缓存单元,用于根据分词结果判断所述最终回复文本是否采纳所述问答数据库中的备选回复答案;若所述最终回复文本采纳所述问答数据库中的备选回复答案,则根据所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中;若所述最终回复文本未采纳所述问答数据库中的备选回复答案,则根据所述最终回复文本生成所采纳的备选回复答案,根据生成的所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中;其中,所述问答训练缓存样本包括:所述最终回复文本对应的原始问题、问题分类、匹配的典型问题和实际回复内容。
作为另外一个示例,所述自学习训练样本缓存单元25,用于在获取人工客服回复的最终回复文本之后,根据所述最终回复文本更新问答训练缓存样本库以及辅助信息训练缓存样本库,并判断客户是否继续输入原始问题;若客户不再输入原始问题,获取客户对所述最终回复文本的满意度,在所述客户对所述最终回复文本的满意度不大于第二阈值时,丢弃缓存的样本。
进一步地,所述自学习训练样本缓存单元25具体用于对所述最终回复文本进行分词;根据分词结果确定所述最终回复文本所采纳的备选回复答案和辅助信息;根据所述最终回复文本所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中,根据所述最终回复文本所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中。
进一步地,所述自学习训练样本缓存单元包括:
问答训练缓存样本缓存单元,用于根据分词结果判断所述最终回复文本是否采纳所述问答数据库中的备选回复答案;若所述最终回复文本采纳所述问答数据库中的备选回复答案,则根据所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中;若所述最终回复文本未采纳所述问答数据库中的备选回复答案,则根据所述最终回复文本生成所采纳的备选回复答案,根据生成的所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中;其中,所述问答训练缓存样本包括:所述最终回复文本对应的原始问题、问题分类、匹配的典型问题和实际回复内容。
进一步地,所述装置还包括:
问答数据库更新模块26,用于在将问答训练缓存样本存储至所述问答训练缓存样本库中之后,判断所述问答训练缓存样本库是否满足预设的更新条件,在所述问答训练缓存样本库满足预设的更新条件时,利用所述问答训练缓存样本库中的问答训练缓存样本对所述问答数据库进行更新。
进一步地,所述问答数据库更新模块具体用于对所述问答数据库中的备选回复答案的推荐度进行更新;和/或对所述问答数据库的原问题分类器进行再训练;和/或对所述问答数据库的原问题相似度算法进行再训练。
进一步地,所述问答数据库更新模块包括:
问题分类器训练单元,用于将所述问答训练缓存样本库中存储的每一问答训练缓存样本的原始问题和问题分类分别作为输入和输出对所述问答数据库的原问题分类器进行再训练。
进一步地,所述问答数据库更新模块包括:
问题相似度算法训练单元,用于在所述问答训练缓存样本库中,选择问答训练缓存样本的原始问题以及匹配的典型问题这两组数据,对于相同的“原始问题-匹配的典型问题”的配对组合,统计其出现的频度;以“原始问题-匹配的典型问题”的配对作为输入,以其频度作为输出,对所述问答数据库的原问题相似度算法的参数进行再训练。
进一步地,所述问答数据库更新模块包括:
推荐度更新单元,用于在所述问答训练缓存样本库中,选择问答训练缓存样本的匹配的典型问题以及实际回复内容这两组数据;对于每一个匹配的典型问题,统计其对应的各个实际回复内容的回复比例作为推荐度对所述问答数据库进行更新。
进一步地,所述自学习训练样本缓存单元包括:
辅助信息训练缓存样本缓存单元,根据分词结果判断所述最终回复文本是否采纳所述辅助信息数据库中的辅助信息;若所述最终回复文本采纳所述辅助信息数据库中的辅助信息,则根据所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中;若所述最终回复文本未采纳所述辅助信息数据库中的辅助信息,则根据所述最终回复文本生成所采纳的辅助信息,根据生成的所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中;其中,所述辅助信息训练缓存样本包括:所述最终回复文本对应的原始问题、问题分类、匹配的典型问题,辅助信息类别和辅助信息内容。
进一步地,所述装置还包括:
辅助信息数据库更新模块27,用于在将辅助信息训练样本存储至所述辅助信息训练缓存样本库之后,判断所述辅助信息训练缓存样本库是否满足预设的更新条件,在所述辅助信息训练缓存样本库满足预设的更新条件时,利用所述辅助信息训练缓存样本库中的辅助信息训练样本对所述辅助信息数据库进行更新。
所述辅助信息数据库更新模块包括:
推荐度更新单元,用于在所述辅助信息训练缓存样本库中,选择辅助信息训练样本的匹配的典型问题以及辅助信息内容这两组数据;对于每一个匹配的典型问题,统计其对应的各个辅助信息内容的回复比例作为推荐度对所述辅助信息数据库进行更新。
其中,上述更新条件具体可以为所保存的样本数量大于第三阈值或达到预设的更新时间点。可以根据需要设置第三阈值的值,比如将第三阈值设置为1000、2000等等。预设的更新时间点比如可以为每周的某一天,或者每月的某一号等等。
实施例三
本发明实施例还提供了一种用于客户服务的电子设备30,如图3所示,包括:
处理器32;和
存储器34,在所述存储器34中存储有计算机程序指令,
其中,在所述计算机程序指令被所述处理器运行时,使得所述处理器32执行以下步骤:
接收客户输入的原始问题;
从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值;
若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及预先建立的辅助信息数据库中的辅助信息,所述辅助信息包括以下信息中的至少一种:所述原始问题中的关键词参考信息、客户数据、客户偏好、客户历史行为。
本实施例中,首先接收客户输入的原始问题,从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值,若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及辅助信息。这样不仅在会话开始时可以使用问答数据库中的备选回复答案,而且在转接入人工客服后,仍能利用问答数据库提供快速答复;另一方面,即使是当前人工客服所不熟悉的领域,仍能为人工客服提供多种辅助信息,协助人工客服进行快速回复,从而能够减轻人工客服的工作量,并能够提高问题回复的质量。
进一步地,如图3所示,用于客户服务的电子设备30还包括网络接口31、输入设备33、硬盘35、和显示设备36。
上述各个接口和设备之间可以通过总线架构互连。总线架构可以是可以包括任意数量的互联的总线和桥。具体由处理器32代表的一个或者多个中央处理器(CPU),以及由存储器34代表的一个或者多个存储器的各种电路连接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其它电路连接在一起。可以理解,总线架构用于实现这些组件之间的连接通信。总线架构除包括数据总线之外,还包括电源总线、控制总线和状态信号总线,这些都是本领域所公知的,因此本文不再对其进行详细描述。
所述网络接口31,可以连接至网络(如因特网、局域网等),从网络中获取相关数据,例如客户输入的原始问题,并可以保存在硬盘35中。
所述输入设备33,可以接收操作人员输入的各种指令,并发送给处理器32以供执行。所述输入设备33可以包括键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
所述显示设备36,可以将处理器32执行指令获得的结果进行显示。
所述存储器34,用于存储操作系统运行所必须的程序和数据,以及处理器32计算过程中的中间结果等数据。
可以理解,本发明实施例中的存储器34可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)或闪存。易失性存储器可以是随机存取存储器(RAM),其用作外部高速缓存。本文描述的装置和方法的存储器34旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器34存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:操作系统341和应用程序342。
其中,操作系统341,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序342,包含各种应用程序,例如浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序342中。
上述处理器32,当调用并执行所述存储器34中所存储的应用程序和数据,具体的,可以是接收客户输入的原始问题;从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值;若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及预先建立的辅助信息数据库中的辅助信息,所述辅助信息包括以下信息中的至少一种:所述原始问题中的关键词参考信息、客户数据、客户偏好、客户历史行为。
本发明上述实施例揭示的方法可以应用于处理器32中,或者由处理器32实现。处理器32可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器32中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器32可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器34,处理器32读取存储器34中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ASIC)、数字信号处理器DSP)、数字信号处理设备(DSPD)、可编程逻辑设备(PLD)、现场可编程门阵列(FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
具体地,处理器32判断所述原始问题所对应的问题分类;在所述问答数据库中对应的问题分类下查找与所述原始问题相似度最高的N个典型问题,N为大于1的整数,所述问答数据库中存储有典型问题及典型问题对应的备选回复答案;获取每一典型问题对应的备选回复答案,并计算每一备选回复答案的置信度。
具体地,处理器32在所述备选回复答案为纯文本答案时,获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的推荐度Rj,通过公式Cij=Si*Rj计算得到每一备选回复答案的置信度Cij;在所述备选回复答案为模板类答案时,获取所述模板类答案中k个辅助信息类别中每一辅助信息类别的最高推荐度RAIk,其中k个最高推荐度中的最小值为min(RAIk),获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的推荐度Rj,通过公式Cij=Si*Rj*min(RAIk)计算得到每一备选回复答案的置信度Cij
具体地,处理器32在人工客服回复所述原始问题后,获取人工客服回复的最终回复文本;或向所述客户回复所述置信度最高的备选回复答案作为最终回复文本,获取所述最终回复文本。
具体地,处理器32判断客户是否继续输入原始问题;若客户继续输入原始问题,转向所述接收客户输入的原始问题的步骤;若客户不再输入原始问题,获取客户对所述最终回复文本的满意度,在所述客户对所述最终回复文本的满意度大于第二阈值时,根据所述最终回复文本更新问答训练缓存样本库以及辅助信息训练缓存样本库。
具体地,处理器32对所述最终回复文本进行分词;根据分词结果确定所述最终回复文本所采纳的备选回复答案和辅助信息;根据所述最终回复文本所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中,根据所述最终回复文本所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中。
具体地,处理器32根据分词结果判断所述最终回复文本是否采纳所述问答数据库中的备选回复答案;若所述最终回复文本采纳所述问答数据库中的备选回复答案,则根据所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中;若所述最终回复文本未采纳所述问答数据库中的备选回复答案,则根据所述最终回复文本生成所采纳的备选回复答案,根据生成的所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中;其中,所述问答训练缓存样本包括:所述最终回复文本对应的原始问题、问题分类、匹配的典型问题和实际回复内容。
具体地,处理器32判断所述问答训练缓存样本库是否满足预设的更新条件,在所述问答训练缓存样本库满足预设的更新条件时,利用所述问答训练缓存样本库中的问答训练缓存样本对所述问答数据库进行更新。
具体地,处理器32对所述问答数据库中的备选回复答案的推荐度进行更新;和/或对所述问答数据库的原问题分类器进行再训练;和/或对所述问答数据库的原问题相似度算法进行再训练。
具体地,处理器32将所述问答训练缓存样本库中存储的每一问答训练缓存样本的原始问题和问题分类分别作为输入和输出对所述问答数据库的原问题分类器进行再训练。
具体地,处理器32在所述问答训练缓存样本库中,选择问答训练缓存样本的原始问题以及匹配的典型问题这两组数据,对于相同的“原始问题-匹配的典型问题”的配对组合,统计其出现的频度;以“原始问题-匹配的典型问题”的配对作为输入,以其频度作为输出,对所述问答数据库的原问题相似度算法的参数进行再训练。
具体地,处理器32在所述问答训练缓存样本库中,选择问答训练缓存样本的匹配的典型问题以及实际回复内容这两组数据;对于每一个匹配的典型问题,统计其对应的各个实际回复内容的回复比例作为推荐度对所述问答数据库进行更新。
具体地,处理器32根据分词结果判断所述最终回复文本是否采纳所述辅助信息数据库中的辅助信息;若所述最终回复文本采纳所述辅助信息数据库中的辅助信息,则根据所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中;若所述最终回复文本未采纳所述辅助信息数据库中的辅助信息,则根据所述最终回复文本生成所采纳的辅助信息,根据生成的所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中;其中,所述辅助信息训练缓存样本包括:所述最终回复文本对应的原始问题、问题分类、匹配的典型问题,辅助信息类别和辅助信息内容。
具体地,处理器32判断所述辅助信息训练缓存样本库是否满足预设的更新条件,在所述辅助信息训练缓存样本库满足预设的更新条件时,利用所述辅助信息训练缓存样本库中的辅助信息训练样本对所述辅助信息数据库进行更新。
具体地,处理器32在所述辅助信息训练缓存样本库中,选择辅助信息训练样本的匹配的典型问题以及辅助信息内容这两组数据;对于每一个匹配的典型问题,统计其对应的各个辅助信息内容的回复比例作为推荐度对所述辅助信息数据库进行更新。
实施例四
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器运行时,使得所述处理器执行以下步骤:
接收客户输入的原始问题;
从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值;
若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及预先建立的辅助信息数据库中的辅助信息,所述辅助信息包括以下信息中的至少一种:所述原始问题中的关键词参考信息、客户数据、客户偏好、客户历史行为。
实施例五
下面结合附图对本发明的用于客户服务的方案进行进一步介绍。为了实现本发明的技术目的,本发明提出了一种客户服务辅助系统,如图4所示,包括:
问答数据库110,用于存储已知的问题及其备选回复答案列表。
辅助信息数据库120,用于存储进行客户服务时可能用到的各种参考信息,包括但不限于品牌、产品信息、产品口碑、客户基本数据、客户偏好、客户历史行为记录等等。
备选回复答案计算单元150,用于根据客户的问题,基于问答数据库110推算出一个或多个备选回复答案及其置信度。
人工客服辅助面板100,辅助人工客服回复客户问题的界面,根据辅助内容,可划分为多个辅助子面板。例如:
(1)备选回复答案子面板:用于按照优先级提供多个备选回复答案或者回复模板。
(2)辅助信息子面板:用于提供回复客户问题时可能用到的辅助信息。可以包括但不限于:
①基于原始问题中关键词的参考信息:从客户的原始问题中提取关键词,并列出相关信息。例如客户问题中提到了某产品名称,则可以给出该产品的文字介绍、规格、价格、优惠活动、产品口碑、相似产品列表等信息。
②客户的基本数据:客户的姓名或昵称、年龄、性别、地理位置、身高、体重、肤质等可以描述客户基础属性的信息。
③客户偏好数据:从客户的历史购买记录、产品评价中提取出的客户偏好信息,例如偏好产品的风格、关注的产品属性等。
④客户历史行为记录:如近期购买过的产品、操作、商品评价、近期服务记录等。
(3)人工客服回复输入栏:用于让人工客服参考以上备选回复答案子面板、辅助信息子面板,通过点击、选择、编辑,最终生成需要回复给客户的答案的输入栏。
自学习训练样本缓存单元160,根据人工客服的最终回复文本,更新问答训练缓存样本库130和辅助信息训练缓存样本库140。
自学习单元170,根据问答训练缓存样本库130和辅助信息训练缓存样本库140中存储的样本以及客户的满意度调查结果,不断调整问答数据库110、辅助信息数据库120,并重新训练备选回复答案计算单元中算法,使系统的性能不断改善。
其中,问答数据库110中每个备选回复答案的储存格式如表1所示:
表1
对于问题分类,问答数据库110可以预定义多个问题分类,便于在检索最接近问题时根据应用场景和问答上下文缩小搜索范围,提高匹配的速度和精度。可参考的问题分类有:产品介绍、产品推荐、质量投诉等。
对于典型问题,是指问题的文字内容。由于现有很多自然语言处理技术可以判断问题之间的相似度(例如语法相似度、编辑距离、语句向量相似度等,这里不再赘述)所以对于同一个典型问题可以有多种相似问法的情况,问答数据库110中只保存一个典型问题即可。
回复类型是指备选回复答案的类型,备选回复答案可分为两种:“纯文本答案”和“模板类答案”。纯文本答案即只有文字;模板类答案即回复中有部分关键词是可替换的词语,例如回复内容“到[省市名]的邮费是[价格]”属于一条模板类答案,其中“[省市名]”、“[价格]”这些方括号中的词语均是回复中可替换的词语,也对应着辅助信息数据库120中“辅助信息类别”这一栏里的信息。而可以被替换到[]位置的词语,则对应着辅助信息数据库120中“辅助信息内容”这一栏里的信息。(此处的[省市名]、[价格]只是示例,在实际应用中可以是更复杂的分类,例如多级分类。)每个典型问题可以对应于多条回复内容,即同一个问题在问答数据库110中可以储存多个对应的备选回复答案。
最近使用时间戳记录了该条备选回复答案最近一次被选择使用的时间戳。
客服总体推荐度:根据所有客服的选择结果计算出的该备选回复答案的总体推荐度。
辅助信息数据库120中每条辅助信息的储存格式如表2所示:
表2
问答训练缓存样本库中存储的问答训练缓存样本的格式如表3所示:
表3
辅助信息训练缓存样本库中存储的辅助信息训练样本的格式如表4所示:
表4
如图5所示,本实施例的用于客户服务的方法具体包括以下步骤:
步骤401:客户提出原始问题;
每当客户提出一个问题(可以通过文本输入或语音输入)时,如果输入的问题非文本格式,可以通过格式转换工具转换为文本。文本格式的客户问题以下简称为“原始问题”。
步骤402:判断备选回复答案的置信度是否足够高,如果足够高,转向步骤403;如果不足够高,转向步骤404;
备选回复答案计算单元150通过问题相似度的计算,得到最高置信度的备选回复答案。
如图6所示,得到最高置信度的备选回复答案的过程包括以下步骤:
步骤601:判断所述原始问题所对应的问题分类;
首先根据当前原始问题及最近的聊天记录等信息判断问题的分类,以缩小搜索范围。判断问题的分类可以简单地通过一些规则、模板判断,也可以使用通过大量预先标注过的文本经过机器学习训练的“问题分类器”进行判断。
步骤502:在所述问答数据库中对应的问题分类下查找与所述原始问题相似度最高的N个典型问题;
在对应的问题分类下,通过问题匹配,在问答数据库110中找到与原始问题相似度最高的N个典型问题(假设为Q1,Q2,…,QN),并分别得到问题相似度数值(假设原始问题与它们的相似度分别为S1,S2,…,SN)。问题相似度的计算方法可以使用编辑距离、特征向量余弦相似度等多种现有算法中的某一种算法,也可以同时使用多种相似度算法,并取相似度数值最大的一组匹配结果(下文简称“综合相似度算法”)。在筛选相似度最高的N个典型问题时,还需要参考一个最低可接受的相似度阈值,假设为Sth,那么对于每一个Si(i=1,2,…,N)都需要满足Si≥Sth
步骤503:获取每一典型问题对应的备选回复答案;
针对相似度最高的N个典型问题,每一个典型问题又对应于多条备选回复答案,并有各自的相似度。假设第i个相似度最高的典型问题(i=1,2,…,N)中,有M条备选回复答案(假设为A1,A2,…,AM),它们的推荐度分别为R1,R2,…,RM
步骤504:计算每一备选回复答案的置信度;
那么,对于第i个典型问题的第j个备选回复答案,计算器置信度Cij。计算方法为:如果该备选回复答案是纯文本答案,可以计算其置信度Cij为:Cij=Si*Rj;如果该备选回复答案是模板类答案,假设模板中出现了k个辅助信息类别,且每个辅助信息类别在辅助信息数据库120中相同的典型问题及辅助信息类别下所对应的最高推荐度的辅助信息的客服总体推荐度为RAIk,则可以计算该模板类答案的置信度Cij为:Cij=Si*Rj*min(RAIk),其中min(RAIk)表示k个辅助信息类别所对应的RAIk中的最小值;
步骤505:按照置信度的从高到低对所有备选回复答案进行排序。
这样就可以得到最高置信度的备选回复答案或备选回复答案列表。
步骤403:向客户展示备选回复答案;
如果最高置信度的一个备选回复答案其置信度C大于等于某一个阈值Cth,则认为该备选回复答案足够可信,可以直接向客户回复该备选回复答案。
步骤404:转入由人工客服回答;
如果最高置信度的一个备选回复答案其置信度C小于某一个阈值Cth,则需要由人工客服来回答,但系统会给人工客服提示多种辅助信息,帮助其快速的完成对客户的回复。
系统给人工客服提供的辅助信息包括备选回复答案列表,及与问题相关的辅助信息等,这些信息显示在备选回复答案子面板和辅助信息子面板上。
备选回复答案子面板:显示按照置信度从高到低排序的备选回复答案列表。
辅助信息子面板:根据实际需求,辅助信息子面板可以由多个分类面板组成,如依据客户问题中的关键词给出的参考信息、客户基本数据、客户偏好、客户历史行为等等。每个分类面板可以是“可自学更新的分类面板”和“其他分类面板”两种。其中“可自学更新的分类面板”里给出的辅助信息是可以根据人工客服的最终回复文本不断学习并更新推荐度的,而“其他分类面板”可以是由其他已有推荐算法给出的辅助信息,比如客户基本数据、客户偏好、客户历史行为、针对客户的个性化推荐内容等。其中“可自学更新的分类面板”中显示的辅助信息为本发明重点关注的内容,为简化说明,下文假设“辅助信息子面板”中仅包括“可自学更新的分类面板”。“其他分类面板”中显示的辅助信息可以由多种方式生成、排序及更新,不在本发明重点讨论范围之内,但本发明所给出的关于“训练缓存样本库”与“问答/辅助信息数据库”的更新的方法也可以作为“其他分类面板”更新的参考。每个分类面板代表一种“辅助信息类别”(对应于辅助信息数据库120中的“辅助信息类别”,如果辅助信息类别有多级分类,则可代表其中的第一级分类),显示按照置信度从高到低排序的备选回复答案列表。(辅助信息的置信度与备选回复答案的置信度计算方法相似。)
人工客服根据上述辅助信息,在人工客服回复输入栏中最终编辑完成给客户的回复(下面简称“最终回复文本”)。
步骤405:自学习训练样本缓存单元160根据最终回复文本,更新问答训练缓存样本库和辅助信息训练缓存样本库;
如图7所示,更新问答训练缓存样本库和辅助信息训练缓存样本库包括以下步骤:
步骤601:获取最终回复文本所采纳的备选回复答案及辅助信息;
初始状态下,同一个典型问题的所有备选回复答案、辅助信息可由人工或特定算法设置不同的初始推荐度,也可以默认设定相同的初始推荐度。
当某人工客服在人工客服输入栏编辑完最终回复文本并确认发出后,首先由自学习训练样本缓存单元160判断此最终回复文本中具体采用了哪些备选回复答案文本/模板、辅助信息——即有哪些回复文本/模板、辅助信息需要更新其在知识库中的推荐度。
如图8所示,获取最终回复文本所采纳的备选回复答案及辅助信息包括以下步骤:
步骤701:对最终回复文本进行分词;
对最终回复文本进行分词,即将每条语句分割成词语。
步骤702:根据分词结果初步筛选可能采纳的备选回复答案及辅助信息;
根据回答客户的原始问题时面板上曾经出现过的辅助信息以及客服的点击历史记录,初步筛选哪些备选回复答案、辅助信息(词语)可能被用到了最终回复文本中。
步骤703:将初步筛选结果与最终回复文本进行比对,确定其中被采纳的备选回复答案及辅助信息;
将初步筛查的结果,与最终回复文本进行对比,确认其是否最终被使用到了最终回复文本中——这些备选回复答案、辅助信息称为“被采纳的”备选回复答案/辅助信息,它们的推荐度需要被新增或更新到数据库中。
步骤704:判断最终回复文本中是否还有其他辅助信息,如果是,转向步骤705;如果否,转向步骤706;
除了步骤703中已识别的备选回复答案和辅助信息以外,继续判断最终回复文本中是否有其他属于辅助信息数据库120的内容,虽然没在面板上作为辅助信息出现,但最终被应用到了客服的回复中——这些辅助信息如果已经在此问题对应的辅助信息数据库120中,则需要提高其推荐度;如果不在此问题对应的辅助信息数据库120中,则需要新增。
步骤705:追加到被采纳的辅助信息中;
步骤706:是否找到最终回复文本所对应的备选回复答案,如果是,则结束;如果否,转向步骤707;
步骤707:生成被采纳的备选回复答案。
如果经过上述步骤,未能找到最终回复文本所对应的问答数据库110中的备选回复答案,则根据已有信息生成一个“被采纳的”备选回复答案。生成方法是:在“最终回复文本”中,将步骤703和步骤704中识别出来的“辅助信息内容”用相应的“辅助信息类别”做替换,即得到一个“被采纳的回复模板”;如果最终回复文本中未包含任何已知的“辅助信息内容”,则直接将最终回复文本视为一条“被采纳的回复文本”。判断该被采纳的回复文本或者回复模板是否已存在于问答数据库110中。如果已存在,则需要更新其推荐度。如果不存在,则意味着可能需要在问答数据库110新增一条回复内容或者回复模板。
对于那些本次最终回复文本中“被采纳的”备选回复答案的文本/回复模板、辅助信息,将这些信息存储到问答训练缓存样本库及辅助信息训练缓存样本库中。其中,“匹配的典型问题”这一栏填写最终回复文本所采用的备选回复答案所对应的“典型问题”。如果最终回复文本未使用已有的备选回复答案,则新增一条“匹配的典型问题”,内容与“原始问题”相同。“问题分类”这一栏填写的是“匹配的典型问题”在问答数据库110中所对应的“问题分类”,如果“匹配的典型问题”是新增的条目,则“问题分类”可以统一设定为“待定分类”,或者根据“原始问题”和“问题分类器”对其进行分类。问答训练缓存样本库中的“实际回复内容”填写的是“最终回复文本”或“最终回复模板”。
辅助信息训练缓存样本库的“辅助信息类别”填写的是被采纳的辅助信息所对应的“辅助信息类别”。具体填写方法如下:如果在辅助信息数据库120中,与此次对话中原始问题所匹配的“典型问题”下,恰好有与此次被采纳的辅助信息相同的条目,则直接采用其对应的“辅助信息类别”填写到辅助信息训练缓存样本库的“辅助信息类别”中;如果在辅助信息数据库120中,与此次对话中原始问题所匹配的“典型问题”下,没有与此次被采纳的辅助信息相同的条目。则按照与原始问题的匹配度从高到低的顺序再查找其他“典型问题”中是否储存了与“被采纳的辅助信息”相同的条目,如果找到了,则读取其“辅助信息类别”填写到辅助信息训练缓存样本库的“辅助信息类别”中;如果在辅助信息数据库120中,没有与此次被采纳的辅助信息相同的条目,则“辅助信息类别”设置为“待定分类”。
问答训练缓存样本库及辅助信息训练缓存样本库中,填写为“待定分类”的栏目,可以后期由人工或机器学习的方式来进行追加标注,修改为分类结果。
步骤602:根据所述最终回复文本所采纳的备选回复答案生成问答训练缓存样本并存储至问答训练缓存样本库中,根据所述最终回复文本所采纳的辅助信息生成辅助信息训练缓存样本并存储至辅助信息训练缓存样本库中。
步骤406:判断客户是否还有下一个问题,如果有,则转向步骤401;如果没有下一个问题,则转向步骤407;
步骤407:判断客户对最终回复文本是否满意;如果满意,转向步骤408;如果不满意,转向步骤409;
如果客户对最终回复文本满意,则保留此次会话中所有的训练缓存样本。
步骤408:判断是否已积累足够多的训练样本,如果是,转向步骤410;如果否,则结束。
步骤409:如果客户对最终回复文本不满意,则丢弃此次会话中所有的训练缓存样本。
步骤410:自学习单元进行数据库的更新和备选回复答案计算单元的再训练。
每隔一段预设的时间,或者每当问答训练缓存样本库和辅助信息训练缓存样本库中的新增样本数量累积到一个阈值,则自学习单元170利用增量的训练样本对问答数据库110和辅助信息数据库120进行推荐度的更新,以及备选回复答案计算单元的再训练。
其中,备选回复答案计算单元150的再训练包括:
对“问题分类器”的再训练:在累积的问答训练缓存样本库中,选择原始问题、问题分类这两列数据,分别作为输入和输出,对已有的“问题分类器”进行再训练。对于问题分类为“待定分类”的样本,可以采用人工的方法对其进行标注后再参加训练。
对“问题相似度计算”的再训练:在计算原始问题与典型问题的相似度时,如果采用的是多种算法结合的“综合相似度算法”,则可在其中追加一种相似度计算方法,该方法通过机器学习训练样本,采用参数回归的方法推算“原始问题”与“典型问题”的相似度(下文简称“统计相似度回归算法”)。具体方法为:
在累积的问答训练缓存样本库中,选择原始问题、匹配的典型问题这两列数据,对于相同文本内容的“原始问题”-“匹配的典型问题”的配对组合,统计其出现的频度(下文简称“配对频度”)。计算方法为:假设在问答训练缓存样本库中,同一个“原始问题”总共有L个“匹配的典型问题”配对结果,且这L个“原始问题”-“匹配的典型问题”组合出现的次数分别为N1,N2,…,NL。那么对于“原始问题”-第k个“匹配的典型问题”组合,其配对频度为:
以原始问题、匹配的典型问题作为输入特征,以配对频度为输出结果。对“统计相似度回归算法”的参数进行重新训练。经过训练后的“统计相似度回归算法”可以作为“综合相似度算法”中的其中一种算法,参与到问题相似度的计算中。
对于问答数据库中推荐度的更新,在累积的问答训练缓存样本库中,选择匹配的典型问题、实际回复内容这两列数据。针对每一个“匹配的典型问题”,统计各个“实际回复内容”的回复比例作为“客服总体推荐度”对问答数据库110进行更新。具体方法为:假设在累积的问答训练缓存样本库中,针对某个“匹配的典型问题”,总共有P个“实际回复内容”与之对应,且这P个“匹配的典型问题”-“实际回复内容”组合出现的次数分别为M1,M2,…,MP。那么对于“原始问题”-第j个“匹配的典型问题”组合,其回复比例为:在问答数据库110中,更新相应的“典型问题”-“回复内容”所对应的“客服总体推荐度”这一栏的数值为其回复比例Rj
辅助信息数据库120的推荐度的更新方法与问答数据库中推荐度的更新类似,在此不再赘述。
本实施例中,能够提高备选回复答案的客服机器人及问答数据库不是仅在会话开始阶段有用,而是有机会用于客户的每一个问题。对于备选回复答案置信度高的问题,可以直接由客服机器人回答;而对于备选回复答案置信度不高的问题,仍可以按照置信度高低为人工客服列出,作为回复的参考模板供选择。大大减轻了人工客服的工作量。
另外,备选回复答案子面板和辅助信息子面板可以给人工客服提供多方面的回复素材,即使客户提了人工客服不太熟悉的业务的问题,仍然可以利用问答数据库、辅助信息数据库帮助人工客服有效地给出回答。通过最终人工客服的操作(例如生成的最终答案时所选择的备选回复答案、辅助信息)以及事后的客户满意度调查,系统可以对已有的数据库进行不断更新、学习,提升系统性能。
以上是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (16)

1.一种用于客户服务的方法,其特征在于,包括:
接收客户输入的原始问题;
从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,其中,判断所述原始问题所对应的问题分类,在所述问答数据库中对应的问题分类下查找与所述原始问题相似度最高的N个典型问题,N为大于1的整数,所述问答数据库中存储有典型问题及典型问题对应的备选回复答案,其中,所述问答数据库中的备选回复答案的存储格式包括:问题分类、典型问题、回复内容、第一推荐度,
获取每一典型问题对应的备选回复答案,并计算每一备选回复答案的置信度,按照置信度的从高到低对所有备选回复答案进行排序,得到最高置信度的备选回复答案,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值;
若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;
若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及预先建立的辅助信息数据库中的辅助信息,其中,所述辅助信息数据库中的辅助信息的储存格式包括:问题分类、典型问题、辅助信息类别、辅助信息内容、第二推荐度,所述辅助信息显示在辅助信息子面板上,所述辅助信息包括以下信息中的至少一种:所述原始问题中的关键词参考信息、客户数据、客户偏好、客户历史行为,辅助信息子面板由多个分类面板组成,多个分类面板包括可自学更新的分类面板,可自学更新的分类面板中的辅助信息能够根据人工客服的最终回复文本不断学习并更新第二推荐度;
根据最终回复文本,更新问答训练缓存样本库和辅助信息训练缓存样本库;
对所述最终回复文本进行分词;
根据分词结果确定所述最终回复文本所采纳的备选回复答案和辅助信息;
根据所述最终回复文本所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中,根据所述最终回复文本所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中;
每当问答训练缓存样本库和辅助信息训练缓存样本库中的新增样本数量累积到预定阈值,则利用增量的训练样本对问答数据库和辅助信息数据库进行第一推荐度和第二推荐度的更新;其中,
所述计算每一备选回复答案的置信度包括:
在所述备选回复答案为纯文本答案时,获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的第一推荐度Rj,通过公式Cij=Si*Rj计算得到每一备选回复答案的置信度Cij
在所述备选回复答案为模板类答案时,获取所述模板类答案中k个辅助信息类别中每一辅助信息类别的最高第二推荐度RAIk,其中k个最高第二推荐度中的最小值为min(RAIk),获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的第一推荐度Rj,通过公式Cij=Si*Rj*min(RAIk)计算得到每一备选回复答案的置信度Cij
2.根据权利要求1所述的用于客户服务的方法,其特征在于,所述方法还包括:
在人工客服回复所述原始问题后,获取人工客服回复的最终回复文本;或向所述客户回复所述置信度最高的备选回复答案作为最终回复文本,获取所述最终回复文本。
3.根据权利要求2所述的用于客户服务的方法,其特征在于,获取所述最终回复文本之后,所述方法还包括:
判断客户是否继续输入原始问题;
若客户继续输入原始问题,转向所述接收客户输入的原始问题的步骤;
若客户不再输入原始问题,获取客户对所述最终回复文本的满意度,在所述客户对所述最终回复文本的满意度大于第二阈值时,根据所述最终回复文本更新问答训练缓存样本库以及辅助信息训练缓存样本库。
4.根据权利要求3所述的用于客户服务的方法,其特征在于,所述根据所述最终回复文本所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中包括:
根据分词结果判断所述最终回复文本是否采纳所述问答数据库中的备选回复答案;
若所述最终回复文本采纳所述问答数据库中的备选回复答案,则根据所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中;
若所述最终回复文本未采纳所述问答数据库中的备选回复答案,则根据所述最终回复文本生成所采纳的备选回复答案,根据生成的所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中;
其中,所述问答训练缓存样本包括:所述最终回复文本对应的原始问题、问题分类、匹配的典型问题和实际回复内容。
5.根据权利要求4所述的用于客户服务的方法,其特征在于,将问答训练缓存样本存储至所述问答训练缓存样本库中之后,所述方法还包括:
判断所述问答训练缓存样本库是否满足预设的更新条件,在所述问答训练缓存样本库满足预设的更新条件时,利用所述问答训练缓存样本库中的问答训练缓存样本对所述问答数据库进行更新。
6.根据权利要求5所述的用于客户服务的方法,其特征在于,所述利用所述问答训练缓存样本库中的问答训练缓存样本对所述问答数据库进行更新包括以下至少一种:
对所述问答数据库中的备选回复答案的推荐度进行更新;
对所述问答数据库的原问题分类器进行再训练;
对所述问答数据库的原问题相似度算法进行再训练。
7.根据权利要求6所述的用于客户服务的方法,其特征在于,所述对所述问答数据库的原问题分类器进行再训练包括:
将所述问答训练缓存样本库中存储的每一问答训练缓存样本的原始问题和问题分类分别作为输入和输出对所述问答数据库的原问题分类器进行再训练。
8.根据权利要求6所述的用于客户服务的方法,其特征在于,所述对所述问答数据库的原问题相似度算法进行再训练包括:
在所述问答训练缓存样本库中,选择问答训练缓存样本的原始问题以及匹配的典型问题这两组数据,对于相同的“原始问题-匹配的典型问题”的配对组合,统计其出现的频度;
以“原始问题-匹配的典型问题”的配对作为输入,以其频度作为输出,对所述问答数据库的原问题相似度算法的参数进行再训练。
9.根据权利要求6所述的用于客户服务的方法,其特征在于,所述对所述问答数据库中的备选回复答案的推荐度进行更新包括:
在所述问答训练缓存样本库中,选择问答训练缓存样本的匹配的典型问题以及实际回复内容这两组数据;
对于每一个匹配的典型问题,统计其对应的各个实际回复内容的回复比例作为推荐度对所述问答数据库进行更新。
10.根据权利要求1所述的用于客户服务的方法,其特征在于,所述根据所述最终回复文本所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中包括:
根据分词结果判断所述最终回复文本是否采纳所述辅助信息数据库中的辅助信息;
若所述最终回复文本采纳所述辅助信息数据库中的辅助信息,则根据所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中;
若所述最终回复文本未采纳所述辅助信息数据库中的辅助信息,则根据所述最终回复文本生成所采纳的辅助信息,根据生成的所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中;
其中,所述辅助信息训练缓存样本包括:所述最终回复文本对应的原始问题、问题分类、匹配的典型问题,辅助信息类别和辅助信息内容。
11.根据权利要求10所述的用于客户服务的方法,其特征在于,将辅助信息训练样本存储至所述辅助信息训练缓存样本库之后,所述方法还包括:
判断所述辅助信息训练缓存样本库是否满足预设的更新条件,在所述辅助信息训练缓存样本库满足预设的更新条件时,利用所述辅助信息训练缓存样本库中的辅助信息训练样本对所述辅助信息数据库进行更新。
12.根据权利要求11所述的用于客户服务的方法,其特征在于,所述利用所述辅助信息训练缓存样本库中的辅助信息训练样本对所述辅助信息数据库进行更新包括:
在所述辅助信息训练缓存样本库中,选择辅助信息训练样本的匹配的典型问题以及辅助信息内容这两组数据;
对于每一个匹配的典型问题,统计其对应的各个辅助信息内容的回复比例作为推荐度对所述辅助信息数据库进行更新。
13.根据权利要求5或11所述的用于客户服务的方法,其特征在于,
所述更新条件为所保存的样本数量大于第三阈值或达到预设的更新时间点。
14.一种用于客户服务的装置,其特征在于,包括:
接收模块,用于接收客户输入的原始问题;
判断模块,用于从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,其中,判断所述原始问题所对应的问题分类,在所述问答数据库中对应的问题分类下查找与所述原始问题相似度最高的N个典型问题,N为大于1的整数,所述问答数据库中存储有典型问题及典型问题对应的备选回复答案,其中,所述问答数据库中的备选回复答案的存储格式包括:问题分类、典型问题、回复内容、第一推荐度,
获取每一典型问题对应的备选回复答案,并计算每一备选回复答案的置信度,按照置信度的从高到低对所有备选回复答案进行排序,得到最高置信度的备选回复答案,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值;
处理模块,用于若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及预先建立的辅助信息数据库中的辅助信息,其中,所述辅助信息数据库中的辅助信息的储存格式包括:问题分类、典型问题、辅助信息类别、辅助信息内容、第二推荐度,所述辅助信息显示在辅助信息子面板上,所述辅助信息包括以下信息中的至少一种:所述原始问题中的关键词参考信息、客户数据、客户偏好、客户历史行为,辅助信息子面板由多个分类面板组成,多个分类面板包括可自学更新的分类面板,可自学更新的分类面板中的辅助信息能够根据人工客服的最终回复文本不断学习并更新第二推荐度;根据最终回复文本,更新问答训练缓存样本库和辅助信息训练缓存样本库,其中,对所述最终回复文本进行分词;根据分词结果确定所述最终回复文本所采纳的备选回复答案和辅助信息;根据所述最终回复文本所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中,根据所述最终回复文本所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中;每当问答训练缓存样本库和辅助信息训练缓存样本库中的新增样本数量累积到预定阈值,则利用增量的训练样本对问答数据库和辅助信息数据库进行第一推荐度和第二推荐度的更新;其中,
所述计算每一备选回复答案的置信度包括:
在所述备选回复答案为纯文本答案时,获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的第一推荐度Rj,通过公式Cij=Si*Rj计算得到每一备选回复答案的置信度Cij
在所述备选回复答案为模板类答案时,获取所述模板类答案中k个辅助信息类别中每一辅助信息类别的最高第二推荐度RAIk,其中k个最高第二推荐度中的最小值为min(RAIk),获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的第一推荐度Rj,通过公式Cij=Si*Rj*min(RAIk)计算得到每一备选回复答案的置信度Cij
15.一种用于客户服务的电子设备,其特征在于,包括:
处理器;和
存储器,在所述存储器中存储有计算机程序指令,
其中,在所述计算机程序指令被所述处理器运行时,使得所述处理器执行以下步骤:
接收客户输入的原始问题;
从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,其中,判断所述原始问题所对应的问题分类,在所述问答数据库中对应的问题分类下查找与所述原始问题相似度最高的N个典型问题,N为大于1的整数,所述问答数据库中存储有典型问题及典型问题对应的备选回复答案,其中,所述问答数据库中的备选回复答案的存储格式包括:问题分类、典型问题、回复内容、第一推荐度,获取每一典型问题对应的备选回复答案,并计算每一备选回复答案的置信度,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值;
若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及预先建立的辅助信息数据库中的辅助信息,其中,所述辅助信息数据库中的辅助信息的储存格式包括:问题分类、典型问题、辅助信息类别、辅助信息内容、第二推荐度,所述辅助信息显示在辅助信息子面板上,所述辅助信息包括以下信息中的至少一种:所述原始问题中的关键词参考信息、客户数据、客户偏好、客户历史行为,辅助信息子面板由多个分类面板组成,多个分类面板包括可自学更新的分类面板,可自学更新的分类面板中的辅助信息能够根据人工客服的最终回复文本不断学习并更新第二推荐度;根据最终回复文本,更新问答训练缓存样本库和辅助信息训练缓存样本库,其中,对所述最终回复文本进行分词;根据分词结果确定所述最终回复文本所采纳的备选回复答案和辅助信息;根据所述最终回复文本所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中,根据所述最终回复文本所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中;每当问答训练缓存样本库和辅助信息训练缓存样本库中的新增样本数量累积到预定阈值,则利用增量的训练样本对问答数据库和辅助信息数据库进行第一推荐度和第二推荐度的更新;其中,
所述计算每一备选回复答案的置信度包括:
在所述备选回复答案为纯文本答案时,获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的第一推荐度Rj,通过公式Cij=Si*Rj计算得到每一备选回复答案的置信度Cij
在所述备选回复答案为模板类答案时,获取所述模板类答案中k个辅助信息类别中每一辅助信息类别的最高第二推荐度RAIk,其中k个最高第二推荐度中的最小值为min(RAIk),获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的第一推荐度Rj,通过公式Cij=Si*Rj*min(RAIk)计算得到每一备选回复答案的置信度Cij
16.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器运行时,使得所述处理器执行以下步骤:
接收客户输入的原始问题;
从预先建立的问答数据库中获取多个对应所述原始问题的备选回复答案及相应的置信度,其中,判断所述原始问题所对应的问题分类,在所述问答数据库中对应的问题分类下查找与所述原始问题相似度最高的N个典型问题,N为大于1的整数,所述问答数据库中存储有典型问题及典型问题对应的备选回复答案,其中,所述问答数据库中的备选回复答案的存储格式包括:问题分类、典型问题、回复内容、第一推荐度,获取每一典型问题对应的备选回复答案,并计算每一备选回复答案的置信度,按照置信度的从高到低对所有备选回复答案进行排序,得到最高置信度的备选回复答案,判断其中置信度最高的备选回复答案的置信度是否不小于第一阈值;
若置信度最高的备选回复答案的置信度不小于第一阈值,则向所述客户回复所述置信度最高的备选回复答案作为最终回复文本;若置信度最高的备选回复答案的置信度小于第一阈值,则向聊天服务器发送要求人工客服接入的服务请求,并向所述人工客服展现所述多个对应所述原始问题的备选回复答案以及预先建立的辅助信息数据库中的辅助信息,其中,所述辅助信息数据库中的辅助信息的储存格式包括:问题分类、典型问题、辅助信息类别、辅助信息内容、第二推荐度,所述辅助信息显示在辅助信息子面板上,所述辅助信息包括以下信息中的至少一种:所述原始问题中的关键词参考信息、客户数据、客户偏好、客户历史行为,辅助信息子面板由多个分类面板组成,多个分类面板包括可自学更新的分类面板,可自学更新的分类面板中的辅助信息能够根据人工客服的最终回复文本不断学习并更新推荐度;根据最终回复文本,更新问答训练缓存样本库和辅助信息训练缓存样本库,其中,对所述最终回复文本进行分词;根据分词结果确定所述最终回复文本所采纳的备选回复答案和辅助信息;根据所述最终回复文本所采纳的备选回复答案生成问答训练缓存样本并存储至所述问答训练缓存样本库中,根据所述最终回复文本所采纳的辅助信息生成辅助信息训练样本并存储至所述辅助信息训练缓存样本库中;每当问答训练缓存样本库和辅助信息训练缓存样本库中的新增样本数量累积到预定阈值,则利用增量的训练样本对问答数据库和辅助信息数据库进行第一推荐度和第二推荐度的更新;其中,
所述计算每一备选回复答案的置信度包括:
在所述备选回复答案为纯文本答案时,获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的第一推荐度Rj,通过公式Cij=Si*Rj计算得到每一备选回复答案的置信度Cij
在所述备选回复答案为模板类答案时,获取所述模板类答案中k个辅助信息类别中每一辅助信息类别的最高第二推荐度RAIk,其中k个最高第二推荐度中的最小值为min(RAIk),获取每一备选回复答案对应的典型问题与所述原始问题的相似度Si以及每一备选回复答案的第一推荐度Rj,通过公式Cij=Si*Rj*min(RAIk)计算得到每一备选回复答案的置信度Cij
CN201711339712.6A 2017-12-14 2017-12-14 用于客户服务的方法、装置、电子设备、计算机可读存储介质 Active CN110069607B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201711339712.6A CN110069607B (zh) 2017-12-14 2017-12-14 用于客户服务的方法、装置、电子设备、计算机可读存储介质
PCT/CN2018/116820 WO2019114512A1 (zh) 2017-12-14 2018-11-22 用于客户服务的方法、装置、电子设备、计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711339712.6A CN110069607B (zh) 2017-12-14 2017-12-14 用于客户服务的方法、装置、电子设备、计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110069607A CN110069607A (zh) 2019-07-30
CN110069607B true CN110069607B (zh) 2024-03-05

Family

ID=66818924

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711339712.6A Active CN110069607B (zh) 2017-12-14 2017-12-14 用于客户服务的方法、装置、电子设备、计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN110069607B (zh)
WO (1) WO2019114512A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570215A (zh) * 2019-09-06 2019-12-13 北京金融资产交易所有限公司 智能客服系统
CN110795546A (zh) * 2019-09-12 2020-02-14 易谷网络科技股份有限公司 一种基于智能客服的收敛方法、装置及电子设备
CN113127613B (zh) * 2020-01-10 2024-01-09 北京搜狗科技发展有限公司 聊天信息处理方法及装置
CN111666394A (zh) * 2020-04-30 2020-09-15 北京捷通华声科技股份有限公司 一种文本处理方法及装置
CN112040075A (zh) * 2020-08-28 2020-12-04 厦门羽星科技股份有限公司 基于语音识别的坐席语音辅助系统
CN112527972A (zh) * 2020-12-25 2021-03-19 东云睿连(武汉)计算技术有限公司 基于深度学习的智能客服聊天机器人实现方法和系统
CN112948403B (zh) * 2021-01-25 2023-08-08 北京房江湖科技有限公司 一种用于自动更新房源数据的方法和装置
CN113420137A (zh) * 2021-06-29 2021-09-21 山东新一代信息产业技术研究院有限公司 基于端到端框架的智能问答系统实现方法、设备及介质
CN113282737B (zh) * 2021-07-21 2021-11-12 中信建投证券股份有限公司 人机协作的智能客服对话方法及装置
CN113626569B (zh) * 2021-08-02 2024-05-21 浪潮软件股份有限公司 一种基于政务事项与历史数据的便民办事方法及系统
CN113672719A (zh) * 2021-09-08 2021-11-19 中国平安人寿保险股份有限公司 对话辅助信息推送方法、装置、计算机设备及存储介质
CN113886737B (zh) * 2021-09-27 2024-10-25 北京达佳互联信息技术有限公司 信息展示方法、装置、电子设备及存储介质
CN114265921A (zh) * 2021-12-29 2022-04-01 广州华多网络科技有限公司 问答知识库构建方法及其装置、设备、介质、产品
CN114925192A (zh) * 2022-07-21 2022-08-19 北京聆心智能科技有限公司 一种人机协同对话方法、装置、设备及存储介质
CN115577088B (zh) * 2022-11-18 2023-11-03 易点生活电子商务有限公司 一种对聊天信息进行分配的技术开发咨询系统
CN117041618B (zh) * 2023-10-10 2024-02-06 北京装库创意科技有限公司 一种用于电商的智能语音客服方法和系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102043793A (zh) * 2009-10-09 2011-05-04 卢健华 一种面向知识服务的推荐方法
CN104809197A (zh) * 2015-04-24 2015-07-29 同程网络科技股份有限公司 基于智能机器人的在线问答方法
CN105373940A (zh) * 2015-11-12 2016-03-02 江南大学 智能商场信息系统
CN105389358A (zh) * 2015-11-04 2016-03-09 浙江工商大学 基于关联规则的Web服务推荐方法
CN105512349A (zh) * 2016-02-23 2016-04-20 首都师范大学 一种用于学习者自适应学习的问答方法及装置
CN105591882A (zh) * 2015-12-10 2016-05-18 北京中科汇联科技股份有限公司 一种智能机器人与人混合客服的方法及系统
CN105808694A (zh) * 2016-03-04 2016-07-27 上海携程商务有限公司 在线客服应答系统及方法
CN106409283A (zh) * 2016-08-31 2017-02-15 上海交通大学 基于音频的人机混合交互系统及方法
CN106683678A (zh) * 2016-11-30 2017-05-17 厦门快商通科技股份有限公司 一种人工电话客服辅助系统及方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120084112A1 (en) * 2010-09-24 2012-04-05 International Business Machines Corporation Providing community for customer questions
US20170337261A1 (en) * 2014-04-06 2017-11-23 James Qingdong Wang Decision Making and Planning/Prediction System for Human Intention Resolution
US10572516B2 (en) * 2015-12-15 2020-02-25 [24]7.ai, Inc. Method and apparatus for managing natural language queries of customers
CN106874441B (zh) * 2017-02-07 2024-03-05 腾讯科技(上海)有限公司 智能问答方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102043793A (zh) * 2009-10-09 2011-05-04 卢健华 一种面向知识服务的推荐方法
CN104809197A (zh) * 2015-04-24 2015-07-29 同程网络科技股份有限公司 基于智能机器人的在线问答方法
CN105389358A (zh) * 2015-11-04 2016-03-09 浙江工商大学 基于关联规则的Web服务推荐方法
CN105373940A (zh) * 2015-11-12 2016-03-02 江南大学 智能商场信息系统
CN105591882A (zh) * 2015-12-10 2016-05-18 北京中科汇联科技股份有限公司 一种智能机器人与人混合客服的方法及系统
CN105512349A (zh) * 2016-02-23 2016-04-20 首都师范大学 一种用于学习者自适应学习的问答方法及装置
CN105808694A (zh) * 2016-03-04 2016-07-27 上海携程商务有限公司 在线客服应答系统及方法
CN106409283A (zh) * 2016-08-31 2017-02-15 上海交通大学 基于音频的人机混合交互系统及方法
CN106683678A (zh) * 2016-11-30 2017-05-17 厦门快商通科技股份有限公司 一种人工电话客服辅助系统及方法

Also Published As

Publication number Publication date
CN110069607A (zh) 2019-07-30
WO2019114512A1 (zh) 2019-06-20

Similar Documents

Publication Publication Date Title
CN110069607B (zh) 用于客户服务的方法、装置、电子设备、计算机可读存储介质
CN109299245B (zh) 知识点召回的方法和装置
WO2022111244A1 (zh) 数据处理方法、装置、电子设备及存储介质
CN112163424B (zh) 数据的标注方法、装置、设备和介质
JP7433601B2 (ja) エキスパートレポートエディタ
CN113627797B (zh) 入职员工画像生成方法、装置、计算机设备及存储介质
US20180101521A1 (en) Avoiding sentiment model overfitting in a machine language model
WO2020123689A1 (en) Suggesting text in an electronic document
CN111507680A (zh) 在线面试方法、系统、设备及存储介质
CN111881172A (zh) 一种基于答题统计特征的题目推荐系统
CN112417848A (zh) 语料生成方法、装置及计算机设备
CN110674276A (zh) 机器人自学习方法、机器人终端、装置及可读存储介质
CN117725191B (zh) 大语言模型的引导信息生成方法、装置及电子设备
CN116077942A (zh) 一种交互式内容推荐的实现方法
CN114969528A (zh) 基于能力评测的用户画像和学习路径推荐方法、装置及设备
CN117911039A (zh) 售后服务系统的控制方法、设备及存储介质
CN114626386A (zh) 问答系统中的问题推荐方法、装置、电子设备及存储介质
CN110717008A (zh) 基于语意识别的搜索结果排序方法及相关装置
CN110110143A (zh) 一种视频分类方法及装置
CN117668199A (zh) 一种智能客服问答预测及推荐对话生成方法及装置
US11568314B2 (en) Data-driven online score caching for machine learning
US20240193213A1 (en) Machine-learning based document recommendation for online real-time communication system
WO2020220283A1 (en) Document auto-completion
CN112687380B (zh) 一种医师评价系统的数据加载方法及质控平台
CN113722577B (zh) 反馈信息的处理方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant