CN116521843A - 面向用户的智能客服方法及其装置、设备、介质 - Google Patents

面向用户的智能客服方法及其装置、设备、介质 Download PDF

Info

Publication number
CN116521843A
CN116521843A CN202310474485.7A CN202310474485A CN116521843A CN 116521843 A CN116521843 A CN 116521843A CN 202310474485 A CN202310474485 A CN 202310474485A CN 116521843 A CN116521843 A CN 116521843A
Authority
CN
China
Prior art keywords
user
text
reply
question
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310474485.7A
Other languages
English (en)
Inventor
王耿鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huaduo Network Technology Co Ltd
Original Assignee
Guangzhou Huaduo Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huaduo Network Technology Co Ltd filed Critical Guangzhou Huaduo Network Technology Co Ltd
Priority to CN202310474485.7A priority Critical patent/CN116521843A/zh
Publication of CN116521843A publication Critical patent/CN116521843A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • G06Q30/015Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Artificial Intelligence (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及电商技术领域中一种面向用户的智能客服方法及其装置、设备、介质,所述方法包括:响应用户启用智能客服事件,获取用户的个人信息及历史行为数据,确定出相应的用户画像;响应用户提问事件,获取用户输入的提问文本,确定出预设的问答知识库中与所述提问文本相匹配的标准提问文本,获取所述标准提问文本的标准回复文本;套用预设的指令模板,根据所述用户画像及所述标准回复文本生成相应的约束指令,所述约束指令指示根据所述用户画像对所述标准回复文本进行契合所述用户的人物风格的重新表述;将所述约束指令输入至预设的拟人问答模型,生成面向用户回复。本申请能够契合用户的人物风格进行回复,实现更加真实拟人化的客服服务。

Description

面向用户的智能客服方法及其装置、设备、介质
技术领域
本申请涉及电商技术领域,尤其涉及一种面向用户的智能客服方法及其相应的装置、计算机设备、计算机可读存储介质。
背景技术
随着人们的生活质量的不断提高,出现越来越多喜欢线上购物的消费者,这使得需要客服服务的用户量呈现出爆发式增长,为了及时提供客服服务,并且高效的回复用户,开发出了智能客服。
传统技术实现的智能客服,通常根据用户的提问文本检索问答知识库,确定出其中的标准提问文本及其对应的标准回复文本,以所述标准回复文本直接回复用户,然而标准回复文本只是针对用户提出的问题进行专业的解答,这种回复极其生硬和机械,无法打动和引起用户的共情,导致无法达到用户的满意度,非常容易让客户感到冷漠和不友好。
鉴于传统技术的不足,本申请人长期从事相关领域的研究,为解决电商领域业内难题,故另辟蹊径。
发明内容
本申请的首要目的在于解决上述问题至少之一而提供一种面向用户的智能客服方法及其相应的装置、计算机设备、计算机可读存储介质。
为满足本申请的各个目的,本申请采用如下技术方案:
适应本申请的目的之一而提供的一种面向用户的智能客服方法,包括如下步骤:
响应用户启用智能客服事件,获取用户的个人信息及历史行为数据,确定出相应的用户画像;
响应用户提问事件,获取用户输入的提问文本,确定出预设的问答知识库中与所述提问文本相匹配的标准提问文本,获取所述标准提问文本的标准回复文本;
套用预设的指令模板,根据所述用户画像及所述标准回复文本生成相应的约束指令,所述约束指令指示根据所述用户画像对所述标准回复文本进行契合所述用户的人物风格的重新表述;
将所述约束指令输入至预设的拟人问答模型,生成面向用户回复。
进一步的实施例中,确定出预设的问答知识库中与所述提问文本相匹配的标准提问文本,包括如下步骤:
采用预设的文本相似度模型确定出所述提问文本与预设的问答知识库中的每个标准提问文本之间对应的语义相似度;
筛选出所述语义相似度超过预设阈值的标准提问文本。
进一步的实施例中,获取用户的个人信息及历史行为数据,确定出相应的用户画像之前,包括如下步骤:
获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本而产生的监督回复文本;
确定出预设的问答知识库中与所述历史提问文本相匹配的标准提问文本,获取所述标准提问文本的标准回复文本;
套用预设的指令模板,根据所述用户画像及所述标准回复文本生成相应的约束指令作为训练样本,以所述监督回复文本作为监督标签;
将所述训练样本输入至拟人回复模型,提取出训练样本的深层语义信息,生成预测的面向用户回复;
采用所述训练样本的监督标签,确定所述预测的面向用户回复的损失值,在所述损失值未达到预设阈值时,对拟人回复模型实施权重更新,并继续调用其他训练样本实施迭代训练直至拟人回复模型收敛。
进一步的实施例中,确定出相应的用户画像,包括如下步骤:
根据用户的个人信息及历史行为数据,确定出基本属性标签、偏好属性标签;
根据所述用户的基本属性标签及偏好属性标签,构造出相应的用户画像。
进一步的实施例中,获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本而产生的监督回复文本之前,包括如下步骤:
获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本的历史回复文本;
确定所述用户画像对应的所述用户的人物风格;
将所述历史回复文本输入至预设的风格分类模型,确定出相应的回复风格;
当所述回复风格与所述用户风格相匹配而实现契合时,将所述历史回复文本作为监督回复文本。
进一步的实施例中,获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本的历史回复文本之前,包括如下步骤:
获取历史提问文本及其对应的历史回复文本,构造出文本数据对;
将所述文本数据对输入至预设的回复匹配模型,确定出相应的回复质量;
去除所述回复质量低于预设阈值的历史提问文本及其对应的历史回复文本。
进一步的实施例中,响应用户提问事件,获取用户输入的提问文本之后,包括如下步骤:
响应匹配失败事件,采用预设的意图分类模型确定出所述提问文本的意图是否明确;
当所述意图明确时,将所述提问文本发送至人工客服接口;
当所述意图不明确时,构造出重新输入通知推送给所述用户。
另一方面,适应本申请的目的之一而提供的一种面向用户的智能客服装置,包括客服启用模块、用户提问模块、指令生成模块以及回复生成模块,其中,客服启用模块,用于响应用户启用智能客服事件,获取用户的个人信息及历史行为数据,确定出相应的用户画像;用户提问模块,用于响应用户提问事件,获取用户输入的提问文本,确定出预设的问答知识库中与所述提问文本相匹配的标准提问文本,获取所述标准提问文本的标准回复文本;指令生成模块,用于套用预设的指令模板,根据所述用户画像及所述标准回复文本生成相应的约束指令,所述约束指令指示根据所述用户画像对所述标准回复文本进行契合所述用户的人物风格的重新表述;回复生成模块,用于将所述约束指令输入至预设的拟人问答模型,生成面向用户回复。
进一步的实施例中,所述用户提问模块,包括:相似度确定子模块,用于采用预设的文本相似度模型确定出所述提问文本与预设的问答知识库中的每个标准提问文本之间对应的语义相似度;提问文本筛选子模块,用于筛选出所述语义相似度超过预设阈值的标准提问文本。
进一步的实施例中,所述用户提问模块之前,包括:第一数据获取子模块,用于获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本而产生的监督回复文本;确定出预设的问答知识库中与所述历史提问文本相匹配的标准提问文本,获取所述标准提问文本的标准回复文本;样本监督构建子模块,用于套用预设的指令模板,根据所述用户画像及所述标准回复文本生成相应的约束指令作为训练样本,以所述监督回复文本作为监督标签;回复生成子模块,用于将所述训练样本输入至拟人回复模型,提取出训练样本的深层语义信息,生成预测的面向用户回复;迭代训练子模块,用于采用所述训练样本的监督标签,确定所述预测的面向用户回复的损失值,在所述损失值未达到预设阈值时,对拟人回复模型实施权重更新,并继续调用其他训练样本实施迭代训练直至拟人回复模型收敛。
进一步的实施例中,所述客服启用模块,包括:标签确定子模块,用于根据用户的个人信息及历史行为数据,确定出基本属性标签、偏好属性标签;画像构造子模块,用于根据所述用户的基本属性标签及偏好属性标签,构造出相应的用户画像。
进一步的实施例中,所述数据获取子模块之前,包括:第二数据获取子模块,用于获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本的历史回复文本;人物风格确定子模块,用于确定所述用户画像对应的所述用户的人物风格;回复风格确定子模块,用于将所述历史回复文本输入至预设的风格分类模型,确定出相应的回复风格;监督确定子模块,用于当所述回复风格与所述用户风格相匹配而实现契合时,将所述历史回复文本作为监督回复文本。
进一步的实施例中,所述第二数据获取子模块之前,包括:第三数据获取子模块,用于获取历史提问文本及其对应的历史回复文本,构造出文本数据对;质量确定子模块,用于将所述文本数据对输入至预设的回复匹配模型,确定出相应的回复质量;文本去除子模块,用于去除所述回复质量低于预设阈值的历史提问文本及其对应的历史回复文本。
进一步的实施例中,所述用户提问模块之后,包括:意图确定子模块,用于响应匹配失败事件,采用预设的意图分类模型确定出所述提问文本的意图是否明确;意图明确子模块,用于当所述意图明确时,将所述提问文本发送至人工客服接口;意图不明确子模块,用于当所述意图不明确时,构造出重新输入通知推送给所述用户。
又一方面,适应本申请的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的面向用户的智能客服方法的步骤。
又一方面,适应本申请的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的面向用户的智能客服方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
本申请的技术方案存在多方面优势,包括但不限于如下各方面:
本申请通过响应用户启用智能客服事件,获取用户的个人信息及历史行为数据,确定出相应的用户画像,响应用户提问事件,获取用户输入的提问文本,确定出预设的问答知识库中与该提问文本相匹配的标准提问文本,获取标准提问文本的标准回复文本,套用预设的指令模板,根据用户画像及标准回复文本生成相应的约束指令,所述约束指令指示根据用户画像对标准回复文本进行契合用户的人物风格的重新表述,将约束指令输入至预设的拟人问答模型,生成面向用户回复。可见,通过用户的用户画像来了解用户,在维持标准回复文本的专业解答能力基础上,改善标准回复文本的表述至能够契合用户的人物风格再进行回复,使得智能客服更具真实感,让用户体验到类似与一个懂自己的真人沟通的感受,大大提升用户满意度,增加用户粘性。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请的面向用户的智能客服方法的典型实施例的流程示意图;
图2为本申请的实施例中筛选出问答知识库中与提问文本相似的标准提问文本的流程示意图;
图3为本申请的实施例中拟人回复模型的训练流程的流程示意图;
图4为本申请的实施例中构造用户画像的流程示意图;
图5为本申请的实施例中确定出监督回复文本的流程示意图;
图6为本申请的实施例中根据回复质量过滤历史提问文本及其对应的历史回复文本的流程示意图;
图7为本申请的实施例中当用户输入的提问文本匹配失败时,针对该提问文本是否明确相应处理的流程示意图;
图8为本申请的面向用户的智能客服装置的原理框图;
图9为本申请所采用的一种计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
需要指出的是,本申请所称的“服务器”这一概念,同理也可扩充到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。
本申请的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
本申请中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
本申请所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本申请的技术方案所调用即可。
本领域技术人员对此应当知晓:本申请的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本申请所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
本申请的一种面向用户的智能客服方法,可被编程为计算机程序产品,部署于客户端或服务器中运行而实现,例如,本申请的示例性应用场景中,可以在电商平台的服务器中部署实现,藉此可以通过访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品的进程进行人机交互而执行该方法。
请参阅图1,本申请的面向用户的智能客服方法,在其典型实施例中,包括如下步骤:
步骤S1100、响应用户启用智能客服事件,获取用户的个人信息及历史行为数据,确定出相应的用户画像;
电商平台的用户可通过展示线上店铺的页面或电商平台的其他页面上的客服入口例如触控“联系客服”底部导航栏控件,或者所述用户在进行浏览商品、添加商品到购物车、结算、付款等电商业务环节时,可通过当前页面的客服入口例如所述页面的右下角悬浮半透明的“联系客服”气泡控件,触发启用智能客服,生成相应的启用智能客服请求发送至服务器。
电商平台的服务器通过接收所述启用智能客服请求,响应用户启用智能客服事件,将所述用户接驳至相应的线上店铺或者电商平台官方的智能客服,提供自动化回复所述用户的提问的智能客服服务。
为了所述智能客服能够基于尽可能地了解用户,从而针对性面向该用户进行回复,一种实施例中,根据所述用户的唯一标识例如ID,访问用户数据库从中获取该用户的个人信息及历史行为数据,所述个人信息可以是用户在电商平台上注册时,输入的相关信息,包括性别、收货地址、教育水平、年龄/出生年月日、职业等任意多项,所述历史行为数据可以是用户过去在电商平台上的行为记录,包括关于商品的点赞、转发、收藏、添加购物车、购买、浏览等任意多项行为。基于所述个人信息及历史行为数据可确定出相应的用户画像,相应的具体实现,由后续部分实施例进一步揭示,本步骤暂且按下不表,示范性举例:年龄:28、教育水平:硕士、性别:女、职业:财务、所在地:中国广东省广州市海珠区、品牌偏好:Chanel、Gucci、购买周期:每月三次、消费水平:消费水平高、商品类型偏好:口红、包包、化妆品。
步骤S1200、响应用户提问事件,获取用户输入的提问文本,确定出预设的问答知识库中与所述提问文本相匹配的标准提问文本,获取所述标准提问文本的标准回复文本;
预先构造出所述问答知识库,涵盖广泛的商品领域和服务分类,例如商品询问、服务指导、订单追踪、售后维护等,包括电商平台的各个方面的标准提问文本及相应的标准回复文本,所述标准提问文本具有简明扼要、准确表明意图、不带感情的表达的特性,所述标准回复文本具有简明扼要、准确专业回复、不带感情的表达的特性,为便于理解,示范性举例:标准提问文本:这件商品有什么颜色可以选择?标准回复文本:此款商品共有红色、蓝色、绿色三种颜色可供选择。颜色可能因批次不同而略有差异,具体请以实物为准。
所述问答知识库可以是通过电商平台的运营人员直接构造出,适用于整个电商平台,也可以是通过由电商平台的运营人员提供基础问答模板,由运营平台上的线上店铺的商家用户根据所述基础问答摸版,结合自身所需构造出适用于自家的线上店铺。
通常电商平台提供问答窗口供所述用户与所述智能客服之间的交流,所述用户可通过向所述问答窗口输入提问文本,触发生成提问请求携带所述提问文本发送至所述智能客服。
所述智能客服接收所述提问请求,响应用户提问事件,获取所述提问文本,当所述智能客服是线上店铺的智能客服,从针对该线上店铺预设的问答数据库中匹配出与所述提问文本语义相近的标准提问文本,为确保所述匹配的准确性,推荐的是实施例中,采用预先训练至收敛的文本语义模型确定出向量化表示所述提问文本的语义的文本特征向量,以及所述问答数据库中向量化表示每个标准提问文本对应的语义的文本特征向量,确定出所述提问文本与所述每个标准提问文本对应的文本特征向量之间的向量距离,以其精准地表示所述提问文本与所述每个标准提问文本之间语义相近程度,据此,便可筛选出与所述提问文本相匹配的标准提问文本,进而从所述问答数据库中获取回复该标准提问文本的标准回复文本。当所述智能客服是电商平台官方的智能客服,从电商平台的预设的问答数据库中匹配出与所述提问文本语义相近的标准提问文本,进而从所述问答数据库中获取回复该标准提问文本的标准回复文本。
所述文本语义模型预先经过训练至收敛,习得提取向其输入的文本的深层语义信息,输出向量化表示该文本的语义的文本特征向量的能力,具体选型可为TextTransfomer、RoBERTa、XLM-RoBERTa、MPNet、BERT等,本领域技术人员可按需择一实现。鉴于这些模型的训练过程为本领域所知晓,故对此不作详述。
步骤S1300、套用预设的指令模板,根据所述用户画像及所述标准回复文本生成相应的约束指令,所述约束指令指示根据所述用户画像对所述标准回复文本进行契合所述用户的人物风格的重新表述;
所述预设的指令模板包括指示语句、用户画像字段、标准回复文本字段,本领域技术人员可按此处揭示灵活变通实现。示范性举例,指令摸版为:根据所述用户画像对所述标准回复文本进行契合所述用户的人物风格的重新表述,用户画像是,标准回复文本是。
套用所述指令模板,将所述用户画像及所述标准回复文本填充至模板相应处,生成相应的约束指令,本领域技术人员应当知晓,所述约束指令是对人工智能系统进行一些限制或规范,以控制其行为或表现的指令。
步骤S1400、将所述约束指令输入至预设的拟人问答模型,生成面向用户回复。
所述拟人问答模型预先经过训练至收敛,习得理解约束指令的语义,根据相应的指示生成面向用户回复的能力。具体选型可为T5、GPT、BERT、基于Encoder-Decoder模型、Transformer模型等,本领域技术人员可按需择一实现,所述拟人问答模型的训练过程由后续部分实施例进一步揭示,本步骤暂且按下不表。
一种实施例中,所述拟人问答模型采用GPT3.5,将所述约束指令作为拟人问答模型的输入序列,对所述输入序列进行分词,获得相应的分词序列,然后,将分词序列输入至Transformer模型中的编码端,通过堆叠多层多头自注意力层和全连接层,对所述分词序列中的每个分词进行编码,具体而言,对每个所述分词,经过多头注意力层时对其进行多头注意力计算,从而对分词的不同维度进行自注意力加权,获得相应的加权的向量表示,再经过全连接层后,得到分词对应的编码向量表示,据此,实现提取出所述约束文本的深层语义信息,将分词序列中每个分词对应的编码表示输入至Transformer模型中的解码段,对所述每个分词对应的编码表示进行解码,生成相应的面向用户回复,具体而言,解码过程中根据已生成的单词和当前单词位置和分词对应的编码表示,计算每次生成单词的生成概率,选取生成概率最高的单词,将每次生成的单词依次拼接便可得到面向用户回复。
根据本申请的典型实施例可以知晓,本申请的技术方案存在多方面优势,包括但不限于如下各方面:
本申请通过响应用户启用智能客服事件,获取用户的个人信息及历史行为数据,确定出相应的用户画像,响应用户提问事件,获取用户输入的提问文本,确定出预设的问答知识库中与该提问文本相匹配的标准提问文本,获取标准提问文本的标准回复文本,套用预设的指令模板,根据用户画像及标准回复文本生成相应的约束指令,所述约束指令指示根据用户画像对标准回复文本进行契合用户的人物风格的重新表述,将约束指令输入至预设的拟人问答模型,生成面向用户回复。可见,通过用户的用户画像来了解用户,在维持标准回复文本的专业解答能力基础上,改善标准回复文本的表述至能够契合用户的人物风格再进行回复,使得智能客服更具真实感,让用户体验到类似与一个懂自己的真人沟通的感受,大大提升用户满意度,增加用户粘性。
请参阅图2,进一步的实施例中,步骤S1200、确定出预设的问答知识库中与所述提问文本相匹配的标准提问文本,包括如下步骤:
步骤S1210、采用预设的文本相似度模型确定出所述提问文本与预设的问答知识库中的每个标准提问文本之间对应的语义相似度;
所述文本相似度模型可以是双塔模型,其包括两个处理支路,每个处理支路均包含完全相同的网络结构,每个处理支路包括文本特征表示层,然后,将两个处理支路的输出分别接入线性层进行语义相似度的计算,所述文本特征提取层可采用Text Transfomer、RoBERTa、XLM-RoBERTa、MPNet、BERT等,本领域技术人员可按需择一实现。所述线性层可采用MLP(多层感知机)、FC(全连接层)等,本领域技术人员可按需择一实现。鉴于RoBERTa+CRF、Text Transfomer、RoBERTa、XLM-RoBERTa、MPNet、BERT的训练过程为本领域所知晓,故对此不作详述。
将所述提问文本与预设的问答知识库中的每个标准提问文本构成文本数据对,将所述文本数据对作为所述文本相似度模型的输入,由一个处理支路提取文本数据对中提问文本的深层语义特征,获得相应向量化的特征表示,同时,另一处理支路提取文本数据对中标准提问文本的深层语义特征,获得相应向量化的特征表示,然后,由线性层计算提问文本与标准提问文本对应的特征表示之间的向量距离作为语义相似度,所述向量距离计算,可采用任意可用的向量距离算法实现,包括但不限于如下任意一种:余弦相似度算法、向量点积算法、曼哈顿距离、欧氏距离算法、皮尔逊相关系数等。
步骤S1220、筛选出所述语义相似度超过预设阈值的标准提问文本。
筛选出所述问答知识库中所述语义相似度超过预设阈值的标准提问文本,所述标准提问文本便是与所述提问文本语义相关,所述预设阈值可由本领域技术人员按需设定。
本实施例中,一方面,通过采用文本相似度模型确定出问答知识库中与提问文本语义相关的标准提问文本,执行高效,能够确保语义相似度的准确性,以其准确表示两个文本之间的语义相近程度,另一方面,通过匹配出与所述提问文本语义相近的标准提问文本,使得能够规范化提问文本的表述,从而根据该标准提问文本确定出对应的标准回复文本,为后续回复的专业性和准确性奠定坚实基础。
请参阅图3,进一步的实施例中,步骤S1100、获取用户的个人信息及历史行为数据,确定出相应的用户画像之前,包括如下步骤:
步骤S1010、获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本而产生的监督回复文本;
所述历史提问文本是用户过去向人工客服提问输入的,所述历史回复文本是人工客服过去回复用户提问输入的,可将在人工客服向用户提供客服服务时,将相应的提问文本及回复文本进行存储以备调用。
往往在销售商品的策略上,会对销售的商品定位相应的消费者群体的用户画像,使得电商平台的人工客服能够根据所述用户画像对提问的用户进行契合该用户的人物风格的回复。据此,将具备表述契合用户的人物风格的、专业的、准确的、完整解答提问中所有疑问的历史回复文本作为所述监督回复文本,所述历史回复文本是人工客服输入的同于回复用户输入的历史提问文本,具体实现可通过电商平台的运营人员按照此处揭示筛选出所述历史回复文本,也可通过人工智能算法进行筛选所述历史回复文本,具体实现由后续部分实施例进一步揭示,本步骤暂且按下不表。
获取所述用户的个人信息及历史行为数据,按照步骤S1110-S1120确定出相应的用户画像。
步骤S1020、确定出预设的问答知识库中与所述历史提问文本相匹配的标准提问文本,获取所述标准提问文本的标准回复文本;
将所述历史提问文本与预设的问答知识库中的每个标准提问文本构成文本数据对,将所述文本数据对作为所述文本相似度模型的输入,由一个处理支路提取文本数据对中历史提问文本的深层语义特征,获得相应向量化的特征表示,同时,另一处理支路提取文本数据对中标准提问文本的深层语义特征,获得相应向量化的特征表示,然后,由线性层计算历史提问文本与标准提问文本对应的特征表示之间的向量距离作为语义相似度,据此,筛选出问答知识库中所述语义相似度超过预设阈值的标准提问文本,继而获取该标准提问文本的标准回复文本。所述预设阈值可由本领域技术人员按需设定。
步骤S1030、套用预设的指令模板,根据所述用户画像及所述标准回复文本生成相应的约束指令作为训练样本,以所述监督回复文本作为监督标签;
所述预设的指令模板包括指示语句、用户画像字段、标准回复文本字段,本领域技术人员可按此处揭示灵活变通实现。示范性举例,指令摸版为:根据所述用户画像对所述标准回复文本进行契合所述用户的人物风格的重新表述,用户画像是,标准回复文本是。
套用所述指令模板,将所述用户画像及所述标准回复文本填充至模板相应处,生成相应的约束指令作为所述训练样本,本领域技术人员应当知晓,所述约束指令是对人工智能系统进行一些限制或规范,以控制其行为或表现的指令。
步骤S1040、将所述训练样本输入至拟人回复模型,提取出训练样本的深层语义信息,生成预测的面向用户回复;
一种实施例中,所述拟人问答模型采用GPT3.5,将所述约束指令作为拟人问答模型的输入序列,对所述输入序列进行分词,获得相应的分词序列,然后,将分词序列输入至Transformer模型中的编码端,通过堆叠多层多头自注意力层和全连接层,对所述分词序列中的每个分词进行编码,具体而言,对每个所述分词,经过多头注意力层时对其进行多头注意力计算,从而对分词的不同维度进行自注意力加权,获得相应的加权的向量表示,再经过全连接层后,得到分词对应的编码向量表示,据此,实现提取出所述约束文本的深层语义信息,将分词序列中每个分词对应的编码表示输入至Transformer模型中的解码段,对所述每个分词对应的编码表示进行解码,生成预测的面向用户回复,具体而言,解码过程中根据已生成的单词和当前单词位置和分词对应的编码表示,计算每次生成单词的生成概率,选取生成概率最高的单词,将每次生成的单词依次拼接便可得到面向用户回复。
步骤S1050、采用所述训练样本的监督标签,确定所述预测的面向用户回复的损失值,在所述损失值未达到预设阈值时,对拟人回复模型实施权重更新,并继续调用其他训练样本实施迭代训练直至拟人回复模型收敛。
调用预设的交叉熵损失函数,此处可由本领域技术人员根据先验知识或实验经验灵活变通设置,基于根据所述训练样本的监督标签计算所述预测的面向用户回复的交叉熵损失值;当交叉熵损失值达到预设阈值时,表明拟人回复模型已被训练至收敛状态,从而可以终止模型训练;交叉熵损失值未达到预设阈值时,表明模型未收敛,于是根据交叉熵损失值对模型实施梯度更新,通常通过反向传播修正模型各个环节的权重参数以使模型进一步逼近收敛,然后,继续调用其他训练样本对该模型实施迭代训练,直至该模型被训练至收敛状态为止,所述预设阈值可由本领域技术人员按需设定。
本实施例中,通过监督训练拟人回复模型直至收敛,使得拟人回复模型习得理解约束指令的语义,根据相应的指示生成面向用户回复的能力,能够确保根据用户画像对标准回复文本进行契合相应用户的人物风格的重新表述,生成面向用户回复。
请参阅图4,进一步的实施例中,步骤S1100、确定出相应的用户画像,包括如下步骤:
步骤S1110、根据用户的个人信息及历史行为数据,确定出基本属性标签、偏好属性标签;
一种实施例中,根据所述用户的唯一标识例如ID,访问用户数据库从中获取该用户的个人信息及历史行为数据,所述个人信息可以是用户在电商平台上注册时,输入的相关信息,包括性别、收货地址、教育水平、年龄/出生年月日、职业等任意多项,所述历史行为数据可以是用户过去在电商平台上的行为记录,包括关于商品的点赞、转发、收藏、添加购物车、购买、浏览等任意多项行为。
根据所述个人信息中的出生年月日计算出年龄,根据所述个人信息的收货地址确定出行政区划部分文本作为所在地,例如中国广东省广州市海珠区,将所述年龄、所在地及所述个人信息中的性别、职业、教育水平作为基本属性标签。
根据所述历史行为数据中点赞、转发、收藏、添加购物车、购买、浏览中任意多项均涉及的商品的品牌及商品类型分别作为品牌偏好、商品类型偏好,例如Chanel、Gucci,口红、包包、化妆品,根据所述历史行为数据中的购买的商品时间,确定出购买周期,例如每月三次,根据所述历史行为数据中的购买的商品数据,确定出支付总额及购买商品数量,根据所述支付总额及所述购买商品数量确定出消费水平,一种实施例中,预设支付总额和购买商品数量对应的阶梯式增长阈值,以及映射关联的每个阶层对应的消费水平,当支付总额和购买商品数量达到对应阶层的阈值确定相应的消费水平,例如消费水平:消费水平低[第一阶层:一万元至十万元、100-500件商品]、消费水平中[第二阶层:十万元至五十万元、500-5000件]、消费水平高[第三阶层:五十万元以上、5000以上],本领域技术人员可按此揭示灵活变通设定所述支付总额和购买商品数量对应的阶梯式增长阈值。将所述品牌偏好、商品类型偏好、消费水平、购买周期作为偏好属性标签。
步骤S1120、根据所述用户的基本属性标签及偏好属性标签,构造出相应的用户画像。
将所述用户的基本属性标签及偏好属性标签关联相对应的标识即年龄、教育水平、性别、职业、所在地、品牌偏好、购买周期、消费水平、商品类型偏好,构造出相应的用户画像。
本实施例中,通过用户的个人信息及历史行为数据,确定出基本属性标签、偏好属性标签,据此构造出用户画像,能够刻画出丰富的用户特征,以便后续拟人回复模型能够根据该用户画像充分地了解用户。
请参阅图5,进一步的实施例中,步骤S1010、获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本而产生的监督回复文本之前,包括如下步骤:
步骤S1000、获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本的历史回复文本;
所述历史提问文本是用户过去向人工客服提问输入的,所述历史回复文本是人工客服过去回复用户提问输入的,可将在人工客服向用户提供客服服务时,将相应的提问文本及回复文本进行存储以备调用。
步骤S1001、确定所述用户画像对应的所述用户的人物风格;
可预先构造出汇集多种不同人物风格的人物风格集,匹配出人物风格集中与所述用户的用户画像相匹配的人物风格,所述匹配可以是通过人为实现,也可以是通过预先训练至收敛的适用于多分类任务的深度学习模型实现,以所述用户画像作为模型输入,映射至人物风格集中相应匹配的人物风格。
所述人物风格集中的人物风格可由本领域技术人员按业务所需灵活变通设置,示范性举例,所述人物风格集中的人物风格包括严肃认真、青春活泼、时尚个性、品牌主义、品质主义、实用主义、追求享受、简单直接。
步骤S1002、将所述历史回复文本输入至预设的风格分类模型,确定出相应的回复风格;
所述风格分类模型预先经过训练至收敛,习得确定出输入的历史回复文本的回复风格的能力,模型的结构可为文本特征提取层后接分类器,所述文本特征提取层适用于提取文本的深层语义任务,可采用Text Transfomer、RoBERTa、XLM-RoBERTa、MPNet、BERT等,本领域技术人员可按需择一实现。所述分类器使用于多分类任务,可采用LightGBM、XGBoost、CatBoost、AdaBoost、GBDT、Random Forest等,本领域技术人员可按需择一实现。
一种实施例中,将历史回复文本作为训练样本,人工标注该历史回复文本对应的回复风格作为训练样本的监督标签,将所述训练样本输入至所述风格分类模型,由其中的文本特征提取层提取出训练样本的深层语义信息,获得相应向量化的文本语义特征表示,将所述文本语义特征表示输入分类器,映射至预设的多个类别,每个类别对应表征一种回复风格,获得每个类别对应的分类概率,确定出分类概率超过预设阈值的一个或多个类别,输出相对应的预测的回复风格,调用预设的交叉熵损失函数,基于根据所述训练样本的监督标签计算所述预测的回复风格的交叉熵损失值;当交叉熵损失值达到预设阈值时,表明风格分类模型已被训练至收敛状态,从而可以终止模型训练;交叉熵损失值未达到预设阈值时,表明模型未收敛,于是根据交叉熵损失值对模型实施梯度更新,通常通过反向传播修正模型各个环节的权重参数以使模型进一步逼近收敛,然后,继续调用其他训练样本对该模型实施迭代训练,直至该模型被训练至收敛状态为止。
所述预设阈值和所述交叉熵损失函数可由本领域技术人员按需设定。所述多个类别分别表征的回复风格可由本领域技术人员按业务所需灵活变通设置,示范性举例,所述多个类别分别表征的回复风格包括幽默风趣、轻松随和、充实详尽、言简意赅、温馨细腻、热情真挚、坦率直白、耐心体贴、有趣可爱、务实稳重、优雅文艺。
步骤S1003、当所述回复风格与所述用户风格相匹配而实现契合时,将所述历史回复文本作为监督回复文本。
可以预先人为对所述多个类别分别表征的回复风格与所述人物风格集中的人物风格,根据回复风格是否契合人物风格进行匹配,建立相匹配的用户风格与回复风格之间的映射关系,可以是一对多的映射关系,也可以是一对一的关联关系,汇总构造出映射关系表。
检索所述映射关系表,便可确定所述历史回复文本的回复风格与所述用户画像对应的所述用户的人物风格是否存在映射关系,当存在时,确定所述回复风格与所述用户风格相匹配,该回复风格能够契合该用户风格,据此,将所述历史回复文本作为监督回复文本。
本实施例中,揭示了确定出监督回复文本的过程,能够确保监督回复文本的表述能够契合用户的人物风格,据此,后续将监督回复文本作为监督标签,监督拟人问答模型生成的面向用户回复的表述能够契合用户的人物风格。
请参阅图6,进一步的实施例中,步骤S1000、获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本的历史回复文本之前,包括如下步骤:
步骤S2000、获取历史提问文本及其对应的历史回复文本,构造出文本数据对;
所述历史提问文本是用户过去向人工客服提问输入的,所述历史回复文本是人工客服过去回复用户提问输入的,可将在人工客服向用户提供客服服务时,将相应的提问文本及回复文本进行存储以备调用。
步骤S2001、将所述文本数据对输入至预设的回复匹配模型,确定出相应的回复质量;
所述回复匹配模型预先经过训练至收敛,习得确定出以输入的文本数据对中的历史回复文本,对该文本数据对中的历史提问文本进行回复的回复质量的能力,模型结构上可以是双塔模型,其包括两个处理支路,每个处理支路均包含完全相同的网络结构,每个处理支路包括文本特征表示层,然后,将两个处理支路的输出接入分类器进行二分类,分类出属于有效回复的概率作为所述回复质量,所述二分类包括有效回复、无效回复。所述文本特征提取层可采用Text Transfomer、RoBERTa、XLM-RoBERTa、MPNet、BERT等,本领域技术人员可按需择一实现。所述分类器使用于二分类任务,可采用LightGBM、XGBoost、CatBoost、AdaBoost、GBDT、Random Forest等,本领域技术人员可按需择一实现。
一种实施例中,将历史提问文本及其对应的历史回复文本构造出文本数据对作为训练样本,人为判断以该文本数据对中的历史回复文本,对该文本数据对中的历史提问文本进行回复是否有效,相应标注所述训练样本的监督标签,一种实施例中,人为判断以训练样本中的历史回复文本,对训练样本中的历史提问文本进行回复,所述回复是专业的、准确的、完整解答提问中的所有疑问的,所述回复属于有效回复标注训练样本的监督标签为1,否则,所述回复属于无效回复标注训练样本的监督标签为0。
将所述训练样本输入回复匹配模型,由一个处理支路提取文本数据对中历史提问文本的深层语义特征,获得相应向量化的特征表示,同时,另一处理支路提取文本数据对中历史回复文本的深层语义特征,获得相应向量化的特征表示,然后,将历史提问文本和历史回复文本对应的特征表示输入至分类器进行二分类,映射至预设的二类别,所述二类别包括表征有效回复的类别、表征无效回复的类别,获得预测的表征有效回复的类别的分类概率,即预测的属于有效回复的概率,调用预设的交叉熵损失函数,基于根据所述训练样本的监督标签计算所述预测的属于有效回复的概率的交叉熵损失值;当交叉熵损失值达到预设阈值时,表明回复匹配模型已被训练至收敛状态,从而可以终止模型训练;交叉熵损失值未达到预设阈值时,表明模型未收敛,于是根据交叉熵损失值对模型实施梯度更新,通常通过反向传播修正模型各个环节的权重参数以使模型进一步逼近收敛,然后,继续调用其他训练样本对该模型实施迭代训练,直至该模型被训练至收敛状态为止。所述交叉熵损失函数可由本领域技术人员按需设定。
步骤S2002、去除所述回复质量低于预设阈值的历史提问文本及其对应的历史回复文本。
所述预设阈值用于界定回复质量是否过低,可由本领域技术人员按此处揭示灵活变通设置。
可以理解,所述回复质量低于预设阈值时,表示以相应的历史回复文本,对其对应的历史提问文本进行回复,该回复不是专业的、准确的、完整解答提问中的所有疑问的,属于无效回复。
本实施例中,通过采用回复匹配模型确定出以历史回复文本,对其对应的历史提问文本进行回复的回复质量,据此,过滤掉回复质量不达标的历史提问文本及其对应的历史回复文本。能够确保剩余的历史回复文本,以其对对应的历史提问文本进行回复,该回复一定程度上是专业的、准确的、完整解答提问中的所有疑问的。
请参阅图7,进一步的实施例中,步骤S1200、响应用户提问事件,获取用户输入的提问文本之后,包括如下步骤:
步骤S1201、响应匹配失败事件,采用预设的意图分类模型确定出所述提问文本的意图是否明确;
所述意图分类模型预先训练至收敛,习得确定出输入的提问文本的意图明确的概率的能力,模型的结构可为文本特征提取层后接分类器,所述文本特征提取层适用于提取文本的深层语义任务,可采用Text Transfomer、RoBERTa、XLM-RoBERTa、MPNet、BERT等,本领域技术人员可按需择一实现。所述分类器使用于二分类任务,可采用LightGBM、XGBoost、CatBoost、AdaBoost、GBDT、Random Forest等,本领域技术人员可按需择一实现。
当从所述问答知识库中没有与所述提问文本相匹配的标准提问文本时,相应匹配失败事件,采用预设的意图分类模型以所述提问文本作为输入,确定出该提问文本的意图明确的概率,进一步,当所述概率大于预设阈值时,确定所述提问文本的意图明确,否则,确定所述提问文本的意图不明确。所述预设阈值可由本领域技术人员按需设定。
一种实施例中,获取历史提问文本作为训练样本,人为判断所述历史提问文本的意图是否明确即是否将疑问表达清楚,相应标注所述训练样本的监督标签,所述历史提问文本的获取可按照步骤S2000实现。一种实施例中,人为判断训练样本的历史提问文本的意图明确,标注训练样本的监督标签为1,否则,标注训练样本的监督标签为0。
将所述训练样本输入至意图分类模型,将所述训练样本输入至所述意图分类模型,由其中的文本特征提取层提取出训练样本的深层语义信息,获得相应向量化的文本语义特征表示,将所述文本语义特征表示输入至与分类器,映射至预设的二个类别,所述二个类别包括表征意图明确的类别、表征意图不明确的类别,获得预测的表征意图明确的类别的分类概率,调用预设的交叉熵损失函数,基于根据所述训练样本的监督标签计算所述预测的表征意图明确的类别的分类概率的交叉熵损失值;当交叉熵损失值达到预设阈值时,表明意图分类模型已被训练至收敛状态,从而可以终止模型训练;交叉熵损失值未达到预设阈值时,表明模型未收敛,于是根据交叉熵损失值对模型实施梯度更新,通常通过反向传播修正模型各个环节的权重参数以使模型进一步逼近收敛,然后,继续调用其他训练样本对该模型实施迭代训练,直至该模型被训练至收敛状态为止。所述交叉熵损失函数可由本领域技术人员按需设定。
步骤S1202、当所述意图明确时,将所述提问文本发送至人工客服接口;
当所述意图明确时,表示所述提问文本由所述智能客服无法提供相应的回复,将该提问文本发送至人工客服接口,有人工客服进行回复,确保回复质量。
步骤S1203、当所述意图不明确时,构造出重新输入通知推送给所述用户。
当所述意图不明确时,表示所述提问文本没有将疑问表达清楚,据此,构造出重新输入通知推送给所述用户,为便于用户理解,所述重新输入通知的内容可以是“您输入的提问文本意图不明确,无法清楚理解您的疑问,请您重新输入”。
本实施例中,揭示了响应匹配失败事件,根据采用意图分类模型确定出提问文本意图是否明确,提供相对应的解决方案,有效确保整个技术方案的鲁棒性和可靠性。
请参阅图8,适应本申请的目的之一而提供的一种面向用户的智能客服装置,是对本申请的面向用户的智能客服方法的功能化体现,该装置包括客服启用模块1100、用户提问模块1200、指令生成模块1300以及回复生成模块1400,其中,客服启用模块1100,用于响应用户启用智能客服事件,获取用户的个人信息及历史行为数据,确定出相应的用户画像;用户提问模块1200,用于响应用户提问事件,获取用户输入的提问文本,确定出预设的问答知识库中与所述提问文本相匹配的标准提问文本,获取所述标准提问文本的标准回复文本;指令生成模块1300,用于套用预设的指令模板,根据所述用户画像及所述标准回复文本生成相应的约束指令,所述约束指令指示根据所述用户画像对所述标准回复文本进行契合所述用户的人物风格的重新表述;回复生成模块1400,用于将所述约束指令输入至预设的拟人问答模型,生成面向用户回复。
进一步的实施例中,所述用户提问模块1200,包括:相似度确定子模块,用于采用预设的文本相似度模型确定出所述提问文本与预设的问答知识库中的每个标准提问文本之间对应的语义相似度;提问文本筛选子模块,用于筛选出所述语义相似度超过预设阈值的标准提问文本。
进一步的实施例中,所述用户提问模块1200之前,包括:第一数据获取子模块,用于获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本而产生的监督回复文本;确定出预设的问答知识库中与所述历史提问文本相匹配的标准提问文本,获取所述标准提问文本的标准回复文本;样本监督构建子模块,用于套用预设的指令模板,根据所述用户画像及所述标准回复文本生成相应的约束指令作为训练样本,以所述监督回复文本作为监督标签;回复生成子模块,用于将所述训练样本输入至拟人回复模型,提取出训练样本的深层语义信息,生成预测的面向用户回复;迭代训练子模块,用于采用所述训练样本的监督标签,确定所述预测的面向用户回复的损失值,在所述损失值未达到预设阈值时,对拟人回复模型实施权重更新,并继续调用其他训练样本实施迭代训练直至拟人回复模型收敛。
进一步的实施例中,所述客服启用模块1100,包括:标签确定子模块,用于根据用户的个人信息及历史行为数据,确定出基本属性标签、偏好属性标签;画像构造子模块,用于根据所述用户的基本属性标签及偏好属性标签,构造出相应的用户画像。
进一步的实施例中,所述数据获取子模块之前,包括:第二数据获取子模块,用于获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本的历史回复文本;人物风格确定子模块,用于确定所述用户画像对应的所述用户的人物风格;回复风格确定子模块,用于将所述历史回复文本输入至预设的风格分类模型,确定出相应的回复风格;监督确定子模块,用于当所述回复风格与所述用户风格相匹配而实现契合时,将所述历史回复文本作为监督回复文本。
进一步的实施例中,所述第二数据获取子模块之前,包括:第三数据获取子模块,用于获取历史提问文本及其对应的历史回复文本,构造出文本数据对;质量确定子模块,用于将所述文本数据对输入至预设的回复匹配模型,确定出相应的回复质量;文本去除子模块,用于去除所述回复质量低于预设阈值的历史提问文本及其对应的历史回复文本。
进一步的实施例中,所述用户提问模块1200之后,包括:意图确定子模块,用于响应匹配失败事件,采用预设的意图分类模型确定出所述提问文本的意图是否明确;意图明确子模块,用于当所述意图明确时,将所述提问文本发送至人工客服接口;意图不明确子模块,用于当所述意图不明确时,构造出重新输入通知推送给所述用户。
为解决上述技术问题,本申请实施例还提供计算机设备。如图9所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种面向用户的智能客服方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本申请的面向用户的智能客服方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图8中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本申请的面向用户的智能客服装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本申请还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本申请任一实施例的面向用户的智能客服方法的步骤。
本领域普通技术人员可以理解实现本申请上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等计算机可读存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
综上所述,本申请能够契合用户的人物风格进行回复,实现更加真实拟人化的客服服务。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种面向用户的智能客服方法,其特征在于,包括如下步骤:
响应用户启用智能客服事件,获取用户的个人信息及历史行为数据,确定出相应的用户画像;
响应用户提问事件,获取用户输入的提问文本,确定出预设的问答知识库中与所述提问文本相匹配的标准提问文本,获取所述标准提问文本的标准回复文本;
套用预设的指令模板,根据所述用户画像及所述标准回复文本生成相应的约束指令,所述约束指令指示根据所述用户画像对所述标准回复文本进行契合所述用户的人物风格的重新表述;
将所述约束指令输入至预设的拟人问答模型,生成面向用户回复。
2.根据权利要求1所述的面向用户的智能客服方法,其特征在于,确定出预设的问答知识库中与所述提问文本相匹配的标准提问文本,包括如下步骤:
采用预设的文本相似度模型确定出所述提问文本与预设的问答知识库中的每个标准提问文本之间对应的语义相似度;
筛选出所述语义相似度超过预设阈值的标准提问文本。
3.根据权利要求1所述的面向用户的智能客服方法,其特征在于,获取用户的个人信息及历史行为数据,确定出相应的用户画像之前,包括如下步骤:
获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本而产生的监督回复文本;
确定出预设的问答知识库中与所述历史提问文本相匹配的标准提问文本,获取所述标准提问文本的标准回复文本;
套用预设的指令模板,根据所述用户画像及所述标准回复文本生成相应的约束指令作为训练样本,以所述监督回复文本作为监督标签;
将所述训练样本输入至拟人回复模型,提取出训练样本的深层语义信息,生成预测的面向用户回复;
采用所述训练样本的监督标签,确定所述预测的面向用户回复的损失值,在所述损失值未达到预设阈值时,对拟人回复模型实施权重更新,并继续调用其他训练样本实施迭代训练直至拟人回复模型收敛。
4.根据权利要求1所述的面向用户的智能客服方法,其特征在于,确定出相应的用户画像,包括如下步骤:
根据用户的个人信息及历史行为数据,确定出基本属性标签、偏好属性标签;
根据所述用户的基本属性标签及偏好属性标签,构造出相应的用户画像。
5.根据权利要求1所述的面向用户的智能客服方法,其特征在于,获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本而产生的监督回复文本之前,包括如下步骤:
获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本的历史回复文本;
确定所述用户画像对应的所述用户的人物风格;
将所述历史回复文本输入至预设的风格分类模型,确定出相应的回复风格;
当所述回复风格与所述用户风格相匹配而实现契合时,将所述历史回复文本作为监督回复文本。
6.根据权利要求1所述的面向用户的智能客服方法,其特征在于,获取输入历史提问文本的用户的用户画像,以及回复所述历史提问文本的历史回复文本之前,包括如下步骤:
获取历史提问文本及其对应的历史回复文本,构造出文本数据对;
将所述文本数据对输入至预设的回复匹配模型,确定出相应的回复质量;
去除所述回复质量低于预设阈值的历史提问文本及其对应的历史回复文本。
7.根据权利要求1所述的面向用户的智能客服方法,其特征在于,响应用户提问事件,获取用户输入的提问文本之后,包括如下步骤:
响应匹配失败事件,采用预设的意图分类模型确定出所述提问文本的意图是否明确;
当所述意图明确时,将所述提问文本发送至人工客服接口;
当所述意图不明确时,构造出重新输入通知推送给所述用户。
8.一种面向用户的智能客服装置,其特征在于,包括:
客服启用模块,用于响应用户启用智能客服事件,获取用户的个人信息及历史行为数据,确定出相应的用户画像;
用户提问模块,用于响应用户提问事件,获取用户输入的提问文本,确定出预设的问答知识库中与所述提问文本相匹配的标准提问文本,获取所述标准提问文本的标准回复文本;
指令生成模块,用于套用预设的指令模板,根据所述用户画像及所述标准回复文本生成相应的约束指令,所述约束指令指示根据所述用户画像对所述标准回复文本进行契合所述用户的人物风格的重新表述;
回复生成模块,用于将所述约束指令输入至预设的拟人问答模型,生成面向用户回复。
9.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至7中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。
CN202310474485.7A 2023-04-27 2023-04-27 面向用户的智能客服方法及其装置、设备、介质 Pending CN116521843A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310474485.7A CN116521843A (zh) 2023-04-27 2023-04-27 面向用户的智能客服方法及其装置、设备、介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310474485.7A CN116521843A (zh) 2023-04-27 2023-04-27 面向用户的智能客服方法及其装置、设备、介质

Publications (1)

Publication Number Publication Date
CN116521843A true CN116521843A (zh) 2023-08-01

Family

ID=87395403

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310474485.7A Pending CN116521843A (zh) 2023-04-27 2023-04-27 面向用户的智能客服方法及其装置、设备、介质

Country Status (1)

Country Link
CN (1) CN116521843A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117216229A (zh) * 2023-11-08 2023-12-12 支付宝(杭州)信息技术有限公司 一种生成客服答案的方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117216229A (zh) * 2023-11-08 2023-12-12 支付宝(杭州)信息技术有限公司 一种生成客服答案的方法及装置

Similar Documents

Publication Publication Date Title
CN110555112B (zh) 一种基于用户正负偏好学习的兴趣点推荐方法
CN110188182A (zh) 模型训练方法、对话生成方法、装置、设备及介质
CN111784455A (zh) 一种物品推荐方法及推荐设备
CN110199276A (zh) 用方面标记查询
CN110795571A (zh) 基于深度学习和知识图谱的文化旅游资源推荐方法
CN110083693A (zh) 机器人对话回复方法及装置
CN111291170B (zh) 一种基于智能客服的会话推荐方法及相关装置
WO2021155691A1 (zh) 用户画像生成方法、装置、存储介质及设备
CN108897823B (zh) 基于深度学习注意力机制的个性化商品检索方法及装置
CN111309887A (zh) 一种训练文本关键内容提取模型的方法和系统
CN115689672A (zh) 聊天式商品导购方法及其装置、设备、介质
CN116976920A (zh) 商品导购方法及其装置、设备、介质
CN116521843A (zh) 面向用户的智能客服方法及其装置、设备、介质
CN116797280A (zh) 广告文案生成方法及其装置、设备、介质
CN113962224A (zh) 命名实体识别方法及其装置、设备、介质、产品
CN113342944B (zh) 一种语料泛化方法、装置、设备及存储介质
CN116823404A (zh) 商品组合推荐方法及其装置、设备、介质
CN116029793A (zh) 商品推荐方法及其装置、设备、介质
CN116957128A (zh) 业务指标预测方法、装置、设备和存储介质
CN115700579A (zh) 广告文本生成方法及其装置、设备、介质
CN115936805A (zh) 商品推荐方法及其装置、设备、介质
CN115309905A (zh) 广告文本生成方法及其装置、设备、介质
CN115293818A (zh) 广告投放选品方法及其装置、设备、介质
CN114997921A (zh) 广告文案推荐方法及其装置、设备、介质、产品
CN113806537B (zh) 商品类目分类方法及其装置、设备、介质、产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination