CN112308573A - 智能客服方法及装置、存储介质、计算机设备 - Google Patents
智能客服方法及装置、存储介质、计算机设备 Download PDFInfo
- Publication number
- CN112308573A CN112308573A CN202011179407.7A CN202011179407A CN112308573A CN 112308573 A CN112308573 A CN 112308573A CN 202011179407 A CN202011179407 A CN 202011179407A CN 112308573 A CN112308573 A CN 112308573A
- Authority
- CN
- China
- Prior art keywords
- customer service
- inquiry
- intelligent customer
- information
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/448—Execution paradigms, e.g. implementations of programming paradigms
- G06F9/4488—Object-oriented
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请公开了一种智能客服方法及装置、存储介质、计算机设备,该方法包括:接收询问指令,并获取所述询问指令对应的实际询问信息;利用所述客户端中部署的智能客服询问匹配模型,确定与实际询问信息匹配度最高的目标询问信息以及对应的匹配度;在客户端的预设问答对数据存储路径下读取与目标询问信息匹配的目标答复信息,并输出目标答复信息;若匹配度小于预设匹配度阈值,则在智能客服服务于当前用户期间,分析当前用户对智能客服的满意程度值并基于满意程度值进行智能客服至人工客服的转换。本申请减少了对数据传输接口的开发量,提高了智能客服的响应速度,并且在一定程度上减轻了用户对数据隐私的担忧,提高了用户体验。
Description
技术领域
本申请涉及互联网技术领域,尤其是涉及到一种智能客服方法及装置、存储介质、计算机设备。
背景技术
随着移动互联的发展,利用现代技术开展高效快捷便民服务工作,已经势在必行。在AI人工智能的商业化落地及实际应用中,智能客服已为众多行业进行了科技赋能,帮助众多企业完成了客服中心的智能化转型。据统计,我国目前开展智能客服相关行业的企业接近400家,服务用户过亿。以电商行业为例:近年来,随着我国电商产业的迅速发展,尤其在电商购物节时的订单量屡创新高,在巨额交易量的背后,则是智能客服在扮演着非常重要的角色。
但是市面上大多数现有智能客服产品采用了客户每一次query(询问),都会调用后端接口,由部署在后端服务器的模型进行query相似度匹配,命中问答对,返回客服回答结果到客户端中,从而客户端对客服回答结果进行显示,这种方案有三个缺陷:1、与用户的交互即时性较慢,需要一次接口查询时间,网络情况不好时体验较差;2、需要将用户数据传输到后端服务器,容易使用户产生对数据隐私的担忧;3、需要开发接口,资源消耗较多。
综上,现在缺少一种能够克服上述缺陷智能客服方案。
发明内容
有鉴于此,本申请提供了一种智能客服方法及装置、存储介质、计算机设备。
根据本申请的一个方面,提供了一种智能客服方法,用于客户端,包括:
接收询问指令,并获取所述询问指令对应的实际询问信息;
利用所述客户端中部署的智能客服询问匹配模型,确定与所述实际询问信息匹配度最高的目标询问信息以及对应的匹配度;
在所述客户端的预设问答对数据存储路径下读取与所述目标询问信息匹配的目标答复信息,并输出所述目标答复信息;
若所述匹配度小于预设匹配度阈值,则在智能客服服务于当前用户期间,分析所述当前用户对所述智能客服的满意程度值并基于所述满意程度值进行所述智能客服至人工客服的转换。
具体地,所述若所述匹配度小于预设匹配度阈值,则在智能客服服务于当前用户期间,分析所述当前用户对所述智能客服的满意程度值,具体包括:
在所述智能客服服务于所述当前用户期间,获取所述当前用户对应的多个所述实际询问信息,并对多个所述实际询问信息进行分析确定所述当前用户对所述智能客服的满意程度值。
具体地,所述接收询问指令之前,所述方法还包括:
响应于对预设业务页面的访问指令,获取与所述业务页面对应的客服服务数据字节大小;
若所述客服服务数据字节大小大于或等于预设字节阈值,则发送客服服务数据获取请求至与所述业务页面对应的服务器,其中,所述客服服务数据获取请求包括与所述预设业务页面对应的客服服务标识,以使所述服务器基于所述客服服务标识向所述客户端发送客服服务数据;
若所述客服服务数据字节大小小于所述预设字节阈值,则在接收到客服服务请求指令时,发送所述客服服务数据获取请求至与所述业务页面对应的服务器。
具体地,所述发送客服服务数据获取请求至与所述业务页面对应的服务器之后,所述方法还包括:
接收来自所述服务器的所述客服服务数据,其中,所述客服服务数据包括所述智能客服询问匹配模型以及预设问答对数据;
基于TensorFlow.js工具在所述客户端中部署所述智能客服询问匹配模型以及将所述预设问答对数据保存在所述预设问答对数据存储路径下。
具体地,所述预设业务页面包括预设网络地址对应的业务页面和/或预设应用程序对应的业务页面。
具体地,所述利用所述客户端中部署的智能客服询问匹配模型,确定与所述实际询问信息匹配度最高的目标询问信息以及对应的匹配度,具体包括:
对所述实际询问信息进行预处理;
基于所述智能客服询问匹配模型,确定与预处理后的实际询问信息匹配度最高的目标询问信息以及对应的所述匹配度。
具体地,所述智能客服询问匹配模型基于预设GPU集群训练得到,所述GPU集群包括多个图形处理器GPU,所述智能客服询问匹配模型的训练步骤包括:
接收到训练任务后,获取任务信息;其中,所述任务信息包括初始模型、样本数据和迭代次数;
将所述初始模型复制到每个GPU,并同步所述每个GPU的模型参数的初始值;
每次迭代提取部分样本数据,将所述提取的样本数据拆分后分发给不同的GPU进行训练,对所有GPU训练得到的参数梯度进行全局规约操作,并在各GPU上根据规约之后的参数梯度更新所述模型参数;
完成所述迭代次数的迭代后,选择任意一个GPU的模型参数保存为模型训练结果,得到所述智能客服询问匹配模型。
根据本申请的另一方面,提供了一种智能客服装置,用于客户端,包括:
实际询问信息获取模块,用于接收询问指令,并获取所述询问指令对应的实际询问信息;
目标询问信息确定模块,用于利用所述客户端中部署的智能客服询问匹配模型,确定与所述实际询问信息匹配度最高的目标询问信息以及对应的匹配度;
目标答复信息确定模块,用于在所述客户端的预设问答对数据存储路径下读取与所述目标询问信息匹配的目标答复信息,并输出所述目标答复信息;
人工客服转换模块,用于若所述匹配度小于预设匹配度阈值,则在智能客服服务于当前用户期间,分析所述当前用户对所述智能客服的满意程度值并基于所述满意程度值进行所述智能客服至人工客服的转换。
具体地,所述人工客服转换模块,具体用于:
在所述智能客服服务于所述当前用户期间,获取所述当前用户对应的多个所述实际询问信息,并对多个所述实际询问信息进行分析确定所述当前用户对所述智能客服的满意程度值。
具体地,所述装置还包括:
字节大小获取模块,用于所述接收询问指令之前,响应于对预设业务页面的访问指令,获取与所述业务页面对应的客服服务数据字节大小;
第一请求发送模块,用于若所述客服服务数据字节大小大于或等于预设字节阈值,则发送客服服务数据获取请求至与所述业务页面对应的服务器,其中,所述客服服务数据获取请求包括与所述预设业务页面对应的客服服务标识,以使所述服务器基于所述客服服务标识向所述客户端发送客服服务数据;
第二请求发送模块,用于所述获取与所述业务页面对应的客服服务数据字节大小之后,若所述客服服务数据字节大小小于所述预设字节阈值,则在接收到客服服务请求指令时,发送所述客服服务数据获取请求至与所述业务页面对应的服务器。
具体地,所述装置还包括:
客服服务数据接收模块,用于所述发送客服服务数据获取请求至与所述业务页面对应的服务器之后,接收来自所述服务器的所述客服服务数据,其中,所述客服服务数据包括所述智能客服询问匹配模型以及预设问答对数据;
客服服务数据部署模块,用于基于TensorFlow.js工具在所述客户端中部署所述智能客服询问匹配模型以及将所述预设问答对数据保存在所述预设问答对数据存储路径下。
具体地,所述预设业务页面包括预设网络地址对应的业务页面和/或预设应用程序对应的业务页面。
具体地,所述目标询问信息确定模块,具体包括:
预处理单元,用于对所述实际询问信息进行预处理;
目标询问信息确定单元,用于基于所述智能客服询问匹配模型,确定与预处理后的实际询问信息匹配度最高的所述目标询问信息以及对应的所述匹配度。
具体地,所述智能客服询问匹配模型基于预设GPU集群训练得到,所述GPU集群包括多个图形处理器GPU;所述GPU集群用于:
接收到训练任务后,获取任务信息;其中,所述任务信息包括初始模型、样本数据和迭代次数;
将所述初始模型复制到每个GPU,并同步所述每个GPU的模型参数的初始值;
每次迭代提取部分样本数据,将所述提取的样本数据拆分后分发给不同的GPU进行训练,对所有GPU训练得到的参数梯度进行全局规约操作,并在各GPU上根据规约之后的参数梯度更新所述模型参数;
完成所述迭代次数的迭代后,选择任意一个GPU的模型参数保存为模型训练结果,得到所述智能客服询问匹配模型。
依据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述智能客服方法。
依据本申请再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述智能客服方法。
借由上述技术方案,本申请提供的一种智能客服方法及装置、存储介质、计算机设备,获取询问指令中携带的实际询问信息,从而基于客户端中已部署的智能客服匹配模型确定实际询问信息对应的目标询问信息,进而在客户端中预设问答对数据存储路径下存储的预设问答对数据中读取与该目标询问信息匹配的目标答复信息,并将目标答复信息输出给用户,并在实际询问信息与模型匹配出的目标询问信息匹配度较低的情况下,对用户的满意程度进行分析,在用户满意程度较低时转为人工客服提供服务。本申请相比于现有技术的技术方案,无需将用户输入的实际询问信息发送到服务器中,减少了对数据传输接口的开发量,节省了现有技术中数据在客户端与服务器之间传输所需的时间和流量资源,提高了智能客服的响应速度,节约了通信资源,减少了服务器资源占用,并且在一定程度上减轻了用户对数据隐私的担忧,同时可以对用户的满意度进行分析在满意度较低时转为人工客服,提高了用户体验。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种智能客服方法的流程示意图;
图2示出了本申请实施例提供的另一种智能客服方法的流程示意图;
图3示出了本申请实施例提供的一种智能客服装置的结构示意图;
图4示出了本申请实施例提供的另一种智能客服装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在本实施例中提供了一种智能客服方法,如图1所示,该方法包括:
步骤101,接收询问指令,并获取询问指令对应的实际询问信息;
步骤102,利用客户端中部署的智能客服询问匹配模型,确定与实际询问信息匹配度最高的目标询问信息以及对应的匹配度;
步骤103,在客户端的预设问答对数据存储路径下读取与目标询问信息匹配的目标答复信息,并输出目标答复信息;
步骤104,若匹配度小于预设匹配度阈值,则在智能客服服务于当前用户期间,分析当前用户对智能客服的满意程度值并基于满意程度值进行智能客服至人工客服的转换。
本申请实施例提供的智能客服方法应用于客户端中,例如智能手机、计算机、平板电脑等等,当用户在使用客户端的过程中需要使用智能客服时,例如在客户端的浏览器上访问网页时触发客服功能,再例如在客户端的应用程序中触发客服功能,客户端可以接收用户通过触发客服功能而产生的询问指令,若客户端接收到询问指令,说明用户有使用客服功能的需求,则可以对询问指令进行解析获取询问指令对应的实际询问信息,例如用户通过在客户端中输入问题“多长时间可以发货”下达询问指令,客户端对询问指令进行解析得到该用户输入的实际询问信息“多长时间可以发货”,确定实际询问信息之后,调用预先在客户端中部署的智能客服询问匹配模型获取与实际询问信息对应的目标询问信息,其中,该智能客服询问匹配模型可以根据输入信息,输出一个与之对应的目标询问信息,该目标询问信息可以为预先设定的标准问题,利用客户端上预先部署的智能客服询问匹配模型得到目标询问信息之后,进一步可以确定与该目标询问信息对应的目标答复信息进行输出,具体地,在客户端中的特定存储路径下读取与目标询问信息匹配的目标答复信息,其中,特定存储路径下保存有与预先设定的标准问题一一对应的标准答复信息,基于目标询问信息在该路径下查询对应的标准答复作为目标答复信息进行输出,从而实现客户端上的智能客服功能。通过预先在客户端中部署智能客服询问匹配模型以及预先在客户端的特定路径下存储预设问答对信息,从而客户端在接收到询问指令后,可以利用智能客服询问匹配模型确定与询问指令中的实际询问信息对应的目标询问信息,该智能客服询问匹配模型可以得出实际询问信息与每个预设询问信息的匹配度,该目标询问信息为与实际询问信息匹配度最高的预设询问信息,以及在特定路径下读取与目标询问信息匹配的目标答复信息进行输出,智能客服功能仅依赖于客户端即可实现,通过上述方式,第一,相对于现有技术的方案省去了接口请求与等待接口结果返回的时间,智能客服的响应速度更快;第二,由于智能客服询问匹配模型以及预设问答对数据都部署在客户端侧,用户输入的问题数据不会上传到服务器,在一定程度上减轻了用户对数据隐私的担忧;第三,智能客服询问匹配模型以及预设问答对数据部署在客户端中,对询问指令进行响应时,不再需要客户端与服务器通信,减少了通信接口的开发成本,减少了通信资源和服务器资源的占用。
进一步地,如果目标询问信息与实际询问信息之间的匹配度小于预设匹配度阈值,可能目前给用户的答复无法让用户满意,那么可以在智能客服服务于当前用户的时间内对当前用户的满意程度进行分析,并在用户的满意程度值较低时将智能客服转为人工客服,为当前用户提供更好的客服服务,提高用户的满意度。
具体地,在智能客服服务于当前用户期间,获取当前用户对应的多个实际询问信息,并对多个实际询问信息进行分析确定当前用户对智能客服的满意程度值。若用户对智能客服的给出的目标答复信息不满意,可能会继续针对相关问题反复提问,那么对当前用户输入的实际询问信息进行追踪分析,具体可以对多个实际询问信息进行语义理解,判断用户多次输入的实际询问信息是否表达相同意思,如果当前用户的多个实际询问信息存在表达相同意思或相近意思的情况,那么可以判断用户的满意度较低,此时可以转为人工客服,或者用户的输入信息表达出希望转为人工客服服务,例如用户输入包含“人工客服”关键词的句子,也可以转为人工客服。反之,如果用户对目标答复信息的满意度较高并且没有表达出希望转为人工客服服务的意思,继续利用智能客服为其提供服务即可。
通过应用本实施例的技术方案,获取询问指令中携带的实际询问信息,从而基于客户端中已部署的智能客服匹配模型确定实际询问信息对应的目标询问信息,进而在客户端中预设问答对数据存储路径下存储的预设问答对数据中读取与该目标询问信息匹配的目标答复信息,并将目标答复信息输出给用户,并在实际询问信息与模型匹配出的目标询问信息匹配度较低的情况下,对用户的满意程度进行分析,在用户满意程度较低时转为人工客服提供服务。本申请实施例相比于现有技术的技术方案,无需将用户输入的实际询问信息发送到服务器中,减少了对数据传输接口的开发量,节省了现有技术中数据在客户端与服务器之间传输所需的时间和流量资源,提高了智能客服的响应速度,节约了通信资源,减少了服务器资源占用,并且在一定程度上减轻了用户对数据隐私的担忧,同时可以对用户的满意度进行分析在满意度较低时转为人工客服,提高了用户体验。
另外,本申请实施例中的智能客服询问匹配模型基于GPU集群训练得到,具体的训练过程如下:
步骤1、接收到训练任务后,获取任务信息;其中,任务信息包括初始模型、样本数据和迭代次数;
步骤2、将初始模型复制到每个GPU,并同步每个GPU的模型参数的初始值;
步骤3、每次迭代提取部分样本数据,将提取的样本数据拆分后分发给不同的GPU进行训练,对所有GPU训练得到的参数梯度进行全局规约操作,并在各GPU上根据规约之后的参数梯度更新模型参数;
步骤4、完成迭代次数的迭代后,选择任意一个GPU的模型参数保存为模型训练结果,得到智能客服询问匹配模型。
在上述训练过程中,首先,服务器任务管理系统接收到用户提交的训练任务后,从中提取任务信息。任务信息可以包含深度学习的模型、样本数据、资源需求和训练迭代次数等信息。其中,模型一般形式是计算机编程语言写成的程序代码,训练系统是指管理GPU集群和通用训练平台(如矩阵数组Tensorflow、caffe2等)的任务管理系统。
其次,训练系统为用户作业分配软硬件资源,主要包括CPU、GPU等计算资源,将模型复制到每个GPU,并开辟单独显存空间保存一套完整的模型参数,使得每块GPU的显存上都保存完整参数集副本。其中,模型可以是保持在GPU集群服务器可以访问到的NFS(网络文件服务器)上,也可以是GPU集群服务器本地硬盘上,由服务器任务管理系统从预设的路径复制到上述NFS或本地硬盘,再由训练任务读取、复制到GPU上。同步每个GPU的模型参数的初始值可以通过参数同步消息将其中一个GPU的模型参数的初始值同步到其他GPU上。其中,参数同步消息包括但不限于:MPI(Message-Passing-Interface,接口传递)消息、IPC通信进程消息或NVLink消息。如果预设了哪个GPU的模型参数作为初始化值,则将预设的GPU中的模型参数同步到其他GPU,如果没有预设,则可以将第1个GPU的模型参数复制到其他GPU。
接着,在训练过程中,每次迭代从样本数据取出一部分样本数据并平均拆分为K份(假设使用K个GPU),分别发送给不同的GPU进行训练,训练获得参数梯度Gradn,Gradn表示第n个GPU计算出的参数梯度数据,每份参数梯度数据又包含N个多维矩阵数组。每次迭代结束后,对所有GPU计算的参数梯度进行全局规约操作,并将全局规约后的参数梯度分发到所有的GPU上。随后每个GPU根据全局规约后的参数梯度更新模型参数。需要说明的是,全局规约是大规模并行计算经常用到的通用算法,要求将所有进程间的数据集逐个元素进行规约操作,再将操作结果分发到所有进程。深度学习的分布式训练过程中,每个worker(worker,执行训练相关的作业,包括推理计算和梯度计算)计算出的参数梯度或参数就需要经过全局规约操作,以保证训练过程中各个计算节点间的模型同步。全局规约操作包括但不限于:全局求和、全局取最大值、全局取最小值或全局取平均值等。
最后,通过去除现有技术中常用的中心化PS(PS,执行模型相关的作业,包括模型参数存储,分发,汇总,更新),训练初始化时将模型复制到每一个GPU上,并在每一个GPU上开辟单独显存空间保存一套完整的模型参数,各GPU上的模型就近引用模型参数,充分利用了GPU-GPU高速数据传输带宽,避免了PS-Worker之间的进程间通信开销,减少了GPU-CPU之间的数据传输开销,从而提升了并行训练效率。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,提供了另一种智能客服方法,如图2所示,该方法包括:
步骤201,响应于对预设业务页面的访问指令,获取与业务页面对应的客服服务数据字节大小;
步骤202,若客服服务数据字节大小大于或等于预设字节阈值,则发送客服服务数据获取请求至与业务页面对应的服务器,其中,客服服务数据获取请求包括与预设业务页面对应的客服服务标识,以使服务器基于客服服务标识向客户端发送客服服务数据;
步骤203,若客服服务数据字节大小小于预设字节阈值,则在接收到客服服务请求指令时,发送客服服务数据获取请求至与业务页面对应的服务器;
步骤204,接收来自服务器的客服服务数据,其中,客服服务数据包括智能客服询问匹配模型以及预设问答对数据;
在步骤201至步骤204中,具体地,预设业务页面包括预设网络地址对应的业务页面和/或预设应用程序对应的业务页面。在基于客户端中的浏览器提供客服服务的应用场景中,预设网络地址可以对应于预设的网站地址或网页地址,当用户访问客服服务对应的网页时,或者当用户访问客服服务对应的网页并触发客服服务功能时,客户端向该网页对应的服务器发送数据获取请求,具体依据客服服务数据的字节大小选择在哪种情况下发送数据获取请求,如果客服服务数据的占用字节数较小即小于预设字节阈值,可以在用户触发客服服务功能时向服务器发送数据获取请求,反之,如果客服服务数据的占用字节数较大即大于或等于预设字节阈值,可以在用户访问网页时就向服务器发送数据获取请求,从而可以对得到的模型进行快速部署,以免因数据量过大下载速度慢导致无法快速实现对客服服务的响应。服务器对接收到的数据获取请求进行解析,得到客户端地址以及客户端所请求的客服服务代码,并在服务器的数据库中查询与该客服服务代码对应的智能客服询问匹配模型以及业务问答对的数据文件,以及将查询到的模型和数据文件发送到相应的客户端地址中。例如,用户访问A网站(A网站可以提供客服服务)时,或者用户访问A网站并触发客服服务时,基于用户对A网站的访问数据或者基于用户对客服服务的触发操作数据,向A网站相应的服务器发送数据获取请求,以请求服务器向客户端发送与该客服服务对应的智能客服询问匹配模型以及业务问答对的数据文件。
在基于客户端中的应用程序提供客服服务的应用场景中,根据不同的情况又可以包含两种更具体的实现方式:其一,该应用程序的安装包中携带智能客服询问匹配模型以及业务问答对的数据文件,在下载应用程序的安装包的同时就获取到了上述模型以及数据文件,这种情况主要针对于应用程序本身占用字节大小较少时可以将模型和数据文件预存到安装包中;其二,当用户使用应用程序时,或者当用户使用应用程序并触发应用程序的客服服务时,客户端向该应用程序对应的服务器发送数据获取请求,具体依据客服服务数据的字节大小选择在哪种情况下发送数据获取请求,如果客服服务数据的占用字节数较小即小于预设字节阈值,可以在用户触发客服服务功能时向服务器发送数据获取请求,反之,如果客服服务数据的占用字节数较大即大于或等于预设字节阈值,可以在用户打开应用程序时就向服务器发送数据获取请求,从而可以对得到的模型进行快速部署,以免因数据量过大下载速度慢导致无法快速实现对客服服务的响应。服务器对接收到的数据获取请求进行解析,得到客户端地址以及客户端所请求的客服服务代码,并在服务器的数据库中查询与该客服服务代码对应的智能客服询问匹配模型以及业务问答对的数据文件,以及将查询到的模型和数据文件发送到相应的客户端地址中。
步骤205,基于TensorFlow.js工具在客户端中部署智能客服询问匹配模型以及将预设问答对数据保存在预设问答对数据存储路径下;
在上述实施例中,TensorFlow.js是一个开源的基于硬件加速的JavaScript库,用于训练和部署机器学习模型。谷歌推出的第一个基于TensorFlow的前端深度学习框架TensorFlow.js是一个开源的用于开发机器学习项目的WebGL-accelerated JavaScript库。TensorFlow.js可以提供高性能的、易于使用的机器学习构建模块,实现在浏览器上训练模型,或运行预训练的模型。本申请中基于TensorFlow.js对模型进行部署,具体可以利用开源代码实现模型部署,从而在用户访问客服服务功能时实现运行该智能客服询问匹配模型。另外,还将业务问答对对应的数据文件存储在预设路径中,以便在预设路径中查询用户询问问题对应的答案。
步骤206,接收询问指令,并获取询问指令对应的实际询问信息;
步骤207,对实际询问信息进行预处理;
步骤208,基于智能客服询问匹配模型,确定与预处理后的实际询问信息匹配度最高的目标询问信息以及对应的匹配度;
步骤209,在客户端的预设问答对数据存储路径下读取与目标询问信息匹配的目标答复信息,并输出目标答复信息。
在步骤206至步骤209中,对于实际询问信息需要先进行预处理,其中,对实际问询信息的预处理过程可以包括去除特殊字符、模糊词语匹配等等,例如将用户输入的实际问询信息中的特殊字符%*¥等去掉,以及按照预设模糊词语匹配表将实际问询信息中的模糊词语按照该匹配表映射,例如基于匹配表,将用户输入的实际问询信息中的“鼓掌”映射为“故障”,得到与实际应用场景更接近的语义信息。另外,实际问询信息还可以为语音信息,上述步骤206具体可以为:接收实际问询信息,并将实际问询信息进行翻译,从语音格式转换为文字格式。进一步的,基于智能客服询问匹配模型得到的目标问询信息,在预设路径下存储的数据文件中查询与该目标问询信息对应的目标答复信息,并将该目标答复信息作为对用户询问的回答进行输出,以实现客户端的智能客服功能。
在现有技术方案下,将会经历开发环境部署,模型开发与训练,接口开发,前端调用四个部分,而本申请实施例基于TensorFlow.js将模型部署在前端,在服务器进行模型训练后,训练成功后可直接在客户端使用,基于TensorFlow.js在客户端部署智能客服询问匹配模型,不需要在服务器搭建TensorFlow环境,以及进行模型部署和接口开发,并且TensorFlow.js支持将Python与Java版本训练的模型直接进行部署,也就是说对于复杂的智能客服询问匹配模型来说,可以采用在后端使用GPU集群对模型进行深度学习训练,然后再将训练好的模型部署在客户端,解决客户端硬件性能不足的问题,将服务端与客户端结合,资源利用最大化。
通过采用基于TensorFlow.js的置于客户端的智能客服模型方案,可带来以下好处:1.开发者无需关注深度学习框架TensorFlow在服务器的安装部署与环境配置;2.智能客服询问匹配模型通过TensorFlow.js部署在前端,用户交互即时性更高,用户体验更好;3.用户隐私数据无需上传服务器,数据隐私性更好;4.智能客服询问匹配模型通过TensorFlow.js部署在前端,无需与后端交互,避免资源浪费;5.服务端训练好的模型可以通过TensorFlow.js直接部署在客户端,无缝对接并解决客户端性能不足问题。
步骤210,若匹配度小于预设匹配度阈值,则在智能客服服务于当前用户期间,获取当前用户对应的多个实际询问信息,并对多个实际询问信息进行分析确定当前用户对智能客服的满意程度值,基于满意程度值进行智能客服至人工客服的转换。
在步骤210中,若用户对智能客服的给出的目标答复信息不满意,可能会继续针对相关问题反复提问,那么对当前用户输入的实际询问信息进行追踪分析,具体可以对多个实际询问信息进行语义理解,判断用户多次输入的实际询问信息是否表达相同意思,如果当前用户的多个实际询问信息存在表达相同意思或相近意思的情况,那么可以判断用户的满意度较低,此时可以转为人工客服,或者用户的输入信息表达出希望转为人工客服服务,例如用户输入包含“人工客服”关键词的句子,也可以转为人工客服。反之,如果用户对目标答复信息的满意度较高并且没有表达出希望转为人工客服服务的意思,继续利用智能客服为其提供服务即可。
进一步的,作为图1方法的具体实现,本申请实施例提供了一种智能客服装置,如图3所示,该装置包括:
实际询问信息获取模块31,用于接收询问指令,并获取询问指令对应的实际询问信息;
目标询问信息确定模块32,用于利用客户端中部署的智能客服询问匹配模型,确定与实际询问信息匹配度最高的目标询问信息以及对应的匹配度;
目标答复信息确定模块33,用于在客户端的预设问答对数据存储路径下读取与目标询问信息匹配的目标答复信息,并输出目标答复信息;
人工客服转换模块34,用于若匹配度小于预设匹配度阈值,则在智能客服服务于当前用户期间,分析当前用户对智能客服的满意程度值并基于满意程度值进行智能客服至人工客服的转换。
在具体的应用场景中,如图4所示,该装置还包括:
字节大小获取模块35,用于接收询问指令之前,响应于对预设业务页面的访问指令,获取与业务页面对应的客服服务数据字节大小;
第一请求发送模块36,用于若客服服务数据字节大小大于或等于预设字节阈值,则发送客服服务数据获取请求至与业务页面对应的服务器,其中,客服服务数据获取请求包括与预设业务页面对应的客服服务标识,以使服务器基于客服服务标识向客户端发送客服服务数据;
第二请求发送模块37,用于若客服服务数据字节大小小于预设字节阈值,则在接收到客服服务请求指令时,发送客服服务数据获取请求至与业务页面对应的服务器。
在具体的应用场景中,如图4所示,该装置还包括:
客服服务数据接收模块38,用于发送客服服务数据获取请求至与业务页面对应的服务器之后,接收来自服务器的客服服务数据,其中,客服服务数据包括智能客服询问匹配模型以及预设问答对数据;
客服服务数据部署模块39,用于基于TensorFlow.js工具在客户端中部署智能客服询问匹配模型以及将预设问答对数据保存在预设问答对数据存储路径下。
具体地,预设业务页面包括预设网络地址对应的业务页面和/或预设应用程序对应的业务页面。
在具体的应用场景中,如图4所示,目标询问信息确定模块32,具体包括:
预处理单元321,用于对实际询问信息进行预处理;
目标询问信息确定单元322,用于基于智能客服询问匹配模型,确定与预处理后的实际询问信息匹配度最高的目标询问信息以及对应的匹配度。
具体地,所述智能客服询问匹配模型基于预设GPU集群训练得到,所述GPU集群包括多个图形处理器GPU;所述GPU集群用于:
接收到训练任务后,获取任务信息;其中,任务信息包括初始模型、样本数据和迭代次数;
将初始模型复制到每个GPU,并同步每个GPU的模型参数的初始值;
每次迭代提取部分样本数据,将提取的样本数据拆分后分发给不同的GPU进行训练,对所有GPU训练得到的参数梯度进行全局规约操作,并在各GPU上根据规约之后的参数梯度更新模型参数;
完成迭代次数的迭代后,选择任意一个GPU的模型参数保存为模型训练结果,得到智能客服询问匹配模型。
需要说明的是,本申请实施例提供的一种智能客服装置所涉及各功能单元的其他相应描述,可以参考图1至图2方法中的对应描述,在此不再赘述。
基于上述如图1至图2所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述如图1至图2所示的智能客服方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1至图2所示的方法,以及图3至图4所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该计算机设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1至图2所示的智能客服方法。
可选地,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种计算机设备结构并不构成对该计算机设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理和保存计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现获取询问指令中携带的实际询问信息,从而基于客户端中已部署的智能客服匹配模型确定实际询问信息对应的目标询问信息,进而在客户端中预设问答对数据存储路径下存储的预设问答对数据中读取与该目标询问信息匹配的目标答复信息,并将目标答复信息输出给用户,并在实际询问信息与模型匹配出的目标询问信息匹配度较低的情况下,对用户的满意程度进行分析,在用户满意程度较低时转为人工客服提供服务。本申请相比于现有技术的技术方案,无需将用户输入的实际询问信息发送到服务器中,减少了对数据传输接口的开发量,节省了现有技术中数据在客户端与服务器之间传输所需的时间和流量资源,提高了智能客服的响应速度,节约了通信资源,减少了服务器资源占用,并且在一定程度上减轻了用户对数据隐私的担忧,同时可以对用户的满意度进行分析在满意度较低时转为人工客服,提高了用户体验。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。
Claims (10)
1.一种智能客服方法,用于客户端,其特征在于,包括:
接收询问指令,并获取所述询问指令对应的实际询问信息;
利用所述客户端中部署的智能客服询问匹配模型,确定与所述实际询问信息匹配度最高的目标询问信息以及对应的匹配度;
在所述客户端的预设问答对数据存储路径下读取与所述目标询问信息匹配的目标答复信息,并输出所述目标答复信息;
若所述匹配度小于预设匹配度阈值,则在智能客服服务于当前用户期间,分析所述当前用户对所述智能客服的满意程度值并基于所述满意程度值进行所述智能客服至人工客服的转换。
2.根据权利要求1所述的方法,其特征在于,所述若所述匹配度小于预设匹配度阈值,则在智能客服服务于当前用户期间,分析所述当前用户对所述智能客服的满意程度值,具体包括:
在所述智能客服服务于所述当前用户期间,获取所述当前用户对应的多个所述实际询问信息,并对多个所述实际询问信息进行分析确定所述当前用户对所述智能客服的满意程度值。
3.根据权利要求1所述的方法,其特征在于,所述接收询问指令之前,所述方法还包括:
响应于对预设业务页面的访问指令,获取与所述业务页面对应的客服服务数据字节大小;
若所述客服服务数据字节大小大于或等于预设字节阈值,则发送客服服务数据获取请求至与所述业务页面对应的服务器,其中,所述客服服务数据获取请求包括与所述预设业务页面对应的客服服务标识,以使所述服务器基于所述客服服务标识向所述客户端发送客服服务数据;
若所述客服服务数据字节大小小于所述预设字节阈值,则在接收到客服服务请求指令时,发送所述客服服务数据获取请求至与所述业务页面对应的服务器。
4.根据权利要求3所述的方法,其特征在于,所述发送客服服务数据获取请求至与所述业务页面对应的服务器之后,所述方法还包括:
接收来自所述服务器的所述客服服务数据,其中,所述客服服务数据包括所述智能客服询问匹配模型以及预设问答对数据;
基于TensorFlow.js工具在所述客户端中部署所述智能客服询问匹配模型以及将所述预设问答对数据保存在所述预设问答对数据存储路径下。
5.根据权利要求3所述的方法,其特征在于,所述预设业务页面包括预设网络地址对应的业务页面和/或预设应用程序对应的业务页面。
6.根据权利要求1所述的方法,其特征在于,所述利用所述客户端中部署的智能客服询问匹配模型,确定与所述实际询问信息匹配度最高的目标询问信息以及对应的匹配度,具体包括:
对所述实际询问信息进行预处理;
基于所述智能客服询问匹配模型,确定与预处理后的实际询问信息匹配度最高的所述目标询问信息以及对应的所述匹配度。
7.根据权利要求1所述的方法,其特征在于,所述智能客服询问匹配模型基于预设GPU(图形处理器)集群训练得到,所述GPU集群包括多个GPU,所述智能客服询问匹配模型的训练步骤包括:
接收到训练任务后,获取任务信息,其中,所述任务信息包括初始模型、样本数据和迭代次数;
将所述初始模型复制到每个GPU,并同步所述每个GPU的模型参数的初始值;
每次迭代提取部分样本数据,将所述提取的样本数据拆分后分发给不同的GPU进行训练,对所有GPU训练得到的参数梯度进行全局规约操作,并在各GPU上根据规约之后的参数梯度更新所述模型参数;
完成所述迭代次数的迭代后,选择任意一个GPU的模型参数保存为模型训练结果,得到所述智能客服询问匹配模型。
8.一种智能客服装置,用于客户端,其特征在于,包括:
实际询问信息获取模块,用于接收询问指令,并获取所述询问指令对应的实际询问信息;
目标询问信息确定模块,用于利用所述客户端中部署的智能客服询问匹配模型,确定与所述实际询问信息匹配度最高的目标询问信息以及对应的匹配度;
目标答复信息确定模块,用于在所述客户端的预设问答对数据存储路径下读取与所述目标询问信息匹配的目标答复信息,并输出所述目标答复信息;
人工客服转换模块,用于若所述匹配度小于预设匹配度阈值,则在智能客服服务于当前用户期间,分析所述当前用户对所述智能客服的满意程度值并基于所述满意程度值进行所述智能客服至人工客服的转换。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的智能客服方法。
10.一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的智能客服方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011179407.7A CN112308573A (zh) | 2020-10-29 | 2020-10-29 | 智能客服方法及装置、存储介质、计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011179407.7A CN112308573A (zh) | 2020-10-29 | 2020-10-29 | 智能客服方法及装置、存储介质、计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112308573A true CN112308573A (zh) | 2021-02-02 |
Family
ID=74330792
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011179407.7A Pending CN112308573A (zh) | 2020-10-29 | 2020-10-29 | 智能客服方法及装置、存储介质、计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112308573A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673256A (zh) * | 2021-07-21 | 2021-11-19 | 阿里巴巴达摩院(杭州)科技有限公司 | 问询语句改写方法及装置 |
CN115860055A (zh) * | 2022-11-23 | 2023-03-28 | 北京百度网讯科技有限公司 | 性能确定方法、性能优化方法、装置、电子设备以及介质 |
-
2020
- 2020-10-29 CN CN202011179407.7A patent/CN112308573A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673256A (zh) * | 2021-07-21 | 2021-11-19 | 阿里巴巴达摩院(杭州)科技有限公司 | 问询语句改写方法及装置 |
CN115860055A (zh) * | 2022-11-23 | 2023-03-28 | 北京百度网讯科技有限公司 | 性能确定方法、性能优化方法、装置、电子设备以及介质 |
CN115860055B (zh) * | 2022-11-23 | 2024-01-02 | 北京百度网讯科技有限公司 | 性能确定方法、性能优化方法、装置、电子设备以及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11113475B2 (en) | Chatbot generator platform | |
McChesney et al. | Defog: fog computing benchmarks | |
CN109067890B (zh) | 一种基于docker容器的CDN节点边缘计算系统 | |
US11422785B2 (en) | Container orchestration framework | |
CN112449750A (zh) | 日志数据收集方法、日志数据收集装置、存储介质和日志数据收集系统 | |
CN112308573A (zh) | 智能客服方法及装置、存储介质、计算机设备 | |
CN116127020A (zh) | 生成式大语言模型训练方法以及基于模型的搜索方法 | |
WO2021203918A1 (zh) | 用于处理模型参数的方法和装置 | |
CN110795697A (zh) | 逻辑表达式的获取方法、装置、存储介质以及电子装置 | |
CN113778871A (zh) | Mock测试方法、装置、设备及存储介质 | |
CN111444158A (zh) | 长短期用户画像生成方法、装置、设备及可读存储介质 | |
CN113836172A (zh) | 交互方法、装置、电子设备、存储介质及计算机程序产品 | |
CN115358404A (zh) | 基于机器学习模型推理的数据处理方法、装置及设备 | |
CN114428705A (zh) | 一种网络数据的监测方法、装置、设备以及存储介质 | |
CN116578423B (zh) | 任务处理方法、自动问答方法以及图像生成方法 | |
US10719736B1 (en) | Feature submission de-duplication engine | |
US20220164377A1 (en) | Method and apparatus for distributing content across platforms, device and storage medium | |
CN112130827A (zh) | 基于云端模块化技术的模型开发方法、平台和智能终端 | |
KR20200103133A (ko) | 하둡 기반의 빅데이터 시스템에서 etl 절차를 수행하는 방법 및 장치 | |
CN111400623B (zh) | 用于搜索信息的方法和装置 | |
CN113268360A (zh) | 请求处理方法、装置、服务器及存储介质 | |
CN113905037A (zh) | 一种文件传输管理方法、装置、设备及存储介质 | |
CN112950382A (zh) | 交易业务撮合匹配方法、装置、电子设备及介质 | |
CN113760715A (zh) | 一种对系统进行测试的方法和装置 | |
CN101996255A (zh) | 一种面向需求接口的云计算搜索体系架构方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |