CN111416728A - 会话结束预测、在线客服服务的方法、系统、设备及介质 - Google Patents
会话结束预测、在线客服服务的方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN111416728A CN111416728A CN201910016629.8A CN201910016629A CN111416728A CN 111416728 A CN111416728 A CN 111416728A CN 201910016629 A CN201910016629 A CN 201910016629A CN 111416728 A CN111416728 A CN 111416728A
- Authority
- CN
- China
- Prior art keywords
- conversation
- session
- customer service
- sentences
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000012549 training Methods 0.000 claims abstract description 62
- 238000004590 computer program Methods 0.000 claims description 19
- 230000011218 segmentation Effects 0.000 claims description 18
- 238000010606 normalization Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 8
- 238000007477 logistic regression Methods 0.000 claims description 8
- 230000002123 temporal effect Effects 0.000 claims description 4
- 238000004891 communication Methods 0.000 abstract description 7
- 238000004458 analytical method Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 6
- 238000012706 support-vector machine Methods 0.000 description 5
- 238000013145 classification model Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/14—Session management
- H04L67/143—Termination or inactivation of sessions, e.g. event-controlled end of session
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种会话结束预测、在线客服服务的方法、系统、设备及介质,所述会话结束预测方法包括:获取多条历史会话日志数据,每条历史会话日志数据依次包括多个会话语句,多个会话语句包括起始语句和终止语句;从每条历史会话日志数据中提取会话正样本和会话负样本,会话正样本包括所有的会话语句,会话负样本为以起始语句为起点的语句组合,语句组合的终点为除终止语句之外的任一会话语句;将会话正样本和会话负样本作为训练数据输入至线性分类器,训练得到会话结束预测模型;会话结束预测模型用于预测在线客服与用户的任一会话是否结束。本发明通过对客服与用户聊天过程的会话语句的分析,基于训练模型科学的预测该通会话是否即将结束。
Description
技术领域
本发明属于在线客服通信技术领域,特别涉及一种会话结束预测、在线客服服务的方法、系统、设备及介质。
背景技术
在互联网领域,采用在线人工客服对用户进行接待,回答用户的咨询问题,帮助用户在整个互联网使用过程中闭环,提升用户的体验。
在人工客服接待用户过程中,存在这样一种普遍的现象,用户咨询完自己的问题后,并不会主动关闭聊天窗口,而是直接切换到其他页面,这样客服和用户的连接资源就需要保留一段时间,当用户超过系统预设的等待时间,且没有继续说话时,系统才会主动切断用户与客服的连接,也就是说,在一定时间内该客服没有继续服务于上一个用户,且其他用户无法分配给该客服接待,造成了客服资源的严重浪费。
发明内容
本发明实施例要解决的技术问题是为了克服现有技术中无法即使预知用户的咨询是否结束造成客服资源的严重浪费的缺陷,提供一种会话结束预测、在线客服服务的方法、系统、设备及介质。
本发明实施例是通过下述技术方案来解决上述技术问题:
一种在线客服的会话结束预测方法,所述会话结束预测方法包括:
获取多条历史会话日志数据,每条历史会话日志数据依次包括多个会话语句,所述多个会话语句包括起始语句和终止语句;
从所述每条历史会话日志数据中提取会话正样本和会话负样本,所述会话正样本包括所有的会话语句,所述会话负样本为以所述起始语句为起点的语句组合,所述语句组合的终点为除所述终止语句之外的任一会话语句;
将所述会话正样本和所述会话负样本作为训练数据输入至线性分类器,训练得到会话结束预测模型;
所述会话结束预测模型用于预测在线客服与用户的任一会话是否结束。
较佳地,所述将所述会话正样本和所述会话负样本作为训练数据输入至线性分类器,训练得到会话结束预测模型的步骤之前,所述会话结束预测方法还包括:
分别对所述会话正样本和所述会话负样本进行分词处理,获得所述会话正样本的词特征和所述会话负样本的词特征;
根据所述会话正样本的词特征生成所述会话正样本的第一特征向量;
根据所述会话负样本的词特征生成所述会话负样本的第二特征向量;
所述将所述会话正样本和所述会话负样本作为训练数据输入至线性分类器,训练得到会话结束预测模型的步骤具体包括:
将所述第一特征向量和所述第二特征向量作为所述训练数据输入至线性分类器得到所述会话结束预测模型。
较佳地,所述每条历史会话日志数据还包括每个会话语句的会话时刻,所述分别对所述会话正样本和所述会话负样本进行分词处理,获得对应的特征词的步骤之后,所述会话结束预测方法还包括:
根据所述会话时刻获取所述历史会话日志数据的时间特征,所述时间特征包括用户相邻两个会话语句之间的时间间隔、在线客服相邻两个会话语句之间的时间间隔和会话总时长;
分别获取所述会话正样本和所述会话负样本的数量特征,所述数量特征包括会话正样本包含的会话语句的数量和词特征数量、会话负样本包含的会话语句的数量和词特征数量;
所述将所述第一特征向量和所述第二特征向量作为所述训练数据输入至线性分类器得到所述会话结束预测模型的步骤具体包括:
将所述第一特征向量、所述第二特征向量、所述时间特征和所述数量特征作为所述训练数据输入至线性分类器得到所述会话结束预测模型。
较佳地,所述将所述第一特征向量、所述第二特征向量、所述时间特征和所述数量特征作为所述训练数据输入至线性分类器得到所述会话结束预测模型的步骤之前,所述会话结束预测方法还包括:
对所述时间特征和所述数量特征进行归一化处理;
所述将所述第一特征向量、所述第二特征向量、所述时间特征和所述数量特征作为所述训练数据输入至线性分类器得到所述会话结束预测模型的步骤中,使用归一化后的时间特征和归一化后的数量特征进行训练。
较佳地,所述线性分类器使用感知机模型、LDA(线性判别分析)模型、logistic(逻辑)回归模型和SVM(支持向量机)模型中的至少一个模型进行训练。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的在线客服的会话结束预测方法。
一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的在线客服的会话结束预测方法的步骤。
一种在线客服服务方法,所述在线客服服务方法包括:
实时获取在线客服与当前用户在当前会话中的目标会话语句和每个目标会话语句的目标会话时刻;
利用上述的在线客服的会话结束预测方法得到会话结束预测模型;
将所述目标会话语句和所述目标会话时刻输入所述会话结束预测模型;
输出所述当前会话是否结束的目标概率值;
判断所述目标概率值是否大于预设阈值,若是,则结束与所述当前用户的当前会话。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的在线客服服务方法。
一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的在线客服服务方法的步骤。
一种在线客服的会话结束预测系统,所述会话结束预测系统包括历史数据获取模块、样本提取模块和训练模块;
所述历史数据获取模块用于获取多条历史会话日志数据,每条历史会话日志数据依次包括多个会话语句,所述多个会话语句包括起始语句和终止语句;
所述样本提取模块用于从所述每条历史会话日志数据中提取会话正样本和会话负样本,所述会话正样本包括所有的会话语句,所述会话负样本为以所述起始语句为起点的语句组合,所述语句组合的终点为除所述终止语句之外的任一会话语句;
所述训练模块用于将所述会话正样本和所述会话负样本作为训练数据输入至线性分类器,训练得到会话结束预测模型;
所述会话结束预测模型用于预测在线客服与用户的任一会话是否结束。
较佳地,所述会话结束预测系统还包括分词模块和特征向量生成模块;
所述分词模块用于分别对所述会话正样本和所述会话负样本进行分词处理,获得所述会话正样本的词特征和所述会话负样本的词特征;
所述特征向量生成模块用于根据所述会话正样本的词特征生成所述会话正样本的第一特征向量,还用于根据所述会话负样本的词特征生成所述会话负样本的第二特征向量;
所述训练模块用于将所述第一特征向量和所述第二特征向量作为所述训练数据输入至线性分类器得到所述会话结束预测模型。
较佳地,所述每条历史会话日志数据还包括每个会话语句的会话时刻,所述会话结束预测系统还包括时间特征获取模块和数量特征获取模块;
所述时间特征获取模块用于根据所述会话时刻获取所述历史会话日志数据的时间特征,所述时间特征包括用户相邻两个会话语句之间的时间间隔、在线客服相邻两个会话语句之间的时间间隔和会话总时长;
所述数量特征获取模块用于分别获取所述会话正样本和所述会话负样本的数量特征,所述数量特征包括会话正样本包含的会话语句的数量和词特征数量、会话负样本包含的会话语句的数量和词特征数量;
所述训练模块用于将所述第一特征向量、所述第二特征向量、所述时间特征和所述数量特征作为所述训练数据输入至线性分类器得到所述会话结束预测模型。
较佳地,所述会话结束预测系统还包括归一化模块;
所述归一化模块用于对所述时间特征和所述数量特征进行归一化处理;
所述训练模块用于使用归一化后的时间特征和归一化后的数量特征进行训练。
较佳地,所述线性分类器使用感知机模型、LDA模型、logistic回归模型和SVM模型中的至少一个模型进行训练。
一种在线客服服务系统,所述在线客服服务系统包括目标数据获取模块、目标概率值获取模块、判断模块和上述的在线客服的会话结束预测系统;
所述目标数据获取模块用于实时获取在线客服与当前用户在当前会话中的目标会话语句和每个目标会话语句的目标会话时刻;
所述会话结束预测系统用于获取会话结束预测模型;
所述目标概率值获取模块用于将所述目标会话语句和所述目标会话时刻输入所述会话结束预测模型,并输出所述当前会话是否结束的目标概率值;
所述判断模块用于判断所述目标概率值是否大于预设阈值,若是,则结束与所述当前用户的当前会话。
本发明实施例的积极进步效果在于:本发明实施例的会话结束预测方法通过对客服与用户聊天过程的会话语句的分析,科学的预测该通会话是否即将结束,进一步的,在实际应用中,能够精准的预测出即当前会话是否结束,从而自动断开与用户的连接,及时释放出空余的人工坐席,避免出现人工资源被长时间占用,而又不产生咨询的情况。
附图说明
图1为本发明实施例1的在线客服的会话结束预测方法的流程图。
图2为本发明实施例2的在线客服的会话结束预测方法的流程图.
图3为本发明实施例3的电子设备的结构示意图。
图4为本发明实施例5的在线客服服务方法的流程图。
图5为本发明实施例8的在线客服的会话结束预测系统的模块示意图。
图6为本发明实施例9的在线客服的会话结束预测系统的模块示意图。
图7为本发明实施例10的在线客服服务系统的模块示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
一种在线客服的会话结束预测方法,如图1所示,所述会话结束预测方法包括:
步骤11、获取多条历史会话日志数据;每条历史会话日志数据依次包括多个会话语句,所述多个会话语句包括起始语句和终止语句;
步骤12、从每条历史会话日志数据中提取会话正样本和会话负样本;所述会话正样本包括所有的会话语句,所述会话负样本为以所述起始语句为起点的语句组合,所述语句组合的终点为除所述终止语句之外的任一会话语句;
步骤13、将会话正样本和会话负样本作为训练数据输入至线性分类器,训练得到会话结束预测模型;所述会话结束预测模型用于预测在线客服与用户的任一会话是否结束。
其中,所述线性分类器使用但不限于使用感知机模型、LDA模型、logistic回归模型和SVM模型中的至少一个模型进行训练;需要说明的是,对于历史会话数据中会话正样本的提取,直接将该顾客所有的话拼到一起即可;对于负样本的提取,则有多种选取策略,假设一个顾客说了N句话的会话,可以选取N-1个负样本,可以只选取顾客第1句,也可以将顾客第1句第2句拼到一起作为负样本,也可以将顾客第1句、第2句、第3句拼到一起实际操作中,即随机在(0,n-1]前开后闭区间内选择结束位置,其中n代表会话中顾客说了几句话。
本实施例中,通过对客服与用户聊天过程的会话语句的分析,科学的预测该通会话是否即将结束,进一步的,在实际应用中,能够精准的预测出即当前会话是否结束,从而自动断开与用户的连接,及时释放出空余的人工坐席,避免出现人工资源被长时间占用,而又不产生咨询的情况。
实施例2
本实施例的在线客服的会话结束预测方法是在实施例1的基础上进一步改进,如图2所示,步骤13之前,所述会话结束预测方法还包括:
步骤121、分别对会话正样本和会话负样本进行分词处理,获得会话正样本的词特征和会话负样本的词特征;可以对于样本信息先泛化,再采用N-gram(语言模型)切词(N=2),切词之后的结果作为词特征。
步骤122、根据会话正样本的词特征生成会话正样本的第一特征向量;
步骤123、根据会话负样本的词特征生成会话负样本的第二特征向量;
本实施例中,所述每条历史会话日志数据还包括每个会话语句的会话时刻,步骤23之后,所述会话结束预测方法还包括:
步骤124、根据所述会话时刻获取所述历史会话日志数据的时间特征;所述时间特征包括用户相邻两个会话语句之间的时间间隔、在线客服相邻两个会话语句之间的时间间隔和会话总时长;
步骤125、分别获取所述会话正样本和所述会话负样本的数量特征;所述数量特征包括会话正样本包含的会话语句的数量和词特征数量、会话负样本包含的会话语句的数量和词特征数量;
步骤126、对所述时间特征和所述数量特征进行归一化处理;需要说明的是,为了为避免特征空间过大,针对时间特征和数量特征做归一化处理。
进一步的,步骤13具体包括:
步骤13'、将所述第一特征向量、所述第二特征向量、归一化后的时间特征和归一化后的数量特征作为所述训练数据输入至线性分类器得到所述会话结束预测模型。
另外,本实施例中,词特征通过比对词特征库得到对应的特征向量,若未包含在特征库中的词,则向量为0,以采用逻辑回归模型进行训练为例,最终选择词特征个数25000训练模型时准确率最高,因此,在训练模型时,对特征向量进行筛选,选取重要程度靠前的25000个词特征来进行模型训练得到会话结束预测模型。
本实施例中,通过分析顾客和用户对话过程,提取出一些关键的特征,再建立二分类模型,用以反映并衡量一通会话是否即将结束,进而在实际会话中,能够及时判断会话即将结束并及时释放人工坐席资源,让其他排队等待的顾客更快的得到服务,在节省人力成本的同时,也提升了客户咨询体验。
实施例3
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现实施例1或2所述的在线客服的会话结束预测方法。
图3为本实施例提供的一种电子设备的结构示意图。图3示出了适于用来实现本发明实施例实施方式的示例性电子设备90的框图。图3显示的电子设备90仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图3所示,电子设备90可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备90的组件可以包括但不限于:至少一个处理器91、至少一个存储器92、连接不同系统组件(包括存储器92和处理器91)的总线93。
总线93包括数据总线、地址总线和控制总线。
存储器92可以包括易失性存储器,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。
存储器92还可以包括具有一组(至少一个)程序模块924的程序工具925,这样的程序模块924包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理。
电子设备90也可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,电子设备90还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备90的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备90使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例4
一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1或2所述的在线客服的会话结束预测方法的步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明实施例还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1或2所述的在线客服的会话结束预测方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明实施例的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
实施例5
一种在线客服服务方法,如图4所示,所述在线客服服务方法包括:
步骤21、实时获取在线客服与当前用户在当前会话中的目标会话语句和每个目标会话语句的目标会话时刻;
步骤22、利用实施例1或2所述的在线客服的会话结束预测方法得到会话结束预测模型;
步骤23、将目标会话语句和目标会话时刻输入会话结束预测模型;
步骤24、输出当前会话是否结束的目标概率值;
步骤25、判断目标概率值是否大于预设阈值,若是,则执行步骤25,若否,则继续与客户的会话;
步骤26、结束与当前用户的当前会话。
本实施例中,通过对客服与用户聊天过程的会话语句及会话时间,利用训练好的模型对当前会话进行精准预测,一旦预测值大于预设阈值,则自动断开与用户的连接,及时释放出空余的人工坐席,避免出现人工资源被长时间占用,而又不产生咨询的情况。
实施例6
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现实施例5所述的在线客服服务方法。
实施例7
一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例5所述的在线客服服务方法的步骤。
实施例8
一种在线客服的会话结束预测系统,如图5所示,所述会话结束预测系统包括历史数据获取模块1、样本提取模块2和训练模块3;
所述历史数据获取模块1用于获取多条历史会话日志数据,每条历史会话日志数据依次包括多个会话语句,所述多个会话语句包括起始语句和终止语句;
所述样本提取模块2用于从所述每条历史会话日志数据中提取会话正样本和会话负样本,所述会话正样本包括所有的会话语句,所述会话负样本为以所述起始语句为起点的语句组合,所述语句组合的终点为除所述终止语句之外的任一会话语句;
所述训练模块3用于将所述会话正样本和所述会话负样本作为训练数据输入至线性分类器,训练得到会话结束预测模型;
所述会话结束预测模型用于预测在线客服与用户的任一会话是否结束。
其中,所述线性分类器使用但不限于使用感知机模型、LDA模型、logistic回归模型和SVM模型中的至少一个模型进行训练。
需要说明的是,对于历史会话数据中会话正样本的提取,直接将该顾客所有的话拼到一起即可;对于负样本的提取,则有多种选取策略,假设一个顾客说了N句话的会话,可以选取N-1个负样本,可以只选取顾客第1句,也可以将顾客第1句第2句拼到一起作为负样本,也可以将顾客第1句、第2句、第3句拼到一起实际操作中,即随机在(0,n-1]前开后闭区间内选择结束位置,其中n代表会话中顾客说了几句话。
本实施例中,通过对客服与用户聊天过程的会话语句的分析,科学的预测该通会话是否即将结束,进一步的,在实际应用中,能够精准的预测出即当前会话是否结束,从而自动断开与用户的连接,及时释放出空余的人工坐席,避免出现人工资源被长时间占用,而又不产生咨询的情况。
实施例9
本实施例的在线客服的会话结束预测方法是在实施例1的基础上进一步改进,如图6所示,所述会话结束预测系统还包括分词模块4和特征向量生成模块5;
所述分词模块4用于分别对所述会话正样本和所述会话负样本进行分词处理,获得所述会话正样本的词特征和所述会话负样本的词特征;可以对于样本信息先泛化,再采用N-gram切词(N=2),切词之后的结果作为词特征。
所述特征向量生成模块5用于根据所述会话正样本的词特征生成所述会话正样本的第一特征向量,还用于根据所述会话负样本的词特征生成所述会话负样本的第二特征向量;
所述每条历史会话日志数据还包括每个会话语句的会话时刻,参考图6,所述会话结束预测系统还包括时间特征获取模块6和数量特征获取模块7;
所述时间特征获取模块6用于根据所述会话时刻获取所述历史会话日志数据的时间特征,所述时间特征包括用户相邻两个会话语句之间的时间间隔、在线客服相邻两个会话语句之间的时间间隔和会话总时长;
所述数量特征获取模块7用于分别获取所述会话正样本和所述会话负样本的数量特征,所述数量特征包括会话正样本包含的会话语句的数量和词特征数量、会话负样本包含的会话语句的数量和词特征数量;
所述会话结束预测系统还包括归一化模块8;需要说明的是,为了为避免特征空间过大,针对时间特征和数量特征做归一化处理。
所述归一化模块8用于对所述时间特征和所述数量特征进行归一化处理;
所述训练模块3用于将所述第一特征向量、所述第二特征向量、归一化后的时间特征和归一化后的数量特征作为所述训练数据输入至线性分类器得到所述会话结束预测模型。
另外,本实施例中,词特征通过比对词特征库得到对应的特征向量,若未包含在特征库中的词,则向量为0,以采用逻辑回归模型进行训练为例,最终选择词特征个数25000训练模型时准确率最高,因此,在训练模型时,对特征向量进行筛选,选取重要程度靠前的25000个词特征来进行模型训练得到会话结束预测模型。
本实施例中,通过分析顾客和用户对话过程,提取出一些关键的特征,再建立二分类模型,用以反映并衡量一通会话是否即将结束,进而在实际会话中,能够及时判断会话即将结束并及时释放人工坐席资源,让其他排队等待的顾客更快的得到服务,在节省人力成本的同时,也提升了客户咨询体验。
实施例10
一种在线客服服务系统,如图7所示,所述在线客服服务系统包括目标数据获取模块101、目标概率值获取模块102、判断模块103和如实施例8或9所述的在线客服的会话结束预测系统;
所述目标数据获取模块101用于实时获取在线客服与当前用户在当前会话中的目标会话语句和每个目标会话语句的目标会话时刻;
所述会话结束预测系统用于获取会话结束预测模型;
所述目标概率值获取模块102用于将所述目标会话语句和所述目标会话时刻输入所述会话结束预测模型,并输出所述当前会话是否结束的目标概率值;
所述判断模块103用于判断所述目标概率值是否大于预设阈值,若是,则结束与所述当前用户的当前会话。本实施例中,通过对客服与用户聊天过程的会话语句及会话时间,利用训练好的模型对当前会话进行精准预测,一旦预测值大于预设阈值,则自动断开与用户的连接,及时释放出空余的人工坐席,避免出现人工资源被长时间占用,而又不产生咨询的情况。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。
Claims (16)
1.一种在线客服的会话结束预测方法,其特征在于,所述会话结束预测方法包括:
获取多条历史会话日志数据,每条历史会话日志数据依次包括多个会话语句,所述多个会话语句包括起始语句和终止语句;
从所述每条历史会话日志数据中提取会话正样本和会话负样本,所述会话正样本包括所有的会话语句,所述会话负样本为以所述起始语句为起点的语句组合,所述语句组合的终点为除所述终止语句之外的任一会话语句;
将所述会话正样本和所述会话负样本作为训练数据输入至线性分类器,训练得到会话结束预测模型;
所述会话结束预测模型用于预测在线客服与用户的任一会话是否结束。
2.如权利要求1所述的在线客服的会话结束预测方法,其特征在于,所述将所述会话正样本和所述会话负样本作为训练数据输入至线性分类器,训练得到会话结束预测模型的步骤之前,所述会话结束预测方法还包括:
分别对所述会话正样本和所述会话负样本进行分词处理,获得所述会话正样本的词特征和所述会话负样本的词特征;
根据所述会话正样本的词特征生成所述会话正样本的第一特征向量;
根据所述会话负样本的词特征生成所述会话负样本的第二特征向量;
所述将所述会话正样本和所述会话负样本作为训练数据输入至线性分类器,训练得到会话结束预测模型的步骤具体包括:
将所述第一特征向量和所述第二特征向量作为所述训练数据输入至线性分类器得到所述会话结束预测模型。
3.如权利要求2所述的在线客服的会话结束预测方法,其特征在于,所述每条历史会话日志数据还包括每个会话语句的会话时刻,所述分别对所述会话正样本和所述会话负样本进行分词处理,获得对应的特征词的步骤之后,所述会话结束预测方法还包括:
根据所述会话时刻获取所述历史会话日志数据的时间特征,所述时间特征包括用户相邻两个会话语句之间的时间间隔、在线客服相邻两个会话语句之间的时间间隔和会话总时长;
分别获取所述会话正样本和所述会话负样本的数量特征,所述数量特征包括会话正样本包含的会话语句的数量和词特征数量、会话负样本包含的会话语句的数量和词特征数量;
所述将所述第一特征向量和所述第二特征向量作为所述训练数据输入至线性分类器得到所述会话结束预测模型的步骤具体包括:
将所述第一特征向量、所述第二特征向量、所述时间特征和所述数量特征作为所述训练数据输入至线性分类器得到所述会话结束预测模型。
4.如权利要求3所述的在线客服的会话结束预测方法,其特征在于,所述将所述第一特征向量、所述第二特征向量、所述时间特征和所述数量特征作为所述训练数据输入至线性分类器得到所述会话结束预测模型的步骤之前,所述会话结束预测方法还包括:
对所述时间特征和所述数量特征进行归一化处理;
所述将所述第一特征向量、所述第二特征向量、所述时间特征和所述数量特征作为所述训练数据输入至线性分类器得到所述会话结束预测模型的步骤中,使用归一化后的时间特征和归一化后的数量特征进行训练。
5.如权利要求1-4中任意一项所述的在线客服的会话结束预测方法,其特征在于,所述线性分类器使用感知机模型、LDA模型、logistic回归模型和SVM模型中的至少一个模型进行训练。
6.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述的在线客服的会话结束预测方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至5任一项所述的在线客服的会话结束预测方法的步骤。
8.一种在线客服服务方法,其特征在于,所述在线客服服务方法包括:
实时获取在线客服与当前用户在当前会话中的目标会话语句和每个目标会话语句的目标会话时刻;
利用如权利要求1-5中任意一项所述的在线客服的会话结束预测方法得到会话结束预测模型;
将所述目标会话语句和所述目标会话时刻输入所述会话结束预测模型;
输出所述当前会话是否结束的目标概率值;
判断所述目标概率值是否大于预设阈值,若是,则结束与所述当前用户的当前会话。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求8所述的在线客服服务方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求8所述的在线客服服务方法的步骤。
11.一种在线客服的会话结束预测系统,其特征在于,所述会话结束预测系统包括历史数据获取模块、样本提取模块和训练模块;
所述历史数据获取模块用于获取多条历史会话日志数据,每条历史会话日志数据依次包括多个会话语句,所述多个会话语句包括起始语句和终止语句;
所述样本提取模块用于从所述每条历史会话日志数据中提取会话正样本和会话负样本,所述会话正样本包括所有的会话语句,所述会话负样本为以所述起始语句为起点的语句组合,所述语句组合的终点为除所述终止语句之外的任一会话语句;
所述训练模块用于将所述会话正样本和所述会话负样本作为训练数据输入至线性分类器,训练得到会话结束预测模型;
所述会话结束预测模型用于预测在线客服与用户的任一会话是否结束。
12.如权利要求11所述的在线客服的会话结束预测系统,其特征在于,所述会话结束预测系统还包括分词模块和特征向量生成模块;
所述分词模块用于分别对所述会话正样本和所述会话负样本进行分词处理,获得所述会话正样本的词特征和所述会话负样本的词特征;
所述特征向量生成模块用于根据所述会话正样本的词特征生成所述会话正样本的第一特征向量,还用于根据所述会话负样本的词特征生成所述会话负样本的第二特征向量;
所述训练模块用于将所述第一特征向量和所述第二特征向量作为所述训练数据输入至线性分类器得到所述会话结束预测模型。
13.如权利要求12所述的在线客服的会话结束预测系统,其特征在于,所述每条历史会话日志数据还包括每个会话语句的会话时刻,所述会话结束预测系统还包括时间特征获取模块和数量特征获取模块;
所述时间特征获取模块用于根据所述会话时刻获取所述历史会话日志数据的时间特征,所述时间特征包括用户相邻两个会话语句之间的时间间隔、在线客服相邻两个会话语句之间的时间间隔和会话总时长;
所述数量特征获取模块用于分别获取所述会话正样本和所述会话负样本的数量特征,所述数量特征包括会话正样本包含的会话语句的数量和词特征数量、会话负样本包含的会话语句的数量和词特征数量;
所述训练模块用于将所述第一特征向量、所述第二特征向量、所述时间特征和所述数量特征作为所述训练数据输入至线性分类器得到所述会话结束预测模型。
14.如权利要求13所述的在线客服的会话结束预测系统,其特征在于,所述会话结束预测系统还包括归一化模块;
所述归一化模块用于对所述时间特征和所述数量特征进行归一化处理;
所述训练模块用于使用归一化后的时间特征和归一化后的数量特征进行训练。
15.如权利要求11-14中任意一项所述的在线客服的会话结束预测系统,其特征在于,所述线性分类器使用感知机模型、LDA模型、logistic回归模型和SVM模型中的至少一个模型进行训练。
16.一种在线客服服务系统,其特征在于,所述在线客服服务系统包括目标数据获取模块、目标概率值获取模块、判断模块和如权利要求11-15中任意一项所述的在线客服的会话结束预测系统;
所述目标数据获取模块用于实时获取在线客服与当前用户在当前会话中的目标会话语句和每个目标会话语句的目标会话时刻;
所述会话结束预测系统用于获取会话结束预测模型;
所述目标概率值获取模块用于将所述目标会话语句和所述目标会话时刻输入所述会话结束预测模型,并输出所述当前会话是否结束的目标概率值;
所述判断模块用于判断所述目标概率值是否大于预设阈值,若是,则结束与所述当前用户的当前会话。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910016629.8A CN111416728B (zh) | 2019-01-08 | 2019-01-08 | 会话结束预测、在线客服服务的方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910016629.8A CN111416728B (zh) | 2019-01-08 | 2019-01-08 | 会话结束预测、在线客服服务的方法、系统、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111416728A true CN111416728A (zh) | 2020-07-14 |
CN111416728B CN111416728B (zh) | 2023-12-05 |
Family
ID=71492614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910016629.8A Active CN111416728B (zh) | 2019-01-08 | 2019-01-08 | 会话结束预测、在线客服服务的方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111416728B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112017629A (zh) * | 2020-07-15 | 2020-12-01 | 马上消费金融股份有限公司 | 语音机器人的会话控制方法及设备、存储介质 |
CN112102116A (zh) * | 2020-09-18 | 2020-12-18 | 携程计算机技术(上海)有限公司 | 基于旅游会话的输入预测方法、系统、设备及存储介质 |
CN112311561A (zh) * | 2019-07-26 | 2021-02-02 | 阿瓦亚管理有限合伙公司 | 增强的数字消息传递 |
CN116034427A (zh) * | 2021-08-27 | 2023-04-28 | 互动解决方案公司 | 使用计算机的会话支持方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105553833A (zh) * | 2015-12-30 | 2016-05-04 | 上海智臻智能网络科技股份有限公司 | 客服系统及其服务方法、机器人客服 |
CN105912111A (zh) * | 2016-04-06 | 2016-08-31 | 北京地平线机器人技术研发有限公司 | 人机交互中的结束语音对话的方法及语音识别装置 |
US20170024807A1 (en) * | 2015-07-24 | 2017-01-26 | Adobe Systems Incorporated | Identifying the End of an On-Line Cart Session |
CN106548368A (zh) * | 2016-10-14 | 2017-03-29 | 五邑大学 | 基于用户遗忘曲线的消费者意图识别方法 |
US20180114172A1 (en) * | 2016-10-20 | 2018-04-26 | International Business Machines Corporation | Online collaboration of task assignment |
CN109086329A (zh) * | 2018-06-29 | 2018-12-25 | 出门问问信息科技有限公司 | 基于话题关键词引导的进行多轮对话方法及装置 |
-
2019
- 2019-01-08 CN CN201910016629.8A patent/CN111416728B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170024807A1 (en) * | 2015-07-24 | 2017-01-26 | Adobe Systems Incorporated | Identifying the End of an On-Line Cart Session |
CN105553833A (zh) * | 2015-12-30 | 2016-05-04 | 上海智臻智能网络科技股份有限公司 | 客服系统及其服务方法、机器人客服 |
CN105912111A (zh) * | 2016-04-06 | 2016-08-31 | 北京地平线机器人技术研发有限公司 | 人机交互中的结束语音对话的方法及语音识别装置 |
CN106548368A (zh) * | 2016-10-14 | 2017-03-29 | 五邑大学 | 基于用户遗忘曲线的消费者意图识别方法 |
US20180114172A1 (en) * | 2016-10-20 | 2018-04-26 | International Business Machines Corporation | Online collaboration of task assignment |
CN109086329A (zh) * | 2018-06-29 | 2018-12-25 | 出门问问信息科技有限公司 | 基于话题关键词引导的进行多轮对话方法及装置 |
Non-Patent Citations (2)
Title |
---|
黄九鸣: "面向舆情分析和属性发现的网络文本挖掘技术研究", 《中国博士学位论文全文数据库》, pages 2 - 3 * |
黄浩;李兵;姜丹;: "基于m-Markov模型的交叉用户会话识别", 计算机科学, no. 3, pages 200 - 203 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112311561A (zh) * | 2019-07-26 | 2021-02-02 | 阿瓦亚管理有限合伙公司 | 增强的数字消息传递 |
CN112017629A (zh) * | 2020-07-15 | 2020-12-01 | 马上消费金融股份有限公司 | 语音机器人的会话控制方法及设备、存储介质 |
CN112017629B (zh) * | 2020-07-15 | 2021-12-21 | 马上消费金融股份有限公司 | 语音机器人的会话控制方法及设备、存储介质 |
CN112102116A (zh) * | 2020-09-18 | 2020-12-18 | 携程计算机技术(上海)有限公司 | 基于旅游会话的输入预测方法、系统、设备及存储介质 |
CN112102116B (zh) * | 2020-09-18 | 2024-05-24 | 携程计算机技术(上海)有限公司 | 基于旅游会话的输入预测方法、系统、设备及存储介质 |
CN116034427A (zh) * | 2021-08-27 | 2023-04-28 | 互动解决方案公司 | 使用计算机的会话支持方法 |
CN116034427B (zh) * | 2021-08-27 | 2024-02-20 | 互动解决方案公司 | 使用计算机的会话支持方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111416728B (zh) | 2023-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111416728B (zh) | 会话结束预测、在线客服服务的方法、系统、设备及介质 | |
CN108763499B (zh) | 基于智能语音的呼叫质检方法、装置、设备及存储介质 | |
CN109151218B (zh) | 通话语音质检方法、装置、计算机设备及存储介质 | |
CN110444198B (zh) | 检索方法、装置、计算机设备和存储介质 | |
US11038821B1 (en) | Chatbot artificial intelligence | |
US11545157B2 (en) | Speaker diartzation using an end-to-end model | |
US10965812B1 (en) | Analysis and classification of unstructured computer text for generation of a recommended conversation topic flow | |
US11544721B2 (en) | Supporting automation of customer service | |
CN111177186B (zh) | 基于问题检索的单句意图识别方法、装置和系统 | |
CN111613212A (zh) | 语音识别方法、系统、电子设备和存储介质 | |
CN111177350A (zh) | 智能语音机器人的话术形成方法、装置和系统 | |
US20210058844A1 (en) | Handoff Between Bot and Human | |
CN114639386A (zh) | 文本纠错及文本纠错词库构建方法 | |
CN112100339A (zh) | 用于智能语音机器人的用户意图识别方法、装置和电子设备 | |
CN117493529A (zh) | 基于自然语言模型的拟人对话方法、装置及电子设备 | |
CN117251559B (zh) | 基于自然语言大模型的工程标准规范获取方法及系统 | |
CN112463967A (zh) | 情绪预警方法、系统、设备及存储介质 | |
CN110704614B (zh) | 对应用中的用户群类型进行预测的信息处理方法及装置 | |
CN112434953A (zh) | 一种基于计算机数据处理的客服人员考核方法和装置 | |
CN112667791A (zh) | 潜在事件预测方法、装置、设备及存储介质 | |
US11144727B2 (en) | Evaluation framework for intent authoring processes | |
CN109165327B (zh) | 人机对话方法、装置及计算机可读存储介质 | |
CN111311186A (zh) | 工单创建方法、介质、装置和计算设备 | |
CN110910905A (zh) | 静音点检测方法及装置、存储介质、电子设备 | |
CN114239602A (zh) | 会话方法、装置和计算机程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210521 Address after: 100176 room 1004, 10th floor, building 1, 18 Kechuang 11th Street, Beijing Economic and Technological Development Zone, Daxing District, Beijing Applicant after: Beijing Huijun Technology Co.,Ltd. Address before: 100086 8th Floor, 76 Zhichun Road, Haidian District, Beijing Applicant before: BEIJING JINGDONG SHANGKE INFORMATION TECHNOLOGY Co.,Ltd. Applicant before: BEIJING JINGDONG CENTURY TRADING Co.,Ltd. |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |