CN114220461A - 客服话术的引导方法、装置、设备及存储介质 - Google Patents

客服话术的引导方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114220461A
CN114220461A CN202111532657.9A CN202111532657A CN114220461A CN 114220461 A CN114220461 A CN 114220461A CN 202111532657 A CN202111532657 A CN 202111532657A CN 114220461 A CN114220461 A CN 114220461A
Authority
CN
China
Prior art keywords
service
vector
call
emotion
customer service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111532657.9A
Other languages
English (en)
Inventor
张松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202111532657.9A priority Critical patent/CN114220461A/zh
Publication of CN114220461A publication Critical patent/CN114220461A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing

Abstract

本申请涉及人工智能技术领域,本申请公开了一种客服话术的引导方法、装置、设备及存储介质,通过将与客户端在线会话中的客户端的音频信息处理为由文本向量和情绪标识组成的通话文件;利用业务话术引导模型中的业务场景匹配层对文本向量匹配对应业务场景后,通过业务话术引导模型中的自然语言处理层基于通话文件进行话术预测,输出话术预测后的话术参考方案,利用了自然语言处理层中的自然语言理解对客户端的音频信息回复进行了预测,输出话术预测后的话术参考方案提供给客服,从而提高客服的服务效率,保证客户端的客户的服务体验。

Description

客服话术的引导方法、装置、设备及存储介质
技术领域
本申请涉及人工智能技术领域,尤其涉及一种客服话术的引导方法、装置、计算机设备及存储介质。
背景技术
随着各行业服务质量的提高,各大企业通过客户服务热线服务客户提高客户体验,而传统的客户服务热线的客服需要大量的话术培训和业务知识学习才能服务客户,避免在跟客户进行电话沟通的时候,由于准备工作的不足从而影响到客户体验。
部分公司通过在接入在线客服之前,需要客户输入相应的数字选项,进而选择相应的服务通道,匹配相应的在线客服与其进行在线会话。但是,仍存在客户输入数字与其要咨询或者需要办理的业务不配的情况,此时若重新接入其他在线客服的话,则需要耗费更多的等候时间,导致客服服务效率较低,客户体验感不好。
发明内容
本申请提供一种客服话术的引导方法、装置、计算机设备及存储介质,解决了现有技术客户在会话业务办理中,客服服务效率较低,用户体验感不好的问题。
第一方面,本申请实施例提供了一种客服话术的引导方法,包括:
在与客户端进行在线会话的过程中,对来自所述客户端的音频信息进行情绪识别,且对所述音频信息对应的文本内容进行向量转换,得到包含通话文本向量与情绪标识的通话文件;
将所述通话文件输入训练后的业务话术引导模型;所述业务话术引导模型包括业务场景匹配层和自然语言处理层;
通过所述业务场景匹配层基于所述通话文本向量进行业务分类,确定所述通话文本向量对应的业务场景;
通过所述自然语言处理层基于所述业务场景与所述情绪标识,进行话术预测,输出话术预测后的话术参考方案;所述话术参考方案用于引导与所述客户端进行在线会话。
第二方面,本申请实施例还提供了一种客服话术的引导装置,包括:
获取模块,在与客户端进行在线会话的过程中,对来自所述客户端的音频信息进行情绪识别,且对所述音频信息对应的文本内容进行向量转换,得到包含通话文本向量与情绪标识的通话文件;
输入模块,将所述通话文件输入训练后的业务话术引导模型;所述业务话术引导模型包括业务场景匹配层和自然语言处理层;
业务场景匹配模块,通过所述业务场景匹配层基于所述通话文本向量进行业务分类,确定所述通话文本向量对应的业务场景;
话术预测模块,通过所述自然语言处理层基于所述业务场景与所述情绪标识,进行话术预测,输出话术预测后的话术参考方案;所述话术参考方案用于引导与所述客户端进行在线会话。
第三方面,本申请实施例还提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述客服话术的引导方法的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述客服话术的引导方法的步骤。
本申请提供的客服话术的引导方法、装置、计算机设备及存储介质,其中,一种客服话术的引导方法,通过将与客户端在线会话中的客户端的音频信息处理为由文本向量和情绪标识组成的通话文件;利用业务话术引导模型中的业务场景匹配层对文本向量匹配对应业务场景后,通过业务话术引导模型中的自然语言处理层基于通话文件进行话术预测,输出话术预测后的话术参考方案,利用了自然语言处理层中的自然语言理解对客户端的音频信息回复进行了预测,输出话术预测后的话术参考方案提供给客服,从而提高客服的服务效率,保证客户端的客户的服务体验。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的一种客服话术的引导方法的应用环境示意图;
图2是本申请一实施例提供的一种客服话术的引导方法的实现流程图;
图3是本申请一实施例提供的一种客服话术的引导方法中步骤S10的流程图;
图4是本申请一实施例提供的一种客服话术的引导方法中步骤S40的流程图;
图5是本申请另一实施例提供的一种客服话术的引导方法中步骤S51-S54的流程图;
图6是本申请一实施例提供的客服话术的引导装置的结构示意图;
图7是本申请一实施例提供的计算机设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供的客服话术的引导方法,可应用在如图1示出的应用环境中。如图1所示,客户端(计算机设备)通过网络与服务器进行通信。其中,客户端(计算机设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
本实施例提供的客服话术的引导方法可以由服务端执行,例如,通过客户端将音频信息发送至服务端,服务端基于该音频信息,执行本实施例提供的客服话术的引导方法,进而得到话术预测后的话术参考方案,最后将该话术参考方案发送至客户端。
在图1之外的一些场景中,还可以是由客户端执行该客服话术的引导方法,直接根据客户端的音频信息,通过执行本实施例提供的客服话术的引导方法,得到话术预测后的话术参考方案,然后将该话术参考方案发送至服务端进行存储。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
可以理解地,自然语言处理(Natural Language Processing,NLP)是人工智能的一个子领域,以语言为对象,利用计算机技术来分析、理解和处理自然语言,把计算机作为语言研究的强大工具,在计算机的支持下对语言信息进行定量化的研究,并提供可供人与计算机之间能共同使用的语言描写。其中,还包括自然语言理解(NaturalLanguageUnderstanding,NLU)、自然语言生成(Natural LanguageGeneration,NLG)和对话管理器(Dialogue Management,DM)几个部分。
图2示出了本申请一实施例提供的客服话术的引导方法的实现流程图。如图2所示,提供一种客服话术的引导方法,其技术方案主要包括以下步骤S10-S40:
步骤S10、在与客户端进行在线会话的过程中,对来自所述客户端的音频信息进行情绪识别,且对所述音频信息对应的文本内容进行向量转换,得到包含通话文本向量与情绪标识的通话文件。
在步骤S10中,在与客户端进行在线会话的过程中,实时获取客户端的音频信息。这里,音频信息为单次会回合中的用户语音内容。例如,在与客户端建立在线会话后,客服与客户端之间能够进行通话,此时如果用户通过终端发送一次语音内容,则该语音内容即为音频信息。
在本实施例中,可以利用情绪识别技术通过音频信息中的声学特征,根据语音情感数据库识别出人物情绪,并设置为情绪标识。识别音频信息的文本内容,并将文本内容转换为业务话术引导模型能识别的通话文本向量,将情绪标识添加至通话文本向量后,得到用于预测话术的通话文件。
作为一个示例,在实现时对来自客户端的音频信息进行情绪识别,具体可以是先将音频信息转换成相应的声学特征图,利用已有的情绪识别模型根据该声学特征图进行情绪标识匹配,得到情绪标识。或者,对音频信息对应的文本内容进行情绪识别,得到语义情绪向量,然后结合声学特征的情绪识别,得到声学特征,利用相应的融合算法将语义情绪向量与声学特征进行融合后,对融合后的特征向量进行情绪标识的概率值匹配,进而得到情绪标识。
在本申请的所有实施例中,对音频信息对应的文本内容进行向量转换可以采用已有的向量转换策略实现。先对音频信息进行文本识别,得到相应的文本信息,然后按照向量转换策略将文本信息转换成对应的通话文本向量。然后将通话文本向量与情绪标识进行关联,得到音频信息对于的通话文件。
容易理解的是,实时通过客户的情绪和通话内容对客服进行话术引导,可以提高客服在应对不同业务问题时的对客户进行答复的准确性,同时减少了对于客服的培训成本。将根据通话文件预测得到的话术参考方案提供给客服进行客服话术引导,提供给客服的方式包括文字、图形和语音。
在一实施例中,音频信息为客服和客户之间沟通的通话语音音频信息,音频信息的格式可以根据需求设定,比如音频信息的语音取样的比特率为128kbps(千比特每秒),以有利于获取语音质量高的音频信息,所述音频信息可以采用双向通道录制方式,分别通过客户与客服的双方的声源进行录制,以保证音频信息的获取质量。
如图3所示,出了本实施例步骤S10的具体实现流程。作为一个示例,步骤S10中,包括:
步骤S101、对所述音频信息进行文本向量转换与声学特征识别,得到文本向量与声学特征;
步骤S102、若根据所述文本向量从预设的语义库中匹配出语义情绪标识,则将所述语义情绪标识与所述声学特征的声学情绪标识,作为情绪标识;
步骤S103、若根据所述文本向量不能从预设的语义库中匹配出语义情绪标识,则将所述声学特征的声学情绪标识作为情绪标识;
步骤S104、将所述情绪标识与所述文本向量关联,得到通话文件。
在步骤S101中,根据语音识别技术(Automatic Speech Recognition,ASR)将将所述音频信息进行语音转文字识别,得到通话文本,通过分词器将所述通话文本进行向量转换,得到向量文本。再通过对音频信息进行分帧得到多个对话片段,根据各对话片段的声学特征,得到对应的声学特征。
在一实施例中,利用word2vec算法作为分词器,word2vec算法为将词语转换成词嵌入向量的算法,将所述对话文本中的每个字或者词语进行向量转换,将向量转换后的字符嵌入向量和词嵌入向量进行拼接,得到所述向量文本,所述向量转换包括将字符转换成字符嵌入向量和将词语转换成词嵌入向量的转换过程,所述向量文本为包括字符嵌入向量和/或词嵌入向量的向量数组。
在另一实施例中,还可以通过独热编码对通话文本进行离散化处理,的带对应的向量文本。One-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。对于每一个特征,如果它有m个可能值,那么经过One-Hot编码后,就变成了m个二元特征。并且,这些特征互斥,每次只有一个激活。
可理解地,语音识别技术(Automatic Speech Recognition,ASR)就是把语音信号转变为相应的文本的技术,通过语音识别技术,可以将音频信息转换成文本内容,即对音频信息进行信号处理后,按帧(毫秒级)拆分出预设段的波形,并对拆分出的预设段波形按照人耳特征转换成多维向量信息,将转换后的多维向量信息进行识别出状态信息,在将状态信息组合成音素,最后将音素组成字词并串连成句的技术,识别过程为运用语音识别技术识别音频信息中音频包含的文本内容的过程,经过识别之后输出通话文本,通话文本为音频信息中的文本内容。
在步骤S102中,由于在沟通时,会产生部分语气词汇,通过这些语气词汇可直接利用对应的文本向量从预设的语义库中匹配出语义情绪标识,并利用匹配得到的语义情绪标识与声学特征的声学情绪标识,作为情绪标识以用于话术预测。
在步骤S103中,还会存在通过文本向量无法从预设的语义库中匹配出语义情绪标识,此时则根据提取出的声学特征利用语音情感识别技术识别出声学情绪标识作为情绪标识。
在一实施例中,利用语音情感识别技术对语音的声学特征进行提取,所提取的声学特征包括能量(energy)、音高(pitch)和梅尔频率倒谱系数(MFCC),再根据语音情感数据库进行分类识别,得到对应的情绪标识,常见基础情绪包括生气、高兴、害怕、悲伤、其他和中性。
在步骤S104中,将情绪标识与文本向量关联,作为预测话术的通话文件进行输出。结合情绪标识与文本向量进行话术引导预测,可以提高预测的准确性。
步骤S20、将所述通话文件输入训练后的业务话术引导模型。所述业务话术引导模型包括业务场景匹配层和自然语言处理层。
在步骤S20中,将通话文件输入训练后的业务话术引导模型进行话术预测,业务话术引导模型需要通过大量的样本进行训练以保证最后所挖掘出的人物特征的准确性。
在一实施例中,业务话术引导模型基于业务场景匹配层和自然语言处理层构建,业务场景匹配层根据通话文件进行业务场景的匹配,基于匹配后的业务场景,自然语言处理层根据通话文件进行话术预测,从而帮助客服进行话术引导。
在一实施例中,业务场景匹配层利用了分类算法,通过通话文件中的通话文本向量进行业务场景的分类预测,从而达到业务场景匹配的目的。其中,分类算法可以但不限于为以下算法,决策树分类算法、神经网络分类算法、支持向量机分类算法(SVM)、随机森林算法、逻辑回归算法(Logistic Regression,LR)和XGBoost算法。
步骤S30、通过所述业务场景匹配层对所述通话文本向量进行业务分类,确定所述通话文本向量对应的业务场景。
在步骤S30中,利用训练后的业务话术引导模型中的业务场景匹配层提取通话文件中与业务相关的多个业务特征向量,得到对应的业务特征向量集合,基于业务特征向量集合利用业务场景匹配层中的分类算法进行业务分类预测,匹配通话文本向量对应的业务场景。其中,业务场景匹配层需要利用业务资料库中的多个业务场景样本进行训练,以保证分类结果匹配对应的业务场景的准确性。
该实施例为通过所述业务场景匹配层基于所述通话文本向量进行业务分类,确定所述通话文本向量对应的业务场景的步骤S30,包括:
步骤S301、根据预先配置的包括多个停用文本向量的停用文本向量集合,从通话文本向量中剔除所述停用文本向量,得到业务特征向量集合;
步骤S302、利用所述业务场景匹配层中的决策树算法,将所述业务特征向量集合中各业务特征向量作为输入,通过所述决策树的结点传递顺序对各所述业务特征向量进行判断,得到的叶节点以确定所述通话文本向量对应的业务场景。
在步骤S301中,在客户与客服沟通中,沟通内容使用到多个字词,其中的字词包括停用字词,根据预先配置的停用文本向量集合也可以为停用文本库等。基于停用文本向量集合从通话文本向量中剔除多个停用文本向量,保留下的若干个业务特征向量,作为用于业务分类的业务特征向量集合。去除停用文本向量有利于提高分类的准确性。
可以理解地,停用词在通常意义上,停用词大致分为两类。一类是人类语言中包含的功能词,这些功能词极其普遍,与其他词相比,功能词没有什么实际含义,比如英文的“the、is、at、which、on”,中文的“了、呢、啊”。但是对于搜索引擎来说,当所要搜索的短语包含功能词,停用词的使用就会导致问题。另一类词包括词汇词,比如“want”等,这些词应用十分广泛,但是对这样的词搜索引擎无法保证能够给出真正相关的搜索结果,难以帮助缩小搜索范围,同时还会降低搜索的效率,所以通常会把这些词从问题中移去,从而提高搜索性能。
在步骤S302中,利用业务场景匹配层中的分类算法对业务特征向量集合进行业务分类,从而确定通话文本向量对应的业务场景。分类算法的发展逐渐成熟,利用分类算法对多个特征进行分类,从而保证分类的准确性。
在一实施例中,业务场景为不同业务的线上会话场景,以及对应业务的资料详情。通过业务场景匹配层对业务特征向量集合进行业务分类示例如下,若业务特征向量集合中业务特征向量所对应的业务特征文本内容为“了解、运动类、保障、费用”,通过上述业务特征文本内容进行业务场景匹配为“某运动类型保险”的业务场景。
在一实施例中,分类算法可以利用决策树算法进行业务分类,决策树算法是一种逼近离散函数值的方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后利用决策树根据业务特征向量从上往下的判断流程,根据业务特征向量的结点类别,分支成下一结点的判断与决策,如果结点不再是一个判断条件,而是一个叶节点,那么它就是一个分类决策。本实施例利用较为容易理解的方式进行示例,当所保留的业务特征向量所表征的业务特征为{了解、运动类、保障、费用},根据决策树利用信息熵训练后的业务特征权重进行依次判断,所获得的业务特征权重排序如下{运动类>了解>保障>费用};首先通过业务特征权重较大的{应用类型=运动类}作为根节点,其中结点类别包括{应用类型∈运动类、意外类、健康类};其次结点为{沟通需求=了解},其中结点类别包括{沟通需求∈了解、理赔、退保}以下结点所对应的结点类别不再一一赘述;再次结点为{应用需求=保障},最终得到的叶节点为{咨询方向=费用},并得出对应的分类结果“某运动类型保险的资费”
在另一实施例中,分类算法可以利用随机森林算法,随机森林是由很多决策树构成的,不同决策树之间没有关联。当进行分类任务时,新的输入样本进入,利用森林中的每一棵决策树,分别通过上一实施例决策树的分类方式进行判断和分类,每个决策树会得到一个自己的分类结果,决策树的分类结果中哪一个分类最多,那么随机森林就会把这个结果当做最终的结果。
可以理解地,随机森林算法(Random Forest,RF)为一种利用多个决策树对样本进行训练并预测的一种分类算法,它属于Bagging类型,通过组合多个弱分类器,最终结果通过投票或取均值,使得整体模型的结果具有较高的精确度和泛化性能。其可以取得不错成绩,主要归功于“随机”和“森林”,一个使它具有抗过拟合能力,一个使它更加精准。
步骤S40、通过所述自然语言处理层基于所述业务场景与所述情绪标识,进行话术预测,输出话术预测后的话术参考方案;所述话术参考方案用于引导与所述客户端进行在线会话。
在步骤S40中,自然语言处理目前还无法做到精确地对输入的自然语言进行回复,但是通过将其约束在某个业务范围内,则可以保证答复结果。基于匹配后的业务场景,利用自然语言处理层中的对话管理器,对通话文件进行决策预测匹配对应的话术策略,并将匹配到的话术策略所对应话术参考方案进行输出,及时为客服提供话术引导,以辅助客服进行业务话术的讲解,从而提客服的服务质量。
可以理解地,自然语言处理(Natural Language Processing,NLP)以语言为对象,利用计算机技术来分析、理解和处理自然语言,把计算机作为语言研究的强大工具,在计算机的支持下对语言信息进行定量化的研究,并提供可供人与计算机之间能共同使用的语言描写。其中,还包括自然语言理解(NaturalLanguage Understanding,NLU)、自然语言生成(Natural LanguageGeneration,NLG)和对话管理器(Dialogue Management,DM)几个部分。其中,自然语言理解就是将输入的句子或者语音识别结果转换成计算机能理解的表征,并进行意图识别和语义理解;对话管理器则是根据当前对话管理状态判断系统应采取的对话策略;自然语言生成是将系统转换为自然语言进行输出。
如图4所示,在通过所述自然语言处理层基于所述业务场景与所述情绪标识,进行话术预测,输出话术预测后的话术参考方案;所述话术参考方案用于引导与所述客户端进行在线会话的步骤S40中,包括:
步骤S401、基于所述业务场景利用所述自然语言处理层,根据所述通话文本向量和所述情绪标识进行客户端的意图预测;
步骤S402、根据所述意图预测后的意图预测结果从训练后的话术策略库中匹配对应的话术策略,得到至少一个话术策略向量;
步骤S403、将所述话术策略向量转换为文本,得到话术参考方案进行输出。
在步骤S401中,利用自然语言处理层中的自然语言理解对所输入的通话文件进行意图预测,根据通话文件中的情绪标识进行情感识别,且根据通话文本向量所对应的语言含义进行意图预测。意图预测就是通过对通话文件理解后,了解客户想要表达的语言含义。
在一实施例中,自然语言理解将通话文本向量还包括省略回复、指代消解和实体识别。
可以理解地,自然语言理解(Natural Language Understanding,NLU):使计算机理解自然语言,具体来说就是理解语言、文本,提取出有用的信息,用于下游的任务。它可以是使自然语言结构化,比如分词、词性标注、句法分析等;也可以是表征学习,字、词、句子的向量表示(Embedding),构建文本表示的文本分类。自然语言理解通过产生适合对话任务的语义表示,主要通过分词、词性标注、命名实体识别、句法分析、指代消解等进行语义解析产生句子意义进行意图识别,从中抽取槽的填充值,进而完成语义表示。
在步骤S402中,根据意图预测结果通过自然语言处理层中的对话管理器匹配对应的话术策略,得到对应的话术策略向量集合,该话术策略向量集合是话术参考方案的向量表征。其中话术参考方案包括业务上的话术内容,用以对客户的业务沟通进行业务话术引导,还包括情绪化书内容,根据客户的情绪进行相应的情绪安抚等的情感话术引导。对话管理器通过大量的该业务场景对话进行训练学习后,才能针对意图预测结果进行匹配,从而预测客户希望做的。
可以理解地,对话管理器(Dialog Management,DM)为对话系统的主体,控制着对话的架构和结构,接受从自然语言理解输入,维护一些状态,与任务管理器交互,并将输出传递给自然语言生成。其中,对话管理分为两个子模块,对话状态追踪(Dialogue StateTracking,DST)和对话策略学习(Dialogue Policy Learning,DPL)。
在步骤S403中,利用自然语言处理层的自然语言生成将话术策略向量集合进行文本转换,得到用于人类识别的话术参考方案输出至显示设备或播放设备,用于辅助客服的业务在线会话。
在一实施例中,将话术参考方案输出至显示设备,当话术参考方案中包括情感话术“先生您好,请您稍等,正在为您提供解决方案”,“先生请您先不要着急,正在为您办理业务”,业务话术“该方案流程为通过确认您的身份在线进行办理”。通过将以上话术参考方案,通过文字的方式展示在客服人员的显示设备,以对客服人员进行话术引导和话术实时培训。
可以理解地,自然语言生成(NLG)是语言技术的一个方面,侧重于从结构化数据或结构化表示(如知识库或逻辑形式)生成自然语言,选择需要向用户表达的概念,计划如何用词句表达这些概念,可以说一个NLG系统就像一个翻译器将数据转换成自然语言表示。
在另一实施例中,还可以通过语音合成技术(Text To Speech,TTS)将输出至客服人员的话术参考方案进行语音播报,客服人员在与客户沟通期间,将话术参考方案中的内容转化为对应的语音,通过播放设备播放给客服人员,从而引导客服与客户端进行在线会话。语音合成技术涉及声学、语言学、数学信号处理技术、多媒体技术等多个学科技术,通常用于把文字转换成自然流畅的语音输出。
图5是本申请另一实施例提供的一种人物特征的挖掘方法的流程图。如图5所示,与图2示出的实施例不同的是,在步骤S30、通过所述业务场景匹配层基于所述通话文本向量进行业务分类,确定所述通话文本向量对应的业务场景的步骤之前,还包括步骤S51-S54具体地:
步骤S51、获取多个业务场景样本,将所述业务场景样本中的业务相关词转化为业务特征向量,得到多个业务特征向量集合;
步骤S52、将所述业务特征向量集合输入所述业务场景匹配层,所述业务场景匹配层利用决策树算法中的决策树,根据多个所述业务特征向量进行逐一判断,从而训练对所述业务特征向量集合进行业务分类;
在一实施例中,通过多个业务场景样本对业务场景匹配层进行训练,通过将业务场景样本中的业务相关词转化为业务特征向量,利用随机森林算法根据业务特征向量集合进行业务场景的分类学习,以保证业务场景分类的准确性。其中,随机森林算法对业务特征向量集合进行有放回的抽样,每次从原来的N个训练样本中有放回地随机抽取N个样本,得到多个样本集。从候选的特征中随机抽取m个特征,作为当前决策的备选特征,用业务特征向量集合作为训练样本构造决策树,决策树通过对多个业务特征向量集合中的业务特征向量进行测算得到各业务特征向量的权重,训练后的决策树根据输入的业务特征向量集合中的业务特征向量做出预测,进行输出。在得到所需数目的决策树后,随机森林方法对这些决策树的输出进行投票,以得票最多的类作为随机森林的决策,从而确定业务特征向量集合所对应的业务场景。
可以理解地,随机森林算法是一种监督学习算法,随机森林就是建立很多决策树,组成一个决策树的“森林”,通过多棵树投票来进行决策。这种方法能够有效地提高对新样本的分类准确度。随机森林在以决策树为基学习器构建Bagging集成(样本的随机选取)的基础上,进一步在决策树的训练过程中引入随机属性选择。具体来说,传统决策树在选择划分属性时是在当前结点的属性集合中选择一个最优属性;而在随机森林中,对基决策树的每个结点,先从该结点的属性集合中随机选择一个包含若干个属性的子集,然后在从这个子集中选择一个最优属性用于划分。
步骤S53、将获取的各个业务场景下的业务沟通样本进行角色划分,将得到包括客服会话和客户会话的在线会话样本集合;
步骤S54、将所述在线会话样本集合输入所述自然语言处理层中的对话管理器,利用所述对话管理器学习各个业务场景下匹配对应的所述话术策略。
在一实施例中,通过获取各业务场景下的历史沟通记录作为业务沟通样本,并将业务沟通样本进行角色划分后作为在线会话样本集合输入自然语言处理层,通过利用自然语言处理层中的对话管理器学习各个业务场景下匹配对应的话术策略,从而保证对客服的在线会话业务的辅助。
可以理解地,利用对话策略学习子模块学习根据通话文件匹配对应的话术策略。其中,对话管理器包括对话状态追踪(Dialogue State Tracking,DST)和对话策略学习(Dialogue Policy Learning,DPL),而对话策略学习子模块DPL可以为深度强化学习,深度强化学习所使用算法可以利用卷积神经网络、长短期记忆网络、循环神经网络等。
可以理解地,长短期记忆网络(Long Short-term Memory,LSTM)基于传统RNN(RecurrentNeural Networks)网络改进的变种网络,能很好地解决梯度爆炸(explodinggradient)和梯度消失(vanishing gradient)问题,让循环网络具备更强更好的记忆性能。
在步骤S40、所述通过所述自然语言处理层基于所述业务场景与所述情绪标识,进行话术预测,输出话术预测后的话术参考方案;所述话术参考方案用于引导与所述客户端进行在线会话的步骤之后,还包括再一实施例步骤S51-S54,具体地::
步骤S61、获取与客户端在线会话完成后的音频记录文件,运用语音分割算法对所述音频记录文件进行客服音频提取,得到客服音频信息;
步骤S62、对客服音频信息进行情绪识别,且对所述客服音频信息对应的文本内容进行向量转换,得到包含客服通话文本向量与客服情绪标识的客服通话文件。
在一实施例中,通过保留客服与客户之间的会话完成后的音频记录文件,根据客服音频信息进行客服的服务质检。其中,客服音频信息可以根据录制生源的不同进行直接区分,从而得到客服音频信息;还可以运用语音分割算法对所述音频记录文件进行客服声学特征提取,根据提取的客服声学特征输入音频角色分割模型,识别出所述音频记录文件中的客服音频和客户音频,得到客服音频信息;分割出客服的音频信息,并进行音频识别得到包含客服通话文本向量与客服情绪标识的客服通话文件。通过对客服通话文件的情绪和所回答话术进行识别,进行客服的服务质检。
在另一实施例中,客服与客户之间的会话完成后的音频记录文件进行利用客服声学特征进行语音角色分割后,作为在线会话样本用于训练业务话术引导模型。
在一实施例中,提供一种客服话术的引导装置,该客服话术的引导装置与上述实施例中客服话术的引导方法一一对应。如图6所示,该客服话术的引导装置包括获取模块11、输入模块12、业务场景匹配模块13和话术预测模块14,各功能模块详细说明如下:
获取模块11,在与客户端进行在线会话的过程中,对来自所述客户端的音频信息进行情绪识别,且对所述音频信息对应的文本内容进行向量转换,得到包含通话文本向量与情绪标识的通话文件;
输入模块12,将所述通话文件输入训练后的业务话术引导模型;所述业务话术引导模型包括业务场景匹配层和自然语言处理层;
业务场景匹配模块13,通过所述业务场景匹配层对所述通话文本向量进行业务分类14,确定所述通话文本向量对应的业务场景;
话术预测模块,通过所述自然语言处理层基于所述业务场景与所述情绪标识,进行话术预测,输出话术预测后的话术参考方案;所述话术参考方案用于引导客服与所述客户端进行在线会话。
关于客服话术的引导装置的具体限定可以参见上文中对于客服话术的引导方法的限定,在此不再赘述。上述客服话术的引导装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是客户端或者服务端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括可读存储介质、内存储器。该可读存储介质存储有操作系统、计算机程序和数据库。该内存储器为可读存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种客服话术的引导方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中客服话术的引导方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中客服话术的引导方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种客服话术的引导方法,其特征在于,包括:
在与客户端进行在线会话的过程中,对来自所述客户端的音频信息进行情绪识别,且对所述音频信息对应的文本内容进行向量转换,得到包含通话文本向量与情绪标识的通话文件;
将所述通话文件输入训练后的业务话术引导模型;所述业务话术引导模型包括业务场景匹配层和自然语言处理层;
通过所述业务场景匹配层对所述通话文本向量进行业务分类,确定所述通话文本向量对应的业务场景;
通过所述自然语言处理层基于所述业务场景与所述情绪标识,进行话术预测,输出话术预测后的话术参考方案;所述话术参考方案用于引导客服与所述客户端进行在线会话。
2.如权利要求1所述的客服话术的引导方法,其特征在于,所述对来自所述客户端的音频信息进行情绪识别,且对所述音频信息对应的文本内容进行向量转换,得到包含通话文本向量与情绪标识的通话文件,包括:
对所述音频信息进行文本向量转换与声学特征识别,得到文本向量与声学特征;
若根据所述文本向量从预设的语义库中匹配出语义情绪标识,则将所述语义情绪标识与所述声学特征的声学情绪标识,作为情绪标识;
若根据所述文本向量不能从预设的语义库中匹配出语义情绪标识,则将所述声学特征的声学情绪标识作为情绪标识;
将所述情绪标识与所述文本向量关联,得到通话文件。
3.如权利要求1所述的客服话术的引导方法,其特征在于,所述通过所述业务场景匹配层基于所述通话文本向量进行业务分类,确定所述通话文本向量对应的业务场景,包括:
根据预先配置的包括多个停用文本向量的停用文本向量集合,从通话文本向量中剔除所述停用文本向量,得到业务特征向量集合;
利用所述业务场景匹配层中的决策树算法,将所述业务特征向量集合中各业务特征向量作为输入,通过所述决策树的结点传递顺序对各所述业务特征向量进行判断,得到的叶节点以确定所述通话文本向量对应的业务场景。
4.如权利要求1所述的客服话术的引导方法,其特征在于,所述通过所述自然语言处理层基于所述业务场景与所述情绪标识,进行话术预测,输出话术预测后的话术参考方案;所述话术参考方案用于引导与所述客户端进行在线会话,包括:
基于所述业务场景利用所述自然语言处理层根据所述通话文本向量和所述情绪标识进行客户端的意图预测;
根据所述意图预测后的意图预测结果从训练后的话术策略库中匹配对应的话术策略,得到至少一个话术策略向量;
将所述话术策略向量转换为文本,得到话术参考方案进行输出。
5.如权利要求1所述的客服话术的引导方法,其特征在于,在所述通过所述自然语言处理层基于所述业务场景与所述情绪标识,进行话术预测,输出话术预测后的话术参考方案;所述话术参考方案用于引导与所述客户端进行在线会话的步骤之后,还包括:
获取与客户端在线会话完成后的音频记录文件,运用语音分割算法对所述音频记录文件进行客服音频提取,得到客服音频信息;
对客服音频信息进行情绪识别,且对所述客服音频信息对应的文本内容进行向量转换,得到包含客服通话文本向量与客服情绪标识的客服通话文件。
6.如权利要求1所述的客服话术的引导方法,其特征在于,在所述通过所述业务场景匹配层基于所述通话文本向量进行业务分类,确定所述通话文本向量对应的业务场景的步骤之前,还包括:
获取多个业务场景样本,将所述业务场景样本中的业务相关词转化为业务特征向量,得到多个业务特征向量集合;
将所述业务特征向量集合输入所述业务场景匹配层,所述业务场景匹配层利用决策树算法中的决策树,根据多个所述业务特征向量进行逐一判断,从而训练对所述业务特征向量集合进行业务分类。
7.如权利要求1所述的客服话术的引导方法,其特征在于,在所述通过所述业务场景匹配层基于所述通话文本向量进行业务分类,确定所述通话文本向量对应的业务场景的步骤之前,还包括:
将获取的各个业务场景下的业务沟通样本进行角色划分,将得到包括客服会话和客户会话的在线会话样本集合;
将所述在线会话样本集合输入所述自然语言处理层中的对话管理器,利用所述对话管理器学习各个业务场景下匹配对应的所述话术策略。
8.一种客服话术的引导装置,其特征在于,包括:
获取模块,在与客户端进行在线会话的过程中,对来自所述客户端的音频信息进行情绪识别,且对所述音频信息对应的文本内容进行向量转换,得到包含通话文本向量与情绪标识的通话文件;
输入模块,将所述通话文件输入训练后的业务话术引导模型;所述业务话术引导模型包括业务场景匹配层和自然语言处理层;
业务场景匹配模块,通过所述业务场景匹配层对所述通话文本向量进行业务分类,确定所述通话文本向量对应的业务场景;
话术预测模块,通过所述自然语言处理层基于所述业务场景与所述情绪标识,进行话术预测,输出话术预测后的话术参考方案;所述话术参考方案用于引导客服与所述客户端进行在线会话。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述客服话术的引导方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述客服话术的引导方法。
CN202111532657.9A 2021-12-15 2021-12-15 客服话术的引导方法、装置、设备及存储介质 Pending CN114220461A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111532657.9A CN114220461A (zh) 2021-12-15 2021-12-15 客服话术的引导方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111532657.9A CN114220461A (zh) 2021-12-15 2021-12-15 客服话术的引导方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114220461A true CN114220461A (zh) 2022-03-22

Family

ID=80702235

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111532657.9A Pending CN114220461A (zh) 2021-12-15 2021-12-15 客服话术的引导方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114220461A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114218392A (zh) * 2022-02-22 2022-03-22 浙商期货有限公司 面向期货问答的用户意图识别方法和系统
CN116361429A (zh) * 2023-01-19 2023-06-30 北京伽睿智能科技集团有限公司 一种业务异常员工管理方法、系统、设备及存储介质
CN116662503A (zh) * 2023-05-22 2023-08-29 深圳市新美网络科技有限公司 私域用户场景话术推荐方法及其系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114218392A (zh) * 2022-02-22 2022-03-22 浙商期货有限公司 面向期货问答的用户意图识别方法和系统
CN116361429A (zh) * 2023-01-19 2023-06-30 北京伽睿智能科技集团有限公司 一种业务异常员工管理方法、系统、设备及存储介质
CN116361429B (zh) * 2023-01-19 2024-02-02 北京伽睿智能科技集团有限公司 一种业务异常员工管理方法、系统、设备及存储介质
CN116662503A (zh) * 2023-05-22 2023-08-29 深圳市新美网络科技有限公司 私域用户场景话术推荐方法及其系统
CN116662503B (zh) * 2023-05-22 2023-12-29 深圳市新美网络科技有限公司 私域用户场景话术推荐方法及其系统

Similar Documents

Publication Publication Date Title
US11676067B2 (en) System and method for creating data to train a conversational bot
CN107657017B (zh) 用于提供语音服务的方法和装置
US10909328B2 (en) Sentiment adapted communication
EP3582119A1 (en) Spoken language understanding system and method using recurrent neural networks
CN114220461A (zh) 客服话术的引导方法、装置、设备及存储介质
WO2021190259A1 (zh) 一种槽位识别方法及电子设备
CN113343108B (zh) 推荐信息处理方法、装置、设备及存储介质
CN111897935A (zh) 基于知识图谱的话术路径选择方法、装置和计算机设备
CN113254613A (zh) 对话问答方法、装置、设备及存储介质
CN115640530A (zh) 一种基于多任务学习的对话讽刺和情感联合分析方法
CN112100339A (zh) 用于智能语音机器人的用户意图识别方法、装置和电子设备
CN115455982A (zh) 对话处理方法、装置、电子设备及存储介质
US11615787B2 (en) Dialogue system and method of controlling the same
Dyriv et al. The user's psychological state identification based on Big Data analysis for person's electronic diary
CN110931002B (zh) 人机交互方法、装置、计算机设备和存储介质
CN113836945A (zh) 意图识别方法、装置、电子设备和存储介质
CN113918710A (zh) 文本数据处理方法、装置、电子设备和可读存储介质
CN114330285B (zh) 语料处理方法、装置、电子设备及计算机可读存储介质
CN111554300B (zh) 音频数据处理方法、装置、存储介质及设备
CN114038451A (zh) 对话数据的质检方法、装置、计算机设备及存储介质
CN115050351A (zh) 生成时间戳的方法、装置及计算机设备
CN114528851A (zh) 回复语句确定方法、装置、电子设备和存储介质
Tripathi et al. CycleGAN-Based Speech Mode Transformation Model for Robust Multilingual ASR
Jiang et al. Audio public opinion analysis model based on heterogeneous neural network
CN113158052B (zh) 聊天内容推荐方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination