CN114242069A - 人机客服的切换方法、装置、设备及存储介质 - Google Patents

人机客服的切换方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114242069A
CN114242069A CN202111533964.9A CN202111533964A CN114242069A CN 114242069 A CN114242069 A CN 114242069A CN 202111533964 A CN202111533964 A CN 202111533964A CN 114242069 A CN114242069 A CN 114242069A
Authority
CN
China
Prior art keywords
customer service
target
robot
intention
human
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111533964.9A
Other languages
English (en)
Inventor
梁华军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202111533964.9A priority Critical patent/CN114242069A/zh
Publication of CN114242069A publication Critical patent/CN114242069A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding

Abstract

本发明涉及人工智能领域,公开了一种人机客服的切换方法、装置、设备及存储介质,用于提高人工客服切入的及时性和人机客服切换的流畅度。所述人机客服的切换方法包括:接收机器人客服对话过程中的音视频流,并对音视频流进行语音识别,得到文本对话信息;对文本对话信息进行客户咨询意图识别,得到目标意图标签;判断目标意图标签是否满足预置人工接入条件;若目标意图标签满足预置人工接入条件,则连接目标人工坐席,并接收目标人工坐席的语音信号;将语音信号与机器人客服对话过程中的机器人客服形象合成,并通过机器人客服形象播放语音信号。此外,本发明还涉及区块链技术,目标意图标签可存储于区块链节点中。

Description

人机客服的切换方法、装置、设备及存储介质
技术领域
本发明涉及语音处理领域,尤其涉及一种人机客服的切换方法、装置、设备及存储介质。
背景技术
随着人工智能技术的不断发展,智能对话系统得到了广泛的应用,越来越多的场景将拟人AI客服代替人工客服来进行对话来收集客户信息和解答客户疑问。
通常,AI客服是通过预设的应答文本来应对客户提出的问题,但预设的应答文本存在不够灵活和覆盖场景有限的问题,在遇到客户提出的特殊问题时,容易出现答非所问的问题,此时,需要客户手动切换人工客服,这种转人工的方式会中断当前的AI对话流程,且无法实时监控客户遇到的问题,客服无法主动和及时介入,可见,现有的人工客服切换方式存在不及时和不顺畅的技术。
发明内容
本发明提供了一种人机客服的切换方法、装置、设备及存储介质,用于提高人工客服切入的及时性和人机客服切换的流畅度。
本发明第一方面提供了一种人机客服的切换方法,包括:
接收机器人客服对话过程中的音视频流,并对所述音视频流进行语音识别,得到文本对话信息;
对所述文本对话信息进行客户咨询意图识别,得到目标意图标签;
判断所述目标意图标签是否满足预置人工接入条件;
若所述目标意图标签满足预置人工接入条件,则连接目标人工坐席,并接收所述目标人工坐席的语音信号;
将所述语音信号与机器人客服对话过程中的机器人客服形象合成,并通过所述机器人客服形象播放所述语音信号。
可选的,在本发明第一方面的第一种实现方式中,所述接收机器人客服对话过程中的音视频流,并对所述音视频流进行语音识别,得到文本对话信息,包括:
接收机器人客服对话过程中的音视频流,并对所述音视频流进行解析,得到所述音视频流中的初始音频信号;
对所述初始音频信号进行环境音识别,得到噪声声源信息,并根据所述噪声声源信息对所述初始音频信号进行降噪处理,得到目标音频信号;
通过预置的语音识别模型,对所述目标音频信号进行语音识别,得到文本对话信息。
可选的,在本发明第一方面的第二种实现方式中,所述对所述文本对话信息进行客户咨询意图识别,得到目标意图标签,包括:
读取训练好的客户咨询意图识别模型,所述客户咨询意图识别模型包括卷积神经网络层和全连接层;
通过所述客户咨询意图识别模型中的卷积神经网络层对所述文本对话信息进行语义特征提取,得到语义特征信息;
通过所述客户咨询意图识别模型中的全连接层对所述语义特征信息进行意图分类,得到目标意图标签。
可选的,在本发明第一方面的第三种实现方式中,所述判断所述目标意图标签是否满足预置人工接入条件,包括:
获取机器人客服对话过程中的历史意图标签,并判断所述目标意图标签与所述历史意图标签的重复率是否大于预设重复率阈值,得到第一判断结果;
判断所述目标意图标签中是否包含切换人工意图标签,得到第二判断结果;
根据所述第一判断结果或所述第二判断结果,判断所述目标意图标签是否满足预置人工接入条件。
可选的,在本发明第一方面的第四种实现方式中,所述若所述目标意图标签满足预置人工接入条件,则连接目标人工坐席,并接收所述目标人工坐席的语音信号,包括:
若所述目标意图标签满足预置人工接入条件,则根据所述目标意图标签,从预置坐席列表中技能信息与所述目标意图标签对应的初始坐席列表;
获取所述初始坐席列表中各坐席的空闲状态信息,得到目标坐席列表,所述目标坐席列表用于指示处于空闲状态的坐席信息;
向所述目标坐席列表中对应的坐席发送人工接入请求,并对响应所述人工接入请求的目标人工坐席进行语音连接,得到所述目标人工坐席发送的语音信号,所述目标人工坐席为最快响应所述人工接入请求的坐席。
可选的,在本发明第一方面的第五种实现方式中,所述将所述语音信号与机器人客服对话过程中的机器人客服形象合成,并通过所述机器人客服形象播放所述语音信号,包括:
通过预设的语音合成算法,对所述语音信号进行音色转换,得到虚拟语音信号,所述虚拟语音信号为机器人客服对话过程中机器人客服音色的语音信号;
将所述虚拟语音信号设置为机器人客服的声源信息,并通过预置的三维动画模型生成所述机器人客服的语音播报动画,所述语音播报动画用于通过所述机器人客服形象播报所述虚拟语音信号。
可选的,在本发明第一方面的第六种实现方式中,在所述将所述语音信号与机器人客服对话过程中的机器人客服形象合成,并通过所述机器人客服形象播放所述语音信号之后,所述人机客服的切换方法还包括:
接收机器人客服切换请求,并通过所述机器人客服切换请求获取所述目标人工坐席上传的客户意图信息;
将所述客户意图信息转发至机器人客服,并接入所述机器人客服;
通过所述机器人客服生成所述客户意图信息对应的客户意图应对策略,并将所述客户意图应对策略下发至客户终端。
本发明第二方面提供了一种人机客服的切换装置,包括:
接收模块,用于接收机器人客服对话过程中的音视频流,并对所述音视频流进行语音识别,得到文本对话信息;
识别模块,用于对所述文本对话信息进行客户咨询意图识别,得到目标意图标签;
判断模块,用于判断所述目标意图标签是否满足预置人工接入条件;
切换模块,用于若所述目标意图标签满足预置人工接入条件,则连接目标人工坐席,并接收所述目标人工坐席的语音信号;
合成模块,用于将所述语音信号与机器人客服对话过程中的机器人客服形象合成,并通过所述机器人客服形象播放所述语音信号。
可选的,在本发明第二方面的第一种实现方式中,所述接收模块具体用于:
接收机器人客服对话过程中的音视频流,并对所述音视频流进行解析,得到所述音视频流中的初始音频信号;
对所述初始音频信号进行环境音识别,得到噪声声源信息,并根据所述噪声声源信息对所述初始音频信号进行降噪处理,得到目标音频信号;
通过预置的语音识别模型,对所述目标音频信号进行语音识别,得到文本对话信息。
可选的,在本发明第二方面的第二种实现方式中,所述识别模块具体用于:
读取训练好的客户咨询意图识别模型,所述客户咨询意图识别模型包括卷积神经网络层和全连接层;
通过所述客户咨询意图识别模型中的卷积神经网络层对所述文本对话信息进行语义特征提取,得到语义特征信息;
通过所述客户咨询意图识别模型中的全连接层对所述语义特征信息进行意图分类,得到目标意图标签。
可选的,在本发明第二方面的第三种实现方式中,所述判断模块具体用于:
获取机器人客服对话过程中的历史意图标签,并判断所述目标意图标签与所述历史意图标签的重复率是否大于预设重复率阈值,得到第一判断结果;
判断所述目标意图标签中是否包含切换人工意图标签,得到第二判断结果;
根据所述第一判断结果或所述第二判断结果,判断所述目标意图标签是否满足预置人工接入条件。
可选的,在本发明第二方面的第四种实现方式中,所述切换模块具体用于:
若所述目标意图标签满足预置人工接入条件,则根据所述目标意图标签,从预置坐席列表中技能信息与所述目标意图标签对应的初始坐席列表;
获取所述初始坐席列表中各坐席的空闲状态信息,得到目标坐席列表,所述目标坐席列表用于指示处于空闲状态的坐席信息;
向所述目标坐席列表中对应的坐席发送人工接入请求,并对响应所述人工接入请求的目标人工坐席进行语音连接,得到所述目标人工坐席发送的语音信号,所述目标人工坐席为最快响应所述人工接入请求的坐席。
可选的,在本发明第二方面的第五种实现方式中,所述合成模块具体用于:
通过预设的语音合成算法,对所述语音信号进行音色转换,得到虚拟语音信号,所述虚拟语音信号为机器人客服对话过程中机器人客服音色的语音信号;
将所述虚拟语音信号设置为机器人客服的声源信息,并通过预置的三维动画模型生成所述机器人客服的语音播报动画,所述语音播报动画用于通过所述机器人客服形象播报所述虚拟语音信号。
可选的,在本发明第二方面的第六种实现方式中,所述人机客服的切换装置还包括:
获取模块,用于接收机器人客服切换请求,并通过所述机器人客服切换请求获取所述目标人工坐席上传的客户意图信息;
转接模块,用于将所述客户意图信息转发至机器人客服,并接入所述机器人客服;
生成模块,用于通过所述机器人客服生成所述客户意图信息对应的客户意图应对策略,并将所述客户意图应对策略下发至客户终端。
本发明第三方面提供了一种人机客服的切换设备,包括:存储器和至少一个处理器,所述存储器中存储有计算机程序;所述至少一个处理器调用所述存储器中的所述计算机程序,以使得所述人机客服的切换设备执行上述的人机客服的切换方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行上述的人机客服的切换方法。
本发明提供的技术方案中,接收机器人客服对话过程中的音视频流,并对所述音视频流进行语音识别,得到文本对话信息;对所述文本对话信息进行客户咨询意图识别,得到目标意图标签;判断所述目标意图标签是否满足预置人工接入条件;若所述目标意图标签满足预置人工接入条件,则连接目标人工坐席,并接收所述目标人工坐席的语音信号;将所述语音信号与机器人客服对话过程中的机器人客服形象合成,并通过所述机器人客服形象播放所述语音信号。本发明实施例中,对机器人客服对话过程中的音视频流进行语音识别和客户咨询意图识别,得到用于指示客户咨询意向的目标意图标签,通过目标意图标签判断是否满足预置人工接入条件,从而判断是否接入人工坐席,而为了提高人工客服切入的流畅度,采用换对象不换前端形象的方式进行动画合成,将机器人客服的形象和人工客服的内核呈现在客户终端面前,即通过机器人客服形象播放目标人工坐席的语音信号。本发明可以提高人工客服切入的及时性和人机客服切换的流畅度。
附图说明
图1为本发明实施例中人机客服的切换方法的一个实施例示意图;
图2为本发明实施例中人机客服的切换方法的另一个实施例示意图;
图3为本发明实施例中人机客服的切换装置的一个实施例示意图;
图4为本发明实施例中人机客服的切换装置的另一个实施例示意图;
图5为本发明实施例中人机客服的切换设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种人机客服的切换方法、装置、设备及存储介质,用于提高人工客服切入的及时性和人机客服切换的流畅度。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
可以理解的是,本发明的执行主体可以为人机客服的切换装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中人机客服的切换方法的一个实施例包括:
101、接收机器人客服对话过程中的音视频流,并对音视频流进行语音识别,得到文本对话信息;
需要说明的是,在机器人客服对话过程中,机器人客服以虚拟动画的形象呈现在视频画面中,能够模拟人的肢体动作和面部表情,使客服形象更真实。在机器人客服对话过程中,呈现在客户面前的始终是机器人客服形象的动画视频,不同的是在后台实现机器人客服与人工客服的无感切换,当机器人客服无法解决客户提出的问题时,将客户提出的问题转发给人工客服终端,人工客服终端将客户问题的解决方案返回给机器人客服系统,再由机器人客服系统将解决方案返回给客户终端,此过程对于客户而言为无感切换过程,能够更高效地配置人工客服的接入时机,降低人工客服的无效占用率,优化客服资源配置,并且在人工客服接入的过程中训练机器人客服的应答能力,使机器人客服的智能程度提高。
在一种实施方式中,机器人客服对话过程中的音视频流包括机器人客服终端发送的音视频流和客户终端发送的音视频流(或音频流),即服务器可以仅对客户终端的音频进行采集,服务器需要获取客户终端的音频采集权限,通过客户终端的音频采集装置获取音频流,也可以对客户终端的音视频进行采集,服务器需要获取客户终端的音频采集权限和图像采集权限,通过客户终端的视频采集装置和音频采集装置获取音视频流,能够减少服务器的数据处理量,进而提高语音识别效率。
在一种实施方式中,服务器通过预置的语音识别算法对音视频流进行语音识别,其中,预置的语音识别算法包括基于动态时间规整(dynamic time warping,DTW)的语音识别算法、基于隐马尔可夫模型(hidden markov model,HMM)语音识别算法以及基于非参数模型的矢量量化(vector quantization,VQ)语音识别算法,具体不做限定。
102、对文本对话信息进行客户咨询意图识别,得到目标意图标签;
需要说明的是,目标意图标签用于指示具体应用场景中文本对话信息的意向信息,服务器通过训练好的客户咨询意图识别模型进行文本意向信息识别,从而得到目标意图标签,其中,客户咨询意图识别模型为自然语言处理(ntural language processing,NLP)模型,服务器将机器人客服对话过程中采集的对话文本信息设置为训练样本对初始的自然语言处理模型进行训练,从而得到训练好的客户咨询意图识别模型,客户咨询意图识别模型能够与具体的客服场景融合,使得目标意图标签与具体客服场景的融合度高,机器人客服效率高。
在一种实施方式中,目标意图标签还包括情感标签和非情感标签,服务器通过客户咨询意图识别模型进行文本情感倾向识别,得到情感标签,情感标签用于指示文本对话信息是否包含消极情绪情感。
103、判断目标意图标签是否满足预置人工接入条件;
在一种实施方式中,服务器对目标意图标签进行分类处理,得到目标意图标签中的情感标签和非情感标签,服务器再根据情感标签判断目标意图标签是否满足预置人工接入条件,预置人工接入条件包括:目标意图标签中的情感标签为消极情绪情感标签。若目标意图标签中的情感标签为消极情绪情感标签,即目标意图标签满足预置人工接入条件,则连接目标人工坐席,展开后续的人工介入程序,避免消极情绪对客户体验造成负面影响。
104、若目标意图标签满足预置人工接入条件,则连接目标人工坐席,并接收目标人工坐席的语音信号;
在一种实施方式中,若目标意图标签满足预置人工接入条件,则服务器向所有空闲坐席终端发送人工接入请求,空闲坐席终端接收到人工接入请求之后,可以进行响应,服务器将最快响应人工接入请求的空闲坐席终端设置为目标人工坐席,并将机器人客服与客户终端的历史对话记录发送至目标人工坐席终端,接入目标人工坐席终端,此时,目标人工坐席终端能够通过机器人客服形象与客服进行直接对话,即服务器接收目标人工坐席的语音信号,以解决机器人客服对话过程中机器人客服无法解决/识别的问题。
105、将语音信号与机器人客服对话过程中的机器人客服形象合成,并通过机器人客服形象播放语音信号。
在一种实施方式中,服务器对语音信号进行语音识别,得到目标文本信息,并通过预置的唇动模型生成目标文本信息对应的唇动参数,将唇动参数与预置机器人客服形象的面部动画模型合成,得到面部唇动动画,另外,服务器还对语音信号进行虚拟语音转换,得到机器人客服形象的目标语音信号,最后,通过面部唇动动画和目标语音信号,实时生成虚拟客服播报视频,以通过机器人客服形象播放语音信号,本实施方式能够提高人机客服切换的流畅度。
进一步地,服务器将目标意图标签存储于区块链数据库中,具体此处不做限定。
本发明实施例中,对机器人客服对话过程中的音视频流进行语音识别和客户咨询意图识别,得到用于指示客户咨询意向的目标意图标签,通过目标意图标签判断是否满足预置人工接入条件,从而判断是否接入人工坐席,而为了提高人工客服切入的流畅度,采用换对象不换前端形象的方式进行动画合成,将机器人客服的形象和人工客服的内核呈现在客户终端面前,即通过机器人客服形象播放目标人工坐席的语音信号。本发明可以提高人工客服切入的及时性和人机客服切换的流畅度。
请参阅图2,本发明实施例中人机客服的切换方法的另一个实施例包括:
201、接收机器人客服对话过程中的音视频流,并对音视频流进行语音识别,得到文本对话信息;
具体的,服务器接收机器人客服对话过程中的音视频流,并对音视频流进行解析,得到音视频流中的初始音频信号;服务器对初始音频信号进行环境音识别,得到噪声声源信息,并根据噪声声源信息对初始音频信号进行降噪处理,得到目标音频信号;服务器通过预置的语音识别模型,对目标音频信号进行语音识别,得到文本对话信息。
本实施例中,由于在客服通话过程中,客户所处的环境各式各样,难以限定,而嘈杂的环境音会导致语音识别的准确率降低,因此,为了提高语音识别模型的语音识别准确率,服务器对音视频流中的初始音频信号进行环境音识别,从而确定噪声声源信息,如人声噪声信息、持续低频噪声信息、持续高频噪声信息等,确定噪声声源信息之后,服务器通过预置的音乐分轨算法,将音频流中的噪声声源音轨删除,以对初始音频信号进行降噪处理,得到目标音频信号,本实施例能够提高语音识别的准确率,进而提高机器人客服的应答准确率。
202、对文本对话信息进行客户咨询意图识别,得到目标意图标签;
具体的,服务器读取训练好的客户咨询意图识别模型,客户咨询意图识别模型包括卷积神经网络层和全连接层;服务器通过客户咨询意图识别模型中的卷积神经网络层对文本对话信息进行语义特征提取,得到语义特征信息;服务器通过客户咨询意图识别模型中的全连接层对语义特征信息进行意图分类,得到目标意图标签。
本实施例中,客户咨询意图识别模型包括卷积神经网络层(convolutionalneural networks,CNN)和全连接层(fully connected layers,FC),卷积神经网络层用于对文本对话信息进行语义特征提取,得到语义特征信息,全连接层相当于一个分类器,用于将训练过程中学习到的分布式特征表示映射到样本标记空间,从而得到目标意图标签。本实施例通过神经网络模型进行客户咨询意图识别,能够提高客户意图识别的准确率。
203、获取机器人客服对话过程中的历史意图标签,并判断目标意图标签与历史意图标签的重复率是否大于预设重复率阈值,得到第一判断结果;
本实施例中,在实际的应用场景中,当客户重复咨询同一问题时,可以认定为机器人客服无法解决/识别客户问题,因此,服务器将意图标签的重复率作为人工接入条件之一,能够及时进行人工客服切换,并及时解决客户遇到的业务问题。历史意图标签是指历史机器人客服对话过程中生成的目标意图标签,第一判断结果用于指示目标意图标签与历史意图标签的重复率是否大于预设重复率阈值。
204、判断目标意图标签中是否包含切换人工意图标签,得到第二判断结果;
本实施例中,在实际的应用场景中,若客户直接要求接入人工客服,如文本对话信息包括“我要转人工服务”、“帮我转人工客服”、“接人工”等人工意图信息,或客户终端发送人工客服接入请求(如点击人工服务按钮),那么,目标意图标签中则包含切换人工意图标签,说明客户希望接入人工客服,此时,得到第二判断结果,第二判断结果用于指示目标意图标签中是否包含切换人工意图标签,本实施例能够提高人工客服切入的及时性。
205、根据第一判断结果或第二判断结果,判断目标意图标签是否满足预置人工接入条件;
本实施例中,结合第一判断结果或第二判断结果,判断目标意图标签是否满足预置人工接入条件,包括:判断第一判断结果是否满足预置人工接入条件,或判断第二判断结果是否满足预置人工接入条件。
在一种实施方式中,若目标意图标签与历史意图标签的重复率大于预设重复率阈值,或目标意图标签中是否包含切换人工意图标签,则确定目标意图标签满足预置人工接入条件。
206、若目标意图标签满足预置人工接入条件,则连接目标人工坐席,并接收目标人工坐席的语音信号;
具体的,若目标意图标签满足预置人工接入条件,则服务器根据目标意图标签,从预置坐席列表中技能信息与目标意图标签对应的初始坐席列表;服务器获取初始坐席列表中各坐席的空闲状态信息,得到目标坐席列表,所述目标坐席列表用于指示处于空闲状态的坐席信息;服务器向目标坐席列表中对应的坐席发送人工接入请求,并对响应人工接入请求的目标人工坐席进行语音连接,得到目标人工坐席发送的语音信号,目标人工坐席为最快响应人工接入请求的坐席。
本实施例中,为了更合理地分配人工坐席资源,并及时地响应客户的人工服务请求,服务器先对预置坐席列表中的坐席信息进行技能信息匹配,得到初始坐席列表,初始坐席列表包括与目标意图标签所指示的业务问题对应业务技能的坐席信息,服务器再从初始坐席列表中获取处于空闲状态的目标坐席列表,最后将人工接入请求发送给目标坐席列表中的所有坐席终端,目标坐席终端通过抢单模式响应人工接入请求,并将最快响应人工接入请求的坐席信息设置为目标人工坐席,接通目标人工坐席的语音连接,使得人工客服与客户成功通话,从而得到目标人工坐席(终端)发送的语音信号。本实施例能够提高人工客服切入的及时性和人机客服切换的流畅度。
207、将语音信号与机器人客服对话过程中的机器人客服形象合成,并通过机器人客服形象播放语音信号。
具体的,服务器通过预设的语音合成算法,对语音信号进行音色转换,得到虚拟语音信号,虚拟语音信号为机器人客服对话过程中机器人客服音色的语音信号;服务器将虚拟语音信号设置为机器人客服的声源信息,并通过预置的三维动画模型生成机器人客服的语音播报动画,语音播报动画用于通过机器人客服形象播报虚拟语音信号。
本实施例中,为了提高人机客服切换的流畅度,在整个客服对话过程中均采用机器人客服的形象和声音与客户交流,改变的仅是处理客户问题的客服对象(机器人客服或人工),此种设计方式对客户体验而言,能够无感地进行客服对象切换,提高服务效率的同时提高用户体验。对此,服务器接入目标人工坐席之后,服务器通过预设的语音合成算法对语音信号进行音色转换,从而得到机器人客服音色的虚拟语音信号,服务器再将虚拟语音信号设置为机器人客服的生源信息,并通过预置的三维动画模型生成机器人客服的语音播报动画,展示至客户终端。
进一步的,服务器接收机器人客服切换请求,并通过机器人客服切换请求获取目标人工坐席上传的客户意图信息;服务器将客户意图信息转发至机器人客服,并接入机器人客服;服务器通过机器人客服生成客户意图信息对应的客户意图应对策略,并将客户意图应对策略下发至客户终端。
本实施例中,为了更合理地分配人工坐席资源,在目标人工坐席完成机器人客服无法解决/识别的客户问题之后,目标人工坐席终端向服务器发送机器人客服切换请求,服务器接收机器人客服切换请求后,获取目标人工坐席上传的客户意图信息,如客户居住地址信息、客户咨询问题描述等机器人客服无法解决/识别的客户意图信息。接着,服务器将客户意图信息转发至机器人客服,并将当前客服对象转接至机器人客服,目标人工坐席退出当前客服对话过程,以接入其它的人工客服接入请求。服务器对客户意图信息进行客户意图应对策略生成,再通过机器人客服形象将客户意图应对策略下发至客户终端,本实施例实现人工客服切入机器人客服,使人工客服与机器人客服的切换方式更灵活。
本发明实施例中,对机器人客服对话过程中的音视频流进行语音识别和客户咨询意图识别,得到用于指示客户咨询意向的目标意图标签,若目标意图标签与历史意图标签的重复率大于预置重复率阈值,说明客户重复咨询同一问题,或目标意图标签中包含切换人工意图标签,说明客户希望接入人工客服,满足上述任意预置人工接入条件,则进行后续的人工接入流程。而为了提高人工客服切入的流畅度,采用换对象不换前端形象的方式进行动画合成,将机器人客服的形象和人工客服的内核呈现在客户终端面前,即通过机器人客服形象播放目标人工坐席的语音信号。本发明可以提高人工客服切入的及时性和人机客服切换的流畅度。
上面对本发明实施例中人机客服的切换方法进行了描述,下面对本发明实施例中人机客服的切换装置进行描述,请参阅图3,本发明实施例中人机客服的切换装置一个实施例包括:
接收模块301,用于接收机器人客服对话过程中的音视频流,并对所述音视频流进行语音识别,得到文本对话信息;
识别模块302,用于对所述文本对话信息进行客户咨询意图识别,得到目标意图标签;
判断模块303,用于判断所述目标意图标签是否满足预置人工接入条件;
切换模块304,用于若所述目标意图标签满足预置人工接入条件,则连接目标人工坐席,并接收所述目标人工坐席的语音信号;
合成模块305,用于将所述语音信号与机器人客服对话过程中的机器人客服形象合成,并通过所述机器人客服形象播放所述语音信号。
进一步地,将目标意图标签存储于区块链数据库中,具体此处不做限定。
本发明实施例中,对机器人客服对话过程中的音视频流进行语音识别和客户咨询意图识别,得到用于指示客户咨询意向的目标意图标签,通过目标意图标签判断是否满足预置人工接入条件,从而判断是否接入人工坐席,而为了提高人工客服切入的流畅度,采用换对象不换前端形象的方式进行动画合成,将机器人客服的形象和人工客服的内核呈现在客户终端面前,即通过机器人客服形象播放目标人工坐席的语音信号。本发明可以提高人工客服切入的及时性和人机客服切换的流畅度。
请参阅图4,本发明实施例中人机客服的切换装置的另一个实施例包括:
接收模块301,用于接收机器人客服对话过程中的音视频流,并对所述音视频流进行语音识别,得到文本对话信息;
识别模块302,用于对所述文本对话信息进行客户咨询意图识别,得到目标意图标签;
判断模块303,用于判断所述目标意图标签是否满足预置人工接入条件;
切换模块304,用于若所述目标意图标签满足预置人工接入条件,则连接目标人工坐席,并接收所述目标人工坐席的语音信号;
合成模块305,用于将所述语音信号与机器人客服对话过程中的机器人客服形象合成,并通过所述机器人客服形象播放所述语音信号。
可选的,所述接收模块301具体用于:
接收机器人客服对话过程中的音视频流,并对所述音视频流进行解析,得到所述音视频流中的初始音频信号;
对所述初始音频信号进行环境音识别,得到噪声声源信息,并根据所述噪声声源信息对所述初始音频信号进行降噪处理,得到目标音频信号;
通过预置的语音识别模型,对所述目标音频信号进行语音识别,得到文本对话信息。
可选的,所述识别模块302具体用于:
读取训练好的客户咨询意图识别模型,所述客户咨询意图识别模型包括卷积神经网络层和全连接层;
通过所述客户咨询意图识别模型中的卷积神经网络层对所述文本对话信息进行语义特征提取,得到语义特征信息;
通过所述客户咨询意图识别模型中的全连接层对所述语义特征信息进行意图分类,得到目标意图标签。
可选的,所述判断模块303具体用于:
获取机器人客服对话过程中的历史意图标签,并判断所述目标意图标签与所述历史意图标签的重复率是否大于预设重复率阈值,得到第一判断结果;
判断所述目标意图标签中是否包含切换人工意图标签,得到第二判断结果;
根据所述第一判断结果或所述第二判断结果,判断所述目标意图标签是否满足预置人工接入条件。
可选的,所述切换模块304具体用于:
若所述目标意图标签满足预置人工接入条件,则根据所述目标意图标签,从预置坐席列表中技能信息与所述目标意图标签对应的初始坐席列表;
获取所述初始坐席列表中各坐席的空闲状态信息,得到目标坐席列表,所述目标坐席列表用于指示处于空闲状态的坐席信息;
向所述目标坐席列表中对应的坐席发送人工接入请求,并对响应所述人工接入请求的目标人工坐席进行语音连接,得到所述目标人工坐席发送的语音信号,所述目标人工坐席为最快响应所述人工接入请求的坐席。
可选的,所述合成模块305具体用于:
通过预设的语音合成算法,对所述语音信号进行音色转换,得到虚拟语音信号,所述虚拟语音信号为机器人客服对话过程中机器人客服音色的语音信号;
将所述虚拟语音信号设置为机器人客服的声源信息,并通过预置的三维动画模型生成所述机器人客服的语音播报动画,所述语音播报动画用于通过所述机器人客服形象播报所述虚拟语音信号。
可选的,所述人机客服的切换装置还包括:
获取模块306,用于接收机器人客服切换请求,并通过所述机器人客服切换请求获取所述目标人工坐席上传的客户意图信息;
转接模块307,用于将所述客户意图信息转发至机器人客服,并接入所述机器人客服;
生成模块308,用于通过所述机器人客服生成所述客户意图信息对应的客户意图应对策略,并将所述客户意图应对策略下发至客户终端。
本发明实施例中,对机器人客服对话过程中的音视频流进行语音识别和客户咨询意图识别,得到用于指示客户咨询意向的目标意图标签,若目标意图标签与历史意图标签的重复率大于预置重复率阈值,说明客户重复咨询同一问题,或目标意图标签中包含切换人工意图标签,说明客户希望接入人工客服,满足上述任意预置人工接入条件,则进行后续的人工接入流程。而为了提高人工客服切入的流畅度,采用换对象不换前端形象的方式进行动画合成,将机器人客服的形象和人工客服的内核呈现在客户终端面前,即通过机器人客服形象播放目标人工坐席的语音信号。本发明可以提高人工客服切入的及时性和人机客服切换的流畅度。
上面图3和图4从模块化功能实体的角度对本发明实施例中的人机客服的切换装置进行详细描述,下面从硬件处理的角度对本发明实施例中人机客服的切换设备进行详细描述。
图5是本发明实施例提供的一种人机客服的切换设备的结构示意图,该人机客服的切换设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对人机客服的切换设备500中的一系列计算机程序操作。更进一步地,处理器510可以设置为与存储介质530通信,在人机客服的切换设备500上执行存储介质530中的一系列计算机程序操作。
人机客服的切换设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的人机客服的切换设备结构并不构成对人机客服的切换设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机设备,所述计算机设备包括存储器和处理器,存储器中存储有计算机可读计算机程序,计算机可读计算机程序被处理器执行时,使得处理器执行上述各实施例中的所述人机客服的切换方法的步骤。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得计算机执行所述人机客服的切换方法的步骤。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干计算机程序用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-onlymemory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种人机客服的切换方法,其特征在于,所述人机客服的切换方法包括:
接收机器人客服对话过程中的音视频流,并对所述音视频流进行语音识别,得到文本对话信息;
对所述文本对话信息进行客户咨询意图识别,得到目标意图标签;
判断所述目标意图标签是否满足预置人工接入条件;
若所述目标意图标签满足预置人工接入条件,则连接目标人工坐席,并接收所述目标人工坐席的语音信号;
将所述语音信号与机器人客服对话过程中的机器人客服形象合成,并通过所述机器人客服形象播放所述语音信号。
2.根据权利要求1所述的人机客服的切换方法,其特征在于,所述接收机器人客服对话过程中的音视频流,并对所述音视频流进行语音识别,得到文本对话信息,包括:
接收机器人客服对话过程中的音视频流,并对所述音视频流进行解析,得到所述音视频流中的初始音频信号;
对所述初始音频信号进行环境音识别,得到噪声声源信息,并根据所述噪声声源信息对所述初始音频信号进行降噪处理,得到目标音频信号;
通过预置的语音识别模型,对所述目标音频信号进行语音识别,得到文本对话信息。
3.根据权利要求1所述的人机客服的切换方法,其特征在于,所述对所述文本对话信息进行客户咨询意图识别,得到目标意图标签,包括:
读取训练好的客户咨询意图识别模型,所述客户咨询意图识别模型包括卷积神经网络层和全连接层;
通过所述客户咨询意图识别模型中的卷积神经网络层对所述文本对话信息进行语义特征提取,得到语义特征信息;
通过所述客户咨询意图识别模型中的全连接层对所述语义特征信息进行意图分类,得到目标意图标签。
4.根据权利要求1所述的人机客服的切换方法,其特征在于,所述判断所述目标意图标签是否满足预置人工接入条件,包括:
获取机器人客服对话过程中的历史意图标签,并判断所述目标意图标签与所述历史意图标签的重复率是否大于预设重复率阈值,得到第一判断结果;
判断所述目标意图标签中是否包含切换人工意图标签,得到第二判断结果;
根据所述第一判断结果或所述第二判断结果,判断所述目标意图标签是否满足预置人工接入条件。
5.根据权利要求1所述的人机客服的切换方法,其特征在于,所述若所述目标意图标签满足预置人工接入条件,则连接目标人工坐席,并接收所述目标人工坐席的语音信号,包括:
若所述目标意图标签满足预置人工接入条件,则根据所述目标意图标签,从预置坐席列表中技能信息与所述目标意图标签对应的初始坐席列表;
获取所述初始坐席列表中各坐席的空闲状态信息,得到目标坐席列表,所述目标坐席列表用于指示处于空闲状态的坐席信息;
向所述目标坐席列表中对应的坐席发送人工接入请求,并对响应所述人工接入请求的目标人工坐席进行语音连接,得到所述目标人工坐席发送的语音信号,所述目标人工坐席为最快响应所述人工接入请求的坐席。
6.根据权利要求1所述的人机客服的切换方法,其特征在于,所述将所述语音信号与机器人客服对话过程中的机器人客服形象合成,并通过所述机器人客服形象播放所述语音信号,包括:
通过预设的语音合成算法,对所述语音信号进行音色转换,得到虚拟语音信号,所述虚拟语音信号为机器人客服对话过程中机器人客服音色的语音信号;
将所述虚拟语音信号设置为机器人客服的声源信息,并通过预置的三维动画模型生成所述机器人客服的语音播报动画,所述语音播报动画用于通过所述机器人客服形象播报所述虚拟语音信号。
7.根据权利要求1-6中任一项所述的人机客服的切换方法,其特征在于,在所述将所述语音信号与机器人客服对话过程中的机器人客服形象合成,并通过所述机器人客服形象播放所述语音信号之后,所述人机客服的切换方法还包括:
接收机器人客服切换请求,并通过所述机器人客服切换请求获取所述目标人工坐席上传的客户意图信息;
将所述客户意图信息转发至机器人客服,并接入所述机器人客服;
通过所述机器人客服生成所述客户意图信息对应的客户意图应对策略,并将所述客户意图应对策略下发至客户终端。
8.一种人机客服的切换装置,其特征在于,所述人机客服的切换装置包括:
接收模块,用于接收机器人客服对话过程中的音视频流,并对所述音视频流进行语音识别,得到文本对话信息;
识别模块,用于对所述文本对话信息进行客户咨询意图识别,得到目标意图标签;
判断模块,用于判断所述目标意图标签是否满足预置人工接入条件;
切换模块,用于若所述目标意图标签满足预置人工接入条件,则连接目标人工坐席,并接收所述目标人工坐席的语音信号;
合成模块,用于将所述语音信号与机器人客服对话过程中的机器人客服形象合成,并通过所述机器人客服形象播放所述语音信号。
9.一种人机客服的切换设备,其特征在于,所述人机客服的切换设备包括:存储器和至少一个处理器,所述存储器中存储有计算机程序;
所述至少一个处理器调用所述存储器中的所述计算机程序,以使得所述人机客服的切换设备执行如权利要求1-7中任意一项所述的人机客服的切换方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述人机客服的切换方法。
CN202111533964.9A 2021-12-15 2021-12-15 人机客服的切换方法、装置、设备及存储介质 Pending CN114242069A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111533964.9A CN114242069A (zh) 2021-12-15 2021-12-15 人机客服的切换方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111533964.9A CN114242069A (zh) 2021-12-15 2021-12-15 人机客服的切换方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114242069A true CN114242069A (zh) 2022-03-25

Family

ID=80756311

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111533964.9A Pending CN114242069A (zh) 2021-12-15 2021-12-15 人机客服的切换方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114242069A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114882891A (zh) * 2022-07-08 2022-08-09 杭州远传新业科技股份有限公司 一种应用于tts的语音转换方法、装置、设备及介质
CN115174747A (zh) * 2022-06-15 2022-10-11 中邮消费金融有限公司 基于意图识别及画像智能匹配的外呼方法及系统
CN117711399A (zh) * 2024-02-06 2024-03-15 深圳市瑞得信息科技有限公司 一种交互式ai智能机器人控制方法与智能机器人

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115174747A (zh) * 2022-06-15 2022-10-11 中邮消费金融有限公司 基于意图识别及画像智能匹配的外呼方法及系统
CN114882891A (zh) * 2022-07-08 2022-08-09 杭州远传新业科技股份有限公司 一种应用于tts的语音转换方法、装置、设备及介质
CN117711399A (zh) * 2024-02-06 2024-03-15 深圳市瑞得信息科技有限公司 一种交互式ai智能机器人控制方法与智能机器人
CN117711399B (zh) * 2024-02-06 2024-05-03 深圳市瑞得信息科技有限公司 一种交互式ai智能机器人控制方法与智能机器人

Similar Documents

Publication Publication Date Title
CN114242069A (zh) 人机客服的切换方法、装置、设备及存储介质
WO2022048403A1 (zh) 基于虚拟角色的多模态交互方法、装置及系统、存储介质、终端
CN110298906B (zh) 用于生成信息的方法和装置
US5884267A (en) Automated speech alignment for image synthesis
KR102488530B1 (ko) 동영상을 생성하기 위한 방법 및 장치
US20200005781A1 (en) Human-machine interaction processing method and apparatus thereof
US20020007276A1 (en) Virtual representatives for use as communications tools
CN111050201B (zh) 数据处理方法、装置、电子设备及存储介质
CN112333179A (zh) 虚拟视频的直播方法、装置、设备及可读存储介质
US20230047858A1 (en) Method, apparatus, electronic device, computer-readable storage medium, and computer program product for video communication
WO2024011903A1 (zh) 一种视频生成方法及装置、计算机可读存储介质
CN110931042A (zh) 同声传译方法、装置、电子设备以及存储介质
CN113392201A (zh) 信息交互方法、装置、电子设备、介质和程序产品
CN112204565A (zh) 用于基于视觉背景无关语法模型推断场景的系统和方法
CN109241924A (zh) 基于互联网的多平台信息交互系统
CN113343831A (zh) 视频中说话人分类方法、装置、电子设备和存储介质
CN110503957A (zh) 一种基于图像去噪的语音识别方法及装置
CN116958342A (zh) 虚拟形象的动作生成方法、动作库的构建方法及装置
US20220301251A1 (en) Ai avatar-based interaction service method and apparatus
US20200234181A1 (en) Implementing training of a machine learning model for embodied conversational agent
CN111703278B (zh) 香氛释放方法、装置、车端、云端、系统和存储介质
CN117292022A (zh) 基于虚拟对象的视频生成方法、装置及电子设备
Mancini et al. Laugh when you’re winning
CN113314096A (zh) 语音合成方法、装置、设备和存储介质
JP7130290B2 (ja) 情報抽出装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination