CN113422875B - 语音坐席的应答方法、装置、设备及存储介质 - Google Patents
语音坐席的应答方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113422875B CN113422875B CN202110690101.6A CN202110690101A CN113422875B CN 113422875 B CN113422875 B CN 113422875B CN 202110690101 A CN202110690101 A CN 202110690101A CN 113422875 B CN113422875 B CN 113422875B
- Authority
- CN
- China
- Prior art keywords
- voice
- information
- interval
- unit
- client
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000012549 training Methods 0.000 claims abstract description 34
- 230000003993 interaction Effects 0.000 claims abstract description 22
- 238000005516 engineering process Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000006854 communication Effects 0.000 abstract description 9
- 238000004891 communication Methods 0.000 abstract description 7
- 239000003795 chemical substances by application Substances 0.000 description 32
- 239000000463 material Substances 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5166—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Marketing (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Machine Translation (AREA)
Abstract
本发明提供一种语音坐席的应答方法、装置、设备及存储介质,该方法包括:在与客户语音交互时,首先,获取客户的语音信息,并将语音信息放入语音节点判断模型;其中,语音节点判断模型通过输入训练数据不断迭代优化;训练数据至少包括语音训练样本的语音特征和语音节点位置信息;然后,利用语音节点判断模型预测语音信息的语义完结点,并截取两个语义完结点之间的语音信息,得到语音区间;最终,提取语音区间中的客户问题,并将客户问题发送至第三方系统,获取第三方系统反馈的多条答复信息,并显示答复信息,以供坐席员参考并答复客户,实现坐席员与客户之间高质量、高效率的沟通交互的目的。
Description
技术领域
本发明涉及呼叫中心与知识库技术领域,尤其涉及一种语音坐席的应答方法、装置、设备及存储介质。
背景技术
近年来,客户与银行之间的关系越来越密切,当客户想要了解一些与银行相关的事情时,往往会通过电话来联系银行。客户拨打的电话接通后,是由坐席员和客户沟通交互,当客户对一些问题提出疑问时,坐席员需要根据客户提出的问题去搜索相关文档资料,然后答复客户的问题,这样的沟通过程比较依赖坐席员的工作经验,且人工搜索相关资料的方式工作效率较低,客户等待时间会比较长,影响客户体验。
由此可知,目前亟需一种语音坐席智能答复方式实现坐席员与客户之间高质量、高效率的沟通交互。
发明内容
有鉴于此,本发明实施例提供一种语音坐席的应答方法、装置、设备及存储介质,以实现坐席员与客户之间高质量、高效率的沟通交互的目的。
为实现上述目的,本发明实施例提供如下技术方案:
本申请第一方面提供一种语音坐席的应答方法,包括:
在与客户语音交互时,获取客户的语音信息,并将所述语音信息放入语音节点判断模型;其中,所述语音节点判断模型通过输入训练数据不断迭代优化;所述训练数据至少包括语音训练样本的语音特征和语音节点位置信息;
利用所述语音节点判断模型预测所述语音信息的语义完结点,并截取两个语义完结点之间的语音信息,得到语音区间;
提取所述语音区间中的客户问题,并将所述客户问题发送至第三方系统,获取所述第三方系统反馈的多条答复信息,并显示所述答复信息。
可选的,在所述利用所述语音节点判断模型预测所述语音信息的语义完结点,截取两个语义完结点之间的语音信息,得到语音区间之后,还包括:
将所述语音区间转写为文本,得到语音文本,并通过句法分析识别所述语音文本的语法结构是否完整;
若确定出所述语音文本的语法结构完整,则执行提取所述语音区间中的客户问题步骤;
若确定出所述语音文本的语法结构不完整,则通过预先设置的时间间隔截取所述语音信息,得到备用语音区间,将所述备用语音区间作为语音区间,并执行提取所述语音区间中的客户问题步骤。
可选的,在所述提取所述语音文本中的客户问题,并将所述客户问题发送至第三方系统,获取所述第三方系统反馈的多条答复信息,并显示所述答复信息之后,还包括:
针对所述答复信息中质量较高的答复信息,提供一键播报按键;
获取所述一键播报按键的点击反馈信息,通过声音复刻技术,播报所述点击反馈信息中所述质量较高的答复信息。
可选的,在所述获取所述一键播报按键的点击反馈信息,通过声音复刻技术,播报所述点击反馈信息中所述质量较高的答复信息之后,还包括:
根据所述答复信息的点击反馈信息以及所述一键播报按键的点击反馈信息,记录所述答复信息的选择情况、所述一键播报按键对应答复信息的选择情况,以及所述客户问题中的语音节点位置信息;其中,所述语音节点位置信息包括语义完结点。
本申请第二方面提供一种语音坐席的应答装置,包括:
文本筛选单元,用于在与客户语音交互时,获取客户的语音信息,并将所述语音信息放入语音节点判断模型;其中,所述语音节点判断模型通过输入训练数据不断迭代优化;所述训练数据至少包括语音训练样本的语音特征和语音节点位置信息;
调用单元,用于利用所述语音节点判断模型预测所述语音信息的语义完结点,并截取两个语义完结点之间的语音信息,得到语音区间;
提取单元,用于提取所述语音区间中的客户问题;
发送单元,用于将所述客户问题发送至第三方系统;
第一获取单元,用于获取所述第三方系统反馈的多条答复信息;
显示单元,用于显示所述答复信息。
可选的,还包括:
转换单元,用于将所述语音区间转写为文本,得到语音文本;
判断单元,用于通过句法分析识别所述语音文本的语法结构是否完整;若所述判断单元确定出所述语音文本的语法结构完整,则所述提取单元执行提取所述语音区间中的客户问题步骤;
截取单元,用于若所述判断单元确定出所述语音文本的语法结构不完整,则通过预先设置的时间间隔截取所述语音信息,得到备用语音区间,将所述备用语音区间作为语音区间,所述提取单元针对所述截取单元得到的语音区间执行提取所述语音区间中的客户问题步骤。
可选的,还包括:
播报单元,用于针对所述答复信息中质量较高的答复信息,提供一键播报按键;
第二获取单元,用于获取所述一键播报按键的点击反馈信息;
播放单元,用于通过声音复刻技术,播报所述点击反馈信息中所述质量较高的答复信息。
可选的,还包括:
记录单元,用于根据所述答复信息的点击反馈信息以及所述一键播报按键的点击反馈信息,记录所述答复信息的选择情况、所述一键播报按键对应答复信息的选择情况,以及所述客户问题中的语音节点位置信息;其中,所述语音节点位置信息包括语义完结点。
本申请第三方面提供一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现本申请第一方面提供的任一所述的语音坐席的应答方法。
本申请第四方面提供一种计算机存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现本申请第一方面提供的任一所述的语音坐席的应答方法。
从上述技术方案可以看出,本申请实施例提供的一种语音坐席的应答方法中,语音节点判断模型通过输入训练数据不断迭代优化,且训练数据至少包括语音数据样本的语音特征和语音节点位置信息,如此,本方案通过预先构建语音节点判断模型,在坐席员与客户语音交互时,首先获取客户的语音信息并放入语音节点判断模型,以预测语音信息的语义完结点,并截取两个语义完结点之间的语音信息得到语音区间,然后提取所述语音区间中的客户问题,接着将客户问题发送至第三方系统,最终获取第三方系统反馈的多条答复信息,并将答复信息显示在界面上,以供坐席员参考并答复客户,实现坐席员与客户之间高质量、高效率的沟通交互的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种语音坐席的应答方法的流程示意图;
图2为本申请实施例提供的另一种语音坐席的应答方法的流程示意图;
图3为本申请实施例提供的一种识别语音文本的语法结构是否完整的流程示意图;
图4为本申请实施例提供的又一种语音坐席的应答方法的流程示意图;
图5为本申请实施例提供的再一种语音坐席的应答方法的流程示意图;
图6为本申请实施例提供的一种语音坐席的应答装置的结构框图;
图7为本申请实施例提供的一种用于执行语音坐席的应答方法的电子设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
由背景技术可知,在客户拨打的电话接通后,是由坐席员和客户沟通交互,当客户对一些问题提出疑问时,坐席员需要根据客户提出的问题去搜索相关文档资料,然后答复客户的问题,这样的沟通过程比较依赖坐席员的工作经验,且人工搜索相关资料的方式工作效率较低,客户等待时间会比较长,影响客户体验。
因此,本方案通过预先构建语音节点判断模型,在坐席员与客户语音交互时,首先获取客户的语音信息并放入语音节点判断模型,以预测语音信息的语义完结点,并截取两个语义完结点之间的语音信息得到语音区间,然后提取所述语音区间中的客户问题,接着将客户问题发送至第三方系统,最终获取第三方系统反馈的多条答复信息,并将答复信息显示在界面上,以供坐席员参考并答复客户,实现坐席员与客户之间高质量、高效率的沟通交互的目的。
参见图1,本申请实施例公开的语音坐席的应答方法,包括以下步骤:
S101、在与客户语音交互时,获取客户的语音信息,并将语音信息放入语音节点判断模型。
在步骤S101中,语音节点判断模型是预先构建的,并且通过输入训练数据不断迭代优化。
其中,训练数据至少包括语音训练样本的语音特征和语音节点位置信息,语音特征至少包括音量、声调、发音时长和停顿时长。
具体的,预先构建语音节点判断模型的过程为,首先通过收集电话银行的录音数据,然后人工标记录音中语义完结点以及提取录音中的语音特征,接着将录音数据逐字输入,迭代优化后得到语音节点判断模型。
需要说明的是,可以是通过双向GRU模型将录音数据逐字输入,其中,GRU为门控循环单元。
S102、利用语音节点判断模型预测语音信息的语义完结点,并截取两个语义完结点之间的语音信息,得到语音区间。
在具体实现步骤S102的过程中,在利用语音节点判断模型预测语音信息的语义完结点时,会获取多个语义完结点,可以通过截取相邻的两个语义完结点之间的语音信息来得到语音区间,即获取相邻两个语义完结点之间的录音段。
其中,语音区间可以为具有完整语义的录音段。
S103、提取语音区间中的客户问题,并将客户问题发送至第三方系统,获取第三方系统反馈的多条答复信息,并显示答复信息。
在步骤S103中,第三方系统可以是知识库和智能问答系统。
在具体实现步骤S103的过程中,首先提取上述步骤得到的语音区间中的客户问题,然后将客户问题发送至知识库和智能问答系统,知识库和智能问答系统获取客户问题后,知识库根据客户问题在知识库后台维护的存储问题中采用全文检索引擎进行检索,得到与客户问题相匹配的存储问题,并且,通过词向量模型识别匹配的存储问题,得到与客户问题相似的相似问题,接着智能问答系统利用相似问模型判断客户问题和相似问题是否具有相同意思,其中,若判断出客户问题和相似问题具有相同意思,输出第一数值,并基于相似问题利用相似问模型搜索答案,若判断出客户问题和相似问题不具有相同意思,输出第二数值,最终,得到得分靠前的几条答案,并将答案显示在人机交互界面上供坐席员参考。
其中,知识库首先通过对存储问题分词,建立词语与问题之间的倒排索引,并对客户问题进行分词,然后利用词向量模型对分词得到的词语进行向量化,并计算客户问题的词向量和存储问题的词向量之间的余弦距离,累计得到客户问题与存储问题之间的距离值,其中,距离越小越相似,由此得到相似问题。
其中,第一数值可以为1,第二数值可以为0,得分靠前的几条答案可以为5条答案,也可以视情况而定,若知识库和智能问答系统反馈的答案得分普遍较高,可以在界面上显示5条以上的答案,若反馈的答案得分普遍较低或者获取到的答案较少,可以在界面上显示5条以下的答案。
需要说明的是,人机交互界面的设备可以由技术人员进行设置,包括但不限于PC、PAD和手机。
本申请实施例提供的一种语音坐席的应答方法中,语音节点判断模型通过输入训练数据不断迭代优化,且训练数据至少包括语音数据样本的语音特征和语音节点位置信息,如此,本方案通过预先构建语音节点判断模型,在坐席员与客户语音交互时,首先获取客户的语音信息并放入语音节点判断模型,以预测语音信息的语义完结点,并截取两个语义完结点之间的语音信息得到语音区间,然后提取所述语音区间中的客户问题,接着将客户问题发送至第三方系统,最终获取第三方系统反馈的多条答复信息,并将答复信息显示在界面上,以供坐席员参考并答复客户,实现坐席员与客户之间高质量、高效率的沟通交互的目的。
参见图2,本申请实施例公开的另一种语音坐席的应答方法,包括以下步骤:
S201、在与客户语音交互时,获取客户的语音信息,并将语音信息放入语音节点判断模型。
S202、利用语音节点判断模型预测语音信息的语义完结点,并截取两个语义完结点之间的语音信息,得到语音区间。
S203、通过句法分析识别语音区间转写的语音文本的语法结构是否完整,并根据识别结果进行相应处理。
其中,句法分析为文本信息处理的核心基础工作之一。
为了更好地理解步骤S203的过程,参见图3,本申请实施例公开的识别语音文本的语法结构是否完整,包括以下步骤:
S301、将语音区间转写为文本,得到语音文本,并通过句法分析识别语音文本的语法结构是否完整。
其中:若确定出所述语音文本的语法结构完整,执行步骤S302,若确定出所述语音文本的语法结构不完整,执行步骤S303。
在具体实现步骤S301的过程中,首先将语音区间转写为文本,然后对文本内容进行句法分析,判断语音文本是否具有完整的语法树,若判断出语音文本具有完整的语法树,则执行步骤S302,若判断出语音文本不具有完整的语法树,则执行步骤S303。
S302、执行提取语音区间中的客户问题步骤。
在具体实现步骤S302的过程中,判断出语音文本具有完整的语法树,即语音文本的语法结构完整,则执行步骤S204。
S303、通过预先设置的时间间隔截取语音消息,得到备用语音区间,将备用语音区间作为语音区间,并执行提取语音区间中的客户问题步骤。
在具体实现步骤S303的过程中,判断出语音文本不具有完整的语法树,则通过预先设置的时间间隔截取时间间隔内的客户的语音消息,得到备用语音区间,利用备用语音区间替代不具有完整的语法树的语音文本对应的语音区间,执行步骤S204。
S204、提取语音区间中的客户问题,并将客户问题发送至第三方系统,获取第三方系统反馈的多条答复信息,并显示答复信息。
上述步骤S201、步骤S202和步骤S204的执行原理和过程与图1中公开的步骤S101至步骤S103的执行原理和过程相同,可参见,这里不再赘述。
本申请实施例提供的一种语音坐席的应答方法中,语音节点判断模型通过输入训练数据不断迭代优化,且训练数据至少包括语音数据样本的语音特征和语音节点位置信息,如此,本方案通过预先构建语音节点判断模型,在坐席员与客户语音交互时,首先获取客户的语音信息并放入语音节点判断模型,以预测语音信息的语义完结点,并截取两个语义完结点之间的语音信息得到语音区间,然后提取所述语音区间中的客户问题,接着将客户问题发送至第三方系统,最终获取第三方系统反馈的多条答复信息,并将答复信息显示在界面上,以供坐席员参考并答复客户,实现坐席员与客户之间高质量、高效率的沟通交互的目的。
参见图4,本申请实施例公开的又一种语音坐席的应答方法,包括以下步骤:
S401、在与客户语音交互时,获取客户的语音信息,并将语音信息放入语音节点判断模型。
S402、利用语音节点判断模型预测语音信息的语义完结点,并截取两个语义完结点之间的语音信息,得到语音区间。
S403、提取语音区间中的客户问题,并将客户问题发送至第三方系统,获取第三方系统反馈的多条答复信息,并显示答复信息。
S404、针对答复信息中质量较高的答复信息,提供一键播报按键。
在具体实现步骤S404的过程中,通过得分识别答案的质量,对于人机交互界面上显示的几条答案中质量较高的答案,提供一键播报功能,即一键播报按键,坐席员可点击一键播报按键播放对应答案。
S405、获取一键播报按键的点击反馈信息,通过声音复刻技术,播报点击反馈信息中质量较高的答复信息。
在具体实现步骤S405的过程中,当坐席员点击界面上的一键播报按键,设备将通过声音复刻技术直接将对应答案播报给客户。
上述步骤S401至步骤S403的执行原理和过程与图1中公开的步骤S101至步骤S103的执行原理和过程相同,可参见,这里不再赘述。
本申请实施例提供的一种语音坐席的应答方法中,语音节点判断模型通过输入训练数据不断迭代优化,且训练数据至少包括语音数据样本的语音特征和语音节点位置信息,如此,本方案通过预先构建语音节点判断模型,在坐席员与客户语音交互时,首先获取客户的语音信息并放入语音节点判断模型,以预测语音信息的语义完结点,并截取两个语义完结点之间的语音信息得到语音区间,然后提取所述语音区间中的客户问题,接着将客户问题发送至第三方系统,最终获取第三方系统反馈的多条答复信息,并将答复信息显示在界面上,以供坐席员参考并答复客户,实现坐席员与客户之间高质量、高效率的沟通交互的目的。
参见图5,本申请实施例公开的再一种语音坐席的应答方法,包括以下步骤:
S501、在与客户语音交互时,获取客户的语音信息,并将语音信息放入语音节点判断模型。
S502、利用语音节点判断模型预测语音信息的语义完结点,并截取两个语义完结点之间的语音信息,得到语音区间。
S503、提取语音区间中的客户问题,并将客户问题发送至第三方系统,获取第三方系统反馈的多条答复信息,并显示答复信息。
S504、针对答复信息中质量较高的答复信息,提供一键播报按键。
S505、获取一键播报按键的点击反馈信息,通过声音复刻技术,播报点击反馈信息中质量较高的答复信息。
S506、根据答复信息的点击反馈信息以及一键播报按键的点击反馈信息,记录答复信息的选择情况、一键播报按键对应答复信息的选择情况,以及客户问题中的语音节点位置信息。
其中,语音节点位置信息包括语义完结点。
在具体实现步骤S506的过程中,首先根据答案和一键播报按键的点击反馈信息,记录答案的选择情况、一键播报按键对应答案的选择情况,以及客户的语音信息中的客户问题中的语音特征和语音节点位置信息。
需要说明的是,可以将答案的选择情况、一键播报按键对应答案的选择情况,以及客户的语音信息中的客户问题中的语音特征和语音节点位置信息作为新的训练数据,持续迭代训练语音节点判断模型。
上述步骤S501至步骤S505的执行原理和过程与图4中公开的步骤S401至步骤S405的执行原理和过程相同,可参见,这里不再赘述。
本申请实施例提供的一种语音坐席的应答方法中,语音节点判断模型通过输入训练数据不断迭代优化,且训练数据至少包括语音数据样本的语音特征和语音节点位置信息,如此,本方案通过预先构建语音节点判断模型,在坐席员与客户语音交互时,首先获取客户的语音信息并放入语音节点判断模型,以预测语音信息的语义完结点,并截取两个语义完结点之间的语音信息得到语音区间,然后提取所述语音区间中的客户问题,接着将客户问题发送至第三方系统,最终获取第三方系统反馈的多条答复信息,并将答复信息显示在界面上,以供坐席员参考并答复客户,实现坐席员与客户之间高质量、高效率的沟通交互的目的。
与上述本申请实施例提供的语音坐席的应答方法相对应,本申请实施例还提供了语音坐席的应答装置。
参见图6,本申请实施例公开的语音坐席的应答装置,包括:
文本筛选单元601,用于在与客户语音交互时,获取客户的语音信息,并将所述语音信息放入语音节点判断模型;其中,所述语音节点判断模型通过输入训练数据不断迭代优化;所述训练数据至少包括语音训练样本的语音特征和语音节点位置信息;
调用单元602,用于利用所述语音节点判断模型预测所述语音信息的语义完结点,并截取两个语义完结点之间的语音信息,得到语音区间;
提取单元603,用于提取所述语音区间中的客户问题;
发送单元604,用于将所述客户问题发送至第三方系统;
第一获取单元605,用于获取所述第三方系统反馈的多条答复信息;
显示单元606,用于显示所述答复信息。
可选的,语音坐席的应答装置还包括:
转换单元607,用于将所述语音区间转写为文本,得到语音文本;
判断单元608,用于通过句法分析识别所述语音文本的语法结构是否完整;若所述判断单元确定出所述语音文本的语法结构完整,则所述提取单元执行提取所述语音区间中的客户问题步骤;
截取单元609,用于若所述判断单元确定出所述语音文本的语法结构不完整,则通过预先设置的时间间隔截取所述语音信息,得到备用语音区间,将所述备用语音区间作为语音区间,所述提取单元针对所述截取单元得到的语音区间执行提取所述语音区间中的客户问题步骤。
可选的,语音坐席的应答装置还包括:
播报单元610,用于针对所述答复信息中质量较高的答复信息,提供一键播报按键;
第二获取单元611,用于获取所述一键播报按键的点击反馈信息;
播放单元612,用于通过声音复刻技术,播报所述点击反馈信息中所述质量较高的答复信息。
可选的,语音坐席的应答装置还包括:
记录单元613,用于根据所述答复信息的点击反馈信息以及所述一键播报按键的点击反馈信息,记录所述答复信息的选择情况、所述一键播报按键对应答复信息的选择情况,以及所述客户问题中的语音节点位置信息;其中,所述语音节点位置信息包括语义完结点。
需要说明的是,上述本申请实施例公开的语音坐席的应答装置中的各个模块具体的原理和执行过程,与上述图1至图5本申请实施例公开的语音坐席的应答方法中对应的部分的原理和执行过程相同,可参见上述本申请实施例公开的语音坐席的应答方法中相应的部分,这里不再进行赘述。
本申请实施例提供的一种语音坐席的应答装置中,语音节点判断模型通过输入训练数据不断迭代优化,且训练数据至少包括语音数据样本的语音特征和语音节点位置信息,如此,本方案通过预先构建语音节点判断模型,在坐席员与客户语音交互时,首先通过文本筛选单元601获取客户的语音信息并放入语音节点判断模型,通过调用单元602以预测语音信息的语义完结点,并截取两个语义完结点之间的语音信息得到语音区间,然后通过提取单元603提取所述语音区间中的客户问题,接着通过发送单元604将客户问题发送至第三方系统,最终通过第一获取单元605获取第三方系统反馈的多条答复信息,并通过显示单元606将答复信息显示在界面上,以供坐席员参考并答复客户,实现坐席员与客户之间高质量、高效率的沟通交互的目的。
本申请实施例还提供了一种电子设备,如图7所示,包括:
存储装置702和处理器701;
其中,所述存储装置702用于存储计算机程序;
所述处理器701用于执行所述计算机程序,所述程序被执行时,具体用于实现本申请如图1至图5所示的实施例公开的语音坐席的应答方法。
本申请实施例还提供了一种计算机存储介质,用于存储计算机程序,所述计算机程序被执行时,具体用于实现本申请如图1至图5所示的实施例公开的语音坐席的应答方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (8)
1.一种语音坐席的应答方法,其特征在于,包括:
在与客户语音交互时,获取客户的语音信息,并将所述语音信息放入语音节点判断模型;其中,所述语音节点判断模型通过输入训练数据不断迭代优化;所述训练数据至少包括语音训练样本的语音特征和语音节点位置信息;
利用所述语音节点判断模型预测所述语音信息的语义完结点,并截取两个语义完结点之间的语音信息,得到语音区间;
将所述语音区间转写为文本,得到语音文本,并通过句法分析识别所述语音文本的语法结构是否完整;
若确定出所述语音文本的语法结构完整,则提取所述语音区间中的客户问题,并将所述客户问题发送至第三方系统,获取所述第三方系统反馈的多条答复信息,并显示所述答复信息;
若确定出所述语音文本的语法结构不完整,则通过预先设置的时间间隔截取所述语音信息,得到备用语音区间,将所述备用语音区间作为语音区间,并执行提取所述语音区间中的客户问题步骤。
2.根据权利要求1所述的方法,其特征在于,在所述提取所述语音区间中的客户问题,并将所述客户问题发送至第三方系统,获取所述第三方系统反馈的多条答复信息,并显示所述答复信息之后,还包括:
针对所述答复信息中质量较高的答复信息,提供一键播报按键;
获取所述一键播报按键的点击反馈信息,通过声音复刻技术,播报所述点击反馈信息中所述质量较高的答复信息。
3.根据权利要求2所述的方法,其特征在于,在所述获取所述一键播报按键的点击反馈信息,通过声音复刻技术,播报所述点击反馈信息中所述质量较高的答复信息之后,还包括:
根据所述答复信息的点击反馈信息以及所述一键播报按键的点击反馈信息,记录所述答复信息的选择情况、所述一键播报按键对应答复信息的选择情况,以及所述客户问题中的语音节点位置信息;其中,所述语音节点位置信息包括语义完结点。
4.一种语音坐席的应答装置,其特征在于,包括:
文本筛选单元,用于在与客户语音交互时,获取客户的语音信息,并将所述语音信息放入语音节点判断模型;其中,所述语音节点判断模型通过输入训练数据不断迭代优化;所述训练数据至少包括语音训练样本的语音特征和语音节点位置信息;
调用单元,用于利用所述语音节点判断模型预测所述语音信息的语义完结点,并截取两个语义完结点之间的语音信息,得到语音区间;
转换单元,用于将所述语音区间转写为文本,得到语音文本;
判断单元,用于通过句法分析识别所述语音文本的语法结构是否完整;若所述判断单元确定出所述语音文本的语法结构完整,则提取单元执行提取所述语音区间中的客户问题步骤;
所述提取单元,用于提取所述语音区间中的客户问题;
发送单元,用于将所述客户问题发送至第三方系统;
第一获取单元,用于获取所述第三方系统反馈的多条答复信息;
显示单元,用于显示所述答复信息;
截取单元,用于若所述判断单元确定出所述语音文本的语法结构不完整,则通过预先设置的时间间隔截取所述语音信息,得到备用语音区间,将所述备用语音区间作为语音区间,所述提取单元针对所述截取单元得到的语音区间执行提取所述语音区间中的客户问题步骤。
5.根据权利要求4所述的装置,其特征在于,还包括:
播报单元,用于针对所述答复信息中质量较高的答复信息,提供一键播报按键;
第二获取单元,用于获取所述一键播报按键的点击反馈信息;
播放单元,用于通过声音复刻技术,播报所述点击反馈信息中所述质量较高的答复信息。
6.根据权利要求5所述的装置,其特征在于,还包括:
记录单元,用于根据所述答复信息的点击反馈信息以及所述一键播报按键的点击反馈信息,记录所述答复信息的选择情况、所述一键播报按键对应答复信息的选择情况,以及所述客户问题中的语音节点位置信息;其中,所述语音节点位置信息包括语义完结点。
7.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至3中任一所述的方法。
8.一种计算机存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至3中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110690101.6A CN113422875B (zh) | 2021-06-22 | 2021-06-22 | 语音坐席的应答方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110690101.6A CN113422875B (zh) | 2021-06-22 | 2021-06-22 | 语音坐席的应答方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113422875A CN113422875A (zh) | 2021-09-21 |
CN113422875B true CN113422875B (zh) | 2022-11-25 |
Family
ID=77789878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110690101.6A Active CN113422875B (zh) | 2021-06-22 | 2021-06-22 | 语音坐席的应答方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113422875B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104202491A (zh) * | 2014-09-25 | 2014-12-10 | 北京橙鑫数据科技有限公司 | 客服电话处理方法及装置 |
CN107481718A (zh) * | 2017-09-20 | 2017-12-15 | 广东欧珀移动通信有限公司 | 语音识别方法、装置、存储介质及电子设备 |
CN110047473A (zh) * | 2019-04-19 | 2019-07-23 | 交通银行股份有限公司太平洋信用卡中心 | 一种人机协作交互方法及系统 |
CN110364145A (zh) * | 2018-08-02 | 2019-10-22 | 腾讯科技(深圳)有限公司 | 一种语音识别的方法、语音断句的方法及装置 |
CN110457684A (zh) * | 2019-07-15 | 2019-11-15 | 广州九四智能科技有限公司 | 智能电话客服的语义分析方法 |
CN110767218A (zh) * | 2019-10-31 | 2020-02-07 | 南京励智心理大数据产业研究院有限公司 | 端到端语音识别方法、系统、装置及其存储介质 |
CN111813909A (zh) * | 2020-06-24 | 2020-10-23 | 泰康保险集团股份有限公司 | 一种智能问答方法和装置 |
CN112597292A (zh) * | 2020-12-29 | 2021-04-02 | 招联消费金融有限公司 | 问题回复推荐方法、装置、计算机设备和存储介质 |
CN112885337A (zh) * | 2021-01-29 | 2021-06-01 | 深圳前海微众银行股份有限公司 | 数据处理方法、装置、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190325898A1 (en) * | 2018-04-23 | 2019-10-24 | Soundhound, Inc. | Adaptive end-of-utterance timeout for real-time speech recognition |
-
2021
- 2021-06-22 CN CN202110690101.6A patent/CN113422875B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104202491A (zh) * | 2014-09-25 | 2014-12-10 | 北京橙鑫数据科技有限公司 | 客服电话处理方法及装置 |
CN107481718A (zh) * | 2017-09-20 | 2017-12-15 | 广东欧珀移动通信有限公司 | 语音识别方法、装置、存储介质及电子设备 |
CN110364145A (zh) * | 2018-08-02 | 2019-10-22 | 腾讯科技(深圳)有限公司 | 一种语音识别的方法、语音断句的方法及装置 |
CN110047473A (zh) * | 2019-04-19 | 2019-07-23 | 交通银行股份有限公司太平洋信用卡中心 | 一种人机协作交互方法及系统 |
CN110457684A (zh) * | 2019-07-15 | 2019-11-15 | 广州九四智能科技有限公司 | 智能电话客服的语义分析方法 |
CN110767218A (zh) * | 2019-10-31 | 2020-02-07 | 南京励智心理大数据产业研究院有限公司 | 端到端语音识别方法、系统、装置及其存储介质 |
CN111813909A (zh) * | 2020-06-24 | 2020-10-23 | 泰康保险集团股份有限公司 | 一种智能问答方法和装置 |
CN112597292A (zh) * | 2020-12-29 | 2021-04-02 | 招联消费金融有限公司 | 问题回复推荐方法、装置、计算机设备和存储介质 |
CN112885337A (zh) * | 2021-01-29 | 2021-06-01 | 深圳前海微众银行股份有限公司 | 数据处理方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113422875A (zh) | 2021-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8756065B2 (en) | Correlated call analysis for identified patterns in call transcriptions | |
JP4662861B2 (ja) | モニタリング装置、評価データ選別装置、応対者評価装置、応対者評価システムおよびプログラム | |
US9183834B2 (en) | Speech recognition tuning tool | |
US10489451B2 (en) | Voice search system, voice search method, and computer-readable storage medium | |
CN110751943A (zh) | 一种语音情绪识别方法、装置以及相关设备 | |
US20110044447A1 (en) | Trend discovery in audio signals | |
CN111683175B (zh) | 一种自动应答来电的方法、装置、设备及存储介质 | |
CN111294468A (zh) | 一种客服中心呼叫用语音质检分析系统 | |
CN105261362A (zh) | 一种通话语音监测方法及系统 | |
CN112185358A (zh) | 意图识别方法、模型的训练方法及其装置、设备、介质 | |
CN110798578A (zh) | 一种来电事务管理方法、装置以及相关设备 | |
CN106407393A (zh) | 一种用于智能设备的信息处理方法及装置 | |
KR20130108173A (ko) | 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법 | |
CN112242135A (zh) | 一种语音数据的处理方法及智能客服装置 | |
KR20130086971A (ko) | 음성인식 질의응답 시스템 및 그것의 운용방법 | |
CN110047473B (zh) | 一种人机协作交互方法及系统 | |
CN111563182A (zh) | 语音会议记录存储处理方法、装置 | |
CN111062729A (zh) | 一种信息获取方法、装置和设备 | |
KR100803900B1 (ko) | 음성 인식 ars 서비스 방법 및 시스템 | |
CN114328867A (zh) | 一种人机对话中智能打断的方法及装置 | |
CN103067579A (zh) | 辅助在线语音聊天方法和装置 | |
CN113422875B (zh) | 语音坐席的应答方法、装置、设备及存储介质 | |
CN111914078A (zh) | 数据处理方法、装置 | |
WO2023090380A1 (ja) | プログラム、情報処理システム及び情報処理方法 | |
CN111581338A (zh) | 一种农业技术服务机器人人机融合咨询问答方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |