CN115567642A - 众包客服服务的监测方法、装置、计算机设备和存储介质 - Google Patents
众包客服服务的监测方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN115567642A CN115567642A CN202211096685.5A CN202211096685A CN115567642A CN 115567642 A CN115567642 A CN 115567642A CN 202211096685 A CN202211096685 A CN 202211096685A CN 115567642 A CN115567642 A CN 115567642A
- Authority
- CN
- China
- Prior art keywords
- crowdsourcing
- data
- target
- recording
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5166—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/14—Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/51—Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
- H04M3/5175—Call or contact centers supervision arrangements
Abstract
本发明涉及一种众包客服服务的监测方法方法、装置、计算机设备和存储介质,方法包括:向众包任务参与终端发出录音请求;响应众包任务参与终端反馈的同意指示,实时采集众包参与终端录制的录音数据;从录音数据中分离出属于众包客服服务人员的目标语音数据;对目标语音数据进行敏感词检测,得到敏感词检测结果;根据敏感词检测结果,确定众包客服服务人员服务质量的评估结果。上述方法可以提高了任务时效性:为任务全流程提供录音凭证,任务开始后录音持续录制,规避了一定的金融风险,提高了任务时效。
Description
技术领域
本发明涉及人工智能技术、自然语言处理技术领域,尤其涉及一种众包客服服务的监测方法、装置、计算机设备和存储介质。
背景技术
众包人员在执行收集资料任务过程中会涉及到与客户交流的过程,在此期间会对关于一些金融话术的进行描述和信息的确认。如果不借助于录音功能,就无法确认众包人员在执行任务时的语言规范,也没办法在事后追究其相关的事故责任。为了避免这一风险,需要对执行任务的众包人员在经过本人授权的情况下,对其执行任务的过程进行语音监听操作。
于是,为了满足风控要求,解决众包人员在收集资料过程中可能出现的金融违规话术,需要对资料收集任务的第三方人员进行全程录音,对众包人员操作流程的进行规范,为任务全流程提供录音凭证,并接入智能语音识别系统,将敏感词汇提前收集,通过语音识别引擎精准、快速的转为文字,对录音进行实时的监控,以及进行违规话术的词库校验和识别功能。
发明人意识到,上述方案的问答效果严重依赖于语义匹配模型技术,然而语义匹配模型常常由于训练数据和模型泛化能力的不足,对于一些业务下的复杂实体,常常导致语义匹配模型匹配不准确,匹配能力严重不足,继而使得问答效果不佳。
发明内容
本发明提供一种众包客服服务的监测方法、装置、计算机设备和存储介质。
第一方面,提供了一种众包客服服务的监测方法,所述监测方法包括:
向众包任务参与终端发出录音请求;
响应所述众包任务参与终端反馈的同意指示,实时采集所述众包参与终端录制的录音数据;
从所述录音数据中分离出属于众包客服服务人员的目标语音数据;
对所述目标语音数据进行敏感词检测,得到敏感词检测结果;
根据所述敏感词检测结果,确定所述众包客服服务人员服务质量的评估结果。
在一些实施例中,所述从所述录音数据中分离出属于众包客服服务人员的目标语音数据,包括:
根据所述录音数据的语音状态对所述录音数据进行分割;
提取分割后的录音数据的声纹特征,对所述录音数据的声纹特征进行聚类得到多个聚类结果;
根据各聚类结果与模板声纹特征的相似度,确定属于众包客服服务人员的目标语音数据,其中,所述模板声纹特征是所述众包客服服务人员的历史录音数据的声纹特征。
在一些实施例中,所述根据所述录音数据的语音状态对所述录音数据进行分割,包括:
确定所述录音数据中每一帧的语音帧信息,所述语音帧信息包括采集的语音帧以及所述语音帧对应的时间戳;
检测所述录音数据中每一帧所处的语音状态;
将语音状态为存在语音的状态的语音帧确定为目标语音帧;
根据确定的目标语音帧及其对应的时间戳,对所述录音数据进行分割。
在一些实施例中,所述对所述目标语音数据进行敏感词检测,得到敏感词检测结果,包括:
将所述目标语音数据输入文本转换模型得到目标文本;
对所述目标文本进行分词处理,得到多个目标分词;
将所述目标分词与所述敏感词进行匹配,得到敏感词检测结果
将所述目标分词与所述敏感词进行发音匹配,确定与所述敏感词音近的目标分词为敏感词。
在一些实施例中,所述将包含所述目标词语的目标语音数据输入文本转换模型得到对应的文本数据,包括:
将所述目标语音数据分别输入至少两个ASR模块,各所述ASR模块输出各自对应的转换文本;
对至少两个所述转换文本进行对齐处理,得到各转换文本对应的对齐文本;
对至少两个所述对齐文本的每个对齐位置上的词语进行打分,选择每个对齐位置上得分最高的词语作为目标词语,根据所述目标词语和各所述目标词语对应的对齐位置确定所述目标文本。
在一些实施例中,所述将所述目标分词与所述敏感词进行发音匹配,确定与所述敏感词音近的目标分词为敏感词,包括:
将所述目标分词转化为第一拼音数据,将所述敏感词转化为第二拼音数据,所述第一拼音数据和所述第二拼音数据均包括包含声母和韵母;
所相同位置上字符对应的拼音数据中声母和韵母均相同,则确定所述相同位置上的字符是音近字;和/或,若所述第一拼音数据和第二拼音数据中相同位置上字符对应的拼音数据中包含有声母模糊音且韵母相同时,则确定所述相同位置上的字符是音近字;和/或,若所述第一拼音信息和第二拼音信息中相同位置上字符对应的拼音信息中包含有韵母模糊音且声母相同时,则确定所述相同位置上的字符是音近字。
在一些实施例中,所述根据敏感词识别结果和语音情绪识别结果,确定所述众包客服服务人员服务质量的评估结果,包括:
记录指定时间长度内,众包客服服务人员的目标语音数据中敏感词数量和/或敏感词出现的频率;
根据所述敏感词数量和/或所述敏感词出现的频率,确定所述众包客服服务人员服务质量的评估结果。
第二方面,提供了一种基于人工智能的智能问答处理装置,包括:
众包客服服务的监测装置,其特征在于,所述监测装置包括:
请求输出模块,用于向众包任务参与终端发出录音请求;
音频采集模块,用于响应所述众包任务参与终端反馈的同意指示,实时采集所述众包参与终端录制的录音数据;
语音筛选模块,用于从所述录音数据中分离出属于众包客服服务人员的目标语音数据;
敏感词检测模块,用于对所述目标语音数据进行敏感词检测,得到敏感词检测结果;
结果输出模块,用于根据所述敏感词检测结果,确定所述众包客服服务人员服务质量的评估结果。
匹配问题对应的匹配答案对所述用户问题进行回应。
第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述智能问答处理方法的步骤。
第四方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述智能问答处理方法的步骤。
上述众包客服服务的监测方法、装置、计算机设备和存储介质所实现的方案中,可以通过向众包任务参与终端发出录音请求;响应所述众包任务参与终端反馈的同意指示,实时采集所述众包参与终端录制的录音数据;从所述录音数据中分离出属于众包客服服务人员的目标语音数据;对所述目标语音数据进行敏感词检测,得到敏感词检测结果;根据所述敏感词检测结果,确定所述众包客服服务人员服务质量的评估结果。在本发明中,大大降低了执行任务过程中的安全风险:减少了众包人员在收集资料过程中可能出现的金融违规话术的风险,对其话术进行实时监听,对于语音产生文字中含有的敏感信息进行分析;使执行任务更加法规范化:对第三方人员在资料收集任务过程中进行全程录音,起到了规范众包人员操作流程的作用,使其在执行任务更加专业化;提高了任务时效性:为任务全流程提供录音凭证,任务开始后录音持续录制,规避了一定的金融风险,提高了任务时效。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中智能问答处理方法的一应用环境示意图;
图2是本发明一实施例中智能问答处理方法的一流程示意图;
图3是本发明一实施例中智能问答处理装置的一结构示意图;
图4是本发明一实施例中计算机设备的一结构示意图;
图5是本发明一实施例中计算机设备的另一结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的众包客服服务的监测方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务端进行通信。服务端可以通过客户端接收用户问题,并根据用户问题从预设标准问题库中进行问题召回处理,以获取多个候选问题;按照用户问题与候选问题的语义匹配度,对多个候选问题进行排序,得到候选问题的第一排序结果;分别判断用户问题与每个候选问题的实体对齐情况;按照实体对齐情况,对第一排序结果进行调整,得到候选问题的第二排序结果,第二排序结果中,实体不对齐的候选问题排在实体对齐的候选问题后面,实体对齐的候选问题按照第一排序结果的排序保持不变;在第二排序结果的序列中,从首位依次截取预设数量的候选问题作为匹配问题;最后选取匹配问题对应的匹配答案对用户问题进行回应,将匹配答案反馈回客户端,在本发明中,针对保险业务下等复杂保险实体,可利用实体对齐优化问答引擎的方案,先是通过语义匹配度进行粗排序,再通过实体对齐方式进行排序调整,选取靠前的匹配问题对应得到答案进行回应,能有效地避免模型的泛化能力缺陷,极大高效提升实体匹配的效果,提升问答引擎的效果。其中,客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。下面通过具体的实施例对本发明进行详细的描述。
请参阅图2所示,图2为本发明实施例提供的众包客服服务的监测方法的一个流程示意图,包括如下步骤:
S10:向众包任务参与终端发出录音请求。
可以理解的是,众包任务指的是一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的大众志愿者的做法。众包任务通常是由个人来承担,但如果涉及到需要多人协作完成的任务,也有可能以依靠开源的个体生产的形式出现。
后台服务器接收输入的多个众包任务,并根据多个众包任务的地址信息、任务难易程度信息、任务时限信息等其中一项或多项的属性信息对多个众包任务进行分类。分类完成后,根据该类众包任务的属性信息对该类众包任务进行统一资源配置。
S20:响应众包任务参与终端反馈的同意指示,实时采集众包参与终端录制的录音数据。
在一些实施例中,发出全程录音的隐私请求,在经过执行人员本人同意的情况下,开始进行录音功能。
发出全程录音的隐私请求,若使用者同意录音,开启录用功能。通过app录音+OCR语音智能识别+移动端h5系统接收数据结合的形式,实现录音的数据的接收和保存;
app录音原理:MediaRecorder包含了Audio和video的记录功能,在Android的界面上,Music和Video两个应用程序都是调用MediaRecorder实现的。MediaRecorder在底层是基于OpenCore(PacketVideo)的库实现的,为了构建一个MediaRecorder程序,上层还包含了进程间通讯等内容。
人工智能识别相结合:基于DeepPeak2端到端建模,多采样率多场景声学建模,近场中文普通话识别准确率达很高,识别返回的文字结果带有时间戳,展示VAD切分句子开始和结束时间,方便进行功能开发。将大量对话录音识别为文字,并对内容进行持续分析与监控,及时发现风险、违规内容,发掘潜在营销机会。可以将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景。支持WebSocketAPI,支持Android、iOS、LinuxSDK,可以在多种操作系统、多种设备终端上调用。
接受和请求录音功能,执行任务的过程可以在手机端的h5系统进行,具有很强的灵活性。方便方便传播和分享信息,或者进行一些任务的展示。比如我们常用的APP都支持分享到微信或者QQ的功能,系统可以通过一个网页链接,打开后基本就是一个h5应用,HTML5开发,能提供更快、更简便的服务,代码可高度重用,服务发布方便。强化了web页的表现性,追加了本地数据库,可以用作离线应用的开发,离线应用就是把需要的资源先缓存到本地,下次再查看时无需联网。
录音结束之后,将录音数据通过h5系统上传保存,以便于后续材料的审核以及提供证明材料。人工智能语音系统转成文字以后根据敏感词库对语音进行校验。如有敏感信息,则发邮件提示业务方以及在系统中提示调查者规范话术。
S30:从录音数据中分离出属于众包客服服务人员的目标语音数据。
在该发明的一些实施例中,上述从录音数据中分离出属于众包客服服务人员的目标语音数据,包括:
根据录音数据的语音状态对录音数据进行分割;
提取分割后的录音数据的声纹特征,对录音数据的声纹特征进行聚类得到多个聚类结果;
根据各聚类结果与模板声纹特征的相似度,确定属于众包客服服务人员的目标语音数据,其中,模板声纹特征是众包客服服务人员的历史录音数据的声纹特征。
在本申请中,可以利用语音活动检测技术(Voice Activity Detection,VAD)对语音特征进行分割,这个技术的主要任务是从带有噪声的语音中准确的定位出语音的开始和结束点,因为语音中含有很长的静音,也就是把静音和实际语音分离开来,因为是语音数据的原始处理,所以VAD是语音信号处理过程的关键技术之一,其中,语音状态包括存在语音的状态和不存在语音的状态。
例如,可以确定语音信息中每个语音帧所处的语音状态,然后,根据处于激活状态的语音帧对语音特征进行分割,即,可选的,在一些实施例中,步骤“基于待识别语音的语音状态对语音特征进行分割”,具体可以包括:
(31)采集待识别语音中每一帧的语音帧信息;
(32)检测待识别语音中每一帧所处的语音状态;
(33)将语音状态为激活状态的语音帧确定为目标语音帧;
(34)根据确定的目标语音帧及其对应的时间戳,对语音特征进行分割。
语音帧信息包括采集的语音帧以及语音帧对应的时间戳,比如,采集到待识别语音的100帧语音帧,其在时间上连续,其中,第10帧~第20帧语音帧处于激活状态,第25帧~第28帧语音帧处于激活状态、以及第59帧~第79帧语音帧处于激活状态,则将语音状态为激活状态的语音帧确定为目标语音帧,然后,基于目标语音帧对应的时间戳,对语音特征进行分割,得到第10帧~第20帧语音帧对应的语音特征、第25帧~第28帧语音帧对应的语音特征、第59帧~第79帧语音帧对应的语音特征以及其他处于静默状态的语音帧对应的语音特征。
S40:对目标语音数据进行敏感词检测,得到敏感词检测结果。
在一些实施例中,对目标语音数据进行敏感词检测,得到敏感词检测结果,包括:
将目标语音数据输入文本转换模型得到目标文本;
对目标文本进行分词处理,得到多个目标分词;
将目标分词与敏感词进行匹配,得到敏感词检测结果
将目标分词与敏感词进行发音匹配,确定与敏感词音近的目标分词为敏感词。
在一些实施例中,将包含目标词语的目标语音数据输入文本转换模型得到对应的文本数据,包括:
将目标语音数据分别输入至少两个ASR模块,各ASR模块输出各自对应的转换文本;
对至少两个转换文本进行对齐处理,得到各转换文本对应的对齐文本;
对至少两个对齐文本的每个对齐位置上的词语进行打分,选择每个对齐位置上得分最高的词语作为目标词语,根据目标词语和各目标词语对应的对齐位置确定目标文本。
在一些实施例中,将目标分词与敏感词进行发音匹配,确定与敏感词音近的目标分词为敏感词,包括:
将目标分词转化为第一拼音数据,将敏感词转化为第二拼音数据,第一拼音数据和第二拼音数据均包括包含声母和韵母;
所相同位置上字符对应的拼音数据中声母和韵母均相同,则确定相同位置上的字符是音近字;和/或,若第一拼音数据和第二拼音数据中相同位置上字符对应的拼音数据中包含有声母模糊音且韵母相同时,则确定相同位置上的字符是音近字;和/或,若第一拼音信息和第二拼音信息中相同位置上字符对应的拼音信息中包含有韵母模糊音且声母相同时,则确定相同位置上的字符是音近字。
本实施例中,拼音信息指将中文字串按照固定的拼音规则写成拼音编码形式的字串,该拼音编码形式的字串用来表征中文字串的拼音信息,且该编码形式的字串的表现形式有很多种,例如,该固定规则可以是将中文字串中字符分别写成“声母+韵母”的形式,例如,对于中文字串“间”可以写成“jian”,即声母为“j”,韵母为“ian”,这里不作具体限定。
S50:根据敏感词检测结果,确定众包客服服务人员服务质量的评估结果。
在一些实施例中,根据敏感词识别结果和语音情绪识别结果,确定众包客服服务人员服务质量的评估结果,包括:
记录指定时间长度内,众包客服服务人员的目标语音数据中敏感词数量和/或敏感词出现的频率;
根据敏感词数量和/或敏感词出现的频率,确定众包客服服务人员服务质量的评估结果。
可见,在上述方案中,众包客服服务的监测方法所实现的方案中,可以通过向众包任务参与终端发出录音请求;响应众包任务参与终端反馈的同意指示,实时采集众包参与终端录制的录音数据;从录音数据中分离出属于众包客服服务人员的目标语音数据;对目标语音数据进行敏感词检测,得到敏感词检测结果;根据敏感词检测结果,确定众包客服服务人员服务质量的评估结果。在本发明中,大大降低了执行任务过程中的安全风险:减少了众包人员在收集资料过程中可能出现的金融违规话术的风险,对其话术进行实时监听,对于语音产生文字中含有的敏感信息进行分析;使执行任务更加法规范化:对第三方人员在资料收集任务过程中进行全程录音,起到了规范众包人员操作流程的作用,使其在执行任务更加专业化;提高了任务时效性:为任务全流程提供录音凭证,任务开始后录音持续录制,规避了一定的金融风险,提高了任务时效。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种众包客服服务的监测装置,该基于人工智能的智能问答处理装置与上述实施例中基于人工智能的智能问答处理方法一一对应。如图3所示,该监测装置包括:请求输出模块101、音频采集模块102、语音筛选模块103、敏感词检测模块104和结果输出模块105。各功能模块详细说明如下:
请求输出模块101,用于向众包任务参与终端发出录音请求;
音频采集模块102,用于响应众包任务参与终端反馈的同意指示,实时采集众包参与终端录制的录音数据;
语音筛选模块103,用于从录音数据中分离出属于众包客服服务人员的目标语音数据;
敏感词检测模块104,用于对目标语音数据进行敏感词检测,得到敏感词检测结果;
结果输出模块105,用于根据敏感词检测结果,确定众包客服服务人员服务质量的评估结果。
本发明提供了一种智能问答处理装置,先通过语义匹配方式得到候选问题的初步排序结果,随后提出基于实体对齐优化问答引擎的方案,通过实体对齐方式,再次对候选问题的排序结果进行排序,使得更加匹配的候选问题被选出来,能有效地避免模型的泛化能力缺陷,极大高效提升实体匹配的效果,提升问答引擎的效果。
关于智能问答处理装置的具体限定可以参见上文中对于智能问答处方法的限定,在此不再赘述。上述智能问答处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性和/或易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的客户端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的智能问答处理方法服务端侧的功能或步骤。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是客户端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能的智能问答处理方法客户端侧的功能或步骤
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
向众包任务参与终端发出录音请求;
响应众包任务参与终端反馈的同意指示,实时采集众包参与终端录制的录音数据;
从录音数据中分离出属于众包客服服务人员的目标语音数据;
对目标语音数据进行敏感词检测,得到敏感词检测结果;
根据敏感词检测结果,确定众包客服服务人员服务质量的评估结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种众包客服服务的监测方法,其特征在于,所述监测方法包括:
向众包任务参与终端发出录音请求;
响应所述众包任务参与终端反馈的同意指示,实时采集所述众包参与终端录制的录音数据;
从所述录音数据中分离出属于众包客服服务人员的目标语音数据;
对所述目标语音数据进行敏感词检测,得到敏感词检测结果;
根据所述敏感词检测结果,确定所述众包客服服务人员服务质量的评估结果。
2.如权利要求1所述的众包客服服务的监测方法,其特征在于,所述从所述录音数据中分离出属于众包客服服务人员的目标语音数据,包括:
根据所述录音数据的语音状态对所述录音数据进行分割;
提取分割后的录音数据的声纹特征,对所述录音数据的声纹特征进行聚类得到多个聚类结果;
根据各聚类结果与模板声纹特征的相似度,确定属于众包客服服务人员的目标语音数据,其中,所述模板声纹特征是所述众包客服服务人员的历史录音数据的声纹特征。
3.如权利要求1所述的众包客服服务的监测方法,其特征在于,所述根据所述录音数据的语音状态对所述录音数据进行分割,包括:
确定所述录音数据中每一帧的语音帧信息,所述语音帧信息包括采集的语音帧以及所述语音帧对应的时间戳;
检测所述录音数据中每一帧所处的语音状态;
将语音状态为存在语音的状态的语音帧确定为目标语音帧;
根据确定的目标语音帧及其对应的时间戳,对所述录音数据进行分割。
4.如权利要求1所述的众包客服服务的监测方法,其特征在于,所述对所述目标语音数据进行敏感词检测,得到敏感词检测结果,包括:
将所述目标语音数据输入文本转换模型得到目标文本;
对所述目标文本进行分词处理,得到多个目标分词;
将所述目标分词与所述敏感词进行匹配,得到敏感词检测结果
将所述目标分词与所述敏感词进行发音匹配,确定与所述敏感词音近的目标分词为敏感词。
5.如权利要求4所述的众包客服服务的监测方法,其特征在于,所述将包含所述目标词语的目标语音数据输入文本转换模型得到对应的文本数据,包括:
将所述目标语音数据分别输入至少两个ASR模块,各所述ASR模块输出各自对应的转换文本;
对至少两个所述转换文本进行对齐处理,得到各转换文本对应的对齐文本;
对至少两个所述对齐文本的每个对齐位置上的词语进行打分,选择每个对齐位置上得分最高的词语作为目标词语,根据所述目标词语和各所述目标词语对应的对齐位置确定所述目标文本。
6.如权利要求4所述的众包客服服务的监测方法,其特征在于,所述将所述目标分词与所述敏感词进行发音匹配,确定与所述敏感词音近的目标分词为敏感词,包括:
将所述目标分词转化为第一拼音数据,将所述敏感词转化为第二拼音数据,所述第一拼音数据和所述第二拼音数据均包括包含声母和韵母;
所相同位置上字符对应的拼音数据中声母和韵母均相同,则确定所述相同位置上的字符是音近字;和/或,若所述第一拼音数据和第二拼音数据中相同位置上字符对应的拼音数据中包含有声母模糊音且韵母相同时,则确定所述相同位置上的字符是音近字;和/或,若所述第一拼音信息和第二拼音信息中相同位置上字符对应的拼音信息中包含有韵母模糊音且声母相同时,则确定所述相同位置上的字符是音近字。
7.如权利要求1所述的众包客服服务的监测方法,其特征在于,所述根据敏感词识别结果和语音情绪识别结果,确定所述众包客服服务人员服务质量的评估结果,包括:
记录指定时间长度内,众包客服服务人员的目标语音数据中敏感词数量和/或敏感词出现的频率;
根据所述敏感词数量和/或所述敏感词出现的频率,确定所述众包客服服务人员服务质量的评估结果。
8.一种众包客服服务的监测装置,其特征在于,所述监测装置包括:
请求输出模块,用于向众包任务参与终端发出录音请求;
音频采集模块,用于响应所述众包任务参与终端反馈的同意指示,实时采集所述众包参与终端录制的录音数据;
语音筛选模块,用于从所述录音数据中分离出属于众包客服服务人员的目标语音数据;
敏感词检测模块,用于对所述目标语音数据进行敏感词检测,得到敏感词检测结果;
结果输出模块,用于根据所述敏感词检测结果,确定所述众包客服服务人员服务质量的评估结果。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述众包客服服务的监测方法的步骤。
10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述众包客服服务的监测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211096685.5A CN115567642A (zh) | 2022-09-08 | 2022-09-08 | 众包客服服务的监测方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211096685.5A CN115567642A (zh) | 2022-09-08 | 2022-09-08 | 众包客服服务的监测方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115567642A true CN115567642A (zh) | 2023-01-03 |
Family
ID=84740489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211096685.5A Pending CN115567642A (zh) | 2022-09-08 | 2022-09-08 | 众包客服服务的监测方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115567642A (zh) |
-
2022
- 2022-09-08 CN CN202211096685.5A patent/CN115567642A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112804400B (zh) | 客服呼叫语音质检方法、装置、电子设备及存储介质 | |
CN108962282B (zh) | 语音检测分析方法、装置、计算机设备及存储介质 | |
US10522152B2 (en) | Diarization using linguistic labeling | |
WO2020211354A1 (zh) | 基于说话内容的说话者身份识别方法、装置及存储介质 | |
CN110444198B (zh) | 检索方法、装置、计算机设备和存储介质 | |
US9672829B2 (en) | Extracting and displaying key points of a video conference | |
US9171547B2 (en) | Multi-pass speech analytics | |
KR102431754B1 (ko) | 인공지능기반 상담지원장치 | |
Kopparapu | Non-linguistic analysis of call center conversations | |
CN112966082A (zh) | 音频质检方法、装置、设备以及存储介质 | |
CN112233680A (zh) | 说话人角色识别方法、装置、电子设备及存储介质 | |
CN110782902A (zh) | 音频数据确定方法、装置、设备和介质 | |
CN114220461A (zh) | 客服话术的引导方法、装置、设备及存储介质 | |
WO2021012495A1 (zh) | 语音识别结果测试方法、装置、计算机设备和介质 | |
CN113095204B (zh) | 双录数据质检方法、装置及系统 | |
CN113223532B (zh) | 客服通话的质检方法、装置、计算机设备及存储介质 | |
US20180342235A1 (en) | System and method for segmenting audio files for transcription | |
Jia et al. | A deep learning system for sentiment analysis of service calls | |
CN115831125A (zh) | 语音识别方法、装置、设备、存储介质及产品 | |
US11398239B1 (en) | ASR-enhanced speech compression | |
CN115567642A (zh) | 众包客服服务的监测方法、装置、计算机设备和存储介质 | |
CN114356982A (zh) | 营销合规性检查方法、装置、计算机设备及存储介质 | |
WO2021159756A1 (zh) | 基于多模态的响应义务检测方法、系统及装置 | |
CN114462376A (zh) | 基于rpa和ai的庭审笔录生成方法、装置、设备及介质 | |
US11947872B1 (en) | Natural language processing platform for automated event analysis, translation, and transcription verification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |