CN110839112A - 一种问题语音的检测方法和装置 - Google Patents

一种问题语音的检测方法和装置 Download PDF

Info

Publication number
CN110839112A
CN110839112A CN201911132863.3A CN201911132863A CN110839112A CN 110839112 A CN110839112 A CN 110839112A CN 201911132863 A CN201911132863 A CN 201911132863A CN 110839112 A CN110839112 A CN 110839112A
Authority
CN
China
Prior art keywords
detected
text information
call record
target text
attribute data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911132863.3A
Other languages
English (en)
Inventor
关浩华
郑爱武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan Power Supply Bureau of Guangdong Power Grid Corp
Original Assignee
Foshan Power Supply Bureau of Guangdong Power Grid Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan Power Supply Bureau of Guangdong Power Grid Corp filed Critical Foshan Power Supply Bureau of Guangdong Power Grid Corp
Priority to CN201911132863.3A priority Critical patent/CN110839112A/zh
Publication of CN110839112A publication Critical patent/CN110839112A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2227Quality of service monitoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/18Automatic or semi-automatic exchanges with means for reducing interference or noise; with means for reducing effects due to line faults with means for protecting lines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2218Call detail recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5175Call or contact centers supervision arrangements

Abstract

本发明提供了一种问题语音的检测方法和装置,涉及数据处理的技术领域,包括:获取客服终端发送的待检测通话录音;将待检测通话录音转换为文本信息,得到目标文本信息;对目标文本信息进行解析,得到目标文本信息的关键词和/或属性数据;基于关键词和/或属性数据,确定待检测通话录音的录音类型,其中,录音类型用于确定待检测通话录音是否为问题语音,解决了现有技术中问题语音需要通过人工质检才能够检测出,检测效率和准确率低技术问题。

Description

一种问题语音的检测方法和装置
技术领域
本发明涉及数据处理技术领域,尤其是涉及一种问题语音的检测方法和装置。
背景技术
互联网时代、移动互联网时代,客户需求的多样化与个性化日益明显,对服务质量的要求也越来越高,同时也对客户服务热线的服务质量提出更高的要求。客户服务热线的发展,也需要适应时代的变化和发展,以持续给客户提供高品质的服务体验。
现在的问题语音的检测方法有较大局限性:一般通过人工偶尔随机抽听待检测通话录音,导致待检测通话录音检测不客观,进而导致检测效率和准确率低。
针对上述问题,还未提出有效的解决方案。
发明内容
有鉴于此,本发明的目的在于提供一种问题语音的检测方法和装置,以缓解现有技术中由于问题语音需要通过人工质检才能够检测出导致的检测效率和准确率低的技术问题。
第一方面,本发明实施例提供了一种问题语音的检测方法,包括:获取客服终端发送的待检测通话录音;将所述待检测通话录音转换为文本信息,得到目标文本信息;对所述目标文本信息进行解析,得到所述目标文本信息的关键词和/或属性数据;基于所述关键词和/或所述属性数据,确定所述待检测通话录音的录音类型,其中,所述录音类型用于确定所述待检测通话录音是否为问题语音。
进一步地,将所述待检测通话录音转换为文本信息,得到目标文本信息,包括:对所述待检测通话录音中的语音信息进行降噪处理,得到初始待检测通话录音;将所述初始待检测通话录音转化为所述文本信息,得到所述目标文本信息。
进一步地,对所述目标文本信息进行解析,得到所述目标文本信息的关键词,包括:将所述目标文本信息分割为多个待测语句;利用预设分词工具,对每个待测语句进行分词处理,得到所述待测语句中所包含的多个关键词,并将所述待测语句中所包含的多个关键词作为所述目标文本信息的关键词。
进一步地,对所述目标文本信息进行解析,得到所述目标文本信息的属性数据,包括:
将所述目标文本信息分割为多个待测语句;确定出每个所述待测语句的起止时间;基于每个所述待测语句的起止时间,确定出所述目标文本信息的属性数据,所述属性数据包括以下至少之一:任意相邻的两个待测语句中前一个待测语句的终止时间点与后一个待测语句的起始时间点之间的时长,所述待检测通话录音结束的时间点与最后一个待测语句的终止时间点之间的时长,所述待检测通话录音开始的时间点与第一个待测语句的起始时间点之间的时长。
进一步地,基于所述关键词和/或所述属性数据,确定所述待检测通话录音的录音类型,包括:若所述关键词中包含客户服务禁用词,和/或,所述属性数据不符合预设条件,则确定所述待检测通话录音的录音类型为第一类型,其中,所述第一类型表明所述待检测通话录音为问题语音。
进一步地,将所述关键词和所述属性数据输入预设评分模型,以通过所述预设评分模型对所述待检测通话录音进行评分,得到所述待检测通话录音质检评分,其中,所述质检评分用于表征所述待检测通话录音所对应的客户服务质量。
进一步地,所述方法还包括:统计相同客服人员在预设时间内产生的问题语音的数量,以通过所述数量确定客服人员的客户服务质量。
第二方面,本发明实施例还提供了一种问题语音的检测装置,包括:获取单元,转换单元,解析单元和确定单元,其中,所述获取单元用于获取客服终端发送的待检测通话录音;所述转换单元用于将所述待检测通话录音转换为文本信息,得到目标文本信息;所述解析单元用于对所述目标文本信息进行解析,得到所述目标文本信息的关键词和/或属性数据;所述确定单元用于基于所述关键词和/或所述属性数据,确定所述待检测通话录音的录音类型,其中,所述录音类型用于确定所述待检测通话录音是否为问题语音。
第三方面,本发明实施例还提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行第一方面所述的问题语音的检测方法。
第四方面,本发明实施例还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面中所述的问题语音的检测方法。
在本发明实施例中,首先,获取客服终端发送的待检测通话录音;接着,将待检测通话录音转换为文本信息,得到目标文本信息;然后,对目标文本信息进行解析,得到目标文本信息的关键词和/或属性数据;最后,基于关键词和/或属性数据,确定待检测通话录音的录音类型,其中,录音类型用于确定待检测通话录音是否为问题语音。
在本发明实施例中,通过将待检测通话录音转换为文本信息,并通过对文本信息进行解析和质检,确定待检测通话录音是否为问题语音,达到了对待检测通话录音进行检测的目的,进而解决了现有技术中由于问题语音需要通过人工质检才能够检测出导致的检测效率和准确率低的技术问题,从而实现了提高待检测通话录音检测效率和准确率的技术效果。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种问题语音的检测方法的流程图;
图2为本发明实施例提供的一种关键词的提取方法的流程图;
图3为本发明实施例提供的一种属性数据的确定方法的流程图;
图4为本发明实施例提供的一种问题语音的检测装置的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
根据本发明实施例,提供了一种问题语音的检测方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种问题语音的检测方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取客服终端发送的待检测通话录音;
步骤S104,将所述待检测通话录音转换为文本信息,得到目标文本信息;
具体的,在服务器接收到客服终端发送的待检测通话录音之后,对待检测通话录音中的语音信息进行降噪处理,之后通过调用讯飞接口将经过降噪处理后的语音信息转化为文本信息,从而得到目标文本信息。
本发明实施例中,语音转译采用的是科大讯飞语音转译引擎,它在语音识别和多麦克风阵列语音信号处理领域内国际顶尖的技术实力,转译准确性较高。除此之外,还可以选择其他的语音转译引擎,本申请对此不作具体限定。
步骤S106,对所述目标文本信息进行解析,得到所述目标文本信息的关键词和/或属性数据;
步骤S108,基于所述关键词和/或所述属性数据,确定所述待检测通话录音的录音类型,其中,所述录音类型用于确定所述待检测通话录音是否为问题语音。
在本发明实施例中,通过将待检测通话录音转换为文本信息,并通过对文本信息进行解析和质检,确定待检测通话录音是否为问题语音,达到了对待检测通话录音进行检测的目的,进而解决了由于问题语音需要通过人工质检才能够检测出导致的检测效率和准确率低的技术问题,从而实现了提高待检测通话录音检测效率和准确率的技术效果。
需要说明的是,语音分析系统首先将分离后的语音通过声学模型转换为对应的汉语音标符号,音标信息再通过超大词汇网络的语言模型识别出最终对应的文本内容。这个过程中,需结合业务中涉及的各地、各区域地方口音适配,来优化声学模型使其能够广泛覆盖中国地方口音,还需要结合业务知识和热线服务范围,进行语言模型优化以提升语音转写准确率。
在本发明实施例中,如图2所示,步骤S106还包括如下步骤:
步骤S11,将所述目标文本信息分割为多个待测语句;
步骤S12,利用预设分词工具,对每个待测语句进行分词处理,得到所述待测语句中所包含的多个关键词,并将所述待测语句中所包含的多个关键词作为所述目标文本信息的关键词。
在实际应用中,中文分词工具可以采用在线的SCWS即Simple Chinese WordsSegmentation简易中文分词系统(PHP),ICTCLAS即Institute of Computing Technology(C、Python、Java),LTP(Language Technology Plantform)(C++、Python),还有R语言的分词包RWordseg(NLPIR的R接口)等工具等。
例如,“我今天很不开心”转换成:[(1,“我”,“r”),(2,“今天”,“t”),(3,“很”,“d”),(4,“不”,“d”),(5,“开心”,“a”)]。
通过上述分词工具,对每个待测语句进行分词处理,进而得到每个待测语句对应的关键词,从而得到目标文本信息的关键词。
需要说明的是,在对目标文本信息进行分词处理时,可以将目标文本信息拆分为第一文本信息和第二文本信息,其中,第一文本信息为客服人员的文本信息,第二文本信息为来电客户的文本信息。
根据对待检测通话录音不同的检测目的可以进行重点分析。
例如,在对客服人员进客服质量检测时,对第一文本信息进行分词处理,通过第一文本信息的关键词进行检测,判断客服人员在接听来电客户的电话时,是否使用了禁用词语。
在对来电客户的服务要求进行判定时,对第二文本信息进行分词处理,通过对第二文本信息的关键词进行检测,判断来电客户的来电原因,来电客户所要办理的业务,来电客户的意见和建议等等。
通过关键词信息以及所展现的CTI(即Computer TelecommunicationIntegration)信息(包括来电时间、来电号码、归属地等),在涉及到核心业务和关键点处,提升对应关键词的置信度和权重值,使这些具有业务价值的关键词能够被识别出来,以提高语音分析的准确度。然后从已生成的索引文件中进行快速筛选,检索出所关注的目标录音,并可对关注的信息进行自动的统计,从而检索出海量录音文件中包含的统计信息。
另外,还需要说明的是,通过对各个关键词进行分析,确定出各个关键词之间和各个待测语句之间的语义关系,准确判断交集型歧义字段和组合型歧义,修正分词、短语的语义,从而有效判断日常语句行为和明确语义指代,消除错误理解,建立正确理解,进而通过上下文界定对话语境、识别生词、自动消除歧义,形成有效的智能判断逻辑,准确判断语句意义。
在本发明实施例中,如图3所示,步骤S106还包括如下步骤:
步骤S21,将所述目标文本信息分割为多个待测语句;
步骤S22,确定出每个所述待测语句的起止时间;
步骤S23,基于每个所述待测语句的起止时间,确定出所述目标文本信息的属性数据,所述属性数据包括以下至少之一:任意相邻的两个待测语句中前一个待测语句的终止时间点与后一个待测语句的起始时间点之间的时长,所述待检测通话录音结束的时间点与最后一个待测语句的终止时间点之间的时长,所述待检测通话录音开始的时间点与第一个待测语句的起始时间点之间的时长。
在本发明实施例中,在将标文本信息分割为多个待测语句之后,通过待检测通话录音中的时间信息,确定出每个待测语句的起止时间,从而根据每个待测语句的起止时间确定出目标文本信息的属性数据。
属性数据包括:任意相邻的两个待测语句中前一个待测语句的终止时间点与后一个待测语句的起始时间点之间的时长,待检测通话录音结束的时间点与最后一个待测语句的终止时间点之间的时长,待检测通话录音开始的时间点与第一个待测语句的起始时间点之间的时长等。
在本发明实施例中,步骤S108还包括如下步骤:
步骤S31,若所述关键词中包含客户服务禁用词,和/或,所述属性数据不符合预设条件,则确定所述待检测通话录音的录音类型为第一类型,其中,所述第一类型表明所述待检测通话录音为问题语音。
在本发明实施例中,当目标文本信息中包含客户服务禁用词时,和/或,属性数据不符合预设条件,那么就确定待检测通话录音为问题语音。
上述的预设条件为质检人员根据实际情况自行设定的属性数据的预设范围,当属性数据大于或小于预设范围时,则说明待检测通话录音为问题语音,即客服人员在接听客服电话时,存在服务质量较低的情况。
例如,任意相邻的两个待测语句中前一个待测语句的终止时间点与后一个待测语句的起始时间点之间的时长的预设范围为2-4秒,但是在对文本信息进行检测时,第一待测语句的终止时间点与第二待测语句的起始时间点之间的时长为5秒,则说明待检测通话录音中出现话务空白现象。
待检测通话录音结束的时间点与最后一个待测语句的终止时间点之间的时长的预设范围为4-6秒,在对文本信息进行检测时待检测通话录音结束的时间点与最后一个待测语句的终止时间点之间的时长大于6秒,则说明客服人员在通话结束后卫及时挂机,待检测通话录音结束的时间点与最后一个待测语句的终止时间点之间的时长为3秒时,则说明客服人员出现急于挂机的情况,这些均为客户服务质量较低的情况。
另外,在对录音中非结构化的语音文件转换为结构化的文本信息后,可以通过提供多种便捷测听的方式。实现对文字化的录音进行拖动、跳转、关键词附近和全文测听等操作支持,供质检人员使用,从而提升质检效率。
在语音检索过程中通过预先设置的门限,筛查出有长时间静音的数据列表,同时提供对应的起止时间,包括静音的开始时间、结束时间、持续时长等信息。有利于管理人员快速、全面地考量客服人员的业务技能水平和服务规范的执行情况,为后续的质检和管理提供参考和依据。
在本发明实施例中,所述方法还包括如下步骤:
步骤S110,将所述关键词和所述属性数据输入预设评分模型,以通过所述预设评分模型对所述待检测通话录音进行评分,得到所述待检测通话录音质检评分,其中,所述质检评分用于表征所述待检测通话录音所对应的客户服务质量。
步骤S112,统计相同客服人员在预设时间内产生的问题语音的数量,以通过所述数量确定客服人员的客户服务质量。
在本发明实施例中,在确定目标文本信息的关键词和属性数据之后,将关键词和属性数据输入预设评分模型,以通过预设评分模型对待检测通话录音进行评分,得到表征待检测通话录音所对应的客户服务质量的质检评分,从而通过质检评分能够使质检人员直观的对待检测通话录音所对应的客户服务质量进行分析,进而提高了质检人员的工作效率。
另外,还能够根据质检人员的质量对相同客服人员在预设时间内产生的问题语音的数量进行统计,从而判定出客服人员的客户服务质量,进而确定出客服人员的业务水平。
实施例二:
发明实施例还提供了一种问题语音的检测装置的实施例,该问题语音的检测装置主要用于执行本发明实施例上述内容所提供的问题语音的检测方法,以下对本发明实施例提供的问题语音的检测质量做具体介绍。
图4是根据本发明实施例的一种问题语音的检测装置的示意图,如图4所示,该问题语音的检测装置主要包括:获取单元10,转换单元20,解析单元30和确定单元40。
所述获取单元10用于获取客服终端发送的待检测通话录音;
所述转换单元20用于将所述待检测通话录音转换为文本信息,得到目标文本信息;
所述解析单元30用于对所述目标文本信息进行解析,得到所述目标文本信息的关键词和/或属性数据;
所述确定单元40用于基于所述关键词和/或所述属性数据,确定所述待检测通话录音的录音类型,其中,所述录音类型用于确定所述待检测通话录音是否为问题语音。
在本发明实施例中,通过将待检测通话录音转换为文本信息,并通过对文本信息进行解析和质检,确定待检测通话录音是否为问题语音,达到了对待检测通话录音进行检测的目的,进而解决了由于问题语音需要通过人工质检才能够检测出导致的检测效率和准确率低的技术问题,从而实现了提高待检测通话录音检测效率和准确率的技术效果。
优选地,所述转换单元还用于:对所述待检测通话录音中的语音信息进行降噪处理,得到初始待检测通话录音;将所述初始待检测通话录音转化为所述文本信息,得到所述目标文本信息。
优选地,所述解析单元还用于:将所述目标文本信息分割为多个待测语句;利用预设分词工具,对每个待测语句进行分词处理,得到所述待测语句中所包含的多个关键词,并将所述待测语句中所包含的多个关键词作为所述目标文本信息的关键词。
优选地,所述解析单元还用于:将所述目标文本信息分割为多个待测语句;确定出每个所述待测语句的起止时间;基于每个所述待测语句的起止时间,确定出所述目标文本信息的属性数据,所述属性数据包括以下至少之一:任意相邻的两个待测语句中前一个待测语句的终止时间点与后一个待测语句的起始时间点之间的时长,所述待检测通话录音结束的时间点与最后一个待测语句的终止时间点之间的时长,所述待检测通话录音开始的时间点与第一个待测语句的起始时间点之间的时长。
优选地,所述确定单元还用于:若所述关键词中包含客户服务禁用词,和/或,所述属性数据不符合预设条件,则确定所述待检测通话录音的录音类型为第一类型,其中,所述第一类型表明所述待检测通话录音为问题语音。
优选地,所述装置还包括:评分单元,用于将所述关键词和所述属性数据输入预设评分模型,以通过所述预设评分模型对所述待检测通话录音进行评分,得到所述待检测通话录音质检评分,其中,所述质检评分用于表征所述待检测通话录音所对应的客户服务质量。
优选地,所述装置还包括:统计单元,用于统计相同客服人员在预设时间内产生的问题语音的数量,以通过所述数量确定客服人员的客户服务质量。
在本发明的另一个实施例中,还提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述程序代码使所述处理器执行所述问题语音的检测方法。
在本发明的另一个实施例中,还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行所述问题语音的检测方法。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种问题语音的检测方法,其特征在于,包括:
获取客服终端发送的待检测通话录音;
将所述待检测通话录音转换为文本信息,得到目标文本信息;
对所述目标文本信息进行解析,得到所述目标文本信息的关键词和/或属性数据;
基于所述关键词和/或所述属性数据,确定所述待检测通话录音的录音类型,其中,所述录音类型用于确定所述待检测通话录音是否为问题语音。
2.根据权利要求1所述的方法,其特征在于,将所述待检测通话录音转换为文本信息,得到目标文本信息,包括:
对所述待检测通话录音中的语音信息进行降噪处理,得到初始待检测通话录音;
将所述初始待检测通话录音转化为所述文本信息,得到所述目标文本信息。
3.根据权利要求2所述的方法,其特征在于,对所述目标文本信息进行解析,得到所述目标文本信息的关键词,包括:
将所述目标文本信息分割为多个待测语句;
利用预设分词工具,对每个待测语句进行分词处理,得到所述待测语句中所包含的多个关键词,并将所述待测语句中所包含的多个关键词作为所述目标文本信息的关键词。
4.根据权利要求2所述的方法,其特征在于,对所述目标文本信息进行解析,得到所述目标文本信息的属性数据,包括:
将所述目标文本信息分割为多个待测语句;
确定出每个所述待测语句的起止时间;
基于每个所述待测语句的起止时间,确定出所述目标文本信息的属性数据,所述属性数据包括以下至少之一:任意相邻的两个待测语句中前一个待测语句的终止时间点与后一个待测语句的起始时间点之间的时长,所述待检测通话录音结束的时间点与最后一个待测语句的终止时间点之间的时长,所述待检测通话录音开始的时间点与第一个待测语句的起始时间点之间的时长。
5.根据权利要求4所述的方法,其特征在于,基于所述关键词和/或所述属性数据,确定所述待检测通话录音的录音类型,包括:
若所述关键词中包含客户服务禁用词,和/或,所述属性数据不符合预设条件,则确定所述待检测通话录音的录音类型为第一类型,其中,所述第一类型表明所述待检测通话录音为问题语音。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述关键词和所述属性数据输入预设评分模型,以通过所述预设评分模型对所述待检测通话录音进行评分,得到所述待检测通话录音质检评分,其中,所述质检评分用于表征所述待检测通话录音所对应的客户服务质量。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
统计相同客服人员在预设时间内产生的问题语音的数量,以通过所述数量确定客服人员的客户服务质量。
8.一种问题语音的检测装置,其特征在于,包括:获取单元,转换单元,解析单元和确定单元,其中,
所述获取单元用于获取客服终端发送的待检测通话录音;
所述转换单元用于将所述待检测通话录音转换为文本信息,得到目标文本信息;
所述解析单元用于对所述目标文本信息进行解析,得到所述目标文本信息的关键词和/或属性数据;
所述确定单元用于基于所述关键词和/或所述属性数据,确定所述待检测通话录音的录音类型,其中,所述录音类型用于确定所述待检测通话录音是否为问题语音。
9.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行上述权利要求1至7中任一项所述的问题语音的检测方法。
10.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至7中任一项所述的问题语音的检测方法。
CN201911132863.3A 2019-11-18 2019-11-18 一种问题语音的检测方法和装置 Pending CN110839112A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911132863.3A CN110839112A (zh) 2019-11-18 2019-11-18 一种问题语音的检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911132863.3A CN110839112A (zh) 2019-11-18 2019-11-18 一种问题语音的检测方法和装置

Publications (1)

Publication Number Publication Date
CN110839112A true CN110839112A (zh) 2020-02-25

Family

ID=69576542

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911132863.3A Pending CN110839112A (zh) 2019-11-18 2019-11-18 一种问题语音的检测方法和装置

Country Status (1)

Country Link
CN (1) CN110839112A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111597818A (zh) * 2020-04-09 2020-08-28 深圳追一科技有限公司 呼叫质检方法、装置、计算机设备和计算机可读存储介质
CN111916110A (zh) * 2020-08-06 2020-11-10 龙马智芯(珠海横琴)科技有限公司 语音质检的方法及装置
CN112037819A (zh) * 2020-09-03 2020-12-04 阳光保险集团股份有限公司 一种基于语义的语音质检方法和装置
CN112767940A (zh) * 2020-12-22 2021-05-07 泰康保险集团股份有限公司 一种语音培训识别方法、系统、设备及存储介质
CN113129895A (zh) * 2021-04-20 2021-07-16 上海仙剑文化传媒股份有限公司 一种语音检测处理系统
CN113132523A (zh) * 2021-04-19 2021-07-16 广州绿怡信息科技有限公司 通话检测模型训练方法及通话检测方法
CN113593553A (zh) * 2021-07-12 2021-11-02 深圳市明源云客电子商务有限公司 语音识别方法、装置、语音管理服务器以及存储介质
CN113676602A (zh) * 2021-07-23 2021-11-19 上海原圈网络科技有限公司 一种在自动应答中转接人工的处理方法和装置
CN117690439A (zh) * 2024-01-31 2024-03-12 国网安徽省电力有限公司合肥供电公司 一种基于营销场景的语音识别语意理解方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101013421A (zh) * 2007-02-02 2007-08-08 清华大学 基于规则的汉语基本块自动分析方法
CN101662550A (zh) * 2009-09-11 2010-03-03 中兴通讯股份有限公司 呼叫中心服务质量检测方法及系统
CN101950284A (zh) * 2010-09-27 2011-01-19 北京新媒传信科技有限公司 中文分词方法及系统
CN103444160A (zh) * 2011-03-17 2013-12-11 富士通株式会社 话务员评价支援装置、话务员评价支援方法及记录有话务员评价支援程序的存储介质
CN103514150A (zh) * 2012-06-21 2014-01-15 富士通株式会社 识别具有组合型歧义的歧义词的方法和装置
CN106981291A (zh) * 2017-03-30 2017-07-25 上海航动科技有限公司 一种基于语音识别的智能核单质检系统
CN109327632A (zh) * 2018-11-23 2019-02-12 深圳前海微众银行股份有限公司 客服录音的智能质检系统、方法及计算机可读存储介质
CN110069784A (zh) * 2019-05-05 2019-07-30 广东电网有限责任公司 一种语音质检评分方法、装置、终端及可存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101013421A (zh) * 2007-02-02 2007-08-08 清华大学 基于规则的汉语基本块自动分析方法
CN101662550A (zh) * 2009-09-11 2010-03-03 中兴通讯股份有限公司 呼叫中心服务质量检测方法及系统
CN101950284A (zh) * 2010-09-27 2011-01-19 北京新媒传信科技有限公司 中文分词方法及系统
CN103444160A (zh) * 2011-03-17 2013-12-11 富士通株式会社 话务员评价支援装置、话务员评价支援方法及记录有话务员评价支援程序的存储介质
CN103514150A (zh) * 2012-06-21 2014-01-15 富士通株式会社 识别具有组合型歧义的歧义词的方法和装置
CN106981291A (zh) * 2017-03-30 2017-07-25 上海航动科技有限公司 一种基于语音识别的智能核单质检系统
CN109327632A (zh) * 2018-11-23 2019-02-12 深圳前海微众银行股份有限公司 客服录音的智能质检系统、方法及计算机可读存储介质
CN110069784A (zh) * 2019-05-05 2019-07-30 广东电网有限责任公司 一种语音质检评分方法、装置、终端及可存储介质

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111597818A (zh) * 2020-04-09 2020-08-28 深圳追一科技有限公司 呼叫质检方法、装置、计算机设备和计算机可读存储介质
CN111597818B (zh) * 2020-04-09 2023-10-24 深圳追一科技有限公司 呼叫质检方法、装置、计算机设备和计算机可读存储介质
CN111916110A (zh) * 2020-08-06 2020-11-10 龙马智芯(珠海横琴)科技有限公司 语音质检的方法及装置
CN111916110B (zh) * 2020-08-06 2024-04-26 龙马智芯(珠海横琴)科技有限公司 语音质检的方法及装置
CN112037819A (zh) * 2020-09-03 2020-12-04 阳光保险集团股份有限公司 一种基于语义的语音质检方法和装置
CN112767940B (zh) * 2020-12-22 2023-05-16 泰康保险集团股份有限公司 一种语音培训识别方法、系统、设备及存储介质
CN112767940A (zh) * 2020-12-22 2021-05-07 泰康保险集团股份有限公司 一种语音培训识别方法、系统、设备及存储介质
CN113132523A (zh) * 2021-04-19 2021-07-16 广州绿怡信息科技有限公司 通话检测模型训练方法及通话检测方法
CN113132523B (zh) * 2021-04-19 2023-05-26 广州绿怡信息科技有限公司 通话检测模型训练方法及通话检测方法
CN113129895A (zh) * 2021-04-20 2021-07-16 上海仙剑文化传媒股份有限公司 一种语音检测处理系统
CN113593553A (zh) * 2021-07-12 2021-11-02 深圳市明源云客电子商务有限公司 语音识别方法、装置、语音管理服务器以及存储介质
CN113593553B (zh) * 2021-07-12 2022-05-24 深圳市明源云客电子商务有限公司 语音识别方法、装置、语音管理服务器以及存储介质
CN113676602A (zh) * 2021-07-23 2021-11-19 上海原圈网络科技有限公司 一种在自动应答中转接人工的处理方法和装置
CN117690439A (zh) * 2024-01-31 2024-03-12 国网安徽省电力有限公司合肥供电公司 一种基于营销场景的语音识别语意理解方法及系统
CN117690439B (zh) * 2024-01-31 2024-04-16 国网安徽省电力有限公司合肥供电公司 一种基于营销场景的语音识别语意理解方法及系统

Similar Documents

Publication Publication Date Title
CN110839112A (zh) 一种问题语音的检测方法和装置
CN112804400B (zh) 客服呼叫语音质检方法、装置、电子设备及存储介质
CN108962282B (zh) 语音检测分析方法、装置、计算机设备及存储介质
US11037553B2 (en) Learning-type interactive device
WO2020228173A1 (zh) 违规话术检测方法、装置、设备及计算机可读存储介质
CN108682420B (zh) 一种音视频通话方言识别方法及终端设备
CN111128223B (zh) 一种基于文本信息的辅助说话人分离方法及相关装置
CN102623011B (zh) 信息处理装置、信息处理方法及信息处理系统
CN110135879B (zh) 基于自然语言处理的客服质量自动评分方法
CN110177182B (zh) 敏感数据处理方法、装置、计算机设备及存储介质
US20130197908A1 (en) Speech Processing in Telecommunication Networks
KR101795593B1 (ko) 전화상담원 보호 장치 및 그 방법
US8285542B2 (en) Adapting a language model to accommodate inputs not found in a directory assistance listing
JP5496863B2 (ja) 感情推定装置、その方法、プログラム及びその記録媒体
US8719016B1 (en) Speech analytics system and system and method for determining structured speech
CN110198381B (zh) 一种识别ai来电的方法、装置、语音助手、终端、计算机设备及计算机可读存储介质
CN112468659B (zh) 应用于电话客服的质量评价方法、装置、设备及存储介质
CN110929011A (zh) 一种对话分析方法、装置和设备
JP6208794B2 (ja) 会話分析装置、方法及びコンピュータプログラム
JP6605105B1 (ja) 文章記号挿入装置及びその方法
CN110956958A (zh) 搜索方法、装置、终端设备及存储介质
CN111010484A (zh) 一种通话录音自动质检方法
KR102407055B1 (ko) 음성인식 후 자연어 처리를 통한 대화 품질지수 측정장치 및 그 방법
CN111179936A (zh) 通话录音监控方法
CN111970311B (zh) 会话切分方法、电子设备及计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200225

RJ01 Rejection of invention patent application after publication