CN111210842A - 语音质检方法、装置、终端及计算机可读存储介质 - Google Patents

语音质检方法、装置、终端及计算机可读存储介质 Download PDF

Info

Publication number
CN111210842A
CN111210842A CN201911373440.0A CN201911373440A CN111210842A CN 111210842 A CN111210842 A CN 111210842A CN 201911373440 A CN201911373440 A CN 201911373440A CN 111210842 A CN111210842 A CN 111210842A
Authority
CN
China
Prior art keywords
quality inspection
voice
data
detected
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911373440.0A
Other languages
English (en)
Other versions
CN111210842B (zh
Inventor
陈晓
贺泽洲
白翠琴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Hangzhou Information Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Hangzhou Information Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201911373440.0A priority Critical patent/CN111210842B/zh
Publication of CN111210842A publication Critical patent/CN111210842A/zh
Application granted granted Critical
Publication of CN111210842B publication Critical patent/CN111210842B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Abstract

本发明实施例涉及语音处理领域,公开了一种语音质检方法,所述方法包括:获取待测语音文件;根据所述待测语音文件匹配相应的语音质检引擎,利用所述相应的语音质检引擎对所述待测语音文件进行处理,生成质检初始数据;根据预设质检库对所述待测语音文件进行处理,生成质检基准数据;按照预设比对规则比对所述质检初始数据和所述质检基准数据,输出比对结果。本发明还公开了一种语音质检装置、终端及计算机可读存储介质。通过本发明,实现语音质检的自动化测试系统,自动分析质检结果,为引擎的优劣分析以及持续优化提供了便捷高效的自动化测试方案。

Description

语音质检方法、装置、终端及计算机可读存储介质
技术领域
本发明实施例涉及语音处理领域,特别涉及一种语音质检方法、装置、终端及计算机可读存储介质。
背景技术
现如今,已有许多以电话进行客服服务、业务销售的行业,如电信行业、旅游行业、保险行业等等,而客服人员的语音服务质量直接影响到企业的业务,因此,需通过对客服人员的语音通话进行质量评估以确定其符合要求。
随着语音识别技术的迅速发展,现有较为常见的语音质检流程主要包括四个方面,一是需要准备语音测试用例数据文件或者测试音频文件;二是播放音频文件调用语音识别引擎;三是语音识别引擎返回识别结果;四是对语音识别测试结果进行统计和分析,输入测试报告或结果文件等。
例如,相关技术中实现了语音质检的方法及装置,将录音文件通过质检词语数据由通话录音文件转换为通话文本,然后基于预设的质检模板和质检预设阀值输出质检报告。
再例如,相关技术中实现了从呼叫系统获得语音数据,通过文本语音转译和存储,再经由智能生成质检条件模块和智能质检模块得出质检数据输出质检结果。
虽上述方案均能实现对通话语音文件质量的检测,但是无法确认语音质检结果的准备性。而且还需辅以人工检测,自动化程度不高,也导致测试效率低。
发明内容
本发明实施方式的目的在于提供一种语音质检方法,实现语音质检的自动化测试,并自动分析质检结果,解决了人工测试覆盖不全、准确率不高、测试效率低的问题。
为解决上述技术问题,本发明的实施方式提供了一种语音质检方法,所述方法包括:获取待测语音文件;根据所述待测语音文件匹配相应的语音质检引擎,利用所述相应的语音质检引擎对所述待测语音文件进行处理,生成质检初始数据;根据预设质检库对所述待测语音文件进行处理,生成质检基准数据;按照预设比对规则比对所述质检初始数据和所述质检基准数据,输出比对结果。
本发明的实施方式还提供了一种语音质检装置,包括:获取模块,用于获取待测语音文件;第一处理模块,用于根据所述待测语音文件匹配相应的语音质检引擎,利用所述相应的语音质检引擎对所述待测语音文件进行处理,生成质检初始数据;第二处理模块,用于根据预设质检库对所述待测语音文件进行处理,生成质检基准数据;比对模块,用于按照预设比对规则比对所述质检初始数据和所述质检基准数据,输出比对结果。
本发明的实施方式还提供了一种语音质检装置终端,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述的语音质检方法的步骤。
本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述语音质检方法的步骤。
本发明实施方式通过获取待测语音文件,并对待测语音文件匹配相应的质检引擎,生成质检初始数据,即实现了质检系统的自动化,同时,扩大了可质检的待测语音文件的范围,解决了人工测试覆盖不全、测试效率低的问题。通过预设质检库对所述待测语音文件进行处理,生成质检基准数据;并按照预设比对规则比对所述质检初始数据和所述质检基准数据,即实现了质检结果的自动化分析,根据输出的比对结果可获知质检引擎测试的准确度,为引擎的优劣分析及改进提供了方向,解决了质检引擎测试准确率不高的问题。
可选地,所述预设比对规则包括:根据质检评测标准,建立质检规则库;接收对所述质检规则库中的质检规则的选择操作。所述预设比对规则包括质检规则定义和质检规则判定;所述质检规则定义为根据质检评测标准,完成质检规则的定义;所述质检规则判定为根据所述质检规则定义判定所述质检初始数据和所述质检基准数据。
可选地,所述按照预设比对规则比对所述质检初始数据和所述质检基准数据包括:获取质检规则定义中的已选质检规则;基于按照所述已选质检规则,按照所述质检规则判定完成对所述质检初始数据和质检基准数据的比对。
可选地,在所述输出比对结果后,所述方法还包括:按照预设多维度分析项,对所述比对结果进行细化分析;输出与各分析项对应的细化分析结果。
通过多维度的对比较结果进行细化分析,使得对质检引擎的评价更加全面,更加高效的确定改进方向,辅助研发算法的优化。
可选地,所述预设质检库为预先设置的实时更新质检点信息的质检库;所述实时更新质检点信息为:设置质检库升级服务,所述质检库升级服务用于实时获取语音质检信息;根据质检库升级服务自动更新质检库中的质检点信息。
由于预设的质检库可以实施更新质检点信息,即可以获得实时的词库等数据,相比对质检引擎本地存储的词库等数据而言,在使用预设的质检库对待测语音文件进行处理,能获得更加准备,接近理想值的质检结果,即可作为获得质检基准数据的基础。
可选地,所述根据预设质检库对所述质检初始数据进行处理,生成质检基准数据后,所述方法还包括:获取每一质检过程中的所述质检基准数据;利用所述质检基准数据建立语音测试库。
可选地,所述根据所述待测语音文件匹配相应的语音质检引擎包括:对所述待测语音文件进行分类,根据所述待测语音文件的类型,自适应从质检引擎池中匹配相应的语音质检引擎,所述匹配的语音质检引擎数量为至少一种。
由于可以根据所述待测语音文件的类型,自适应从质检引擎池中匹配相应的语音质检引擎,且匹配的语音质检引擎数量还可以为多种,使得本发明的实施方式适用于多种应用场景的语音质检引擎或算法模型的自动化测试,解决了现有技术中仅能对单一的场景进行语音质检的问题。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定。
图1是根据本发明第一实施方式的语音质检方法的流程示意图;
图2是根据本发明实施方式的质检引擎池示意图;
图3是根据本发明第二实施方式的语音质检方法的流程示意图;
图4是根据本发明第三实施方式的语音质检装置的模块示意图;
图5是根据本发明第五实施方式的终端的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
本发明的第一实施方式涉及一种语音质检方法,在本实施方式中,获取待测语音文件;根据所述待测语音文件匹配相应的语音质检引擎,利用所述相应的语音质检引擎对所述待测语音文件进行处理,生成质检初始数据;根据预设质检库对所述待测语音文件进行处理,生成质检基准数据;按照预设比对规则比对所述质检初始数据和所述质检基准数据,输出比对结果。通过获取待测语音文件,并对待测语音文件匹配相应的质检引擎,生成质检初始数据,即实现了质检系统的自动化,同时,扩大了可质检的待测语音文件的范围,解决了人工测试覆盖不全、测试效率低的问题。通过预设质检库对所述待测语音文件进行处理,生成质检基准数据;并按照预设比对规则比对所述质检初始数据和所述质检基准数据,即实现了质检结果的自动分析,根据输出的比对结果可获知质检引擎测试的准确度,为引擎的优劣分析及改进提供了方向,解决了质检引擎测试准确率不高的问题。下面对本实施方式的语音质检方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
本实施方式中的语音质检方法的流程示意图如图1所示,该方法应用于终端。在本实施方式中,根据不同的需求,图1所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。
步骤101:获取待测语音文件。
在本发明实施例中,待测语音文件的来源可以是宽带维装平台、10086客服热线等以电话进行客户服务或销售的行业。通常,待测语音文件为客服与用户的通话录音文件,因其是录音文件,录音环境无法控制,会导致录音质量无法保证,为得到准确的质检结果,可对待测语音文件进行筛选,具体地,对待测语音文件是否为空文件、噪声是否较大、方言是否较重以致无法识别等进行筛选,剔除存在上述问题的文件。
步骤102:根据所述待测语音文件匹配相应的语音质检引擎,利用所述相应的语音质检引擎对所述待测语音文件进行处理,生成质检初始数据。
在本发明实施例中,一般不同类别的待测语音文件可以对应有不同的语音质检引擎,为了能够检测更多的语音文件,可设置语音质检引擎池,请参见图2,质检引擎池201中放置有各种质检引擎1、2、3……,这些质检引擎可以为不同的种类,也可以为同一质检引擎的不同版本。具体地,根据所述待测语音文件匹配相应的语音质检引擎还可以细化为:
步骤1021:对所述待测语音文件进行分类。
在本发明实施例中,根据待测语音文件的具体内容,对其进行分类。具体地,因通话服务涉及的范围较广,不同的待测语音文件通常拥有不同的类型,例如“保险”、“理财”、“办卡”等等。对不同类型的待测语音文件进行数据分类以便后续的语音质检的顺利运行。对批量的待测语音文件,可以根据语音文件涉及的业务类型的不同对语音文件进行分类,并对已分类的待测语音文件按照类别分别存储。与此同时,可对存储空间按照上述类别进行相应的划分,并对各类别进行标识,例如可划分为保险存储空间、理财存储空间等等,则对已分类的待测语音文件可根据存储空间的标识,直接存储进行对应的空间中。对单一待测语音文件,在确定其归属于哪一业务类别后,还可以根据通话的具体内容对语音文件进行分类,例如可分为开场白、结束语等等。同样地,根据类别进行划分后,也可按照上述存储空间的划分方式对已分类的待测语音文件按照类别分别存储。
在本发明其他实施例中,还可以根据待测语音文件的话源进行分类。具体地,根据待测语音文件是单一话源还是多话源进行分类,其中,单一话源是指待测语音文件中只有一个人的语音,例如客服的通话录音文件,多话源是指待测语音文件中有至少两人的语音出现,主要为客服与用户的交互式通话录音文件。同样地,对待测语音文件按照话源分类后,可按照上述存储空间的划分方式对已分类的待测语音文件按照话源的不同分别存储。
步骤1022:根据所述待测语音文件的类型,自适应从质检引擎池中匹配相应的语音质检引擎。
在本发明实施例中,对待测语音文件进行质检,实际上就是按照话者分离、文本转化、关键词识别、语速检测、静音检测、叠音检测、情绪检测等等质检点来对待测语音文件进行处理输出结果,以判断客服的服务质量。具体地,话者分离是则利用声纹识别等技术对语音文件中的客服和用户的通话内容进行话者分离,提取出只含有客服通话内容的语音文件,文本转化是指将通话语音文件的内容自动转写生成文字,关键词识别是指针对客服通话出现服务禁语、缺少规范用语等通话内容的自动质检,语速检测是指针对客服语速过快的自动质检,静音检测是指针对通话中客服长时静音的自动质检,叠音检测是指针对客服抢插话的自动质检,情绪检测是指针对通话中客服情绪异常自动质检。而质检引擎中可根据质检要求侧重点的不同设置上述各质检点,并存储相应的数据,例如与关键词检测相对应的不符合服务规范的用语词库等等,该类数据基本属于本地存储数据,那么将待测语音文件输入质检引擎中,即可自动按照上述质检点对待测语音文件进行质检,得到质检结果。
在本发明实施例中,质检引擎池201中有不同种类的质检引擎,例如与理财类对应的语音质检引擎、与保险类对应的语音质检引擎、与多话源对应的语音质检引等等,也有相同种类、但是拥有不同版本号的质检引擎。需要说明的是,单一话源和多话源对应的语音质检引擎的区别在于,单一话源中无需话者分离这一质检点。在构建质检引擎池时,同样地,也可对质检引擎池中质检引擎进行类别标记,便于与待测语音文件的匹配。因此对于已分类的待测语音文件可自适应地根据自身的类别从质检引擎池201中匹配相应的语音质检引擎。具体地,获取待测语音文件的存储空间标识,根据该标识获知该待测语音文件的类型,再与质检引擎池201中类别标记进行比对,对比对结果一致的,确定其为匹配成功的质检引擎。需要说明的是,本申请支持单个质检引擎或多个质检引擎的选取,也支持对同一质检引擎可选择多个不同版本进行对比测试,从而判定迭代的过程是否达到提升和改进的效果。例如,若待测语音文件是保险类,而在质检引擎池带有保险标志的质检引擎数量大于一,则可从中选择一个或多个质检引擎。
在选定质检引擎后,按照选定的质检引擎中的质检点对待测语音文件进行处理,生成质检初始数据。例如,选定的质检引擎中的质检点包括文本转化和关键词检测,则质检引擎先对待测语音文件进行文本转化、再对转化的文本进行关键词检测,该关键词检测具体是指将转化的文本与质检引擎中的不符合服务规范的用语词库进行比对,挑选出不符合服务规范的用语,那么生成的质检初始数据即为该待测语音文件的转化后的文本和关键词检测中检测出的不符合服务规范的用语。
步骤103:根据预设质检库对所述待测语音文件进行处理,生成质检基准数据。
在本发明实施例中,为获取质检基准数据,需预先设置质检库,该质检库为可实时更新质检点信息的质检库,其中,质检点信息包括关键词信息、情绪信息、质检公式信息等等。具体地,设置质检库升级服务,该质检库升级服务用于实时获取语音质检信息;根据质检库升级服务自动更新质检库中的质检点信息。其中,语音质检信息可包括语言通用词库,服务规范词库等等,实时获取的方式可以为连接内部数据库进行更新,也可以连接大数据平台进行更新,当相应的大数据平台有数据更新时,就可以实时将对应的更新数据同步到语音质检信息,实现质检库升级服务中数据的更新,还可以通过应用爬虫技术,通过爬取,定时自动更新质检库升级服务的数据,完善模型。爬虫技术主要针对与网络网页,又称网络爬虫、网络蜘蛛,可以自动化浏览网络中的信息,或者说是一种网络机器人。它们被广泛用于互联网搜索引擎或其他类似网站,以获取或更新这些网站的内容和检索方式。它们可以自动采集所有其能够访问到的页面内容,以获取所需数据。利用爬虫自动采集互联网中的信息(图片、文字、链接等),采集回来并按照一定的规则和筛选标准进行数据归类形成数据库文件。
在本发明其他实施例中,质检库升级服务可设置对质检库中质检点信息的自动更新的频率和时间,例如可设置自动更新时间为一周,则在这一周时间内即使质检库升级服务已有更新数据也不会主动更新质检库中的质检点信息,在时间满一周后则自动更新。
因预设的质检库可对自身数据进行实时更新,而质检引擎中的数据基本都是本地存储的,基本没有更新或者更新频率较低,所以预设质检库中的数据比起质检引擎池中质检引擎的存储的数据覆盖范围更广更先进,那么在以预设质检库为基础,按照步骤1022中描述到的质检点对待测语音文件进行质检时,得到的质检结果会更加准确,可认为其接近理想值,即为质检基准数据。例如,同样是对待测语音文件进行关键词检测,利用质检引擎检测出的不符合服务规范的词可能是“不行”、“别说了”、“停”这3个、而因预设质检库中的词库的实时更新,则检测出的不符合服务规范的词可能为“不行”、“别说了”、“停”、“亲”、“杠精”这5个,比通过质检引擎检测出的结果更加准确,可将其作为质检基准数据。
在本发明其他实例中,在对待测语音文件进行文本转化时,对于已进行多次质检的待测语音文件而言,文本转化的结果已处于稳定状态,且得到的文本转化的结果几乎不会受数据更新的影响,考虑到文本转化的工作量较大,为提高质检效率,可设置在根据预设质检库对待测语音文件进行处理前,先判断待测语音文件是否是第一次接受质检,若不是,则获取质检初始数据中的文本转化数据,将其直接作为质检基准数据;若是,则仍根据预设质检库对待测语音文件进行处理,生成质检基准数据。
因预设的质检库可对自身数据进行实时更新,而质检引擎中的数据基本都是本地存储的,基本没有更新或者更新频率较低,所以预设质检库中的数据比起质检引擎池中质检引擎的基础数据覆盖范围更广更先进,那么在以预设质检库为基础,按照步骤1022中描述到的质检点对待测语音文件进行质检时,得到的质检结果会更加准确,可认为其接近理想值,即为质检基准数据。例如,同样是对待测语音文件进行关键词检测,利用质检引擎检测出的不符合服务规范的词可能是“不行”、“别说了”、“停”这3个、而因预设质检库中的词库的实时更新,则检测出的不符合服务规范的词可能为“不行”、“别说了”、“停”、“亲”、“杠精”这5个,比通过质检引擎检测出的结果更加准确,可将其作为质检基准数据。
在本发明其他实例中,在对待测语音文件进行文本转化时,对于已进行多次质检的待测语音文件而言,文本转化的结果已处于稳定状态,且得到的文本转化的结果几乎不会受数据更新的影响,考虑到文本转化的工作量较大,为提高质检效率,可设置在根据预设质检库对待测语音文件进行处理前,先判断待测语音文件是否是第一次接受质检,若不是,则获取质检初始数据中的文本转化数据,将其直接作为质检基准数据;若是,则仍根据预设质检库对待测语音文件进行处理,生成质检基准数据。
在本发明其他实施例中,生成质检基准数据后,利用质检基准数据建立语音测试库。具体地,获取每次语音质检过程中的质检基准数据,通过积累、形成海量的语音文件的质检基准数据,从而建立语音测试库,并引用测试库中的数据对质检引擎进行回归测试,提高后续质检引擎自动化测试的效率,其中,回归测试是指重新对质检引擎进行测试以确认修改没有引入新的错误或导致其他代码产生错误。自动回归测试将大幅降低测试、维护升级等阶段的成本。
步骤104:按照预设比对规则比对所述质检初始数据和所述质检基准数据,输出比对结果。
在本发明实施例中,因质检初始数据和质检基准数据所涵盖的质检点较多,若按照质检点一一比对,虽然输出的比对结果会覆盖范围广,但是争对性不强,若厂商只想获知其中一项的比对结果,那么全面比对的方式比较浪费资源,为使输出的比对结果具有争对性和覆盖范围可调整,可预设比对规则。
具体地,先建立质检规则库,为使质检规则库中的质检规则较全面,可根据质检评测标准来建立该质检规则库,其中,质检评测标准中涵盖所有种类的语音文件在进行质检时所需检测的质检点,需要说明的是,此处的质检规则相当于上述的质检点。该质检规则库可接收自定义选择,即可接收对质检规则库中的质检规则的选择操作。对于质检规则的选择操作,可根据特殊质检要求对质检规则进行选择,例如,某一厂商的关注点在质检引擎的关键词检测和情绪检测的准确性上,则可对质检规则库中关键词检测和情绪检测进行勾选。还可以根据质检粒度的大小,可对质检规则进行无差别筛选,其中质检粒度为对质检细化程度的要求,细化程度越高,粒度级就越小;相反,细化程度越低,粒度级就越大。也就是说,要求的质检细化程度越高,选择的质检规则也就越多。
在完成对质检规则库中的质检规则的选择后,步骤104还可以细化为:
步骤1041:获取已选质检规则。
在本发明实施例中,获取上述中被筛选出的质检规则,即已选质检规则。
步骤1042:按照已选质检规则,完成对所述质检初始数据和质检基准数据的比对。
在本发明实施例中,读取被选中的质检规则,按照选中的质检规则将质检引擎完成的质检初始数据和基于预设质检库完成的质检基准数据做规则比对,并输出比对结果,以根据比对结果判断质检引擎完成的质检结果的准确性。例如,已选的质检规则为关键词检测,则分别获取质检初始数据中的关键词检测的结果和质检基准数据中的关键词检测的结果,对这两种结果进行比对,将质检基准数据中的关键词检测的结果作为基准,输出质检引擎在关键词检测上的准确率或偏差。
在本发明其他实施例中,因质检引擎池支持多个质检引擎的接入,还可以比较针对同一待测语音文件的不同质检引擎的质检效果,例如,当一待测语音文件匹配的是同一质检引擎的不同版本A、B、C时,可分别获取不同版本的质检引擎A、B、C对待测语音文件进行处理后的质检初始数据A1、B1、C1,再获得质检基础数据A2、B2、C2后,将其与质检基准数据比较,输出各个质检引擎的比对结果A3、B3、C3,则可对A3、B3、C3的比较,确定出各不同版本的质检引擎的优劣,也可获知该质检引擎版本的改版方向是否正确,以便及时修正。
与现有技术相比,本发明实施方式了实现语音质检的自动化测试系统,自动分析质检结果,为引擎的优劣分析以及持续优化提供了便捷高效的自动化测试方案。
本发明的第二实施方式涉及一种语音质检方法。第二实施方式与第一实施方式大致相同,主要区别之处在于:对质检初始数据和质检基准数据的比对进一步细化,得到多维度统计的比对分析结果。
本实施方式中的语音质检方法如图3所示,步骤101-步骤104与本发明的第一实施例一致,在此不再赘述,在步骤104后,所述语音质检方法还包括:
步骤S301:按照预设多维度分析项,对所述比对结果进行细化分析。
在本发明实施例中,为得到多维度的比对分析结果,预先对分析项的多维度进行设置,举例来说,可设置为质检记录分析、质检结果分析、不合格原因分析、无法识别原因分析、检测目标值差距化分析等等。
步骤S302:输出与各分析项对应的细化分析结果。
在本发明实施例中,按照各分析项对比对结果进行细化分析后,输出与分析项相对的细化分析结果,此类细化分析结果可从多维度提供质检引擎算法的改进思路,以检测目标值差距化分析为例,将质检初始数据与质检基准数据的关键词质检数据、句子质检数据、情绪质检数据一起输入,进行比对分析,计算得到两者的在上述分析项的差距值。
与现有技术相比,本发明实施方式,多维度的对比较结果进行细化分析,使得对质检引擎的评价更加全面,更加高效的确定质检引擎的改进方向,辅助研发算法的优化。
上面各种方法的步骤划分,只是为了描述清楚,并不对步骤执行的先后顺序进行限定,而且实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明第三实施方式涉及一种语音质检装置,如图4所示,包括:
获取模块401,用于获取待测语音文件;
第一处理模块402,用于根据所述待测语音文件匹配相应的语音质检引擎,利用所述相应的语音质检引擎对所述待测语音文件进行处理,生成质检初始数据;
第二处理模块403,用于根据预设质检库对所述待测语音文件进行处理,生成质检基准数据;
比对模块404,用于按照预设比对规则比对所述质检初始数据和所述质检基准数据,输出比对结果。
不难发现,本实施方式为与第一实施方式相对应的系统实施例,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
本发明第四实施方式涉及一种语音质检方法。第四实施方式与第三实施方式大致相同,主要区别之处在于:对质检初始数据和质检基准数据的比对进一步细化,得到多维度统计的比对分析结果。
由于第二实施方式与本实施方式相互对应,因此本实施方式可与第二实施方式互相配合实施。第二实施方式中提到的相关技术细节在本实施方式中依然有效,在第二实施方式中所能达到的技术效果在本实施方式中也同样可以实现,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第二实施方式中。
本发明第五实施方式涉及一种终端,如图5所示,包括至少一个处理器501;以及,与至少一个处理器501通信连接的存储器502;其中,存储器502存储有可被至少一个处理器501执行的指令,指令被至少一个处理器501执行,以使至少一个处理器501能够执行上述的语音质检方法的步骤。
其中,处理器501和存储器502采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器501和存储器502的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器501处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器501。
处理器501负责管理总线和通常的处理,还可以提供各种功能,包括定时、外围接口、电压调节、电源管理以及其他控制功能。而存储器502可以被用于存储处理器501在执行操作时所使用的数据。
本发明第六实施方式涉及了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述语音质检方法的步骤。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

Claims (10)

1.一种语音质检方法,其特征在于,所述方法包括:
获取待测语音文件;
根据所述待测语音文件匹配相应的语音质检引擎,利用所述相应的语音质检引擎对所述待测语音文件进行处理,生成质检初始数据;
根据预设质检库对所述待测语音文件进行处理,生成质检基准数据;
按照预设比对规则比对所述质检初始数据和所述质检基准数据,输出比对结果。
2.根据权利要求1所述的语音质检方法,其特征在于,所述预设比对规则包括:
根据质检评测标准,建立质检规则库;
接收对所述质检规则库中的质检规则的选择操作。
3.根据权利要求2所述的语音质检方法,其特征在于,所述按照预设比对规则比对所述质检初始数据和所述质检基准数据包括:
获取已选质检规则;
按照所述已选质检规则,完成对所述质检初始数据和质检基准数据的比对。
4.根据权利要求1至3中任一项所述的语音质检方法,其特征在于,在所述输出比对结果后,所述方法还包括:
按照预设多维度分析项,对所述比对结果进行细化分析;
输出与各分析项对应的细化分析结果。
5.根据权利要求1所述的语音质检方法,其特征在于,所述预设质检库为预先设置的实时更新质检点信息的质检库;
所述实时更新质检点信息为:
设置质检库升级服务,所述质检库升级服务用于实时获取语音质检信息;
根据质检库升级服务自动更新质检库中的质检点信息。
6.根据权利要求1所述的语音质检方法,其特征在于,所述根据预设质检库对所述质检初始数据进行处理,生成质检基准数据后,所述方法还包括:
获取每一质检过程中的所述质检基准数据;
利用所述质检基准数据建立语音测试库。
7.根据权利要求1所述的语音质检方法,其特征在,所述根据所述待测语音文件匹配相应的语音质检引擎包括:
对所述待测语音文件进行分类;
根据所述待测语音文件的类型,自适应从质检引擎池中匹配相应的语音质检引擎,所述匹配的语音质检引擎数量为至少一种。
8.一种语音质检装置,其特征在于,所述装置包括:
获取模块,用于获取待测语音文件;
第一处理模块,用于根据所述待测语音文件匹配相应的语音质检引擎,利用所述相应的语音质检引擎对所述待测语音文件进行处理,生成质检初始数据;
第二处理模块,用于根据预设质检库对所述待测语音文件进行处理,生成质检基准数据;
比对模块,用于按照预设比对规则比对所述质检初始数据和所述质检基准数据,输出比对结果。
9.一种终端,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一项所述的语音质检方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的语音质检方法的步骤。
CN201911373440.0A 2019-12-27 2019-12-27 语音质检方法、装置、终端及计算机可读存储介质 Active CN111210842B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911373440.0A CN111210842B (zh) 2019-12-27 2019-12-27 语音质检方法、装置、终端及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911373440.0A CN111210842B (zh) 2019-12-27 2019-12-27 语音质检方法、装置、终端及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111210842A true CN111210842A (zh) 2020-05-29
CN111210842B CN111210842B (zh) 2023-04-28

Family

ID=70786435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911373440.0A Active CN111210842B (zh) 2019-12-27 2019-12-27 语音质检方法、装置、终端及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111210842B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112468658A (zh) * 2020-11-20 2021-03-09 平安普惠企业管理有限公司 语音质量检测方法、装置、计算机设备及存储介质
CN112511698A (zh) * 2020-12-03 2021-03-16 普强时代(珠海横琴)信息技术有限公司 一种基于通用边界检测的实时通话分析方法
CN113113046A (zh) * 2021-04-14 2021-07-13 杭州朗和科技有限公司 音频处理的性能检测方法、装置、存储介质及电子设备
CN113724708A (zh) * 2021-07-23 2021-11-30 山东环维通讯科技有限公司 一种语音转化成文本智能核单的质检系统
CN113903358A (zh) * 2021-10-15 2022-01-07 北京房江湖科技有限公司 语音质检方法、可读存储介质及计算机程序产品
CN114155859A (zh) * 2020-08-18 2022-03-08 马上消费金融股份有限公司 检测模型训练方法、语音对话检测方法及相关设备
CN114842849A (zh) * 2022-04-24 2022-08-02 马上消费金融股份有限公司 语音对话检测方法及装置
CN115579022A (zh) * 2022-12-09 2023-01-06 南方电网数字电网研究院有限公司 叠音检测方法、装置、计算机设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106934000A (zh) * 2017-03-03 2017-07-07 深圳市彬讯科技有限公司 一种呼叫系统的语音自动质检方法及系统
JP2017135642A (ja) * 2016-01-29 2017-08-03 株式会社日立システムズ 電話音声モニタリング評価システム
CN108737667A (zh) * 2018-05-03 2018-11-02 平安科技(深圳)有限公司 语音质检方法、装置、计算机设备及存储介质
CN109389971A (zh) * 2018-08-17 2019-02-26 深圳壹账通智能科技有限公司 基于语音识别的保险录音质检方法、装置、设备和介质
CN109448730A (zh) * 2018-11-27 2019-03-08 广州广电运通金融电子股份有限公司 一种自动语音质检方法、系统、装置及存储介质
CN109740459A (zh) * 2018-12-19 2019-05-10 创新奇智(合肥)科技有限公司 一种图像差异对比方法、系统及无人售货装置
CN110288192A (zh) * 2019-05-23 2019-09-27 平安科技(深圳)有限公司 基于多个质检模型的质检方法、装置、设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017135642A (ja) * 2016-01-29 2017-08-03 株式会社日立システムズ 電話音声モニタリング評価システム
CN106934000A (zh) * 2017-03-03 2017-07-07 深圳市彬讯科技有限公司 一种呼叫系统的语音自动质检方法及系统
CN108737667A (zh) * 2018-05-03 2018-11-02 平安科技(深圳)有限公司 语音质检方法、装置、计算机设备及存储介质
CN109389971A (zh) * 2018-08-17 2019-02-26 深圳壹账通智能科技有限公司 基于语音识别的保险录音质检方法、装置、设备和介质
CN109448730A (zh) * 2018-11-27 2019-03-08 广州广电运通金融电子股份有限公司 一种自动语音质检方法、系统、装置及存储介质
CN109740459A (zh) * 2018-12-19 2019-05-10 创新奇智(合肥)科技有限公司 一种图像差异对比方法、系统及无人售货装置
CN110288192A (zh) * 2019-05-23 2019-09-27 平安科技(深圳)有限公司 基于多个质检模型的质检方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄翊: "基于智能语音分析的客服智慧运营管理系统解决方案", 《科技信息探索》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114155859A (zh) * 2020-08-18 2022-03-08 马上消费金融股份有限公司 检测模型训练方法、语音对话检测方法及相关设备
CN114155859B (zh) * 2020-08-18 2023-08-08 马上消费金融股份有限公司 检测模型训练方法、语音对话检测方法及相关设备
CN112468658A (zh) * 2020-11-20 2021-03-09 平安普惠企业管理有限公司 语音质量检测方法、装置、计算机设备及存储介质
CN112468658B (zh) * 2020-11-20 2022-10-25 平安普惠企业管理有限公司 语音质量检测方法、装置、计算机设备及存储介质
CN112511698A (zh) * 2020-12-03 2021-03-16 普强时代(珠海横琴)信息技术有限公司 一种基于通用边界检测的实时通话分析方法
CN113113046A (zh) * 2021-04-14 2021-07-13 杭州朗和科技有限公司 音频处理的性能检测方法、装置、存储介质及电子设备
CN113113046B (zh) * 2021-04-14 2024-01-19 杭州网易智企科技有限公司 音频处理的性能检测方法、装置、存储介质及电子设备
CN113724708A (zh) * 2021-07-23 2021-11-30 山东环维通讯科技有限公司 一种语音转化成文本智能核单的质检系统
CN113903358A (zh) * 2021-10-15 2022-01-07 北京房江湖科技有限公司 语音质检方法、可读存储介质及计算机程序产品
CN114842849A (zh) * 2022-04-24 2022-08-02 马上消费金融股份有限公司 语音对话检测方法及装置
CN114842849B (zh) * 2022-04-24 2023-08-08 马上消费金融股份有限公司 语音对话检测方法及装置
CN115579022A (zh) * 2022-12-09 2023-01-06 南方电网数字电网研究院有限公司 叠音检测方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN111210842B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
CN111210842B (zh) 语音质检方法、装置、终端及计算机可读存储介质
CN112804400B (zh) 客服呼叫语音质检方法、装置、电子设备及存储介质
US8010343B2 (en) Disambiguation systems and methods for use in generating grammars
CN112492111B (zh) 一种智能语音外呼方法、装置、计算机设备和存储介质
CN110148400B (zh) 发音类型的识别方法、模型的训练方法、装置及设备
US20030040907A1 (en) Speech recognition system
CA3174601A1 (en) Text intent identifying method, device, computer equipment and storage medium
CN104903954A (zh) 使用基于人工神经网络的亚语音单位区分的说话人验证及识别
CN108305618B (zh) 语音获取及搜索方法、智能笔、搜索终端及存储介质
CN104299623A (zh) 语音应用中用于自动确认和消歧模块的方法和系统
CN111581388A (zh) 一种用户意图识别方法、装置及电子设备
CN111354354B (zh) 一种基于语义识别的训练方法、训练装置及终端设备
CN113709313B (zh) 客服通话数据智能质检方法、装置、设备及介质
CN110852082B (zh) 同义词的确定方法及装置
CN110489740B (zh) 语义解析方法及相关产品
CN116383710A (zh) 标签确定方法、装置、电子设备及存储介质
CN113015002B (zh) 一种主播视频数据的处理方法和装置
CN114564968A (zh) 基于人机对话的意图识别方法、系统、终端及介质
CN110083807B (zh) 合同的修改影响自动预测方法、装置、介质及电子设备
Chung et al. A question detection algorithm for text analysis
CN112395402A (zh) 基于深度模型的推荐话术生成方法、装置和计算机设备
KR20220099690A (ko) 문서를 요약하는 장치, 방법 및 컴퓨터 프로그램
KR102621633B1 (ko) 개발 제품의 인증 프로세스 정보 제공 시스템 및 그 방법
CN112069293B (zh) 一种数据标注方法、装置、电子设备和计算机可读介质
US11462212B2 (en) Document identification device, document identification method, and program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant