CN117854547A - 一种语音质检方法及装置、电子设备、存储介质 - Google Patents

一种语音质检方法及装置、电子设备、存储介质 Download PDF

Info

Publication number
CN117854547A
CN117854547A CN202311613041.3A CN202311613041A CN117854547A CN 117854547 A CN117854547 A CN 117854547A CN 202311613041 A CN202311613041 A CN 202311613041A CN 117854547 A CN117854547 A CN 117854547A
Authority
CN
China
Prior art keywords
voice data
target voice
target
speech
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311613041.3A
Other languages
English (en)
Inventor
王月宝
沈鹏
黄明星
周晓波
陈辉亮
段彦夺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shuidi Technology Group Co ltd
Original Assignee
Beijing Shuidi Technology Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shuidi Technology Group Co ltd filed Critical Beijing Shuidi Technology Group Co ltd
Priority to CN202311613041.3A priority Critical patent/CN117854547A/zh
Publication of CN117854547A publication Critical patent/CN117854547A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请涉及语音识别技术领域,公开了一种语音质检方法及装置、电子设备、存储介质;其方法包括:获取目标语音数据;确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量;基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定。本申请能够检测出不合规的通话,且无需调用GPU,降低物力消耗和人力消耗。

Description

一种语音质检方法及装置、电子设备、存储介质
技术领域
本公开涉及语音识别技术领域,具体而言,涉及一种语音质检方法及装置、电子设备、存储介质。
背景技术
在网络销售或电话销售领域,公司的员工需要和顾客进行电话沟通,一些公司为了提高员工的工作效率,会设置全勤奖或最低通话时长,然而一些员工为了满足最低通话时长或者满足全勤奖要求,会出现作弊行为,比如:打电话给自己,或者在拨通电话后播放音乐等其他不相关内容,或者单纯挂通电话但无通话声音。
目前主要通过预训练语言模型(Bidirectional Encoder Representation fromTransformers,Bert)判断通话是否存在作弊行为,但通话长度往往在数十分钟,而Bert模型文本长度输入有限,且Bert模型需要调用图形处理器(Graphics Processing Unit,GPU),物力成本和时间成本均较高。
发明内容
针对上述情况,本申请实施例提供了一种语音质检方法及装置、电子设备、存储介质,旨在解决上述问题或者至少部分地解决上述问题。
第一方面,本申请实施例提供了一种语音质检方法,所述方法包括:获取目标语音数据;确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量;基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定。
在一些实施例中,所述确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,包括:基于语音识别技术对所述目标语音数据进行识别,生成目标文本;基于所述目标文本确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量。
在一些实施例中,所述基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定,包括:若所述目标语音数据的语速无异常,则基于所述目标语音数据的关键词含量,检测所述目标语音数据是否符合预设规定。
在一些实施例中,所述基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定,包括:若所述目标语音数据的语速异常,确定所述目标语音数据不符合预设规定。
在一些实施例中,基于以下方式确定所述目标语音数据的语速是否异常:若所述目标语音数据的语速小于语速阈值,则确定所述目标语音数据的语速异常;若所述目标语音数据的语速大于或等于所述语速阈值,则确定所述目标语音数据的语速无异常。
在一些实施例中,所述语速阈值基于正语音样本的语速和负语音样本的语速确定;其中,所述正语音样本表示合规语音,所述负语音样本表示不合规语音。
在一些实施例中,所述基于所述目标语音数据的关键词含量,确定所述目标语音数据是否符合预设规定,包括:若所述目标语音数据的关键词含量小于预设关键词含量,确定所述目标语音数据不符合预设规定;若所述目标语音数据的关键词含量大于或等于所述预设关键词含量,确定所述目标语音数据符合预设规定。
第二方面,本申请实施例还提供了一种语音质检装置,所述装置包括:
获取模块,用于获取目标语音数据;处理模块,用于确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量;检测模块,用于基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定。
在一些实施例中,处理模块,具体用于基于以下方式确定目标语音数据的语速和/或目标语音数据包含的关键词含量:基于语音识别技术对目标语音数据进行识别,生成目标文本;基于目标文本确定目标语音数据的语速和/或目标语音数据包含的关键词含量。
在一些实施例中,处理模块,具体用于基于以下方式确定目标语音数据的语速和/或目标语音数据包含的关键词含量:若目标语音数据的语速无异常,则基于目标语音数据的关键词含量,检测目标语音数据是否符合预设规定。
在一些实施例中,检测模块,具体用于基于以下方式检测目标语音数据是否符合预设规定:若目标语音数据的语速异常,确定目标语音数据不符合预设规定。
在一些实施例中,基于以下方式确定目标语音数据的语速是否异常:若目标语音数据的语速小于语速阈值,则确定目标语音数据的语速异常;若目标语音数据的语速大于或等于语速阈值,则确定目标语音数据的语速无异常。
在一些实施例中,语速阈值基于正语音样本的语速和负语音样本的语速确定;其中,正语音样本表示合规语音,负语音样本表示不合规语音。
在一些实施例中,检测模块,具体用于基于以下方式确定目标语音数据是否符合预设规定,包括:若目标语音数据的关键词含量小于预设关键词含量,确定目标语音数据不符合预设规定;若目标语音数据的关键词含量大于或等于预设关键词含量,确定目标语音数据符合预设规定。
第三方面,本申请实施例还提供了一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,可执行指令在被执行时使处理器执行上述第一方面的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储一个或多个程序,一个或多个程序当被包括多个应用程序的电子设备执行时,使得电子设备执行上述第二方面的步骤。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:本申请通过检测语音数据的语速,可识别单纯挂通的场景,通过检测语音数据的关键词含量,可以识别播放不相关录音的场景,从而查找出不合规行为。并且本申请的方案无需调用GPU,降低物力消耗和人力消耗。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种语音质检方法的流程示意图;
图2示出了本申请另一实施例提供的一种语音质检方法的流程图;
图3示出了本申请又一实施例提供的一种语音质检方法的流程图;
图4示出了本申请又一实施例提供的一种语音质检方法的流程图;
图5示出了本申请又一实施例提供的一种语音质检方法的流程图;
图6示出了本申请实施例提供的一种语音质检装置的结构图;
图7示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”及其变体要被解读为意味着“包括但不限于”的开放式术语。
在网络销售或电话销售领域,公司的员工需要和顾客进行电话沟通,一些公司为了提高员工的工作效率,会设置全勤奖或最低通话时长,然而存在员工为了满足最低通话时长或者满足全勤奖要求,会出现作弊行为,比如:打电话给自己,或者在拨通电话后播放音乐等其他不相关内容,或者单纯挂通电话但无通话声音。
目前主要通过预训练语言模型(Bidirectional Encoder Representation fromTransformers,Bert)判断通话是否存在作弊行为,但通话长度往往在数十分钟,而Bert模型文本长度输入有限,且Bert模型需要调用图形处理器(Graphics Processing Unit,GPU),物力成本和时间成本均较高。
经分析,将语音经过语音识别技术转译为文字后,如果员工单纯挂通电话不出声会导致语速异常;如果播放音乐或者收音机中的内容等其他不相关内容,可以通过语义识别等手段进行识别。
基于此,本发明提出了一种语音质检方法,通过检测语音数据的语速,可识别单纯挂通的场景,通过检测语音数据的关键词含量,可以识别播放不相关录音的场景,从而抑制不合规行为的出现。并且本申请的方案无需调用GPU,降低物力消耗和人力消耗。
下面通过具体的实施例对本申请进行详细的描述。
图1示出了根据本申请提供的一个实施例的一种语音质检方法的流程示意图,从图1可以看出,该方法可以包括步骤S101~步骤S103:
步骤S101:获取目标语音数据。
其中,目标语音数据可以是员工与顾客打电话的通话录音。一次通话的录音为一个目标语音数据,或将一次通话的录音拆分为多个目标语音数据。
步骤S102:确定目标语音数据的语速和/或目标语音数据包含的关键词含量。
步骤S103:基于目标语音数据的语速和/或目标语音数据包含的关键词含量,检测目标语音数据是否符合预设规定。
当电话为单纯挂通场景时,语音数据为空白即无人说话,或语音数据中内容很少,此时语音数据的语速为0或过低或异常,因此基于语音数据的语速可判断出单纯挂通的场景,进而判断为不合规的通话记录。当电话录音为播放音乐或其他音频数据时,此时的语音数据不包含相关领域的领域关键词,例如保险销售领域的关键词为:保障、理赔、赔付等,因此可基于语音数据所包含的关键词识别出播放音乐或其他音频数据的场景,进而判断为不合规的通话记录。
从图1所示的方法可以看出,本申请通过检测语音数据的语速,可识别单纯挂通的场景,通过检测语音数据的关键词含量,可以识别播放不相关录音的场景,从而抑制不合规行为的出现。并且本申请的方案无需调用GPU,降低物力消耗和人力消耗。
在本申请的一些实施例中,在上述方法中,步骤S102中首先基于语音识别技术对目标语音数据进行识别,生成目标文本。
一种实施方式中,语音识别技术为自动语音识别(AutomaticSpeechRecognition,ASR)技术,通过ASR技术将目标语音数据自动转换为目标文本。
进一步的,基于目标文本确定目标语音数据的语速和/或目标语音数据包含的关键词含量。
具体地,基于目标文本的字数和通话时长确定目标语音数据的语速。例如,字数/通话时长(分钟)即为语速。
在本申请实施例中,通过语音识别技术将语音数据转换为文本,无需调用bert模型,节省物力和时间。
在本申请的一些实施例中,在上述方法中,步骤S103可实现为:若目标语音数据的语速无异常,则基于目标语音数据的关键词含量,检测目标语音数据是否符合预设规定。
具体地,图2示出了根据本申请提供的另一个实施例的一种语音质检方法的流程示意图,从图2可以看出,该方法可以包括步骤S201~步骤S204:
步骤S201:获取目标语音数据。
步骤S202:确定目标语音数据的语速。
步骤S203:若目标语音数据的语速无异常,确定目标语音数据包含的关键词含量。
步骤S204:基于目标语音数据的关键词含量,检测目标语音数据是否符合预设规定。
在本申请实施例中,若目标语音数据的语速无异常,则可确定此次通话的场景不属于单纯挂通场景,为了更准确的判定目标语音数据是否符合规定,进一步基于目标语音数据的关键词含量,检测目标语音数据是否属于预设领域的语音数据,进而判定目标语音数据是否符合预设规定,以此确定此次通话是否合规。
在本申请的另一些实施例中,步骤S103可具体实现以下步骤:若目标语音数据的语速异常,确定目标语音数据不符合预设规定。
具体地,图3示出了根据本申请提供的另一个实施例的一种语音质检方法的流程示意图,从图3可以看出,该方法可以包括步骤S301~步骤S303:
步骤S301:获取目标语音数据。
步骤S302:确定目标语音数据的语速。
步骤S303:若目标语音数据的语速异常,确定目标语音数据不符合预设规定。
在本申请实施例中,通过确定目标语音数据的语速,如果确定目标语音数据的语速异常,则确定目标语音数据不符合预设规定,此次通话为单纯挂通等不合规场景。
在本申请的另一些实施例中,在上述方法中,步骤S103可实现为:若目标语音数据的语速和目标语音数据的关键词含量均无异常,确定目标语音数据符合预设规定。
具体地,图4示出了根据本申请提供的另一个实施例的一种语音质检方法的流程示意图,从图4可以看出,该方法可以包括步骤S401~步骤S404:
步骤S401:获取目标语音数据。
步骤S402:确定目标语音数据的语速和关键词含量。
步骤S403:若目标语音数据的语速无异常,且关键词含量无异常,确定目标语音数据符合预设规定。
步骤S404:若目标语音数据的语速和/关键词含量异常,确定目标语音数据不符合预设规定。
在本申请实施例中,若目标语音数据的语速和关键词含量均无异常,则可确定此次通话的场景不属于异常场景,判断本次通话符合预设规定。若目标语音数据的语速和关键词含量中有一者异常或二者均异常,则可确定此次通话的场景属于异常场景,判断本次通话不符合预设规定。
在本申请的一些实施例中,还可以首先获取目标语音数据,确定目标语音数据的关键词含量,若目标语音数据的关键词含量异常,则确定目标语音数据不符合预设规定;若目标语音数据的关键词含量无异常,进一步基于目标关键词的语速确定目标语音数据是否符合预设规定。
在本申请的一些实施例中,在上述方法中,基于以下方式确定目标语音数据的语速是否异常:
若目标语音数据的语速小于语速阈值,则确定目标语音数据的语速异常。
若目标语音数据的语速大于或等于语速阈值,则确定目标语音数据的语速无异常。
具体地,语速阈值基于正语音样本的语速和负语音样本的语速确定。其中,正语音样本表示合规语音,负语音样本表示不合规语音。
更详细的,首先将多个通话数据利用ASR转译技术,分别转换为文本信息,提取出员工的通话内容,并分成正语音样本和负语音样本两个数据集。随后,对正语音样本和负语音样本分别计算语速,并选择较为合理的语速作为判断是否作弊的卡点,将其作为语速阈值。
在本申请的一些实施例中,在上述方法中,基于以下方式确定目标语音数据是否符合预设规定:
若目标语音数据的关键词含量小于预设关键词含量,确定目标语音数据不符合预设规定;
若目标语音数据的关键词含量大于或等于预设关键词含量,确定目标语音数据符合预设规定。
具体地,预先准备领域关键词,如保险销售领域,可准备保险销售关键词,如:保障、理赔、赔付等。随后,收集一批合规样本,对其中的关键词含量进行测算,用平均每分钟的关键词含量作为统计指标,测算阈值,将其作为预设关键词含量。
在本申请实施例中,通过判断目标语音数据的关键词含量是否小于预设关键词含量,若目标语音数据的关键词含量小于关键词,则表示目标语音数据中内容与预设领域不相关或相关度较低,进而可确定本次检测的通话不合规。
在本申请的一些实施例中,为了更清楚的说明本申请提供的语音质检方法,下面结合图5所示的一种语音质检方法的流程图,进行完整的说明:
获取目标语音数据,将目标语音数据转换为目标文本,基于目标文本确定目标语音数据的语速,并判断目标语音数据的语速是否小于语速阈值,若目标语音数据的语速不小于语速阈值,则确定目标语音数据不合规;若目标语音数据的语速小于语速阈值,进一步确定目标语音数据的关键词含量,并判断目标语音数据的关键词含量是否小于关键词含量阈值,若目标语音数据的关键词含量小于关键词含量阈值,则确定目标语音数据不合规,继续判断下一个目标语音数据;若目标语音数据的关键词含量不小于关键词含量阈值,则确定目标语音合规,继续判断下一个目标语音数据。
在本申请实施例中,通过确定目标语音数据的语速和关键词含量,即可识别出目标语音数据是否合规,操作简单,无需调用GPU,节省物力和时间。
在本申请的一些实施例中,提供一种语音质检装置,该语音质检装置与上述实施例中语音质检方法一一对应。如图6所示,该处理装置包括:获取模块601、处理模块602以及检测模块603。各功能模块详细说明如下:
获取模块601,用于获取目标语音数据;
处理模块602,用于确定目标语音数据的语速和/或目标语音数据包含的关键词含量;
检测模块603,用于基于目标语音数据的语速和/或目标语音数据包含的关键词含量,检测目标语音数据是否符合预设规定。
在本申请的一些实施例中,在上述装置中,处理模块602,具体用于基于以下方式确定目标语音数据的语速和/或目标语音数据包含的关键词含量:
基于语音识别技术对目标语音数据进行识别,生成目标文本;
基于目标文本确定目标语音数据的语速和/或目标语音数据包含的关键词含量。
在本申请的一些实施例中,在上述装置中,处理模块602,具体用于基于以下方式确定目标语音数据的语速和/或目标语音数据包含的关键词含量:若目标语音数据的语速无异常,则基于目标语音数据的关键词含量,检测目标语音数据是否符合预设规定。
在本申请的一些实施例中,在上述装置中,检测模块603,具体用于基于以下方式检测目标语音数据是否符合预设规定:若目标语音数据的语速异常,确定目标语音数据不符合预设规定。
在本申请的一些实施例中,在上述装置中,基于以下方式确定目标语音数据的语速是否异常:若目标语音数据的语速小于语速阈值,则确定目标语音数据的语速异常;若目标语音数据的语速大于或等于语速阈值,则确定目标语音数据的语速无异常。
在本申请的一些实施例中,在上述装置中,语速阈值基于正语音样本的语速和负语音样本的语速确定;其中,正语音样本表示合规语音,负语音样本表示不合规语音。
在本申请的一些实施例中,在上述装置中,检测模块603,具体用于基于以下方式确定目标语音数据是否符合预设规定,包括:若目标语音数据的关键词含量小于预设关键词含量,确定目标语音数据不符合预设规定;若目标语音数据的关键词含量大于或等于预设关键词含量,确定目标语音数据符合预设规定。
需要说明的是,上述任一的语音质检装置可一一对应实现前述的语音质检方法,这里不再赘述。
图7示出了本申请实施例所提供的一种电子设备的结构示意图。如图7所示,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成语音质检装置。处理器,执行存储器所存放的程序,并具体用于执行前述方法。
处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备可执行本申请多个实施例提供的语音质检方法,并实现成新闻推荐装置在图6所示实施例的功能,本申请实施例在此不再赘述。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行本申请多个实施例提供的语音质检方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的同一要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种语音质检方法,其特征在于,所述方法包括:
获取目标语音数据;
确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量;
基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定。
2.根据权利要求1所述的方法,其特征在于,所述确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,包括:
基于语音识别技术对所述目标语音数据进行识别,生成目标文本;
基于所述目标文本确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量。
3.根据权利要求1所述的方法,其特征在于,所述基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定,包括:
若所述目标语音数据的语速无异常,则基于所述目标语音数据的关键词含量,检测所述目标语音数据是否符合预设规定。
4.根据权利要求1所述的方法,其特征在于,所述基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定,包括:
若所述目标语音数据的语速异常,确定所述目标语音数据不符合预设规定。
5.根据权利要求3或4所述的方法,其特征在于,基于以下方式确定所述目标语音数据的语速是否异常:
若所述目标语音数据的语速小于语速阈值,则确定所述目标语音数据的语速异常;
若所述目标语音数据的语速大于或等于所述语速阈值,则确定所述目标语音数据的语速无异常。
6.根据权利要求5所述的方法,其特征在于,所述语速阈值基于正语音样本的语速和负语音样本的语速确定;
其中,所述正语音样本表示合规语音,所述负语音样本表示不合规语音。
7.根据权利要求3所述的方法,其特征在于,所述基于所述目标语音数据的关键词含量,确定所述目标语音数据是否符合预设规定,包括:
若所述目标语音数据的关键词含量小于预设关键词含量,确定所述目标语音数据不符合预设规定;
若所述目标语音数据的关键词含量大于或等于所述预设关键词含量,确定所述目标语音数据符合预设规定。
8.一种语音质检装置,其特征在于,所述装置包括:
获取模块,用于获取目标语音数据;
处理模块,用于确定所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量;
检测模块,用于基于所述目标语音数据的语速和/或所述目标语音数据包含的关键词含量,检测所述目标语音数据是否符合预设规定。
9.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如权利要求1-7任一所述的语音质检方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行如权利要求1-7任一所述的语音质检方法的步骤。
CN202311613041.3A 2023-11-29 2023-11-29 一种语音质检方法及装置、电子设备、存储介质 Pending CN117854547A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311613041.3A CN117854547A (zh) 2023-11-29 2023-11-29 一种语音质检方法及装置、电子设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311613041.3A CN117854547A (zh) 2023-11-29 2023-11-29 一种语音质检方法及装置、电子设备、存储介质

Publications (1)

Publication Number Publication Date
CN117854547A true CN117854547A (zh) 2024-04-09

Family

ID=90546585

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311613041.3A Pending CN117854547A (zh) 2023-11-29 2023-11-29 一种语音质检方法及装置、电子设备、存储介质

Country Status (1)

Country Link
CN (1) CN117854547A (zh)

Similar Documents

Publication Publication Date Title
CN109544166B (zh) 一种风险识别方法和装置
CN108763952B (zh) 一种数据分类方法、装置及电子设备
CN110675399A (zh) 屏幕外观瑕疵检测方法及设备
US8285539B2 (en) Extracting tokens in a natural language understanding application
CN108986822A (zh) 语音识别方法、装置、电子设备及非暂态计算机存储介质
CN110379410A (zh) 语音响应速度自动分析方法及系统
CN114239591A (zh) 敏感词识别方法及装置
WO2023207212A1 (zh) 语音对话检测方法及装置
CN112397073A (zh) 一种音频数据处理方法及装置
CN109062793B (zh) 一种滚轮控件的测试方法、装置及电子设备
CN112417068B (zh) 下单地址的推荐方法及系统、电子设备
CN111916110B (zh) 语音质检的方法及装置
CN117349434A (zh) 语音分类方法、装置及存储介质
CN108093356B (zh) 一种啸叫检测方法及装置
CN108255891B (zh) 一种判别网页类型的方法及装置
CN110163470B (zh) 事件评估方法及装置
CN117854547A (zh) 一种语音质检方法及装置、电子设备、存储介质
CN110262938B (zh) 一种内容监控方法和装置
CN110955760A (zh) 判决结果的评价方法和相关装置
CN111354365B (zh) 一种纯语音数据采样率识别方法、装置、系统
CN109543150B (zh) 一种庭审笔录的处理方法和装置
CN113744712A (zh) 智能外呼语音拼接方法、装置、设备、介质和程序产品
CN113470630A (zh) 基于大数据的语音识别方法、系统、设备及存储介质
CN113705248B (zh) 一种基于结果评价的话术训练数据处理方法和装置
CN112951274A (zh) 语音相似度确定方法及设备、程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination