CN109767786B - 一种在线语音实时检测方法及装置 - Google Patents
一种在线语音实时检测方法及装置 Download PDFInfo
- Publication number
- CN109767786B CN109767786B CN201910086772.4A CN201910086772A CN109767786B CN 109767786 B CN109767786 B CN 109767786B CN 201910086772 A CN201910086772 A CN 201910086772A CN 109767786 B CN109767786 B CN 109767786B
- Authority
- CN
- China
- Prior art keywords
- real
- time
- score
- audio clip
- clip file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000011897 real-time detection Methods 0.000 title claims description 11
- 238000001514 detection method Methods 0.000 claims abstract description 89
- 230000008569 process Effects 0.000 claims abstract description 20
- 238000004364 calculation method Methods 0.000 claims description 22
- 230000002159 abnormal effect Effects 0.000 claims description 21
- 239000002131 composite material Substances 0.000 claims description 17
- 229910044991 metal oxide Inorganic materials 0.000 claims description 5
- 150000004706 metal oxides Chemical class 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 239000004065 semiconductor Substances 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 3
- 230000001960 triggered effect Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Telephone Function (AREA)
Abstract
本申请实施例公开了一种在线语音实时检测方法及装置,在实时语音采集的过程中,每间隔预设时间生成一个实时音频片段文件,再对实时音频片段文件进行实时评分以及综合评分,并在发现存在不合格的实时音频片段文件时,立即停止在线语音采集,解决了在现有的对音频文件进行语音质量检测的方法中,通常是在触发停止录音以及保存音频文件之后,才可对整个音频文件进行语音质量的检测,具有一定程度上的延迟,这就导致的一旦检测不合格,用户可能需要多次重录的技术问题。再则,音频文件保存之后才做语音质量检测,会占用较大的存储空间,对较大时长的音频文件进行语音质量检测也会耗费很多时间,导致的检测结果的呈现需要等待的技术问题。
Description
技术领域
本申请涉及音频处理技术领域,尤其涉及一种在线语音实时检测方法及 装置。
背景技术
作为语音识别、声纹识别等人工智能能力模块的输入,语音必需经过特 定设备(如麦克风及其配套的软件应用)来采集环节。而在语音采集时,又 往往需要知道录音的质量如何,保障语音流可用,满足语音识别、声纹识别 等的最低标准。
常用的语音质量检测方法,有VAD-SNR、MOS等方法,均是通过分 析音频正文的特征,来得出音质优劣的结论。录音质量的判定,通常在软件 应用层进行检测,需要耗费一定的运算时间和存储空间等。
在现有的对音频文件进行语音质量检测的方法中,通常是在触发停止录 音以及保存音频文件之后,才可对整个音频文件进行语音质量的检测,具有 一定程度上的延迟,这就导致了一旦检测不合格,用户可能需要多次重录的 技术问题。再则,音频文件保存之后才做语音质量检测,会占用较大的存储 空间,对较大时长的音频文件进行语音质量检测也会耗费很多时间,导致了 检测结果的呈现需要等待的技术问题。
发明内容
本申请实施例提供了一种在线语音实时检测方法及装置,解决了在现有 的对音频文件进行语音质量检测的方法中,通常是在触发停止录音以及保存 音频文件之后,才可对整个音频文件进行语音质量的检测,具有一定程度上 的延迟,这就导致的一旦检测不合格,用户可能需要多次重录的技术问题。 再则,音频文件保存之后才做语音质量检测,会占用较大的存储空间,对较 大时长的音频文件进行语音质量检测也会耗费很多时间,导致的检测结果的 呈现需要等待的技术问题。
有鉴于此,本申请第一方面提供了一种在线语音实时检测方法,所述方 法包括:
在线语音采集的过程中,每间隔预设时间生成一个实时音频片段文件, 实时音频片段文件包括间隔的预设时间内的音频数据;
对实时音频片段文件进行语音质量检测,得到实时音频片段文件的实时 评分;
获取历史评分,并根据预设的历史评分和实时评分的权重值将历史评分 与实时评分进行加权计算,得到实时音频片段文件的综合评分;
判断实时音频片段文件的综合评分是否低于预设评分阈值,若实时音频 片段文件的综合评分低于预设评分阈值,则将实时音频片段文件的综合评分 转换为综合等级进行展示,并停止在线语音采集;若实时音频片段文件的综 合评分高于预设评分阈值,则将实时音频片段文件的综合评分转换为综合等 级进行展示,并将实时音频片段文件的综合评分作为更新后的历史评分进行 保存。
可选地,对实时音频片段文件进行语音质量检测,得到实时音频片段文 件的实时评分具体包括:
对实时音频片段文件分别进行信噪比检测、有效时间占比检测、平均能 量值检测和MOS检测,得到实时音频片段文件的实时信噪比评分、实时有 效时间占比评分、实时平均能量值评分和实时MOS评分;
根据预设的信噪比评分、有效时间占比评分、平均能量值评分和MOS 评分的权重值,对实时音频片段文件的实时信噪比评分、实时有效时间占比 评分、实时平均能量值评分和实时MOS评分进行加权计算,得到实时音频 片段文件的实时评分。
可选地,获取历史评分,并根据预设的历史评分和实时评分的权重值将 历史评分与实时评分进行加权计算,得到实时音频片段文件的综合评分具体 包括:
获取前N次历史评分;
根据预设的前N次历史评分和实时评分的权重值,将前N次历史评分与 实时评分进行加权计算,得到实时音频片段文件的综合评分。
可选地,得到实时音频片段文件的综合评分之后,判断实时音频片段文 件的综合评分是否低于预设评分阈值之前还包括:
计算前N次历史评分的两两相邻历史评分之间的第一差值,以及前一次 历史评分与实时音频片段文件的综合评分之间的第二差值;
根据第一差值与第二差值,得到两两相邻历史评分以及前一次历史评分 与实时音频片段文件的综合评分之间的差值的波动情况;
调取预置异常波动规则库,若得到的波动情况满足预置异常波动规则库 中的预置异常波动规则,则将实时音频片段文件的综合评分转换为综合等级 进行展示,并停止在线语音采集,否则执行下一步。
可选地,停止在线语音采集后还包括:
将采集的全部音频片段文件删除。
本申请第二方面提供一种在线语音实时检测装置,所述装置包括:
处理单元,用于在线语音采集的过程中,每间隔预设时间生成一个实时 音频片段文件,实时音频片段文件包括间隔的预设时间内的音频数据;
第一评分单元,用于对实时音频片段文件进行语音质量检测,得到实时 音频片段文件的实时评分;
第二评分单元,用于获取历史评分,并根据预设的历史评分和实时评分 的权重值将历史评分与实时评分进行加权计算,得到实时音频片段文件的综 合评分;
评分判断单元,用于判断实时音频片段文件的综合评分是否低于预设评 分阈值,若实时音频片段文件的综合评分低于预设评分阈值,则将实时音频 片段文件的综合评分转换为综合等级进行展示,并停止在线语音采集;若实 时音频片段文件的综合评分高于预设评分阈值,则将实时音频片段文件的综 合评分转换为综合等级进行展示,并将实时音频片段文件的综合评分作为更 新后的历史评分进行保存。
可选地,第一评分单元具体包括:
检测子单元,用于对实时音频片段文件分别进行信噪比检测、有效时间 占比检测、平均能量值检测和MOS检测,得到实时音频片段文件的实时信 噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评 分;
第一评分子单元,用于根据预设的信噪比评分、有效时间占比评分、平 均能量值评分和MOS评分的权重值,对实时音频片段文件的实时信噪比评 分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分进行加 权计算,得到实时音频片段文件的实时评分。
可选地,第二评分单元具体包括:
获取子单元,用于获取前N次历史评分;
第二评分子单元,用于根据预设的前N次历史评分和实时评分的权重 值,将前N次历史评分与实时评分进行加权计算,得到实时音频片段文件的 综合评分。
可选地,还包括:
差值计算单元,用于计算前N次历史评分的两两相邻历史评分之间的第 一差值,以及前一次历史评分与实时音频片段文件的综合评分之间的第二差 值;
波动分析单元,用于根据第一差值与第二差值,得到两两相邻历史评分 以及前一次历史评分与实时音频片段文件的综合评分之间的差值的波动情 况;
波动判断单元,用于调取预置异常波动规则库,若得到的波动情况满足 预置异常波动规则库中的预置异常波动规则,则将实时音频片段文件的综合 评分转换为综合等级进行展示,并停止在线语音采集,否则触发第二评分单 元。
可选地,还包括:
删除单元,用于将采集的全部音频片段文件删除。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例中,提供了一种在线语音实时检测方法,在实时语音采集 的过程中,每间隔预设时间生成一个实时音频片段文件,再对实时音频片段 文件进行实时评分以及综合评分,并在发现存在不合格的实时音频片段文件 时,立即停止在线语音采集,解决了在现有的对音频文件进行语音质量检测 的方法中,通常是在触发停止录音以及保存音频文件之后,才可对整个音频 文件进行语音质量的检测,具有一定程度上的延迟,这就导致的一旦检测不 合格,用户可能需要多次重录的技术问题。再则,音频文件保存之后才做语 音质量检测,会占用较大的存储空间,对较大时长的音频文件进行语音质量 检测也会耗费很多时间,导致的检测结果的呈现需要等待的技术问题。
附图说明
图1为本申请实施例中在线语音实时检测方法的一个方法流程图;
图2为本申请实施例中在线语音实时检测方法的另一方法流程图;
图3为本申请实施例中在线语音实时检测装置的结构示意图;
图4为本申请实施例中在线语音实时检测设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实 施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然, 所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申 请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的 所有其他实施例,都属于本申请保护的范围。
本申请设计了一种在线语音实时检测方法及装置,解决了传统模式上, 对于语音质量的检测,都是在触发停止录音、保存文件之后,才可将整个音 频文件提取出进行语音质量的检测,具有一定程度上的延迟。这就导致了需 要用户可能需要多次重录。再则,语音采集存储之后才做检测,会占用较大 的存储空间,对较大时长的语音文件进行检测也会耗费很多时间,导致检测 结果的呈现需要等待的技术问题。
为了便于理解,请参阅图1,图1为本申请实施例中一种在线语音实时检 测方法的一个方法流程图,具体为:
101、在线语音采集的过程中,每间隔预设时间生成一个实时音频片段文 件,实时音频片段文件包括间隔的预设时间内的音频数据;
需要说明的是,在在线语音采集的过程中,也就是用户在录制音频文件 的过程中,每间隔预设时间生成一个实时音频片段文件,实时音频片段文件 中包括所间隔的预设时间的时间段内的音频数据。
102、对实时音频片段文件进行语音质量检测,得到实时音频片段文件的 实时评分;
需要说明的是,在生成实时音频片段文件后,对实时音频片段文件进行 语音质量检测,并得到实时音频片段文件的实时评分。
103、获取历史评分,并根据预设的历史评分和实时评分的权重值将历史 评分与实时评分进行加权计算,得到实时音频片段文件的综合评分;
需要说明的是,在得到实时音频片段文件的实时评分后,还需要结合历 史评分对实时音频文件进行综合评分,从而得到实时音频片段文件的综合评 分。
104、判断实时音频片段文件的综合评分是否低于预设评分阈值,若实时 音频片段文件的综合评分低于预设评分阈值,则将实时音频片段文件的综合 评分转换为综合等级进行展示,并停止在线语音采集;若实时音频片段文件 的综合评分高于预设评分阈值,则将实时音频片段文件的综合评分转换为综 合等级进行展示,并将实时音频片段文件的综合评分作为更新后的历史评分 进行保存;
需要说明的是,最终,将实时音频片段文件的综合评分作为该段音频片 段文件是否合格的评价依据,将综合评分与预设评分阈值进行比较,只有当 综合评分高于预设评分阈值时,确定该段实时音频片段文件的语音质量合格, 从而根据综合评分确定对应的综合等级向用户进行更直观的展示,并且将该 段实时音频片段文件的综合评分作为下一段实时音频片段文件的一个历史评 分进行保存,否则除了根据综合评分确定对应的综合等级向用户进行更直观 的展示之外,直接停止在线语音采集,提示用户需要进行重新录制。
本申请实施例中,提供了一种在线语音实时检测方法,在实时语音采集 的过程中,每间隔预设时间生成一个实时音频片段文件,再对实时音频片段 文件进行实时评分以及综合评分,并在发现存在不合格的实时音频片段文件 时,立即停止在线语音采集,解决了在现有的对音频文件进行语音质量检测 的方法中,通常是在触发停止录音以及保存音频文件之后,才可对整个音频 文件进行语音质量的检测,具有一定程度上的延迟,这就导致的一旦检测不 合格,用户可能需要多次重录的技术问题。再则,音频文件保存之后才做语 音质量检测,会占用较大的存储空间,对较大时长的音频文件进行语音质量 检测也会耗费很多时间,导致的检测结果的呈现需要等待的技术问题。
以上是对本申请提供的一种在线语音实时检测方法的一个实施例进行的 说明,以下将对本申请提供的一种在线语音实时检测方法的另一个实施例进 行说明。
请参阅图2,图2为本申请实施例中一种在线语音实时检测方法的另一个 方法流程图,具体为:
201、在线语音采集的过程中,每间隔预设时间生成一个实时音频片段文 件,实时音频片段文件包括间隔的预设时间内的音频数据;
需要说明的是,在在线语音采集的过程中,也就是用户在录制音频文件 的过程中,每间隔预设时间生成一个实时音频片段文件,实时音频片段文件 中包括所间隔的预设时间的时间段内的音频数据。
202、对实时音频片段文件分别进行信噪比检测、有效时间占比检测、平 均能量值检测和MOS检测,得到实时音频片段文件的实时信噪比评分、实 时有效时间占比评分、实时平均能量值评分和实时MOS评分;
需要说明的是,对实时音频片段文件进行包括但不限于信噪比检测、有 效时间占比检测、平均能量值检测和MOS检测,得到实时音频片段文件的实 时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS 评分。
203、根据预设的信噪比评分、有效时间占比评分、平均能量值评分和 MOS评分的权重值,对实时音频片段文件的实时信噪比评分、实时有效时间 占比评分、实时平均能量值评分和实时MOS评分进行加权计算,得到实时 音频片段文件的实时评分;
需要说明的是,在得到实时音频片段文件的实时信噪比评分、实时有效 时间占比评分、实时平均能量值评分和实时MOS评分后,根据预设的信噪比 评分、有效时间占比评分、平均能量值评分和MOS评分的权重值,对实时 音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值 评分和实时MOS评分进行加权计算,得到实时音频片段文件的实时评分。
204、获取前N次历史评分;
需要说明的是,N值可以为随机值,若N为2,则代表本段实时音频片 段文件的前一段实时音频片段文件的综合评分以及前前段实时音频片段文件 的综合评分,除此之外,N值也决定了每个历史评分的权重值,将影响本段 实时音频片段文件的综合评分。
205、根据预设的前N次历史评分和实时评分的权重值,将前N次历史 评分与实时评分进行加权计算,得到实时音频片段文件的综合评分;
需要说明的是,根据预设的前N次历史评分和实时评分的权重值,将前 N次历史评分与实时评分进行加权计算,得到本段实时音频片段文件的综合 评分。
206、计算前N次历史评分的两两相邻历史评分之间的第一差值,以及前 一次历史评分与实时音频片段文件的综合评分之间的第二差值;
需要说明的是,分别计算前N次历史评分的两两相邻历史评分之间的第 一差值,以及前一次历史评分与实时音频片段文件的综合评分之间的第二差 值,第一差值和第二差值均代表相邻两两评分之间的波动差异。
207、根据第一差值与第二差值,得到两两相邻历史评分以及前一次历史 评分与实时音频片段文件的综合评分之间的差值的波动情况;
需要说明的是,在得到了前N次历史评分的两两相邻历史评分之间的第 一差值,以及前一次历史评分与实时音频片段文件的综合评分之间的第二差 值后,能够根据第一差值与第二差值,得到两两相邻历史评分以及前一次历 史评分与实时音频片段文件的综合评分之间的差值的波动情况,例如,总共 选取了4次历史评分,以及当前得到的综合评分,4次历史评分之间依次存在 有3个第一差值,在第四次历史评分与当前得到的综合评分之间能够计算出 第二差值,可以预先对第一差值和第二差值的等级范围进行限定,例如第一 差值和第二差值低于20则为优,高于20但低于60为良,高于60则为不合 格,波动情况也可用第一差值和第二差值的等级排列进行说明。
208、调取预置异常波动规则库,若得到的波动情况满足预置异常波动规 则库中的预置异常波动规则,则将实时音频片段文件的综合评分转换为综合 等级进行展示,并停止在线语音采集,否则执行下一步;
需要说明的是,通过调取预置异常波动规则库,将得到的波动情况与预 置异常波动规则进行匹配,当匹配成功时,将实时音频片段文件的综合评分 转换为综合等级进行展示,并停止在线语音采集,提示用户需要进行重新录 制,否则执行下一步,预置异常波动规则包括但不限于:1、出现等级为不合 格;2、连续三次出现等级为良。
209、判断实时音频片段文件的综合评分是否低于预设评分阈值,若实时 音频片段文件的综合评分低于预设评分阈值,则将实时音频片段文件的综合 评分转换为综合等级进行展示,并停止在线语音采集,将采集的全部音频片 段文件删除;若实时音频片段文件的综合评分高于预设评分阈值,则将实时 音频片段文件的综合评分转换为综合等级进行展示,并将实时音频片段文件 的综合评分作为更新后的历史评分进行保存;
需要说明的是,最终,将实时音频片段文件的综合评分作为该段音频片 段文件是否合格的评价依据,将综合评分与预设评分阈值进行比较,只有当 综合评分高于预设评分阈值时,确定该段实时音频片段文件的语音质量合格, 从而根据综合评分确定对应的综合等级向用户进行更直观的展示,并且将该 段实时音频片段文件的综合评分作为下一段实时音频片段文件的一个历史评 分进行保存,否则除了根据综合评分确定对应的综合等级向用户进行更直观 的展示之外,直接停止在线语音采集,提示用户需要进行重新录制。
本申请实施例中,提供了一种在线语音实时检测方法,在实时语音采集 的过程中,每间隔预设时间生成一个实时音频片段文件,再对实时音频片段 文件进行实时评分以及综合评分,并在发现存在不合格的实时音频片段文件 时,立即停止在线语音采集,解决了在现有的对音频文件进行语音质量检测 的方法中,通常是在触发停止录音以及保存音频文件之后,才可对整个音频 文件进行语音质量的检测,具有一定程度上的延迟,这就导致的一旦检测不 合格,用户可能需要多次重录的技术问题。再则,音频文件保存之后才做语 音质量检测,会占用较大的存储空间,对较大时长的音频文件进行语音质量 检测也会耗费很多时间,导致的检测结果的呈现需要等待的技术问题,进一 步地,本申请还考虑了音质的平稳度,对历史评分和综合评分进行了波动值 的计算和判断,避免了音质不统一和不稳定的情况。
请参阅图3,本申请实施例提供了一种在线语音实时检测装置的一个结构 示意图,具体为:
处理单元301,用于在线语音采集的过程中,每间隔预设时间生成一个 实时音频片段文件,实时音频片段文件包括间隔的预设时间内的音频数据;
第一评分单元302,用于对实时音频片段文件进行语音质量检测,得到 实时音频片段文件的实时评分;
第一评分单元302具体包括:
检测子单元3021,用于对实时音频片段文件分别进行信噪比检测、有效 时间占比检测、平均能量值检测和MOS检测,得到实时音频片段文件的实 时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS 评分;
第一评分子单元3022,用于根据预设的信噪比评分、有效时间占比评 分、平均能量值评分和MOS评分的权重值,对实时音频片段文件的实时信 噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分 进行加权计算,得到实时音频片段文件的实时评分;
差值计算单元303,用于计算前N次历史评分的两两相邻历史评分之间 的第一差值,以及前一次历史评分与实时音频片段文件的综合评分之间的第 二差值;
波动分析单元304,用于根据第一差值与第二差值,得到两两相邻历史评 分以及前一次历史评分与实时音频片段文件的综合评分之间的差值的波动情 况;
波动判断单元305,用于调取预置异常波动规则库,若得到的波动情况 满足预置异常波动规则库中的预置异常波动规则,则将实时音频片段文件的 综合评分转换为综合等级进行展示,并停止在线语音采集,触发删除单元 308,否则触发第二评分单元306;
第二评分单元306,用于获取历史评分,并根据预设的历史评分和实时 评分的权重值将历史评分与实时评分进行加权计算,得到实时音频片段文件 的综合评分;
第二评分单元306具体包括:
获取子单元3061,用于获取前N次历史评分;
第二评分子单元3062,用于根据预设的前N次历史评分和实时评分的权 重值,将前N次历史评分与实时评分进行加权计算,得到实时音频片段文件 的综合评分;
评分判断单元307,用于判断实时音频片段文件的综合评分是否低于预 设评分阈值,若实时音频片段文件的综合评分低于预设评分阈值,则将实时 音频片段文件的综合评分转换为综合等级进行展示,并停止在线语音采集, 触发删除单元308;若实时音频片段文件的综合评分高于预设评分阈值,则 将实时音频片段文件的综合评分转换为综合等级进行展示,并将实时音频片 段文件的综合评分作为更新后的历史评分进行保存;
删除单元308,用于将采集的全部音频片段文件删除。
本申请实施例还提供了另一种在线语音实时检测设备,如图4所示,为 了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的, 请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数 字助理(英文全称:PersonalDigital Assistant,英文缩写:PDA)、销售终端(英 文全称:Point of Sales,英文缩写:POS)、车载电脑等任意终端设备,以终端 为手机为例:
图4示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。 参考图4,手机包括:射频(英文全称:Radio Frequency,英文缩写:RF)电 路1010、存储器1020、输入单元1030、显示单元1040、传感器1050、音频 电路1060、无线保真(英文全称:wirelessfidelity,英文缩写:WiFi)模块 1070、处理器1080、以及电源1090等部件。本领域技术人员可以理解,图4 中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部 件,或者组合某些部件,或者不同的部件布置。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,该终端所包括的处理器1080还具有以下功能:
在线语音采集的过程中,每间隔预设时间生成一个实时音频片段文件, 实时音频片段文件包括间隔的预设时间内的音频数据;
对实时音频片段文件进行语音质量检测,得到实时音频片段文件的实时 评分;
获取历史评分,并根据预设的历史评分和实时评分的权重值将历史评分 与实时评分进行加权计算,得到实时音频片段文件的综合评分;
判断实时音频片段文件的综合评分是否低于预设评分阈值,若实时音频 片段文件的综合评分低于预设评分阈值,则将实时音频片段文件的综合评分 转换为综合等级进行展示,并停止在线语音采集;若实时音频片段文件的综 合评分高于预设评分阈值,则将实时音频片段文件的综合评分转换为综合等 级进行展示,并将实时音频片段文件的综合评分作为更新后的历史评分进行 保存。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描 述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应 过程,在此不再赘述。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四” 等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后 次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本 申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此 外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包 含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必 限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这 些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个” 是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存 在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存 在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后 关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些 项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b 或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”, 或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和 方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示 意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可 以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个 系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间 的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合 或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作 为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方, 或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或 者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元 中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一 个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功 能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售 或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本 申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的 全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个 存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机, 服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步 骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称: Read-Only Memory,英文缩写:ROM)、随机存取存储器(英文全称: Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储 程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制; 尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应 当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其 中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案 的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种在线语音实时检测方法,其特征在于,包括:
在线语音采集的过程中,每间隔预设时间生成一个实时音频片段文件,实时音频片段文件包括间隔的预设时间内的音频数据;
对实时音频片段文件进行语音质量检测,得到实时音频片段文件的实时评分;
获取本段实时音频片段文件的前一段实时音频片段文件的综合评分,即获取历史评分,并根据预设的历史评分和实时评分的权重值将历史评分与实时评分进行加权计算,得到实时音频片段文件的综合评分;
判断实时音频片段文件的综合评分是否低于预设评分阈值,若实时音频片段文件的综合评分低于预设评分阈值,则将实时音频片段文件的综合评分转换为综合等级进行展示,并停止在线语音采集;若实时音频片段文件的综合评分高于预设评分阈值,则将实时音频片段文件的综合评分转换为综合等级进行展示,并将实时音频片段文件的综合评分作为更新后的历史评分进行保存。
2.根据权利要求1所述的在线语音实时检测方法,其特征在于,对实时音频片段文件进行语音质量检测,得到实时音频片段文件的实时评分具体包括:
对实时音频片段文件分别进行信噪比检测、有效时间占比检测、平均能量值检测和MOS检测,得到实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分;
根据预设的信噪比评分、有效时间占比评分、平均能量值评分和MOS评分的权重值,对实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分进行加权计算,得到实时音频片段文件的实时评分。
3.根据权利要求1所述的在线语音实时检测方法,其特征在于,获取历史评分,并根据预设的历史评分和实时评分的权重值将历史评分与实时评分进行加权计算,得到实时音频片段文件的综合评分具体包括:
获取前N次历史评分;
根据预设的前N次历史评分和实时评分的权重值,将前N次历史评分与实时评分进行加权计算,得到实时音频片段文件的综合评分。
4.根据权利要求3所述的在线语音实时检测方法,其特征在于,得到实时音频片段文件的综合评分之后,判断实时音频片段文件的综合评分是否低于预设评分阈值之前还包括:
计算前N次历史评分的两两相邻历史评分之间的第一差值,以及前一次历史评分与实时音频片段文件的综合评分之间的第二差值;
根据第一差值与第二差值,得到两两相邻历史评分以及前一次历史评分与实时音频片段文件的综合评分之间的差值的波动情况;
调取预置异常波动规则库,若得到的波动情况满足预置异常波动规则库中的预置异常波动规则,则将实时音频片段文件的综合评分转换为综合等级进行展示,并停止在线语音采集,否则执行下一步。
5.根据权利要求1或4所述的在线语音实时检测方法,其特征在于,停止在线语音采集后还包括:
将采集的全部音频片段文件删除。
6.一种在线语音实时检测装置,其特征在于,包括:
处理单元,用于在线语音采集的过程中,每间隔预设时间生成一个实时音频片段文件,实时音频片段文件包括间隔的预设时间内的音频数据;
第一评分单元,用于对实时音频片段文件进行语音质量检测,得到实时音频片段文件的实时评分;
第二评分单元,用于获取本段实时音频片段文件的前一段实时音频片段文件的综合评分,即获取历史评分,并根据预设的历史评分和实时评分的权重值将历史评分与实时评分进行加权计算,得到实时音频片段文件的综合评分;
评分判断单元,用于判断实时音频片段文件的综合评分是否低于预设评分阈值,若实时音频片段文件的综合评分低于预设评分阈值,则将实时音频片段文件的综合评分转换为综合等级进行展示,并停止在线语音采集;若实时音频片段文件的综合评分高于预设评分阈值,则将实时音频片段文件的综合评分转换为综合等级进行展示,并将实时音频片段文件的综合评分作为更新后的历史评分进行保存。
7.根据权利要求6所述的在线语音实时检测装置,其特征在于,第一评分单元具体包括:
检测子单元,用于对实时音频片段文件分别进行信噪比检测、有效时间占比检测、平均能量值检测和MOS检测,得到实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分;
第一评分子单元,用于根据预设的信噪比评分、有效时间占比评分、平均能量值评分和MOS评分的权重值,对实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分进行加权计算,得到实时音频片段文件的实时评分。
8.根据权利要求6所述的在线语音实时检测装置,其特征在于,第二评分单元具体包括:
获取子单元,用于获取前N次历史评分;
第二评分子单元,用于根据预设的前N次历史评分和实时评分的权重值,将前N次历史评分与实时评分进行加权计算,得到实时音频片段文件的综合评分。
9.根据权利要求8所述的在线语音实时检测装置,其特征在于,还包括:
差值计算单元,用于计算前N次历史评分的两两相邻历史评分之间的第一差值,以及前一次历史评分与实时音频片段文件的综合评分之间的第二差值;
波动分析单元,用于根据第一差值与第二差值,得到两两相邻历史评分以及前一次历史评分与实时音频片段文件的综合评分之间的差值的波动情况;
波动判断单元,用于调取预置异常波动规则库,若得到的波动情况满足预置异常波动规则库中的预置异常波动规则,则将实时音频片段文件的综合评分转换为综合等级进行展示,并停止在线语音采集,否则触发第二评分单元。
10.根据权利要求6或9所述的在线语音实时检测装置,其特征在于,还包括:
删除单元,用于将采集的全部音频片段文件删除。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910086772.4A CN109767786B (zh) | 2019-01-29 | 2019-01-29 | 一种在线语音实时检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910086772.4A CN109767786B (zh) | 2019-01-29 | 2019-01-29 | 一种在线语音实时检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109767786A CN109767786A (zh) | 2019-05-17 |
CN109767786B true CN109767786B (zh) | 2020-10-16 |
Family
ID=66455587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910086772.4A Active CN109767786B (zh) | 2019-01-29 | 2019-01-29 | 一种在线语音实时检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109767786B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113596590B (zh) * | 2020-04-30 | 2022-08-26 | 聚好看科技股份有限公司 | 显示设备及播放控制方法 |
CN118212693A (zh) | 2019-08-18 | 2024-06-18 | 聚好看科技股份有限公司 | 显示设备及界面显示方法 |
CN110493649B (zh) * | 2019-09-12 | 2021-08-20 | 重庆市群众艺术馆 | 基于群众满意度的文化馆数字资源加工方法 |
CN112559798B (zh) * | 2019-09-26 | 2022-05-17 | 北京新唐思创教育科技有限公司 | 音频内容质量的检测方法及装置 |
CN111343344B (zh) * | 2020-03-13 | 2022-05-31 | Oppo(重庆)智能科技有限公司 | 语音异常检测方法、装置、存储介质及电子设备 |
CN113496709A (zh) * | 2020-04-07 | 2021-10-12 | 上海擎感智能科技有限公司 | 车内音效远程在线评测方法及系统、存储介质及服务器 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101145283A (zh) * | 2006-09-12 | 2008-03-19 | 董明 | 具有发音质量评价的嵌入式语言教学机 |
CN101236742A (zh) * | 2008-03-03 | 2008-08-06 | 中兴通讯股份有限公司 | 音乐/非音乐的实时检测方法和装置 |
EP2088586A1 (en) * | 1998-08-24 | 2009-08-12 | Mindspeed Technologies, Inc. | Adaptive codebook gain control for speech coding |
SE1000555A1 (sv) * | 2010-05-24 | 2011-11-25 | Peter Olov Lager | Talkvalitetsmätsystem och metod för ett röstorienterat nätverk |
CN103730131A (zh) * | 2012-10-12 | 2014-04-16 | 华为技术有限公司 | 语音质量评估的方法和装置 |
CN106816158A (zh) * | 2015-11-30 | 2017-06-09 | 华为技术有限公司 | 一种语音质量评估方法、装置及设备 |
CN108597498A (zh) * | 2018-04-10 | 2018-09-28 | 广州势必可赢网络科技有限公司 | 一种多麦克风语音采集方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050104976A (ko) * | 2004-04-30 | 2005-11-03 | 삼성전자주식회사 | 자동 음질 평가 방법 및 그 시스템 |
-
2019
- 2019-01-29 CN CN201910086772.4A patent/CN109767786B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2088586A1 (en) * | 1998-08-24 | 2009-08-12 | Mindspeed Technologies, Inc. | Adaptive codebook gain control for speech coding |
CN101145283A (zh) * | 2006-09-12 | 2008-03-19 | 董明 | 具有发音质量评价的嵌入式语言教学机 |
CN101236742A (zh) * | 2008-03-03 | 2008-08-06 | 中兴通讯股份有限公司 | 音乐/非音乐的实时检测方法和装置 |
SE1000555A1 (sv) * | 2010-05-24 | 2011-11-25 | Peter Olov Lager | Talkvalitetsmätsystem och metod för ett röstorienterat nätverk |
CN103730131A (zh) * | 2012-10-12 | 2014-04-16 | 华为技术有限公司 | 语音质量评估的方法和装置 |
CN106816158A (zh) * | 2015-11-30 | 2017-06-09 | 华为技术有限公司 | 一种语音质量评估方法、装置及设备 |
CN108597498A (zh) * | 2018-04-10 | 2018-09-28 | 广州势必可赢网络科技有限公司 | 一种多麦克风语音采集方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109767786A (zh) | 2019-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109767786B (zh) | 一种在线语音实时检测方法及装置 | |
CN110910901B (zh) | 一种情绪识别方法及装置、电子设备和可读存储介质 | |
CN107702706B (zh) | 路径确定方法、装置、存储介质及移动终端 | |
JP5855290B2 (ja) | 接客評価装置、接客評価システム及び接客評価方法 | |
US10083686B2 (en) | Analysis object determination device, analysis object determination method and computer-readable medium | |
EP3136696B1 (en) | Method and device for detecting audio signal according to frequency domain energy | |
WO2014069076A1 (ja) | 会話分析装置及び会話分析方法 | |
US20150172465A1 (en) | Method and system for extracting out characteristics of a communication between at least one client and at least one support agent and computer program thereof | |
AU2013344416A1 (en) | Unsupervised prioritization and visualization of clusters | |
WO2019128638A1 (zh) | 从音乐节拍点中提取大节拍信息的方法、存储介质和终端 | |
CN111028834B (zh) | 语音信息提醒方法、装置、服务器和语音信息提醒设备 | |
CN114238033B (zh) | 板卡运行状态预警方法、装置、设备及可读存储介质 | |
CN109151148B (zh) | 通话内容的记录方法、装置、终端及计算机可读存储介质 | |
US20150058615A1 (en) | Apparatus and method for enhancing system usability | |
CN110930990A (zh) | 基于语音识别的客流量的统计方法、装置、设备和介质 | |
CN111951021A (zh) | 一种可疑社团的发现方法和装置、存储介质及计算机设备 | |
US20200311401A1 (en) | Analyzing apparatus, control method, and program | |
CN113225624A (zh) | 一种语音识别耗时确定方法和装置 | |
CN114066459A (zh) | 一种支付风险管理的方法以及相关装置 | |
CN107154996B (zh) | 来电拦截方法、装置、存储介质及终端 | |
CN111149153A (zh) | 信息处理装置以及说话解析方法 | |
JP5579884B2 (ja) | 音識別条件選定装置および異音判定装置 | |
CN112053216A (zh) | 一种金融产品的风险管理方法以及相关装置 | |
US20150286692A1 (en) | Evaluation result display method, evaluation result display apparatus, and non-transitory computer-readable recording medium storing evaluation result display program | |
CN105989838B (zh) | 语音识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address |
Address after: 510700 room a401-1, zone a, Guangzhou International Business Incubator, No. 3, Juquan Road, Science City, Huangpu District, Guangzhou, Guangdong Province (office only) Patentee after: GUANGZHOU SPEAKIN INTELLIGENT TECHNOLOGY Co.,Ltd. Address before: 510000 Building 1, No.12 Keyun Road, Tianhe District, Guangzhou City, Guangdong Province (Location: 705) Patentee before: SPEAKIN TECHNOLOGIES Co.,Ltd. |
|
CP03 | Change of name, title or address |