CN109767786B

CN109767786B - 一种在线语音实时检测方法及装置

Info

Publication number: CN109767786B
Application number: CN201910086772.4A
Authority: CN
Inventors: 梁健龙
Original assignee: Speakin Technologies Co ltd
Current assignee: Guangzhou Speakin Intelligent Technology Co ltd
Priority date: 2019-01-29
Filing date: 2019-01-29
Publication date: 2020-10-16
Anticipated expiration: 2039-01-29
Also published as: CN109767786A

Abstract

本申请实施例公开了一种在线语音实时检测方法及装置，在实时语音采集的过程中，每间隔预设时间生成一个实时音频片段文件，再对实时音频片段文件进行实时评分以及综合评分，并在发现存在不合格的实时音频片段文件时，立即停止在线语音采集，解决了在现有的对音频文件进行语音质量检测的方法中，通常是在触发停止录音以及保存音频文件之后，才可对整个音频文件进行语音质量的检测，具有一定程度上的延迟，这就导致的一旦检测不合格，用户可能需要多次重录的技术问题。再则，音频文件保存之后才做语音质量检测，会占用较大的存储空间，对较大时长的音频文件进行语音质量检测也会耗费很多时间，导致的检测结果的呈现需要等待的技术问题。

Description

一种在线语音实时检测方法及装置

技术领域

本申请涉及音频处理技术领域，尤其涉及一种在线语音实时检测方法及装置。

背景技术

作为语音识别、声纹识别等人工智能能力模块的输入，语音必需经过特定设备(如麦克风及其配套的软件应用)来采集环节。而在语音采集时，又往往需要知道录音的质量如何，保障语音流可用，满足语音识别、声纹识别等的最低标准。

常用的语音质量检测方法，有VAD-SNR、MOS等方法，均是通过分析音频正文的特征，来得出音质优劣的结论。录音质量的判定，通常在软件应用层进行检测，需要耗费一定的运算时间和存储空间等。

在现有的对音频文件进行语音质量检测的方法中，通常是在触发停止录音以及保存音频文件之后，才可对整个音频文件进行语音质量的检测，具有一定程度上的延迟，这就导致了一旦检测不合格，用户可能需要多次重录的技术问题。再则，音频文件保存之后才做语音质量检测，会占用较大的存储空间，对较大时长的音频文件进行语音质量检测也会耗费很多时间，导致了检测结果的呈现需要等待的技术问题。

发明内容

本申请实施例提供了一种在线语音实时检测方法及装置，解决了在现有的对音频文件进行语音质量检测的方法中，通常是在触发停止录音以及保存音频文件之后，才可对整个音频文件进行语音质量的检测，具有一定程度上的延迟，这就导致的一旦检测不合格，用户可能需要多次重录的技术问题。再则，音频文件保存之后才做语音质量检测，会占用较大的存储空间，对较大时长的音频文件进行语音质量检测也会耗费很多时间，导致的检测结果的呈现需要等待的技术问题。

有鉴于此，本申请第一方面提供了一种在线语音实时检测方法，所述方法包括：

在线语音采集的过程中，每间隔预设时间生成一个实时音频片段文件，实时音频片段文件包括间隔的预设时间内的音频数据；

对实时音频片段文件进行语音质量检测，得到实时音频片段文件的实时评分；

获取历史评分，并根据预设的历史评分和实时评分的权重值将历史评分与实时评分进行加权计算，得到实时音频片段文件的综合评分；

判断实时音频片段文件的综合评分是否低于预设评分阈值，若实时音频片段文件的综合评分低于预设评分阈值，则将实时音频片段文件的综合评分转换为综合等级进行展示，并停止在线语音采集；若实时音频片段文件的综合评分高于预设评分阈值，则将实时音频片段文件的综合评分转换为综合等级进行展示，并将实时音频片段文件的综合评分作为更新后的历史评分进行保存。

可选地，对实时音频片段文件进行语音质量检测，得到实时音频片段文件的实时评分具体包括：

对实时音频片段文件分别进行信噪比检测、有效时间占比检测、平均能量值检测和MOS检测，得到实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分；

根据预设的信噪比评分、有效时间占比评分、平均能量值评分和MOS 评分的权重值，对实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分进行加权计算，得到实时音频片段文件的实时评分。

可选地，获取历史评分，并根据预设的历史评分和实时评分的权重值将历史评分与实时评分进行加权计算，得到实时音频片段文件的综合评分具体包括：

获取前N次历史评分；

根据预设的前N次历史评分和实时评分的权重值，将前N次历史评分与实时评分进行加权计算，得到实时音频片段文件的综合评分。

可选地，得到实时音频片段文件的综合评分之后，判断实时音频片段文件的综合评分是否低于预设评分阈值之前还包括：

计算前N次历史评分的两两相邻历史评分之间的第一差值，以及前一次历史评分与实时音频片段文件的综合评分之间的第二差值；

根据第一差值与第二差值，得到两两相邻历史评分以及前一次历史评分与实时音频片段文件的综合评分之间的差值的波动情况；

调取预置异常波动规则库，若得到的波动情况满足预置异常波动规则库中的预置异常波动规则，则将实时音频片段文件的综合评分转换为综合等级进行展示，并停止在线语音采集，否则执行下一步。

可选地，停止在线语音采集后还包括：

将采集的全部音频片段文件删除。

本申请第二方面提供一种在线语音实时检测装置，所述装置包括：

处理单元，用于在线语音采集的过程中，每间隔预设时间生成一个实时音频片段文件，实时音频片段文件包括间隔的预设时间内的音频数据；

第一评分单元，用于对实时音频片段文件进行语音质量检测，得到实时音频片段文件的实时评分；

第二评分单元，用于获取历史评分，并根据预设的历史评分和实时评分的权重值将历史评分与实时评分进行加权计算，得到实时音频片段文件的综合评分；

评分判断单元，用于判断实时音频片段文件的综合评分是否低于预设评分阈值，若实时音频片段文件的综合评分低于预设评分阈值，则将实时音频片段文件的综合评分转换为综合等级进行展示，并停止在线语音采集；若实时音频片段文件的综合评分高于预设评分阈值，则将实时音频片段文件的综合评分转换为综合等级进行展示，并将实时音频片段文件的综合评分作为更新后的历史评分进行保存。

可选地，第一评分单元具体包括：

检测子单元，用于对实时音频片段文件分别进行信噪比检测、有效时间占比检测、平均能量值检测和MOS检测，得到实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分；

第一评分子单元，用于根据预设的信噪比评分、有效时间占比评分、平均能量值评分和MOS评分的权重值，对实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分进行加权计算，得到实时音频片段文件的实时评分。

可选地，第二评分单元具体包括：

获取子单元，用于获取前N次历史评分；

第二评分子单元，用于根据预设的前N次历史评分和实时评分的权重值，将前N次历史评分与实时评分进行加权计算，得到实时音频片段文件的综合评分。

可选地，还包括：

差值计算单元，用于计算前N次历史评分的两两相邻历史评分之间的第一差值，以及前一次历史评分与实时音频片段文件的综合评分之间的第二差值；

波动分析单元，用于根据第一差值与第二差值，得到两两相邻历史评分以及前一次历史评分与实时音频片段文件的综合评分之间的差值的波动情况；

波动判断单元，用于调取预置异常波动规则库，若得到的波动情况满足预置异常波动规则库中的预置异常波动规则，则将实时音频片段文件的综合评分转换为综合等级进行展示，并停止在线语音采集，否则触发第二评分单元。

可选地，还包括：

删除单元，用于将采集的全部音频片段文件删除。

从以上技术方案可以看出，本申请实施例具有以下优点：

本申请实施例中，提供了一种在线语音实时检测方法，在实时语音采集的过程中，每间隔预设时间生成一个实时音频片段文件，再对实时音频片段文件进行实时评分以及综合评分，并在发现存在不合格的实时音频片段文件时，立即停止在线语音采集，解决了在现有的对音频文件进行语音质量检测的方法中，通常是在触发停止录音以及保存音频文件之后，才可对整个音频文件进行语音质量的检测，具有一定程度上的延迟，这就导致的一旦检测不合格，用户可能需要多次重录的技术问题。再则，音频文件保存之后才做语音质量检测，会占用较大的存储空间，对较大时长的音频文件进行语音质量检测也会耗费很多时间，导致的检测结果的呈现需要等待的技术问题。

附图说明

图1为本申请实施例中在线语音实时检测方法的一个方法流程图；

图2为本申请实施例中在线语音实时检测方法的另一方法流程图；

图3为本申请实施例中在线语音实时检测装置的结构示意图；

图4为本申请实施例中在线语音实时检测设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请设计了一种在线语音实时检测方法及装置，解决了传统模式上，对于语音质量的检测，都是在触发停止录音、保存文件之后，才可将整个音频文件提取出进行语音质量的检测，具有一定程度上的延迟。这就导致了需要用户可能需要多次重录。再则，语音采集存储之后才做检测，会占用较大的存储空间，对较大时长的语音文件进行检测也会耗费很多时间，导致检测结果的呈现需要等待的技术问题。

为了便于理解，请参阅图1，图1为本申请实施例中一种在线语音实时检测方法的一个方法流程图，具体为：

101、在线语音采集的过程中，每间隔预设时间生成一个实时音频片段文件，实时音频片段文件包括间隔的预设时间内的音频数据；

需要说明的是，在在线语音采集的过程中，也就是用户在录制音频文件的过程中，每间隔预设时间生成一个实时音频片段文件，实时音频片段文件中包括所间隔的预设时间的时间段内的音频数据。

102、对实时音频片段文件进行语音质量检测，得到实时音频片段文件的实时评分；

需要说明的是，在生成实时音频片段文件后，对实时音频片段文件进行语音质量检测，并得到实时音频片段文件的实时评分。

103、获取历史评分，并根据预设的历史评分和实时评分的权重值将历史评分与实时评分进行加权计算，得到实时音频片段文件的综合评分；

需要说明的是，在得到实时音频片段文件的实时评分后，还需要结合历史评分对实时音频文件进行综合评分，从而得到实时音频片段文件的综合评分。

104、判断实时音频片段文件的综合评分是否低于预设评分阈值，若实时音频片段文件的综合评分低于预设评分阈值，则将实时音频片段文件的综合评分转换为综合等级进行展示，并停止在线语音采集；若实时音频片段文件的综合评分高于预设评分阈值，则将实时音频片段文件的综合评分转换为综合等级进行展示，并将实时音频片段文件的综合评分作为更新后的历史评分进行保存；

需要说明的是，最终，将实时音频片段文件的综合评分作为该段音频片段文件是否合格的评价依据，将综合评分与预设评分阈值进行比较，只有当综合评分高于预设评分阈值时，确定该段实时音频片段文件的语音质量合格，从而根据综合评分确定对应的综合等级向用户进行更直观的展示，并且将该段实时音频片段文件的综合评分作为下一段实时音频片段文件的一个历史评分进行保存，否则除了根据综合评分确定对应的综合等级向用户进行更直观的展示之外，直接停止在线语音采集，提示用户需要进行重新录制。

以上是对本申请提供的一种在线语音实时检测方法的一个实施例进行的说明，以下将对本申请提供的一种在线语音实时检测方法的另一个实施例进行说明。

请参阅图2，图2为本申请实施例中一种在线语音实时检测方法的另一个方法流程图，具体为：

201、在线语音采集的过程中，每间隔预设时间生成一个实时音频片段文件，实时音频片段文件包括间隔的预设时间内的音频数据；

202、对实时音频片段文件分别进行信噪比检测、有效时间占比检测、平均能量值检测和MOS检测，得到实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分；

需要说明的是，对实时音频片段文件进行包括但不限于信噪比检测、有效时间占比检测、平均能量值检测和MOS检测，得到实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS 评分。

203、根据预设的信噪比评分、有效时间占比评分、平均能量值评分和 MOS评分的权重值，对实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分进行加权计算，得到实时音频片段文件的实时评分；

需要说明的是，在得到实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分后，根据预设的信噪比评分、有效时间占比评分、平均能量值评分和MOS评分的权重值，对实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分进行加权计算，得到实时音频片段文件的实时评分。

204、获取前N次历史评分；

需要说明的是，N值可以为随机值，若N为2，则代表本段实时音频片段文件的前一段实时音频片段文件的综合评分以及前前段实时音频片段文件的综合评分，除此之外，N值也决定了每个历史评分的权重值，将影响本段实时音频片段文件的综合评分。

205、根据预设的前N次历史评分和实时评分的权重值，将前N次历史评分与实时评分进行加权计算，得到实时音频片段文件的综合评分；

需要说明的是，根据预设的前N次历史评分和实时评分的权重值，将前 N次历史评分与实时评分进行加权计算，得到本段实时音频片段文件的综合评分。

206、计算前N次历史评分的两两相邻历史评分之间的第一差值，以及前一次历史评分与实时音频片段文件的综合评分之间的第二差值；

需要说明的是，分别计算前N次历史评分的两两相邻历史评分之间的第一差值，以及前一次历史评分与实时音频片段文件的综合评分之间的第二差值，第一差值和第二差值均代表相邻两两评分之间的波动差异。

207、根据第一差值与第二差值，得到两两相邻历史评分以及前一次历史评分与实时音频片段文件的综合评分之间的差值的波动情况；

需要说明的是，在得到了前N次历史评分的两两相邻历史评分之间的第一差值，以及前一次历史评分与实时音频片段文件的综合评分之间的第二差值后，能够根据第一差值与第二差值，得到两两相邻历史评分以及前一次历史评分与实时音频片段文件的综合评分之间的差值的波动情况，例如，总共选取了4次历史评分，以及当前得到的综合评分，4次历史评分之间依次存在有3个第一差值，在第四次历史评分与当前得到的综合评分之间能够计算出第二差值，可以预先对第一差值和第二差值的等级范围进行限定，例如第一差值和第二差值低于20则为优，高于20但低于60为良，高于60则为不合格，波动情况也可用第一差值和第二差值的等级排列进行说明。

208、调取预置异常波动规则库，若得到的波动情况满足预置异常波动规则库中的预置异常波动规则，则将实时音频片段文件的综合评分转换为综合等级进行展示，并停止在线语音采集，否则执行下一步；

需要说明的是，通过调取预置异常波动规则库，将得到的波动情况与预置异常波动规则进行匹配，当匹配成功时，将实时音频片段文件的综合评分转换为综合等级进行展示，并停止在线语音采集，提示用户需要进行重新录制，否则执行下一步，预置异常波动规则包括但不限于：1、出现等级为不合格；2、连续三次出现等级为良。

209、判断实时音频片段文件的综合评分是否低于预设评分阈值，若实时音频片段文件的综合评分低于预设评分阈值，则将实时音频片段文件的综合评分转换为综合等级进行展示，并停止在线语音采集，将采集的全部音频片段文件删除；若实时音频片段文件的综合评分高于预设评分阈值，则将实时音频片段文件的综合评分转换为综合等级进行展示，并将实时音频片段文件的综合评分作为更新后的历史评分进行保存；

本申请实施例中，提供了一种在线语音实时检测方法，在实时语音采集的过程中，每间隔预设时间生成一个实时音频片段文件，再对实时音频片段文件进行实时评分以及综合评分，并在发现存在不合格的实时音频片段文件时，立即停止在线语音采集，解决了在现有的对音频文件进行语音质量检测的方法中，通常是在触发停止录音以及保存音频文件之后，才可对整个音频文件进行语音质量的检测，具有一定程度上的延迟，这就导致的一旦检测不合格，用户可能需要多次重录的技术问题。再则，音频文件保存之后才做语音质量检测，会占用较大的存储空间，对较大时长的音频文件进行语音质量检测也会耗费很多时间，导致的检测结果的呈现需要等待的技术问题，进一步地，本申请还考虑了音质的平稳度，对历史评分和综合评分进行了波动值的计算和判断，避免了音质不统一和不稳定的情况。

请参阅图3，本申请实施例提供了一种在线语音实时检测装置的一个结构示意图，具体为：

处理单元301，用于在线语音采集的过程中，每间隔预设时间生成一个实时音频片段文件，实时音频片段文件包括间隔的预设时间内的音频数据；

第一评分单元302，用于对实时音频片段文件进行语音质量检测，得到实时音频片段文件的实时评分；

第一评分单元302具体包括：

检测子单元3021，用于对实时音频片段文件分别进行信噪比检测、有效时间占比检测、平均能量值检测和MOS检测，得到实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS 评分；

第一评分子单元3022，用于根据预设的信噪比评分、有效时间占比评分、平均能量值评分和MOS评分的权重值，对实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分进行加权计算，得到实时音频片段文件的实时评分；

差值计算单元303，用于计算前N次历史评分的两两相邻历史评分之间的第一差值，以及前一次历史评分与实时音频片段文件的综合评分之间的第二差值；

波动分析单元304，用于根据第一差值与第二差值，得到两两相邻历史评分以及前一次历史评分与实时音频片段文件的综合评分之间的差值的波动情况；

波动判断单元305，用于调取预置异常波动规则库，若得到的波动情况满足预置异常波动规则库中的预置异常波动规则，则将实时音频片段文件的综合评分转换为综合等级进行展示，并停止在线语音采集，触发删除单元 308，否则触发第二评分单元306；

第二评分单元306，用于获取历史评分，并根据预设的历史评分和实时评分的权重值将历史评分与实时评分进行加权计算，得到实时音频片段文件的综合评分；

第二评分单元306具体包括：

获取子单元3061，用于获取前N次历史评分；

第二评分子单元3062，用于根据预设的前N次历史评分和实时评分的权重值，将前N次历史评分与实时评分进行加权计算，得到实时音频片段文件的综合评分；

评分判断单元307，用于判断实时音频片段文件的综合评分是否低于预设评分阈值，若实时音频片段文件的综合评分低于预设评分阈值，则将实时音频片段文件的综合评分转换为综合等级进行展示，并停止在线语音采集，触发删除单元308；若实时音频片段文件的综合评分高于预设评分阈值，则将实时音频片段文件的综合评分转换为综合等级进行展示，并将实时音频片段文件的综合评分作为更新后的历史评分进行保存；

删除单元308，用于将采集的全部音频片段文件删除。

本申请实施例还提供了另一种在线语音实时检测设备，如图4所示，为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(英文全称：PersonalDigital Assistant，英文缩写：PDA)、销售终端(英文全称：Point of Sales，英文缩写：POS)、车载电脑等任意终端设备，以终端为手机为例：

图4示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图4，手机包括：射频(英文全称：Radio Frequency，英文缩写：RF)电路1010、存储器1020、输入单元1030、显示单元1040、传感器1050、音频电路1060、无线保真(英文全称：wirelessfidelity，英文缩写：WiFi)模块 1070、处理器1080、以及电源1090等部件。本领域技术人员可以理解，图4 中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

在本申请实施例中，该终端所包括的处理器1080还具有以下功能：

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四” 等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个” 是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b 或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(英文全称： Read-Only Memory，英文缩写：ROM)、随机存取存储器(英文全称： Random Access Memory，英文缩写：RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种在线语音实时检测方法，其特征在于，包括：

获取本段实时音频片段文件的前一段实时音频片段文件的综合评分，即获取历史评分，并根据预设的历史评分和实时评分的权重值将历史评分与实时评分进行加权计算，得到实时音频片段文件的综合评分；

2.根据权利要求1所述的在线语音实时检测方法，其特征在于，对实时音频片段文件进行语音质量检测，得到实时音频片段文件的实时评分具体包括：

根据预设的信噪比评分、有效时间占比评分、平均能量值评分和MOS评分的权重值，对实时音频片段文件的实时信噪比评分、实时有效时间占比评分、实时平均能量值评分和实时MOS评分进行加权计算，得到实时音频片段文件的实时评分。

3.根据权利要求1所述的在线语音实时检测方法，其特征在于，获取历史评分，并根据预设的历史评分和实时评分的权重值将历史评分与实时评分进行加权计算，得到实时音频片段文件的综合评分具体包括：

获取前N次历史评分；

4.根据权利要求3所述的在线语音实时检测方法，其特征在于，得到实时音频片段文件的综合评分之后，判断实时音频片段文件的综合评分是否低于预设评分阈值之前还包括：

5.根据权利要求1或4所述的在线语音实时检测方法，其特征在于，停止在线语音采集后还包括：

将采集的全部音频片段文件删除。

6.一种在线语音实时检测装置，其特征在于，包括：

第二评分单元，用于获取本段实时音频片段文件的前一段实时音频片段文件的综合评分，即获取历史评分，并根据预设的历史评分和实时评分的权重值将历史评分与实时评分进行加权计算，得到实时音频片段文件的综合评分；

7.根据权利要求6所述的在线语音实时检测装置，其特征在于，第一评分单元具体包括：

8.根据权利要求6所述的在线语音实时检测装置，其特征在于，第二评分单元具体包括：

获取子单元，用于获取前N次历史评分；

9.根据权利要求8所述的在线语音实时检测装置，其特征在于，还包括：

10.根据权利要求6或9所述的在线语音实时检测装置，其特征在于，还包括：

删除单元，用于将采集的全部音频片段文件删除。