CN112466332A

CN112466332A - 一种语速评分方法、装置、电子设备及存储介质

Info

Publication number: CN112466332A
Application number: CN202011271532.0A
Authority: CN
Inventors: 高峰; 杜新凯; 吕超; 牛国扬; 蔡岩松; 刘谦; 王彦昕
Original assignee: Sunshine Insurance Group Co Ltd
Current assignee: Sunshine Insurance Group Co Ltd
Priority date: 2020-11-13
Filing date: 2020-11-13
Publication date: 2021-03-09

Abstract

本申请提供了一种语速评分方法、装置、电子设备及存储介质，通过从待评分语音中确定出多个词，按照每个词中字的数量，将所述多个词划分为多个待评分组；针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例；基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例；基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值。本申请将待评分语音划分为不同的待评分组，通过确定出的每个待评分组的判定比例确定出待评分语音在每种语速类型下的评分比例，确定出待评分语音的分值，从而有助于提高语速判别结果的准确率。

Description

一种语速评分方法、装置、电子设备及存储介质

技术领域

本申请涉及语言处理技术领域，尤其是涉及一种语速评分方法、装置、电子设备及存储介质。

背景技术

近年来人工智能技术发展迅猛，AI技术的应用渗透到生产生活的各个领域，语音对话机器人是其中的热门应用之一，它的发展也为人们的生活带来了极大的便利。在与对话机器人进行语音交互时，如果语音对话机器人发出的语音语速均匀且流畅，则会使得听者能够更加清晰的听清对话内容，从而更加愿意与对话机器人进行对话。

目前，对于语音语速的判断方式是根据一句话的整体发音时间确定该语音语速是否均匀，这种方式没有考虑到语音中字或者词存在的差异性，因此使用这种方式进行语速判断，会损失一定的精确度和可信度，从而减少判断结果的准确性。

发明内容

有鉴于此，本申请的目的在于提供一种语速评分方法、装置、电子设备及存储介质，在对待评分语音进行评分时，可以将待评分语音划分为不同的待评分组，从而通过确定出的每个待评分组的判定比例确定出待评分语音在每种语速类型下的评分比例，确定出待评分语音的分值，有助于提高语速判别结果的准确率。

本申请实施例提供了一种语速评分方法，所述语速评分方法包括：

从待评分语音中确定出多个词，按照每个词中字的数量，将所述多个词划分为多个待评分组；

针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例；

基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例；

基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值。

进一步的，当所述待评分语音的分值包括语速均匀分值，所述语速类型包括语速均匀类型时，所述针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例，包括：

获取所述待评分组中每个词的发音时间；

基于所述待评分组中每个词的发音时间，确定所述待评分组对应的语速均匀区间；

确定所述待评分组中的词位于所述语速均匀区间内的均匀词语数量；

基于所述均匀词语数量和所述待评分语音中词的总数量，确定所述待评分组在所述语速均匀类型下的判定比例。

进一步的，所述基于所述待评分组中每个词的发音时间，确定所述待评分组对应的语速均匀区间，包括：

基于所述待评分组中每个词的发音时间，确定出所述待评分组的时间均值和时间方差；

基于所述待评分组的时间均值和时间方差，确定所述待评分组对应的语速均匀区间。

进一步的，在所述基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例之后，所述语速评分方法还包括：

确定所述评分比例是否大于或等于所述语速类型对应的阈值系数；

若是，则确定所述待评分语音的语速均匀；

若否，则确定所述待评分语音的语速不均匀。

进一步的，当所述待评分语音的分值包括语速快慢分值，所述语速类型包括第一标准类型、第二标准类型以及第三标准类型时，所述针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例，包括：

获取所述待评分组中每个词的发音时间，以及所述待评分组对应的第一标准类型的第一标准区间、第二标准类型的第二标准区间以及第三标准类型的第三标准区间；

基于每个词的发音时间，确定所述待评分组的所有词中位于所述待评分组对应的所述第一标准区间内的第一标准数量、位于所述待评分组对应的所述第二标准区间内的第二标准数量、以及位于所述待评分组对应的所述第三标准区间内的第三标准数量；

基于所述第一标准数量、所述第二标准数量、所述第三标准数量和所述待评分语音中词的总数量，确定所述待评分组在所述第一标准类型下的第一判定比例、所述待评分组在所述第二标准类型下的第二判定比例、以及所述待评分组在所述第三标准类型下的第三判定比例。

进一步的，所述基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例，包括：

基于各个待评分组在所述第一标准类型下的第一判定比例，确定所述待评分语音在所述第一标准类型下的第一评分比例；

基于各个待评分组在所述第二标准类型下的第二判定比例，确定所述待评分语音在所述第二标准类型下的第二评分比例；

基于各个待评分组在所述第三标准类型下的第三判定比例，确定所述待评分语音在所述第三标准类型下的第三评分比例。

进一步的，所述基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值，包括：

基于所述第一评分比例和所述第一标准类型对应的阈值系数，确定所述待评分语音的第一标准分值；

基于所述第二评分比例和所述第二标准类型对应的阈值系数，确定所述待评分语音的第二标准分值；

基于所述第三评分比例和所述第三标准类型对应的阈值系数，确定所述待评分语音的第三标准分值；

基于所述第一标准分值、第二标准分值以及第三标准分值，确定所述待评分语音的语速快慢分值。

进一步的，在所述基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值之后，所述语速评分方法还包括：

确定所述语速快慢分值是否大于或等于预设的第一标准分值；

若是，则确定所述待评分语音的语速正常；

若否，确定所述第二评分比例是否大于所述第三评分比例；

若是，则确定所述待评分语音的语速为快语速；

若不是，则确定所述待评分语音的语速为慢语速。

本申请实施例还提供了一种语速评分装置，所述语速评分装置包括：

分组模块，用于从待评分语音中确定出多个词，按照每个词中字的数量，将所述多个词划分为多个待评分组；

判定比例确定模块，用于针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例；

评分比例确定模块，用于基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例；

评分模块，用于基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值。

进一步的，当所述待评分语音的分值包括语速均匀分值，所述语速类型包括语速均匀类型时，所述判定比例确定模块在用于基于所述针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例时，所述判定比例确定模块用于：

获取所述待评分组中每个词的发音时间；

进一步的，所述判定比例确定模块在用于基于所述待评分组中每个词的发音时间，确定所述待评分组对应的语速均匀区间时，所述判定比例确定模块用于：

进一步的，所述语速评分装置还包括均匀判断模块，所述均匀判断模块用于：

若是，则确定所述待评分语音的语速均匀；

若否，则确定所述待评分语音的语速不均匀。

进一步的，当所述待评分语音的分值包括语速快慢分值，所述语速类型包括第一标准类型、第二标准类型以及第三标准类型时，所述判定比例确定模块在用于基于所述针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例时，所述判定比例确定模块用于：

进一步的，所述评分比例确定模块在用于基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例时，所述评分比例确定模块用于：

进一步的，所述评分模块在用于基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值时，所述评分模块用于：

进一步的，所述语速评分装置还包括快慢判断模块，所述快慢判断模块用于：

若是，则确定所述待评分语音的语速正常；

若否，确定所述第二评分比例是否大于所述第三评分比例；

若是，则确定所述待评分语音的语速为快语速；

若不是，则确定所述待评分语音的语速为慢语速。

本申请实施例还提供一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如上述的语速评分方法的步骤。

本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如上述的语速评分方法的步骤。

本申请实施例提供的一种语速评分方法、装置、电子设备及存储介质，从待评分语音中确定出多个词，按照每个词中字的数量，将所述多个词划分为多个待评分组；针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例；基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例；基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值。

这样，本申请在对待评分语音进行评分时，可以将待评分语音划分为不同的待评分组，从而通过确定出的每个待评分组的判定比例确定出待评分语音在每种语速类型下的评分比例，确定出待评分语音的分值，有助于提高语速判别结果的准确率。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例所提供的一种语速评分方法的流程图；

图2为本申请实施例所提供的另一种语速评分方法的流程图；

图3为本申请实施例所提供的另一种语速评分方法的流程图；

图4为本申请实施例所提供的一种语速评分装置的结构示意图之一；

图5为本申请实施例所提供的一种语速评分装置的结构示意图之二；

图6为本申请实施例所提供的一种语速评分装置的结构示意图之三；

图7为本申请实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以每种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例，都属于本申请保护的范围。

首先，对本申请可适用的应用场景进行介绍。本申请可应用于语言处理技术领域。当需要对待评分语音进行评分时，本申请首先把待评分语音所包含的全部词确定出来，并根据每个词所包含的字数不同对确定出的多个词进行分组，然后统计每个待评分组的情况，从而确定出待评分语音的发音情况，进而对待评分语音语速进行判断和评分。

经研究发现，目前，对于语音语速的判断方式是根据一句话的整体发音时间确定该语音语速是否均匀，这种方式没有考虑到语音中字或者词存在的差异性，因此使用这种方式进行语速判断，会损失一定的精确度和可信度，从而减少判断结果的准确性。

基于此，本申请实施例提供了一种语速评分方法，在对待评分语音进行评分时，可以将待评分语音划分为不同的待评分组，从而通过确定出的每个待评分组的判定比例确定出待评分语音在每种语速类型下的评分比例，确定出待评分语音的分值，有助于提高语速判别结果的准确率。

请参阅图1，图1为本申请实施例所提供的一种语速评分方法的流程图。如图1中所示，本申请实施例提供的语速评分方法，包括：

S101，从待评分语音中确定出多个词，按照每个词中字的数量，将所述多个词划分为多个待评分组。

该步骤中，对待评分语音进行识别，确定出待评分语音中所包含的所有词，并根据词中所包含的字的数量不同进行分组，把相同字数的词分为一组，确定出多个待评分组。

这里，可以采用ASR转写，数据清洗等技术手段从待评分语音中确定出待评分语音包含的所有词，其中，词可以包括一字词、二字词、三字词以及四字词等多字数词，每个词中包含文字信息以及词的发音时间信息。其中，ASR转写的主要工作内容为提取文字信息和与之对应的发音时长信息以及分词处理。数据清洗主要工作内容为去除标点符号、空格、特殊字符等。

示例性的，以语音内容为“本发明提供一种针对语音文件经ASR转写后基于正态分布的语速评分方法，该方法用来衡量对话机器人或者电销客服的通话语速快慢”为例，对该语音进行ASR转写、数据清洗，处理结果如下所示：

文字信息示例：

“本/发明/提供/一种/针对/语音文件/经/ASR/转写/后/基于/正态分布/的/语速评分/方法/该/方法/用来/衡量/对话机器人/或者/电销客服/的/通话语速/快慢/”。

发音时间信息示例：

“(0.29,0.40)(0.40,1.04)(1.04,1.19)(1.19,1.40)(1.40,1.75)(1.75,1.97)(3.18,3.54)(4.49,4.70)(4.70,4.97)(4.97,5.14)(5.14,5.48)(5.48,5.60)(5.60,5.96)(5.96,6.15)(6.18,6.53)(6.53,6.86)(6.86,7.13)(7.13,7.52)(8.27,8.47)(8.47,8.61)(8.61,8.96)(8.96,9.65)(9.68,10.05)(10.05,10.21)(10.21,10.49)”。

数据说明情况如下：

“文字信息”：词之间“/”分隔。

“时间信息”：与文字信息对应，每一组括号内两个数字代表该词的开始时间与结束时间。

示例性的，对数据的分组统计，根据词字数的不同，分组统计各字数词的发音持续时间(单位：秒)，如下所示：

一字词持续时间：

0.11,0.36,0.17,0.36,0.33,0.37

二字词持续时间：

0.64,0.15,0.21,0.35,0.27,0.34,0.35,0.27,0.39,0.20,0.35,0.28

三字词持续时间：

0.21

四字词持续时间：

0.22,0.12,0.19,0.69,0.16

五字词持续时间：

0.14

这样，就完成了待评分语音根据词中的字数进行分组的工作。

S102，针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例。

该步骤中，针对待评分语音分组后的所有待评分组，确定出每个待评分组在每种语速类型下与最终评分有关的所有判定比例。

这里，语速类型可以包括快语速、慢语速、语速正常、语速均匀和语速不均匀等，判定比例的确定标准以语速类型为判定依据。其中快语速、慢语速以及语速正常可以统称为语速快慢类型，语速均匀和语速不均匀可以统称为语速均匀类型。

S103，基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例。

该步骤中，在确定出每个待评分组在每种语速类型下的判定比例之后，基于待评分语音的所有待评分组在一种语速类型下的判定比例，可确定出待评定语音在该种语速类型下的评分比例，基于此方法，可确定出待评分语音在每种语速类型下的评分比例。

这里，评分比例可以包括快语速、慢语速、语速正常、语速均匀和语速不均匀类型下的评分比例。

其中，待评分语音中所有待评分组在一种语速类型下的判定比例的和值，为待评分语音在该语速类型下的评分比例。

举例来说，以待评分语音在语速类型1下的评分比例来进行说明，假设该待评分语音中的一字待评分组在语速类型1下的判定比例为P₁、二字待评分组在语速类型1下的判定比例为P₂、三字待评分组在语速类型1下的判定比例为P₃，其余字数的待评分组的判定比例以此类推。所以该待评分语音在语速类型1下的评分比例P_1类为：P_1类＝P₁+P₂+P₃+…。

S104，基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值。

该步骤中，针对每种语速类型，在确定出待评分语音在每种语速类型下的评分比例之后，基于每种语速类型下的评分比例和与每种语速类型判定结果有关的阈值系数两者之间的关系，可以确定待评分语音在每种语速类型下的评分分值。

这里，阈值系数是根据正态分布“3δ”原则确定的。正态分布“3δ”原则为，若随机变量X服从一个数学期望为μ、方差为δ的正态分布，记为N(μ，δ²)，则位于区间[μ-δ,μ+δ]的部分大约占比65.26％，位于区间[μ-2δ,μ+2δ]的部分大约占比95.45％，位于区间[μ-3δ,μ+3δ]的部分大约占比99.73％。自然状态下，很多种数据分布呈现类似规律，在对大量包含各种语速的语音数据进行处理的过程中发现，语速正常以及语速均匀数据占多数，快语速、慢语速以及不均匀语速数据占少数，符合正态分布“集中性”、“对称性”和“均匀变动性”的特点，因此，可用正态分布“3δ”原则来判断语速均匀与快慢程度，并进行评分。

本申请实施例提供的语速评分方法，从待评分语音中确定出多个词，按照每个词中字的数量，将所述多个词划分为多个待评分组；针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例；基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例；基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值。

请参阅图2，图2为本申请实施例所提供的另一种语速评分方法的流程图。当所述待评分语音的分值为语速均匀分值，所述语速类型为语速均匀类型时，如图2中所示，本申请实施例提供的语速评分方法，包括：

S201，从待评分语音中确定出多个词，按照每个词中字的数量，将所述多个词划分为多个待评分组。

S202，获取所述待评分组中每个词的发音时间。

该步骤中，针对于每个待评分组，获取该待评分组中每个词的发音时间。

这里，在对待评分语音进行分组后，每个待评分组中包含每个词的发音时间。

S203，基于所述待评分组中每个词的发音时间，确定所述待评分组对应的语速均匀区间。

该步骤中，针对所有待评分组，基于确定的待评分组中每个词的发音时间，可以确定该待评分组对应的语速均匀区间，从而确定出所有待评分组各自所对应的语速均匀区间。

这里，语速均匀区间代表，发音时间位于该区间内的词的语速是均匀的。其中，语速均匀区间的确定是根据正态分布“3δ”原则确定的。

S204，确定所述待评分组中的词位于所述语速均匀区间内的均匀词语数量。

该步骤中，确定待评分组中每个词的发音时间和与该待评分组对应的语速均匀区间，统计该待评分组中有多少词的发音时间位于该语速均匀区间内，即可确定待评分组的均匀词语数量。

S205，基于所述均匀词语数量和所述待评分语音中词的总数量，确定所述待评分组在所述语速均匀类型下的判定比例。

该步骤中，在确定了待评分组中位于语速均匀区间内的词的数量和待评分语音包含词的总数量之后，基于两者之间的比值，即可确定出待评分组在所述语速均匀类型下的判定比例。

举例来说，以待评分语音中的一字待评分组为例，假设一字待评分组有n₁个词，其中发音均匀词语数量为n_1a，待评分语音词的总数量为N，一字待评分组在语速均匀类型下的判定比例

其中一字待评分组的权重系数

S206，基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例。

该步骤中，所述判定比例为待评分组在语速均匀类型下的判定比例，评分比例为待评分语音在语速均匀类型的评分比例，基于确定的语速均匀类型下的判定比例和对应的计算公式，可以确定出待评分语音在语速均匀类型的评分比例。

示例性的，可以设定待评分语音在语速均匀类型的评分比例记为P_均，各个待评分组在语速均匀类型下的判定比例依次记为p₁、p₂、p₃…，该待评分语音在语速均匀类型的评分比例P_均为：P_均＝p₁+p₂+p₃+…

S207，基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值。

该步骤中，所述语速类型对应的阈值系数为待评分组在语速均匀类型下语速均匀区间对应的阈值系数，所述待评分语音的分值为语速均匀类型下的分值。基于确定的语速均匀类型下的评分比例和阈值系数进行对比，然后根据对比结果采用相应的计算公式，最后可确定待评分语音的在语速均匀类型下的分值。

这里，阈值系数的确定是基于正态分布“3δ”原则确定的，阈值系数为区间[μ-δ,μ+δ]部分的占比系数，记为q₁，记S_均匀为语速均匀类型下分值。当P_均≥q₁时，语速均匀分值计算公式为

当P_均<q₁时，语速均匀分值计算公式为

其中，规定语速均匀程度得分S_均匀在区间[80,100]为语速均匀，在区间为(0,80)为语速不均，q₁一般情况下可以取值为65.26％。

其中，S201的描述可以参照S101的描述，在此不做赘述。

进一步的，S203还包括：基于所述待评分组中每个词的发音时间，确定出所述待评分组的时间均值和时间方差；基于所述待评分组的时间均值和时间方差，确定所述待评分组对应的语速均匀区间。

该步骤中，针对每一个待评分组，基于该待评分组中每个词的发音时间，计算该待评分组的发音时间均值和发音时间方差；再基于该待评分组的发音时间均值和发音时间方差，确定该待评分组对应的语速均匀区间。

这里，以一字待评分组进行示例性说明，计算一字待评分组的发音时间均值为μ₁、发音时间方差为δ₁ ²，则确定一字待评分组的语速均匀区间为[μ₁-δ₁,μ₁+δ₁]，同理，其他字数待评分组的语速均匀区间也是依据此种方法进行确定。

进一步的，在所述基于各个待评分组在所述每一种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例之后，所述语速评分方法还包括：确定所述评分比例是否大于或等于所述语速类型对应的阈值系数；若是，则确定所述待评分语音的语速均匀；若否，则确定所述待评分语音的语速不均匀。

该步骤中，语速类型为语速均匀类型，当语速均匀评分比例大于等于语速均匀类型对应的阈值系数时，判定待评分语音的语速均匀，当语速均匀评分比例小于语速均匀类型对应的阈值系数时，判定待评分语音的语速不均匀。

这里，阈值系数是根据正态分布“3δ”原则确定的，阈值系数为区间[μ-δ,μ+δ]部分的占比系数，记为q₁，当P_均≥q₁时，判定语速均匀；当P_均<q₁时判定语速不均匀。

本申请实施例提供的语速评分方法，从待评分语音中确定出多个词，按照每个词中字的数量，将所述多个词划分为多个待评分组；获取所述待评分组中每个词的发音时间；基于所述待评分组中每个词的发音时间，确定所述待评分组对应的语速均匀区间；确定所述待评分组中的词位于所述语速均匀区间内的均匀词语数量；基于所述均匀词语数量和所述待评分语音中词的总数量，确定所述待评分组在所述语速均匀类型下的判定比例。基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例；基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值。

这样，本申请在待评分语音在语速均匀类型下进行评分时，通过将待评分语音划分为不同的待评分组，确定出每个待评分组所对应的语速均匀区间，以及在各个评分组在语速均匀类型下的判定比例，并基于判定比例确定出待评分语音的评分比例，从而通过确定出的待评分语音在语速均匀类型下的评分比例，确定出待评分语音的分值，有助于提高语速判别结果的准确率。

请参阅图3，图3为本申请实施例所提供的另一种语速评分方法的流程图。当所述待评分语音的分值包括语速快慢分值，所述语速类型包括第一标准类型、第二标准类型以及第三标准类型时，如图3中所示，本申请实施例提供的语速评分方法，包括：

S301，从待评分语音中确定出多个词，按照每个词中字的数量，将所述多个词划分为多个待评分组。

S302，获取所述待评分组中每个词的发音时间，以及所述待评分组对应的第一标准类型的第一标准区间、第二标准类型的第二标准区间以及第三标准类型的第三标准区间。

该步骤中，第一标准类型为语速正常类型，第一标准区间为语速正常区间；第二标准类型为快语速类型，第二标准区间为快语速区间；第三标准类型为慢语速类型，第三标准区间为慢语速区间。以组为单位，获取待评分语音中每个待评分组中每个词的发音持续时间，并获取由大量历史语音数据确定出的语速正常区间、快语速区间以及慢语速区间。

这里，语速正常区间代表，发音时间位于该区间内的词的语速是正常的；快语速区间代表，发音时间位于该区间内的词的语速是快的；慢语速区间代表，发音时间位于该区间内的词的语速是慢的。

其中，语速正常区间、快语速区间以及慢语速区间是根据正态分布“3δ”原则确定的，是基于对大量原始语音数据进行处理确定的。首先获取大量历史语音数据(数量不少于1万条，并且每条时间不少于1分钟)，然后对历史语音数据进行ASR转写、数据清洗、分组等操作，处理过程与待评分语音数据处理过程相同，基于分组后的数据，计算一字、二字、三字以及其他多字数词对应的集合的发音时间的均值μ′_i，方差δ′_i ²(i＝1，2，3...)。基于计算得到的各字数词的集合的均值和方差，设定语速正常区间为[μ′_i-δ′_i，μ′_i+δ′_i]、快语速区间为(0，μ′_i-δ′_i)、慢语速区间为(μ′_i+δ′_i，+∞)，(i＝1，2，3...)。

示例的，在对历史语音数据进行处理后，可以采用json格式进行存储保存，下面以正常语速区间保存为例，具体形式如下所示：

S303，基于每个词的发音时间，确定所述待评分组的所有词中位于所述待评分组对应的所述第一标准区间内的第一标准数量、位于所述待评分组对应的所述第二标准区间内的第二标准数量、以及位于所述待评分组对应的所述第三标准区间内的第三标准数量。

该步骤中，第一标准数量为语速正常词语数量，第二标准数量为快语速词语数量，第三标准数量为慢语速词语数量。针对每个待评分组，统计待评分组中每个词的发音时间，确定待评分组中位于所对应的语速正常区间内的语速正常词语数量，确定待评分组组中位于所对应的快语速区间内的快语速词语数量，确定待评分组组中位于所对应的慢语速区间内的慢语速词语数量。

示例的，可以记待评分组所包含的词语数量为n_i，i＝1,2,3,4…；记待评分组中位于语速正常区间内的语速正常词语数量为n_ib；记待评分组中位于快语速区间内的快语速词语数量为n_ic；记待评分组中位于慢语速区间内的慢语速词语数量为n_id。

S304，基于所述第一标准数量、所述第二标准数量、所述第三标准数量和所述待评分语音中词的总数量，确定所述待评分组在所述第一标准类型下的第一判定比例、所述待评分组在所述第二标准类型下的第二判定比例、以及所述待评分组在所述第三标准类型下的第三判定比例。

该步骤中，第一判定比例为语速正常判定比例，第二判定比例为快语速判定比例，第三判定比例为慢语速判定比例。确定出待评分组语速正常词语数量、快语速词语数量、慢语速词语数量以及待评分语音中词的总数量之后，基于相应的计算公式可以确定待评分组语速正常判定比例、快语速判定比例以及慢语速判定比例。

这里，记待评分组语速正常判定比例为w_i正、快语速判定比例为w_i快、慢语速判定比例为w_i慢，i＝1,2,3,4…；其中

S305，基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例。

S306，基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值。

其中，S301、S305以及S306的描述可以参照S101、S103以及S104的描述，在此不做赘述。

进一步的，S305包括：基于各个待评分组在所述第一标准类型下的第一判定比例，确定所述待评分语音在所述第一标准类型下的第一评分比例；基于各个待评分组在所述第二标准类型下的第二判定比例，确定所述待评分语音在所述第二标准类型下的第二评分比例；基于各个待评分组在所述第三标准类型下的第三判定比例，确定所述待评分语音在所述第三标准类型下的第三评分比例。

该步骤中，第一评分比例为语速正常评分比例，第二评分比例为快语速判定比例，第三评分比例为慢语速评分比例。基于待评分语音中所有待评分组各自对应的语速正常类型下的语速正常判定比例和对应的计算公式，确定待评分语音的语速正常评分比例；基于待评分语音中所有待评分组各自对应的快语速类型下的快语速判定比例和对应的计算公式，确定待评分语音的快语速评分比例；基于待评分语音中所有待评分组各自对应的慢语速类型下的慢语速判定比例和对应的计算公式，确定待评分语音的慢语速评分比例。

这里，可以记待评分语音语速正常评分比例为W_正；记待评分语音快语速评分比例为W_快；记待评分语音慢语速评分比例为W_慢。

其中，

x代表词所能包含的最多字数。

进一步的，S306包括：基于所述第一评分比例和所述第一标准类型对应的阈值系数，确定所述待评分语音的第一标准分值；基于所述第二评分比例和所述第二标准类型对应的阈值系数，确定所述待评分语音的第二标准分值；基于所述第三评分比例和所述第三标准类型对应的阈值系数，确定所述待评分组的第三标准分值；基于所述第一标准分值、第二标准分值以及第三标准分值，确定所述待评分语音的语速快慢分值。

该步骤中，第一标准分值为语速正常分值，第二标准分值为快语速分值，第三标准分值为慢语速分值。针对于待评分语音，在确定语速正常评分比例和对应的阈值系数之后，基于相应的计算公式，可确定待评分语音的语速正常分值；在确定快语速评分比例和对应的阈值系数之后，基于相应的计算公式，可确定待评分语音的快语速分值；在确定慢语速评分比例和对应的阈值系数之后，基于相应的计算公式，可确定待评分语音的慢语速分值。最后根据语速正常分值、快语速分值、慢语速分值以及相应的计算公式，确定待评分语音在语速快慢类型下最终评分。

这里，记待评分语音的语速正常分值为S_正常、快语速分值为S_快、慢语速分值为S_慢，以及待评分语音在语速快慢类型下最终评分为S；其中，阈值系数是根据正态分布“3δ”原则确定的，语速正常对应的阈值系数为区间[μ-δ,μ+δ]部分的占比系数，记为q₁，快语速对应的阈值系数为区间(0,μ-δ)部分的占比系数，记为q₂，慢语速对应的阈值系数为区间(μ+δ,+∞)部分的占比系数,记为q₃。这里规定在语速快慢类型下，最终待测语音的语速正常得分S区间为[80,100]，快语速或慢语速得分区间为(0,80)，q₁一般取值为65.26％，q₂一般取值为17.37％，q₃一般取值为17.37％。

其中，待评分语音的语速正常分值、快语速分值、慢语速分值以及最终分值的计算公式如下所示：

(1)语速正常分值计算：

当W_正≥q₁时，语速正常分值计算公式为

当W_正＜q₁时，语速正常分值计算公式为

(2)快语速分值计算：

当W_快≤q₂时，快语速分值计算公式为

当W_快>q₂时，快语速分值计算公式为

(3)慢语速分值计算

当W_慢≤q₃时，慢语速分值计算公式为

当W_慢>q₃时，慢语速分值计算公式为

(4)语速最终得分计算：

在语速快慢类型下的语速最终得分为

进一步的，在所述基于所述待评分语音在各个每种语速区间内类型下的评分比例以及每个每种语速区间类型对应的阈值系数，确定所述待评分语音的分值之后，所述语速评分方法还包括：确定所述语速快慢分值是否大于或等于预设的第一标准分值；若是，则确定所述待评分语音的语速正常；若否，确定所述第二评分区间比例是否大于所述第三评分比例；若是，则确定所述待评分语音的语速为快语速；若不是，则确定所述待评分语音的语速为慢语速。

该步骤中，基于在语速快慢类型下的最终语速分值与第一标准分值进行对比，来判断语速快慢程度，当最终语速分值大于等于第一标准分值时，代表待评分语音的语速正常；当最终语速分值小于第一标准分值时，代表语速不正常，然后对快语速评分比例和慢语速评分比例进行对比，当快语速评分比例大于慢语速评分比例时，代表待评分语音为快语速，反之，则代表待评分语音为慢语速。

这里，第一标准分值一般可以取语速正常区间内的最小值。

本申请实施例提供的语速评分方法，从待评分语音中确定出多个词，按照每个词中字的数量，将所述多个词划分为多个待评分组；获取所述待评分组中每个词的发音时间，以及所述待评分组对应的第一标准类型的第一标准区间、第二标准类型的第二标准区间以及第三标准类型的第三标准区间；基于每个词的发音时间，确定所述待评分组的所有词中位于所述待评分组对应的所述第一标准区间内的第一标准数量、位于所述待评分组对应的所述第二标准区间内的第二标准数量、以及位于所述待评分组对应的所述第三标准区间内的第三标准数量；基于所述第一标准数量、所述第二标准数量、所述第三标准数量和所述待评分语音中词的总数量，确定所述待评分组在所述第一标准类型下的第一判定比例、所述待评分组在所述第二标准类型下的第二判定比例、以及所述待评分组在所述第三标准类型下的第三判定比例。基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例；基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值。

这样，本申请在待评分语音在语速快慢类型下进行评分时，通过将待评分语音划分为不同的待评分组，并统计每个评分组在语速正常、快语速、慢语速下的判定比例，并基于每个评分组的判定比例确定出待检语音语速正常、快语速、慢语速的评分比例，从而通过确定出的待评分语音在语速快慢类型下的评分比例，确定出待评分语音的最终分值，有助于提高语速判别结果的准确率。

示例性的，以具体计算案例来对本申请实施例所提供的语速评分方法进行解释，具体如下所示：

假设有100个词构成的待评分语音，每个词的字数在1-4个不等，按本申请的方法进行语速快慢类型、语速均匀类型的判断与得分：

1、对待评分语音根据词的字数分组统计发音时间(以秒计算)，其中一字词有20个，发音时间别为0.11,0.21,0.10,0.15,0.17...均值μ₁＝0.10，标准差δ₁＝0.03；二字词有40个，发音时间分别为0.20,0.19,0.30,0.19,0.21...均值μ₂＝0.19，标准差δ₂＝0.04；三字词有10个，发音时间分别为0.19,0.28,0.35,0.25,0.27...均值μ₃＝0.28，标准差δ₃＝0.03；四字词有30个，发音时间分别为0.39,0.48,0.36,0.25,0.47…均值μ₄＝0.28，标准差δ₄＝0.04。

2、判断语速均匀并打分：

(1)分组统计待评分组语速均匀区间[μ_i-δ_i,μ_i+δ_i]；

(2)计算待评分组在语速均匀类型下的判定比例p_i；

落在一字词正常区间[μ₁-δ₁,μ₁+δ₁]＝[0.07,0.13]内的判定比例p₁＝16％；

落在二字词正常区间[μ₂-δ₂,μ₂+δ₂]＝[0.15,0.23]内的判定比例p₂＝27％；

落在三字词正常区间[μ₃-δ₃,μ₃+δ₃]＝[0.25,0.31]内的判定比例p₃＝6％；

落在四字词正常区间[μ₄-δ₄,μ₄+δ₄]＝[0.35,0.43]内的判定比例p₄＝22％。

(3)语速均匀类型下的评分：

计算待评分语音落在语速均匀类型下的评分比例P_均以及评分S_均匀：

P_均＝p₁+p₂+p₃+p₄＝71％>65.26％

(4)判断语速是否均匀：

P_均>65.26％

因此判定结果为：语速均匀。

3、判断语速快慢并打分：

(1)按照字数，分组计算待评分语音中落在历史语音数据规定的语速正常区间[μ′_i-δ′_i,μ′_i+δ′_i]、语速区间(0，μ′_i-δ′_i)、慢语速区间(μ′_i+δ′_i，+∞)(i＝1,2,3...)各自的评分比例，记为W_正、W_快、W_慢，并做以下统计：

一字词有20个，待评分语音中一字词均值μ₁＝0.10，标准差δ₁＝0.03，落在一字词对应的语速正常区间[μ′₁-δ′₁，μ′₁+δ′₁]＝[0.09,0.15]内的一字词有12个，判定比例为12％；对应的快语速区间(0，μ′₁-δ′₁)＝(0,0.09)内的一字词有6个，判定比例为6％；对应的慢语速区间(μ′₁+δ′₁，+∞)＝(0.15,+∞)内的一字词有2个，判定比例为2％。

类似地，二字词有40个，均值μ₂＝0.19，标准差δ₂＝0.04，落在二字词对应的语速正常区间[μ′₂-δ′₂，μ′₂+δ′₂]＝[0.08,0.12]内的二字词有30个，判定比例为30％；对应的快语速区间(0，μ′₂-δ′₂)＝(0,0.08)内的二字词有6个，判定比例为6％；对应的慢语速区间(μ′₂+δ′₂，+∞)＝(0.12,+∞)内的二字词有4个，判定比例为4％。

按上述方法，依次统计10个三字词的语速正常判定比例为6％、快语速判定比例为2％以及慢语速判定比例为2％，30个四字词的语速正常判定比例为24％、快语速判定比例为4％以及慢语速判定比例为2％。

(2)计算评分比例

语速正常评分比例W_正＝12％+30％+6％+24％＝72％；

快语速评分比例W_快＝6％+6％+2％+4％＝18％；

慢语速评分比例W_慢＝2％+4％+2％+2％＝10％。

(3)语速正常、快语速、慢语速的分值

因W_正＝72％>65.26％，故

因W_快＝18％>17.37％，故

因W_慢＝10％<17.37％，故

(4)语速最终得分

语速最终得分为

(5)语速判断

因语速最终得分为83.92>80，判定结果为语速正常。

请参阅图4，图4为本申请实施例所提供的一种语速评分装置的结构示意图之一，如图4中所示，所述语速评分装置400包括：

分组模块410，用于从待评分语音中确定出多个词，按照每个词中字的数量，将所述多个词划分为多个待评分组；

判定比例确定模块420，用于针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例；

评分比例确定模块430，用于基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例；

评分模块440，用于基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值。

进一步的，当所述待评分语音的分值包括语速均匀分值，所述语速类型包括语速均匀类型时，所述判定比例确定模块420在用于基于所述针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例时，所述判定比例确定模块420用于：

获取所述待评分组中每个词的发音时间；

进一步的，所述判定比例确定模块420在用于基于所述待评分组中每个词的发音时间，确定所述待评分组对应的语速均匀区间时，所述判定比例确定模块420用于：

进一步的，如图5所示，图5为本申请实施例所提供的一种语速评分装置的结构示意图之二，所述语速评分装置400还包括均匀判断模块450，所述均匀判断模块450用于：

若是，则确定所述待评分语音的语速均匀；

若否，则确定所述待评分语音的语速不均匀。

进一步的，当所述待评分语音的分值包括语速快慢分值，所述语速类型包括第一标准类型、第二标准类型以及第三标准类型时，所述判定比例确定模块420在用于基于所述针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例时，所述判定比例确定模块420用于：

进一步的，所述评分比例确定模块430在用于基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例时，所述评分比例确定模块430用于：

进一步的，所述评分模块440在用于基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值时，所述评分模块440用于：

进一步的，如图6所示，图6为本申请实施例所提供的一种语速评分装置的结构示意图之三，所述语速评分装置400还包括快慢判断模块460，所述快慢判断模块460用于：

若是，则确定所述待评分语音的语速正常；

若否，确定所述第二评分比例是否大于所述第三评分比例；

若是，则确定所述待评分语音的语速为快语速；

若不是，则确定所述待评分语音的语速为慢语速。

本申请实施例提供的语速评分装置，从待评分语音中确定出多个词，按照每个词中字的数量，将所述多个词划分为多个待评分组；针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例；基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例；基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值。

请参阅图7，图7为本申请实施例所提供的一种电子设备的结构示意图。如图7中所示，所述电子设备700包括处理器710、存储器720和总线730。

所述存储器720存储有所述处理器710可执行的机器可读指令，当电子设备700运行时，所述处理器710与所述存储器720之间通过总线730通信，所述机器可读指令被所述处理器710执行时，可以执行如上述图1以及图3所示方法实施例中的一种语速评分方法的步骤，具体实现方式可参见方法实施例，在此不再赘述。

本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时可以执行如上述图1以及图3所示方法实施例中的一种语速评分方法的步骤，具体实现方式可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本申请的具体实施方式，用以说明本申请的技术方案，而非对其限制，本申请的保护范围并不局限于此，尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种语速评分方法，其特征在于，所述语速评分方法包括：

2.根据权利要求1所述的语速评分方法，其特征在于，当所述待评分语音的分值包括语速均匀分值，所述语速类型包括语速均匀类型时，所述针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例，包括：

获取所述待评分组中每个词的发音时间；

3.根据权利要求2所述的语速评分方法，其特征在于，所述基于所述待评分组中每个词的发音时间，确定所述待评分组对应的语速均匀区间，包括：

4.根据权利要求2所述的语速评分方法，其特征在于，在所述基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例之后，所述语速评分方法还包括：

若是，则确定所述待评分语音的语速均匀；

若否，则确定所述待评分语音的语速不均匀。

5.根据权利要求1所述的语速评分方法，其特征在于，当所述待评分语音的分值包括语速快慢分值，所述语速类型包括第一标准类型、第二标准类型以及第三标准类型时，所述针对于每个待评分组，确定所述待评分组在每种语速类型下的判定比例，包括：

6.根据权利要求5所述的语速评分方法，其特征在于，所述基于各个待评分组在所述每种语速类型下的判定比例，确定所述待评分语音在每种语速类型下的评分比例，包括：

7.根据权利要求6所述的语速评分方法，其特征在于，所述基于所述待评分语音在每种语速类型下的评分比例以及每种语速类型对应的阈值系数，确定所述待评分语音的分值，包括：

8.一种语速评分装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过所述总线通信，所述机器可读指令被所述处理器执行时执行如权利要求1至7中任一项所述的语速评分方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如权利要求1至7中任一项所述的语速评分方法的步骤。