WO2021138898A1

WO2021138898A1 - 语音识别结果检测方法及装置、存储介质

Info

Publication number: WO2021138898A1
Application number: PCT/CN2020/071389
Authority: WO
Inventors: 薛征山
Original assignee: 深圳市欢太科技有限公司; Oppo广东移动通信有限公司
Priority date: 2020-01-10
Filing date: 2020-01-10
Publication date: 2021-07-15
Also published as: CN114846543A

Abstract

一种语音识别结果检测方法、装置及存储介质，该方法包括：获取待测语音识别结果，并利用机器翻译模型将待测语音识别结果从第一语种翻译至第二语种，得到待测翻译结果(S101)；基于待测翻译结果和待测语音识别结果，确定第一评估特征；第一评估特征用于表征待测语音识别结果的识别和翻译效果(S102)；基于第一评估特征对待测语音识别结果进行评估，得到第一评估结果(S103)；判断第一评估结果是否满足预设条件，得到第一判断结果，并根据第一判断结果确定待测语音识别结果的错误检测结果(S104)。

Description

语音识别结果检测方法及装置、存储介质

技术领域

本申请实施例涉及语音识别技术领域，尤其涉及一种语音识别结果检测方法及装置、存储介质。

背景技术

受限于语音识别的准确性，语音识别结果常常会出现错误，这将对后续的理解将造成障碍，增加了语音理解的难度。通常情况下，在对语音进行识别，得到语音识别结果之后，对语音识别结果进行错误检测，从而可以进一步纠正其中的错误。

目前，主要是利用语音识别结果所属语种的一些语言特征，训练出相应的错误检测模型，以进行语音识别结果的错误检测。例如，对于中文语音识别结果，可以基于词语搭配、上下文信息设计错误检测模型，实现中文语音识别结果的错误检测。然而，采用与语音识别结果所属语种相应的错误检测模型进行错误检测，可以利用的检测特征较少，检测准确率较低。

发明内容

为解决相关技术问题，本申请实施例期望提供一种语音识别结果检测方法及装置、存储介质。

本申请实施例的技术方案可以如下实现：

本申请实施例提供了一种语音识别结果检测方法，包括：

获取待测语音识别结果，并利用机器翻译模型将所述待测语音识别结果从第一语种翻译至第二语种，得到待测翻译结果；

基于所述待测翻译结果和所述待测语音识别结果，确定第一评估特征；所述第一评估特征用于表征所述待测语音识别结果的识别和翻译效果；

基于所述第一评估特征对所述待测语音识别结果进行评估，得到第一评估结果；

判断所述第一评估结果是否满足预设条件，得到第一判断结果，并根据所述第一判断结果确定所述待测语音识别结果的错误检测结果。

在上述方案中，所述基于所述待测翻译结果和所述待测语音识别结果，确定第一评估特征，包括：

获取所述机器翻译模型对所述待测翻译结果的翻译评分和困惑度评分，得到第一翻译评分和第一困惑度评分；

将所述待测语音识别结果输入所述第一语种对应的语言模型，得到第一语言模型得分；

将所述第一翻译评分、所述第一困惑度评分和所述第一语言模型得分确定为所述第一评估特征。

在上述方案中，所述基于所述第一评估特征对所述待测语音识别结果进行评估，得到第一评估结果，包括：

获取所述第一翻译评分、所述第一困惑度评分和所述第一语言模型得分中每一个对应的特征权重，得到三个特征权重；

利用所述三个特征权重对所述第一翻译评分、所述第一困惑度评分和所述第一语言模型得分进行加权处理，得到所述第一评估结果。

在上述方案中，所述获取所述第一翻译评分、所述第一困惑度评分和所述第一语言模型得分中每一个对应的特征权重，得到三个特征权重之前，所述方法还包括：

获取样本语音识别结果，以及所述样本语音识别结果的预设检测结果；

利用所述机器翻译模型将所述样本语音识别结果从所述第一语种翻译至所述第二语种，得到样本翻译结果；

基于所述样本翻译结果和所述样本语音识别结果，确定第二翻译评分、第二困惑度评分和第二语言模型得分；

获取所述第二翻译评分、所述第二困惑度评分和所述第二语言模型得分中每一个对应的预设权重，得到三个预设权重；

利用所述第二翻译评分、所述第二困惑度评分、所述第二语言模型得分、所述预设检测结果和所述三个预设权重，确定所述三个特征权重。

在上述方案中，所述利用所述第二翻译评分、所述第二困惑度评分、所述第二语言模型得分、所述预设检测结果和三个所述预设权重，确定所述三个特征权重，包括：

利用所述三个预设权重对所述第二翻译评分、所述第二困惑度评分和所述第二语言模型得分进行加权处理，得到第二评估结果；所述第二评估特征用于表征所述样本语音识别结果的识别和翻译效果；

判断所述第二评估结果是否满足所述预设条件，得到第二判断结果，并根据所述第二判断结果确定所述样本语音识别结果的错误检测结果；

基于所述样本语音识别结果的错误检测结果和所述预设检测结果，调整所述三个预设权重，得到所述三个特征权重。

在上述方案中，所述基于所述样本语音识别结果的错误检测结果和所述预设检测结果，调整所述三个预设权重，得到所述三个特征权重，包括：

按照权重调整算法调整所述三个预设权重，直至所述样本语音识别结果的错误检测结果与所述预设检测结果相同，得到所述三个特征权重。

在上述方案中，所述根据第一判断结果确定所述待测语音识别结果的错误检测结果，包括：

在所述第一判断结果为所述第一评估结果不满足所述预设条件的情况下，确定所述待测语音识别结果的错误检测结果为存在错误；

在所述第一判断结果为所述第一评估结果满足所述预设条件的情况下，确定所述待测语音识别结果的错误检测结果为无错误。

在上述方案中，所述判断所述第一评估结果是否满足预设条件，得到第一判断结果，包括：

比较所述第一评估结果和评估阈值；

在所述第一评估结果小于所述评估阈值的情况下，确定所述第一判断结果为所述第一评估结果不满足所述预设条件；

在所述第一评估结果大于或者等于所述评估阈值的情况下，确定所述第一判断结果为所述第一评估结果满足所述预设条件。

本申请实施例提供了一种语音识别结果检测装置，包括：

翻译模块，配置为获取待测语音识别结果，并利用机器翻译模型将所述待测语音识别结果从第一语种翻译至第二语种，得到待测翻译结果；

确定模块，配置为基于所述待测翻译结果和所述待测语音识别结果，确定第一评估特征；所述第一评估特征用于表征所述待测语音识别结果的识别和翻译效果；

评估模块，配置为基于所述第一评估特征对所述待测语音识别结果进行评估，得到第一评估结果；

判断模块，配置为判断所述第一评估结果是否满足预设条件，得到第一判断结果，并根据所述第一判断结果确定所述待测语音识别结果的错误检测结果。

本申请实施例提供了一种语音识别结果检测装置，所述装置包括处理器和存储器；

所述处理器，配置为执行所述存储器中存储的语音识别结果检测程序，以实现上述语音识别结果检测方法。

本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述语音识别结果检测方法。

本申请实施例提供了一种语音识别结果检测方法及装置、存储介质，方法包括：获取待测语音识别结果，并利用机器翻译模型将待测语音识别结果从第一语种翻译至第二语种，得到待测翻译结果；基于待测翻译结果和待测语音识别结果，确定第一评估特征；第一评估特征用于表征所述待测语音识别结果的识别和翻译效果；基于第一评估特征对待测语音识别结果进行评估，得到第一评估结果；判断第一评估结果是否满足预设条件，得到第一判断结果，并根据第一判断结果确定待测语音识别结果的错误检测结果。本申请实施例提供的技术方案，将待测语音识别结果翻译成另一种语种，以结合翻译结果对待测语音识别进行错误检测，相比于仅基于单一语种相关特征进行错误检测，可以得到更多的特征以实现错误检测，提高了错误检测的准确率。

附图说明

图1为本申请实施例提供的一种语音识别结果检测方法的流程示意图；

图2为本申请实施例提供的一种示例性的语音识别结果的错误检测过程示意图；

图3为本申请实施例提供的一种确定三个特征权重的流程示意图；

图4为本申请实施例提供的一种示例性的语音识别结果检测方法应用的系统架构示意图；

图5为本申请实施例提供的一种语音识别结果检测装置的结构示意图一；

图6为本申请实施例提供的一种语音识别结果检测装置的结构示意图二。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。可以理解的是，此处所描述的具体实施例仅仅用于解释相关申请，而非对该申请的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关申请相关的部分。

本申请实施例提供了一种语音识别结果检测方法，通过语音识别结果检测装置实现。图1为本申请实施例提供的一种语音识别结果检测方法的流程示意图。如图1所示，语音识别结果检测方法主要包括以下步骤：

S101、获取待测语音识别结果，并利用机器翻译模型将待测语音识别结果从第一语种翻译至第二语种，得到待测翻译结果。

在本申请的实施例中，语音识别结果检测装置可以获取到待测语音识别结果，并利用机器翻译模型将待测语音识别结果从第一语种翻译至第二语种，得到待测翻译结果。

需要说明的是，在本申请的实施例中，待测语音识别结果为需要进行错误检测的语音识别结果，是语音识别后生成的文本。语音识别结果检测装置可以接收语音识别处理装置将语音识别得到的待测语音识别结果，此外，语音识别结果检测装置自身也可以配置有识别模块，以进行语音识别，得到待测语音识别结果。具体的待测语音识别结果，以及待测语音识别结果的来源本申请实施例不作限定。

需要说明的是，在本申请的实施例中，待测语音识别结果的语种为第一语种。机器翻译模型为可以将输入的文本从第一语种翻译至第二语种，第一语种和第二语种为两种不同的语种。具体的机器翻译模型，以及第一语种和第二语种可以根据实际需求选择，本申请实施例不作限定。

示例性的，在本申请的实施例中，待测语音识别结果的语种为汉语，即第一语种为汉语，机器翻译模型可以将待测语音识别结果从汉语翻译至英语，即第二语种为英语，从而得到语种为英语的待测翻译结果。

S102、基于待测翻译结果和待测语音识别结果，确定第一评估特征；第一评估特征用于表征待测语音识别结果的识别和翻译效果。

在本申请的实施例中，语音识别结果检测装置在获得待测语音识别结果和待测语音识别结果之后，可以基于待测翻译结果和待测语音识别结果，确定第一评估特征，第一评估特征用于表征待测语音识别结果的识别和翻译效果。

具体地，在本申请的实施例中，语音识别结果检测装置基于待测翻译结果和待测语音识别结果，确定第一评估特征，包括：获取机器翻译模型对待测翻译结果的第一翻译评分和第一困惑度评分；将待测语音识别结果输入第一语种对应的语言模型，得到第一语言模型得分；将第一翻译评分、第一困惑度评分和第一语言模型得分确定为第一评估特征。

需要说明的是，在本申请的实施例中，语音识别结果检测装置在步骤S101利用机器翻译模型对待测语音识别结果进行翻译的过程中，实际上可以翻译出语种为第二语种的多个翻译结果，并针对每一个翻译结果确定出相应的翻译评分和困惑度评分。其中，翻译评分表征翻译结果的整体翻译效果，例如，流畅程度和语义匹配程度，困惑度评分表征翻译结果在翻译过程中受到的混淆程度。机器翻译模型实际上是将多个翻译结果中翻译评分最高的翻译结果，确定为待测语音识别结果对应的待测翻译结果，因此，语音识别结果检测装置可以直接获取到机器翻译模型对待测翻译结果的翻译评分和困惑度评分，确定为第一翻译评分和第一困惑度评分。

需要说明的是，在本申请的实施例中，待测语音识别结果的语种为第一语种，因此，语音识别结果检测装置可以将待测语音识别结果输入第一语种对应的语言模型，该语言模型可以基于设计的第一语种相关的词语搭配，上下文结构对待测语音识别结果从流畅度、语句结构方面等进行评估，从而得到相应的语言模型得分。也就是说，第一语音模型评分表征了待侧语音识别结果在第一语种环境下语义表达的效果。

示例性地，在本申请的实施例中，待测语音识别结果为“今天天气怎么样”，语音识别结果检测装置可以将该待测语音识别结果输入汉语语种的语言模型，该模型从语句流畅度和结构等方面进行评估，从而得到第一语言模型得分A1。此外，语音识别结果检测装置将“今天天气怎么样”利用机器翻译模型翻译至英语，得到待测翻译结果为“What’s the weather like today”，以及待测翻译结果的第一翻译评分A2和第一困惑度评分A3。其中，A1、A2和A3均为第一评估特征。

可以理解的是，在本申请的实施例中，语音识别结果检测装置将第一翻译评分、第一困惑度评分和第一语言模型评分确定为第一评估特征，不仅从待测语音识别结果的语种特征上进行识别效果的考量，还从待测语音识别结果的另一种语种的表达结果上进行考量，可以获得更多表征待测语音识别结果识别效果的信息，从而利用第一评估特征可以更准确的进行后续错误检测。

需要说明的是，在本申请的实施例中，语音识别结果检测装置还可以按照其它方式，从其它角度基于待测翻译结果和待测语音识别结果，确定第一评估特征。例如，语音识别结果检测装置也可以对待测翻译结果和待测语音识别结果从通顺度，语言逻辑等方面利用相应的模型各自进行评分，将每一个分数确定为一个第一评估特征。具体的第一评估特征的数量和类型本申请实施例不作限定。

S103、基于第一评估特征对待测语音识别结果进行评估，得到第一评估结果。

在本申请的实施例中，语音识别结果检测装置在获得第一评估特征之后，进一步的，基于第一评估特征对待测语音识别结果进行评估，得到第一评估结果。

具体地，在本申请的实施例中，语音识别结果检测装置基于第一评估特征对待测语音识别结果进行评估，得到第一评估结果，包括：获取第一第一翻译评分、第一困惑度评分和第一语言模型得分中每一个对应的特征权重，得到三个特征权重；利用三个特征权重对第一翻译评分、第一困惑度评分和所述第一语言模型得分进行加权处理，得到第一评估结果。

需要说明的是，在本申请的实施例中，针对第一评估特征中每一种类型的评估特征，设置有对应的特征权重，以表征利用该评估特征在进行待测语音识别结果评估的过程中的重要程度。语音识别结果检测装置可以将第一评估特征中的每一个评估特征，与相应的特征权重相乘，得到三个乘积结果，之后，计算三个乘积结果的总和即为第一评估结果。

具体地，在本申请的实施例中，第一评估特征包括：翻译评分、困惑度评分和语言模型得分，语音识别结果检测装置按照以下公式(1)计算待测语音识别结果的第一评估结果：

Score(s)＝λ ₁×TM+λ ₂×PP+λ ₃×LM (1)

其中，Score(s)为第一评估结果，TM为翻译评分，λ ₁为翻译评分对应的特征权重，PP为困惑度评分，λ ₂为困惑度评分对应的特征权重，LM为语音模型得分，λ ₃为语言模型得分对应的特征权重。

需要说明的是，在本申请的实施例中，语音识别结果检测装置对第一评估特征进行加权处理，不仅可以按照上述加权求和的方式得到第一评估结果，还可以进行其它形式的加权处理，例如，加权平均等，本申请实施例不作限定。

S104、判断第一评估结果是否满足预设条件，得到第一判断结果，并根据第一判断结果确定得到待测语音识别结果的错误检测结果。

在本申请的实施例中，语音识别结果检测装置在得到第一评估结果之后，即可判断第一评估结果是否满足预设条件，得到第一判断结果，并根据第一判断结果确定确定出待测语音识别结果的错误检测结果。

具体地，在本申请的实施例中，语音识别结果检测装置根据第一判断结果确定待测语音识别结果的错误检测结果，包括：在第一判断结果为第一评估结果不满足预设条件的情况下，确定待测语音识别结果的错误检测结果为存在错误；在第一判断结果为第一评估结果满足预设条件的情况下，确定待测语音识别结果的错误检测结果为无错误。

具体地，在本申请的实施例中，语音识别结果检测装置判断第一评估结果是否满足预设条件，得到第一判断结果，包括：比较第一评估结果和评估阈值；在第一评估结果小于评估阈值的情况下，确定第一判断结果为第一评估结果不满足所述预设条件；在第一评估结果大于或者等于评估阈值的情况下，确定第一判断结果为第一评估结果不满足预设条件。

可以理解的是，在本申请的实施例中，第一评估结果表征了待测语音识别结果在流畅度、错别字等各方面的整体评分，因此，在第一评估结果小于评估阈值的情况下，说明待测语音识别结果存在错误，相应的，在第一评估结果大于或者等于评估阈值的情况下，说明待测语音识别结果无错误。具体的评估阈值可以根据实际需求设置，本申请实施例不作限定。

需要说明的是，在本申请的实施例中，可以根据实际错误检测标准预先设置预设条件，具体的预设条件本申请实施例不作限定。例如，预设条件还可以为预设区间，即在第一评估结果超出预设区间的情况下，确定待测语音识别结果的错误检测结果为存在错误，在第一评估结果处于预设区间范围内的情况下，确定待测语音识别结果的错误检测结果为无错误。

图2为本申请实施例提供的一种示例性的语音识别结果的错误检测过程示意图。如图2所示，语音识别结果检测装置将待测语音识别结果输入机器翻译模型，机器翻译模型即可将待测语音识别结果第一语种翻译至第二语种，输出待测翻译结果，之后，获取待测翻译结果翻译评分、困惑度评分，以及待测语音识别结果的语言模型得分，从而利用相应的特征权重进行加权求和，得到第一评估结果，最后，将第一评估结果与评估阈值进行比较，确定待测语音识别结果的错误检测结果。

需要说明的是，在本申请的实施例中，语音识别结果检测装置在上述步骤S103中获取三个特征权重之前，实际上可以按照一定方式确定出三个特征权重。

图3为本申请实施例提供的一种确定三个特征权重的流程示意图。如图3所示，主要包括以下步骤：

S301、获取样本语音识别结果，以及样本语音识别结果的预设检测结果。

在本申请的实施例中，语音识别结果检测装置可以先获取到样本语音识别结果，以及样本语音识别结果的预设检测结果。

需要说明的是，在本申请的实施例中，样本语音识别结果的数量可以为多个。例如几十万个。样本语音识别结果的预设检测结果，即为人工对样本语音识别结果是否存在错误的判断结果。

示例性的，在本申请的实施例中，一个样本语音识别结果为“第一大学2019年新生开学”，其预设检测结果为无错误。此外，还有一个样本语音识别结果为“第二大学热列欢迎2019年新生开学”，其预设检测结果为存在错误。

需要说明的是，在本申请的实施例中，可以按照一定比例的无错误和存在错误的预设检测结果，获取大量的样本语音识别结果，具体的比例本申请实施例不作限定。

需要说明的是，在本申请的实施例中，样本语音识别结果与待测语音识别结果的语种相同，即均为第一语种。

S302、利用机器翻译模型将样本语音识别结果从第一语种翻译至第二语种，得到样本翻译结果。

在本申请的实施例中，语音识别结果检测装置在获得样本语音识别结果之后，可以利用机器翻译模型将样本语音识别结果从第一语种翻译至第二语种，得到样本翻译结果。

需要说明的是，在本申请的实施例中，语音识别结果检测装置利用机器翻译模型翻译样本语音识别结果的过程，与上述步骤S101中翻译待测语音识别结果相同，在此不再赘述。

S303、基于样本翻译结果和样本语音识别结果，确定第二翻译评分、第二困惑度评分和第二语言模型得分。

在本申请的实施例中，语音识别结果检测装置在得到样本翻译结果和样本语音识别结果之后，进一步的，基于样本翻译结果和样本语音识别结果，确定第二翻译评分、第二困惑度评分和第二语言模型得分。

需要说明的是，在本申请的实施例中，语音识别结果检测装置基于样本翻译结果和样本语音识别结果，确定第二翻译评分、第二困惑度评分和第二语言模型得分，与上述步骤S102中基于待测翻译结果和待测语音识别结果，确定第一翻译评分、第一困惑度评分和第一语言模型得分的过程类似，在此不再赘述。

S304、获取第二翻译评分、第二困惑度评分和第二语言模型得分中每一个对应的预设权重，得到三个预设权重。

在本申请的实施例中，语音识别结果检测装置还可以获取到第二翻译评分、第二困惑度评分和第二语言模型得分中每一个对应的预设权重，得到三个预设权重。

需要说明的是，在本申请的实施例中，因为在初始情况下，无法判断不同类型的特征在进行错误检测过程中的重要程度，因此，可以预先设置三个预设权重，例如，可以将三个预设权重中的每一个权重均设置为1。具体的三个预设权重本申请实施例不作限定。

S305、利用第二翻译评分、第二困惑度评分、第二语言模型得分、预设检测结果和三个预设权重，确定三个特征权重。

在本申请的实施例中，语音识别结果检测装置在得到第二翻译评分、第二困惑度评分、第二语言模型得分、预设检测结果和三个预设权重之后，即可利用第二翻译评分、第二困惑度评分、第二语言模型得分、预设检测结果和三个预设权重，确定三个特征权重。

具体地，在本申请的实施例中，语音识别结果检测装置利用第二翻译评分、第二困惑度评分、第二语言模型得分、预设检测结果和三个预设权重，确定三个特征权重，包括：利用三个预设权重对第二翻译评分、第二困惑度评分和第二语言模型得分进行加权处理，得到第二评估结果；判断第二评估结果是否满足预设条件，得到第二判断结果，并根据第二判断结果确定样本语音识别结果的错误检测结果；基于样本语音识别结果的错误检测结果和预设检测结果，调整三个预设权重，得到三个特征权重。

需要说明的是，在本申请的实施例中，语音识别结果检测装置利用三个预设权重对第二评估特征进行加权处理，与上述步骤S103中利用三个特征权重对第一评估特征加权处理的过程类似，区别仅在于特征和权重的具体值，在此不再赘述。

需要说明的是，在本申请的实施例中，语音识别结果检测装置判断第二评估结果是否满足预设条件，与上述步骤S104中判断第一评估结果是否满足预设条件的过程类似，区别仅在于判断的对象不同，在此不再赘述。

具体地，在本申请的实施例中，语音识别结果检测装置基于样本语音识别结果的错误检测结果和预设检测结果，调整三个预设权重，得到三个特征权重，包括：按照权重调整算法调整三个预设权重，直至样本语音识别结果的错误检测结果与预设检测结果相同，得到三个特征权重。

可以理解的是，在本申请的实施例中，样本语音识别结果的错误检测结果与预设检测结果相同，即说明权重设置的较为合适，因此，可以将调整后的三个预设权重确定为三个特征权重。

需要说明的是，在本申请的实施例中，可以根据实际需求预设权重调整算法，例如最小错误率训练(Minimum error rate training，MERT)算法等。具体的权重调整算法本申请实施例不作限定。

可以理解的是，在本申请的实施例中，语音识别结果检测装置可以利用大量的样本语音识别结果进行三个特征权重的确定，因此，语音识别结果检测装置可以在调整权重过程中，当大量的样本语音识别结果中较高比例的样本语音识别结果的错误检测结果与预设检测结果相同时，即可将得到的权重确定为特征权重。

需要说明的是，在本申请的实施例中，上述语音识别结果检测方法可以应用于各种需要语音识别的应用场景中，以实现语音识别结果的错误检测。

图4为本申请实施例提供的一种示例性的语音识别结果检测方法应用的系统架构示意图。如图4所示，所述系统可包括：客户端、云端、语音处理服务器和显示屏幕，其中，云端中集成有本申请提供的语音识别结果检测方法。

实际应用中，在进行会议演讲的过程中，客户端采集演讲者的语音数据，将采集的语音数据发送给语音处理服务器，该语音处理服务器对语音数据进行识别，得到待测语音识别结果，之后，语音处理服务器可以将待测语音识别结果发送云端，由云端按照语音识别结果检测方法对待测语音识别结果进行错误检测，并将错误检测结果返回给语音处理服务器，如果错误检测结果为存在错误，语音处理服务器即可根据错误检测结果对待测语音识别结果按照一定方式进行纠正，得到正确的语音识别结果，最终将正确的语音识别结果投屏到显示屏幕上进行展示。

需要说明的是，在本申请的实施例中，上述语音识别结果检测方法采用软件的方式实现，不仅可以集成在上述云端，还可以集成在移动终端上，本申请实施例不作限定。

本申请实施例提供了一种语音识别结果检测方法，包括：获取待测语音识别结果，并利用机器翻译模型将待测语音识别结果从第一语种翻译至第二语种，得到待测翻译结果；基于待测翻译结果和待测语音识别结果，确定第一评估特征；第一评估特征用于表征待测语音识别结果的识别和翻译效果；基于第一评估特征对待测语音识别结果进行评估，得到第一评估结果；判断第一评估结果是否满足预设条件，得到第一判断结果，并根据第一判断结果确定待测语音识别结果的错误检测结果。本申请实施例提供的技术方案，将待测语音识别结果翻译成另一种语种，以结合翻译结果对待测语音识别进行错误检测，相比于仅基于单一语种相关特征进行错误检测，可以得到更多的特征以实现错误检测，提高了错误检测的准确率。

本申请实施例提供了一种语音识别结果检测装置。图5为本申请实施例提供的一种语音识别结果检测装置的结构示意图一。如图5所示，语音识别结果检测装置包括：

翻译模块501，配置为获取待测语音识别结果，并利用机器翻译模型将所述待测语音识别结果从第一语种翻译至第二语种，得到待测翻译结果；

确定模块502，配置为基于所述待测翻译结果和所述待测语音识别结果，确定第一评估特征；所述第一评估特征用于表征所述待测语音识别结果的识别和翻译效果；

评估模块503，配置为基于所述第一评估特征对所述待测语音识别结果进行评估，得到第一评估结果；

判断模块504，配置为判断所述第一评估结果是否满足预设条件，得到得到第一判断结果，并根据所述第一判断结果确定所述待测语音识别结果的错误检测结果。

在一实施例中，所述确定模块502，配置为获取所述机器翻译模型对所述待测翻译结果的翻译评分和困惑度评分，得到第一翻译评分和第一困惑度评分；将所述待测语音识别结果输入所述第一语种对应的语言模型，得到第一语言模型得分；将所述第一翻译评分、所述第一困惑度评分和所述第一语言模型得分确定为第一评估特征。

在一实施例中，所述评估模块503，配置为获取所述第一翻译评分、所述第一困惑度评分和所述第一语言模型得分中每一个对应的特征权重，得到三个特征权重；利用所述三个特征权重对所述第一翻译评分、所述第一困惑度评分和所述第一语言模型得分进行加权处理，得到所述第一评估结果。

在一实施例中，所述确定模块502，配置为获取样本语音识别结果，以及所述样本语音识别结果的预设检测结果；利用所述机器翻译模型将所述样本语音识别结果从所述第一语种翻译至所述第二语种，得到样本翻译结果；基于所述样本翻译结果和所述样本语音识别结果，确定第二翻译评分、第二困惑度评分和第二语言模型得分；获取所述第二翻译评分、所述第二困惑度评分和所述第二语言模型得分中每一个对应的预设权重，得到三个预设权重；利用所述第二翻译评分、所述第二困惑度评分、所述第二语言模型得分、所述预设检测结果和所述三个预设权重，确定所述三个特征权重。

在一实施例中，所述确定模块502，配置为利用所述三个预设权重对所述第二翻译评分、所述第二困惑度评分、所述第二语言模型得分进行加权处理，得到第二评估结果；判断所述第二评估结果是否满足所述预设条件，得到得到第二判断结果，并根据所述第二判断结果确定所述样本语音识别结果的错误检测结果；基于所述样本语音识别结果的错误检测结果和所述预设检测结果，调整所述三个预设权重，得到所述三个特征权重。

在一实施例中，所述确定模块502，配置为按照权重调整算法调整所述三个预设权重，直至所述样本语音识别结果的错误检测结果与所述预设检测结果相同，得到所述三个特征权重。

在一实施例中，所述判断模块504，配置为在所述第一判断结果为所述第一评估结果不满足所述预设条件的情况下，确定所述待测语音识别结果的错误检测结果为存在错误；在所述第一判断结果为所述第一评估结果满足所述预设条件的情况下，确定所述待测语音识别结果的错误检测结果为无错误。

在一实施例中，所述判断模块504，配置为比较所述第一评估结果和评估阈值；在所述第一评估结果小于所述评估阈值的情况下，确定所述第一判断结果为所述第一评估结果不满足所述预设条件；在所述第一评估结果大于或者等于所述评估阈值的情况下，确定所述第一判断结果为所述第一评估结果满足所述预设条件。

需要说明的是，实际应用时，所述翻译模块501、所述确定模块502、所述评估模块503和所述判断模块504所执行的步骤可由处理器实现。

需要说明的是：上述实施例提供的语音识别结果检测装置在进行语音识别结果的错误检测时，仅以上述各程序模块的划分进行举例说明，实际应用中，可以根据需要而将上述处理分配由不同的程序模块完成，即将装置的内部结构划分成不同的程序模块，以完成以上描述的全部或者模块处理。另外，上述实施例提供的语音识别结果检测装置与语音识别结果检测方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

基于上述程序模块的硬件实现，且为了实现申请实施例的方法，本申请实施例还提供了一种语音识别结果检测装置。图6为本申请实施例提供的一种语音识别结果检测装置的结构示意图二。如图6所示，语音识别结果检测装置包括：处理器601、存储器602和通信总线603；

所述通信总线603，配置为实现所述处理器601和所述存储器602之间的通信连接；

所述处理器601，配置为执行所述存储器602中存储的语音识别结果检测程序，以实现上述语音识别结果检测方法。

本申请实施例提供了一种语音识别结果检测装置，获取待测语音识别结果，并利用机器翻译模型将待测语音识别结果从第一语种翻译至第二语种，得到待测翻译结果；基于待测翻译结果和待测语音识别结果，确定第一评估特征；第一评估特征用于表征所述待测语音识别结果的识别和翻译效果；基于第一评估特征对待测语音识别结果进行评估，得到第一评估结果；判断第一评估结果是否满足预设条件，得到第一判断结果，并根据第一判断结果确定待测语音识别结果的错误检测结果。本申请实施例提供的语音识别结果检测装置，将待测语音识别结果翻译成另一种语种，以结合翻译结果对待测语音识别进行错误检测，相比于仅基于单一语种相关特征进行错误检测，可以得到更多的特征以实现错误检测，提高了错误检测的准确率。

本申请实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被一个或者多个处理器执行时实现上述同声传译方法。计算机可读存储介质可以是易失性存储器(volatile memory)，例如随机存取存储器(Random-Access Memory，RAM)；或者非易失性存储器(non-volatile memory)，例如只读存储器(Read-Only Memory，ROM)，快闪存储器(flash memory)，硬盘(Hard Disk Drive，HDD)或固态硬盘(Solid-State Drive，SSD)；也可以是包括上述存储器之一或任意组合的各自设备，如移动电话、计算机、平板设备、个人数字助理等。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的实现流程示意图和/或方框图来描述的。应理解可由计算机程序指令实现流程示意图和/或方框图中的每一流程和/或方框、以及实现流程示意图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在实现流程示意图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在实现流程示意图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在实现流程示意图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本实用申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种语音识别结果检测方法，包括：

获取待测语音识别结果，并利用机器翻译模型将所述待测语音识别结果从第一语种翻译至第二语种，得到待测翻译结果；

基于所述待测翻译结果和所述待测语音识别结果，确定第一评估特征；所述第一评估特征用于表征所述待测语音识别结果的识别和翻译效果；

基于所述第一评估特征对所述待测语音识别结果进行评估，得到第一评估结果；

判断所述第一评估结果是否满足预设条件，得到第一判断结果，并根据所述第一判断结果确定所述待测语音识别结果的错误检测结果。
根据权利要求1所述的方法，其中，所述基于所述待测翻译结果和所述待测语音识别结果，确定第一评估特征，包括：

获取所述机器翻译模型对所述待测翻译结果的翻译评分和困惑度评分，得到第一翻译评分和第一困惑度评分；

将所述待测语音识别结果输入所述第一语种对应的语言模型，得到第一语言模型得分；

将所述第一翻译评分、所述第一困惑度评分和所述第一语言模型得分确定为所述第一评估特征。
根据权利要求2所述的方法，其中，所述基于所述第一评估特征对所述待测语音识别结果进行评估，得到第一评估结果，包括：

获取所述第一翻译评分、所述第一困惑度评分和所述第一语言模型得分中每一个对应的特征权重，得到三个特征权重；

利用所述三个特征权重对所述第一翻译评分、所述第一困惑度评分和所述第一语言模型得分进行加权处理，得到所述第一评估结果。
根据权利要求3所述的方法，其中，所述获取所述第一翻译评分、所述第一困惑度评分和所述第一语言模型得分中每一个对应的特征权重，得到三个特征权重之前，所述方法还包括：

获取样本语音识别结果，以及所述样本语音识别结果的预设检测结果；

利用所述机器翻译模型将所述样本语音识别结果从所述第一语种翻译至所述第二语种，得到样本翻译结果；

基于所述样本翻译结果和所述样本语音识别结果，确定第二翻译评分、第二困惑度评分和第二语言模型得分；

获取所述第二翻译评分、所述第二困惑度评分和所述第二语言模型得分中每一个对应的预设权重，得到三个预设权重；

利用所述第二翻译评分、所述第二困惑度评分、所述第二语言模型得分、所述预设检测结果和所述三个预设权重，确定所述三个特征权重。
根据权利要求4所述的方法，其中，所述利用所述第二翻译评分、所述第二困惑度评分、所述第二语言模型得分、所述预设检测结果和所述三个预设权重，确定所述三个特征权重，包括：

利用所述三个预设权重对所述第二翻译评分、所述第二困惑度评分和所述第二语言模型得分进行加权处理，得到第二评估结果；所述第二评估特征用于表征所述样本语音识别结果的识别和翻译效果；

判断所述第二评估结果是否满足所述预设条件，得到第二判断结果，并根据所述第二判断结果确定所述样本语音识别结果的错误检测结果；

基于所述样本语音识别结果的错误检测结果和所述预设检测结果，调整所述三个预设权重，得到所述三个特征权重。
根据权利要求5所述的方法，其中，所述基于所述样本语音识别结果的错误检测结果和所述预设检测结果，调整所述三个预设权重，得到所述三个特征权重，包括：

按照权重调整算法调整所述三个预设权重，直至所述样本语音识别结果的错误检测结果与所述预设检测结果相同，得到所述三个特征权重。
根据权利要求1-6任一项所述的方法，其中，所述根据第一判断结果确定所述待测语音识别结果的错误检测结果，包括：

在所述第一判断结果为所述第一评估结果不满足所述预设条件的情况下，确定所述待测语音识别结果的错误检测结果为存在错误；

在所述第一判断结果为所述第一评估结果满足所述预设条件的情况下，确定所述待测语音识别结果的错误检测结果为无错误。
根据权利要求1-7任一项所述的方法，其中，所述判断所述第一评估结果是否满足预设条件，得到第一判断结果，包括：

比较所述第一评估结果和评估阈值；

在所述第一评估结果小于所述评估阈值的情况下，确定所述第一判断结果为所述第一评估结果不满足所述预设条件；

在所述第一评估结果大于或者等于所述评估阈值的情况下，确定第一判断结果为所述第一评估结果满足所述预设条件。
一种语音识别结果检测装置，包括：

翻译模块，配置为获取待测语音识别结果，并利用机器翻译模型将所述待测语音识别结果从第一语种翻译至第二语种，得到待测翻译结果；

确定模块，配置为基于所述待测翻译结果和所述待测语音识别结果，确定第一评估特征；所述第一评估特征用于表征所述待测语音识别结果的识别和翻译效果；

评估模块，配置为基于所述第一评估特征对所述待测语音识别结果进行评估，得到第一评估结果；

判断模块，配置为判断所述第一评估结果是否满足预设条件，得到第一判断结果，并根据所述第一判断结果确定所述待测语音识别结果的错误检测结果。
一种语音识别结果检测装置，所述装置包括处理器和存储器；

所述处理器，配置为执行所述存储器中存储的语音识别结果检测程序，以实现权利要求1至8任一项所述的语音识别结果检测方法。
一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如权利要求1至8任一项所述的语音识别结果检测方法。