CN110473522A

CN110473522A - 一种精确分析短语音片段的方法

Info

Publication number: CN110473522A
Application number: CN201910782768.1A
Authority: CN
Inventors: 周继敏
Original assignee: Baikelu (beijing) Technology Co Ltd
Current assignee: Baikelu (beijing) Technology Co Ltd
Priority date: 2019-08-23
Filing date: 2019-08-23
Publication date: 2019-11-19
Anticipated expiration: 2039-08-23
Also published as: CN110473522B

Abstract

本发明涉及一种精确分析短语音片段的方法。该方法包括：语音识别系统在通话过程中实时捕捉语音，并且自动记录通话信息；确定可预计的特别简短的回答的语音片段；在不影响实时通话的情况下，利用机器学习训练分类模型的二次语音识别系统离线分析被呼方在所述语音片段内的语音，得到正确的文字；记录通过二次分析确定的正确语音文字，以便提高实时语音识别的准确性。本发明解决了如何实时语音识别语音片段中的单词的问题，使得用户能够准确地记录所需的语音信息，而不会中断电话交谈的流程。

Description

一种精确分析短语音片段的方法

技术领域

本发明涉及机器学习领域。更具体地说，本发明涉及一种精确分析短语音片段的方法。

背景技术

目前，语音识别是目前与人工智能相关的主要任务之一，特别是在用于电话通信的人工智能中，因为这种通信是纯语音的。语音识别技术在相当长的声音片段中能有效识别文字，准确率也较高；但由于缺乏上下文，在短的声音片段中很难进行识别和分析。在包括汉语和英语在内的许多语言中，同音异义词或发音相似的词的存在，进一步复杂化了对这些短片段中的单词的实时语音识别。

通过预先给这些简短的语音片段进行分类建模，并通过离线识别系统进行响应，这种方法使企业能够准确地记录所需的语音信息，而不会中断电话交谈的流程。

发明内容

本发明所要解决的技术问题是提供一种精确分析短语音片段的方法，解决了如何实时语音识别语音片段中的单词的问题，使得用户能够准确地记录所需的语音信息，而不会中断电话交谈的流程。

通过本发明可以实现的技术目的不限于上文已经特别描述的内容，并且本领域技术人员将从下面的详细描述中更加清楚地理解本文中未描述的其他技术目的。

本发明解决上述技术问题的技术方案如下：

根据本公开的一方面，本发明提供一种精确分析短语音片段的方法，所述方法包括语音识别系统在通话过程中实时捕捉语音，并且自动记录通话信息；确定可预计的特别简短的回答的语音片段；在不影响实时通话的情况下，利用机器学习训练分类模型的二次语音识别系统离线分析被呼方在所述语音片段内的语音，得到正确的文字；记录通过二次分析确定的正确语音文字，以便提高实时语音识别的准确性。

可选地，在如上所述的方法中，所述可预计的特别简短的回答的语音片段包括客户服务的评分、客户是否满意、客户希望合约维持多久。

可选地，在如上所述的方法中，在自动呼叫中，根据会话语言规范，预测被呼方会对某些特定的片段作出简短的响应，确定所述片段，并且自动记录接收者的反应和持续的对话。

可选地，在如上所述的方法中，所述片段是通过机器学习模型处理的，所述机器学习模型通过Python分类程序进行训练，所述程序测试音频相似性，所记录的语音被分类有正确的标签，在不中断电话的情况下自动更正在电话中记录的最终数据。

上述技术方案仅为本发明实施例的一些部分，本领域技术人员从以下本发明的详细描述中可以导出和理解包含了本发明的技术特征的各种实施例。

本领域技术人员将会理解，通过本发明可以实现的效果不限于上文已经具体描述的内容，并且从以下详细说明中将更清楚地理解本发明的其他优点。

附图说明

被包括以提供对本发明的进一步理解的附图示出本发明的实施例，并且与说明书一起用于解释本发明的原理。

图1为本发明实施例提供的精确分析短语音片段的方法的流程图。

图2为本发明实施例提供的精确分析短语音片段的方法的示意图。

具体实施方式

现在将详细参考本发明的示例性实施例，其示例在附图中示出。下面将参考附图给出的详细描述旨在解释本发明的示例性实施例，而不是示出可以根据本发明实现的唯一实施例。以下详细描述包括具体细节以便提供对本发明的透彻理解。然而，对于本领域技术人员来说显而易见的是，可以在没有这些具体细节的情况下实践本发明。

在一些情况下，已知的结构和设备被省略或以框图形式示出，集中于结构和设备的重要特征，以免模糊本发明的概念。在整个说明书中将使用相同的附图标记来表示相同或相似的部分。

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

在本发明的描述中，需要理解的是，术语“上”、“下”、“中心”、“内”、“外”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

图1示出了本发明实施例提供的精确分析短语音片段的方法的流程图。如图1所示，本发明提供了一种精确分析短语音片段的方法，所述方法包括语音识别系统在通话过程中实时捕捉语音，并且自动记录通话信息；确定可预计的特别简短的回答的语音片段；在不影响实时通话的情况下，利用机器学习训练分类模型的二次语音识别系统离线分析被呼方在所述语音片段内的语音，得到正确的文字；记录通过二次分析确定的正确语音文字，以便提高实时语音识别的准确性。可选地，在如上所述的方法中，所述可预计的特别简短的回答的语音片段包括客户服务的评分、客户是否满意、客户希望合约维持多久。可选地，在如上所述的方法中，在自动呼叫中，根据会话语言规范，预测被呼方会对某些特定的片段作出简短的响应，确定所述片段，并且自动记录接收者的反应和持续的对话。例如，当问了一个问题，例如“请对我们的服务进行打分，满分10分？”实时识别系统可能将“四分”误译为“十分”。然而，谈话没有中断。可选地，在如上所述的方法中，所述片段是通过机器学习模型处理的，所述机器学习模型通过Python分类程序进行训练，所述程序测试音频相似性，所记录的语音被分类有正确的标签，在不中断电话的情况下自动更正在电话中记录的最终数据。例如，将客户对问题的响应从“十分”更改为“四分”。

图2示出了本发明实施例提供的精确分析短语音片段的方法的示意图。如图2所示，精确分析短语音片段的方法如下：1.0在电话的整个通话过程中实时语音识别系统正在进行实时语音识别；2.0预先识别的短的片段被记录下来；3.0利用离线辅助识别系统对记录的短的片段进行分析；4.0准确的数据被记录下来；5.0这些数据有助于改进实时语音识别系统。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本申请可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现。基于这样的理解，本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

如上所述，已经给出了本发明的优选实施例的详细描述，以使本领域技术人员能够实施和实践本发明。虽然已经参照示例性实施例描述了本发明，但是本领域技术人员将会理解，在不脱离所附权利要求书中描述的本发明的精神或范围的情况下，可以在本发明中进行各种修改和改变。因此，本发明不应限于在此描述的特定实施例，而应被赋予与本文公开的原理和新颖特征一致的最宽范围。

Claims

1.一种精确分析短语音片段的方法，其特征在于，所述方法包括：

语音识别系统在通话过程中实时捕捉语音，并且自动记录通话信息；

确定可预计的特别简短的回答的语音片段；

在不影响实时通话的情况下，利用机器学习训练分类模型的二次语音识别系统离线分析被呼方在所述语音片段内的语音，得到正确的文字；

记录通过二次分析确定的正确语音文字，以便提高实时语音识别的准确性。

2.根据权利要求1所述的方法，

其特征在于，所述可预计的特别简短的回答的语音片段包括客户服务的评分、客户是否满意、客户希望合约维持多久。

3.根据权利要求1所述的方法，

其特征在于，在自动呼叫中，根据会话语言规范，预测被呼方会对某些特定的片段作出简短的响应，确定所述片段，并且自动记录接收者的反应和持续的对话。

4.根据权利要求3所述的方法，

其特征在于，所述片段是通过机器学习模型处理的，所述机器学习模型通过Python分类程序进行训练，所述程序测试音频相似性，所记录的语音被分类有正确的标签，在不中断电话的情况下自动更正在电话中记录的最终数据。