CN109471931A

CN109471931A - 语料收集方法、装置、计算机设备及存储介质

Info

Publication number: CN109471931A
Application number: CN201811400312.6A
Authority: CN
Inventors: 张鹏; 敬大彦
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-11-22
Filing date: 2018-11-22
Publication date: 2019-03-15

Abstract

本发明提供一种语料收集方法及装置，所述方法包括：向网络终端发送语料模板；向语音终端发送读出所述语料模板的语音提示消息；接收所述语音终端发送的目标语料；判断所述目标语料与所述语料模板是否匹配；若是，生成与所述语料模板对应的语料文件。本发明能够本发明能够针对预先设定的语料模板，有针对性的收集所需的语料并制成语料文件，可以高仿真地收集手机或者座机渠道进线的语音，逼近客户真实场景下说话的背景，显著提高语音识别模型的准确率。

Description

语料收集方法、装置、计算机设备及存储介质

技术领域

本发明涉及互联网应用技术领域，尤其涉及一种语料收集方法、装置、计算机设备及存储介质。

背景技术

随着AI语音识别技术的成熟和广泛应用，针对特殊场景收集大量语料的需求日益增多，高质量的语料可以训练出高可用的语音识别模型，进一步准确的识别出客户的意图。

现有相关技术中，大多基于对话的形式收集语料，该种语料的收集方法所收集的语料应用场景比较单一，仅用于聊天的场景；另一方面，该种语料的收集方法一般采用效仿聊天的收集方式，由熟悉业务的相关人员自行通过想象模拟对话场景，收集对话语料。这种语料收集方式，远离真实场景，容易陷入个人的思维及语言定式，导致语料真实度差，并且需要自行想象场景，效率低下。

因此，现有的技术方案中，语料的收集没有针对性，收集的语料不精准，语料真实度差，训练出的语音识别模型适用性不强，语料内容不够丰富。

发明内容

本发明提供一种语料收集方法及相应的装置，其主要实现了针对预先设定的语料模板，有针对性的收集所需的语料，并制成语料文件，可以高仿真地收集手机或者座机渠道进线的语音，逼近客户真实场景下说话的背景，如噪音、各种手机型号设备，显著提高语音识别模型的准确率。

本发明还提供一种用于执行本发明的语料收集方法的计算机设备及可读存储介质。

为解决上述问题，本发明采用如下各方面的技术方案：

第一方面，本发明提供一种语料收集方法，所述方法包括：

向网络终端发送语料模板；向语音终端发送读出所述语料模板的语音提示消息；

接收所述语音终端发送的目标语料；

判断所述目标语料与所述语料模板是否匹配；

若是，生成与所述语料模板对应的语料文件。

具体的，还包括：

接收用户的语音信息；

提取所述语音信息中的业务信息；

根据所述语料文件处理所述业务信息。

具体的，所述语料文件包含目标业务，所述根据所述语料文件，处理所述业务信息包括：

获取所述语料文件中的所述目标业务，向用户的网络终端推送所述目标业务。

优选的，所述判断目标语料与语料模板是否匹配之后，还包括：

若否，向所述语音终端发送重新读出所述语料模板的语音提示消息。

具体的，所述判断目标语料与语料模板是否匹配，包括：

识别所述目标语料中的第一语料内容，获取所述语料模板中的第二语料内容；判断所述第一语料内容与所述第二语料内容是否相同。

具体的，所述向网络终端发送语料模板之前，包括：

接收包含所述语音终端对应的用户号码的注册信息，执行注册；

向已注册的用户号码的语音终端发送呼叫请求。

具体的，还包括：

实时记录制进度信息并创建录制进度信息数据库；

接收网络终端提交的判断当前语料是否录制完成的查询请求；

查询所述录制进度信息数据库并向所述网络终端反馈查询结果。

第二方面，本发明提供一种语料收集装置，所述方法包括：

发送模块，用于向网络终端发送语料模板；向语音终端发送读出所述语料模板的语音提示消息；

接收模块，用于接收所述语音终端发送的目标语料；

判断模块，用于判断所述目标语料与所述语料模板是否匹配；

生成模块，用于若判断所述目标语料与所述语料模板匹配，则生成与所述语料模板对应的语料文件。

第三方面，本发明提供一种计算机设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行如第一方面中任一项权利要求所述语料收集方法的步骤。

第四方面，本发明提供一种存储有计算机可读指令的存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行如第一方面中任一项权利要求所述语料收集方法的步骤。

相对于现有技术，本发明的技术方案至少具备如下优点：

1、本发明提供一种语料收集方法，其特征在于，所述方法通过向网络终端发送语料模板；向语音终端发送读出所述语料模板的语音提示消息；接收所述语音终端发送的目标语料；判断所述目标语料与所述语料模板是否匹配；若是，生成与所述语料模板对应的语料文件。本发明能够针对预先设定的语料模板，有针对性的收集所需的语料，并制成语料文件，可以高仿真地收集手机或者座机渠道进线的语音，逼近客户真实场景下说话的背景，显著提高语音识别模型的准确率以及适用性。

2、本发明可以应用于多种场景中，可以是被客户的意图，根据识别结果处理相关的业务。具体的，本发明可以通过接收用户的语音信息；提取所述语音信息中的业务信息；根据所述语料文件处理所述业务信息。可选的，所述语料文件包含目标业务，所述根据所述语料文件，处理所述业务信息时，获取所述语料文件中的所述目标业务，向用户的网络终端推送所述目标业务。本发明根据所收集的语料可以逼近真实场景，帮助更精准地识别客户意图，便于后续业务的处理。

附图说明

图1为一个实施例中语料收集方法流程图；

图2为一个实施例中语料收集装置结构框图；

图3为一个实施例中计算机设备的内部结构框图。

本发明目的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

在本发明的说明书和权利要求书及上述附图中的描述的一些流程中，包含了按照特定顺序出现的多个操作，但是应该清楚了解，这些操作可以不按照其在本文中出现的顺序来执行或并行执行，操作的序号如S11、S12等，仅仅是用于区分开各个不同的操作，序号本身不代表任何的执行顺序。另外，这些流程可以包括更多或更少的操作，并且这些操作可以按顺序执行或并行执行。需要说明的是，本文中的“第一”、“第二”等描述，是用于区分不同的消息、设备、模块等，不代表先后顺序，也不限定“第一”和“第二”是不同的类型。

本领域普通技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

本领域普通技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)，具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明实施例提供一种语料收集方法，该方法所实现的功能需要包括用户、语音终端、网络终端及服务器的参与，以服务器为本发明实施例的执行主体，执行、实现所述方法的功能，如图1所示，所述方法包括以下步骤：

S11、向网络终端发送语料模板；向语音终端发送读出所述语料模板的语音提示消息。

本发明实施例中，所述网络终端可以为网页端，所述语音终端可以为用户的手机或者座机或其他可以语音通话的终端。

本发明实施例中，服务器接收包含所述语音终端对应的用户号码的注册信息，执行注册。具体的，用户通过网络终端输入指定的网址，所述指定网址即本发明应用对应的网址。网络终端接收所述注册信息，将所述注册信息提交至服务器，服务器接收所述注册信息后完成注册。其中，所述注册信息包含用户号码，所述用户号码可以是手机号或者座机号。

需要说明的是，本发明可以在完成注册之后等待用户拨打热线号码，另一种实施例中，也可以自动拨打已注册的用户号码，向已注册的用户号码的语音终端发送呼叫请求。其中，热线号码为预先设定的用于语料收集的号码。

进一步的，本发明完成注册之后，向网络终端发送语料模板并向语音终端发送读出所述语料模板的语音提示消息。

本发明实施例中，注册成功后会在用户界面展示待拨打的热线号码以及待录制的语料模板。所述语料模板为预先设定的，其可以根据实际需求而设定，可以分为多种不同的语料类型，例如，股票相关、保险业务相关、理财产品相关以及贷款相关的语料模板。设定不同的语料模板的内容后所收集的语料文本可用与不同的场景，如语音合成、语音识别、语音风格迁移等基于特定场景的应用。

另一种实施例中，所述语料模板可以为所述服务器通过智能学习之后向网络终端推送的。例如，服务器通过智能学习收集不同场景下所需的语料模板，并分类建立不同场景下的语料模板库并实时向网络终端推送。

本发明实施例中，所述语音提示信息可以灵活设定，例如，客户拨打热线后，语音提示：欢迎拨打语料收集热线，请在滴声后，读出网页上展示的内容，按#号键结束或5秒超时。

S12、接收所述语音终端发送的目标语料。

本发明实施例中，用户拨打所述热线号码之后，语音终端输出提示开始录制的语音提示信息。用户在收到所述语音提示信息后依据所述语料模板输入所述目标语料。本发明实施例中，所述语料模板中包含待录制的语料内容，所述目标语料为用户依据语料模板输入的语音信息，其中包括用户声纹信息、用户读出的语料内容以及噪音信息。

本发明实施例中，所述服务器在接收所述目标语料的过程中，实时记录制进度信息并创建录制进度信息数据库，后续录制过程中实时更新所述录制进度信息数据库。所述录制进度信息包括但不限于未开始录制、录制过程中、录制完成、接收录制下一条语料的请求、开始录制下一条语料以及制作语料文件。当接收到查询所述录制进度信息的请求时查询所述录制进度信息数据库并反馈查询结果。

一种可能的设计中，用户拨打所述热线号码后后，语音终端输出“欢迎拨打语料收集热线，请在滴声后，读出网页上展示的内容，按#号键结束或5秒超时”的语音提示信息，用户收到该语音提示信息后即开始读出语料模板中的内容。

本发明实施例中，具体可以录制一条或多条语料。一种可能的应用场景中，具体录制如下：

1、网络终端展示待录制的语料模板以及待拨打的热线号码。

2、语音终端在收到用户的通话请求后输出语音提示信息，如“欢迎拨打语料收集热线，请在滴声后，读出网页上展示的内容，按#号键结束或5秒超时”。

3、网络终端接收用户输入的第一条目标语料。

4、语音终端向服务器提交查询录制进度信息的请求，所述服务器查询所述录制进度信息，判断用户是否在网络终端点击了“下一步”的按键获取新语料。若是，则输出下一条语音提示信息，如输出“请在滴声后继续录音，按#号键结束或5秒超时”的语音提示信息；若否，则输出“重新录制请按1，继续录制下一条请在网络终端点击下一步获取语料后，按2，重听请按0”的语音提示信息。

5、用户在网络终端点击了“下一步”后，再在语音终端按2，进行下一条语料录制。若想重新录制，则可直接按1。

6、网络终端接收用户点击“下一步”按键触发的获取新语料的指令后，向服务器提交查询当前语料的录制进度信息的请求，所述服务器接收该请求后查询录制进度信息判断当前语料是否录制完成，若否，则弹出页面提示用户“请先录完本条语料”；若是，直接展示下一条语料模板。

S13、判断所述目标语料与所述语料模板是否匹配。

本发明实施例中，可以通过识别所述目标语料中的第一语料内容，获取所述语料模板中的第二语料内容；判断所述第一语料内容与所述第二语料内容是否相同。

本发明实施例中，当判断所述目标语料与所述语料模板匹配时，生成录制完成的录制进度信息并存入所述录制进度信息数据库。当接收网络终端提交的查询当前语料是否录制完成的请求时，查询所述录制进度信息数据库并向网络终端反馈查询结果。例如，当用户通过网络终端点击“下一步”时，则向服务器提交查询当前语料是否录制完成的请求，服务器查询所述录制进度信息数据库并向网络终端反馈查询结果，若查询结果为未录制完成，会弹出页面提示用户“请先录完本条语料”；若查询结果为录制完成，网页直接弹出下一条新语料。

当用户通过网络终端点击“下一步”时，服务器生成“接收录制下一条语料的请求”的录制进度信息并更新至所述录制进度信息数据库中。当语音终端录制完当前语料时，向服务器提交查询用户是否点击“下一步”的进度信息的请求，服务器查询所述进度信息数据库并反馈查询结果。

S14、若是，生成与所述语料模板对应的语料文件。

本发明实施例中，服务器接收所述目标语料之后，为所述目标语料添加标识信息，所述标识信息可以是所述目标语料的名称或者是编号，所述目标语料的名称可以是依据所述目标语料的内容而设定，例如，当前目标语料为股票相关，则将该目标语料命名为股票相关语料等。

进一步的，建立所述标识信息与目标语料的源文件的映射关系生成所述语料文件并存入预先创建的语料库。一种实施例中，所述语料文件中还包含所述目标语料源文件的文件类型。

进一步的，本发明还包括：接收用户的语音信息；提取所述语音信息中的业务信息；根据所述语料文件处理所述业务信息。一种可能的设计中，所述语料文件包含目标业务，所述根据所述语料文件，处理所述业务信息时获取所述语料文件中的所述目标业务，向用户的网络终端推送所述目标业务。例如，所述语料模板为：“我要办理车贷业务”，则录制完成的语料库中存有“我要办理车贷业务”的语料。当接收客户的语音信息为“准备购车，想办理分期贷款业务”时，提取该语音信息中的业务信息即“分期贷款”、“购车”则根据语料库已存的语料“我要办理车贷业务”，获取语料中的目标业务“车贷”分析客户的意图为车贷意向，则向客户推送与车贷相关的业务内容。本发明实施例中，当判断目标语料与语料模板不匹配时向所述语音终端发送重新读出所述语料模板的语音提示消息。

请参考图2，在另一种实施例中，本发明提供了一种语料收集装置，包括：

发送模块11，用于向网络终端发送语料模板；向语音终端发送读出所述语料模板的语音提示消息。

接收模块12，用于接收所述语音终端发送的目标语料。

1，网络终端展示待录制的语料模板以及待拨打的热线号码。

2，语音终端在收到用户的通话请求后输出语音提示信息，如“欢迎拨打语料收集热线，请在滴声后，读出网页上展示的内容，按#号键结束或5秒超时”。

3，网络终端接收用户输入的第一条目标语料。

4，语音终端向服务器提交查询录制进度信息的请求，所述服务器查询所述录制进度信息，判断用户是否在网络终端点击了“下一步”的按键获取新语料。若是，则输出下一条语音提示信息，如输出“请在滴声后继续录音，按#号键结束或5秒超时”的语音提示信息；若否，则输出“重新录制请按1，继续录制下一条请在网络终端点击下一步获取语料后，按2，重听请按0”的语音提示信息。

5，用户在网络终端点击了“下一步”后，再在语音终端按2，进行下一条语料录制。若想重新录制，则可直接按1。

6，网络终端接收用户点击“下一步”按键触发的获取新语料的指令后，向服务器提交查询当前语料的录制进度信息的请求，所述服务器接收该请求后查询录制进度信息判断当前语料是否录制完成，若否，则弹出页面提示用户“请先录完本条语料”；若是，直接展示下一条语料模板。

判断模块13，用于判断所述目标语料与所述语料模板是否匹配。

生成模块14，用于若判断所述目标语料与所述语料模板匹配，则生成与所述语料模板对应的语料文件。

在另一种实施例中，本发明提供了一种计算机设备，如图3所示，所述计算机设备包括处理器303、存储器305、输入单元307以及显示单元309等器件。本领域技术人员可以理解，图3示出的结构器件并不构成对所有计算机设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件。存储器305可用于存储应用程序301以及各功能模块，处理器303运行存储在存储器305的应用程序301，从而执行设备的各种功能应用以及数据处理。存储器305可以是内存储器或外存储器，或者包括内存储器和外存储器两者。内存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U盘、磁带等。本发明所公开的存储器包括但不限于这些类型的存储器。本发明所公开的存储器305只作为例子而非作为限定。

输入单元307用于接收信号的输入，以及接收客户输入的关键字。输入单元307可包括触控面板以及其它输入设备。触控面板可收集客户在其上或附近的触摸操作(比如客户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作)，并根据预先设定的程序驱动相应的连接装置；其它输入设备可以包括但不限于物理键盘、功能键(比如播放控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元309可用于显示客户输入的信息或提供给客户的信息以及计算机设备的各种菜单。显示单元309可采用液晶显示器、有机发光二极管等形式。处理器303是计算机设备的控制中心，利用各种接口和线路连接整个电脑的各个部分，通过运行或执行存储在存储器303内的软件程序和/或模块，以及调用存储在存储器内的数据，执行各种功能和处理数据。图3中所示的一个或多个处理器303能够执行、实现图2中所示的发送模块11、接收模块12、判断模块13以及生成模块14的功能。

在一种实施方式中，所述计算机设备包括存储器305和处理器303，所述存储器305中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器303执行以上实施例所述的一种语料收集方法的步骤。

本发明实施例提供的一种计算机设备，可实现向网络终端发送语料模板；向语音终端发送读出所述语料模板的语音提示消息；接收所述语音终端发送的目标语料；判断所述目标语料与所述语料模板是否匹配；若是，生成与所述语料模板对应的语料文件。本发明能够快速地、大量地、高仿真地收集手机或者座机渠道进线的语音，逼近客户真实场景下说话的背景(如噪音、各种手机型号设备)，显著提高语音识别模型的准确率。

此外，在又一种实施例中，本发明还提出了一种存储有计算机可读指令的存储介质，该计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：向网络终端发送语料模板；向语音终端发送读出所述语料模板的语音提示消息；接收所述语音终端发送的目标语料；判断所述目标语料与所述语料模板是否匹配；若是，生成与所述语料模板对应的语料文件。一个或多个处理器能实现图2所示实施例中的语料收集装置中的发送模块11、接收模块12、判断模块13以及生成模块14的功能。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种语料收集方法，其特征在于，所述方法包括：

接收所述语音终端发送的目标语料；

判断所述目标语料与所述语料模板是否匹配；

若是，生成与所述语料模板对应的语料文件。

2.根据权利要求1所述的语料收集方法，其特征在于，还包括：

接收用户的语音信息；

提取所述语音信息中的业务信息；

根据所述语料文件处理所述业务信息。

3.根据权利要求2所述的语料收集方法，其特征在于，所述语料文件包含目标业务，所述根据所述语料文件，处理所述业务信息包括：

4.根据权利要求1所述的语料收集方法，其特征在于，所述判断目标语料与语料模板是否匹配之后，还包括：

5.根据权利要求1所述的语料收集方法，其特征在于，所述判断目标语料与语料模板是否匹配，包括：

6.根据权利要求1所述的语料收集方法，其特征在于，所述向网络终端发送语料模板之前，包括：

向已注册的用户号码的语音终端发送呼叫请求。

7.根据权利要求1所述的语料收集方法，其特征在于，还包括：

实时记录制进度信息并创建录制进度信息数据库；

8.一种语料收集装置，其特征在于，所述方法包括：

接收模块，用于接收所述语音终端发送的目标语料；

9.一种计算机设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行如权利要求1至7中任一项权利要求所述语料收集方法的步骤。

10.一种存储有计算机可读指令的存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述语料收集方法的步骤。