CN111143528B

CN111143528B - 多音字词汇的标注方法及装置

Info

Publication number: CN111143528B
Application number: CN201911325565.6A
Authority: CN
Inventors: 范久慧
Original assignee: Unisound Intelligent Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd
Priority date: 2019-12-20
Filing date: 2019-12-20
Publication date: 2023-05-26
Anticipated expiration: 2039-12-20
Also published as: CN111143528A

Abstract

本发明是关于多音字词汇的标注方法及装置。该方法包括：接收对话语音；根据所述对话语音查询目标多音字词汇库；根据所述目标多音字词汇库对所述对话语音进行拼音标注。通过本发明的技术方案，可对对话语音自动地进行拼音标注，从而提高多音字词汇的语音标注准确率和效率，避免人为标注多音字的拼音或声调。

Description

多音字词汇的标注方法及装置

技术领域

本发明涉及语音处理技术领域，尤其涉及多音字词汇的标注方法及装置。

背景技术

目前，在对多音字词汇进行标注时，通常都是在庞大的多音字词汇库中找到多音字然后进行人为标注，即人为标注多音字的拼音或声调，而这种语音标注方式显然准确率低、效率差。

发明内容

本发明实施例提供了多音字词汇的标注方法及装置。所述技术方案如下：

根据本发明实施例的第一方面，提供一种多音字词汇的标注方法，包括：

接收对话语音；

根据所述对话语音查询目标多音字词汇库；

根据所述目标多音字词汇库对所述对话语音进行拼音标注。

在一个实施例中，所述根据所述对话语音查询目标多音字词汇库，包括：

根据所述对话语音查询对话意图；

根据所述对话意图查询所述目标多音字词汇库。

在一个实施例中，所述方法还包括：

基于多个预设对话的意图，创建多个多音字词汇库；

所述根据所述对话语音查询对话意图，包括：

根据自然语言理解技术，识别所述对话语音的所述对话意图；

所述根据所述对话意图查询所述目标多音字词汇库，包括：

从所述多个多音字词汇库中查询出与所述对话意图相匹配的词汇库作为所述目标多音字词汇库。

在一个实施例中，所述根据所述目标多音字词汇库对所述对话语音进行拼音标注，包括：

从所述目标多音字词汇库中查询与所述对话语音对应的多音字词汇；

利用所述多音字词汇，对所述对话语音进行拼音标注。

根据本发明实施例的第二方面，提供一种多音字词汇的标注装置，包括：

接收模块，用于接收对话语音；

查询模块，用于根据所述对话语音查询目标多音字词汇库；

标注模块，用于根据所述目标多音字词汇库对所述对话语音进行拼音标注。

在一个实施例中，所述查询模块包括：

第一查询子模块，用于根据所述对话语音查询对话意图；

第二查询子模块，用于根据所述对话意图查询所述目标多音字词汇库。

在一个实施例中，所述装置还包括：

创建模块，用于基于多个预设对话的意图，创建多个多音字词汇库；

所述第一查询子模块具体用于：

所述第二查询子模块具体用于：

在一个实施例中，所述标注模块包括：

第三查询子模块，用于从所述目标多音字词汇库中查询与所述对话语音对应的多音字词汇；

标注子模块，用于利用所述多音字词汇，对所述对话语音进行拼音标注。

本发明的实施例提供的技术方案可以包括以下有益效果：

在接收到对话语音时，可查询该目标多音字词汇库，然后根据目标多音字词汇库对所述对话语音自动地进行拼音标注，从而提高多音字词汇的语音标注准确率和效率，避免人为标注多音字的拼音或声调。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种多音字词汇的标注方法的流程图。

图2是根据一示例性实施例示出的另一种多音字词汇的标注方法的流程图。

图3是根据一示例性实施例示出的一种多音字词汇的标注装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

为了解决上述技术问题，本发明实施例提供了一种多音字词汇的标注方法，该方法可用于多音字词汇的标注程序、系统或装置中，且该方法对应的执行主体可以是终端或服务器，如图1所示，该方法包括步骤S101至步骤S103：

在步骤S101中，接收对话语音；

在步骤S102中，根据所述对话语音查询目标多音字词汇库；

目标多音字词汇库中预存储有大量的多音字词汇，例如多音字词汇可以是朝阳(zhāo yáng)区、朝阳(cháo yáng)区，剥bāo、剥bō。

在步骤S103中，根据所述目标多音字词汇库对所述对话语音进行拼音标注。

根据所述对话语音查询对话意图；

根据所述对话意图查询所述目标多音字词汇库。

对该对话语音进行语音识别，可查询该对话意图，然后根据该对话意图自动查询相应的目标多音字词汇库，从而利用准确的目标多音字词汇库对对话语音进行自动标注，以提高语音标注效率，并进一步提高语音标注的准确率。

目标多音字词汇库可以是地区多音字词汇库、姓名多音字词汇库、景点多音字词汇库。

在一个实施例中，所述方法还包括：

基于多个预设对话的意图，创建多个多音字词汇库；

所述根据所述对话语音查询对话意图，包括：

根据自然语言理解技术(NLP，Natural Language Processing)，识别所述对话语音的所述对话意图；

所述根据所述对话意图查询所述目标多音字词汇库，包括：

在创建多个多音字词汇库之后，可利用对话意图从该多个多音字词汇库中查询出相匹配的词汇库作为目标多音字词汇库，从而提高词汇库的筛选准确率，进而利用目标多音字词汇库提高对该对话语音的标注准确率和效率。

利用所述多音字词汇，对所述对话语音进行拼音标注。

在确定目标多音字词汇库之后，可查询与该对话语音相关的多音字词汇，然后利用该多音字词汇对该对话语音自动地进行拼音标注，从而避免人为标注多音字词汇，进而有利于提高多音字词汇的语音标注准确率和效率。

下面将结合图2进一步详细说明本发明的技术方案：

把一个大的多音字词汇库，按照语音对话的意图建立多个小的多音字词汇库；

一次人机交互的对话中通过NLU(自然语言理解)技术识别出这次对话的意图，然后查询结果，把意图和结果发送给标音处理服务；

标音处理服务通过该次对话的意图找到相关的多音字词汇库；

在多音字词汇库中找对应的多音字词汇，用标音处理技术给多音字词汇标注拼音以及声调。

比如：根据“天气怎么样”的意图可以建立一个地区名称的多音字词汇库，

“朝阳”在词库中存储的是“朝阳(chá o y á ng)”，在标注的时候就会有目的的在地区名称的多音字词汇库中查找。最终的结果是：问：“今天天气怎么样？”答：“朝阳(ch á oy á ng)今天天气情况是晴”。

最后，需要明确的是：本领域技术人员可根据实际需求，将上述多个实施例进行自由组合。

对应本发明实施例提供的上述多音字词汇的标注方法，本发明实施例还提供一种多音字词汇的标注装置，如图3所示，该装置包括：

接收模块301，用于接收对话语音；

查询模块302，用于根据所述对话语音查询目标多音字词汇库；

标注模块303，用于根据所述目标多音字词汇库对所述对话语音进行拼音标注。

在一个实施例中，所述查询模块包括：

第一查询子模块，用于根据所述对话语音查询对话意图；

在一个实施例中，所述装置还包括：

所述第一查询子模块具体用于：

所述第二查询子模块具体用于：

在一个实施例中，所述标注模块包括：

本领域技术人员在考虑说明书及实践这里发明的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种多音字词汇的标注方法，其特征在于，包括：

接收对话语音；

根据所述对话语音查询目标多音字词汇库；

根据所述目标多音字词汇库对所述对话语音进行拼音标注；

所述根据所述对话语音查询目标多音字词汇库，包括：

根据所述对话语音查询对话意图；

根据所述对话意图查询所述目标多音字词汇库；

所述方法还包括：

基于多个预设对话的意图，创建多个多音字词汇库；

所述根据所述对话语音查询对话意图，包括：

所述根据所述对话意图查询所述目标多音字词汇库，包括：

从所述多个多音字词汇库中查询出与所述对话意图相匹配的词汇库作为所述目标多音字词汇库；

所述方法还包括：目标多音字词汇库中预存储有大量的多音字词汇，目标多音字词汇库是地区多音字词汇库、姓名多音字词汇库或景点多音字词汇库；

一次人机交互的对话中通过自然语言理解技术识别出这次对话的意图，然后查询结果，把意图和结果发送给标音处理服务；

2.根据权利要求1中所述的方法，其特征在于，

所述根据所述目标多音字词汇库对所述对话语音进行拼音标注，包括：

利用所述多音字词汇，对所述对话语音进行拼音标注。

3.一种多音字词汇的标注装置，其特征在于，包括：

接收模块，用于接收对话语音；

查询模块，用于根据所述对话语音查询目标多音字词汇库；

标注模块，用于根据所述目标多音字词汇库对所述对话语音进行拼音标注；

所述查询模块包括：

第一查询子模块，用于根据所述对话语音查询对话意图；

第二查询子模块，用于根据所述对话意图查询所述目标多音字词汇库；

所述装置还包括：

所述第一查询子模块具体用于：

所述第二查询子模块具体用于：

所述装置还包括：目标多音字词汇库中预存储有大量的多音字词汇，目标多音字词汇库是地区多音字词汇库、姓名多音字词汇库或景点多音字词汇库；

4.根据权利要求3中所述的装置，其特征在于，

所述标注模块包括：