CN110334183A

CN110334183A - 使用任意文本词库的方法及装置

Info

Publication number: CN110334183A
Application number: CN201910589639.0A
Authority: CN
Inventors: 徐飞; 张瑜
Original assignee: AI Speech Ltd
Current assignee: AI Speech Ltd
Priority date: 2019-07-02
Filing date: 2019-07-02
Publication date: 2019-10-15
Anticipated expiration: 2039-07-02
Also published as: CN110334183B

Abstract

本发明公开使用任意文本词库的方法和装置，其中，一种使用任意文本词库的方法，包括：将待匹配说法与包含任意文本的用户说法进行匹配，其中，所述包含任意文本的用户说法为开发者针对预设场景定义的包括非语义槽和绑定任意文本词库的语义槽构成的用户说法；若所述待匹配说法与所述用户说法匹配，对所述任意文本进行首尾过滤以提取出有效文本；判断所述有效文本是否满足预设条件；对满足预设条件的所述有效文本进行与所述预设场景对应的处理。本申请的方法和装置提供的方案可以保证在一定限制下能够接受任意内容，同时保证翻译、提醒等场景下使用和语义解析正确。

Description

使用任意文本词库的方法及装置

技术领域

本发明属于词库技术领域，尤其涉及使用任意文本词库的方法及装置。

背景技术

在词库中，任意文本，即能接受任意内容的词库。其中，词库是相同类型词条的集合，在语义解析中被广泛使用，但能够接受任意内容的词库并不常见。

通常会将类似“北京、上海、苏州、深圳”这些城市的集合在一起，生成一个“城市”的词库，通过长期积累将相关内容整合到一起，形成一个词库使用。

发明人在实现本申请的过程中发现，现有技术中的上述方案主要存在以下缺陷：

(1)词条的内容比较固定；

(2)词库需更新频繁；

(3)不支持模糊内容匹配；

(4)在特定场景下不适用，如翻译、提醒等。

发明人还发现，上述缺陷主要是由以下原因导致的：

(1)为了保证语义的准确，词条通常是固定的文本；

(2)提供能够接受任意内容的词库，既需要满足特殊场景下的需求，又需要保证语义解析正确，需要丰富的语义经验和严格的使用限制，大部分研发人员并不具备。

发明内容

本发明实施例提供一种使用任意文本词库的方法及装置，用于至少解决上述技术问题之一。

第一方面，本发明实施例提供一种使用任意文本词库的方法，包括：将待匹配说法与包含任意文本的用户说法进行匹配，其中，所述包含任意文本的用户说法为开发者针对预设场景定义的包括非语义槽和绑定任意文本词库的语义槽构成的用户说法；若所述待匹配说法与所述用户说法匹配，对所述任意文本进行首尾过滤以提取出有效文本；判断所述有效文本是否满足预设条件；对满足预设条件的所述有效文本进行与所述预设场景对应的处理。

第二方面，本发明实施例提供一种使用任意文本词库的装置，包括：匹配模块，配置为将待匹配说法与包含任意文本的用户说法进行匹配，其中，所述包含任意文本的用户说法为开发者针对预设场景定义的包括非语义槽和绑定任意文本词库的语义槽构成的用户说法；提取模块，配置为若所述待匹配说法与所述用户说法匹配，对所述任意文本进行首尾过滤以提取出有效文本；判断模块，配置为判断所述有效文本是否满足预设条件；处理模块，配置为对满足预设条件的所述有效文本进行与所述预设场景对应的处理。

第三方面，提供一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明任一实施例的使用任意文本词库的方法的步骤。

第四方面，本发明实施例还提供一种计算机程序产品，所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行本发明任一实施例的使用任意文本词库的方法的步骤。

本申请的方法和装置提供的方案通过允许开发者在用户说法中加入任意文本，进而当用户使用具有任意文本的技能时，将会有一些与任意文本相关的处理，从而丰富词库，使得在某些场景(取值千变万化，无法使用具体的词库一一枚举)下，也能通过词库的方式允许开发者和用户使用相应的功能，该词库能够接受任意的内容，从而方便开发者和用户的使用。在使用的过程中进行一些对任意文本的相应的判断和处理，从而更好地过滤掉一些无效的说法，提升使用体验。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一实施例提供的一种使用任意文本词库的方法的流程图；

图2为本发明一实施例提供的一种任意文本词库的具体实现的框图；

图3为本发明一实施例提供的一种任意文本词库的一种具体实现的一个前端限制的界面图；

图4为本发明一实施例提供的一种任意文本词库的一种具体实现的；另一个前端限制的界面图；

图5为本发明一实施例提供的一种使用任意文本词库的装置的框图；

图6是本发明一实施例提供的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参考图1，其示出了本申请的使用任意文本词库的方法一实施例的流程图，本实施例的使用任意文本词库的方法可以适用于具备智能语音对话功能的终端、如智能语音电视、智能音箱、智能对话玩具以及其他现有的支持语音对话的智能终端等。

如图1所示，在步骤101中，将待匹配说法与包含任意文本的用户说法进行匹配；

在步骤102中，若待匹配说法与用户说法匹配，对任意文本进行首尾过滤以提取出有效文本；

在步骤103中，判断有效文本是否满足预设条件；

在步骤104中，对满足预设条件的有效文本进行与预设场景对应的处理。

在本实施例中，对于步骤101，使用任意文本词库的装置将待匹配说法与包含任意文本的用户说法进行匹配，其中，包含任意文本的用户说法为开发者针对预设场景定义的包括非语义槽和绑定任意文本词库的语义槽构成的用户说法。例如，当用户进入某一个技能后，采集用户的语音，然后进行语音识别，将识别出的待匹配文本与开发者针对该技能定义的用户说法进行匹配，该用户说法中包含任意文本词库，即开发者在定义该用户说法时引入了一个绑定任意文本词库的语义槽，从而该语义槽中的无论什么内容都会被绑定到任意文本词库中，因此在将待匹配说法与该用户说法匹配时，只需要匹配非语义槽部分的说法是否相同即可，剩余的内容将会被自动认为是任意文本词库语义槽。

之后，对于步骤102，若使用任意文本词库的装置判断出待匹配说法与用户说法匹配，则可以确定哪一部分是对应的任意文本词库，对相应的任意文本进行首尾过滤处理从而提取出其中的有效文本。例如可以过滤掉停用词语气词等，当然也可以过滤掉其他没有实际意义且对文本没有影响的词，本申请在此没有限制。例如，某些用户说话时，可能会习惯性地增加一些没有实际意义的词，如额，嗯等不影响文本内容的词，就可以过滤掉以免影响后面的处理。

之后，对于步骤103，使用任意文本词库的装置还需要判断有效文本是否满足预设条件，例如可能用户说了相应的对应非语义槽的内容之后，后面并没有说别的，或者只说了一些无关紧要的停用词或语气词时，该说法其实是无效的，需要提醒用户，则此时会判断该有效文本其实不满足预设条件，如长度和时长等，本申请在此没有限制。

最后，对于步骤104，使用任意文本词库的装置对于满足预设条件的有效文本还需要进行后续与预设场景对应的处理，如技能相关的处理，例如用户所在的当前的技能或者说场景是翻译的时候，就需要对该有效文本进行翻译，本申请在此没有限制。

本申请实施例提供的方案通过允许开发者在用户说法中加入任意文本，进而当用户使用具有任意文本的技能时，将会有一些与任意文本相关的处理，从而丰富词库，使得在某些场景(取值千变万化，无法使用具体的词库一一枚举)下，也能通过词库的方式允许开发者和用户使用相应的功能，该词库能够接受任意的内容，从而方便开发者和用户的使用。在使用的过程中进行一些对任意文本的相应的判断和处理，从而更好地过滤掉一些无效的说法，提升使用体验。

在一些可选的实施例中，在将待匹配说法与包含任意文本的用户说法进行匹配之后，方法还包括：若待匹配说法与用户说法不匹配，则提醒不理解用户说法。从而在用户的待匹配说法与该技能内开发者定义的用户说法不匹配时，能够及时地提醒用户换一种说法，从而更好地使用相应的技能，提升用户体验。

在一些可选的实施例中，在判断有效文本是否满足预设条件之后，方法还包括：若有效文本不满足预设条件，则提醒用户说法有误。从而在用户的说法匹配但任意文本不满足预设条件时，及时的告知用户，以使用户能够更好地使用相关技能，提升用户体验。

在一些可选的实施例中，判断有效文本是否满足预设条件包括：判断有效文本的字符长度是否大于预设长度。从而对于长度不满足的判定为无效文本，不进行后续的技能操作，减少系统不必要的操作，

在一些可选的实施例中，在开发者针对预设场景定义包含任意文本的用户说法时，当开发者定义的非语义槽的字符数量小于预设数量时，提醒开发者非语义槽的字符数量不能小于预设数量；当开发者定义在同一用户说法中包含两个及以上的语义槽绑定任意文本词库时，提醒开发者同一用户说法中只能有一个绑定任意文本词库的语义槽。从而在开发者定义包含任意文本词库的用户说法时，进行一些必要的限制，使得任意文本能够更好地被使用，从源头杜绝一些无效的说法，极大地减少后续的无用操作。

在进一步可选的实施例中，预设场景包括提醒场景和翻译场景，与提醒场景对应的任意文本词库包括事件，与翻译场景对应的任意文本词库包括翻译内容。从而对于提醒场景和翻译场景这些事件和翻译内容不固定的现象，提出一种任意文本词库供其接纳相应的提醒事件和翻译内容，从而这两项技能及相关的产品也能正常使用词库功能，不会受到词库内容不固定的影响。

进一步可选的，预设场景为提醒场景时，对有效文本进行与预设场景对应的技能处理包括：提醒用户与有效文本对应的事件；预设场景为翻译场景时，对有效文本进行与预设场景对应的技能处理包括：对有效文本进行相应的翻译。从而对于事件和翻译内容对应的任意文本词库也能够进行相应的处理。

下面对通过描述发明人在实现本发明的过程中遇到的一些问题和对最终确定的方案的一个具体实施例进行说明，以使本领域技术人员更好地理解本申请的方案。

发明人对现有技术进行仔细研究后发现，本领域技术人员为了解决上述缺陷，可能会采用以下方案：

通常会通过代码逻辑实现，而非开放一个能够接受任意内容的词库，这样的方式能够满足部分需求同时能够保证语义解析正确。

本领域技术人员之所以不容易想到本申请的方案，主要是由于以下原因：需要实现更灵活的语音定制，满足各种特殊场景，在实现方案和设计上需要深入思考开发者的各种场景以及丰富的语义经验。

发明人发现，现有技术中有些语义槽的取值千变万化，无法使用具体的词库一一枚举，这时开发者就可以使用词库【sys.任意文本】，该词库可以接收任意字符。

例如，开发一个实现翻译功能的技能，需要翻译的文本内容无法用一个普通的枚举词库来实现，这时可以使用绑定内置词库【sys.任意文本】。直接添加带语义槽的用户说法「翻译#翻译文本#」或添加说法「翻译我要吃苹果」，将「我要吃苹果」标注为语义槽#翻译文本#，绑定内置词库【sys.任意文本】。

需要注意的是，使用【sys.任意文本】的时候必须十分慎重，因为这个词库可以接收任意字符，这就意味着用户说什么都会进入这个词库。所以DUI平台对【sys.任意文本】的使用做了如下限制：

1、不能把整句说法都绑定【sys.任意文本】词库，否则就意味着用户说的任何话都会解析为这个意图。

2、需要使用【sys.任意文本】词库的用户说法，必须有两个或者以上的字符是非语义槽的。如语义槽#提醒内容#绑定词库【sys.任意文本】，那么用户说法「提醒我#提醒内容#」中有三个字「提醒我」不是语义槽。如说法「说#提醒内容#」只有一个字「说」没有标注为语义槽，因此是行不通的。

3、同一个说法，只能使用一次【sys.任意文本】。

本申请的方案提出了一种使用任意文本词库的装置，发明的一个具体实施例的实现本申请的过程如下：

(1)提供任意文本词库，保证在翻译、提醒等特殊场景下使用。

(2)通过变量定义及前端共同限制，保证语义解析正确。

请参考图2，其示出了本申请的方案的一个具体实施例的流程图，需要说明的是以下实施例中虽然提到了一些具体的例子，但并不用于限制本申请的方案。

用户需求分析：

I.提醒、翻译场景下，有两个语义槽：事件和翻译内容，这两个语义槽的具体取值是千变万化，不能枚举的，甚至都无法归纳总结。需要一个能接收任意字符的任意文本词库，可以接收任意字符；同时在类似场景下也会有相关需求。

II.为保证语义解析正确，需要对任意文本词库进行限制。包含变量定义及前端限制。

变量定义：

I.限制字数：不是任意长度都进行接受，限定为2～30个字符的长度。

II.语气词，停用词的首尾过滤：变量中，对词条首尾的单字语气词、停用词进行过滤，去除掉单字语气词及停用词。

III.匹配规则：使用任意文本的说法，进行全句匹配，不进行部分匹配(2)前端限制：

I.不可以单独使用任意文本词库，必须要有非标注的两个及以上连续字符，具体可参考图3。

II.同一说法中，只能使用一次任意文本词库，具体可参考图4。

通过以上设计，保证在一定限制下能够接受任意内容，同时保证翻译、提醒等场景下使用和语义解析正确。

请参考图5，其示出了本发明一实施例提供的使用任意文本词库的装置的框图。

如图5所示，使用任意文本词库的装置500，包括匹配模块510、提取模块520、判断模块530和处理模块540。

其中，匹配模块510，配置为将待匹配说法与包含任意文本的用户说法进行匹配，其中，包含任意文本的用户说法为开发者针对预设场景定义的包括非语义槽和绑定任意文本词库的语义槽构成的用户说法；提取模块520，配置为若待匹配说法与用户说法匹配，对任意文本进行首尾过滤以提取出有效文本；判断模块530，配置为判断有效文本是否满足预设条件；以及处理模块540，配置为对满足预设条件的有效文本进行与预设场景对应的处理。

应当理解，图5中记载的诸模块与参考图1中描述的方法中的各个步骤相对应。由此，上文针对方法描述的操作和特征以及相应的技术效果同样适用于图5中的诸模块，在此不再赘述。

值得注意的是，本申请的实施例中的模块并不用于限制本申请的方案，例如模板生成模块可以描述为对每个字对应的语音段分别提取高斯后验特征，并基于每个语音段的高斯后验特征生成整个注册语音的特征模板的模块。另外，还可以通过硬件处理器来实现相关功能模块，例如苏模板生成模块也可以用处理器实现，在此不再赘述。

在另一些实施例中，本发明实施例还提供了一种非易失性计算机存储介质，计算机存储介质存储有计算机可执行指令，该计算机可执行指令可执行上述任意方法实施例中的使用任意文本词库的方法；

作为一种实施方式，本发明的非易失性计算机存储介质存储有计算机可执行指令，计算机可执行指令设置为：

将待匹配说法与包含任意文本的用户说法进行匹配，其中，所述包含任意文本的用户说法为开发者针对预设场景定义的包括非语义槽和绑定任意文本词库的语义槽构成的用户说法；

若所述待匹配说法与所述用户说法匹配，对所述任意文本进行首尾过滤以提取出有效文本；

判断所述有效文本是否满足预设条件；

对满足预设条件的所述有效文本进行与所述预设场景对应的处理。

非易失性计算机可读存储介质可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据使用任意文本词库的装置的使用所创建的数据等。此外，非易失性计算机可读存储介质可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中，非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至使用任意文本词库的装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

本发明实施例还提供一种计算机程序产品，计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序，计算机程序包括程序指令，当程序指令被计算机执行时，使计算机执行上述任一项使用任意文本词库的方法。

图6是本发明实施例提供的电子设备的结构示意图，如图6所示，该设备包括：一个或多个处理器610以及存储器620，图6中以一个处理器610为例。使用任意文本词库的方法的设备还可以包括：输入装置630和输出装置640。处理器610、存储器620、输入装置630和输出装置640可以通过总线或者其他方式连接，图6中以通过总线连接为例。存储器620为上述的非易失性计算机可读存储介质。处理器610通过运行存储在存储器620中的非易失性软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例使用任意文本词库的方法。输入装置630可接收输入的数字或字符信息，以及产生与使用任意文本词库的装置的用户设置以及功能控制有关的键信号输入。输出装置640可包括显示屏等显示设备。

上述产品可执行本发明实施例所提供的方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明实施例所提供的方法。

作为一种实施方式，上述电子设备应用于使用任意文本词库的装置中，包括：至少一个处理器；以及，与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够：

判断所述有效文本是否满足预设条件；

本申请实施例的电子设备以多种形式存在，包括但不限于：

(1)移动通信设备：这类设备的特点是具备移动通信功能，并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机，以及低端手机等。

(2)超移动个人计算机设备：这类设备属于个人计算机的范畴，有计算和处理功能，一般也具备移动上网特性。这类终端包括：PDA、MID和UMPC设备等，例如iPad。

(3)便携式娱乐设备：这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod)，掌上游戏机，电子书，以及智能玩具和便携式车载导航设备。

(4)服务器:提供计算服务的设备，服务器的构成包括处理器、硬盘、内存、系统总线等，服务器和通用的计算机架构类似，但是由于需要提供高可靠的服务，因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。

(5)其他具有数据交互功能的电子装置。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种使用任意文本词库的方法，包括：

判断所述有效文本是否满足预设条件；

2.根据权利要求1所述的方法，其中，在所述将待匹配说法与包含任意文本的用户说法进行匹配之后，所述方法还包括：

若所述待匹配说法与所述用户说法不匹配，则提醒不理解用户说法。

3.根据权利要求1所述的方法，其中，在所述判断所述有效文本是否满足预设条件之后，所述方法还包括：

若所述有效文本不满足预设条件，则提醒用户说法有误。

4.根据权利要求1所述的方法，其中，所述判断所述有效文本是否满足预设条件包括：

判断所述有效文本的字符长度是否大于预设长度。

5.根据权利要求1所述的方法，其中，在开发者针对预设场景定义包含任意文本的用户说法时，

当开发者定义的所述非语义槽的字符数量小于预设数量时，提醒开发者所述非语义槽的字符数量不能小于预设数量；

当开发者定义在同一用户说法中包含两个及以上的语义槽绑定任意文本词库时，提醒开发者同一用户说法中只能有一个绑定任意文本词库的语义槽。

6.根据权利要求1-5中任一项所述的方法，其中，所述预设场景包括提醒场景和翻译场景，与所述提醒场景对应的任意文本词库包括事件，与所述翻译场景对应的任意文本词库包括翻译内容。

7.根据权利要求6所述的方法，其中，所述预设场景为提醒场景时，所述对所述有效文本进行与所述预设场景对应的技能处理包括：

提醒用户与所述有效文本对应的事件；

所述预设场景为翻译场景时，所述对所述有效文本进行与所述预设场景对应的技能处理包括：

对所述有效文本进行相应的翻译。

8.一种使用任意文本词库的装置，包括：

匹配模块，配置为将待匹配说法与包含任意文本的用户说法进行匹配，其中，所述包含任意文本的用户说法为开发者针对预设场景定义的包括非语义槽和绑定任意文本词库的语义槽构成的用户说法；

提取模块，配置为若所述待匹配说法与所述用户说法匹配，对所述任意文本进行首尾过滤以提取出有效文本；

判断模块，配置为判断所述有效文本是否满足预设条件；

处理模块，配置为对满足预设条件的所述有效文本进行与所述预设场景对应的处理。

9.一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至7任一项所述方法的步骤。

10.一种存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。