CN105138575A

CN105138575A - 语音文本串的解析方法和装置

Info

Publication number: CN105138575A
Application number: CN201510456896.9A
Authority: CN
Inventors: 时培轩
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd; Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2015-07-29
Filing date: 2015-07-29
Publication date: 2015-12-09
Anticipated expiration: 2035-07-29
Also published as: CN105138575B

Abstract

本发明实施例提供一种语音文本串的解析方法和装置。所述方法包括：获取待解析的语音文本串；将所述语音文本串与预设的多个正则表达匹配模板进行匹配，获取匹配的正则表达匹配模板的信息，其中，所述正则表达匹配模板以结构化形式表达，在第一结构化标签中描述正则表达式的规则字符串序列，在至少一个第二结构化标签中表示所述规则字符串序列中相应的匹配字符串；输出所述匹配的正则表达匹配模板的信息。通过构建结构化形式的正则表达匹配模板的方式，使得正则表达式的表达和管理规范、简单。

Description

语音文本串的解析方法和装置

技术领域

本发明涉及语义分析技术，尤其涉及一种语音文本串的解析方法和装置。

背景技术

目前，基于语音识别的应用由于其使用便利性，已得到广泛的应用。用户在输入语音时通常以口语化的方式表达其意图，因此在将用户的语音转换为语音文本串后进行解析时，需要使用适于口语表达的解析方式。

规则匹配是口语化语义解析比较常用的方法，使用预先编制好的规则串与(语音转换后的)语音文本串进行字符串匹配。

现有的用于口语解析的正则表达式通常是以非常抽象的方式呈现出来的。例如，假设要解析发短信的命令，则需要这样编写规则：“(给)(.+)(发|回)(信息|短信)”或/和“(发|回)(信息|短信)(给)(.+)”，并将所述规则存入数据库。当用户语音录入“给刘德华发短信”时，在将所述语音转换为相应的文本串后，可匹配上前者的规则，进而给出解析结果。

目前的正则表达式的编写和维护存在以下缺点：

首先，正则表达式的编写规则抽象难懂，而且容易发生编写错误。

其次，现有的方案需要将关键词直接写入正则表达式中，例如“(信息|短信)”，而且很多正则表达式都包含同样的关键词。那么，当修改、添加、删除关键词的时候，就需要操作很多个正则表达式，非常繁琐。

再次，对于要提取的参数，现有的基于正则表达式的方法都是通过参数的顺序来表示，例如，在“(给)(.+)(发|回)(信息|短信)”中，用第二个参数来表示要提取的参数。这导致了每次编写正则表达式都要去数参数的顺序，容易出错。

最后，随着需要进行语义解析的领域的增加，要编写的正则表达式也越来越多，有效地管理和维护编写的正则表达式成为一个契待解决的问题。

发明内容

本发明的目的在于，提供一种语音文本串的解析方法和装置，通过结构化形式来表达和管理正则表达式，以有效地管理和维护编写的正则表达式。

根据本发明的一方面，提供一种语音文本串的解析方法，其特征在于，所述方法包括：获取待解析的语音文本串；将所述语音文本串与预设的多个正则表达匹配模板进行匹配，获取匹配的正则表达匹配模板的信息，其中，所述正则表达匹配模板以结构化形式表达，在第一结构化标签中描述正则表达式的规则字符串序列，在至少一个第二结构化标签中表示所述规则字符串序列中相应的匹配字符串；输出所述匹配的正则表达匹配模板的信息。

优选地，在所述第二结构化标签中还包括所述匹配字符串的替换字符串的信息。其中，在所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理中，对于任一匹配字符串，将所述语音文本串中相应的字符串与所述匹配字符串以及其替换字符串进行匹配。

优选地，在所述第一结构化标签中，所述正则表达式的规则字符串序列中待提取的参数以变量表达，并且在第三结构化标签中描述与待提取的参数相应的变量的信息。

优选地，所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理还包括：根据所述第一结构化标签中的变量从所述语音文本串提取符合相应的第三结构化标签中的描述的参数数据；所述输出所述匹配的正则表达匹配模板的信息的处理还包括：输出提取的参数数据。

优选地，在第四结构化标签中描述所述正则表达匹配模板表示的用户意图的数据。相应地，所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理还包括：提取与所述匹配的正则表达匹配模板相应的第四结构化标签的数据；所述输出所述匹配的正则表达匹配模板的信息的处理还包括：输出所述正则表达匹配模板表示的用户意图的数据。

所述结构化形式可以是XML语言格式，所述正则表达匹配模板可以是DOM树。

根据本发明的另一方面，还提供一种语音文本串的解析装置。所述装置包括：语音文本串获取单元，用于获取待解析的语音文本串；正则表达匹配单元，用于将所述语音文本串与预设的多个正则表达匹配模板进行匹配，获取匹配的正则表达匹配模板的信息，其中，所述正则表达匹配模板以结构化形式表达，在第一结构化标签中描述正则表达式的规则字符串序列，在至少一个第二结构化标签中表示所述规则字符串序列中相应的匹配字符串；正则表达输出单元，用于输出所述匹配的正则表达匹配模板的信息。

优选地，在所述第二结构化标签中还包括所述匹配字符串的替换字符串的信息。其中，正则表达匹配单元用于对于任一匹配字符串，将所述语音文本串中相应的字符串与所述匹配字符串以及其替换字符串进行匹配。

优选地，所述正则表达匹配单元还用于根据所述第一结构化标签中的变量从所述语音文本串提取符合相应的第三结构化标签中的描述的参数数据；所述正则表达输出单元还用于输出提取的参数数据。

优选地，在第四结构化标签中描述所述正则表达匹配模板表示的用户意图的数据；相应地，所述正则表达匹配单元还用于提取与所述匹配的正则表达匹配模板相应的第四结构化标签的数据；所述正则表达输出单元还用于输出所述正则表达匹配模板表示的用户意图的数据。

根据本发明示例性实施例的语音文本串的解析方法和实现所述方法的装置通过构建结构化形式的正则表达匹配模板的方式，使得正则表达式的表达和管理规范、简单。通过结构化形式编写的规则也更为直观，容易理解。此外，基本的结构化标签可被重复利用，更提高了管理效率。

此外，通过例如XML可扩展标记语言构建和管理正则表达式，与其他编程语言或软件工具之间的兼容性强，使得如此编写的正则表达式可用性强。

附图说明

图1是示出根据本发明的基本构思编写的正则表达匹配模板的示例；

图2是示出根据本发明的示例性实施例一的语音文本串的解析方法的流程图；

图3是示出根据本发明的示例性实施例二的语音文本串的解析装置的逻辑框图。

具体实施方式

本发明的基本发明构思是，以结构化形式的正则表达匹配模板来描述正则表达式，使用结构化标签(第一结构化标签)描述正则表达式的，并且通过至少一个另一种结构化标签(第二结构化标签)来分别表示所述规则字符串序列中的各匹配字符串。这样，在结构化标签中描述的规则字符串序列直观、易懂，隐藏了所述规则字符串序列中的匹配字符串的复杂度，同时通过第二结构化标签表示的所述匹配字符串还可在多个正则表达匹配模板重复被使用，提高了正则表达式的可复用性和可维护性。

此外，使用变量来表达所述正则表达式的规则字符串序列中待提取的参数，并且还通过再另一种结构化标签(第三结构化标签)描述与待提取的参数相应的变量的信息。由此，通过正则表达匹配模板还可提取出输入的语音文本串中的参数数据，如变量名称(即参数名称)及其参数值，用户无需记住正则表达式中提取参数的位置，降低出错率。

在本文中以目前广泛使用的结构化描述形式的XML语言表达的正则表达匹配模板作为示例对本发明的示例性实施例进行描述。需要理解，本发明提出的正则表达匹配模板可使用任何可扩展的结构化表达形式来进行表达/描述，而不限于使用XML语言的方式。

图1是示出根据本发明的基本构思编写的正则表达匹配模板的示例，其示出用于表达发送信息的正则表达匹配模板。

参照图1，标签<template>定义的是所述正则表达匹配模板，其中的标签<pattern>(第一结构化标签)用于描述规则字符串序列“【发送】【短信】【给】【person】”，“【发送】”、“【短信】”、“【给】”等皆为所述正则表达匹配模板的匹配字符串。

标签<slot>(第二结构化标签)用于表示该正则表达匹配模板或其他正则表达匹配模板中的匹配字符串的信息。此外，第二结构化标签(如<slotname＝"发送"synx＝"发送|发|回"/>)还包括匹配字符串“【发送】”的替换字符串"发送|发|回"等，所述替换字符串可以是匹配字符串的同义词“发送”或与其相应的词“回”。这样，该正则表达匹配模板可用于匹配多个具有相似表达模式的语音文本串。

由于所述第二结构化标签独立于任何一个正则表达匹配模板而存在，因此，所述第二结构化标签可以在多个正则表达匹配模板当中重复被使用。

在此基础上，对于包含参数的正则表达，所述规则字符串序列还包括与待提取的参数相应的变量的信息(例如【person】)。相应地，标签<slotname＝"person"group＝"name"…/>(第三结构化标签)用于描述与待提取的参数相应的变量"person"的信息。

基于前述结构化表达的正则表达匹配模板，当输入的语音文本串为“发短信给玛丽”时，可匹配出标识为"SEND_MESSAGE_PERSON"的正则表达匹配模板，并且从所述语音文本串提取到变量为"person":“玛丽”的参数数据。

此外，在图1示出的正则表达匹配模板中还包括用于描述所述正则表达匹配模板表示的用户意图的数据的第四结构化标签<semantics>，即"send_message"。由此，针对例如口语化的用户输入，还可相应地获取关于用户意图的信息。

前述用于定义所述正则表达匹配模板的<template>以及其中的标签构成了一个DOM树，也就是说，所述正则表达匹配模板的结构化表示是DOM树结构。

由此可见，根据本发明的方面构思构建的结构化形式的正则表达方式(正则表达匹配模板)规范、相对简单；编写的规则也更为直观，容易理解；基本的结构化标签可被重复利用，提高了管理效率。

以下将参照图2和图3详细说明本发明的示例性实施例。

实施例一

图2是示出根据本发明的示例性实施例一的语音文本串的解析方法的流程图。

参照图2，在步骤S210，获取待解析的语音文本串。

所述语音文本串是从用户录入的语音识别出的文本数据。

在步骤S220，将所述语音文本串与预设的多个正则表达匹配模板进行匹配，获取匹配的正则表达匹配模板的信息。其中，如前所述，所述正则表达匹配模板以结构化形式表达，在第一结构化标签中描述正则表达式的规则字符串序列，在至少一个第二结构化标签中表示所述规则字符串序列中相应的匹配字符串。

在步骤S230，输出所述匹配的正则表达匹配模板的信息。

可选地，在所述第二结构化标签中还包括所述匹配字符串的替换字符串的信息。相应地，在步骤S220中所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理中，对于任一匹配字符串，将所述语音文本串中相应的字符串与所述匹配字符串以及其替换字符串进行匹配。例如，对于待解析的语音文本串“发短信给玛丽”，在与第一结构化标签<pattern>中的规则字符串序列进行匹配时，对于匹配字符串“发送”，将其与相应的第二结构化标签“<slotname＝"发送"synx＝"发送|发|回"/>”中的替换字符串“发送”、“发”、“回”分别进行匹配，匹配到“发”，则确定该匹配字符串找到匹配。

进一步地，在所述第一结构化标签中，可以变量表达所述正则表达式的规则字符串序列中待提取的参数，并且在第三结构化标签中描述与待提取的参数相应的变量的信息。

在前述的例子中，所述第一结构化标签“<pattern>【发送】【短信】【给】【person】</pattern>”中的“person”是用于提取参数的变量；第三结构化标签“<slotname＝"person"group＝"name"synx＝"？<name>张三|李四"/>”用于描述提取参数“name”的变量“person”的信息。

相应地，在步骤S220中，所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理还包括：根据所述第一结构化标签中的变量从所述语音文本串提取符合相应的第三结构化标签中的描述的参数数据。在步骤S230，还输出在步骤S220提取的参数数据。

返回前面的例子，对于待解析的语音文本串“发短信给玛丽”，通过图1中示出的正则表达匹配模板<template>中的规则字符串序列“【发送】【短信】【给】【person】”，可提取出参数“name”的值为“玛丽”。

此外，优选地，在所述正则表达匹配模板中，还在第四结构化标签中描述所述正则表达匹配模板表示的用户意图的数据。

相应地，步骤S220还包括：提取与所述匹配的正则表达匹配模板相应的第四结构化标签的数据；步骤S230还包括：输出所述正则表达匹配模板表示的用户意图的数据。

实施例二

图3是示出根据本发明的示例性实施例二的语音文本串的解析装置的逻辑框图。所述语音文本串的解析装置可用于执行实施例一的方法。

参照图3，所述语音文本串的解析装置包括语音文本串获取单元310、正则表达匹配单元320和正则表达输出单元330。

语音文本串获取单元310用于获取待解析的语音文本串。

正则表达匹配单元320用于将所述语音文本串与预设的多个正则表达匹配模板进行匹配，获取匹配的正则表达匹配模板的信息。其中，所述正则表达匹配模板以结构化形式表达，在第一结构化标签中描述正则表达式的规则字符串序列，在至少一个第二结构化标签中表示所述规则字符串序列中相应的匹配字符串。

正则表达输出单元330用于输出所述匹配的正则表达匹配模板的信息。

优选地，在所述第二结构化标签中还包括所述匹配字符串的替换字符串的信息。相应地，正则表达匹配单元320用于对于任一匹配字符串，将所述语音文本串中相应的字符串与所述匹配字符串以及其替换字符串进行匹配。

相应地，正则表达匹配单元320还用于根据所述第一结构化标签中的变量从所述语音文本串提取符合相应的第三结构化标签中的描述的参数数据。正则表达输出单元330还用于输出提取的参数数据。

优选地，在第四结构化标签中描述所述正则表达匹配模板表示的用户意图的数据。相应地，正则表达匹配单元320还用于提取与所述匹配的正则表达匹配模板相应的第四结构化标签的数据；正则表达输出单元330还用于输出所述正则表达匹配模板表示的用户意图的数据。

所述结构化形式是例如XML语言格式，所述正则表达匹配模板是DOM树。

综上所述，根据本发明示例性实施例的语音文本串的解析方法和实现所述方法的装置通过构建结构化形式的正则表达匹配模板的方式，使得正则表达式的表达和管理规范、简单。通过结构化形式编写的规则也更为直观，容易理解。此外，基本的结构化标签可被重复利用，更提高了管理效率。

需要指出，根据实施的需要，可将本申请中描述的各个步骤/部件拆分为更多步骤/部件，也可将两个或多个步骤/部件或者步骤/部件的部分操作组合成新的步骤/部件，以实现本发明的目的。

上述根据本发明的方法可在硬件、固件中实现，或者被实现为可存储在记录介质(诸如CDROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码，或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码，从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解，计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如，RAM、ROM、闪存等)，当所述软件或计算机代码被计算机、处理器或硬件访问且执行时，实现在此描述的处理方法。此外，当通用计算机访问用于实现在此示出的处理的代码时，代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种语音文本串的解析方法，其特征在于，所述方法包括：

获取待解析的语音文本串；

将所述语音文本串与预设的多个正则表达匹配模板进行匹配，获取匹配的正则表达匹配模板的信息，其中，所述正则表达匹配模板以结构化形式表达，在第一结构化标签中描述正则表达式的规则字符串序列，在至少一个第二结构化标签中表示所述规则字符串序列中相应的匹配字符串；

输出所述匹配的正则表达匹配模板的信息。

2.根据权利要求1所述的方法，其特征在于，在所述第二结构化标签中还包括所述匹配字符串的替换字符串的信息，

其中，在所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理中，对于任一匹配字符串，将所述语音文本串中相应的字符串与所述匹配字符串以及其替换字符串进行匹配。

3.根据权利要求2所述的方法，其特征在于，在所述第一结构化标签中，所述正则表达式的规则字符串序列中待提取的参数以变量表达，并且在第三结构化标签中描述与待提取的参数相应的变量的信息。

4.根据权利要求3所述的方法，其特征在于，所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理还包括：根据所述第一结构化标签中的变量从所述语音文本串提取符合相应的第三结构化标签中的描述的参数数据，

所述输出所述匹配的正则表达匹配模板的信息的处理还包括：输出提取的参数数据。

5.根据权利要求1～4中任一项所述的方法，其特征在于，在第四结构化标签中描述所述正则表达匹配模板表示的用户意图的数据，

所述将所述语音文本串与预设的多个正则表达匹配模板进行匹配的处理还包括：提取与所述匹配的正则表达匹配模板相应的第四结构化标签的数据，

所述输出所述匹配的正则表达匹配模板的信息的处理还包括：输出所述正则表达匹配模板表示的用户意图的数据。

6.根据权利要求5所述的方法，其特征在于，所述结构化形式是XML语言格式，所述正则表达匹配模板是DOM树。

7.一种语音文本串的解析装置，其特征在于，所述装置包括：

语音文本串获取单元，用于获取待解析的语音文本串；

正则表达匹配单元，用于将所述语音文本串与预设的多个正则表达匹配模板进行匹配，获取匹配的正则表达匹配模板的信息，其中，所述正则表达匹配模板以结构化形式表达，在第一结构化标签中描述正则表达式的规则字符串序列，在至少一个第二结构化标签中表示所述规则字符串序列中相应的匹配字符串；

正则表达输出单元，用于输出所述匹配的正则表达匹配模板的信息。

8.根据权利要求7所述的装置，其特征在于，在所述第二结构化标签中还包括所述匹配字符串的替换字符串的信息，

其中，正则表达匹配单元用于对于任一匹配字符串，将所述语音文本串中相应的字符串与所述匹配字符串以及其替换字符串进行匹配。

9.根据权利要求8所述的装置，其特征在于，在所述第一结构化标签中，所述正则表达式的规则字符串序列中待提取的参数以变量表达，并且在第三结构化标签中描述与待提取的参数相应的变量的信息。

10.根据权利要求9所述的装置，其特征在于，所述正则表达匹配单元还用于根据所述第一结构化标签中的变量从所述语音文本串提取符合相应的第三结构化标签中的描述的参数数据，

所述正则表达输出单元还用于输出提取的参数数据。

11.根据权利要求7～10中任一项所述的装置，其特征在于，在第四结构化标签中描述所述正则表达匹配模板表示的用户意图的数据，

所述正则表达匹配单元还用于提取与所述匹配的正则表达匹配模板相应的第四结构化标签的数据，

所述正则表达输出单元还用于输出所述正则表达匹配模板表示的用户意图的数据。

12.根据权利要求11所述的装置，其特征在于，所述结构化形式是XML语言格式，所述正则表达匹配模板是DOM树。