WO2017016286A1

WO2017016286A1 - 一种多语言语义解析的方法和装置

Info

Publication number: WO2017016286A1
Application number: PCT/CN2016/082653
Authority: WO
Inventors: 刘伟
Original assignee: 中兴通讯股份有限公司
Priority date: 2015-07-24
Filing date: 2016-05-19
Publication date: 2017-02-02
Also published as: CN106372054A; CN106372054B

Abstract

一种多语言语义解析的方法和装置，涉及电子终端设备领域，所述方法包括：接收用户输入的语音控制指令，并识别所述语音控制指令对应的语言；按照识别出的所述语言对所述语音控制指令进行语法结构识别，获得带有语义标签的语法结构树；按照语法结构树的层级结构解析出所述语音控制指令对应的语义解析结果。可以不考虑语言的问题，自动识别对应的语言，来实现无语言障碍的使用，增加终端实际使用中的便利性。

Description

一种多语言语义解析的方法和装置

技术领域

本发明实施例涉及但不限于电子终端设备，尤指一种多语言语义解析的方法和装置。

背景技术

在语音控制指令领域，需要对所识别出的命令，比如：“给某某打电话”，“把空调的温度调到25度”等进行语义的解析，才能清楚地知道用户想要表达的操控意图，进而按照语音指令对目标终端进行相应控制。

但是，在应用的过程中，如果更换一种语言来表达，由于语法结构的完全不同，因此语义解析需要用两套甚至更多不同的逻辑来进行解析，这样，使得语义解析变得复杂、不灵活。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本发明实施例提供一种多语言语义解析的方法和装置，能够使得语义解析变得简单、灵活,无障碍解锁终端。

一种多语言语义解析的方法，包括：

接收用户输入的语音控制指令，并识别语音控制指令对应的语言；

按照识别出的语言对语音控制指令进行语法结构识别，获得带有语义标签的语法结构树；

按照语法结构树的层级结构解析出语音控制指令对应的语义解析结果。

可选地，所述方法还包括：执行所述语义解析结果对应的操作。

可选地，所述接收用户输入的语音控制指令之前还包括：

按照巴科斯范式根据语言编写一种或者多种语法文件。

可选地，所述按照识别出的语言对语音控制指令进行语法结构识别，获得带有语义标签的语法结构树包括：

按照识别出的所述语言的语法结构的层级对所述语音控制指令进行语法成分分析，获得所述语音控制指令对应的语法结构树；

确定所述语音控制指令句式对应的一个或者多个语义标签；

结合所述语义标签和所述语法结构树，获得所述获得带有语义标签的语法结构树。

可选地所述语义标签包括以下的一项或者多项：领域、动作、动作标识、关键词。

可选地，确定所述语音控制指令句式对应的一个或者多个语义标签包括：

分析所述语音控制指令的句式结构，获得一个或者多个词语、短语和句子；

为获得的每个词语、短语和句子确定对应的一个或者多个语义标签。

本发明实施例还提供一种多语言语义解析的装置，包括：

语音接收模块，设置为接收用户输入的语音控制指令；

语音引擎识别模块，设置为识别所述语音控制指令对应的语言；

语法树处理模块，设置为按照识别出的所述语言对所述语音控制指令进行语法结构识别，获得带有语义标签的语法结构树；

语义解析处理模块，设置为按照语法结构树的层级结构解析出所述语音控制指令对应的语义解析结果。

可选地，所述装置还包括：

控制执行模块，设置为执行所述语义解析结果对应的操作。

可选地，所述装置还包括：

语法编译模块，设置为按照巴科斯范式根据语言编写一种或者多种语法文件。

可选地，所述语法树处理模块包括：

语法成分分析单元，设置为按照识别出的所述语言的语法结构的层级对所述语音控制指令进行语法成分分析，获得所述语音控制指令对应的语法结构树；

语义标签标识单元，设置为确定所述语音控制指令句式对应的一个或者多个语义标签；

语法结构树构成单元，设置为结合所述语义标签和所述语法结构树，获得所述获得带有语义标签的语法结构树。

可选地，所述语义标签标识单元设置为：

本发明实施例再提供了一种计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于执行上述任一多语言语义解析的方法。

本发明和现有技术相比，具有如下有益效果：

本发明提供的多语言语义解析的方法和装置，可以不考虑语言的问题，自动识别对应的语言，来实现无语言障碍的使用，增加终端实际使用中的便利性。

本发明实施例的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

在阅读并理解了附图和详细描述后，可以明白其他方面。

附图概述

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例的一种多语言语义解析的方法的流程图；

图2是本发明实施例的一种多语言语义解析的装置的结构示意图。

本发明的较佳实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下文中将结合附图对本发明的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

如图1所示，本发明实施例提供一种多语言语义解析的方法，包括：

步骤S101、接收用户输入的语音控制指令，并识别所述语音控制指令对应的语言；

步骤S102、按照识别出的语言对所述语音控制指令进行语法结构识别，获得带有语义标签的语法结构树；

步骤S103、按照语法结构树的层级结构解析出所述语音控制指令对应的语义解析结果。

步骤S101中识别所述语音控制指令对应的语言是根据不同的语言模型资源进行识别。

步骤S103之后还包括：

步骤S104、执行所述语义解析结果对应的操作。

步骤S101之前还包括：

S100、按照巴科斯范式根据语言编写一种或者多种语法文件。

巴科斯范式是由John Backus和Peter Naur首次引入一种形式化符号来描述给定语言的语法(最早用于描述ALGOL 60(算法语言(ALGOrithmic Language)的缩写，是计算机发展史上首批产生的高级程式语言家族)编程语言)。按照巴科斯范式根据不同的语言编写语法文件，要求编写的语法文件能够按照语法结构的层级表现语音控制指令的领域(Domain)，动作(Action)，动作ID(Action ID)以及关键词，在每一个句式子集(经过句式结构分析获得一个或者多个词语、短语和句子组成的集合)用TAG标签标识出句式子集的相关语义标签。

步骤S103中按照语法树的层级结构一层一层地解析出语音控制指令的领域(Domain)，动作(Action)，动作ID(Action ID)。如果有需要的关键词，例如“联系人姓名”，“25度”等关键词也根据相对应的语义标签进行解析，最后确定一套相关的语义解析结果指令集。

步骤S102包括：

步骤S1021按照识别出的所述语言的语法结构的层级对所述语音控制指令进行语法成分分析，获得所述语音控制指令对应的语法结构树；

步骤S1022确定所述语音控制指令句式对应的一个或者多个语义标签；

步骤S1023结合所述语义标签和所述语法结构树，获得所述获得带有语义标签的语法结构树。

步骤S1022中的所述语义标签包括以下的一项或者多项：领域、动作、动作标识、关键词。

步骤S1022包括：

分析所述语音控制指令的句式结构，获得一个或者多个词语、短语和句子；为获得的每个词语、短语和句子确定对应的一个或者多个语义标签。

如图2所示，本发明实施例还提供一种多语言语义解析的装置，包括：

语音接收模块201，用于接收用户输入的语音控制指令；

语音引擎识别模块202，用于识别所述语音控制指令对应的语言；

语法树处理模块203，用于按照识别出的所述语言对所述语音控制指令进行语法结构识别，获得带有语义标签的语法结构树；

语义解析处理模块204，用于按照语法结构树的层级结构解析出所述语音控制指令对应的语义解析结果。

所述的装置还包括：

控制执行模块205，用于执行所述语义解析结果对应的操作。

语法编译模块200，用于按照巴科斯范式根据语言编写一种或者多种语法文件。

其中，语法树处理模块203包括：

语法成分分析单元2031，用于按照识别出的所述语言的语法结构的层级对所述语音控制指令进行语法成分分析，获得所述语音控制指令对应的语法结构树；

语义标签标识单元2032，用于确定所述语音控制指令句式对应的一个或者多个语义标签；

语法结构树构成单元2033，用于结合所述语义标签和所述语法结构树，获得所述获得带有语义标签的语法结构树。

语义标签标识单元2032用于：

实施例1

本实施例以以下例句作为示例：

【发送短信】

给张三发短信

吉田さんにメッセージを送る

Send sms to Mike

【调整空调的温度】

把空调的温度调到25度

エアコンを25度へちょうせいする

Turn the air conditioning temperature to 25degrees

1.根据不同的语言进行语法的编写，这里因为要展示区分领域Domain所以写了两类操控的例句，语法的详细展开只以发短信作为示例，调整空调的写法类似不再赘述，可能的形式如下：

2.语音识别内容根据第一步所编写的语法结构返回带有语义标签的语法树结构，可能的形式如下：

3.按照语法树的层级结构解析出语音控制指令的领域(Domain)，动作(Action)，动作ID(Action ID)。如果有需要的关键词，例如“联系人姓名”， “25度”等关键词也根据相对应的语义标签进行解析，最后输出一套相关的语义解析结果指令集，可能的形式如下：

获取第一层的语义标签区分Domain，SENDSMS_TAG标志为发短信的领域Domain＝"send_sms"，同样AIRCONCTRL_TAG标志为空调控制的领域Domain＝"aircon_ctrl"。获取第二层的语义标签区分动作，发短信可能会分为单命令发短信Action＝"send_sms_only"，发短信给联系人Action＝"send_sms_name"等动作。动作下面没有需要区分的ID，因此本例没有Action ID的解析。在发短信给某某这个示例中是需要解析联系人这个关键字的，因为手机终端在调起发短信这个操作的同时是需要知道联系人是谁才能做出正确的操作的。因此可能的解析为找到name这个语义标签，找到关键字，这个地方可能会是Arg1＝"张三"。

因此本实施例【发送短信】经过基于语义标签解析出的最终结果可能是以下形式：

中文：

{"domain":"send_sms","action":"send_sms_name","name":"张三"}

日文：

{"domain":"send_sms","action":"send_sms_name","name":"吉田"}

英文：

{"domain":"send_sms","action":"send_sms_name","name":"Mike"}

本实施例【调整空调的温度】经过基于语义标签解析出的最终结果可能是以下形式：

中文,日文，英文：

{"domain":"aircon_ctrl","action":"change_temp","temperature":"25"}

因为动作可能会有区分的原因，这里再举一个控制空调开关的例子“关闭空调”和“打开空调”，对于该例可能分别会是以下形式，action＝0表示关，action＝1表示开：

{"domain":"aircon_ctrl","action":"switch","action_id":"0"}

{"domain":"aircon_ctrl","action":"switch","action_id":"1"}

4.按照所输出的语义解析结果指令集进行对设备终端的实际操控。由上一步可以看出该指令集已经是跟语言无关，终端设备可以直接根据该指令集做出语音指令想要的相关操作，例如{"domain":"send_sms","action":"send_sms_name","name":"张三"}

由domain和action，可以知道是需要调起短信模块发短信界面，name可以知道是需要将张三填到联系人栏中，同样语言不同，仅仅是联系人名填得不同，跟语言是无关的。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现，相应地，上述实施例中的各模块/模块可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。本申请不限制于任何特定形式的硬件和软件的结合。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

工业实用性

本发明实施例提出的多语言语义解析的方法和装置，涉及电子终端设备领域，方法，所述方法包括：接收用户输入的语音控制指令，并识别所述语音控制指令对应的语言；按照识别出的所述语言对所述语音控制指令进行语法结构识别，获得带有语义标签的语法结构树；按照语法结构树的层级结构解析出所述语音控制指令对应的语义解析结果。可以不考虑语言的问题，自动识别对应的语言，来实现无语言障碍的使用，增加终端实际使用中的便利性。

Claims

一种多语言语义解析的方法，其特征在于，包括：

接收用户输入的语音控制指令，并识别语音控制指令对应的语言；

按照识别出的语言对语音控制指令进行语法结构识别，获得带有语义标签的语法结构树；

按照语法结构树的层级结构解析出语音控制指令对应的语义解析结果。
如权利要求1所述的方法，该方法还包括：执行所述语义解析结果对应的操作。
如权利要求1所述的方法，所述接收用户输入的语音控制指令之前还包括：

按照巴科斯范式根据语言编写一种或者多种语法文件。
如权利要求1所述的方法，其中，所述按照识别出的语言对语音控制指令进行语法结构识别，获得带有语义标签的语法结构树包括：

按照识别出的所述语言的语法结构的层级对所述语音控制指令进行语法成分分析，获得所述语音控制指令对应的语法结构树；

确定所述语音控制指令句式对应的一个或者多个语义标签；

结合所述语义标签和所述语法结构树，获得所述获得带有语义标签的语法结构树。
如权利要求4所述的方法，其中，所述语义标签包括以下的一项或者多项：领域、动作、动作标识、关键词。
如权利要求4所述的方法，其中，所述确定所述语音控制指令句式对应的一个或者多个语义标签包括：

分析所述语音控制指令的句式结构，获得一个或者多个词语、短语和句子；

为获得的每个词语、短语和句子确定对应的一个或者多个语义标签。
一种多语言语义解析的装置，其特征在于，包括：

语音接收模块，设置为接收用户输入的语音控制指令；

语音引擎识别模块，设置为识别所述语音控制指令对应的语言；

语法树处理模块，设置为按照识别出的所述语言对所述语音控制指令进行语法结构识别，获得带有语义标签的语法结构树；

语义解析处理模块，设置为按照语法结构树的层级结构解析出所述语音控制指令对应的语义解析结果。
如权利要求7所述的装置，还包括：

控制执行模块，设置为执行所述语义解析结果对应的操作。
如权利要求7所述的装置，还包括：

语法编译模块，设置为按照巴科斯范式根据语言编写一种或者多种语法文件。
如权利要求7所述的装置，其中，所述语法树处理模块包括：

语法成分分析单元，设置为按照识别出的所述语言的语法结构的层级对所述语音控制指令进行语法成分分析，获得所述语音控制指令对应的语法结构树；

语义标签标识单元，设置为确定所述语音控制指令句式对应的一个或者多个语义标签；

语法结构树构成单元，用于结合所述语义标签和所述语法结构树，获得所述获得带有语义标签的语法结构树。
如权利要求10所述的装置，其中，所述语义标签标识单元用于：

分析所述语音控制指令的句式结构，获得一个或者多个词语、短语和句子；

为获得的每个词语、短语和句子确定对应的一个或者多个语义标签。
一种计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于执行权1～权6任一项的多语言语义解析的方法。