CN106372054A - 一种多语言语义解析的方法和装置 - Google Patents
一种多语言语义解析的方法和装置 Download PDFInfo
- Publication number
- CN106372054A CN106372054A CN201510443910.1A CN201510443910A CN106372054A CN 106372054 A CN106372054 A CN 106372054A CN 201510443910 A CN201510443910 A CN 201510443910A CN 106372054 A CN106372054 A CN 106372054A
- Authority
- CN
- China
- Prior art keywords
- control command
- phonetic control
- semantic
- grammatical structure
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本申请提出一种多语言语义解析的方法和装置,涉及电子终端设备领域,方法,所述方法包括:接收用户输入的语音控制指令,并识别所述语音控制指令对应的语言;按照识别出的所述语言对所述语音控制指令进行语法结构识别,获得带有语义标签的语法结构树;按照语法结构树的层级结构解析出所述语音控制指令对应的语义解析结果。可以不考虑语言的问题,自动识别对应的语言,来实现无语言障碍的使用,增加终端实际使用中的便利性。
Description
技术领域
本发明涉及电子终端设备领域,具体涉及一种多语言语义解析的方法和装置。
背景技术
由于在语音控制指令领域需要对所识别出的命令(例如:“给某某打电话”,“把空调的温度调到25度”)进行语义的解析才能清楚地知道用户想要表达的操控意图,进而对目标终端进行语音控制。但是在应用的过程中如果换了一种语言来表达,由于语法结构的完全不同,因此语义解析需要用两套逻辑来进行解析,造成了很大的麻烦。
发明内容
本发明提供一种多语言语义解析的方法和装置,无障碍解锁终端和方法,能够实现与语言无关的语音控制指令领域的语义解析待机界面或解锁界面的显示方向变换。
为了实现上述发明目的,本发明采取的技术方案如下:
一种多语言语义解析的方法,包括:
接收用户输入的语音控制指令,并识别所述语音控制指令对应的语言;
按照识别出的所述语言对所述语音控制指令进行语法结构识别,获得带有语义标签的语法结构树;
按照语法结构树的层级结构解析出所述语音控制指令对应的语义解析结果。
进一步地,所述方法还包括:
执行所述语义解析结果对应的操作。
进一步地,所述接收用户输入的语音控制指令之前还包括:
按照巴科斯范式根据语言编写一种或者多种语法文件。
进一步地,按照识别出的所述语言对所述语音控制指令进行语法结构识别,获得带有语义标签的语法结构树包括:
按照识别出的所述语言的语法结构的层级对所述语音控制指令进行语法成分分析,获得所述语音控制指令对应的语法结构树;
确定所述语音控制指令句式对应的一个或者多个语义标签;
结合所述语义标签和所述语法结构树,获得所述获得带有语义标签的语法结构树。
所述语义标签包括以下的一项或者多项:领域、动作、动作标识、关键词。
进一步地,确定所述语音控制指令句式对应的一个或者多个语义标签包括:
分析所述语音控制指令的句式结构,获得一个或者多个词语、短语和句子;
为获得的每个词语、短语和句子确定对应的一个或者多个语义标签。
本发明还提供一种多语言语义解析的装置,包括:
语音接收模块,用于接收用户输入的语音控制指令;
语音引擎识别模块,用于并识别所述语音控制指令对应的语言;
语法树处理模块,用于按照识别出的所述语言对所述语音控制指令进行语法结构识别,获得带有语义标签的语法结构树;
语义解析处理模块,用于按照语法结构树的层级结构解析出所述语音控制指令对应的语义解析结果。
优选地,所述装置还包括:
控制执行模块,用于执行所述语义解析结果对应的操作。
优选地,所述装置还包括:
语法编译模块,用于按照巴科斯范式根据语言编写一种或者多种语法文件。
优选地,所述语法树处理模块包括:
语法成分分析单元,用于按照识别出的所述语言的语法结构的层级对所述语音控制指令进行语法成分分析,获得所述语音控制指令对应的语法结构树;
语义标签标识单元,用于确定所述语音控制指令句式对应的一个或者多个语义标签;
语法结构树构成单元,用于结合所述语义标签和所述语法结构树,获得所述获得带有语义标签的语法结构树。
优选地,语义标签标识单元用于:
分析所述语音控制指令的句式结构,获得一个或者多个词语、短语和句子;
为获得的每个词语、短语和句子确定对应的一个或者多个语义标签。
本发明和现有技术相比,具有如下有益效果:
本发明提供的多语言语义解析的方法和装置,可以不考虑语言的问题,自动识别对应的语言,来实现无语言障碍的使用,增加终端实际使用中的便利性。
附图说明
图1是本发明实施例的一种多语言语义解析的方法的流程图;
图2是本发明实施例的一种多语言语义解析的装置的结构示意图。
具体实施方式
为使本发明的发明目的、技术方案和有益效果更加清楚明了,下面结合附图对本发明的实施例进行说明,需要说明的是,在不冲突的情况下,本申请中的实施例和实施例中的特征可以相互任意组合。
如图1所示,本发明实施例提供一种多语言语义解析的方法,包括:
S101、接收用户输入的语音控制指令,并识别所述语音控制指令对应的语言;
S102、按照识别出的所述语言对所述语音控制指令进行语法结构识别,获得带有语义标签的语法结构树;
S103、按照语法结构树的层级结构解析出所述语音控制指令对应的语义解析结果。
步骤S101中识别所述语音控制指令对应的语言是根据不同的语言模型资源进行识别。
步骤S103之后还包括:
S104、执行所述语义解析结果对应的操作。
步骤S101之前还包括:
S100、按照巴科斯范式根据语言编写一种或者多种语法文件。
巴科斯范式是由John Backus和Peter Naur首次引入一种形式化符号来描述给定语言的语法(最早用于描述ALGOL 60(算法语言(ALGOrithmicLanguage)的缩写,是计算机发展史上首批产生的高级程式语言家族)编程语言)。按照巴科斯范式根据不同的语言编写语法文件,要求编写的语法文件能够按照语法结构的层级表现语音控制指令的领域(Domain),动作(Action),动作ID(Action ID)以及关键词,在每一个句式子集(经过句式结构分析获得一个或者多个词语、短语和句子组成的集合)用TAG标签标识出句式子集的相关语义标签。
步骤S103中按照语法树的层级结构一层一层地解析出语音控制指令的领域(Domain),动作(Action),动作ID(Action ID)。如果有需要的关键词,例如“联系人姓名”,“25度”等关键词也根据相对应的语义标签进行解析,最后确定一套相关的语义解析结果指令集。
步骤S102包括:
S1021按照识别出的所述语言的语法结构的层级对所述语音控制指令进行语法成分分析,获得所述语音控制指令对应的语法结构树;
S1022确定所述语音控制指令句式对应的一个或者多个语义标签;
S1023结合所述语义标签和所述语法结构树,获得所述获得带有语义标签的语法结构树。
步骤S1022中的所述语义标签包括以下的一项或者多项:领域、动作、动作标识、关键词。
步骤S1022包括:
分析所述语音控制指令的句式结构,获得一个或者多个词语、短语和句子;
为获得的每个词语、短语和句子确定对应的一个或者多个语义标签。
如图2所示,本发明实施例还提供一种多语言语义解析的装置,包括:
语音接收模块201,用于接收用户输入的语音控制指令;
语音引擎识别模块202,用于并识别所述语音控制指令对应的语言;
语法树处理模块203,用于按照识别出的所述语言对所述语音控制指令进行语法结构识别,获得带有语义标签的语法结构树;
语义解析处理模块204,用于按照语法结构树的层级结构解析出所述语音控制指令对应的语义解析结果。
所述的装置还包括:
控制执行模块205,用于执行所述语义解析结果对应的操作。
语法编译模块200,用于按照巴科斯范式根据语言编写一种或者多种语法文件。
其中,语法树处理模块包括:
语法成分分析单元2031,用于按照识别出的所述语言的语法结构的层级对所述语音控制指令进行语法成分分析,获得所述语音控制指令对应的语法结构树;
语义标签标识单元2032,用于确定所述语音控制指令句式对应的一个或者多个语义标签;
语法结构树构成单元2033,用于结合所述语义标签和所述语法结构树,获得所述获得带有语义标签的语法结构树。
语义标签标识单元2032用于:
分析所述语音控制指令的句式结构,获得一个或者多个词语、短语和句子;
为获得的每个词语、短语和句子确定对应的一个或者多个语义标签。
实施例1
本实施例以以下例句作为示例:
【发送短信】
给张三发短信
吉田さんにメッセージを送る
Send sms to Mike
【调整空调的温度】
把空调的温度调到25度
エアコンを25度へょうせいする
Turn the air conditioning temperature to 25 degrees
1.根据不同的语言进行语法的编写,这里因为要展示区分领域Domain所以写了两类操控的例句,语法的详细展开只以发短信作为示例,调整空调的写法类似不再赘述,可能的形式如下:
2.语音识别内容根据第一步所编写的语法结构返回带有语义标签的语法树结构,可能的形式如下:
3.按照语法树的层级结构解析出语音控制指令的领域(Domain),动作(Action),动作ID(Action ID)。如果有需要的关键词,例如“联系人姓名”,“25度”等关键词也根据相对应的语义标签进行解析,最后输出一套相关的语义解析结果指令集,可能的形式如下:
获取第一层的语义标签区分Domain,SENDSMS_TAG标志为发短信的领域Domain="send_sms",同样AIRCONCTRL_TAG标志为空调控制的领域Domain="aircon_ctrl"。获取第二层的语义标签区分动作,发短信可能会分为单命令发短信Action="send_sms_only",发短信给联系人Action="send_sms_name"等动作。动作下面没有需要区分的ID,因此本例没有Action ID的解析。在发短信给某某这个示例中是需要解析联系人这个关键字的,因为手机终端在调起发短信这个操作的同时是需要知道联系人是谁才能做出正确的操作的。因此可能的解析为找到name这个语义标签,找到关键字,这个地方可能会是Arg1="张三"。
因此本实施例【发送短信】经过基于语义标签解析出的最终结果可能是以下形式:
中文:
{"domain":"send_sms","action":"send_sms_name","name":"张三"}
日文:
{"domain":"send_sms","action":"send_sms_name","name":"吉田"}
英文:
{"domain":"send_sms","action":"send_sms_name","name":"Mike"}
本实施例【调整空调的温度】经过基于语义标签解析出的最终结果可能是以下形式:
中文,日文,英文:
{"domain":"aircon_ctrl","action":"change_temp","temperature":"25"}
因为动作可能会有区分的原因,这里再举一个控制空调开关的例子“关闭空调”和“打开空调”,对于该例可能分别会是以下形式,action=0表示关,action=1表示开:
{"domain":"aircon_ctrl","action":"switch","action_id":"0"}
{"domain":"aircon_ctrl","action":"switch","action_id":"1"}
4.按照所输出的语义解析结果指令集进行对设备终端的实际操控。由上一步可以看出该指令集已经是跟语言无关,终端设备可以直接根据该指令集做出语音指令想要的相关操作,例如{"domain":"send_sms","action":"send_sms_name","name":"张三"}
由domain和action,可以知道是需要调起短信模块发短信界面,name可以知道是需要将张三填到联系人栏中,同样语言不同,仅仅是联系人名填得不同,跟语言是无关的。
虽然本发明所揭示的实施方式如上,但其内容只是为了便于理解本发明的技术方案而采用的实施方式,并非用于限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭示的核心技术方案的前提下,可以在实施的形式和细节上做任何修改与变化,但本发明所限定的保护范围,仍须以所附的权利要求书限定的范围为准。
Claims (11)
1.一种多语言语义解析的方法,其特征在于,包括:
接收用户输入的语音控制指令,并识别所述语音控制指令对应的语言;
按照识别出的所述语言对所述语音控制指令进行语法结构识别,获得带有语义标签的语法结构树;
按照语法结构树的层级结构解析出所述语音控制指令对应的语义解析结果。
2.如权利要求1所述的方法,其特征在于:还包括:
执行所述语义解析结果对应的操作。
3.如权利要求1所述的方法,其特征在于:接收用户输入的语音控制指令之前还包括:
按照巴科斯范式根据语言编写一种或者多种语法文件。
4.如权利要求1所述的方法,其特征在于,按照识别出的所述语言对所述语音控制指令进行语法结构识别,获得带有语义标签的语法结构树包括:
按照识别出的所述语言的语法结构的层级对所述语音控制指令进行语法成分分析,获得所述语音控制指令对应的语法结构树;
确定所述语音控制指令句式对应的一个或者多个语义标签;
结合所述语义标签和所述语法结构树,获得所述获得带有语义标签的语法结构树。
5.如权利要求4所述的方法,其特征在于,所述语义标签包括以下的一项或者多项:领域、动作、动作标识、关键词。
6.如权利要求4所述的方法,其特征在于,确定所述语音控制指令句式对应的一个或者多个语义标签包括:
分析所述语音控制指令的句式结构,获得一个或者多个词语、短语和句子;
为获得的每个词语、短语和句子确定对应的一个或者多个语义标签。
7.一种多语言语义解析的装置,其特征在于,包括:
语音接收模块,用于接收用户输入的语音控制指令;
语音引擎识别模块,用于并识别所述语音控制指令对应的语言;
语法树处理模块,用于按照识别出的所述语言对所述语音控制指令进行语法结构识别,获得带有语义标签的语法结构树;
语义解析处理模块,用于按照语法结构树的层级结构解析出所述语音控制指令对应的语义解析结果。
8.如权利要求7所述的装置,其特征在于:还包括:
控制执行模块,用于执行所述语义解析结果对应的操作。
9.如权利要求7所述的装置,其特征在于:还包括:
语法编译模块,用于按照巴科斯范式根据语言编写一种或者多种语法文件。
10.如权利要求7所述的装置,其特征在于,语法树处理模块包括:
语法成分分析单元,用于按照识别出的所述语言的语法结构的层级对所述语音控制指令进行语法成分分析,获得所述语音控制指令对应的语法结构树;
语义标签标识单元,用于确定所述语音控制指令句式对应的一个或者多个语义标签;
语法结构树构成单元,用于结合所述语义标签和所述语法结构树,获得所述获得带有语义标签的语法结构树。
11.如权利要求10所述的装置,其特征在于,语义标签标识单元用于:
分析所述语音控制指令的句式结构,获得一个或者多个词语、短语和句子;
为获得的每个词语、短语和句子确定对应的一个或者多个语义标签。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510443910.1A CN106372054B (zh) | 2015-07-24 | 2015-07-24 | 一种多语言语义解析的方法和装置 |
PCT/CN2016/082653 WO2017016286A1 (zh) | 2015-07-24 | 2016-05-19 | 一种多语言语义解析的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510443910.1A CN106372054B (zh) | 2015-07-24 | 2015-07-24 | 一种多语言语义解析的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106372054A true CN106372054A (zh) | 2017-02-01 |
CN106372054B CN106372054B (zh) | 2020-10-09 |
Family
ID=57880209
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510443910.1A Active CN106372054B (zh) | 2015-07-24 | 2015-07-24 | 一种多语言语义解析的方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN106372054B (zh) |
WO (1) | WO2017016286A1 (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108228191A (zh) * | 2018-02-06 | 2018-06-29 | 威盛电子股份有限公司 | 语法编译系统以及语法编译方法 |
CN108399919A (zh) * | 2017-02-06 | 2018-08-14 | 中兴通讯股份有限公司 | 一种语义识别方法和装置 |
CN109841210A (zh) * | 2017-11-27 | 2019-06-04 | 西安中兴新软件有限责任公司 | 一种智能操控实现方法及装置、计算机可读存储介质 |
CN110096709A (zh) * | 2019-05-07 | 2019-08-06 | 百度在线网络技术(北京)有限公司 | 指令处理方法及装置、服务器及计算机可读介质 |
CN110970028A (zh) * | 2019-12-26 | 2020-04-07 | 杭州中科先进技术研究院有限公司 | 一种规范语音识别设备的语音识别指令与操作指令的方法 |
CN111933141A (zh) * | 2020-08-31 | 2020-11-13 | 江西台德智慧科技有限公司 | 一种基于大数据的人工智能语音交互系统 |
CN116955649A (zh) * | 2023-07-21 | 2023-10-27 | 重庆赛力斯新能源汽车设计院有限公司 | 意图识别方法、装置、电子设备及存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111143330B (zh) * | 2019-12-27 | 2023-10-03 | 湖南亚信软件有限公司 | 一种多模态数据库解析引擎的实现方法及装置 |
CN112949286B (zh) * | 2021-03-09 | 2023-08-04 | 北京汉雅天诚教育科技有限公司 | 一种基于句式结构的汉语自动句法分析器 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0869466A (ja) * | 1994-08-30 | 1996-03-12 | Sumitomo Electric Ind Ltd | 自然言語解析装置 |
CN1526132A (zh) * | 2000-10-10 | 2004-09-01 | ض� | 基于语音的不受语言限制的搜索系统 |
CN1677388A (zh) * | 2004-03-30 | 2005-10-05 | 微软公司 | 用于逻辑形式的统计语言模型 |
CN104485106A (zh) * | 2014-12-08 | 2015-04-01 | 畅捷通信息技术股份有限公司 | 语音识别方法、语音识别系统和语音识别设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7475015B2 (en) * | 2003-09-05 | 2009-01-06 | International Business Machines Corporation | Semantic language modeling and confidence measurement |
CN101110812A (zh) * | 2007-08-29 | 2008-01-23 | 中兴通讯股份有限公司 | 文本命令解析处理方法 |
-
2015
- 2015-07-24 CN CN201510443910.1A patent/CN106372054B/zh active Active
-
2016
- 2016-05-19 WO PCT/CN2016/082653 patent/WO2017016286A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0869466A (ja) * | 1994-08-30 | 1996-03-12 | Sumitomo Electric Ind Ltd | 自然言語解析装置 |
CN1526132A (zh) * | 2000-10-10 | 2004-09-01 | ض� | 基于语音的不受语言限制的搜索系统 |
CN1677388A (zh) * | 2004-03-30 | 2005-10-05 | 微软公司 | 用于逻辑形式的统计语言模型 |
CN104485106A (zh) * | 2014-12-08 | 2015-04-01 | 畅捷通信息技术股份有限公司 | 语音识别方法、语音识别系统和语音识别设备 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108399919A (zh) * | 2017-02-06 | 2018-08-14 | 中兴通讯股份有限公司 | 一种语义识别方法和装置 |
CN109841210A (zh) * | 2017-11-27 | 2019-06-04 | 西安中兴新软件有限责任公司 | 一种智能操控实现方法及装置、计算机可读存储介质 |
CN109841210B (zh) * | 2017-11-27 | 2024-02-20 | 西安中兴新软件有限责任公司 | 一种智能操控实现方法及装置、计算机可读存储介质 |
CN108228191A (zh) * | 2018-02-06 | 2018-06-29 | 威盛电子股份有限公司 | 语法编译系统以及语法编译方法 |
CN110096709A (zh) * | 2019-05-07 | 2019-08-06 | 百度在线网络技术(北京)有限公司 | 指令处理方法及装置、服务器及计算机可读介质 |
CN110970028A (zh) * | 2019-12-26 | 2020-04-07 | 杭州中科先进技术研究院有限公司 | 一种规范语音识别设备的语音识别指令与操作指令的方法 |
CN111933141A (zh) * | 2020-08-31 | 2020-11-13 | 江西台德智慧科技有限公司 | 一种基于大数据的人工智能语音交互系统 |
CN116955649A (zh) * | 2023-07-21 | 2023-10-27 | 重庆赛力斯新能源汽车设计院有限公司 | 意图识别方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106372054B (zh) | 2020-10-09 |
WO2017016286A1 (zh) | 2017-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106372054A (zh) | 一种多语言语义解析的方法和装置 | |
US10777192B2 (en) | Method and apparatus of recognizing field of semantic parsing information, device and readable medium | |
US20210118463A1 (en) | Interactive server, control method thereof, and interactive system | |
AU2017408800B2 (en) | Method and system of mining information, electronic device and readable storable medium | |
JP5119055B2 (ja) | 多言語対応音声認識装置、システム、音声の切り替え方法およびプログラム | |
EP2869298A1 (en) | Information identification method and apparatus | |
CN111402861B (zh) | 一种语音识别方法、装置、设备及存储介质 | |
JP7213943B2 (ja) | 車載機器の音声処理方法、装置、機器及び記憶媒体 | |
CN110209812B (zh) | 文本分类方法和装置 | |
US8509396B2 (en) | Automatic creation of complex conversational natural language call routing system for call centers | |
JP2020030408A (ja) | オーディオにおける重要語句を認識するための方法、装置、機器及び媒体 | |
CN111462741B (zh) | 语音数据处理方法、装置及存储介质 | |
CN109947924B (zh) | 对话系统训练数据构建方法、装置、电子设备及存储介质 | |
KR20170033152A (ko) | 음성 인식 서버 및 그 제어 방법 | |
CN110096599B (zh) | 知识图谱的生成方法及装置 | |
JP6869835B2 (ja) | 音声認識システム、端末装置、及び辞書管理方法 | |
CN112466289A (zh) | 语音指令的识别方法、装置、语音设备和存储介质 | |
CN109003611A (zh) | 用于车辆语音控制的方法、装置、设备和介质 | |
CN114420102B (zh) | 语音断句方法、装置、电子设备及存储介质 | |
CN112818996A (zh) | 指令识别方法和装置、存储介质及电子设备 | |
EP3186707B1 (en) | Method of and system for processing a user-generated input command | |
CN111354354A (zh) | 一种基于语义识别的训练方法、训练装置及终端设备 | |
JP7383761B2 (ja) | 車両に対する音声処理方法、装置、電子機器、記憶媒体及びコンピュータプログラム | |
US20240005917A1 (en) | Speech interaction method ,and apparatus, computer readable storage medium, and electronic device | |
KR102476208B1 (ko) | 한국어 명사 추출 토크나이저 기반의 워드클라우드 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |