CN111797636A - 离线语义解析方法及系统 - Google Patents

离线语义解析方法及系统 Download PDF

Info

Publication number
CN111797636A
CN111797636A CN202010705844.1A CN202010705844A CN111797636A CN 111797636 A CN111797636 A CN 111797636A CN 202010705844 A CN202010705844 A CN 202010705844A CN 111797636 A CN111797636 A CN 111797636A
Authority
CN
China
Prior art keywords
semantic
field
current
navigation
fields
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010705844.1A
Other languages
English (en)
Other versions
CN111797636B (zh
Inventor
陈家欢
甘津瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AI Speech Ltd
Original Assignee
AI Speech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AI Speech Ltd filed Critical AI Speech Ltd
Priority to CN202010705844.1A priority Critical patent/CN111797636B/zh
Publication of CN111797636A publication Critical patent/CN111797636A/zh
Application granted granted Critical
Publication of CN111797636B publication Critical patent/CN111797636B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开一种离线语义解析方法和系统,方法包括:根据多个语言字段获取与其对应的多个功能语义字段,在语言模型的gram语法编译内容中,对应多个功能语义字段创建多个语义分类字段skill_id;判断当前字段是否有对应多个语义分类字段skill_id,若是,则根据当前字段、语义对应关系获取对应的当前语义分类字段skill_id;若否,则根据当前字段及本地导航解析程序获取导航信息返回字段。本发明通过在gram语法编译的流程中添加skill id字段,为每一个说法都注明其分类,在给出识别结果的同时,给出当前说法属于哪一类的信息:skill id。通过skill id直接定位到对应类别的语义进行解析。

Description

离线语义解析方法及系统
技术领域
本发明涉及语音识别及应用领域。本发明具体涉及一种离线语义解析方法及系统。
背景技术
现有的语义解析方案,大多是建立在重复匹配的方案上确定最终语义结果。在现有方案中,是得到识别结果后,通过依次匹配不同的离线语义,得到相对较正确的结果。
由此可知,现有的语义解析方案的缺陷在于,一方面,由于最终的语义是建立在依次匹配、比较之后,得到的一个可信度相对较高的结果,这就意味着,即便在识别正确的基础上也无法保证最后的语义结果一定是用户想要得到的结果。
另一方面,语义的匹配、解析是需要花费时间的,这在离线语义较少的情况下,时间的花费还不突出,随着离线语义的需求增加,说法、技能越来越多,解析的时间也会随之增加,离线内容越丰富,语义解析的时间也就越长,用户体验也就越差。
发明人在实现本申请的过程中发现:上述缺陷产生的根本原因是在于:以上技术中的识别结果并没有包含语义相关的信息,导致想要获取到正确的语义只能通过对离线语义的依次匹配、比较来得到。
发明内容
本发明实施方式提供一种离线语义解析方法及系统,用于至少解决上述技术问题之一。
第一方面,本发明实施方式中提供一种离线语义解析方法,包括:步骤S101,根据多个语言字段获取与其对应的多个功能语义字段,建立多个功能语义字段与多个语言字段的语义对应关系;步骤S102,在语言模型的gram语法编译内容中,对应多个功能语义字段创建多个语义分类字段skill_id;根据多个语义分类字段skill_id关联多个语义解析;多个语义解析能够获取确定的输出字段;步骤S103,判断当前字段是否有对应多个语义分类字段skill_id,若是,则转到步骤S104,若否,则转到步骤S105;步骤S104,根据当前字段、语义对应关系获取对应的当前语义分类字段skill_id;根据当前语义分类字段skill_id通过对应的语义能够解析获取当前输出字段;以及步骤S105,根据当前字段及本地的导航解析程序获取导航信息返回字段;导航解析程序能够根据当前字段获得相应的导航位置数据。
第二方面,本发明实施方式中提供一种离线语义解析系统,包括:语义分类字段建立单元及解析单元,其中,语义分类字段建立单元配置为:根据多个语言字段获取与其对应的多个功能语义字段;建立多个功能语义字段与多个语言字段的语义对应关系;在语言模型的gram语法编译内容中,对应多个功能语义字段创建多个语义分类字段skill_id;根据多个语义分类字段skill_id关联多个语义解析;多个语义解析能够获取确定的输出字段;解析单元包括:一个语义解析单元及一个导航单元。解析单元配置为:判断当前字段是否有对应多个语义分类字段skill_id,若是,则转到解析单元,若否,则转到导航单元;语义解析单元,配置为根据当前字段、语义对应关系获取对应的当前语义分类字段skill_id;根据当前语义分类字段skill_id通过对应的语义能够解析获取当前输出字段;以及导航单元,配置为根据当前字段及本地的导航解析程序获取导航信息返回字段;导航解析程序能够根据当前字段获得相应的导航位置数据。
第三方面,提供一种离线语义解析的电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施方式的方法的步骤。
第四方面,本发明实施方式还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本发明任一实施方式的方法的步骤。
本发明通过在gram语法编译的流程中添加skill id的字段,为每一个说法都注明其分类,这样将识别的功能放大,在给出识别结果的同时,给出当前说法属于哪一类的信息:skill id。通过skill id直接定位到对应类别的语义进行解析。
通过上述方案,可以解决类似技术以下的至少一个缺陷:
缺陷一:语义的准确率;由于说法在最初编译的时候就已经标注了用户认定的类集,不存在跑偏到其他类别内进行语义解析。
缺陷二:效率;skill id的定义,可以将识别结果直接定位到对应的语义集合,不会对所有存在的语义进行依次遍历、比较;不需要考虑随着说法、技能的增多从而导致的体验变差的问题。
另外当前方案还支持和兼容了离线导航技能。导航技能作为一个特殊技能是不会有skill id作为标识的;如果识别结果没有skill id,并且当前产品内部包含有导航技能,那么可以认定,当前说法通过导航技能识别。
附图说明
为了更清楚地说明本发明实施方式的技术方案,下面将对实施方式描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施方式提供的离线语义解析方法的流程图;
图2为本发明另一实施方式提供的离线语义解析方法的流程图;
图3为本发明再一实施方式提供的离线语义解析方法的组成图;
图4为本发明一实施方式提供的离线语义解析系统的组成图;
图5为本发明又一实施方式提供的离线语义解析方法的流程图;
图6是本发明一实施方式提供的电子设备的结构示意图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
发明人在实现本申请的过程中发现,针对上述缺陷,通常采用提供基础服务能力,由开发者自行解决这些缺陷。因为解决上述问题,是要做到准确、快速,即在不影响开发者创建对话的基础上,也不会增加开发者额外工作量的基础上提供最优解。所以涉很多基础离线技术的融合(包含gram编译、ASR、NLU、DM等)。从而在技术的融合上存在难度。同时,对话系统中通常由五个组成部分:自动语音识别(ASR,Automatic Speech Recognition,自动语音识别),自然语言理解(NLU,Natural Language Understanding,自然语言理解),对话管理(DM,Dialog Manager对话管理),自然语言生成(NLG)和文本到语音合成(TTS,Text ToSpeech文本到语音)。ASR通过深度学习技术获得,很难做出系统化改进。
请参考图1,其示出了本发明一实施例提供的一种离线语义解析方法。
如图1所示,包括:
步骤S101,获取多个功能语义字段。
本步骤中,根据多个语言字段获取与其对应的多个功能语义字段,建立多个功能语义字段与多个语言字段的语义对应关系。
步骤S102,创建多个语义分类字段。
本步骤中,在语言模型的gram语法编译内容中,对应多个功能语义字段创建多个语义分类字段skill_id。根据多个语义分类字段skill_id关联多个语义解析。多个语义解析能够获取确定的输出字段。
步骤S103,划分解析方法。
本步骤中,判断当前字段是否有对应多个语义分类字段skill_id,若是,则转到步骤S104,若否,则转到步骤S105。
步骤S104,语义解析。
本步骤中,根据当前字段、语义对应关系获取对应的当前语义分类字段skill_id。根据当前语义分类字段skill_id通过对应的语义能够解析获取当前输出字段。
步骤S105,导航解析。
本步骤中,根据当前字段及本地的导航解析程序获取导航信息返回字段。导航解析程序能够根据当前字段获得相应的导航位置数据。
在离线语义解析方法的一种优选的实施方式中,如图2所示,步骤S103包括:
步骤S1031,获取当前语义分类字段。
本步骤中,根据当前字段及语义对应关系,获取对应的语义分类字段skill_id。
步骤S1032,判断语义分类字段是否为空。
本步骤中,判断语义分类字段skill_id是否为空,若否,则转到步骤S104,若是,则转到步骤S105。
在离线语义解析方法的另一种优选的实施方式中,步骤S104包括:
判断当前语义分类字段skill_id通过对应的语义解析是否能够获取当前输出字段,若能够,则输出当前输出字段。若不能够,则转到步骤S105。
在离线语义解析方法的再一种优选的实施方式中,导航解析程序对应导航解析语义。语义对应关系中包括导航解析语义与语言字段的对应关系。
如图3所示,步骤S105中包括:
步骤S1051,获取当前功能语义。
本步骤中,根据当前字段获取对应的当前功能语义。
步骤S1052,判断当前功能语义是否为导航解析语义。
本步骤中,判断当前功能语义是否为导航解析语义,若是,则根据当前字段及本地的导航解析程序获取导航信息返回字段。若否,则通过自然语言识别当前字段获取当前自然语言识别结果。
在离线语义解析方法的再一种优选的实施方式中,步骤S1052中还包括,判断自然语言识别结果是否为有效结果,若是有效结果,则输出自然语言识别结果为当前输出字段。若不是有效结果,则将自然语言识别结果作为导航解析参数生成导航结果。根据导航结果更新导航解析程序。
在离线语义解析方法的再一种优选的实施方式中,多个语言字段为第一类多个语言字段。多个语义分类字段skill_id为与第一类语言字段对应的第一类语义分类字段skill_id。
在离线语义解析方法的再一种优选的实施方式中,还包括:第二类多个语言字段及与第二类语言字段对应的第二类语义分类字段skill_id。
在离线语义解析方法的再一种优选的实施方式中,步骤S105中还包括:
判断导航位置数据是否为有效数据,若是,则输出导航位置数据。若否,则当前字段及第二类语义分类字段skill_id通过对应的语义能够解析获取第二输出字段。将第二输出字段作为当前输出字段。
第二方面,本发明实施方式中提供一种离线语义解析系统,如图4所示,包括:语义分类字段建立单元101及解析单元201,其中,语义分类字段建立单元101配置为:
根据多个语言字段获取与其对应的多个功能语义字段。建立多个功能语义字段与多个语言字段的语义对应关系。
在语言模型的gram语法编译内容中,对应多个功能语义字段创建多个语义分类字段skill_id。根据多个语义分类字段skill_id关联多个语义解析。多个语义解析能够获取确定的输出字段。
解析单元201包括:一个语义解析单元202及一个导航单元203。解析单元201配置为:
判断当前字段是否有对应多个语义分类字段skill_id,若是,则转到解析单元201,若否,则转到导航单元203。
语义解析单元202,配置为根据当前字段、语义对应关系获取对应的当前语义分类字段skill_id。根据当前语义分类字段skill_id通过对应的语义能够解析获取当前输出字段。
导航单元203,配置为根据当前字段及本地的导航解析程序获取导航信息返回字段。导航解析程序能够根据当前字段获得相应的导航位置数据。
在离线语义解析系统的另一种优选的实施方式中:
解析单元201还配置为:
根据当前字段及语义对应关系,获取对应的语义分类字段skill_id。
判断语义分类字段skill_id是否为空,若否,则转到解析单元201,若是,则转到导航单元203。
语义解析单元202,还配置为判断当前语义分类字段skill_id通过对应的语义解析是否能够获取当前输出字段,若能够,则输出当前输出字段。若不能够,则转到
导航解析程序对应导航解析语义。语义对应关系中包括导航解析语义与语言字段的对应关系。
导航单元203,还配置为根据当前字段获取对应的当前功能语义。判断当前功能语义是否为导航解析语义,若是,则根据当前字段及本地的导航解析程序获取导航信息返回字段。若否,则通过自然语言识别当前字段获取当前自然语言识别结果。
导航单元203,还配置为判断自然语言识别结果是否为有效结果,若是有效结果,则输出自然语言识别结果为当前输出字段。若不是有效结果,则将自然语言识别结果作为导航解析参数生成导航结果。根据导航结果更新导航解析程序。
多个语言字段为第一类多个语言字段。多个语义分类字段skill_id为与第一类语言字段对应的第一类语义分类字段skill_id。
第二类多个语言字段及与第二类语言字段对应的第二类语义分类字段skill_id。
导航单元203,还配置为判断导航位置数据是否为有效数据,若是,则输出导航位置数据。若否,则当前字段及第二类语义分类字段skill_id通过对应的语义能够解析获取第二输出字段。将第二输出字段作为当前输出字段。
在另一些实施方式中,本发明实施方式还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施方式中的网络模型的加密方法;
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,计算机可执行离线语义解析指令设置为:
根据多个语言字段获取与其对应的多个功能语义字段。建立多个功能语义字段与多个语言字段的语义对应关系。
在语言模型的gram语法编译内容中,对应多个功能语义字段创建多个语义分类字段skill_id。根据多个语义分类字段skill_id关联多个语义解析。多个语义解析能够获取确定的输出字段。
判断当前字段是否有对应多个语义分类字段skill_id,若是,则根据当前字段、语义对应关系获取对应的当前语义分类字段skill_id。根据当前语义分类字段skill_id通过对应的语义能够解析获取当前输出字段。若否,则根据当前字段及本地的导航解析程序获取导航信息返回字段。导航解析程序能够根据当前字段获得相应的导航位置数据。
在离线语义解析方法的另一种优选的实施方式中,在说明本发明中的方案之前,先扩展下对于skill_id的概念:每一种说法都可以归类到某一个类别中,比如“打开电视”、“打开电灯”,这些说法可以归类成“家电控制”(此处的“家店控制”的名称是由开发者自行决定的);比如“今天天气怎么样”,可以归类为“天气查询”;如此种种;既然每一种说法都可以归类到某一个集合下面,那么我们可以为这个说法的集合添加一个唯一的标识,这就是skill id。
本发明中离线语义解析方法在一种实施方式中的处理流程如图5所示,方案描述为:
通过在gram语法编译的流程中添加skill id的字段,为每一个说法都注明其分类,这样将识别的功能放大,在给出识别结果的同时,给出当前说法属于哪一类的信息:skill id。通过skill id直接定位到对应类别的语义进行解析。
图5中所示,input.pcm代表输出当前识别语音。获取识别结果asr feed。根据识别结果asr feed判断其对应的识别类别asr_ret.skillid==nil,即识别类别是否为空,若不为空,则获取识别类别对应的结果字段或结果数据,dui_nul feed asr.skillid。在获得结果字段或结果数据后,判断是否为可以输出的结果feed result,若可以,则输出该结果并结束本识别过程。若不可以,则选择执行“导航技能”。
若识别类别asr_ret.skillid==nil,即识别类别为空,则说明当前的识别语音不在预设的识别类别中。如果类别为空,则选择执行“导航技能”。判断当前的识别语音是否在“导航技能”curskill is navi_skill中,若是,则使用navi_nlu feed即为“导航技能”返回导航结果;若否,则使用自然语言的识别方式,对当前识别语音识别,并输出识别结果。
进一步,判断“导航技能”返回导航结果是否能过获得,若能够获得,则输出,若否,则采用其他识别类别对识别语音识别,并获取识别结果is feed result ok,则返回输出结果return reuslt。
通过上述方案,可以明显解决类似技术以下的缺陷:
缺陷一:语义的准确率;由于说法在最初编译的时候就已经标注了用户认定的类集,不存在跑偏到其他类别内进行语义解析。
缺陷二:效率;skill id的定义,可以将识别结果直接定位到对应的语义集合,不会对所有存在的语义进行依次遍历、比较;不需要考虑随着说法、技能的增多从而导致的体验变差的问题。
另外当前方案还支持和兼容了离线导航技能。导航技能作为一个特殊技能是不会有skill id作为标识的;如果识别结果没有skill id,并且当前产品内部包含有导航技能,那么可以认定,当前说法就是导航技能。
示例一:
用户:打开电视
ASR:识别结果:打开电视;skill_id:家电控制
NLU:定位到家电控制进行语义解析
DUI:好的,这就为您打开。
示例二:
用户:导航到苏州
ASR:识别结果:打开电视;skill_id:‘’(无标记,认定为导航技能)
NLU:定位导航技能
DUI:好的,这就为您导航...
作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施方式中的离线语义解析方法对应的程序指令/模块。一个或者多个程序指令存储在非易失性计算机可读存储介质中,当被处理器执行时,执行上述任意方法实施方式中的离线语义解析方法。
非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据离线语义解析装置的使用所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施方式中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至离线语义解析装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施方式还提供一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行上述任一项离线语义解析方法。
图6是本发明实施方式提供的电子设备的结构示意图,如图6所示,该设备包括:一个或多个处理器610以及存储器620,图6中以一个处理器610为例。离线语义解析方法的设备还可以包括:输入装置630和输出装置640。处理器610、存储器620、输入装置630和输出装置640可以通过总线或者其他方式连接,图6中以通过总线连接为例。存储器620为上述的非易失性计算机可读存储介质。处理器610通过运行存储在存储器620中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施方式离线语义解析方法。输入装置630可接收输入的数字或字符信息,以及产生与信息投放装置的用户设置以及功能控制有关的键信号输入。输出装置640可包括显示屏等显示设备。
上述产品可执行本发明实施方式所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施方式中详尽描述的技术细节,可参见本发明实施方式所提供的方法。
作为一种实施方式,上述电子设备可以应用于加密、解密平台中,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个加密处理器能够:
根据多个语言字段获取与其对应的多个功能语义字段。建立多个功能语义字段与多个语言字段的语义对应关系;
在语言模型的gram语法编译内容中,对应多个功能语义字段创建多个语义分类字段skill_id;根据多个语义分类字段skill_id关联多个语义解析;多个语义解析能够获取确定的输出字段;
判断当前字段是否有对应多个语义分类字段skill_id,若是,则根据当前字段、语义对应关系获取对应的当前语义分类字段skill_id;根据当前语义分类字段skill_id通过对应的语义能够解析获取当前输出字段;若否,则根据当前字段及本地的导航解析程序获取导航信息返回字段;导航解析程序能够根据当前字段获得相应的导航位置数据。
本申请实施方式的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器,掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
以上所描述的装置实施方式仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施方式方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施方式或者实施方式的某些部分的方法。
最后应说明的是:以上实施方式仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施方式对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施方式技术方案的精神和范围。

Claims (10)

1.一种离线语义解析方法,包括:
步骤S101,根据多个语言字段获取与其对应的多个功能语义字段;建立所述多个功能语义字段与所述多个语言字段的语义对应关系;
步骤S102,在语言模型的gram语法编译内容中,对应所述多个功能语义字段创建多个语义分类字段skill_id;根据所述多个语义分类字段skill_id关联多个语义解析;所述多个语义解析能够获取确定的输出字段;
步骤S103,判断当前字段是否有对应多个语义分类字段skill_id,若是,则转到步骤S104,若否,则转到步骤S105;
步骤S104,根据所述当前字段、所述语义对应关系获取对应的当前语义分类字段skill_id;根据所述当前语义分类字段skill_id通过对应的语义能够解析获取当前输出字段;
步骤S105,根据当前字段及本地的导航解析程序获取导航信息返回字段;所述导航解析程序能够根据所述当前字段获得相应的导航位置数据。
2.根据权利要求1所述的方法,其中,所述步骤S103包括:
步骤S1031,根据所述当前字段及所述语义对应关系,获取对应的语义分类字段skill_id;
步骤S1032,判断所述语义分类字段skill_id是否为空,若否,则转到步骤S104,若是,则转到步骤S105。
3.根据权利要求1所述的方法,其中,所述步骤S104包括:
判断所述当前语义分类字段skill_id通过对应的语义解析是否能够获取当前输出字段,若能够,则输出所述当前输出字段;若不能够,则转到所述步骤S105。
4.根据权利要求1或3所述的方法,其中,所述导航解析程序对应导航解析语义;所述语义对应关系中包括导航解析语义与语言字段的对应关系;
所述步骤S105中包括:
步骤S1051,根据所述当前字段获取对应的当前功能语义;
步骤S1052,判断所述当前功能语义是否为导航解析语义,若是,则根据当前字段及本地的导航解析程序获取导航信息返回字段;若否,则通过自然语言识别所述当前字段获取当前自然语言识别结果。
5.根据权利要求4所述的方法,其中,所述步骤S1052中还包括:
判断所述自然语言识别结果是否为有效结果,若是有效结果,则输出所述自然语言识别结果为当前输出字段;若不是有效结果,则将所述自然语言识别结果作为导航解析参数生成导航结果;根据所述导航结果更新所述导航解析程序。
6.根据权利要求1所述的方法,其中,所述多个语言字段为第一类多个语言字段;所述多个语义分类字段skill_id为与所述第一类语言字段对应的第一类语义分类字段skill_id。
7.根据权利要求6所述的方法,其中,还包括:第二类多个语言字段及与所述第二类语言字段对应的第二类语义分类字段skill_id。
8.根据权利要求7所述的方法,其中,所述步骤S105中还包括:
判断所述导航位置数据是否为有效数据,若是,则输出所述导航位置数据;若否,则所述当前字段及所述第二类语义分类字段skill_id通过对应的语义能够解析获取第二输出字段;将所述第二输出字段作为当前输出字段。
9.一种离线语义解析系统,其中,包括:语义分类字段建立单元及解析单元,其中,所述语义分类字段建立单元配置为:
根据多个语言字段获取与其对应的多个功能语义字段;建立所述多个功能语义字段与所述多个语言字段的语义对应关系;
在语言模型的gram语法编译内容中,对应所述多个功能语义字段创建多个语义分类字段skill_id;根据所述多个语义分类字段skill_id关联多个语义解析;所述多个语义解析能够获取确定的输出字段;
所述解析单元包括:一个解析单元及一个导航单元;所述解析单元配置为:
判断当前字段是否有对应多个语义分类字段skill_id,若是,则转到解析单元,若否,则转到导航单元;
所述解析单元,配置为根据所述当前字段、所述语义对应关系获取对应的当前语义分类字段skill_id;根据所述当前语义分类字段skill_id通过对应的语义能够解析获取当前输出字段;
所述导航单元,配置为根据当前字段及本地的导航解析程序获取导航信息返回字段;所述导航解析程序能够根据所述当前字段获得相应的导航位置数据。
10.根据权利要求9所述的系统,其中:
所述解析单元还配置为:
根据所述当前字段及所述语义对应关系,获取对应的语义分类字段skill_id;
判断所述语义分类字段skill_id是否为空,若否,则转到所述解析单元,若是,则转到所述导航单元;
所述解析单元,还配置为判断所述当前语义分类字段skill_id通过对应的语义解析是否能够获取当前输出字段,若能够,则输出所述当前输出字段;若不能够,则转到所述导航单元;
所述导航解析程序对应导航解析语义;所述语义对应关系中包括导航解析语义与语言字段的对应关系;
所述导航单元,还配置为根据所述当前字段获取对应的当前功能语义;判断所述当前功能语义是否为导航解析语义,若是,则根据当前字段及本地的导航解析程序获取导航信息返回字段;若否,则通过自然语言识别所述当前字段获取当前自然语言识别结果;
所述导航单元,还配置为判断所述自然语言识别结果是否为有效结果,若是有效结果,则输出所述所述自然语言识别结果为当前输出字段;若不是有效结果,则将所述自然语言识别结果作为导航解析参数生成导航结果;根据所述导航结果更新所述导航解析程序;
所述多个语言字段为第一类多个语言字段;所述多个语义分类字段skill_id为与所述第一类语言字段对应的第一类语义分类字段skill_id;
第二类多个语言字段及与所述第二类语言字段对应的第二类语义分类字段skill_id;
所述导航单元,还配置为判断所述导航位置数据是否为有效数据,若是,则输出所述导航位置数据;若否,则所述当前字段及所述第二类语义分类字段skill_id通过对应的语义能够解析获取第二输出字段;将所述第二输出字段作为当前输出字段。
CN202010705844.1A 2020-07-21 2020-07-21 离线语义解析方法及系统 Active CN111797636B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010705844.1A CN111797636B (zh) 2020-07-21 2020-07-21 离线语义解析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010705844.1A CN111797636B (zh) 2020-07-21 2020-07-21 离线语义解析方法及系统

Publications (2)

Publication Number Publication Date
CN111797636A true CN111797636A (zh) 2020-10-20
CN111797636B CN111797636B (zh) 2023-06-16

Family

ID=72808105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010705844.1A Active CN111797636B (zh) 2020-07-21 2020-07-21 离线语义解析方法及系统

Country Status (1)

Country Link
CN (1) CN111797636B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108563633A (zh) * 2018-03-29 2018-09-21 腾讯科技(深圳)有限公司 一种语音处理方法和服务器
CN109671421A (zh) * 2018-12-25 2019-04-23 苏州思必驰信息科技有限公司 离线导航的定制和实现方法及装置
CN109918678A (zh) * 2019-03-22 2019-06-21 阿里巴巴集团控股有限公司 一种字段含义识别方法和装置
CN110136713A (zh) * 2019-05-14 2019-08-16 苏州思必驰信息科技有限公司 用户在多模态交互中的对话方法及系统
CN110705267A (zh) * 2019-09-29 2020-01-17 百度在线网络技术(北京)有限公司 语义解析方法、装置及存储介质
CN111144128A (zh) * 2019-12-26 2020-05-12 北京百度网讯科技有限公司 语义解析方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108563633A (zh) * 2018-03-29 2018-09-21 腾讯科技(深圳)有限公司 一种语音处理方法和服务器
CN109671421A (zh) * 2018-12-25 2019-04-23 苏州思必驰信息科技有限公司 离线导航的定制和实现方法及装置
CN109918678A (zh) * 2019-03-22 2019-06-21 阿里巴巴集团控股有限公司 一种字段含义识别方法和装置
CN110136713A (zh) * 2019-05-14 2019-08-16 苏州思必驰信息科技有限公司 用户在多模态交互中的对话方法及系统
CN110705267A (zh) * 2019-09-29 2020-01-17 百度在线网络技术(北京)有限公司 语义解析方法、装置及存储介质
CN111144128A (zh) * 2019-12-26 2020-05-12 北京百度网讯科技有限公司 语义解析方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李国法 等: "智能汽车决策中的驾驶行为语义解析关键技术", 《汽车安全与节能学报》 *

Also Published As

Publication number Publication date
CN111797636B (zh) 2023-06-16

Similar Documents

Publication Publication Date Title
CN110442701B (zh) 语音对话处理方法及装置
CN107909998B (zh) 语音指令处理方法、装置、计算机设备和存储介质
CN107146612B (zh) 语音引导方法、装置、智能设备及服务器
CN111049996A (zh) 多场景语音识别方法及装置、和应用其的智能客服系统
CN110164435A (zh) 语音识别方法、装置、设备及计算机可读存储介质
CN107526809B (zh) 基于人工智能推送音乐的方法和装置
CN109767763B (zh) 自定义唤醒词的确定方法和用于确定自定义唤醒词的装置
CN107015964B (zh) 面向智能机器人开发的自定义意图实现方法及装置
CN111063353B (zh) 允许自定义语音交互内容的客户端处理方法及用户终端
CN109637536B (zh) 一种自动化识别语义准确性的方法及装置
CN107908743B (zh) 人工智能应用构建方法和装置
CN111292751A (zh) 语义解析方法及装置、语音交互方法及装置、电子设备
CN111142993A (zh) 一种信息获取方法、终端及计算机存储介质
CN116821290A (zh) 面向多任务对话的大语言模型训练方法和交互方法
CN111681658A (zh) 车载app的语音控制方法和装置
CN115148212A (zh) 一种语音交互方法、智能设备及系统
CN112837683B (zh) 语音服务方法及装置
CN110058916A (zh) 一种语音功能跳转方法、装置、设备及计算机存储介质
EP3843090B1 (en) Method and apparatus for outputting analysis abnormality information in spoken language understanding
CN109273004B (zh) 基于大数据的预测性语音识别方法及装置
CN110286893B (zh) 服务生成方法、装置、设备、系统和存储介质
CN109712622B (zh) 用于语音对话平台的语音交互异常处理的配置方法及系统
CN111797636A (zh) 离线语义解析方法及系统
CN113360630B (zh) 交互信息提示方法
CN114596840A (zh) 语音识别方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant after: Sipic Technology Co.,Ltd.

Address before: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant before: AI SPEECH Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant