CN109543192A - 自然语言解析方法、装置、设备及存储介质 - Google Patents

自然语言解析方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109543192A
CN109543192A CN201811459555.7A CN201811459555A CN109543192A CN 109543192 A CN109543192 A CN 109543192A CN 201811459555 A CN201811459555 A CN 201811459555A CN 109543192 A CN109543192 A CN 109543192A
Authority
CN
China
Prior art keywords
natural language
customized
analysis
understanding module
language understanding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811459555.7A
Other languages
English (en)
Other versions
CN109543192B (zh
Inventor
张贺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen China Investment Co Ltd
Mobvoi Innovation Technology Co Ltd
Original Assignee
Beijing Yushanzhi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yushanzhi Information Technology Co Ltd filed Critical Beijing Yushanzhi Information Technology Co Ltd
Priority to CN201811459555.7A priority Critical patent/CN109543192B/zh
Publication of CN109543192A publication Critical patent/CN109543192A/zh
Application granted granted Critical
Publication of CN109543192B publication Critical patent/CN109543192B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例公开了一种自然语言解析方法、装置、设备及存储介质。其中,方法包括:获取自然语言文本;获取定制自然语言理解模块中,至少一个解析类别分别对应的定制化参数;如果解析类别对应的定制化参数包括非自定义参数和非定制参数,采用通用自然语言理解模块中,所述解析类别对应的解析模型对所述自然语言文本进行解析,本发明实施例当通用自然语言理解模块中对这些解析模型进行优化或更新后,通过采用通用自然理解模块中的模型进行解析,从而实现定制自然语言理解模块的同步优化或更新,降低维护成本。

Description

自然语言解析方法、装置、设备及存储介质
技术领域
本发明实施例涉及自然语言处理技术领域,特别是涉及一种自然语言解析方法、装置、设备及存储介质。
背景技术
任务型人机对话系统一般包括语音识别模块、自然语言理解模块、对话管理模块、自然语言生成模块以及语音合成模块。其中,自然语言理解模块用于对语音识别模块输出的自然语言文本进行语义解析,将非结构化的自然语言文本解析为符合自然语言理解协议的结构化知识。
目前,任务型人机对话系统已经被成功应用到多种类型的设备中,例如:手机、音箱、电视和可穿戴设备等。然而,一套自然语言理解模块难以满足不同场景不同设备的需求,现有技术一般通过复制通用自然语言理解模块的方式来完成。
复制通用自然语言理解模块会导致产生多个互相独立的自然语言理解模块,这样会导致以下技术缺陷:当更新或优化通用自然语言理解模块的时候,无法同步更新或优化通用自然语言理解模块的副本;各个自然语言处理模块仍然需要单独维护,导致系统的维护成本高。
发明内容
有鉴于此,本发明实施例提供了一种自然语言解析方法、装置、设备及存储介质,主要目的在于实现自然语言理解模块的同步优化或更新,降低维护成本。
为了解决上述问题,本发明实施例主要提供如下技术方案:
第一方面,本发明实施例提供了一种自然语言解析方法,该方法包括:
获取自然语言文本;
获取定制自然语言理解模块中,至少一个解析类别分别对应的定制化参数;
如果解析类别对应的定制化参数包括非自定义参数和非定制参数,采用通用自然语言理解模块中,所述解析类别对应的解析模型对所述自然语言文本进行解析。
第二方面,本发明实施例还提供一种自然语言解析装置,该装置包括:
第一获取模块,用于获取自然语言文本;
第二获取模块,用于获取定制自然语言理解模块中,至少一个解析类别分别对应的定制化参数;
第一解析模块,用于如果解析类别对应的定制化参数包括非自定义参数和非定制参数,采用通用自然语言理解模块中,所述解析类别对应的解析模型对所述自然语言文本进行解析。
第三方面,本发明实施例还提供一种电子设备,包括:
至少一个处理器;
以及与所述处理器连接的至少一个存储器、总线;其中,
所述处理器、存储器通过所述总线完成相互间的通信;
所述处理器用于调用所述存储器中的程序指令,以执行任一实施例所述的自然语言解析方法。
第四方面,本发明实施例还提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行任一实施例所述的自然语言解析方法。
借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
本发明实施例中,定制自然语言理解模块中至少一个解析类别分别对应定制化参数,标明了各解析类别是否是增加的、是否是定制的;如果解析类别对应的定制化参数包括非自定义参数和非定制参数,采用通用自然语言理解模块中,所述解析类别对应的解析模型对所述自然语言文本进行解析,则实现了通用自然语言理解模块中解析模型的复用,这使得定制自然语言理解模块中无需复制非自定义的、非定制的解析模型,这些解析模型只需在通用自然理解模块中进行维护即可,降低维护成本;而且,当通用自然语言理解模块中对这些解析模型进行优化或更新后,通过采用通用自然理解模块中的模型进行解析,从而实现定制自然语言理解模块的同步优化或更新。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明实施例的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例一提供的一种自然语言解析方法的流程图;
图2是本发明实施例二提供的一种自然语言解析方法的流程图;
图3a是本发明实施例三提供的一种自然语言解析方法的流程图;
图3b是本发明实施例三提供的一种通用自然语言理解模块中第一版解析类别的示意图;
图3c是本发明实施例三提供的一种定制自然语言理解模块中第一版解析类别的示意图;
图3d是本发明实施例三提供的一种通用自然语言理解模块中第二版解析类别的示意图;
图3e是本发明实施例三提供的一种定制自然语言理解模块中第二版解析类别的示意图;
图4是本发明实施例四提供的一种自然语言解析装置的结构示意图;
图5是本发明实施例五提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
图1是本发明实施例一提供的一种自然语言解析方法的流程图,本实施例适用于任务型人机对话系统中,采用定制自然语言理解模块和通用自然语言理解模型协同对自然语言文本进行解析的情况,其中,自然语言理解模型可以是基于统计模型得到的,也可以是基于规则的语法分析得到的。本发明实施例提供的方法可以应用于手机、电视、音箱、可穿戴设备等应用场景,也可以应用于智能客服,儿童机器人,智能车载系统等应用场景。
本实施例提供的方法可以由自然语言解析装置执行,该装置可以由硬件和/或软件构成,并一般集成在电子设备中。结合图1,本实施例提供的方法包括以下操作:
S110、获取自然语言文本。
任务型人机对话系统一般包括语音识别模块、自然语言理解模块、对话管理模块、自然语言生成模块以及语音合成模块。其中,语音识别模块用于对输入的语言信号进行识别得到自然语言文本,例如“播放周杰伦的七里香”、“导航去天安门”等,即通过语音识别模块获取自然语言文本。当然,也可以直接向该装置中输入自然语言文本,以获取到自然语言文本。
S120、获取定制自然语言理解模块中,至少一个解析类别分别对应的定制化参数。
本实施例中的任务型人机对话系统包括通用自然语言理解模块和定制自然语言理解模块。通用自然语言理解模块包括至少一个解析类别对应的解析模型。一般情况下,解析类别与解析模型具有一一对应关系,当然,多个解析类别也可以对应一个多功能的解析模型,本发明不限于此。
由于通用自然语言理解模块难以满足不同设备、不同场景的需求,则根据设备需求和场景需求设置新的自然语言理解模块,称为定制自然语言理解模块。定制自然语言理解模块包括在通用自然语言理解模块的基础上增加的解析模型,和/或,对通用自然语言理解模块中解析模型进行定制的解析模型。其中,解析模型与解析类别也具有对应关系。
为了清楚标明哪些解析模型是增加的,哪些解析模型是定制的,对定制自然语言理解模型设置配置信息。配置信息包括至少一个解析类别中各解析类别分别对应的定制化参数,其中,定制化参数包括自定义参数或者非自定义参数,以及,定制参数或者非定制参数。
自定义参数表示对应解析类别是增加的,则该解析类别对应的解析模型仅存在于定制自然语言理解模块中。非自定义参数表示对应的解析类别继承自通用自然语言理解模块。定制参数表示对应解析类别是定制的。非定制参数表示对应解析类别不是定制的。值得说明的,如果解析类别对应非自定义参数,则会同时对应定制参数或者非定制参数;如果解析类别对应自定义参数,则不对应定制参数或者非定制参数。
S130、判断解析类别对应的定制化参数是否包括非自定义参数和非定制参数,如果包括,跳转到S131。
S131、采用通用自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析。
可选地,遍历各个解析类别,判断各解析类别对应的定制化参数是否包括非自定义参数和非定制参数。
如果一解析类别对应的定制化参数包括非自定义参数和非定制参数,则说明该解析类别继承自通用自然语言理解模块,且未进行定制,则采用通用自然语言理解模块中,该解析类别对应的解析模型进行解析。正是由于直接采用通用自然语言理解模块进行解析,则定制自然语言理解模块中不必包括对应非自定义参数和非定制参数的解析模型,只需要包括对应的解析类别即可。
可选地,相反,如果解析类别对应的定制化参数不包括非自定义参数,也不包括非定制参数,则采用定制自然语言理解模块中对应的解析模型进行解析。
本实施例中,定制自然语言理解模块中至少一个解析类别分别对应定制化参数,标明了各解析类别是否是增加的、是否是定制的;如果解析类别对应的定制化参数包括非自定义参数和非定制参数,采用通用自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析,则实现了通用自然语言理解模块中解析模型的复用,这使得定制自然语言理解模块中无需复制非自定义的、非定制的解析模型,这些解析模型只需在通用自然理解模块中进行维护即可,降低维护成本;而且,当通用自然语言理解模块中对这些解析模型进行优化或更新后,通过采用通用自然理解模块中的模型进行解析,从而实现定制自然语言理解模块的同步优化或更新。
实施例二
图2是本发明实施例二提供的一种自然语言解析方法的流程图。本实施例对上述实施例的各可选实施方式的基础上进一步优化,可选地,解析类别包括:领域意图和/或语义槽;领域意图对应的解析模型包括领域意图分类模型,语义槽对应的解析模型包括语义槽标注模型;可选地,追加操作:如果解析类别对应的定制化参数包括自定义参数,采用定制自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析;或者,如果解析类别对应的定制化参数包括非自定义参数和定制参数,采用定制自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析,从而完善自然语言解析方法。结合图2,本实施例提供的方法包括以下操作:
S210、获取自然语言文本。
S220、获取定制自然语言理解模块中,至少一个解析类别分别对应的定制化参数。
自然语言理解协议一般包括垂直领域,领域意图,语义槽三类信息。
一个任务型人机对话系统包含一个或多个垂直领域,垂直领域表示自然语言文本所属领域,例如:自然语言文本“播放周杰伦的七里香”属于音乐领域、自然语言文本“查看明天北京的天气”属于天气领域、自然语言文本“导航去天安门”属于导航领域;此外,垂直领域还包括火车票领域、飞机票领域、餐馆领域等。
一个垂直领域包括至少一个领域意图,领域意图表示在垂直领域内,自然语言文本的具体意图。例如,在天气领域中,自然语言文本“明天北京下雨吗”属于询问是否下雨的意图、自然语言文本“今天空气质量好不好”属于询问空气质量的意图、自然语言文本“北京刮风呢吗”属于询问是否有风的意图。
一个垂直领域包括零个或者至少一个语义槽,语义槽表示在垂直领域内,自然语言文本限定的具体条件。例如,在天气领域中,一般包括“时间”和“地点”两种语义槽,自然语言文本“明天北京下雨吗”限定了“时间”条件为“明天”以及“地点”条件为“北京”。又例如自然语言文本“今天空气质量好不好”限定了“时间”条件为“今天”、自然语言文本“北京刮风呢吗”限定了“地点”条件为“北京”。
综上分析,本实施例中,解析类别包括:领域意图和/或语义槽;领域意图对应的解析模型包括领域意图分类模型,语义槽对应的解析模型包括语义槽标注模型。领域意图分类模型用于对自然语言文本进行领域分类,语义槽标注模型用于从自然语言文本中标注语义槽,从而实现对自然语言文本的解析。
S230、判断解析类别对应的定制化参数是否包括非自定义参数或者自定义参数,如果包括自定义参数,跳转到S231,如果包括非自定义参数,跳转到S232。
S231、采用定制自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析。
S232、判断解析类别对应的定制化参数是否包括非定制参数或者定制参数,如果包括非定制参数,跳转到S240、如果包括定制参数,跳转到S231。
S240、采用通用自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析。
在一示例中,定制化参数包括是否自定义和是否定制,进一步还包括定制类型。如果是否自定义取值为“真”,则表示自定义参数,即该解析类别是增加的,其对应的解析模型仅存在于定制自然语言理解模块中,则采用定制自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析。如果是否自定义取值为“假”,则表示非自定义参数,即该解析类别继承自通用自然语言理解模块。
进一步地,如果是否定制为“真”则表示定制参数,即该解析类别对应的解析模型在通用自然语言理解模块中对应解析模型的基础上进行了定制,则采用定制自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析。如果是否定制为“假”则表示非定制参数,则该解析类别未进行定制,则直接采用通用自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析。
可选地,定制类型表示解析类别为定制的情况下,采用的定制类型,定制类型包括扩展或者覆盖。定制类型主要用于模型训练的过程中。
本实施例中,通过如果解析类别对应的定制化参数包括自定义参数,采用定制自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析;或者,如果解析类别对应的定制化参数包括非自定义参数和定制参数,采用定制自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析,从而通过是否自定义和是否定制,确定解析模型,从而实现了通用自然语言理解模块中解析模型的复用;同时,通过自定义模型和定制模型,使得定制自然语言理解模块能够应用于多种设备和多种场景中。
实施例三
图3a是本发明实施例三提供的一种自然语言解析方法的流程图。本实施例在上述各实施例的各可选实施方式的基础上进一步优化。可选地,在获取定制自然语言理解模块中,至少一个解析类别分别对应的定制化参数之前,还包括定制化参数的确定过程,以及解析模型的训练过程。结合图3a,本发明实施例提供的方法包括以下操作:
S310、获取自然语言文本。继续执行S320和S350。
S320、确定定制自然语言理解模块中,继承自通用自然语言理解模块的第一解析类别。
为了方便描述和区分,将继承自通用自然语言理解模型的解析类别称为第一解析类别,将非继承自通用自然语言理解模块的解析类别称为第二解析类别。
可选地,当通用自然语言理解模块中,解析类别进行更新或者优化后,由于继承关系,定制自然语言理解模块中对应的第一解析类别自动进行更新或者优化。
S330、令第一解析类别对应非自定义参数。
S340、判断是否对第一解析类别进行定制,如果进行定制,跳转到S341,如果未进行定制,则跳转到S344。
S341、令第一解析类别对应定制参数和定制类型参数。
S342、根据定制类型参数,确定对第一解析类别对应的解析模型进行训练的训练预料。
如果研发人员对第一解析类别进行定制,则需要对第一解析类别对应的解析模型进行训练。根据定制类型的不同,训练语料不同。
可选地,定制类型包括扩展和覆盖。如果定制类型参数包括覆盖,确定定制自然语言理解模块中,第一解析类别对应的训练语料;如果定制类型参数包括扩展,确定定制自然语言理解模块中,第一解析类别对应的训练语料,以及通用自然语言理解模块中,第一解析类别对应的训练语料。
其中,定制自然语言理解模块中,每个领域意图都有相应的训练语料用于训练领域意图分类模型。每个垂直领域都有相应的训练语料用于训练语义槽标注模型。
S343、根据训练预料,对第一解析类别对应的解析模型进行训练。继续执行S380。
S344、令第一解析类别对应非定制参数。继续执行S380。
如果研发人员未对第一解析类别进行定制,则定制自然语言理解模块中不具有具有第一解析类别的解析模型,也就不需要对第一解析类别对应的解析模型进行训练。
S350、确定定制自然语言理解模块中,非继承自通用自然语言理解模块的第二解析类别。
如果解析类别非继承自通用自然语言理解模块,说明该解析类别,即第二解析类别是新增加的,则第二解析类别对应的解析模型需要训练。
S360、令第二解析类别对应自定义参数。
S370、采用定制自然语言理解模块中,第二解析类别对应的训练语料,训练第二解析类别对应的解析模型。继续执行S380。
S380、获取定制自然语言理解模块中,至少一个解析类别分别对应的定制化参数。
S390、如果解析类别对应的定制化参数包括非自定义参数和非定制参数,采用通用自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析。
值得说明的是,S320-S344可以与S350-S370并行执行,也可以顺序执行,顺序执行时,可以先执行S320-S344,也可以先执行S350-S370。S320和S350可以在S310之前执行,也可以在S310之后执行。
下面结合图3b、图3c、图3d和图3e,以一具体实施方式详细说明本发明实施例提供的自然语言解析方法。
图3b是本发明实施例三提供的一种通用自然语言理解模块中第一版解析类别的示意图。图3b中的垂直领域包括天气领域和音乐领域。天气领域中的领域意图包括“是否下雨”和“一般查询”,语义槽包括“时间”和“地点”。音乐领域中的领域意图包括“播放音乐”和“收藏音乐”,语义槽包括“歌手姓名”和“歌曲名称”。
图3c是本发明实施例三提供的一种定制自然语言理解模块中第一版解析类别的示意图。图3c中的解析类别继承自图3b中的解析类别,并对部分解析类别进行了定制,用虚线框标出。其他继承自图3b、且未进行定制的解析类别用实线框标出。具体地,在天气领域中增加自定义领域意图“空气质量”,对原领域意图“是否下雨”进行定制;在音乐领域中增加自定义语义槽“专辑名称”、对原领域意图“收藏音乐”进行定制。根据本发明实施例提供的方法,“空气质量”对应的定制化参数包括自定义参数,“是否下雨”对应的定制化参数包括非自定义参数和定制参数,“专辑名称”对应的定制化参数包括自定义参数,“收藏音乐”对应的定制化参数包括非自定义参数和定制参数,其他的领域意图和语义槽对应的定制化参数包括非自定义参数和非定制参数。基于此,天气领域中的领域意图“一般查询”、语义槽“时间”和“地点”,音乐领域中的领域意图“播放音乐”、语义槽“歌手姓名”和“歌曲名称”,采用通用自然语言理解模块中对应的领域意图分类模型和语义槽标注模型,对自然语言文本进行解析。
图3d是本发明实施例三提供的一种通用自然语言理解模块中第二版解析类别的示意图。第二版在第一版的基础上经过优化和更新。具体地,在天气领域中优化领域意图“一般查询”以及对应的模型,新增领域意图“是否刮风”以及对应的模型,在音乐领域中新增语义槽“歌曲风格”以及对应的模型。
图3e是本发明实施例三提供的一种定制自然语言理解模块中第二版解析类别的示意图。由于定制自然语言理解模型继承自通用自然语言理解模块,则在定制自然语言理解模块中第一版解析类别的基础上自动增加了“是否刮风”和“歌曲风格”,同步优化“一般查询”。根据本发明实施例提供的方法,“是否刮风”、“歌曲风格”和“一般查询”对应的定制化参数均包括非自定义参数和非定制参数,这些需要采用通用自然语言理解模块中对应的领域意图分类模型和语义槽标注模型,对自然语言文本进行解析。
综上,在定制自然语言理解模块中第二版解析类别中,除了天气领域中定制的领域意图“是否下雨”、领域意图“空气质量”,音乐领域中定制的领域意图“收藏音乐”、语义槽“专辑名称”,其他领域意图和语义槽都与通用自然语言理解模块同时迭代更新,并采用通用自然语言理解模块的对应模型进行解析。
本实施例中,一方面,在训练或者更新、优化定制自然语言理解模块中解析类别的过程中,当优化或者更新通用自然语言理解模块中的解析类别时,基于继承关系,可以同步优化和更新定制自然语言理解模块中对应的解析类别,降低模块的维护成本。另一方面,在解析自然语言文本的过程中,当通用自然语言理解模块中对非自定义、非定制的解析模型进行优化或更新后,通过采用通用自然理解模块中的这些模型进行解析,从而实现定制自然语言理解模块的同步优化或更新,降低模块的维护成本。
实施例四
图4是本发明实施例四提供的一种自然语言解析装置的结构示意图。本实施例适用于任务型人机对话系统中,采用定制自然语言理解模块和通用自然语言理解模型协同对自然语言文本进行解析的情况。结合图4,本实施例提供的装置包括:第一获取模块41、第二获取模块42和第一解析模块43。
第一获取模块41,用于获取自然语言文本;
第二获取模块42,用于获取定制自然语言理解模块中,至少一个解析类别分别对应的定制化参数;
第一解析模块43,用于如果解析类别对应的定制化参数包括非自定义参数和非定制参数,采用通用自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析。
本实施例中,定制自然语言理解模块中至少一个解析类别分别对应定制化参数,标明了各解析类别是否是增加的、是否是定制的;如果解析类别对应的定制化参数包括非自定义参数和非定制参数,采用通用自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析,则实现了通用自然语言理解模块中解析模型的复用,这使得定制自然语言理解模块中无需复制非自定义的、非定制的解析模型,这些解析模型只需在通用自然理解模块中进行维护即可,降低维护成本;而且,当通用自然语言理解模块中对这些解析模型进行优化或更新后,通过采用通用自然理解模块中的模型进行解析,从而实现定制自然语言理解模块的同步优化或更新。
可选地,解析类别包括:领域意图和/或语义槽。领域意图对应的解析模型包括领域意图分类模型,语义槽对应的解析模型包括语义槽标注模型。
可选地,该装置还包括第二解析模块或者第三解析模块。其中,第二解析模块用于如果解析类别对应的定制化参数包括自定义参数,采用定制自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析;第三解析模块用于如果解析类别对应的定制化参数包括非自定义参数和定制参数,采用定制自然语言理解模块中,解析类别对应的解析模型对自然语言文本进行解析。
可选地,该装置还包括继承模块,用于在获取定制自然语言理解模块中,至少一个解析类别分别对应的定制化参数之前,确定定制自然语言理解模块中,继承自通用自然语言理解模块的第一解析类别;令第一解析类别对应非自定义参数;如果未对第一解析类别进行定制,则令第一解析类别对应非定制参数。
可选地,该装置还包括训练模块,用于如果对第一解析类别进行定制,则令第一解析类别对应定制参数和定制类型参数;根据定制类型参数,确定对第一解析类别对应的解析模型进行训练的训练预料;根据训练预料,对第一解析类别对应的解析模型进行训练。
可选地,训练模块在根据定制类型参数,确定对第一解析类别对应的解析模型进行训练的训练预料时,具体用于:如果定制类型参数包括覆盖,确定定制自然语言理解模块中,第一解析类别对应的训练语料;或者,如果定制类型参数包括扩展,确定定制自然语言理解模块中,第一解析类别对应的训练语料,以及通用自然语言理解模块中,第一解析类别对应的训练语料。
可选地,该装置还包括自定义模块,用于确定定制自然语言理解模块中,非继承自通用自然语言理解模块的第二解析类别;令第二解析类别对应自定义参数;采用定制自然语言理解模块中,第二解析类别对应的训练语料,训练第二解析类别对应的解析模型。
由于本实施例所介绍的自然语言解析装置为可以执行本发明实施例中的自然语言解析方法的装置,故而基于本发明实施例中所介绍的自然语言解析方法,本领域所属技术人员能够了解本实施例的自然语言解析装置的具体实施方式以及其各种变化形式,所以在此对于该自然语言解析装置如何实现本发明实施例中的自然语言解析方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中自然语言解析方法所采用的装置,都属于本申请所欲保护的范围。
实施例五
本发明实施例提供了一种电子设备,如图5所示,包括:至少一个处理器(processor)51;以及与处理器51连接的至少一个存储器(memory)52、总线53。
其中,处理器51、存储器52通过总线53完成相互间的通信;
处理器51用于调用存储器52中的程序指令,以执行上述方法实施例中的步骤。
实施例六
本实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种自然语言解析方法,其特征在于,包括:
获取自然语言文本;
获取定制自然语言理解模块中,至少一个解析类别分别对应的定制化参数;
如果解析类别对应的定制化参数包括非自定义参数和非定制参数,采用通用自然语言理解模块中,所述解析类别对应的解析模型对所述自然语言文本进行解析。
2.根据权利要求1所述的方法,其特征在于,
所述解析类别包括:领域意图和/或语义槽;
领域意图对应的解析模型包括领域意图分类模型,语义槽对应的解析模型包括语义槽标注模型。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果解析类别对应的定制化参数包括自定义参数,采用定制自然语言理解模块中,所述解析类别对应的解析模型对所述自然语言文本进行解析;或者,
如果解析类别对应的定制化参数包括非自定义参数和定制参数,采用定制自然语言理解模块中,所述解析类别对应的解析模型对所述自然语言文本进行解析。
4.根据权利要求1-3任一项所述的方法,其特征在于,在所述获取定制自然语言理解模块中,至少一个解析类别分别对应的定制化参数之前,还包括:
确定定制自然语言理解模块中,继承自通用自然语言理解模块的第一解析类别;
令所述第一解析类别对应非自定义参数;
如果未对第一解析类别进行定制,则令第一解析类别对应非定制参数。
5.根据权利要求4所述的方法,其特征在于,还包括:
如果对第一解析类别进行定制,则令第一解析类别对应定制参数和定制类型参数;
根据定制类型参数,确定对第一解析类别对应的解析模型进行训练的训练预料;
根据所述训练预料,对所述第一解析类别对应的解析模型进行训练。
6.根据权利要求5所述的方法,其特征在于,所述根据定制类型参数,确定对第一解析类别对应的解析模型进行训练的训练预料,包括:
如果定制类型参数包括覆盖,确定定制自然语言理解模块中,第一解析类别对应的训练语料;或者,
如果定制类型参数包括扩展,确定定制自然语言理解模块中,第一解析类别对应的训练语料,以及通用自然语言理解模块中,第一解析类别对应的训练语料。
7.根据权利要求4所述的方法,其特征在于,在所述获取定制自然语言理解模块中,至少一个解析类别分别对应的定制化参数之前,还包括:
确定定制自然语言理解模块中,非继承自通用自然语言理解模块的第二解析类别;
令所述第二解析类别对应自定义参数;
采用定制自然语言理解模块中,第二解析类别对应的训练语料,训练第二解析类别对应的解析模型。
8.一种自然语言解析装置,其特征在于,包括:
第一获取模块,用于获取自然语言文本;
第二获取模块,用于获取定制自然语言理解模块中,至少一个解析类别分别对应的定制化参数;
第一解析模块,用于如果解析类别对应的定制化参数包括非自定义参数和非定制参数,采用通用自然语言理解模块中,所述解析类别对应的解析模型对所述自然语言文本进行解析。
9.一种电子设备,其特征在于,包括:
至少一个处理器;
以及与所述处理器连接的至少一个存储器、总线;其中,
所述处理器、存储器通过所述总线完成相互间的通信;
所述处理器用于调用所述存储器中的程序指令,以执行权利要求1至权利要求7中任一项所述的自然语言解析方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行权利要求1至权利要求7中任一项所述的自然语言解析方法。
CN201811459555.7A 2018-11-30 2018-11-30 自然语言解析方法、装置、设备及存储介质 Active CN109543192B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811459555.7A CN109543192B (zh) 2018-11-30 2018-11-30 自然语言解析方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811459555.7A CN109543192B (zh) 2018-11-30 2018-11-30 自然语言解析方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109543192A true CN109543192A (zh) 2019-03-29
CN109543192B CN109543192B (zh) 2023-05-05

Family

ID=65852090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811459555.7A Active CN109543192B (zh) 2018-11-30 2018-11-30 自然语言解析方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109543192B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110619047A (zh) * 2019-09-16 2019-12-27 出门问问信息科技有限公司 一种自然语言模型的构建方法、装置以及可读存储介质
CN111897916A (zh) * 2020-07-24 2020-11-06 惠州Tcl移动通信有限公司 语音指令识别方法、装置、终端设备及存储介质
CN113299271A (zh) * 2020-02-06 2021-08-24 菜鸟智能物流控股有限公司 语音合成方法、语音交互方法、装置及设备
CN113838467A (zh) * 2021-08-02 2021-12-24 北京百度网讯科技有限公司 语音处理方法、装置及电子设备
CN117573845A (zh) * 2024-01-15 2024-02-20 之江实验室 一种面向跨领域人机协同作业的机器人自然语言理解方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5794050A (en) * 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
CN103268313A (zh) * 2013-05-21 2013-08-28 北京云知声信息技术有限公司 一种自然语言的语义解析方法及装置
CN108021559A (zh) * 2018-02-05 2018-05-11 威盛电子股份有限公司 自然语言理解系统以及语意分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5794050A (en) * 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
CN103268313A (zh) * 2013-05-21 2013-08-28 北京云知声信息技术有限公司 一种自然语言的语义解析方法及装置
CN108021559A (zh) * 2018-02-05 2018-05-11 威盛电子股份有限公司 自然语言理解系统以及语意分析方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110619047A (zh) * 2019-09-16 2019-12-27 出门问问信息科技有限公司 一种自然语言模型的构建方法、装置以及可读存储介质
CN110619047B (zh) * 2019-09-16 2022-09-02 出门问问信息科技有限公司 一种自然语言模型的构建方法、装置以及可读存储介质
CN113299271A (zh) * 2020-02-06 2021-08-24 菜鸟智能物流控股有限公司 语音合成方法、语音交互方法、装置及设备
CN113299271B (zh) * 2020-02-06 2023-12-15 菜鸟智能物流控股有限公司 语音合成方法、语音交互方法、装置及设备
CN111897916A (zh) * 2020-07-24 2020-11-06 惠州Tcl移动通信有限公司 语音指令识别方法、装置、终端设备及存储介质
CN111897916B (zh) * 2020-07-24 2024-03-19 惠州Tcl移动通信有限公司 语音指令识别方法、装置、终端设备及存储介质
CN113838467A (zh) * 2021-08-02 2021-12-24 北京百度网讯科技有限公司 语音处理方法、装置及电子设备
CN113838467B (zh) * 2021-08-02 2023-11-14 北京百度网讯科技有限公司 语音处理方法、装置及电子设备
CN117573845A (zh) * 2024-01-15 2024-02-20 之江实验室 一种面向跨领域人机协同作业的机器人自然语言理解方法
CN117573845B (zh) * 2024-01-15 2024-05-24 之江实验室 一种面向跨领域人机协同作业的机器人自然语言理解方法

Also Published As

Publication number Publication date
CN109543192B (zh) 2023-05-05

Similar Documents

Publication Publication Date Title
CN109543192B (zh) 自然语言解析方法、装置、设备及存储介质
CN109558479B (zh) 一种规则匹配方法、装置、设备及存储介质
CN107210033A (zh) 基于众包来更新用于数字个人助理的语言理解分类器模型
CN107357787B (zh) 语义交互方法、装置及电子设备
CN107590123B (zh) 车载中地点上下文指代消解方法及装置
CN107357933A (zh) 一种用于多源异构科技信息资源的标签描述方法和装置
CN109243468B (zh) 语音识别方法、装置、电子设备及存储介质
CN102096694A (zh) 具有支持组件的显示再现系统
CN111460149B (zh) 文本分类方法、相关设备及可读存储介质
CN107908743A (zh) 人工智能应用构建方法和装置
JP2022028881A (ja) 広告を自動的に生成する方法、装置、機器及びコンピュータ可読記憶媒体
CN116402024A (zh) 一种基于大型语言模型的工程文件生成方法及其系统
CN113515594A (zh) 意图识别方法、意图识别模型训练方法、装置及设备
KR20160041085A (ko) 사용자 맞춤형 콘텐츠 적응 객체 구성 방법, 이를 수행하는 사용자 맞춤형 콘텐츠 적응 객체 구성 서버 및 이를 저장하는 기록매체
CN114925206A (zh) 人工智能体、语音信息识别方法、存储介质和程序产品
CN113488034A (zh) 一种语音信息的处理方法、装置、设备及介质
KR20210063875A (ko) 마케팅 정보 분석 서비스 제공을 위한 프로그램 및 기록매체
CN111462760A (zh) 声纹识别系统、方法、装置及电子设备
CN114881141A (zh) 事件类型分析方法及相关设备
CN113448942B (zh) 数据库访问方法、装置、设备及存储介质
CN110471708B (zh) 基于可重用组件的配置项获取的方法及装置
US20090217156A1 (en) Method for Storing Localized XML Document Values
CN112632962A (zh) 人机交互系统中实现自然语言理解方法和装置
KR20220074571A (ko) 마케팅 지식 그래프의 채널 기반 정보 수집을 위한 딥러닝 sns 콘텐츠 임베딩 방법 및 그 장치
CN112786023A (zh) 标记模型构建方法及语音播报系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20211118

Address after: 210038 8th floor, building D11, Hongfeng science and Technology Park, Nanjing Economic and Technological Development Zone, Jiangsu Province

Applicant after: New Technology Co.,Ltd.

Applicant after: VOLKSWAGEN (CHINA) INVESTMENT Co.,Ltd.

Address before: 100080 Room 501, 5th floor, NO.67, North Fourth Ring Road West, Haidian District, Beijing

Applicant before: Beijing Yufanzhi Information Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant