CN113779962B - 数据处理方法、装置、设备和存储介质 - Google Patents

数据处理方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN113779962B
CN113779962B CN202010525647.1A CN202010525647A CN113779962B CN 113779962 B CN113779962 B CN 113779962B CN 202010525647 A CN202010525647 A CN 202010525647A CN 113779962 B CN113779962 B CN 113779962B
Authority
CN
China
Prior art keywords
model
training
labeling
sentence
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010525647.1A
Other languages
English (en)
Other versions
CN113779962A (zh
Inventor
章波
张月
王睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN202010525647.1A priority Critical patent/CN113779962B/zh
Publication of CN113779962A publication Critical patent/CN113779962A/zh
Application granted granted Critical
Publication of CN113779962B publication Critical patent/CN113779962B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供一种数据处理方法、装置、设备和存储介质,该方法包括:获取训练语句,并将其输入需要训练的句法分析模型。再将句法分析模型输出的句法信息和训练语句一并输入标注模型,以实现对标注模型的训练。根据标注模型输出的标注结果同时调两个模型的整模型参数。可见,标注模型是依靠训练语句以及句法信息才输出标注结果的,因此,根据标注结果反向调整模型参数的过程也会同时影响到前述的两个模型,从而实现两个模型的同时训练,保证了两个模型的训练效果。同时,在标注模型训练过程中还引入了句法信息,这相当于对训练语句进行了句法增强,因此,根据经过句法增强训练语句训练标注模型,进一步保证了模型的训练效果。

Description

数据处理方法、装置、设备和存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据处理方法、装置、设备和存储介质。
背景技术
自然语言处理是人工智能领域中的一个重要研究方向。计算机在具备理解用户产生的自然语言文本的能力后,其的这种理解能力能够在不同的场景中发挥巨大作用。
比如,用户可以在电商平台留下有关商品的评价信息,计算机通过对用户的评价进行语义理解、情感识别,以了解到用户对商品的使用反馈。再比如,用户还可以在门户网站进行事实点评,此时,计算机同样可以通过对用户的留言进行语义理解,从而实现舆情分析。因此,如何保证语句语义理解的准确性就成为一个亟待解决的问题。
发明内容
有鉴于此,本发明实施例提供一种数据处理方法、装置、设备和存储介质,用以保证模型的训练效果。
第一方面,本发明实施例提供一种数据处理方法,包括:
获取训练语句;
将所述训练语句输入句法分析模型,以得到所述训练语句对应的句法信息;
根据所述句法信息以及所述训练语句,训练标注模型;
根据所述标注模型输出的标注结果,调整所述句法分析模型以及所述标注模型各自的模型参数。
第二方面,本发明实施例提供一种数据处理装置,包括:
获取模块,用于获取训练语句;
输入模块,用于将所述训练语句输入句法分析模型,以得到所述训练语句对应的句法信息;
训练模块,用于根据所述句法信息以及所述训练语句,训练标注模型;
调整模块,用于根据所述标注模型输出的标注结果,调整所述句法分析模型以及所述标注模型各自的模型参数。
第三方面,本发明实施例提供一种电子设备,包括处理器和存储器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第一方面中的数据处理方法。该电子设备还可以包括通信接口,用于与其他设备或通信网络通信。
第四方面,本发明实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现如第一方面所述的数据处理方法。
本发明实施例提供的数据处理方法,获取训练语句,并将其输入需要训练的句法分析模型,以由此句法分析模型输出训练语句对应的句法信息。再将句法信息和训练语句一并输入标注模型,以实现对标注模型的训练。最终,根据标注模型输出的标注结果同时调前述两个模型的整模型参数。
根据上述描述可知,一方面,标注模型是依靠两部分内容才输出标注结果的,即依靠训练语句以及句法分析模型输出的句法信息才输出标注结果。因此,根据标注结果反向调整模型参数的过程也会同时影响到这两个模型,使得两个模型训练任务相互影响,实现两个模型的同时训练,保证两个模型的训练效果。另一方面,在训练标注模型的过程中同时使用到了训练语句以及句法分析模型输出的句法信息,此句法信息的引入相当于对训练语句进行了句法增强,因此,根据此经过句法增强训练语句训练标注模型,进一步保证标注模型的训练效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据处理方法的流程图;
图2为本发明实施例提供的一种句法分析模型训练方式的流程图;
图3为本发明实施例提供的另一种数据处理方法的流程图;
图4为与图3所示实施例提供的数据处理方法对应的模型结构示意图;
图5为本发明实施例提供的又一种数据处理方法的流程图;
图6为与图5所示实施例提供的数据处理方法对应的模型结构示意图;
图7为本发明实施例提供的又一种数据处理方法的流程图;
图8为与图7所示实施例提供的数据处理方法对应的模型结构示意图;
图9为本发明实施例提供的又一种数据处理方法的流程图;
图10为本发明实施例提供的数据处理装置的结构示意图;
图11为与图10所示实施例提供的数据处理装置对应的电子设备的结构示意图;
图12为本发明实施例提供的数据处理方法在居家人机交互场景下的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于识别”。类似地,取决于语境,短语“如果确定”或“如果识别(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当识别(陈述的条件或事件)时”或“响应于识别(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
下面对本发明实施例提供的数据处理方法进行说明之前,可以先对该语义理解,特别是情感识别的现实意义进行示例性说明:
正如背景技术中提到的,一种场景,用户可以在电商网站上输入关于已购买商品的评价信息。服务器可以对获得的大量评价信息进行语义理解,其中,语义理解具体可以包括情感识别,以得到大量用户对此商品的使用反馈信息。比如用户喜爱或者不喜爱此商品,商品使用过程中有何种缺点等等。进一步地,可以根据使用反馈信息,对商品进行改进,提高用户的使用体验。
另一种场景,用户还可以在门户网站上输入对于某时事热点的评论信息。服务器通过对大量评论信息进行语义理解,从而实现对此时事热点的舆情分析。
又一种场景,用户还可以对智能机器人输入控制指令。智能机器人通过对控制指令的语义理解,为用户输出应答语句。为了保证用户的使用体验,应答语句具有的情感类型与用户输入的控制指令具有的情感类型相匹配。举例来说,用户输入的控制指令对应于悲伤的情感类型,则智能机器人输出的应答语句可以对应于喜悦的情感类型,从而实现对用户的安慰。
对于上述场景但不仅限于上述场景,其都存在语义理解特别是情感识别的需求,并且在实际应用中,语义理解通常是借助网络模型来实现的。此时,便可以使用本发明提供的方法来实现网络模型的训练,以保证语义理解的准确性。
基于上述描述,下面结合附图对本发明的一些实施方式作详细说明。在各实施例之间不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。另外,下述各方法实施例中的步骤时序仅为一种举例,而非严格限定。
图1为本发明实施例提供的一种数据处理方法的流程图。本发明实施例提供的该数据处理方法可以由处理设备来执行。可以理解的是,该处理设备可以实现为软件、或者软件和硬件的组合。本实施例以及下述各实施例中的处理设备具体来说可以是服务器。本实施例提供的数据处理方法实际上是一种模型训练方法。如图1所示,该方法包括如下步骤:
S101,获取训练语句。
在进行标注模型以及句法分析模型的训练之前,可以预先为标注模型建立第一语料库,为句法分析模型建立第二语料库。其中,两个语料中包含的语句均可以通过互联网得到。此时,获取到的训练语句可以是将第一语料库中的任一语句。
对于第一语料库,根据标注模型的标注需求不同,语料库中包含的每个句子都已经进行了相应标注。
举例来说,标注模型用于对语句进行语义识别,且强调语句的情感类型,则第一语料库中的语句“我爱吃苹果”会进行以下标注:我[holder]爱[expression]吃苹果[target]。其中,holder表示情感发出者,expression表示情感类型,target表示情感表达对象。
标注模型用于对语句进行语义识别,且不强调语句的情感类型,则语句“我爱吃苹果”会进行以下标注:我[Agent]爱[Predicate]吃苹果[Patient]。其中,Agent表示动作发出者,Predicate表示谓语动词,Patient表示动作承受对象。
同理的,对于第二语料库,其中包含的每个语句可以以其对应的依存句法树的形式存在。并且第二语料库中包含的语句可以与第一语料库相同,或者第一语料库可以是第二语料库的子集。
举例来说,语句“我爱吃苹果”被标注为:上述依存句法树表明:“爱”分别与“我”和“吃”具有依存关系,“吃”与“苹果”有依存关系。
S102,将训练语句输入句法分析模型,以得到训练语句对应的句法信息。
将第二语料库中的任一语句即训练语句输入句法分模型,以由句法分析对其进行特征提取,得到训练语句对应的句法信息。其中,句法信息可以表现为不同的形式,比如可以表现为词向量矩阵、概率矩阵或者依存句法树。需要注意的是,输入句法分析模型的训练语句也需要包含于第一语料库中。
对于概率矩阵,可以这样理解:训练语句中包含N个词语,则句法分析模型可以分别得到N个词语各自之间是否存在依存关系的概率值,并由此N*N个概率值组成概率矩阵。进一步的,句法分析可以根据概率矩阵中的元素生成训练语句对应的依存句法树。
承接上述“我爱吃苹果”的举例,训练语句中包括的词语“我”表示为A,“爱”表现为B,“吃”表示为C,“苹果”表现为D,也即是即N=4时,概率矩阵可以表示为:
可选地,还可以对概率矩阵进行归一化处理。然后,再从归一化后的概率矩阵中将概率值大于预设阈值的部分提取出来,并根据提取出的内容生成训练语句的依存关系树。
S103,根据句法信息以及训练语句,训练标注模型。
接着,将提取出的句法信息和表示为词向量矩阵的训练语句一并输入至标注模型中,以实现标注模型的训练。
具体地,当句法分析模型输出的句法信息表现为词向量时,可以直接将两个向量拼接,以将拼接结果输入标注模型。举例来说,假设训练语句包含N个词语,每个词语由D1维数据表示,则训练语句可以表现为N*D1的词向量矩阵;并且句法信息可以表现为N*D2的词向量矩阵,此时输入标注的拼接结果实际上为N*(D1+D2)的词向量矩阵。其中,并不限定D1与D2之间的大小关系。
当句法信息表现为概率矩阵或者关系依次树时,则可以将训练语句的词向量表示和句法信息进行融合,具体融合过程可以参见下图5~图8所示实施例中的相关描述。
可选地,标注模型可以由双向长短期记忆(Bi-directional Long Short-TermMemory,简称BiLSTM)网络以及条件随机场(Conditional Random Field,简称CRF)网络共同构成。
S104,根据标注模型输出的标注结果,调整句法分析模型以及标注模型各自的模型参数。
标注模型能够输出训练语句对应的标注结果。其中,根据标注模型的应用场景不同,标注结果可以是将训练语句中的情感发出者、情感类型以及情感表达对象标注出来,也可以是将训练语句中的动作发出者以及动作承受对象标注出来。
进一步地,还可以根据此标注结果以及预设的损失函数计算损失值,再根据损失值通过反向传播的方式调整模型参数。由于句法分析模型也参与到了标注模型的训练过程中,因此,在反向传播的过程中,可以实现句法分析模型和标注模型各自的模型参数的同时调整,也即是实现了两模型的同时训练。
经过多次参数调整后,可以使句法分析模式和标注模型同时收敛,从而完成模型训练。
本实施例中,一方面,标注模型是依靠的是两部分内容,即依靠训练语句以及句法分析模型输出的句法信息才会输出标注结果。因此,根据标注结果反向调整模型参数的过程也会同时影响到这两个模型,使得两个模型训练任务相互影响,实现两个模型的同时训练,保证两个模型的训练效果。另一方面,在训练标注模型的过程中同时使用到了训练语句以及句法分析模型输出的句法信息,此句法信息的引入相当于对训练语句进行了句法增强,因此,根据此经过句法增强训练语句训练标注模型,也进一步保证标注模型的训练效果。
上述实施例中公开了同时训练句法分析模型以及标注模型的过程。而在标注模型训练的过程中,使用到了句法分析模型输出的句法信息,因此,句法信息的准确性,也会直接影响标注模型的训练效果,因此,尤其要保证句法分析模型的训练效果。
基于此,对于句法分析模型,在与标注模型一起训练的同时,其也可以进行独立训练,如图2所示,该独立训练过程可以包括以下步骤:
S201,将训练语句输入句法分析模型,以通过句法分析模型的编码层对训练语句进行编码,得到训练语句对应的第一句法信息。
S202,再将第一句法信息输入句法分析模型的解码层,以通过解码层输出训练语句对应的第二句法信息。
S203,根据第二句法信息,调整句法分析模型的模型参数。
在进行单独训练时,输入到句法分析模型的训练语句,可以是第二语料库中的任一语句,并不限于与第一语料库中相同的那些语句。
并且句法分析模型的模型结构可以是输入层—编码层—解码层。则基于此结构,当训练语句通过句法分析模型的输入层输入至编码层后,编码层可以对其进行编码。此处的编码处理可以认为是句法分析模型对训练进行特征提取,以由编码层输出训练语句对应的第一句法信息。其中,第一句法信息可以表现为词向量矩阵。如果将词向量矩阵直接输出的话,用户看到的是一些数据,无法直观的理解其中的含义,因此第一句法信息实际上是一种隐性信息。
然后,句法分析模型的编码层输出的第一句法信息会进一步输入至解码层,解码层会输出训练语句对应的第二句法信息,其中,第二句法信息以概率矩阵或者句法依存树的形式体现。与第一句法特征相对的,第二句法信息是用户可以直观理解的显性信息。
最终,句法分析模型同样可以根据编码层输出的分析结果,采用反向传播的方式来调整模型参数。可见,在上述的整个训练过程中,标注模型是没有参与的,也即是实现了句法分析模型的单独训练。
需要说明的有,本实施例实际提供的上述单独训练的步骤可以在步骤101之前或者104之后执行。
综合上述各实施例,句法分析模型一方面可以按照如图1所示的方式与标注模型进行同时训练。同时,还可以按照图2所示实施例的方式对句法分析模型进行单独训练。相比于只对句法模型进行单独,将两种训练方式相结合,可以大大提升句法分析模型的训练效果,使得其输出的句法信息更准确,这也就进一步保证了标注模型训练的效果。
图1所示实施例中公开了句法模型提取出的句法信息会参与到标注模型的训练过程中,且在实际应用中,标注模型通常可以包括输入层—编码层—解码层。基于这种网络结构,可选地,句法信息可以在标注模型的编码层引入。
则图3为本发明实施例提供的另一种数据处理方法的流程图。本实施例中描述的训练过程可以结合图4所示内容进行理解。如图3所示,该方法可以包括如下步骤:
S301,获取训练语句。
获取到的训练语句可以是第一语料库中的任一语句,且上述步骤301的执行过程与前述实施例的相应步骤相似,可以参见如图1所示实施例中的相关描述,在此再不赘述。
S302,将训练语句输入句法分析模型,以通过句法分析模型的编码层对训练语句进行编码,得到训练语句对应的第一句法信息。
与标注模型相同的,句法分析模型的结构同样可以为输入层—编码层—解码层。基于此结构,当训练语句通过句法分析模型的输入层输入至编码层后,编码层可以对其进行编码,以由编码层输出训练语句对应的第一句法信息。其中,第一句法信息可以认为是编码层从训练语句中提取出的语句特征,第一句法信息具体可以表现为词向量矩阵。
S303,将第一句法信息以及训练语句输入标注模型的编码层,以通过标注模型的编码层对第一句法信息以及训练语句进行编码,得到语义信息。
S304,将语义信息输入标注模型的解码层,以通过解码层输出训练语句的标注结果。
接着,再将第一句法信息和训练语句一并输入至标注模型的编码层,以进一步通过解码层输出训练语句的标注结果。标注结果中包含的具体内容可以参见图1所示实施例中的相关描述,在此不再赘述。
可选地,上述的“将第一句法信息和训练一并输入”,可以认为是将同为向量矩阵形式的第一句法信息以及训练语句进行拼接,具体拼接过程可以参见图1所示实施例中的相关描述。再将拼接结果输入标注模型的编码层,以通过编码层对其进行编码,从而得到训练语句的语义信息,语义信息同样可以表现为向量矩阵的形式。此处的编码处理也可以认为是对拼接结果进行的特征提取。
上述的拼接处理可以实现训练语句的句法增强,拼接结果即可认为是句法增强结果。由于融合结果中是包含训练语句的句法信息的,因此,训练语句的句法信息也会参与到语义信息的提取过程中,从而保证语义信息的准确性。再将语义信息输入标注模型的解码层,即可通过解码层输出标注结果。
可选地,标注模型中的编码层可以为双向长短期记忆(Bi-directional LongShort-Term Memory,简称BiLSTM)网络,解码层可以为条件随机场(Conditional RandomField,简称CRF)网络。
S305,根据标注模型输出的标注结果,调整句法分析模型以及标注模型各自的模型参数。
上述步骤305的执行过程与前述实施例的相应步骤相似,可以参见如图1所示实施例中的相关描述,在此再不赘述。
本实施例中,句法分析模型输出的句法信息是在标注模型的编码层引入的。通过句法信息的引入,能够使训练语句实现句法增强,从而使标注模型在标注的过程中能够考虑到语句的句法,保证标注模型的训练效果。
可选地,句法信息还可以在标注模型的解码层引入。则图5为本发明实施例提供的又一种数据处理方法的流程图。本实施例提供的训练过程可以结合图6所示内容进行理解。如图5所示,该方法可以包括如下步骤:
S401,获取训练语句。
S402,将训练语句输入句法分析模型,以通过句法分析模型的编码层对训练语句进行编码,得到训练语句对应的第一句法信息。
上述步骤401~402的执行过程与前述实施例的相应步骤相似,可以参见如图3所示实施例中的相关描述,在此再不赘述。
S403,将第一句法信息输入句法分析模型的解码层,以通过解码层输出训练语句的对应的第二句法信息。
句法分析模型的编码层输出的第一句法信息会进一步输入至解码层,以通过解码层输出训练语句对应的第二句法信息。
S404,将训练语句输入标注模型,以通过标注模型的编码层对训练语句进行编码,得到语义信息。
同时,训练语句还可以被输入至标注模型,以通过标注模型的编码层对训练语句进行编码,以通过编码层输出训练语句的语义信息。此编码处理可以认为是对训练语句进行的特征提取。
此时,需要说明的有,对于获取到的训练语句,一方面,可以经过上述步骤402~403,可以得到训练语句的句法信息。另一方面,还可以通过执行步骤404得到训练语句的语义信息。而上述只是一种示意性的信息获取顺序,本发明并不限定语义信息和第二句法信息的获取顺序。
S405,将第二句法信息以及语义信息输入融合模型,以通过融合模型融合第二句法信息以及语义信息。
S406,将融合结果输入标注模型的解码层,以通过解码层输出训练语句的标注结果。
由于第二句法信息与语义信息是的内容不同的矩阵,无法将二者直接拼接,因此,需要借助一个融合模型来实现第二句法信息和语义信息的融合。可选地,融合模型具体可以为图卷积神经网络(Graph Convolutional Network,简称GCN),还可以为树型长短期记忆(Tree Long Short-Term Memory,简称TreeLSTM)网络等等。
经过上述的融合处理可以实现训练语句的句法增强。由于融合结果中包含训练语句的句法信息,因此,句法信息也会参与到语义信息的提取过程中,从而保证语义信息的准确性。再将融合结果输入标注模型的解码层,以通过解码层输出训练语句对应的标注结果。
S407,根据标注模型输出的标注结果,调整句法分析模型以及标注模型各自的模型参数。
最终,可以再根据标注模型输出的标注结果,同时调整句法分析模型以及标注模型各自的模型参数。另外,在标注模型的训练过程中,除了句法分析模型以及标注模型,融合模型也参与到了其中,因此,在使用反向传播方式进行模型参数调整时,实际上也可以对融合模型的模型参数进行调整,从而实现三个模型的同时训练。
本实施例中,句法分析模型输出的句法信息是在标注模型的解码层引入的。通过句法信息的引入,能够使训练语句实现句法增强,从而使标注模型在训练过程中考虑到语句的句法,保证标注模型的训练效果。
可选地,句法信息还可以同时在标注模型的编码层和解码层引入。则图7为本发明实施例提供的又一种数据处理方法的流程图。本实施例提供的训练过程可以结合图8所示内容进行理解。如图7所示,在图5所示实施例中步骤403之后,该方法还可以包括如下步骤:
S501,将第一句法信息以及训练语句输入标注模型,以通过标注模型的编码层对第一句法信息以及训练语句进行编码,得到语义信息。
在执行上述步骤402后即可得到第一句法信息,此时,再将第一句法信息和训练语句输入一并输入标注模型中,以由标注模型的编码层对二者进行拼接并编码,从而得到训练语句的语义信息。上述的拼接处理可以实现训练语句的句法增强,拼接结果即可认为是句法增强结果。此处的详细内容可参见图3所示实施例中的相关描述。
S502,将语义信息和第二句法信息输入融合模型,以通过融合模型对第二句法信息以及语义信息进行融合。
再将语义信息和经过步骤403得到的第二句法信息输入融合模型,以由融合模型对二者进行融合此处的详细内容可参见图5所示实施例中的相关描述。
S503,将融合结果输入标注模型的解码层,以通过解码层输出训练语句的标注结果。
S504,根据标注模型输出的标注结果,调整句法分析模型以及标注模型各自的模型参数。
上述步骤503~步骤504的执行过程与前述实施例的相应步骤相似,可以参见如图5所示实施例中的相关描述,在此再不赘述。
本实施例中,句法分析模型输出的句法信息会同时在标注模型的编码层和解码层引入。通过在模型的两个层均引入句法信息,从而能够使训练语句具有更高的句法增强效果,使得标注模型在训练过程中考虑到更为丰富的句法信息,从而保证标注模型的训练效果。
需要说明的有,在利用图3~图8所示的训练方式进行句法分析模型以及标注模型共同训练的同时,句法分析模型还可以采用如图2所示实施例中的方式进行单独训练。
图1~图8所示实施例,实际上都是模型训练方法。在根据上述将标注模型和句法分析模型训练至收敛后,则可以通过两模型实现语句的语义理解、情感分析等等。则图9为本发明实施例提供的又一种数据处理方法的流程图。如图7所示,该方法实际上是一种基于语义识别的人机交互方法,该方法还可以包括如下步骤:
S601,获取用户输入的待标注语句。
用户可以向智能机器人发出控制指令。其中,智能机器人可以适用于家居场景,也可以适用于公共服务场景,比如银行、医院等等。控制指令也即是待标注语句,其具体可以是用户发出的语音指令也可以是用户在智能机器人提供的操作界面上输入文字内容。
S602,将待标注语句输入训练至收敛的句法分析模型,以得到待标注语句对应的句法信息。
智能机器人在获取到待标注语句后,可以将其输入至自身配置的、已经训练至收敛的句法分析模型中,以由句法分析模型输出待标注语句对应的句法信息。其中,句法信息可以表现为词向量矩阵、概率矩阵或者句法依存树。以词向量矩阵形式表现的句法信息可以由句法分析模型的编码层输出,也即是上述各实施例中的第一句法信息;以概率矩阵或者句法依存树形式表现的句法信息可以由句法分析模型的解码层输出,也即是上述各实施例中的第二句法信息。
S603,将句法信息和待标注语句输入训练至收敛的标注模型,以得到待标注语句的标注结果,标注结果包含待标注语句的情感类型。
此时,得到的句法信息以及用户输入的待标注语句会一并输入智能机器人配置的、训练至收敛的标注模型,以由标注模型输出标注结果。此标注结果不仅可以反映待标注语句的语义,还可以反映待标注语句的情感类型,比如喜悦、悲伤、愤怒等等。
可选地,正如上图3~图8所示实施例中描述的,标注模型可以对输入的句法信息以及待标注语句进行拼接,以得到拼接结果;又或者由智能机器人自身配置的、训练至收敛的融合模型对句法信息以及待标注语句进行融合,以得到融合结果。此时,标注模型可以根据拼接结果或者融合结果,输出待标注语句的标注结果。
S604,输出应答语句,应答语句的情感类型和待标注语句的情感类型相匹配。
智能机器人会进一步根据标注结果生成应答语句,并将此与待标注语句对应的应答语句输出给用户,以实现人机交互。其中,应答语句的情感类型与待标注语句的情感类型相匹配。这种匹配举例来说可以是:应答语句与待标注语句都具有正向情感,比如二者都具有喜悦的情感类型。上述情感类型的匹配还可以是:待标注语句具有悲伤的情感类型,应答语句具有喜悦的情感类型。
需要说明的有,本实施例是一个模型预测过程,其具体预测过程与上述各实施例提供的方法相似,未详细描述的部分可以参见上述各实施例中的相关描述,在此不再赘述。
本实施例中,在利用图1~图8所示的数据处理方法得到训练至收敛的句法分析模型和标注模型后,对于配置有此模型的智能机器人来说,其可以实现对用户输入的语句的语义理解以及情感分析,从而输出相应的应答语句,实现人机交互。
需要说明的还有,除了本实施例提供的人机交互场景,对于已经训练至收敛的标注模型和句法分析模型,其同样可以应用于上述提及的商品评价信息的理解以及舆情分析等场景。
以下将详细描述本发明的一个或多个实施例的数据处理装置。本领域技术人员可以理解,这些数据处理装置均可使用市售的硬件组件通过本方案所教导的步骤进行配置来构成。
图10为本发明实施例提供的数据处理装置的结构示意图,如图10所示,该装置包括:
获取模块11,用于获取训练语句。
输入模块12,用于将所述训练语句输入句法分析模型,以得到所述训练语句对应的句法信息。
训练模块13,用于根据所述句法信息以及所述训练语句,训练标注模型。
调整模块14,用于根据所述标注模型输出的标注结果,调整所述句法分析模型以及所述标注模型各自的模型参数。
可选地,所述输入模块12具体用于:将所述训练语句输入所述句法分析模型,以通过所述句法分析模型的编码层对所述训练语句进行编码,得到所述训练语句对应的第一句法信息。
可选地,所述训练模块13具体用于:将所述第一句法信息以及所述训练语句输入所述标注模型的编码层,以通过所述标注模型的编码层对所述第一句法信息以及所述训练语句进行编码,得到语义信息;以及将所述语义信息输入所述标注模型的解码层,以通过所述解码层输出所述训练语句的标注结果。
可选地,所述输入模块12还用于:将所述第一句法信息输入所述句法分析模型的解码层,以通过所述解码层输出所述训练语句对应的第二句法信息。
所述调整模块14,还用于根据所述第二句法信息,调整所述句法分析模型的模型参数。
可选地,所述输入模块12具体用于:将所述训练语句输入所述句法分析模型,以通过所述句法分析模型的编码层对所述训练语句进行编码,得到所述训练语句对应的第一句法信息;以及将所述第一句法信息输入所述句法分析模型的解码层,以通过所述解码层输出所述训练语句的对应的第二句法信息。
可选地,所述训练模块13具体用于:将所述训练语句输入所述标注模型,以通过所述标注模型的编码层对所述训练语句进行编码,得到语义信息;
将所述第二句法信息以及所述语义信息输入融合模型,以通过所述融合模型融合所述第二句法信息以及所述语义信息;以及将融合结果输入所述标注模型的解码层,以通过所述解码层输出所述训练语句的标注结果。
可选地,所述训练模块13具体还用于:将所述第一句法信息以及所述训练语句输入所述标注模型,以通过所述标注模型的编码层对所述第一句法信息以及所述训练语句进行编码,得到语义信息;
将所述语义信息和所述第二句法信息输入融合模型,以通过所述融合模型对所述第二句法信息以及所述语义信息进行融合;以及将融合结果输入所述标注模型的解码层,以通过所述解码层输出所述训练语句的标注结果。
可选地,所述调整模块14具体用于:根据所述标注结果,调整所述标注模型、所述句法分析模型以及所述融合模型各自的模型参数。
可选地,所述装置还包括:输出模块21。
所述获取模块11,用于获取用户输入的待标注语句。
输入模块12,用户将所述待标注语句输入训练至收敛的句法分析模型,以得到所述待标注语句对应的句法信息;以及将所述句法信息和所述待标注语句输入训练至收敛的标注模型,以得到所述待标注语句的标注结果,所述标注结果包含所述待标注语句的情感类型。
所述输出模块21,用于输出应答语句,所述应答语句的情感类型和所述待标注语句的情感类型相匹配。
图10所示装置可以执行图1至图9所示实施例的方法,本实施例未详细描述的部分,可参考对图1至图9所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1至图9所示实施例中的描述,在此不再赘述。
以上描述了数据处理装置的内部功能和结构,在一个可能的设计中,数据处理装置的结构可实现为一电子设备,如图11所示,该电子设备可以包括:处理器31和存储器32。其中,所述存储器32用于存储支持该电子设备执行上述图1至图9所示实施例中提供的数据处理方法的程序,所述处理器31被配置为用于执行所述存储器32中存储的程序。
所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器31执行时能够实现如下步骤:
获取训练语句;
将所述训练语句输入句法分析模型,以得到所述训练语句对应的句法信息;
根据所述句法信息以及所述训练语句,训练标注模型;
根据所述标注模型输出的标注结果,调整所述句法分析模型以及所述标注模型各自的模型参数。
可选地,所述处理器31还用于执行前述图1至图9所示实施例中的全部或部分步骤。
其中,所述电子设备的结构中还可以包括通信接口33,用于该电子设备与其他设备或通信网络通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存上述电子设备所用的计算机软件指令,其包含用于执行上述图1至图9所示方法实施例中数据处理方法所涉及的程序。
为了便于理解,结合如下的人机交互场景对以上提供的数据处理方法的具体实现过程进行示例性说明。
在人机交互场景中,用户可以向智能机器人输入问题语句,则智能机器人可以根据自身配置的标注模型和句法分析模型,来实现对问题语句的语义以及情感类型进行识别、理解。
具体以居家的人机交互场景为例,用户可以对家中的智能机器人输入问题语句:“搜索我喜爱的电影”。则智能机器人配置的句法分析模型获取并对此输入问题进行处理,以得到问题语句的句法信息。其中,句法信息可以包括由句法分析模型的编码层输出的、表现为词向量矩阵的第一句法信息,以及由句法分析模型的解码层输出的、表现为概率矩阵或依存句法树的第二句法信息。
接着,再将句法模型输出的句法信息以及用户输入的问题语句一并输入智能机器人配置的标注模型,标注模型可以结合语法信息对问题语句进行语义分析和情感类型的识别,输出的标注结果可以为:搜索我[holder]喜爱[expression]的电影[target]。
根据此标注结果,智能机器人可以知晓问题语句是要搜索电影,同时也能知晓用户处于开心的状态,但此标注结果不会输出给用户。进一步的,智能机器人还可以根据此标注结果为用户输出问题语句应答语句:“为您推荐电影《XX》,祝您观影愉快”。
上述居家的人机交互场景的相关内容可以结合图12进行理解。
在公共服务场合的人机交互场景中,用户输入的问题语句可以为:“有几个排队等待的顾客,银行的办理效率太低了”。智能机器人得到的问题呢语句的标注结果为:几个排队等待的顾客,银行的办理效率[target]太低[expression]了。由于问题语句具有的情感类型是烦躁,此时,为了缓解用的烦躁情绪,智能机器人可以输出态度温和的应答语句,即“当前排队等待的顾客有5个,请您耐心等待,很抱歉给您带来不便”
在舆情分析场景中,用户可以输入评论语句:“我觉得小明对这件事的处理方法真是太棒了”,服务器可以根据自身配置的句法分析模型以及标注模型得到标注结果:“我[holder]觉得小明对这件事[target]的处理方法真是太棒[expression]了”。服务器通过对大量评论语句进行分析从而实现舆情分析。
在商品评价场景中,用户可以输入评价语句:“我太喜欢这款产品了”,服务器可以根据自身配置的句法分析模型以及标注模型得到标注结果:“我[holder]太喜欢[expression]这款产品[target]了”。服务器通过对大量评价语句进行分析从而实现对产品使用效果的分析。
需要说明的有,智能机器人或者服务器在进行语义分析、情感识别过程中需要结合使用句法分析模型和标注模型,二者的具体结合使用过程可以参见图4、图6和图8所示的方式,并且两个模型的具体训练方式也可参见图1~图8所示实施例中的相关描述,在此均不再赘述。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (11)

1.一种数据处理方法,其特征在于,包括:
获取训练语句;
将所述训练语句输入句法分析模型,以得到所述训练语句对应的句法信息;
根据所述句法信息以及所述训练语句,训练标注模型;
根据所述标注模型输出的标注结果,调整所述句法分析模型以及所述标注模型各自的模型参数;
所述根据所述句法信息以及所述训练语句,训练标注模型,包括:
将所述训练语句对应的第一句法信息以及所述训练语句输入所述标注模型,以通过所述标注模型的编码层对所述第一句法信息以及所述训练语句进行编码,得到语义信息;
将所述语义信息和所述训练语句对应的第二句法信息输入融合模型,以通过所述融合模型对所述第二句法信息以及所述语义信息进行融合;
将融合结果输入所述标注模型的解码层,以通过所述解码层输出所述训练语句的标注结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述训练语句输入句法分析模型,以得到所述训练语句对应的句法信息,包括:
将所述训练语句输入所述句法分析模型,以通过所述句法分析模型的编码层对所述训练语句进行编码,得到所述训练语句对应的第一句法信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述句法信息以及所述训练语句,训练标注模型,包括:
将所述第一句法信息以及所述训练语句输入所述标注模型的编码层,以通过所述标注模型的编码层对所述第一句法信息以及所述训练语句进行编码,得到语义信息;
将所述语义信息输入所述标注模型的解码层,以通过所述解码层输出所述训练语句的标注结果。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
将所述第一句法信息输入所述句法分析模型的解码层,以通过所述解码层输出所述训练语句对应的第二句法信息;
根据所述第二句法信息,调整所述句法分析模型的模型参数。
5.根据权利要求1所述的方法,其特征在于,所述将所述训练语句输入句法分析模型,以得到所述训练语句对应的句法信息,包括:
将所述训练语句输入所述句法分析模型,以通过所述句法分析模型的编码层对所述训练语句进行编码,得到所述训练语句对应的第一句法信息;
将所述第一句法信息输入所述句法分析模型的解码层,以通过所述解码层输出所述训练语句的对应的第二句法信息。
6.根据权利要求5所述的方法,其特征在于,所述根据所述句法信息以及所述训练语句,训练标注模型,包括:
将所述训练语句输入所述标注模型,以通过所述标注模型的编码层对所述训练语句进行编码,得到语义信息;
将所述第二句法信息以及所述语义信息输入融合模型,以通过所述融合模型融合所述第二句法信息以及所述语义信息;
将融合结果输入所述标注模型的解码层,以通过所述解码层输出所述训练语句的标注结果。
7.根据权利要求6所述的方法,其特征在于,所述标注模型输出的标注结果,调整所述句法分析模型和所述标注模型各自的模型参数,包括:
根据所述标注结果,调整所述标注模型、所述句法分析模型以及所述融合模型各自的模型参数。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取用户输入的待标注语句;
将所述待标注语句输入训练至收敛的句法分析模型,以得到所述待标注语句对应的句法信息;
将所述句法信息和所述待标注语句输入训练至收敛的标注模型,以得到所述待标注语句的标注结果,所述标注结果包含所述待标注语句的情感类型;
输出应答语句,所述应答语句的情感类型和所述待标注语句的情感类型相匹配。
9.一种数据处理装置,其特征在于,包括:
获取模块,用于获取训练语句;
输入模块,用于将所述训练语句输入句法分析模型,以得到所述训练语句对应的句法信息;
训练模块,用于将所述训练语句对应的第一句法信息以及所述训练语句输入标注模型,以通过所述标注模型的编码层对所述第一句法信息以及所述训练语句进行编码,得到语义信息;
将所述语义信息和所述训练语句对应的第二句法信息输入融合模型,以通过所述融合模型对所述第二句法信息以及所述语义信息进行融合;
将融合结果输入所述标注模型的解码层,以通过所述解码层输出所述训练语句的标注结果;
调整模块,用于根据所述标注模型输出的标注结果,调整所述句法分析模型以及所述标注模型各自的模型参数。
10.一种电子设备,其特征在于,包括:存储器、处理器;其中,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1至8中任一项所述的数据处理方法。
11.一种非暂时性机器可读存储介质,其特征在于,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1至8中任一项所述的数据处理方法。
CN202010525647.1A 2020-06-10 2020-06-10 数据处理方法、装置、设备和存储介质 Active CN113779962B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010525647.1A CN113779962B (zh) 2020-06-10 2020-06-10 数据处理方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010525647.1A CN113779962B (zh) 2020-06-10 2020-06-10 数据处理方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN113779962A CN113779962A (zh) 2021-12-10
CN113779962B true CN113779962B (zh) 2024-02-02

Family

ID=78834812

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010525647.1A Active CN113779962B (zh) 2020-06-10 2020-06-10 数据处理方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN113779962B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095177A (zh) * 2014-05-04 2015-11-25 萧瑞祥 文章的意见单元识别方法及其相关装置与计算机程序产品
CN105930503A (zh) * 2016-05-09 2016-09-07 清华大学 基于组合特征向量和深度学习的情感分类方法及装置
CN108427722A (zh) * 2018-02-09 2018-08-21 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN110705253A (zh) * 2019-08-29 2020-01-17 昆明理工大学 基于迁移学习的缅甸语依存句法分析方法及装置
CN110895553A (zh) * 2018-08-23 2020-03-20 国信优易数据有限公司 语义匹配模型训练方法、语义匹配方法及答案获取方法
CN111046656A (zh) * 2019-11-15 2020-04-21 北京三快在线科技有限公司 文本处理方法、装置、电子设备及可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8533208B2 (en) * 2009-09-28 2013-09-10 Ebay Inc. System and method for topic extraction and opinion mining

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095177A (zh) * 2014-05-04 2015-11-25 萧瑞祥 文章的意见单元识别方法及其相关装置与计算机程序产品
CN105930503A (zh) * 2016-05-09 2016-09-07 清华大学 基于组合特征向量和深度学习的情感分类方法及装置
CN108427722A (zh) * 2018-02-09 2018-08-21 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN110895553A (zh) * 2018-08-23 2020-03-20 国信优易数据有限公司 语义匹配模型训练方法、语义匹配方法及答案获取方法
CN110705253A (zh) * 2019-08-29 2020-01-17 昆明理工大学 基于迁移学习的缅甸语依存句法分析方法及装置
CN111046656A (zh) * 2019-11-15 2020-04-21 北京三快在线科技有限公司 文本处理方法、装置、电子设备及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于产品评论的消费者偏好模型构建研究;胡龙茂;胡戴新;;长春大学学报(第12期);全文 *

Also Published As

Publication number Publication date
CN113779962A (zh) 2021-12-10

Similar Documents

Publication Publication Date Title
US11394667B2 (en) Chatbot skills systems and methods
US11948058B2 (en) Utilizing recurrent neural networks to recognize and extract open intent from text inputs
US11487986B2 (en) Providing a response in a session
Li et al. Api-bank: A benchmark for tool-augmented llms
US20200301954A1 (en) Reply information obtaining method and apparatus
US20190103111A1 (en) Natural Language Processing Systems and Methods
US10242667B2 (en) Natural language generation in a spoken dialogue system
US11729120B2 (en) Generating responses in automated chatting
KR102229850B1 (ko) 대화형 상호작용 시스템에서 서치 입력에서의 사용자 의도를 추론하는 방법 및 이를 위한 시스템
WO2019100350A1 (en) Providing a summary of a multimedia document in a session
US8156060B2 (en) Systems and methods for generating and implementing an interactive man-machine web interface based on natural language processing and avatar virtual agent based character
US20140046876A1 (en) System and method of providing a computer-generated response
US20210209164A1 (en) Method, apparatus, and storage medium for recommending interactive information
CN111241237A (zh) 一种基于运维业务的智能问答数据处理方法及装置
CN108959388B (zh) 信息生成方法及装置
JP7204801B2 (ja) ニューラルネットワークに基づくマンマシンインタラクション方法、装置、及び媒体
CN114239547A (zh) 一种语句生成方法及电子设备、存储介质
CN112163560A (zh) 一种视频信息处理方法、装置、电子设备及存储介质
CN114706945A (zh) 意图识别方法、装置、电子设备及存储介质
US20220075960A1 (en) Interactive Communication System with Natural Language Adaptive Components
CN113569017B (zh) 一种模型处理方法、装置、电子设备及存储介质
CN111737408A (zh) 基于剧本的对话方法、设备及电子设备
CN110891201B (zh) 文本生成方法、装置、服务器和存储介质
CN113779962B (zh) 数据处理方法、装置、设备和存储介质
US11393454B1 (en) Goal-oriented dialog generation using dialog template, API, and entity data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant