WO2024087297A1

WO2024087297A1 - 文本情感分析方法、装置、电子设备及存储介质

Info

Publication number: WO2024087297A1
Application number: PCT/CN2022/134576
Authority: WO
Inventors: 宋彦; 田元贺; 陈伟东; 李世鹏
Original assignee: 苏州思萃人工智能研究所有限公司
Priority date: 2022-10-27
Filing date: 2022-11-28
Publication date: 2024-05-02
Also published as: CN115510860A

Abstract

本申请提供了一种文本情感分析方法、装置、电子设备及存储介质，其中，该文本情感分析方法包括：获取待分析文本，并确定所述待分析文本所对应的第一待使用特征信息和第二待使用特征信息；确定与所述第一待使用特征信息所对应的第一嵌入向量，并确定与所述第二待使用特征信息相对应的第二嵌入向量；确定所述待分析文本所对应的待使用隐向量；根据所述第一嵌入向量、所述第二嵌入向量和所述待使用隐向量，确定所述待分析文本所对应的情感信息。

Description

文本情感分析方法、装置、电子设备及存储介质

本申请要求在2022年10月27日提交中国专利局、申请号为202211340090.X的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请涉及自然语言处理技术领域，例如涉及一种文本情感分析方法、装置、电子设备及存储介质。

背景技术

通过对文本信息进行情感分析，如，对用户评论文本信息进行情感分析，容易获取大众对一个事件或一个产品的看法。

对文本情感分析大多是采用先提取方面词，再预测情感极性的管道方法，其步骤复杂而且存在方面词提取错误导致的错误扩散现象。而少部分采用联合方法，但这种方法只能局限于使用高效的编码器，而没有考虑使用更高级的模型框架和利用额外的知识来帮助提升模型的性能。

发明内容

本申请提供了一种文本情感分析方法、装置、电子设备及存储介质，以解决对文本所对应的情感信息分析不够准确，且分析效率较低的问题。

本申请实施例提供了一种文本情感分析方法，包括：

获取待分析文本，并确定所述待分析文本所对应的第一待使用特征信息和第二待使用特征信息，其中，所述第一待使用特征信息为上下文特征信息，所述第二待使用特征信息为句法特征信息；

确定与所述第一待使用特征信息所对应的第一嵌入向量，并确定与所述第二待使用特征信息相对应的第二嵌入向量；

确定所述待分析文本所对应的待使用隐向量；

根据所述第一嵌入向量、所述第二嵌入向量和所述待使用隐向量，确定所述待分析文本所对应的情感信息。

本申请实施例还提供了一种文本情感分析装置，包括：

特征信息确定模块，设置为获取待分析文本，并确定所述待分析文本所对应的第一待使用特征信息和第二待使用特征信息，其中，所述第一待使用特征信息为上下文特征信息，所述第二待使用特征信息为句法特征信息；

嵌入向量确定模块，设置为确定与所述第一待使用特征信息所对应的第一嵌入向量，并确定与所述第二待使用特征信息相对应的第二嵌入向量；

隐向量确定模块，设置为确定所述待分析文本所对应的待使用隐向量；

情感信息确定模块，设置为根据所述第一嵌入向量、所述第二嵌入向量和所述待使用隐向量，确定所述待分析文本所对应的情感信息。

本申请实施例还提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请任一实施例所述的文本情感分析方法。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现本申请任一实施例所述的文本情感分析方法。

附图说明

图1是根据本申请实施例一提供的一种文本情感分析方法的流程图；

图2是根据本申请实施例二提供的一种文本情感分析方法的模型示意图；

图3是根据本申请实施例三提供的一种文本情感分析装置的结构示意图；

图4是实现本申请实施例的文本情感分析方法的电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述，所描述的实施例仅仅是本申请一部分的实施例。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。

在对本技术方案进行阐述之前，先对本技术方案的应用场景进行简单介绍，以便理解本技术方案。对于文本内容进行情感分析在多用场景下都非常实用，如，通过影评信息确定用户对电影的喜爱程度、或者通过用户评论信息了解用户对餐厅菜品或者服务的评价、或者是通过用户反馈信息了解用户对于电子产品的评价等，以基于用户的反馈信息以及相应的情感信息，更加了解用户需求以对相关产品进行改进。

实施例一

图1为本申请实施例一提供的一种文本情感分析方法的流程图，本实施例可适用于快速准确的对文本进行情感倾向的分析的情况，该方法可以由文本情感分析装置来执行，该文本情感分析装置可以采用硬件和/或软件的形式实现，该文本情感分析装置可配置于可执行文本情感分析方法的计算设备中。

如图1所示，该方法包括以下步骤。

S110、获取待分析文本，并确定待分析文本所对应的第一待使用特征信息和第二待使用特征信息。

待分析文本可以理解为需要进行情感分析的文本信息，如，可以为评论区的用户评论信息、影评信息、书评信息以及任何具有情感倾向的文本信息。在本技术方案中，可以通过双通道注意力机制对待分析文本进行情感分析，所谓双通道注意力机制包括基于上下文特征对待分析文本进行情感分析的注意力机制，以及基于句法知识对待分析文本进行情感分析的注意力机制。第一待使用特征信息可以理解为基于上下文特征注意力机制，得到的与待分析文本相对应的上下文特征信息。第二待使用特征信息可以理解为基于句法知识注意力机制对待分析文本进行分析，得到的句法特征信息。

在对待分析文本进行情感分析时，可以同时对待分析文本的上下文特征信息以及句法知识特征信息进行分析，以得到待分析文本相对应的第一待使用特征信息和第二待使用特征信息。

可选的，确定待分析文本所对应的第一待使用特征信息和第二待使用特征信息，包括：确定与待分析文本相对应的依存句法树；基于依存句法树中，至少两个分词之间的上下文特征依赖关系，得到与待分析文本相对应的第一待使用特征信息；基于依存句法树中，至少两个分词之间的句法依赖关系，得到与待分析文本相对应的第二待使用特征信息。

在本技术方案中，待分析文本中包括至少两个分词，依存句法树可以理解为包含待分析文本的上下文特征信息和句法特征信息的关系图，也就是说，依存句法树为基于至少两个分词之间的上下文特征和句法特征进行构建的。

构建与待分析文本相对应的依存句法树，以根据依存句法树中的上下文特征依赖关系，以及句法依赖关系，分别得到与待分析文本相对应的第一待使用特征信息和第二待使用特征信息。

示例性地，待分析文本为“这个蘑菇海鲜汤很棒”，以其中的“汤”字为例，可以选取“汤”字前面的r个词，以及后面的r个词，如当r＝1时，与“汤”相对应的第一待使用特征信息为“海鲜”和“很”，为待分析文本的第一待使用特征信息。同时，在这个待分析文本中，根据句法知识特征可以确定，相对于“汤”字，“这个”为限定词，“蘑菇”和“海鲜”为描述性词语，“棒”为修饰词，而“很”字用于表征“棒”的程度，与“汤”字无直接关联。根据待分析文本中每个分词与“汤”字之间的句法知识，可以得到与待分析文本相对应的第二待使用特征信息，即，第二待使用特征信息为用于表征待分析文本的句法知识的信息。

S120、确定与第一待使用特征信息所对应的第一嵌入向量，并确定与第二待使用特征信息相对应的第二嵌入向量。

第一嵌入向量为对第一待使用特征信息进行向量化处理后得到的向量。第二嵌入向量为对第二待使用特征信息进行向量化处理后得到的向量。

在本技术方案中，确定与第一待使用特征信息所对应的第一嵌入向量，包括：基于第一嵌入函数，将第一待使用特征信息进行映射处理，得到第一待使用映射信息；确定第一待使用映射信息，在上下文特征嵌入矩阵中的第一位置信息，并根据第一位置信息所对应的矩阵元素，确定第一待使用映射信息所对应的第一嵌入向量。

第一嵌入函数可以理解为将第一待使用特征信息进行映射处理，得到相应的第一待使用映射信息的函数。通过对第一待使用映射信息进行向量化处理，则可以得到第一嵌入向量。上下文特征嵌入矩阵可以理解为预先构建的包含大量分词的信息矩阵。

示例性地，上下文特征嵌入矩阵中包含2万个分词，多个分词分别位于矩阵的不同行，每个矩阵行对应唯一的向量值。基于第一嵌入函数，对待分析文本中的多个分词分别进行分词，以当前分词为例，其中，当前分词可以作为第一待使用特征信息，根据当前分词在上下文嵌入矩阵中所对应的矩阵行，即第一位置信息，可以得到与当前分词相对应的唯一向量值，即与第一位置相对应的矩阵元素，并将该矩阵元素确定为第一嵌入向量。

可选的，确定与第二待使用特征信息相对应的第二嵌入向量，包括：基于第二嵌入函数，将第二待使用特征信息进行映射处理，得到第二待使用映射信息；确定第二待使用映射信息，在句法特征嵌入矩阵中的第二位置信息，并根据第二位置信息所对应的矩阵元素，确定第二待使用映射信息所对应的第二嵌入向量。

第二嵌入函数可以理解为将第二待使用特征信息进行映射处理，得到相应的第二待使用映射信息的函数。通过对第二待使用映射信息进行向量化处理，则可以得到第二嵌入向量。句法特征嵌入矩阵可以理解为预先构建的包含大量句法知识的信息矩阵，如，可以包括名词短语、主语、修饰语以及程度副词的句法关系等。

示例性地，句法特征嵌入矩阵中包含500个句法知识，多个分词分别位于矩阵的不同行，每个矩阵行对应唯一的向量值。基于第二嵌入函数，对待分析文本中的多个分词分别进行分词，以当前分词为例，其中，当前分词可以作为第二待使用特征信息，根据当前分词在句法嵌入矩阵中所对应的矩阵行，即第二位置信息，可以得到与当前分词相对应的唯一向量值，即与第二位置相对应的矩阵元素，并将该矩阵元素确定为第二嵌入向量。

S130、确定待分析文本所对应的待使用隐向量。

在本技术方案中，待使用隐向量为基于语言表征模型基于变换器的双向编码器表示(Bidirectional Encoder Representations from Transformer，BERT)对待分析文本进行向量化处理后，得到的向量。

在实际应用中，确定待分析文本所对应的待使用隐向量，包括：基于语言表征模型，对待分析文本进行编码，得到与待分析文本中每个分词相对应的待使用分词向量；将多个待使用分词向量进行拼接处理，得到与待分析文本相对应的待使用隐向量。

待使用分词可以理解为待分析文本中的多个分词。待使用分词向量即为与每个分词相对应的隐向量。待使用隐向量为基于多个待使用分词向量进行拼接处理后，得到的隐向量。

将待分析文本输入BERT模型中，并基于BERT模型对待分析文本中的每个待使用分词进行编码，可以得到与每个待使用分词相对应的待使用分词向量，示例性地，将

输入该模型中，采用BERT模型的标准编码方式对矩阵中每个待使用分词进行编码，输出每个分词所对应的上下文向量表征，即为与每个分词相对应的待使用分词向量。其中，将第i个分词x _i的待使用分词向量记为h _i，则待分析文本

所对应的待使用隐向量即可以表示为：

h ₁…h _n＝BERT(x ₁x ₂…x _n)

其中，n表示待使用分词的数量，h ₁…h _n表示待使用隐向量，x表示待分析文本中的待使用分词。

S140、根据第一嵌入向量、第二嵌入向量和待使用隐向量，确定待分析文本所对应的情感信息。

在本技术方案中，经过上述内容对待分析文本进行处理后，在第一嵌入向量中包括与待分析文本相对应的上下文特征信息，在第二嵌入向量中包括与待分析文本相对应的句法特征信息，同时，在待使用隐向量中包含与待分析文本相对应的情感特征信息。基于此，根据第一嵌入向量、第二嵌入向量和待使用隐向量，可以确定待分析文本所对应的情感信息。

可选的，根据第一嵌入向量、第二嵌入向量和待使用隐向量，确定待分析文本所对应的情感信息，包括：根据第一嵌入向量和待使用隐向量，确定第一嵌入向量所对应的第一权重；根据第二嵌入向量和待使用隐向量，确定第二嵌入向量所对应的第二权重；根据第一嵌入向量、第一权重、第二嵌入向量和第二权重，确定待分析文本所对应的情感信息。

在本技术方案中，可以通过分析上下文特征和语法特征在情感分析中的影响程度，以确定与第一嵌入向量相对应的第一权重，以及与第二嵌入向量相对应的第二权重。

可以通过以下公式确定第一权重：

其中，

表示第一权重，exp表示以自然常数e为底的指数函数，

表示第一嵌入向量，h _i表示待使用分词向量，j表示加和个数，2r表示与待使用分词相关联的分词数量。

可以通过以下公式确定第二权重：

其中，

表示第二权重，exp表示以自然常数e为底的指数函数，

表示第二嵌入向量，h _i表示待使用分词向量，k表示加和个数，m _i表示与待使用分词相关联的分词数量。

在本技术方案中，第一嵌入向量可以是针对待分析文本中的每个待使用分词所对应的向量，相应的，第二嵌入向量为针对待分析文本中的每个待使用分词所对应的向量。而与待分析文本相对应的上下文特征向量为基于多个第一嵌入向量拼接得到的，与待分析文本相对应的语法特征向量为基于多个第二嵌入向量得到的。也就是说，在本技术方案中是通过对每个待使用分词分别进行处理后，可以得到与每个待使用分词相对应的情感信息。

根据第一嵌入向量、第一权重、第二嵌入向量和第二权重，确定待分析文本所对应的情感信息，包括：基于第一嵌入向量和第一权重，得到第一待拼接向量，并基于第二嵌入向量和第二权重，得到第二待拼接向量；将第一待拼接向量和第二待拼接向量进行拼接处理，得到目标向量；将目标向量输入预先构建的解码器，以基于解码器对目标向量进行情感分析，以确定待分析文本所对应的情感信息。

第一待拼接向量可以理解为基于第一嵌入向量和第一权重相乘得到的向量，第二待拼接向量可以理解为基于第二嵌入向量和第二权重相乘得到的向量。目标向量可以理解为对第一待拼接向量和第二待拼接向量拼接得到的向量。例如，将待分析文本中的分词1所对应的第一待拼接向量和第二待拼接向量进行拼接，得到与分词1相对应的目标向量。

第一待拼接向量可以基于以下公式得到：

其中，

表示第一待拼接向量，

表示第一权重，

表示第一嵌入向量，j表示加和个数，2r表示与待使用分词相关联的分词数量，·表示两个向量的内积。

第二拼接向量可以基于以下公式得到：

其中，

表示第二待拼接向量，

表示第二权重，

表示第二嵌入向量，k表示加和个数，m _i表示与待使用分词相关联的分词数量，·表示两个向量的内积。

基于以下公式可以得到目标向量：

其中，a _i表示目标向量，

表示第一待拼接向量，

表示第二待拼接向量，

表示将第一待拼接向量和第二待拼接向量进行拼接处理。

在确定待分析文本中的每个分词相对应的目标向量后，基于每个目标向量进行拼接处理，可以得到与待分析文本相对应的目标向量。将与待分析文本相对应的目标向量输入全连接层进行处理，以将处理后的向量输入预先构建的解码器中，如，送入softmax解码器，即可得到与每个分词相对应的标签，以根据每个分词的标签的含义，输出模型预测的方面词以及方面词的情感极性。

也就是说，若在待分析文本中包含10个分词，在最后的输出结果中，即包括与这个10个分词相对应的情感信息，情感信息可以用“积极”或“消极”进行表示。这样设置，可以对待分析文本中的每个分词分别进行情感信息的分析，颗粒度更细，可以更好的帮助对待分析文本的情感分析。

本技术方案，通过双通道注意力机制对待分析文本进行分析，可以同时对待分析文本的上下文特征和句法特征进行分析，更加快速，且通过对待分析文本中的每个分词进行情感分析，使得到的待分析文本所对应的情感信息更加准确。

本实施例的技术方案，获取待分析文本，并确定待分析文本所对应的第一待使用特征信息和第二待使用特征信息，通过构建与待分析文本相对应的依存句法树，可以确定待分析文本中每个分词所对应的上下文特征信息和句法特征信息。确定与第一待使用特征信息所对应的第一嵌入向量，并确定与第二待使用特征信息相对应的第二嵌入向量，基于上下文特征嵌入矩阵确定第一嵌入向量，基于句法特征嵌入矩阵确定第二嵌入向量。确定待分析文本所对应的待使用隐向量，同时，基于BERT模型得到与待分析文本相对应的待使用隐向量，以根据第一嵌入向量、第二嵌入向量和待使用隐向量，确定待分析文本所对应的情感信息。根据上下文特征和句法特征随待分析文本情感信息的影响程度，自动确定第一嵌入向量的第一权重，第二嵌入向量的第二权重，以基于第一嵌入向量、第二嵌入向量和待使用隐向量，确定待分析文本所对应的情感信息。解决了对文本所对应的情感信息分析不够准确，且分析效率较低的问题，达到了快速准确的对文本进行情感信息的分析的效果。

实施例二

在一个例子中，本技术方案中对待分析文本进行情感信息的分析的模型结构如图2所示，其中，模型中的右侧的上下文特征与句法知识特征的例子均以“汤”为例给出。在本技术方案中，待分析文本通常为包含至少两个分词的文本，但是在对待分析文本进行情感分析时，是通过对待分析文本中的每个分词分别进行情感分析。也就是说，若在待分析文本中包含10个分词，则最终得到的情感信息的数量为10个，与每个分词一一对应。

在图2的模型中，采用了序列标注的基本框架，待分析文本中的每个分词被赋予一个标签。其中，方面词的标签由两部分组成，第一部分表示该方面词在所有方面词中的位置，第二部分表示该方面词所对应的情感极性，可以用“POS”表示积极情感，用“NEG”表示消极情感。示例性地，待分析文本为“这个蘑菇海鲜汤很棒”，其中，“蘑菇”在方面词“蘑菇海鲜汤”中位于开始，则其第一部分的标签为B，其情感极性为积极情感，则第二部分标签为“POS”；相类似的，“海鲜”在“蘑菇海鲜汤”中位于开始，则其第一部分标签为I，其情感极性为积极情感，则第二部分标签为“POS”；而“这个”并不属于任何方面词，则其标签为“O”。

另外，在本技术方案中，采用了标准的编码解码架构，其中，编码器采用BERT模型，解码器采用softmax解码器。在本技术方案中，基于双通道注意力机制对待分析文本进行分析，在一实施例中，本技术方案通过上下文通道注意力机制和句法知识特征通道注意力机制，同时对待分析文本进行分析，以得到与待分析文本相对应的情感信息。

采用依存句法分析工具构建与待分析文本相对应的依存句法树得到

其中，x _i表示第i个词。对待分析文本中的每个分词x _i，提取其上下文特征，并通过依存句法树提取其句法知识特征信息。

示例性地，在提取每个分词的上下文特征时，可以选取该分词前r个词以及后r个词(即，x _i-r，…，x _i-1，x _i+1，…，x _i+r)，共计2r个词组成x _i的上下文特征(即，第一待使用特征信息)，记为C _i＝[c _i,1,…c _i,j…c _i,2r]。其中，在本技术方案中，r可以选取为1，但r的取值可以根据实际情况进行设置，也可以设置为其他自然数。同时，提取每个分词所对应的句法知识特征(即，第二待使用特征信息)。可以选取所有与x _i存在依存句法关系的分词，以及该分词与x _i之间的依存句法关系类型，并把该分词与依存句法关系类型拼接，形成句法知识特征信息，记为

其中m _i表示与x _i关联的句法知识的个数。

以x _i＝“汤”为例，与“汤”有关的词有“这个”、“蘑菇”、“海鲜”、“棒”，他们与“汤”之间的依存句法关系类型依次为“det”，“compound”，“compound”，“nsubj”，所以最后得到的句法知识为S ₄＝[这个-det，蘑菇-compound，海鲜-compound，棒-nsubj]。其中，det表示限定词，compound表示复合标识符，nsubj表示名词主语。

通过第一嵌入函数，将第一待使用特征信息c _i,j映射为上下文特征嵌入向量

可以预先构建一个包含所有上下文特征的词表(即，上下文特征嵌入矩阵)，并赋予每个上下文特征一个序号(即，第一映射信息)，接下来，从上下文特征嵌入矩阵(该矩阵的行数等于词表中词的个数)中，提取上下文特征对应序号的行数所对应的向量，作为上下文特征的嵌入(即，第一嵌入向量)。

通过第二嵌入函数，将句法知识s _i,k映射为句法知识嵌入向量

可以预先构建一个包含所有句法知识特征的词表(即，句法特征嵌入矩阵)，并赋予每个句法知识特征一个序号(即，第二映射信息)，接下来，从句法特征嵌入矩阵(该矩阵的行数等于词表中词的个数)中，提取句法特征嵌入矩阵对应序号的行数所对应的向量，作为句法特征嵌入矩阵的嵌入(即，第二嵌入向量)。

还需要使用BERT模型对待分析文本进行编码，得到每个分词所对应的隐向量(即，待使用分词向量)。即，把句子

输入标准的BERT模型，采用BERT标准的编码方式，对句子中的每个词进行编码，输出相应的隐向量。其中，第i个词x _i的隐向量记为h _i。可以采用以下公式得到：

h ₁…h _n＝BERT(x ₁x ₂…x _n)

其中，n表示待使用分词的数量，h _n表示待使用分词向量，h ₁…h _n表示待使用隐向量，x表示待分析文本中的待使用分词。

基于以下公式确定与第一嵌入向量相对应的第一权重：

其中，

表示第一权重，exp表示以自然常数e为底的指数函数，

基于第一嵌入向量和第一权重，得到第一待拼接向量。其中，第一待拼接向量可以基于以下公式得到：

其中，

表示第一待拼接向量，

表示第一权重，

相类似地，基于以下公式确定与第二嵌入向量相对应的第二权重：

其中，

表示第二权重，exp表示以自然常数e为底的指数函数，

基于第二嵌入向量和第二权重，得到第二待拼接向量。其中，第二待拼接向量可以基于以下公式得到：

其中，

表示第二待拼接向量，

表示第二权重，

基于第一待拼接向量和第二待拼接向量可以得到目标向量，目标向量可以通过以下公式确定：

其中，a _i表示目标向量，

表示第一待拼接向量，

表示第二待拼接向量，

表示将第一待拼接向量和第二待拼接向量进行拼接处理。

在确定待分析文本中的每个分词相对应的目标向量后，基于每个目标向量进行拼接处理，可以得到与待分析文本相对应的目标向量。将与待分析文本相对应的目标向量输入全连接层进行处理，以将处理后的向量输入预先构建的解码器中，如，送入softmax解码器，即可得到与每个分词相对应的标签，以根据每个分词的标签的含义，输出模型预测的方面词以及该方面词的情感极性。

本实施例的技术方案，获取待分析文本，并确定待分析文本所对应的第一待使用特征信息和第二待使用特征信息，通过构建与待分析文本相对应的依存句法树，可以确定待分析文本中每个分词所对应的上下文特征信息和句法特征信息。确定与第一待使用特征信息所对应的第一嵌入向量，并确定与第二待使用特征信息相对应的第二嵌入向量，分别基于上下文特征嵌入矩阵确定第一嵌入向量，基于句法特征嵌入矩阵确定第二嵌入向量。确定待分析文本所对应的待使用隐向量，同时，基于BERT模型得到与待分析文本相对应的待使用隐向量，以根据第一嵌入向量、第二嵌入向量和待使用隐向量，确定待分析文本所对应的情感信息。根据上下文特征和句法特征随待分析文本情感信息的影响程度，自动确定第一嵌入向量的第一权重，第二嵌入向量的第二权重，以基于第一嵌入向量、第二嵌入向量和待使用隐向量，确定待分析文本所对应的情感信息。解决了对文本所对应的情感信息分析不够准确，且分析效率较低的问题，达到了快速准确的对文本进行情感信息的分析的效果。

实施例三

图3为本申请实施例三提供的一种文本情感分析装置的结构示意图。如图3所示，该装置包括：特征信息确定模块210、嵌入向量确定模块220、隐向量确定模块230和情感信息确定模块240。

特征信息确定模块210，设置为获取待分析文本，并确定待分析文本所对应的第一待使用特征信息和第二待使用特征信息，其中，第一待使用特征信息为上下文特征信息，第二待使用特征信息为句法特征信息；

嵌入向量确定模块220，设置为确定与第一待使用特征信息所对应的第一嵌入向量，并确定与第二待使用特征信息相对应的第二嵌入向量；

隐向量确定模块230，设置为确定待分析文本所对应的待使用隐向量；

情感信息确定模块240，设置为根据第一嵌入向量、第二嵌入向量和待使用隐向量，确定待分析文本所对应的情感信息。

可选的，特征信息确定模块210，包括：句法树确定单元，设置为确定与待分析文本相对应的依存句法树；其中，待分析文本中包括至少两个分词，依存句法树为基于至少两个分词之间的上下文特征和句法特征进行构建的；

第一待使用特征信息确定单元，设置为基于依存句法树中，至少两个分词之间的上下文特征依赖关系，得到与待分析文本相对应的第一待使用特征信息；

第二待使用特征信息确定单元，设置为基于依存句法树中，至少两个分词之间的句法依赖关系，得到与待分析文本相对应的第二待使用特征信息。

可选的，嵌入向量确定模块220，包括：第一待使用映射信息确定单元，设置为基于第一嵌入函数，将第一待使用特征信息进行映射处理，得到第一待使用映射信息；

第一嵌入向量确定单元，设置为确定第一待使用映射信息，在上下文特征嵌入矩阵中的第一位置信息，并根据第一位置信息所对应的矩阵元素，确定第一待使用映射信息所对应的第一嵌入向量。

可选的，嵌入向量确定模块220，还包括：第二待使用映射信息确定单元，设置为基于第二嵌入函数，将第二待使用特征信息进行映射处理，得到第二待使用映射信息；

第二嵌入向量确定单元，设置为确定第二待使用映射信息，在句法特征嵌入矩阵中的第二位置信息，并根据第二位置信息所对应的矩阵元素，确定第二待使用映射信息所对应的第二嵌入向量。

可选的，隐向量确定模块230包括：分词分量确定单元，设置为基于语言表征模型，对待分析文本进行编码，得到与待分析文本中每个分词相对应的待使用分词向量；

隐向量确定单元，设置为将多个待使用分词向量进行拼接处理，得到与待分析文本相对应的待使用隐向量。

可选的，情感信息确定模块240，包括：第一权重确定单元，设置为根据第一嵌入向量和待使用隐向量，确定第一嵌入向量所对应的第一权重；

第二权重确定单元，设置为根据第二嵌入向量和待使用隐向量，确定第二嵌入向量所对应的第二权重；

情感信息确定单元，设置为根据第一嵌入向量、第一权重、第二嵌入向量和第二权重，确定待分析文本所对应的情感信息。

可选的，情感信息确定单元，包括：拼接向量确定子单元，设置为基于第一嵌入向量和第一权重，得到第一待拼接向量，并基于第二嵌入向量和第二权重，得到第二待拼接向量；

目标向量确定子单元，设置为将第一待拼接向量和第二待拼接向量进行拼接处理，得到目标向量；

情感信息子确定单元，设置为将目标向量输入预先构建的解码器，以基于解码器对目标向量进行情感分析，以确定待分析文本所对应的情感信息。

本申请实施例所提供的文本情感分析装置可执行本申请任意实施例所提供的文本情感分析方法，具备执行方法相应的功能模块和效果。

实施例四

图4示出了本申请的实施例的电子设备10的结构示意图。电子设备旨在表示多种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示多种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图4所示，电子设备10包括至少一个处理器11，以及与至少一个处理器11通信连接的存储器，如只读存储器(Read-Only Memory，ROM)12、随机访问存储器(Random Access Memory，RAM)13等，其中，存储器存储有可被至少一个处理器执行的计算机程序，处理器11可以根据存储在ROM12中的计算机程序或者从存储单元18加载到RAM13中的计算机程序，来执行多种适当的动作和处理。在RAM 13中，还可存储电子设备10操作所需的多种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(Input/Output，I/O)接口15也连接至总线14。

电子设备10中的多个部件连接至I/O接口15，包括：输入单元16，例如键盘、鼠标等；输出单元17，例如多种类型的显示器、扬声器等；存储单元18，例如磁盘、光盘等；以及通信单元19，例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或多种电信网络与其他设备交换信息/数据。

处理器11可以是多种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(Central Processing Unit，CPU)、图形处理单元(Graphics Processing Unit，GPU)、多种专用的人工智能(Artificial Intelligence，AI)计算芯片、多种运行机器学习模型算法的处理器、数字信号处理器(Digital Signal Processor，DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的多个方法和处理，例如文本情感分析方法。

在一些实施例中，文本情感分析方法可被实现为计算机程序，其被有形地包含于计算机可读存储介质，例如存储单元18。在一些实施例中，计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时，可以执行上文描述的文本情感分析方法的一个或多个步骤。备选地，在其他实施例中，处理器11可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行文本情感分析方法。

本文中以上描述的系统和技术的多种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(Field Programmable Gate Array，FPGA)、专用集成电路(Application Specific Integrated Circuit，ASIC)、专用标准产品(Application Specific Standard Parts，ASSP)、芯片上系统的系统(System on Chip，SOC)、复杂可编程逻辑设备(Complex Programmable Logic Device，CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些多种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本申请的文本情感分析方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本申请的上下文中，计算机可读存储介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。备选地，计算机可读存储介质可以是机器可读信号介质。机器可读存储介质包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、RAM、ROM、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，EPROM)、快闪存储器、光纤、便捷式紧凑盘只读存储器(Compact Disc Read Only Memory，CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。存储介质可以是非暂态(non-transitory)存储介质。

为了提供与用户的交互，可以在电子设备上实施此处描述的系统和技术，该电子设备具有：用于向用户显示信息的显示装置(例如，阴极射线管(Cathode Ray Tube，CRT)或者液晶显示器(Liquid Crystal Display，LCD)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(Local Area Network，LAN)、广域网(Wide Area Network，WAN)、区块链网络和互联网。

计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与虚拟专用服务器(Virtual Private Server，VPS)服务中，存在的管理难度大，业务扩展性弱的缺陷。

可以使用上面所示的多种形式的流程，重新排序、增加或删除步骤。例如，本申请中记载的多个步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请的技术方案所期望的结果，本文在此不进行限制。

上述实施方式，并不构成对本申请保护范围的限制。根据设计要求和其他因素，可以进行多种修改、组合、子组合和替代。

Claims

一种文本情感分析方法，包括：

获取待分析文本，并确定所述待分析文本所对应的第一待使用特征信息和第二待使用特征信息，其中，所述第一待使用特征信息为上下文特征信息，所述第二待使用特征信息为句法特征信息；

确定与所述第一待使用特征信息所对应的第一嵌入向量，并确定与所述第二待使用特征信息相对应的第二嵌入向量；

确定所述待分析文本所对应的待使用隐向量；

根据所述第一嵌入向量、所述第二嵌入向量和所述待使用隐向量，确定所述待分析文本所对应的情感信息。
根据权利要求1所述的方法，其中，所述确定所述待分析文本所对应的第一待使用特征信息和第二待使用特征信息，包括：

确定与所述待分析文本相对应的依存句法树，其中，所述待分析文本中包括至少两个分词，所述依存句法树为基于所述至少两个分词之间的上下文特征和句法特征进行构建的；

基于所述依存句法树中，所述至少两个分词之间的上下文特征依赖关系，得到与所述待分析文本相对应的第一待使用特征信息；

基于所述依存句法树中，所述至少两个分词之间的句法依赖关系，得到与所述待分析文本相对应的第二待使用特征信息。
根据权利要求1所述的方法，其中，所述确定与所述第一待使用特征信息所对应的第一嵌入向量，包括：

基于第一嵌入函数，将所述第一待使用特征信息进行映射处理，得到第一待使用映射信息；

确定所述第一待使用映射信息，在上下文特征嵌入矩阵中的第一位置信息，并根据所述第一位置信息所对应的矩阵元素，确定所述第一待使用映射信息所对应的第一嵌入向量。
根据权利要求1所述的方法，其中，所述确定与所述第二待使用特征信息相对应的第二嵌入向量，包括：

基于第二嵌入函数，将所述第二待使用特征信息进行映射处理，得到第二待使用映射信息；

确定所述第二待使用映射信息，在句法特征嵌入矩阵中的第二位置信息，并根据所述第二位置信息所对应的矩阵元素，确定所述第二待使用映射信息所对应的第二嵌入向量。
根据权利要求1所述的方法，其中，所述确定所述待分析文本所对应的待使用隐向量，包括：

基于语言表征模型，对所述待分析文本进行编码，得到与所述待分析文本中每个分词相对应的待使用分词向量；

将多个待使用分词向量进行拼接处理，得到与所述待分析文本相对应的待使用隐向量。
根据权利要求1所述的方法，其中，所述根据所述第一嵌入向量、所述第二嵌入向量和所述待使用隐向量，确定所述待分析文本所对应的情感信息，包括：

根据所述第一嵌入向量和所述待使用隐向量，确定所述第一嵌入向量所对应的第一权重；

根据所述第二嵌入向量和所述待使用隐向量，确定所述第二嵌入向量所对应的第二权重；

根据所述第一嵌入向量、所述第一权重、所述第二嵌入向量和所述第二权重，确定所述待分析文本所对应的情感信息。
根据权利要求6所述的方法，其中，所述根据所述第一嵌入向量、所述第一权重、所述第二嵌入向量和所述第二权重，确定所述待分析文本所对应的情感信息，包括：

基于所述第一嵌入向量和所述第一权重，得到第一待拼接向量，并基于所述第二嵌入向量和所述第二权重，得到第二待拼接向量；

将所述第一待拼接向量和所述第二待拼接向量进行拼接处理，得到目标向量；

将所述目标向量输入预先构建的解码器，以基于所述解码器对所述目标向量进行情感分析，以确定所述待分析文本所对应的情感信息。
一种文本情感分析装置，包括：

特征信息确定模块，设置为获取待分析文本，并确定所述待分析文本所对应的第一待使用特征信息和第二待使用特征信息，其中，所述第一待使用特征信息为上下文特征信息，所述第二待使用特征信息为句法特征信息；

嵌入向量确定模块，设置为确定与所述第一待使用特征信息所对应的第一嵌入向量，并确定与所述第二待使用特征信息相对应的第二嵌入向量；

隐向量确定模块，设置为确定所述待分析文本所对应的待使用隐向量；

情感信息确定模块，设置为根据所述第一嵌入向量、所述第二嵌入向量和所述待使用隐向量，确定所述待分析文本所对应的情感信息。
一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的文本情感分析方法。
一种计算机可读存储介质，其中，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的文本情感分析方法。