CN114676704A - 句子情感分析方法、装置、设备以及存储介质 - Google Patents

句子情感分析方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN114676704A
CN114676704A CN202210595553.0A CN202210595553A CN114676704A CN 114676704 A CN114676704 A CN 114676704A CN 202210595553 A CN202210595553 A CN 202210595553A CN 114676704 A CN114676704 A CN 114676704A
Authority
CN
China
Prior art keywords
word
representation
sentence
feature
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210595553.0A
Other languages
English (en)
Other versions
CN114676704B (zh
Inventor
杨锦杰
胡晓晖
薛云
代安安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN202210595553.0A priority Critical patent/CN114676704B/zh
Publication of CN114676704A publication Critical patent/CN114676704A/zh
Application granted granted Critical
Publication of CN114676704B publication Critical patent/CN114676704B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明涉及情感分析领域,特别涉及一种句子情感分析方法,方法包括:获取待测语句的句子表示、依赖信息以及词性标注信息,将待测语句的句子表示输入至词嵌入模型,获取待测语句的词嵌入表示;将待测语句的词嵌入表示、依赖类型信息以及词性标注信息输入记忆神经网络,获取待测语句的依赖类型特征表示以及词性标注特征表示;将待测语句的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至图卷积神经网络,获取隐藏层特征表示,获取距离数据,将隐藏层特征表示以及距离数据输入至面向方面词语句表示模型,获取目标语句特征表示;将方面词对应的隐藏层特征表示、目标语句特征表示输入至全连接神经网络,获取情感分析结果。

Description

句子情感分析方法、装置、设备以及存储介质
技术领域
本发明涉及情感分析领域,特别涉及是一种句子情感分析方法、装置、设备以及存储介质。
背景技术
随着网络时代的发展,人们会通过各种社交媒体或APP对一些产品、商铺和人物等发表自己的观点,作为一项细粒度的情感分析任务,基于方面级的情感分析目前已受到广泛的关注。
现有的技术方案是基于语义的方法,通常都是通过神经网络自动学习各上下文单词的注意力权重,结合该注意力权重对句子的方面词进行分析,然而,缺乏先验知识可能会造成方面词对上下文词的关联偏差,从而引入一些不必要的噪声,导致识别情绪信息结果不准确,效率低下,从而无法准确地对文本语句进行情感分析。
发明内容
基于此,本发明的目的在于,提供一种句子情感分析方法、装置、设备以及存储介质,通过结合待测语句的依赖信息以及词性标注信息,提高了方面词对上下文词的关联性,从而更加精确地对文本语句的情感进行分析。
第一方面,本申请实施例提供了一种句子情感分析方法,包括以下步骤:
获取待测语句的句子表示、依赖信息以及词性标注信息,其中,所述待测语句包括若干个句子,句子包括若干个单词,所述单词包括上下文单词以及方面词,所述依赖信息包括依赖边信息以及依赖类型信息,所述依赖边信息为单词与单词之间的具有依赖关系,所述依赖类型信息为单词与单词之间的依赖类型向量表示,所述词性标注信息为各个单词对应的词性标注向量表示;
将所述各个单词对应的词嵌入表示、所述依赖类型信息以及所述词性标注信息输入预设的记忆神经网络中,获取所述各个单词对应的依赖类型特征表示以及词性标注特征表示;
将所述各个单词对应的词嵌入表示、所述依赖类型信息以及所述词性标注信息输入预设的记忆神经网络中,获取所述各个单词对应的依赖类型特征表示以及词性标注特征表示;
将所述待测语句的依赖信息以及词性标注信息,所述待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至预设的图卷积神经网络中,获取各个单词对应的隐藏层特征表示,其中,所述隐藏层特征表示包括上下文单词对应的隐藏层特征表示以及方面词对应的隐藏层特征表示;
获取所述上下文单词与所述方面词之间的距离数据,将所述隐藏层特征表示以及所述距离数据输入至预设的面向方面词语句表示模型中,获取所述面向方面词语句表示模型输出的目标语句特征表示;
将所述方面词对应的隐藏层特征表示、目标语句特征表示输入至预设的全连接神经网络,获取所述全连接神经网络输出的待测语句的情感分析结果。
第二方面,本申请实施例提供了一种句子情感分析装置,包括:
获取模块,用于获取待测语句的句子表示、依赖信息以及词性标注信息,其中,所述待测语句包括若干个句子,句子包括若干个单词,所述单词包括上下文单词以及方面词,所述依赖信息包括依赖边信息以及依赖类型信息,所述依赖边信息为单词与单词之间的具有依赖关系,所述依赖类型信息为单词与单词之间的依赖类型向量表示,所述词性标注信息为各个单词对应的词性标注向量表示;
词嵌入处理模块,用于将所述句子表示输入至预设的词嵌入模型,获取所述各个单词对应的词嵌入表示;
第一特征处理模块,用于将所述各个单词对应的词嵌入表示、所述依赖类型信息以及所述词性标注信息输入预设的记忆神经网络中,获取所述各个单词对应的依赖类型特征表示以及词性标注特征表示;
第二特征处理模块,用于将所述待测语句的依赖信息以及词性标注信息,所述待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至预设的图卷积神经网络中,获取各个单词对应的隐藏层特征表示,其中,所述隐藏层特征表示包括上下文单词对应的隐藏层特征表示以及方面词对应的隐藏层特征表示;
第三特征处理模块,用于获取所述上下文单词与所述方面词之间的距离数据,将所述隐藏层特征表示以及所述距离数据输入至预设的面向方面词语句表示模型中,获取所述面向方面词语句表示模型输出的目标语句特征表示;
分析模块,用于将所述方面词对应的隐藏层特征表示、目标语句特征表示输入至预设的全连接神经网络,获取所述全连接神经网络输出的待测语句的情感分析结果。
第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如第一方面所述句子情感分析方法的步骤。
第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的句子情感分析方法的步骤。
在本申请实施例中,提供一种句子情感分析方法、装置、设备以及存储介质,通过结合待测语句的依赖信息以及词性标注信息,提高了方面词对上下文词的关联性,从而更加精确地对文本语句的情感进行分析。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本申请一个实施例提供的句子情感分析方法的流程示意图;
图2为本申请一个实施例提供的句子情感分析方法中S3的流程示意图;
图3为本申请一个实施例提供的句子情感分析方法中S4的流程示意图;
图4为本申请一个实施例提供的句子情感分析方法中S404的流程示意图;
图5为本申请另一个实施例提供的句子情感分析方法中S4的流程示意图;
图6为本申请一个实施例提供的句子情感分析方法中S5的流程示意图;
图7为本申请一个实施例提供的句子情感分析方法中S6的流程示意图;
图8为本申请一个实施例提供的句子情感分析装置的结构示意图;
图9为本申请一个实施例提供的计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
请参阅图1,图1为本申请一个实施例提供的句子情感分析方法的流程示意图,方法包括如下步骤:
S1:获取待测语句的句子表示、依赖信息以及词性标注信息。
句子情感分析方法的执行主体为句子情感分析方法的分析设备(以下简称分析设备)。分析设备可以通过软件和/或硬件的方式实现,可以通过软件和/或硬件的方式实现句子情感分析方法,该分析设备可以是两个或多个物理实体构成,也可以是一个物理实体构成。分析设备所指向的硬件,本质上均是指计算机设备,例如,分析设备可以是电脑、手机、平板或交互平板等设备。在一个可选的实施例中,分析设备具体可以是服务器,或是多台计算机设备联合而成的服务器机群。
待测语句包括若干个单词,单词为句子中所描述的某一实体,可以是名词、形容词等等;
单词包括上下文单词以及方面词,依赖信息包括依赖边信息以及依赖类型信息,依赖边信息为单词与单词之间的具有依赖关系;
依赖类型信息为单词与单词之间的依赖类型向量表示,具体地,依赖类型有42种,每种依赖类型都有对应的向量表示。
词性标注信息为各个单词对应的词性标注向量表示,词性有47种,每种词性标注都有对应的向量表示。
在本实施例中,分析设备可以获取用户输入的获取待测语句的句子表示,可以通过使用StanfordCoreNLP工具对待测语句进行分析,获取与待测语句相关联的依赖信息以及词性标注信息,也可以在预设的数据库中,获取待测语句的句子表示、依赖信息以及词性标注信息,其中,待测语句的句子表示为:
Figure 699778DEST_PATH_IMAGE001
式中,S为待测语句的句子表示,包含了n个上下文单词对应的单词向量
Figure 837368DEST_PATH_IMAGE002
和由m个方面词组成的方面词对应的单词向量
Figure DEST_PATH_IMAGE003
S2:将各个单词对应的词嵌入表示、依赖类型信息以及词性标注信息输入预设的记忆神经网络中,获取各个单词对应的依赖类型特征表示以及词性标注特征表示。
词嵌入模型可以采用BERT(Bidirectional Encoder Representation fromTransformers)模型,也可以采用GloVe模型。
在本实施例中,分析设备将待测语句的句子表示输入至预设的词嵌入模型,使用BERT模型对待测语句进行编码,获取初始的上下文隐藏层表示,即待测语句的各个单词对应的词嵌入表示,其中,词嵌入表示为:
Figure 581857DEST_PATH_IMAGE004
式中,H为待测语句的词嵌入表示集合,包括各个单词对应的词嵌入表示
Figure DEST_PATH_IMAGE005
S3:将各个单词对应的词嵌入表示、依赖类型信息以及词性标注信息输入预设的记忆神经网络中,获取各个单词对应的依赖类型特征表示以及词性标注特征表示。
记忆神经网络可以采用KVMN(key-value memory network)记忆神经网络,利用KVMN记忆神经网络从方面词与上下文单词的依赖信息中学习方面词的表示。
在本实施例中,分析设备将各个单词对应的词嵌入表示、依赖类型信息以及词性标注信息输入预设的记忆神经网络中,获取各个单词对应的依赖类型特征表示以及词性标注特征表示。
请参阅图2,图2为本申请一个实施例提供的句子情感分析方法中S3的流程示意图,包括步骤S301~S302,具体如下:
S301:获取所述待测语句中单词与单词之间的依赖边特征表示,将所述待测语句的各个单词对应的词嵌入表示以及依赖边特征表示输入至所述权重层,根据预设的第一权重系数计算算法,获取所述待测语句的第一权重系数集。
第一权重系数集包括单词与单词之间的第一权重系数,其中,第一权重系数用于体现单词与单词之间的关联性。
第一权重系数计算算法为:
Figure 668762DEST_PATH_IMAGE006
式中,
Figure DEST_PATH_IMAGE007
为第i个单词以及第j个单词之间的第一权重系数,
Figure 204785DEST_PATH_IMAGE008
为第i个单词对应的词嵌入表示,
Figure DEST_PATH_IMAGE009
为第j个单词对应的词嵌入表示,n为所述待测语句的单词的总数目;
Figure 360829DEST_PATH_IMAGE010
为第i个单词与第j个单词之间的依赖边特征表示;
在本实施例中,分析设备获取所述待测语句中单词与单词之间的依赖边特征表示,将所述待测语句的各个单词对应的词嵌入表示以及依赖边特征表示输入至所述权重层,根据预设的第一权重系数计算算法,获取所述待测语句的第一权重系数集。
S302:将所述第一权重系数集、待测语句的依赖类型信息以及词性标注信息输入至所述编码层,根据预设的依赖类型特征表示计算算法以及词性标注特征表示计算算法,分别获取所述待测语句的各个单词对应的依赖类型特征表示以及词性标注特征表示。
所述依赖类型特征表示计算算法为:
Figure DEST_PATH_IMAGE011
式中,
Figure 640501DEST_PATH_IMAGE012
为第i个单词对应的依赖类型特征表示,
Figure DEST_PATH_IMAGE013
为第i个单词以及第j个单词之间的依赖类型向量表示;
在本实施例中,分析设备根据第一权重系数集、待测语句的依赖类型信息以及预设的依赖类型特征表示计算算法,获取待测语句的各个单词对应的依赖类型特征表示。
所述词性标注特征表示计算算法为:
Figure 975055DEST_PATH_IMAGE014
式中,
Figure DEST_PATH_IMAGE015
为第i个单词对应的词性标注特征表示,
Figure 26187DEST_PATH_IMAGE016
为第j个对应的词性标注向量表示。
在本实施例中,分析设备根据第一权重系数集、待测语句的词性标注信息以及预设的词性标注特征表示计算算法,获取待测语句的各个单词对应的词性标注特征表示。
请参阅图3,图3为本申请另一个实施例提供的句子情感分析方法中S3的流程示意图,还包括步骤S303,步骤S304在步骤S301之前,具体如下:
S303:根据依赖信息中的依赖边信息,构建待测语句的依赖边矩阵。
在本实施例中,分析设备根据依赖信息中的依赖边信息,构建待测语句的依赖边矩阵,其中,依赖边矩阵为:
Figure DEST_PATH_IMAGE017
式中,A为依赖边矩阵,
Figure 810473DEST_PATH_IMAGE018
为依赖边特征表示,
Figure DEST_PATH_IMAGE019
代表依赖边信息为单词与单词之间的具有依赖关系,
Figure 752890DEST_PATH_IMAGE020
代表依赖边信息为单词与单词之间的不具有依赖关系。
S4:将待测语句的依赖信息以及词性标注信息,待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至预设的图卷积神经网络中,获取各个单词对应的隐藏层特征表示。
图卷积神经网络可以采用DPGCN(Dependency-Pos Graph Convolution Network)图卷积神经网络,其中,图卷积神经网络包括依次连接的图卷积计算模块、权重计算模块以及隐藏特征计算模块,图卷积计算模块以及隐藏特征计算模块均包括依次连接的输入层以及若干个图卷积层。
在本实施例中,分析设备将待测语句的依赖信息以及词性标注信息,待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至预设的图卷积神经网络中,获取各个单词对应的隐藏层特征表示,其中,隐藏层特征表示包括上下文单词对应的隐藏层特征表示以及方面词对应的隐藏层特征表示。
请参阅图4,图4为本申请一个实施例提供的句子情感分析方法中S4的流程示意图,包括步骤S401~S404,具体如下:
S401:将待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至图卷积计算模块的输入层,根据预设的第一拼接公式,获取图卷积计算模块的输入层对应的各个单词对应的拼接特征表示,并将图卷积计算模块的输入层对应的各个单词对应的拼接特征表示作为隐藏特征计算模块的输入层对应的各个单词对应的拼接特征表示。
第一拼接公式为:
Figure DEST_PATH_IMAGE021
式中,
Figure 939020DEST_PATH_IMAGE022
为图卷积计算模块的输入层对应的第i个单词对应的拼接特征表示,
Figure DEST_PATH_IMAGE023
为拼接符号;
Figure 85355DEST_PATH_IMAGE024
为图卷积计算模块的输入层对应的第j个单词对应的拼接特征表示;
在本实施例中,分析设备将待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至图卷积计算模块的输入层,根据预设的第一拼接公式,对待测语句的各个单词对应的词嵌入表示、依赖类型特征表示、词性标注特征表示进行拼接,获取图卷积神经网络的第一层输出的各个单词对应的隐藏层特征表示。
S402:将隐藏特征计算模块的输入层对应的各个单词对应的拼接特征表示、依赖信息中的依赖类型信息以及词性标注信息输入至图卷积计算模块的图卷积层,根据预设的第二拼接公式,获取图卷积计算模块的图卷积层的第一层对应的各个单词对应的拼接特征表示。
第二拼接公式为:
Figure DEST_PATH_IMAGE025
式中,
Figure 435565DEST_PATH_IMAGE026
为隐藏特征计算模块的第l层对应的第i个单词对应的隐藏层特征表示;
在本实施例中,分析设备将隐藏特征计算模块的输入层对应的各个单词对应的拼接特征表示、依赖信息中的依赖类型信息以及词性标注信息输入至图卷积计算模块的图卷积层,根据预设的第二拼接公式,获取图卷积计算模块的图卷积层的第一层对应的各个单词对应的拼接特征表示。
S403:获取待测语句中单词与单词之间的依赖边特征表示,将图卷积计算模块的图卷积层的第一层对应的各个单词对应的拼接特征表示输入至权重计算模块,根据预设的第二权重系数计算算法,获取权重计算模块的第一层对应的第二权重系数。
第二权重系数计算算法为:
Figure DEST_PATH_IMAGE027
式中,
Figure 57039DEST_PATH_IMAGE028
为权重计算模块的第l层对应的第i个单词以及第j个单词对应的第二权重系数,
Figure DEST_PATH_IMAGE029
为依赖边特征表示,
Figure 691152DEST_PATH_IMAGE030
为图卷积计算模块的第l层的图卷积层对应的第i个单词对应的拼接特征表示,
Figure DEST_PATH_IMAGE031
为图卷积计算模块的第l层的图卷积层对应的第j个单词对应的拼接特征表示;
在本实施例中,分析设备获取待测语句中单词与单词之间的依赖边特征表示,将图卷积计算模块的图卷积层的第一层对应的各个单词对应的拼接特征表示输入至权重计算模块,根据预设的第二权重系数计算算法,获取权重计算模块的第一层对应的第二权重系数。
S404:将隐藏特征计算模块的输入层对应的各个单词对应的隐藏层特征表示以及权重计算模块的第一层对应的第二权重系数输入至隐藏特征计算模块的图卷积层中,获取隐藏特征计算模块的图卷积层的其余各个层对应的隐藏层特征表示,作为图卷积神经网络输出的各个单词对应的隐藏层特征表示。
在本实施例中,分析设备将隐藏特征计算模块的输入层对应的各个单词对应的隐藏层特征表示以及权重计算模块的第一层对应的第二权重系数输入至隐藏特征计算模块的图卷积层中,获取隐藏特征计算模块的图卷积层的其余各个层对应的隐藏层特征表示,作为图卷积神经网络输出的各个单词对应的隐藏层特征表示。
请参阅图5,图5为本申请一个实施例提供的句子情感分析方法中S404的流程示意图,包括步骤S4041~S4042,具体如下:
S4041:根据隐藏特征计算模块的输入层对应的各个单词对应的隐藏层特征表示、权重计算模块的第一层对应的第二权重系数以及预设的隐藏层特征计算算法,获取隐藏特征计算模块的图卷积层的第一层对应的隐藏层特征表示。
隐藏层特征计算算法为:
Figure 615246DEST_PATH_IMAGE032
式中,
Figure DEST_PATH_IMAGE033
为隐藏特征计算模块的图卷积层的第l层对应的第i个单词对应的隐藏层特征表示,
Figure 108544DEST_PATH_IMAGE034
为Relu激活函数,
Figure DEST_PATH_IMAGE035
为第一可训练参数,
Figure 524920DEST_PATH_IMAGE036
为第二可训练参数;
在本实施例中,分析设备根据隐藏特征计算模块的输入层对应的各个单词对应的隐藏层特征表示、权重计算模块的第一层对应的第二权重系数以及预设的隐藏层特征计算算法,获取隐藏特征计算模块的图卷积层的第一层对应的隐藏层特征表示。
S4042:将隐藏特征计算模块的图卷积层的第一层对应的隐藏层特征表示作为输入参数,结合第二拼接算法、第二权重系数计算算法以及隐藏层特征计算算法,进行迭代计算,获取隐藏特征计算模块的图卷积层的其余各个层对应的隐藏层特征表示。
在本实施例中,分析设备将隐藏特征计算模块的图卷积层的第一层对应的隐藏层特征表示作为输入参数,结合第二拼接算法、第二权重系数计算算法以及隐藏层特征计算算法,进行迭代计算,获取隐藏特征计算模块的图卷积层的其余各个层对应的隐藏层特征表示。通过融入了句法和词性信息,丰富了单词的特征表示,更类似人类语言学地合理利用句法知识,提高句子情感分析的精准性。
S5:获取上下文单词与方面词之间的距离数据,将隐藏层特征表示以及距离数据输入至预设的面向方面词语句表示模型中,获取目标语句特征表示。
在本实施例中,分析设备获取上下文单词与方面词之间的距离数据,将隐藏层特征表示以及距离数据输入至预设的面向方面词语句表示模型中,获取目标语句特征表示。
请参阅图6,图6为本申请一个实施例提供的句子情感分析方法中S5的流程示意图,包括步骤S501~S504,具体如下:
S501:将距离数据、各个单词对应的隐藏层特征表示输入至位置特征表示模块,根据预设的位置系数计算算法以及预设的距离阈值,获取各个单词对应的位置系数。
位置系数计算算法为:
Figure DEST_PATH_IMAGE037
式中,
Figure 279118DEST_PATH_IMAGE038
为第i个单词对应的位置系数,dis为距离数据,k为距离阈值;
在本实施例中,分析设备将距离数据、各个单词对应的隐藏层特征表示输入至位置特征表示模块,根据预设的位置系数计算算法以及预设的距离阈值,获取各个单词对应的位置系数;
即,当单词与方面词之间的距离数据大于距离阈值时,则不考虑该单词,因为距离太远的单词对方面词情感几乎没影响,反而引入噪声,将距离数据大于距离阈值的单词对应的位置系数设置为0;
当单词与方面词之间的距离数据小于或等于距离阈值时,根据位置系数计算算法,计算距离数据小于或等于距离阈值的单词对应的位置系数,从而获取各个单词对应的位置系数。
S502:根据各个单词对应的位置系数、隐藏层特征表示以及预设的位置特征表示计算算法,获取位置特征表示模块输出的各个单词对应的位置特征表示。
位置特征表示计算算法为:
Figure DEST_PATH_IMAGE039
式中,
Figure 764326DEST_PATH_IMAGE040
为第i个单词对应的位置特征表示;
在本实施例中,分析设备根据各个单词对应的位置系数、隐藏层特征表示以及预设的位置特征表示计算算法,获取位置特征表示模块输出的各个单词对应的位置特征表示。
S503:将各个单词对应的位置特征表示、方面词对应的隐藏层特征表示输入至权重模块,根据预设的第三权重系数计算算法,获取权重模块输出的各个单词对应的第三权重系数。
第三权重系数计算算法为:
Figure DEST_PATH_IMAGE041
式中,
Figure 620287DEST_PATH_IMAGE042
为第t个单词对应的第三权重参数,m为方面词的数目;
在本实施例中,分析设备将各个单词对应的位置特征表示、方面词对应的隐藏层特征表示输入至权重模块,根据预设的第三权重系数计算算法,获取权重模块输出的各个单词对应的第三权重系数。
S504:将各个单词对应的第三权重系数、位置特征表示输入至目标语句特征表示模块,根据预设的目标语句特征表示计算算法,获取目标语句特征表示模块输出的目标语句特征表示。
目标语句特征表示计算算法为:
Figure 645880DEST_PATH_IMAGE043
式中,z为目标语句特征表示,
Figure 739738DEST_PATH_IMAGE044
为训练系数。
在本实施例中,分析设备将各个单词对应的第三权重系数、位置特征表示输入至目标语句特征表示模块,根据预设的目标语句特征表示计算算法,获取目标语句特征表示模块输出的目标语句特征表示。
S6:将方面词对应的隐藏层特征表示、目标语句特征表示输入至预设的全连接神经网络,获取全连接神经网络输出的待测语句的情感分析结果。
在本实施例中,分析设备将方面词对应的隐藏层特征表示、目标语句特征表示输入至预设的全连接神经网络,获取全连接神经网络输出的待测语句的情感分析结果,其中,全连接神经网络包括依次连接的全连接层以及归一化激活函数层。
请参阅图7,图7为本申请一个实施例提供的句子情感分析方法中S6的流程示意图,包括步骤S601~S602,具体如下:
S601:将目标语句特征表示输入至全连接层进行降维处理,获得全连接层输出的降维处理后的目标语句特征。
在本实施例中,分析设备将目标语句特征表示输入至全连接层进行降维处理,获得全连接层输出的降维处理后的目标语句特征,用于后续在归一化激活函数层中进行情感分类的处理。
S602:将降维处理后的目标语句特征表示输入至归一化激活函数层,根据预设的情感分析算法,获取情感分类极性概率分布向量,根据情感分类极性概率分布向量,获取概率最大的维度对应的情感极性,将情感极性作为待测语句的情感分析结果。
情感分析算法为:
Figure 461094DEST_PATH_IMAGE045
式中,u为情感分类极性概率分布向量,
Figure 742034DEST_PATH_IMAGE046
为全连接神经网络的参数矩阵,
Figure 102477DEST_PATH_IMAGE047
为全连接神经网络的偏置值,softmax()为归一化函数。
在本实施例中,分析设备将降维处理后的目标语句特征表示输入至归一化激活函数层,根据预设的情感分析算法,获取情感分类极性概率分布向量,根据情感分类极性概率分布向量,根据情感分类极性概率分布向量,获取概率最大的维度对应的情感极性,作为待测文本数据集的情感分析结果,具体地,当计算得到u=[u积极,u消极,u中性]=[0.1,0.7,0.2],概率最大为u消极,其概率最大的维度对应的情感极性为消极,作为待测文本数据集的情感分析结果。
在一个可选的实施例中,本申请还提供一种网络信息推荐方法,网络信息推荐方法应用了上述句子情感分析方法,首先获取社交网络平台上用户发表的评论信息,例如Twitter,Lap14,Rest14,Rest15和Rest16,作为待测待测语句,其中,Twitter数据集最初由Tang等人建立,包含了来自社交软件twitter的推文,一共包括6940条评论,每条评论都有标记出其中的方面词以及对应的情感极性。
Lap14和Rest14数据集来自SemEval-2014 Task4,主要用于细粒度情感分析,每个领域的数据集都分为训练数据、验证数据(从训练数据分离出来)和测试数据,其中LAP14包含2966条评论,REST14包含4728条评论,每条评论都有标记出其中的方面词以及对应的情感极性。
根据本申请提供的句子情感分析方法,获取待测待测语句的情感分析结果。并根据待测待测语句的情感分析结果,获取情感极性为积极的待测句子及其对应的评论信息,获取发表评论信息的用户的用户标识,根据用户标识,向用户推送与情感极性为积极的待测句子相关联的网络信息。
请参考图8,图8为本申请一个实施例提供的句子情感分析装置的结构示意图,该装置可以通过软件、硬件或两者的结合实现句子情感分析装置的全部或一部分,该装置8包括:
获取模块81,用于获取待测语句的句子表示、依赖信息以及词性标注信息,其中,待测语句包括若干个句子,句子包括若干个单词,单词包括上下文单词以及方面词,依赖信息包括依赖边信息以及依赖类型信息,依赖边信息为单词与单词之间的具有依赖关系,依赖类型信息为单词与单词之间的依赖类型向量表示,词性标注信息为各个单词对应的词性标注向量表示;
词嵌入处理模块82,用于将所述句子表示输入至预设的词嵌入模型,获取所述各个单词对应的词嵌入表示;
第一特征处理模块83,用于将各个单词对应的词嵌入表示、依赖类型信息以及词性标注信息输入预设的记忆神经网络中,获取各个单词对应的依赖类型特征表示以及词性标注特征表示;
第二特征处理模块84,用于将待测语句的依赖信息以及词性标注信息,待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至预设的图卷积神经网络中,获取各个单词对应的隐藏层特征表示,其中,隐藏层特征表示包括上下文单词对应的隐藏层特征表示以及方面词对应的隐藏层特征表示;
第三特征处理模块85,用于获取上下文单词与方面词之间的距离数据,将隐藏层特征表示以及距离数据输入至预设的面向方面词语句表示模型中,获取面向方面词语句表示模型输出的目标语句特征表示;
分析模块86,用于将方面词对应的隐藏层特征表示、目标语句特征表示输入至预设的全连接神经网络,获取全连接神经网络输出的待测语句的情感分析结果。
在本实施例中,通过获取模块,获取待测语句的句子表示、依赖信息以及词性标注信息,其中,待测语句包括若干个句子,句子包括若干个单词,单词包括上下文单词以及方面词,依赖信息包括依赖边信息以及依赖类型信息,依赖边信息为单词与单词之间的具有依赖关系,依赖类型信息为单词与单词之间的依赖类型向量表示,词性标注信息为各个单词对应的词性标注向量表示;通过词嵌入处理模块,将所述句子表示输入至预设的词嵌入模型,获取所述各个单词对应的词嵌入表示;通过第一特征处理模块,将各个单词对应的词嵌入表示、依赖类型信息以及词性标注信息输入预设的记忆神经网络中,获取各个单词对应的依赖类型特征表示以及词性标注特征表示;通过第二特征处理模块,将待测语句的依赖信息以及词性标注信息,待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至预设的图卷积神经网络中,获取各个单词对应的隐藏层特征表示,其中,隐藏层特征表示包括上下文单词对应的隐藏层特征表示以及方面词对应的隐藏层特征表示;通过第三特征处理模块,获取上下文单词与方面词之间的距离数据,将隐藏层特征表示以及距离数据输入至预设的面向方面词语句表示模型中,获取面向方面词语句表示模型输出的目标语句特征表示;通过分析模块,将方面词对应的隐藏层特征表示、目标语句特征表示输入至预设的全连接神经网络,获取全连接神经网络输出的待测语句的情感分析结果。通过结合待测语句的依赖信息以及词性标注信息,提高了方面词对上下文词的关联性,从而更加精确地对文本语句的情感进行分析。
请参考图9,图9为本申请一个实施例提供的计算机设备的结构示意图,计算机设备9包括:处理器91、存储器92以及存储在存储器92上并可在处理器91上运行的计算机程序93;计算机设备可以存储有多条指令,指令适用于由处理器91加载并执行上述图一至图六的方法步骤,具体执行过程可以参见图一至图六的具体说明,在此不进行赘述。
其中,处理器91可以包括一个或多个处理核心。处理器91利用各种接口和线路连接服务器内的各个部分,通过运行或执行存储在存储器92内的指令、程序、代码集或指令集,以及调用存储器92内的数据,执行句子情感分析装置7的各种功能和处理数据,可选的,处理器91可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programble Logic Array,PLA)中的至少一个硬件形式来实现。处理器91可集成中央处理器91(Central ProcessingUnit,CPU)、图像处理器91(Graphics Processing Unit,GPU)和调制解调器等中的一个或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器91中,单独通过一块芯片进行实现。
其中,存储器92可以包括随机存储器92(Random Access Memory,RAM),也可以包括只读存储器92(Read-Only Memory)。可选的,该存储器92包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器92可用于存储指令、程序、代码、代码集或指令集。存储器92可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控指令等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器92可选的还可以是至少一个位于远离前述处理器91的存储装置。
本申请实施例还提供了一种存储介质,所述存储介质可以存储有多条指令,所述指令适用于由处理器加载并执行上述图一至图六的方法步骤,具体执行过程可以参见图一至图六的具体说明,在此不进行赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束算法。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。

Claims (10)

1.一种句子情感分析方法,其特征在于,包括以下步骤:
获取待测语句的句子表示、依赖信息以及词性标注信息,其中,所述待测语句包括若干个句子,所述句子包括若干个单词,所述单词包括上下文单词以及方面词,所述依赖信息包括依赖边信息以及依赖类型信息,所述依赖边信息为单词与单词之间的具有依赖关系,所述依赖类型信息为单词与单词之间的依赖类型向量表示,所述词性标注信息为各个单词对应的词性标注向量表示;
将所述句子表示输入至预设的词嵌入模型,获取所述各个单词对应的词嵌入表示;
将所述各个单词对应的词嵌入表示、所述依赖类型信息以及所述词性标注信息输入预设的记忆神经网络中,获取所述各个单词对应的依赖类型特征表示以及词性标注特征表示;
将所述待测语句的依赖信息以及词性标注信息,所述待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至预设的图卷积神经网络中,获取各个单词对应的隐藏层特征表示,其中,所述隐藏层特征表示包括上下文单词对应的隐藏层特征表示以及方面词对应的隐藏层特征表示;
获取所述上下文单词与所述方面词之间的距离数据,将所述隐藏层特征表示以及所述距离数据输入至预设的面向方面词语句表示模型中,获取目标语句特征表示;
将所述方面词对应的隐藏层特征表示、目标语句特征表示输入至预设的全连接神经网络,获取情感分析结果。
2.根据权利要求1所述的句子情感分析方法,其特征在于:
所述记忆神经网络包括依次连接的权重层以及编码层;
所述将所述各个单词对应的词嵌入表示、所述依赖类型信息以及所述词性标注信息输入预设的记忆神经网络中,获取所述各个单词对应的依赖类型特征表示以及词性标注特征表示,包括步骤:
获取所述待测语句中单词与单词之间的依赖边特征表示,将所述待测语句的各个单词对应的词嵌入表示以及依赖边特征表示输入至所述权重层,根据预设的第一权重系数计算算法,获取所述待测语句的第一权重系数集,其中,所述第一权重系数集包括单词与单词之间的第一权重系数,所述第一权重系数计算算法为:
Figure 261326DEST_PATH_IMAGE001
式中,
Figure 248261DEST_PATH_IMAGE002
为第i个单词以及第j个单词之间的第一权重系数,
Figure 653834DEST_PATH_IMAGE003
为第i个单词对应的词嵌入表示,
Figure 499431DEST_PATH_IMAGE004
为第j个单词对应的词嵌入表示,n为所述待测语句的单词的总数目;
Figure 431483DEST_PATH_IMAGE005
为第i个单词与第j个单词之间的依赖边特征表示;
将所述第一权重系数集、待测语句的依赖类型信息以及词性标注信息输入至所述编码层,根据预设的依赖类型特征表示计算算法以及词性标注特征表示计算算法,分别获取所述待测语句的各个单词对应的依赖类型特征表示以及词性标注特征表示,其中,所述依赖类型特征表示计算算法为:
Figure 71543DEST_PATH_IMAGE006
式中,
Figure 964413DEST_PATH_IMAGE007
为第i个单词对应的依赖类型特征表示,
Figure 597389DEST_PATH_IMAGE008
为第i个单词以及第j个单词之间的依赖类型向量表示;
所述词性标注特征表示计算算法为:
Figure 134680DEST_PATH_IMAGE009
式中,
Figure 194909DEST_PATH_IMAGE010
为第i个单词对应的词性标注特征表示,
Figure 575075DEST_PATH_IMAGE011
为第j个对应的词性标注向量表示。
3.根据权利要求2所述的句子情感分析方法,其特征在于,所述获取所述待测语句中单词与单词之间的依赖边特征表示之前,包括步骤:
根据所述依赖信息中的依赖边信息,构建所述待测语句的依赖边矩阵,其中,所述依赖边矩阵为:
Figure 496894DEST_PATH_IMAGE012
式中,A为所述依赖边矩阵,
Figure 406469DEST_PATH_IMAGE013
为依赖边特征表示,
Figure 247386DEST_PATH_IMAGE014
代表所述依赖边信息为单词与单词之间的具有依赖关系,
Figure 990214DEST_PATH_IMAGE015
代表所述依赖边信息为单词与单词之间的不具有依赖关系。
4.根据权利要求2所述的句子情感分析方法,其特征在于:
所述图卷积神经网络包括依次连接的图卷积计算模块、权重计算模块以及隐藏特征计算模块,其中,所述图卷积计算模块以及隐藏特征计算模块均包括依次连接的输入层以及若干个图卷积层;
所述将所述待测语句的依赖信息以及词性标注信息,所述待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至预设的图卷积神经网络中,获取各个单词对应的隐藏层特征表示,包括步骤:
将所述待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至所述图卷积计算模块的输入层,根据预设的第一拼接公式,获取所述图卷积计算模块的输入层对应的各个单词对应的拼接特征表示,并将所述图卷积计算模块的输入层对应的各个单词对应的拼接特征表示作为所述隐藏特征计算模块的输入层对应的各个单词对应的拼接特征表示,其中,所述第一拼接公式为:
Figure 964992DEST_PATH_IMAGE016
式中,
Figure 476876DEST_PATH_IMAGE017
为所述图卷积计算模块的输入层对应的第i个单词对应的拼接特征表示,
Figure 754274DEST_PATH_IMAGE018
为拼接符号;
Figure 702507DEST_PATH_IMAGE019
为图卷积计算模块的输入层对应的第j个单词对应的拼接特征表示;
将所述隐藏特征计算模块的输入层对应的各个单词对应的拼接特征表示、所述依赖信息中的依赖类型信息以及词性标注信息输入至所述图卷积计算模块的图卷积层,根据预设的第二拼接公式,获取所述图卷积计算模块的图卷积层的第一层对应的各个单词对应的拼接特征表示,其中,所述第二拼接公式为:
Figure 231709DEST_PATH_IMAGE020
式中,
Figure 722733DEST_PATH_IMAGE021
为所述隐藏特征计算模块的第l层对应的第i个单词对应的隐藏层特征表示;
获取所述待测语句中单词与单词之间的依赖边特征表示,将所述图卷积计算模块的图卷积层的第一层对应的各个单词对应的拼接特征表示输入至所述权重计算模块,根据预设的第二权重系数计算算法,获取所述权重计算模块的第一层对应的第二权重系数,其中,所述第二权重系数计算算法为:
Figure 30086DEST_PATH_IMAGE022
式中,
Figure 747506DEST_PATH_IMAGE023
为所述权重计算模块的第l层对应的第i个单词以及第j个单词对应的第二权重系数,
Figure 939453DEST_PATH_IMAGE024
为所述依赖边特征表示,
Figure 412548DEST_PATH_IMAGE025
为所述图卷积计算模块的第l层的图卷积层对应的第i个单词对应的拼接特征表示,
Figure 907114DEST_PATH_IMAGE026
为所述图卷积计算模块的第l层的图卷积层对应的第j个单词对应的拼接特征表示;
将所述隐藏特征计算模块的输入层对应的各个单词对应的隐藏层特征表示以及所述权重计算模块的第一层对应的第二权重系数输入至所述隐藏特征计算模块的图卷积层中,获取所述隐藏特征计算模块的图卷积层的其余各个层对应的隐藏层特征表示,作为所述图卷积神经网络输出的各个单词对应的隐藏层特征表示。
5.根据权利要求4所述的句子情感分析方法,其特征在于,所述将所述隐藏特征计算模块的输入层对应的各个单词对应的隐藏层特征表示以及所述权重计算模块的第一层对应的第二权重系数输入至所述隐藏特征计算模块的图卷积层中,获取所述隐藏特征计算模块的图卷积层的其余各个层对应的隐藏层特征表示,包括步骤:
根据所述隐藏特征计算模块的输入层对应的各个单词对应的隐藏层特征表示、所述权重计算模块的第一层对应的第二权重系数以及预设的隐藏层特征计算算法,获取所述隐藏特征计算模块的图卷积层的第一层对应的隐藏层特征表示,其中,所述隐藏层特征计算算法为:
Figure 970885DEST_PATH_IMAGE027
式中,
Figure 825577DEST_PATH_IMAGE028
为Relu激活函数,
Figure 900981DEST_PATH_IMAGE029
为第一可训练参数,
Figure 956661DEST_PATH_IMAGE030
为第二可训练参数;
将所述隐藏特征计算模块的图卷积层的第一层对应的隐藏层特征表示作为输入参数,结合所述第二拼接算法、第二权重系数计算算法以及隐藏层特征计算算法,进行迭代计算,获取所述隐藏特征计算模块的图卷积层的其余各个层对应的隐藏层特征表示。
6.根据权利要求1所述的句子情感分析方法,其特征在于,所述面向方面词语句表示模型包括依次连接的位置特征表示模块、权重模块以及目标语句特征表示模块;
所述将所述隐藏层特征表示以及所述距离数据输入至预设的面向方面词语句表示模型中,获取目标语句特征表示,包括步骤:
将所述距离数据、所述各个单词对应的隐藏层特征表示输入至所述位置特征表示模块,根据预设的位置系数计算算法以及预设的距离阈值,获取所述各个单词对应的位置系数,其中,所述位置系数计算算法为:
Figure 366783DEST_PATH_IMAGE031
式中,
Figure 775899DEST_PATH_IMAGE032
为第i个单词对应的位置系数,dis为所述距离数据,k为所述距离阈值;
根据所述各个单词对应的位置系数、隐藏层特征表示以及预设的位置特征表示计算算法,获取所述位置特征表示模块输出的各个单词对应的位置特征表示,其中,所述位置特征表示计算算法为:
Figure 96022DEST_PATH_IMAGE033
式中,
Figure 447237DEST_PATH_IMAGE034
为所述第i个单词对应的位置特征表示;
将所述各个单词对应的位置特征表示、方面词对应的隐藏层特征表示输入至所述权重模块,根据预设的第三权重系数计算算法,获取所述权重模块输出的各个单词对应的第三权重系数,其中,所述第三权重系数计算算法为:
Figure 829808DEST_PATH_IMAGE035
式中,
Figure 167249DEST_PATH_IMAGE036
为第t个单词对应的第三权重参数,m为所述方面词的数目;
将所述各个单词对应的第三权重系数、位置特征表示输入至所述目标语句特征表示模块,根据预设的目标语句特征表示计算算法,获取所述目标语句特征表示模块输出的目标语句特征表示,其中,所述目标语句特征表示计算算法为:
Figure 723302DEST_PATH_IMAGE037
式中,z为所述目标语句特征表示,
Figure 730572DEST_PATH_IMAGE038
为训练系数。
7.根据权利要求6所述的句子情感分析方法,其特征在于:
所述全连接神经网络包括依次连接的全连接层以及归一化激活函数层;
所述将所述方面词对应的隐藏层特征表示、目标语句特征表示输入至预设的全连接神经网络,获取情感分析结果,包括步骤:
将所述目标语句特征表示输入至所述全连接层进行降维处理,获得所述全连接层输出的降维处理后的目标语句特征;
将所述降维处理后的目标语句特征表示输入至所述归一化激活函数层,根据预设的情感分析算法,获取情感分类极性概率分布向量,根据所述情感分类极性概率分布向量,获取概率最大的维度对应的情感极性,将所述情感极性作为所述待测语句的情感分析结果,其中,所述情感分析算法为:
Figure 380865DEST_PATH_IMAGE039
式中,u为所述情感分类极性概率分布向量,
Figure 397363DEST_PATH_IMAGE040
为所述全连接神经网络的参数矩阵,
Figure 426499DEST_PATH_IMAGE041
为所述全连接神经网络的偏置值,softmax()为归一化函数。
8.一种句子情感分析装置,其特征在于,包括:
获取模块,用于获取待测语句的句子表示、依赖信息以及词性标注信息,其中,所述待测语句包括若干个句子,句子包括若干个单词,所述单词包括上下文单词以及方面词,所述依赖信息包括依赖边信息以及依赖类型信息,所述依赖边信息为单词与单词之间的具有依赖关系,所述依赖类型信息为单词与单词之间的依赖类型向量表示,所述词性标注信息为各个单词对应的词性标注向量表示;
词嵌入处理模块,用于将所述句子表示输入至预设的词嵌入模型,获取所述各个单词对应的词嵌入表示;
第一特征处理模块,用于将所述各个单词对应的词嵌入表示、所述依赖类型信息以及所述词性标注信息输入预设的记忆神经网络中,获取所述各个单词对应的依赖类型特征表示以及词性标注特征表示;
第二特征处理模块,用于将所述待测语句的依赖信息以及词性标注信息,所述待测语句的各个单词对应的词嵌入表示、依赖类型特征表示以及词性标注特征表示输入至预设的图卷积神经网络中,获取各个单词对应的隐藏层特征表示,其中,所述隐藏层特征表示包括上下文单词对应的隐藏层特征表示以及方面词对应的隐藏层特征表示;
第三特征处理模块,用于获取所述上下文单词与所述方面词之间的距离数据,将所述隐藏层特征表示以及所述距离数据输入至预设的面向方面词语句表示模型中,获取所述面向方面词语句表示模型输出的目标语句特征表示;
分析模块,用于将所述方面词对应的隐藏层特征表示、目标语句特征表示输入至预设的全连接神经网络,获取所述全连接神经网络输出的待测语句的情感分析结果。
9.一种计算机设备,其特征在于,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的句子情感分析方法的步骤。
10.一种存储介质,其特征在于:所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于情感分析的步骤。
CN202210595553.0A 2022-05-30 2022-05-30 句子情感分析方法、装置、设备以及存储介质 Active CN114676704B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210595553.0A CN114676704B (zh) 2022-05-30 2022-05-30 句子情感分析方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210595553.0A CN114676704B (zh) 2022-05-30 2022-05-30 句子情感分析方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
CN114676704A true CN114676704A (zh) 2022-06-28
CN114676704B CN114676704B (zh) 2022-08-16

Family

ID=82079434

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210595553.0A Active CN114676704B (zh) 2022-05-30 2022-05-30 句子情感分析方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN114676704B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115659951A (zh) * 2022-12-26 2023-01-31 华南师范大学 基于标签嵌入的语句情感分析方法、装置以及设备
CN115712726A (zh) * 2022-11-08 2023-02-24 华南师范大学 基于双词嵌入的情感分析方法、装置以及设备
CN115905518A (zh) * 2022-10-17 2023-04-04 华南师范大学 基于知识图谱的情感分类方法、装置、设备以及存储介质
CN115906863A (zh) * 2022-10-25 2023-04-04 华南师范大学 基于对比学习的情感分析方法、装置、设备以及存储介质
CN116029294A (zh) * 2023-03-30 2023-04-28 华南师范大学 词项配对方法、装置及设备
CN117909313A (zh) * 2024-03-19 2024-04-19 成都融见软件科技有限公司 设计代码数据的分布式存储方法、电子设备和介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726745A (zh) * 2018-12-19 2019-05-07 北京理工大学 一种融入描述知识的基于目标的情感分类方法
CN110781306A (zh) * 2019-10-31 2020-02-11 山东师范大学 一种英文文本的方面层情感分类方法及系统
US20200159832A1 (en) * 2018-11-15 2020-05-21 Fei CAI Device and text representation method applied to sentence embedding
CN113535897A (zh) * 2021-06-30 2021-10-22 杭州电子科技大学 一种基于句法关系和意见词分布的细粒度情感分析方法
CN113641820A (zh) * 2021-08-10 2021-11-12 福州大学 基于图卷积神经网络的视角级文本情感分类方法及系统
CN113987167A (zh) * 2021-10-11 2022-01-28 山东师范大学 基于依赖感知图卷积网络的方面级情感分类方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200159832A1 (en) * 2018-11-15 2020-05-21 Fei CAI Device and text representation method applied to sentence embedding
CN109726745A (zh) * 2018-12-19 2019-05-07 北京理工大学 一种融入描述知识的基于目标的情感分类方法
CN110781306A (zh) * 2019-10-31 2020-02-11 山东师范大学 一种英文文本的方面层情感分类方法及系统
CN113535897A (zh) * 2021-06-30 2021-10-22 杭州电子科技大学 一种基于句法关系和意见词分布的细粒度情感分析方法
CN113641820A (zh) * 2021-08-10 2021-11-12 福州大学 基于图卷积神经网络的视角级文本情感分类方法及系统
CN113987167A (zh) * 2021-10-11 2022-01-28 山东师范大学 基于依赖感知图卷积网络的方面级情感分类方法及系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115905518A (zh) * 2022-10-17 2023-04-04 华南师范大学 基于知识图谱的情感分类方法、装置、设备以及存储介质
CN115905518B (zh) * 2022-10-17 2023-10-20 华南师范大学 基于知识图谱的情感分类方法、装置、设备以及存储介质
CN115906863A (zh) * 2022-10-25 2023-04-04 华南师范大学 基于对比学习的情感分析方法、装置、设备以及存储介质
CN115906863B (zh) * 2022-10-25 2023-09-12 华南师范大学 基于对比学习的情感分析方法、装置、设备以及存储介质
CN115712726A (zh) * 2022-11-08 2023-02-24 华南师范大学 基于双词嵌入的情感分析方法、装置以及设备
CN115712726B (zh) * 2022-11-08 2023-09-12 华南师范大学 基于双词嵌入的情感分析方法、装置以及设备
CN115659951A (zh) * 2022-12-26 2023-01-31 华南师范大学 基于标签嵌入的语句情感分析方法、装置以及设备
CN115659951B (zh) * 2022-12-26 2023-03-21 华南师范大学 基于标签嵌入的语句情感分析方法、装置以及设备
CN116029294A (zh) * 2023-03-30 2023-04-28 华南师范大学 词项配对方法、装置及设备
CN117909313A (zh) * 2024-03-19 2024-04-19 成都融见软件科技有限公司 设计代码数据的分布式存储方法、电子设备和介质
CN117909313B (zh) * 2024-03-19 2024-05-14 成都融见软件科技有限公司 设计代码数据的分布式存储方法、电子设备和介质

Also Published As

Publication number Publication date
CN114676704B (zh) 2022-08-16

Similar Documents

Publication Publication Date Title
CN114676704B (zh) 句子情感分析方法、装置、设备以及存储介质
CN111951805A (zh) 一种文本数据处理方法及装置
CN115204183B (zh) 基于知识增强的双通道情感分析方法、装置以及设备
CN111680159A (zh) 数据处理方法、装置及电子设备
CN110781302B (zh) 文本中事件角色的处理方法、装置、设备及存储介质
CN115168592B (zh) 基于方面类别的语句情感分析方法、装置以及设备
CN116089619B (zh) 情感分类方法、装置、设备以及存储介质
CN115659987B (zh) 基于双通道的多模态命名实体识别方法、装置以及设备
CN115455171B (zh) 文本视频的互检索以及模型训练方法、装置、设备及介质
CN115587597B (zh) 基于子句级关系图的方面词的情感分析方法以及装置
CN116258145B (zh) 多模态命名实体识别方法、装置、设备以及存储介质
CN113626576A (zh) 远程监督中关系特征抽取方法、装置、终端及存储介质
CN114492669B (zh) 关键词推荐模型训练方法、推荐方法和装置、设备、介质
CN114492661B (zh) 文本数据分类方法和装置、计算机设备、存储介质
CN117407523A (zh) 句子情感分析方法、装置、计算机设备以及存储介质
CN115906861B (zh) 基于交互方面信息融合的语句情感分析方法以及装置
CN115906863B (zh) 基于对比学习的情感分析方法、装置、设备以及存储介质
CN115659951B (zh) 基于标签嵌入的语句情感分析方法、装置以及设备
CN114547312B (zh) 基于常识知识图谱的情感分析方法、装置以及设备
CN115905518B (zh) 基于知识图谱的情感分类方法、装置、设备以及存储介质
CN116680401A (zh) 文档处理方法、文档处理装置、设备及存储介质
CN115905524A (zh) 融合句法和语义信息的情感分析方法、装置以及设备
CN115827878A (zh) 语句情感分析方法、装置以及设备
CN116168403A (zh) 医疗数据分类模型训练方法、分类方法、装置及相关介质
CN115033700A (zh) 基于相互学习网络的跨领域情感分析方法、装置以及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant