CN115329769A - 基于语义增强网络的平台企业网络舆论情感分析方法 - Google Patents

基于语义增强网络的平台企业网络舆论情感分析方法 Download PDF

Info

Publication number
CN115329769A
CN115329769A CN202210784238.2A CN202210784238A CN115329769A CN 115329769 A CN115329769 A CN 115329769A CN 202210784238 A CN202210784238 A CN 202210784238A CN 115329769 A CN115329769 A CN 115329769A
Authority
CN
China
Prior art keywords
public opinion
semantic
platform enterprise
vector
emotion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210784238.2A
Other languages
English (en)
Inventor
欧阳小叶
郭大宇
王亚珅
刘弋锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Electronic and Information Technology of CETC
Original Assignee
China Academy of Electronic and Information Technology of CETC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Electronic and Information Technology of CETC filed Critical China Academy of Electronic and Information Technology of CETC
Priority to CN202210784238.2A priority Critical patent/CN115329769A/zh
Publication of CN115329769A publication Critical patent/CN115329769A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于语义增强网络的平台企业网络舆论情感分析方法,包括:基于平台企业舆情相关文本和构建的平台企业舆论情感词典,形成平台企业舆论情感数据集;对所述平台企业舆论情感数据集中句子的词进行多级向量表示,以获得句子中单词的语义向量;对所述平台企业舆情相关文本进行句法分析,计算出句法分析树的概率值;基于平台企业舆论情感数据集的语义向量进行语义增强匹配,以获得语义增强的语义向量;基于语义增强的语义向量进行句子嵌入表示;基于句子嵌入表示的结果进行情感预设,以获得预测结果。本申请的方法利用深度学习技术实现快速高效的情感分析,针对网络财经文本的情绪分析,有助于了解公众的情绪状态,及时获取舆论和态度。

Description

基于语义增强网络的平台企业网络舆论情感分析方法
技术领域
本发明涉及大数据处理技术领域,尤其涉及一种基于语义增强网络的平台企业网络舆论情感分析方法。
背景技术
基于互联网的微博、微信公众号、知乎等新媒体、自媒体形式,使得平台企业舆情传播速度、范围得到大大提高。平台企业舆情的产生、扩大和传播对投资者、平台企业、市场监管乃至宏观经济运行都会产生重要影响。对于平台企业自身来说,往往一些小的信用危机,则有可能酿成平台企业危机事件,因此通过把握前期舆情监测,减少和避免平台企业舆情危机的爆发。而国家或市场监管相关部门通过对平台企业舆情的监测,可避免与市场相关的各类问题发酵于网络,扰乱市场秩序,因此可以通过舆情监控掌握平台企业网络舆情风险点,做好风险排查评估工作。
正面舆情能够提高相关平台企业市场份额、平台企业的社会声誉,进一步增强其影响力、竞争力,对平台企业运行也能够起到稳定作用。负面舆情不仅损害了平台企业自身利益、平台企业的社会声誉,破坏平台企业赖以生存发展的信用基础,还可能会扰乱市场秩序。
发明内容
本发明实施例提供一种基于语义增强网络的平台企业网络舆论情感分析方法,用以实现快速高效的情感分析,实现判断当前平台企业舆情为正面舆情还是负面舆情。
本发明实施例提供一种基于语义增强网络的平台企业网络舆论情感分析方法,包括:
基于互联网中监测到的平台企业舆情相关文本和构建的平台企业舆论情感词典,形成平台企业舆论情感数据集;
对所述平台企业舆论情感数据集中句子的词进行多级向量表示,以获得句子中单词的语义向量;
对所述平台企业舆情相关文本进行句法分析,计算出句法分析树的概率值,并进行去噪处理;
基于去噪后的所述平台企业舆情相关文本,以及,平台企业舆论情感数据集的语义向量进行语义增强匹配,以获得语义增强的语义向量;
基于语义增强的语义向量进行句子嵌入表示;
基于句子嵌入表示的结果进行情感预设,以获得预测结果。
可选的,基于互联网中监测到的平台企业舆情相关文本和构建的平台企业舆论情感词典,形成平台企业舆论情感数据集包括:
将互联网中监测到的平台企业舆情相关文本和构建的平台企业舆论情感词典作为文本输入数据,利用TF/IDF算法进行筛选,以形成由正面情感词典和负面情感词典两部分组成的平台企业舆论情感数据集。
可选的,对所述平台企业舆论情感数据集中句子的词进行多级向量表示,以获得句子中单词的语义向量包括:
基于所述平台企业舆论情感数据集中句子的词:
使用卷积网络进行字符级向量表示;
基于GloVe词嵌入工具,以获得词级向量表示;
基于Bert嵌入工具得到句子级别向量表示;
串联字符级向量表示、词级向量表示以及句子级别向量表示,并将串联信息,通过Albert模型进行编码,以获得句子中单词的语义向量:
Figure BDA0003731293300000021
其中,ew表示单词的语义向量,
Figure BDA0003731293300000031
表示词w的字符级向量表示,
Figure BDA0003731293300000032
为词w的词级向量表示,
Figure BDA0003731293300000033
表示词w的句子级向量表示。
可选的,对所述平台企业舆情相关文本进行句法分析,计算出句法分析树的概率值,并进行去噪处理包括:
利用PCFG句法分析模型对平台企业舆情相关文本进行句法分析,计算出句法分析树的概率值;
依据概率值对所有分析树进行排序,选择概率值靠前的句法分析树作为分析结果;以及
根据PCFG得到句子中每个词的概率值对句法树进行剪枝,去掉概率低的词。
可选的,基于去噪后的所述平台企业舆情相关文本,以及,平台企业舆论情感数据集的语义向量进行语义增强匹配,以获得语义增强的语义向量包括:
基于去噪后的所述平台企业舆情相关文本,和,平台企业舆论情感数据集进行语义增强匹配,以构建语义增强矩阵M∈Rd×d
可选的,基于语义增强的语义向量进行句子嵌入表示包括:
将所述语义增强矩阵作为输入,进行卷积操作:
Figure BDA0003731293300000034
其中σ(·)是ReLU函数,z(l,f)表示第l层的f类型输出端口的特征映射,表示,z(l,f)=Mf
Figure BDA0003731293300000035
为窗口大小,W(l,f)和b(l)为参数,Fl-1表示第(l-1)层特征数;
使用
Figure BDA0003731293300000036
Figure BDA0003731293300000037
作为池化操作的宽度和高度进行池化操作:
Figure BDA0003731293300000038
以池化输出的匹配向量被映射到低维空间中去,得到匹配向量[v1,...,vn];
将匹配向量作为句子嵌入模块的输入,利用一个GRU单元,得到输出隐藏向量[h′1...,h′n]作为句子嵌入表示。
可选的,基于句子嵌入表示的结果进行情感预设,以获得预测结果包括:
将隐藏向量[h′1...,h′n],作为情感预测模块的输入,定义匹配得分g(s,m,c):
Figure BDA0003731293300000041
Figure BDA0003731293300000042
Figure BDA0003731293300000043
其中,Wd1、Wd2、Wd、bd2、bd1是参数,ts是在训练中习得的虚拟文本向量,hi是隐藏向量[h′1...,h′n]的第i个隐藏状态,
Figure BDA0003731293300000044
是词w的最终隐藏状态。
本申请还提出一种基于语义增强网络的平台企业网络舆论情感分析装置,包括:
文本输入模块:用于基于互联网中监测到的平台企业舆情相关文本和构建的平台企业舆论情感词典,形成平台企业舆论情感数据集;
词嵌入模块:用于对所述平台企业舆论情感数据集中句子的词进行多级向量表示,以获得句子中单词的语义向量;
语义增强模块:用于对所述平台企业舆情相关文本进行句法分析,计算出句法分析树的概率值,并进行去噪处理;基于去噪后的所述平台企业舆情相关文本,以及,平台企业舆论情感数据集的语义向量进行语义增强匹配,以获得语义增强的语义向量;
句子嵌入模块:用于基于语义增强的语义向量进行句子嵌入表示;
情感预测模块:用于基于句子嵌入表示的结果进行情感预设,以获得预测结果。
本申请还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前述的基于语义增强网络的平台企业网络舆论情感分析方法的步骤。
本发明实施例提出的基于语义增强网络的平台企业网络舆论情感分析方法,利用深度学习技术实现快速高效的情感分析,针对网络财经文本的情绪分析,有助于了解公众的情绪状态,及时获取舆论和态度,快速到达信息主体。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本申请实施例网络舆论情感分析方法的基本流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供一种基于语义增强网络的平台企业网络舆论情感分析方法,如图1所示,包括:
在步骤S101中,基于互联网中监测到的平台企业舆情相关文本和构建的平台企业舆论情感词典,形成平台企业舆论情感数据集。在一些具体示例中,基于互联网中监测到的平台企业舆情相关文本和构建的平台企业舆论情感词典,形成平台企业舆论情感数据集包括:将互联网中监测到的平台企业舆情相关文本和构建的平台企业舆论情感词典作为文本输入数据,利用TF/IDF算法进行筛选,以形成由正面情感词典和负面情感词典两部分组成的平台企业舆论情感数据集。例如可以针对互联网上的微博中平台企业相关和各大财经网站上的用户评论文本信息开展情感分析。舆情文本来自平台企业重点关注的各大社交媒体平台;平台企业舆论情感数据集一方面融合了目前中文的情感词典(如HOWNET、DLUTSD、NTUSD),并结合了平台企业领域的相关文献和报道,通过分词、TF/IDF算法以及人工的手段开展筛选,从而形成由正面情感词典和负面情感词典两部分组成的平台企业舆论情感数据集。
在步骤S102中,对所述平台企业舆论情感数据集中句子的词进行多级向量表示,以获得句子中单词的语义向量。在一些实施例中,对所述平台企业舆论情感数据集中句子的词进行多级向量表示,以获得句子中单词的语义向量包括:
基于所述平台企业舆论情感数据集中句子的词:
使用卷积网络进行字符级向量表示;
基于GloVe词嵌入工具,以获得词级向量表示;
基于Bert嵌入工具得到句子级别向量表示;
串联字符级向量表示、词级向量表示以及句子级别向量表示,并将串联信息,通过Albert模型进行编码,以获得句子中单词的语义向量:
Figure BDA0003731293300000061
其中,ew表示单词的语义向量,
Figure BDA0003731293300000062
表示词w的字符级向量表示,
Figure BDA0003731293300000063
为词w的词级向量表示,
Figure BDA0003731293300000064
表示词w的句子级向量表示。
在步骤S103中,对所述平台企业舆情相关文本进行句法分析,计算出句法分析树的概率值,并进行去噪处理。在一些实施例中,对所述平台企业舆情相关文本进行句法分析,计算出句法分析树的概率值,并进行去噪处理包括:
利用PCFG(Probabilistic Context Free Grammar)句法分析模型对平台企业舆情相关文本进行句法分析,计算出句法分析树的概率值,当存在多个概率树时,依据概率值对所有分析树进行排序,选择概率值靠前的句法分析树作为分析结果。以及
根据PCFG得到句子中每个词的概率值对句法树进行剪枝,去掉概率低的词,对长句去除噪声,识别原始短句的过程。
在步骤S104中,基于去噪后的所述平台企业舆情相关文本,以及,平台企业舆论情感数据集的语义向量进行语义增强匹配,以获得语义增强的语义向量。在一些实施例中,基于去噪后的所述平台企业舆情相关文本,以及,平台企业舆论情感数据集的语义向量进行语义增强匹配,以获得语义增强的语义向量包括:基于去噪后的所述平台企业舆情相关文本,和,平台企业舆论情感数据集进行语义增强匹配,以构建语义增强矩阵M∈Rd×d
具体的,得到去除噪声后的舆论文本后,构建语义增强矩阵M∈Rd×d,将去噪后的舆情文本中的词和平台企业舆论情感数据集进行语义增强匹配,M表示w和dic之间的相似度,其中
Figure BDA0003731293300000071
d维的M矩阵定义如下:
Figure BDA0003731293300000072
由此整合平台企业词典中的情感词语义,强化舆情文本中的词向量语义,得到语义进一步增强的舆情文本词语义。
在步骤S105中,基于语义增强的语义向量进行句子嵌入表示。在一些实施例中,基于语义增强的语义向量进行句子嵌入表示包括:
将所述语义增强矩阵作为输入,进行卷积操作:
Figure BDA0003731293300000073
其中σ(·)是ReLU函数,z(l,f)表示第l层的f类型输出端口的特征映射,表示,z(l,f)=Mf
Figure BDA0003731293300000074
为窗口大小,W(l,f)和b(l)为参数,Fl-1表示第(l-1)层特征数;
使用
Figure BDA0003731293300000081
Figure BDA0003731293300000082
作为池化操作的宽度和高度进行池化操作:
Figure BDA0003731293300000083
以池化输出的匹配向量被映射到低维空间中去,得到匹配向量[v1,...,vn];
将匹配向量作为句子嵌入模块的输入,利用一个GRU单元,得到输出隐藏向量[h′1...,h′n]作为句子嵌入表示。
在步骤S106中,基于句子嵌入表示的结果进行情感预设,以获得预测结果。在一些实施例中,基于句子嵌入表示的结果进行情感预设,以获得预测结果包括:
将隐藏向量[h′1...,h′n],作为情感预测模块的输入,定义匹配得分g(s,m,c):
Figure BDA0003731293300000084
Figure BDA0003731293300000085
Figure BDA0003731293300000086
其中,Wd1、Wd2、Wd、bd2、bd1是参数,ts是在训练中习得的虚拟文本向量,hi是隐藏向量[h′1...,h′n]的第i个隐藏状态,
Figure BDA0003731293300000087
是词w的最终隐藏状态。
互联网平台企业具有低成本、高效率、广覆盖、高风险的特点。以微博为代表的新兴社交媒体提供相关平台企业信息。与传统平台企业相比,本申请提出的基于语义增强网络的平台企业网络舆论情感分析方法,利用深度学习技术实现快速高效的情感分析,针对网络财经文本的情绪分析,有助于了解公众的情绪状态,及时获取舆论和态度,快速到达信息主体。
在平台企业舆情文本中词的表示过程中,本申请提出了多粒度词嵌入方法,联合字符级、词级和句子级词嵌入,多级融合可得语义丰富的词向量表示,以捕获更深层的平台企业舆情文本本地语义。
构建平台企业舆论情感数据集,并基于平台企业舆论情感数据集强化平台企业舆情文本中情感词汇权重,同时利用语义增强神经网络实现平台企业舆情情感语义加强,获得语义更加全面的平台企业舆情文本嵌入式表示。
本申请的语义增强过程,通过PCFG句法分析模型对平台企业舆论文本开展句法树剪枝,降低句子中的噪声,再进一步利用降噪后的舆论文本和平台企业情感词典开展语义增强匹配,强化舆情文本的文本向量语义。
本申请基于丰富平台企业情感语义的句子向量,进行情感预测,采用softmax函数开展判断,输出当前平台企业舆情状态,是正面舆情、负面舆情还是无情感,最终实现平台企业舆情的快速发现,进一步指导平台企业开展风险防范和应对。
本申请还提出一种基于语义增强网络的平台企业网络舆论情感分析装置,包括:
文本输入模块:用于基于互联网中监测到的平台企业舆情相关文本和构建的平台企业舆论情感词典,形成平台企业舆论情感数据集;
词嵌入模块:用于对所述平台企业舆论情感数据集中句子的词进行多级向量表示,以获得句子中单词的语义向量;
语义增强模块:用于对所述平台企业舆情相关文本进行句法分析,计算出句法分析树的概率值,并进行去噪处理;基于去噪后的所述平台企业舆情相关文本,以及,平台企业舆论情感数据集的语义向量进行语义增强匹配,以获得语义增强的语义向量;
句子嵌入模块:用于基于语义增强的语义向量进行句子嵌入表示;
情感预测模块:用于基于句子嵌入表示的结果进行情感预设,以获得预测结果。
本申请还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前述的基于语义增强网络的平台企业网络舆论情感分析方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (9)

1.一种基于语义增强网络的平台企业网络舆论情感分析方法,其特征在于,包括:
基于互联网中监测到的平台企业舆情相关文本和构建的平台企业舆论情感词典,形成平台企业舆论情感数据集;
对所述平台企业舆论情感数据集中句子的词进行多级向量表示,以获得句子中单词的语义向量;
对所述平台企业舆情相关文本进行句法分析,计算出句法分析树的概率值,并进行去噪处理;
基于去噪后的所述平台企业舆情相关文本,以及,平台企业舆论情感数据集的语义向量进行语义增强匹配,以获得语义增强的语义向量;
基于语义增强的语义向量进行句子嵌入表示;
基于句子嵌入表示的结果进行情感预设,以获得预测结果。
2.如权利要求1所述的基于语义增强网络的平台企业网络舆论情感分析方法,其特征在于,基于互联网中监测到的平台企业舆情相关文本和构建的平台企业舆论情感词典,形成平台企业舆论情感数据集包括:
将互联网中监测到的平台企业舆情相关文本和构建的平台企业舆论情感词典作为文本输入数据,利用TF/IDF算法进行筛选,以形成由正面情感词典和负面情感词典两部分组成的平台企业舆论情感数据集。
3.如权利要求2所述的基于语义增强网络的平台企业网络舆论情感分析方法,其特征在于,对所述平台企业舆论情感数据集中句子的词进行多级向量表示,以获得句子中单词的语义向量包括:
基于所述平台企业舆论情感数据集中句子的词:
使用卷积网络进行字符级向量表示;
基于GloVe词嵌入工具,以获得词级向量表示;
基于Bert嵌入工具得到句子级别向量表示;
串联字符级向量表示、词级向量表示以及句子级别向量表示,并将串联信息,通过Albert模型进行编码,以获得句子中单词的语义向量:
Figure FDA0003731293290000021
其中,ew表示单词的语义向量,
Figure FDA0003731293290000022
表示词w的字符级向量表示,
Figure FDA0003731293290000023
为词w的词级向量表示,
Figure FDA0003731293290000024
表示词w的句子级向量表示。
4.如权利要求3所述的基于语义增强网络的平台企业网络舆论情感分析方法,其特征在于,对所述平台企业舆情相关文本进行句法分析,计算出句法分析树的概率值,并进行去噪处理包括:
利用PCFG句法分析模型对平台企业舆情相关文本进行句法分析,计算出句法分析树的概率值;
依据概率值对所有分析树进行排序,选择概率值靠前的句法分析树作为分析结果;以及
根据PCFG得到句子中每个词的概率值对句法树进行剪枝,去掉概率低的词。
5.如权利要求4所述的基于语义增强网络的平台企业网络舆论情感分析方法,其特征在于,基于去噪后的所述平台企业舆情相关文本,以及,平台企业舆论情感数据集的语义向量进行语义增强匹配,以获得语义增强的语义向量包括:
基于去噪后的所述平台企业舆情相关文本,和,平台企业舆论情感数据集进行语义增强匹配,以构建语义增强矩阵M∈Rd×d
6.如权利要求5所述的基于语义增强网络的平台企业网络舆论情感分析方法,其特征在于,基于语义增强的语义向量进行句子嵌入表示包括:
将所述语义增强矩阵作为输入,进行卷积操作:
Figure FDA0003731293290000025
其中σ(·)是ReLU函数,z(l,f)表示第l层的f类型输出端口的特征映射,表示,z(l,f)=Mf
Figure FDA0003731293290000026
为窗口大小,W(l,f)和b(l)为参数,Fl-1表示第(l-1)层特征数;
使用
Figure FDA0003731293290000027
Figure FDA0003731293290000028
作为池化操作的宽度和高度进行池化操作:
Figure FDA0003731293290000031
以池化输出的匹配向量被映射到低维空间中去,得到匹配向量[v1,...,vn];
将匹配向量作为句子嵌入模块的输入,利用一个GRU单元,得到输出隐藏向量[h′1...,h′n]作为句子嵌入表示。
7.如权利要求5所述的基于语义增强网络的平台企业网络舆论情感分析方法,其特征在于,基于句子嵌入表示的结果进行情感预设,以获得预测结果包括:
将隐藏向量[h′1...,h′n],作为情感预测模块的输入,定义匹配得分g(s,m,c):
Figure FDA0003731293290000032
Figure FDA0003731293290000033
Figure FDA0003731293290000034
其中,Wd1、Wd2、Wd、bd2、bd1是参数,ts是在训练中习得的虚拟文本向量,hi是隐藏向量[h′1...,h′n]的第i个隐藏状态,
Figure FDA0003731293290000035
是词w的最终隐藏状态。
8.一种基于语义增强网络的平台企业网络舆论情感分析装置,其特征在于,包括:
文本输入模块:用于基于互联网中监测到的平台企业舆情相关文本和构建的平台企业舆论情感词典,形成平台企业舆论情感数据集;
词嵌入模块:用于对所述平台企业舆论情感数据集中句子的词进行多级向量表示,以获得句子中单词的语义向量;
语义增强模块:用于对所述平台企业舆情相关文本进行句法分析,计算出句法分析树的概率值,并进行去噪处理;基于去噪后的所述平台企业舆情相关文本,以及,平台企业舆论情感数据集的语义向量进行语义增强匹配,以获得语义增强的语义向量;
句子嵌入模块:用于基于语义增强的语义向量进行句子嵌入表示;
情感预测模块:用于基于句子嵌入表示的结果进行情感预设,以获得预测结果。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于语义增强网络的平台企业网络舆论情感分析方法的步骤。
CN202210784238.2A 2022-07-05 2022-07-05 基于语义增强网络的平台企业网络舆论情感分析方法 Pending CN115329769A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210784238.2A CN115329769A (zh) 2022-07-05 2022-07-05 基于语义增强网络的平台企业网络舆论情感分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210784238.2A CN115329769A (zh) 2022-07-05 2022-07-05 基于语义增强网络的平台企业网络舆论情感分析方法

Publications (1)

Publication Number Publication Date
CN115329769A true CN115329769A (zh) 2022-11-11

Family

ID=83917973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210784238.2A Pending CN115329769A (zh) 2022-07-05 2022-07-05 基于语义增强网络的平台企业网络舆论情感分析方法

Country Status (1)

Country Link
CN (1) CN115329769A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115841119A (zh) * 2023-02-21 2023-03-24 中国科学技术大学 一种基于图结构的情绪原因提取方法
CN116629275A (zh) * 2023-07-21 2023-08-22 北京无极慧通科技有限公司 一种基于大数据的智能决策支持系统及方法
CN117271438A (zh) * 2023-07-17 2023-12-22 乾元云硕科技(深圳)有限公司 用于大数据的智能存储系统及其方法
CN117350276A (zh) * 2023-12-05 2024-01-05 卓世未来(天津)科技有限公司 一种数据增强方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115841119A (zh) * 2023-02-21 2023-03-24 中国科学技术大学 一种基于图结构的情绪原因提取方法
CN115841119B (zh) * 2023-02-21 2023-06-16 中国科学技术大学 一种基于图结构的情绪原因提取方法
CN117271438A (zh) * 2023-07-17 2023-12-22 乾元云硕科技(深圳)有限公司 用于大数据的智能存储系统及其方法
CN117271438B (zh) * 2023-07-17 2024-07-30 乾元云硕科技(深圳)有限公司 用于大数据的智能存储系统及其方法
CN116629275A (zh) * 2023-07-21 2023-08-22 北京无极慧通科技有限公司 一种基于大数据的智能决策支持系统及方法
CN116629275B (zh) * 2023-07-21 2023-09-22 北京无极慧通科技有限公司 一种基于大数据的智能决策支持系统及方法
CN117350276A (zh) * 2023-12-05 2024-01-05 卓世未来(天津)科技有限公司 一种数据增强方法及系统
CN117350276B (zh) * 2023-12-05 2024-02-13 卓世未来(天津)科技有限公司 一种数据增强方法及系统

Similar Documents

Publication Publication Date Title
CN115329769A (zh) 基于语义增强网络的平台企业网络舆论情感分析方法
CN110263323A (zh) 基于栅栏式长短时记忆神经网络的关键词抽取方法及系统
CN114118065B (zh) 一种电力领域中文文本纠错方法、装置、存储介质及计算设备
CN110414004B (zh) 一种核心信息提取的方法和系统
WO2023040493A1 (zh) 事件检测
CN113051374B (zh) 一种文本匹配优化方法及装置
CN110502742B (zh) 一种复杂实体抽取方法、装置、介质及系统
CN115952291B (zh) 基于多头自注意力及lstm的金融舆情分类方法及系统
CN112992125B (zh) 一种语音识别方法、装置、电子设备、可读存储介质
CN113672731B (zh) 基于领域信息的情感分析方法、装置、设备及存储介质
CN115982350A (zh) 基于多模态Transformer的虚假新闻检测方法
CN111680529A (zh) 一种基于层聚合的机器翻译算法及装置
CN112287240A (zh) 基于双嵌入多层卷积神经网络的案件微博评价对象抽取方法及装置
CN116049387A (zh) 一种基于图卷积的短文本分类方法、装置、介质
CN114416991A (zh) 一种基于prompt的文本情感原因分析方法和系统
CN112200674B (zh) 一种证券市场情绪指数智能计算信息系统
CN117910458A (zh) 一种基于大语言模型的文本数据清洗系统
CN110909167B (zh) 一种微博文本分类系统
CN113609873A (zh) 翻译模型训练方法、装置及介质
CN107045497A (zh) 一种快速的新闻文本内容情感分析系统及方法
CN115292492A (zh) 意图分类模型的训练方法、装置、设备及存储介质
CN114722153A (zh) 一种意图分类的方法和装置
CN111611379A (zh) 一种文本信息分类方法、装置、设备及可读存储介质
CN117932487B (zh) 一种风险分类模型训练、风险分类方法及装置
CN116975298B (zh) 一种基于nlp的现代化社会治理调度系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination