CN110909529A - 一种公司形象提升系统的用户情感分析和预判系统 - Google Patents

一种公司形象提升系统的用户情感分析和预判系统 Download PDF

Info

Publication number
CN110909529A
CN110909529A CN201911183478.1A CN201911183478A CN110909529A CN 110909529 A CN110909529 A CN 110909529A CN 201911183478 A CN201911183478 A CN 201911183478A CN 110909529 A CN110909529 A CN 110909529A
Authority
CN
China
Prior art keywords
emotion
text
user
analysis
polarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911183478.1A
Other languages
English (en)
Other versions
CN110909529B (zh
Inventor
陈睿欣
杨俊鹏
于灏
郑厚清
刘素蔚
王玓
刘睿
谢清霞
孙艺新
贾德香
傅弘亚
林坤新
李心达
王程
崔维平
柳占杰
陈�光
王智敏
高洪达
刘威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Grid Energy Research Institute Co Ltd
State Grid Beijing Electric Power Co Ltd
Original Assignee
National Grid Energy Research Institute Co Ltd
State Grid Beijing Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Grid Energy Research Institute Co Ltd, State Grid Beijing Electric Power Co Ltd filed Critical National Grid Energy Research Institute Co Ltd
Priority to CN201911183478.1A priority Critical patent/CN110909529B/zh
Publication of CN110909529A publication Critical patent/CN110909529A/zh
Application granted granted Critical
Publication of CN110909529B publication Critical patent/CN110909529B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种公司形象提升系统的用户情感分析和预判系统,包括情感极性预测模块、情感分析模块、风险识别模块与数据输入,所述情感极性预测模块由基于传统机器学习的中文长本分析与基于深度学习的长、短文本分析组成,所述情感极性预测模块对网络数据进行预测分析,所述情感极性预测模块由机结合机器学习模型和深度学习模型,对用户的情感进行分析,机器学习模型采用朴素贝叶斯算法中词频采用本方案提出的词频补数。本发明解决机器理解文本深层意思、预测效率和精准度的问题,实现强化客户需求管理、探究客户情绪、优化客户服务体系等目的,为公司提供了在负面事件大规模蔓延之前阻止负面事件一步发展的可能,更好地维护公司的公众形象。

Description

一种公司形象提升系统的用户情感分析和预判系统
技术领域
本发明涉及自然语言处理技术领域,具体为一种公司形象提升系统的用户情感分析和预判系统。
背景技术
随着互联网的快速发展,社会媒体信息传播途径和方式越来越多,网友在网上的言论也随着增多,网上的言论对公司的声誉有着较大的影响,及时了解用户情绪和需求是解决公司声誉问题的重要前提。
网络上面的舆论往往是对当下的某一事件的讨论,加上一些情绪化的意见而形成,往往在非常短时间内就能有较大的影响,由于受到主客观方面的影响,使得网民的发言具有一定的局限性,相对感性化和情绪化等,特别是一部分人将其作为宣泄情绪的场所,由此可见,网络舆论已经成为影响社会持续稳定发展、维护社会和谐与稳定的重要因素,我们可以利用自然语言处理技术在社交媒体上了解社交媒体中各用户的情绪。
传统的文本情感分析的方式包括基于情感词典的方法,即对文本分词,找出文档中的情感词、否定词以及程度副词,然后判断每个情感词之前是否有否定词及程度副词,将它之前的否定词和程度副词划分为一个组,如果有否定词将情感词的情感权值变为负,如果有程度副词就乘以程度副词的程度值,最后所有组的得分加起来,如果得分为正数,则情感是积极的,如果得分为负数,则情感是消极的。
目前相似技术:
(1)《基于机器学习的情绪预测方法、装置、设备》
该专利发明一种基于机器学习的情绪预测方法,该方案获取第一预设时间内多维特征值,得到第一训练样本集,得到样本集后对情绪预测模型进行训练,生成训练后的第一情绪预测模型,根据所述第一预测样本集和所述训练后的第一情绪预测模型,进行情绪预测。
(2)《一种文本情绪预测方法及装置》
该方案构建情绪匹配知识库,将待分类文本与情绪匹配知识库进行匹配,得到待分类文本的情绪特征,然后对情绪特征进行分类,得到文本的情绪分类结果,在人工构建具有动作与对象标注的情绪匹配知识库的基础上,将待分类文本自动学习进行分类
但是,上述的两种现有技术都存在缺陷,如下:
(1)《基于机器学习的情绪预测方法、装置、设备》
该方案用纯机器学习算法对长和短文本进行情感预测,对文本的深层意思难以预测,其中岭回归算法中用文本特征词向量作为算法的自变量,情感种类作为因变量输出,文本的特征词数量通常较多,即使有了岭回归的权重限制,特征词数量多后误差依然会变大。
(2)《一种文本情绪预测方法及装置》
该方案的算法需要带有词汇量较多的语料库,输入文本后在语料库进行匹配对应,提取情感种类和感情等级,预测效果和语料库大小成正相关关系,随着语料库词语数量的增大,算法速度也会受影响。
发明内容
本发明的目的在于提供一种公司形象提升系统的用户情感分析和预判系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种公司形象提升系统的用户情感分析和预判系统,包括情感极性预测模块、情感分析模块、风险识别模块与数据输入,所述情感极性预测模块由基于传统机器学习的中文长本分析与基于深度学习的长、短文本分析组成,所述情感极性预测模块对网络数据进行预测分析,所述情感极性预测模块由机结合机器学习模型和深度学习模型,对用户的情感进行分析,机器学习模型采用朴素贝叶斯算法中词频采用本方案提出的词频补数,增加预测准确率,深度学习模型采用自注意力机制,加强作用于风险事件的注意力,同时采用Encoder-Decoder框架,仿文本摘要功能实现对自注意力机制的加强,自注意力机制对文本的高层次向量表示序列进行融合,构建基于自注意力机制的循环神经网络情感分析模型;
所述情感分析模块由用户情绪分析与群体情绪分析组成,所述情感分析模块根据情感极性预测模块的技术,结合客户属性数据进行分析,所述群体情绪分析利用用户情绪分析模型,再结合复杂社交网络拓扑图,来预测群体情感,群体情绪分析方案对社区群体基于投票的方式进行融合;
所述风险识别模块由关键社区和关键节点及风险事件识别体系组成,结合关键社区和关键节点历史风险事件,提出风险事件抑制解决方案;
所述数据输入包括公司客户服务数据和社交媒体数据进行相关性关联后的数据及用户在社交网络上的行为数据,主要是用户发布、转发或者评论的文本的分析。
优选的,所述情感极性预测模块中考虑到社交媒体上的数据大多是短文本数据,因此主要采用短文本情感分析技术,长文本和中长文本情感分析技术作为辅助,在模型方面,以深度学习情感分析技术为主,以基于传统监督学习的情感技术为辅,其中文本分长文本,中长文本,短文本,中长文本定义为3或4句话,长文本和短文本的长短分别在中长文本之上和之下。
优选的,所述基于传统机器学习的中文长本分析采用词袋模型,朴素贝叶斯对情感极性进行预测,用于中长文本分析,通过文本特征工程的方式抽取文本内容的特征。
优选的,所述基于深度学习的长、短文本分析针对社交媒体上的文本内容短文本的特点,拟采用深度神经网络的方式将中短文本映射到语义层面的高层次表示,进一步对文本的情感极性进行判别,同时,考虑到社交媒体本身丰富的信息以及公司客户服务的数据,可以在文本内容的基础上引入用户属性等上下文信息,提升用户情感极性判别的准确性。
优选的,所述用户情绪分析偏向个人化,通过情感极性分析技术对用户个人文本信息和个人属性数据,及网上留下的种种信息记录来进行分析。
优选的,所述群体情感分析针对复杂社交网络拓扑结构的结构特点,拟采用用户情感分析模型对用户节点的情感极性进行判别,在社区的基础之上采用投票方式对社区的情感极性进行判别,同时,在不考虑社区的基础上,在社交网络结构上运行图联通算法检测用户情感极性的传播范围。
优选的,基于用户情绪分析模型对复杂社交网络上的用户节点的情感极性进行分析和判别,结合公司形象提升系统的复杂社交网络模型拓扑结构,采用投票的方式对社区用户的整体情感极性进行综合判别,投票方式的投票个体是对一个群体中的每个个体,对事情的情感态度,最终票数最高者作为该群体的情感状态。
优选的,考虑到用户的消极情绪只有在一个群体中开始发酵,才有可能发展成为一个大规模负面事件,而可能爆发的风险事件,因此不以社区为基础,直接在复杂社交网络拓扑图上运行图联通算法,判断消极情绪当前传播的范围,综合判断不同群体的情感极性,对提前预防风险事件的大规模发酵具有积极意义。
优选的,所述风险事件识别体系充分研究和分析公司的业务场景,并结合相关历史事件的影响,对相关事件的影响程度做综合的评估,找到与事件影响程度关联较大的因素,提出对风险事件的不同方面进行评估的一系列风险评估指标,构建一套有效的且可行的风险评估指标体系,发现社交网络上潜在风险事件后,结合复杂社交网络模型,对热点事件传播的特点进行分析。
与现有技术相比,本发明的有益效果是:
本发明将综合利用基于传统机器学习的情感分析技术和深度学习模型来进行预测分析,解决机器理解文本深层意思、预测效率和精准度的问题,通过对文本大数据进行深入挖掘,实现强化客户需求管理、探究客户情绪、优化客户服务体系等目的,同时说明识别社交网络中潜在的风险事件的方法,结合复杂社交网络模型,分析热点事件的传播的特点,构建系统的抑制风险事件的解决方案,通过主动服务、预先公关等手段中断可能的传播路径上的关键节点或者综合影响力较大的节点,为公司提供了在负面事件大规模蔓延之前阻止负面事件一步发展的可能,更好地维护公司的公众形象;
具体优点如下:
1、采用基于本方案提出的基于特殊字典进行词频补数的朴素贝叶斯算法,提高算法准确率。
2、有机结合机器学习和深度学习算法互补式地优化情感分析模型,提高模型效率。
3、利用深度学习算法理解文本深层意思,加入自注意力机制,对目标文本进行自动学习,侧重关注。
附图说明
图1为本发明的整体系统框图;
图2为本发明的基于传统机器学习的情感分析模型流程图;
图3为本发明的基于深度学习的情感分析模型流程图;
图4为本发明的Skip-gram模型的简单神经网络图;
图5为本发明的循环神经网络示意图;
图6为本发明的循环内部结构图;
图7为本发明的引入注意力模型的Encoder-Decoder框架图。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1至图7,本发明提供一种技术方案:一种公司形象提升系统的用户情感分析和预判系统,如图1所示,包括情感极性预测模块、情感分析模块、风险识别模块与数据输入,所述情感极性预测模块由基于传统机器学习的中文长本分析与基于深度学习的长、短文本分析组成,所述情感分析模块由用户情绪分析与群体情绪分析组成,所述风险识别模块由关键社区和关键节点及风险事件识别体系组成,所述数据输入包括公司客户服务数据和社交媒体数据进行相关性关联后的数据及用户在社交网络上的行为数据。
如图2所示,所述情感极性预测模块中考虑到社交媒体上的数据大多是短文本数据,因此主要采用短文本情感分析技术,长文本和中长文本情感分析技术作为辅助,在模型方面,以深度学习情感分析技术为主,以基于传统监督学习的情感技术为辅,其中文本分长文本,中长文本,短文本,中长文本定义为3或4句话,长文本和短文本的长短分别在中长文本之上和之下。
所述基于传统机器学习的中文长本分析采用词袋模型,朴素贝叶斯对情感极性进行预测,用于中长文本分析,通过文本特征工程的方式抽取文本内容的特征,过程步骤如下:
1、文本预处理:对文本进行分词、去停用词,构造词袋。
2、对分词结果分类,找出情感词、否定词和程度副词。
3、标记特殊词,特殊词指的是网络用语,新型词汇,以及步骤2介绍的词语,对它们进行标记,本方案称之为特殊加成的词语。
4、将词语投入朴素贝叶斯模型进行训练、预测。
步骤2中介绍的词语类型,即进行特殊加成的词典:
①使用BosonNLP情感词典,例如:辛勤劳作、良心,该词典都带有情感分值,处理词语的时候作为加权值用。
②否定词词典,例如:几乎不、从不、放弃、反对。
③程度副词词典,例如:百分比、非常
在以上各个词典中的词语都是情感比较强烈的,为了提高预测效果,本方案在朴素贝叶斯模型中,修改词语在文中的概率,停用词词典,即一些无参考价值的词语,例如:我,怎么。
在计算词频时,对它们的词频进行额外增加,以增大盖茨的比重,本方案称之为词频补数。
Figure BDA0002291856600000071
其中NP为真实数量,N为最新数量,式子作用为,随着改词语出现次数的升高,它的加成就会越来越多。
如图3至图7所示,所述基于深度学习的长、短文本分析针对社交媒体上的文本内容短文本的特点,拟采用深度神经网络的方式将中短文本映射到语义层面的高层次表示,进一步对文本的情感极性进行判别,同时,考虑到社交媒体本身丰富的信息以及公司客户服务的数据,可以在文本内容的基础上引入用户属性等上下文信息,提升用户情感极性判别的准确性过程步骤如下:
1、首先对文本进行分词,采用词向量技术,本方案采用word2vec制作词向量,word2vec算法中Skip-gram模型就是对词字进行降维操作。
每个单词变成one-hot编码形式,将单词由one-hot表示映射到低维度空间的向量表示,结合字向量技术,将字映射到对应的低维度向量表示,得到一个词向量序列和字向量序列。
该词向量序列和字向量序列比原来的one-hot编码形式简短,便于相似语义词语的计算,字词应用的语境相同的词语在模型中相似度会较高。
2、采用循环神经网络分别对词向量序列和字向量序列进行处理,得到更高层次的文本表示,根据具体的实验结果确定循环层的具体层数,按序列输入的学习数据X={X1,X2,...,Xτ}
变量说明:
x<k>表示输入序列中的第k个元素
y<k>表示输出序列中的第k个元素
RNN单元在时刻t0接收输入x0并产生输出y0,在下一个时刻t1,RNN单元同时接收输入x1和上一个时刻的输出h0,从而产生本时刻的输出,这使得RNN可以考虑历史输入的影响。
该循环神经网络用向前传播方式实现:
ht为隐藏层的活性值,wh为隐藏层的权重值:
Figure BDA0002291856600000081
yt为第t个时刻的输出,f(·)是一个非线性函数。
yt=f(Wo*ht+bo) (3)
Sigmoid函数:
Figure BDA0002291856600000082
模型的损失函数为:
Figure BDA0002291856600000083
将语料库中的语句逐个输入到RNN中,以此来训练模型的参数,最终得到更高层次的向量序列表示。
3、得到文本的更高层次向量序列后,采用自注意力机制对文本的高层次向量表示序列进行融合,得到文本的向量表示,通过自注意力机制并利用训练过程的监督信号来使得模型自动学习关注序列的哪些部分,再将基于字向量的的文本向量表示和基于词向量的文本向量表示进行连接,得到文本的最终表示。
该模型类似于文本摘要的Encoder-Decoder框架,在一批数据中筛选出需要的部分。
在步骤2的循环神经网络的基础下使用Encoder-Decoder框架,加入自注意力机制,即两个循环神经网络合并起来。原始编解码模型的Encoder过程生成一个中间向量C,用于保存原序列的语义信息,这个向量长度是固定的,当输入原序列的长度比较长时,向量C无法保存全部的语义信息,上下文语义信息受到了限制,限制了模型的理解能力,所以使用自注意力机制来打破这种原始编解码模型对固定向量的限制。
4、在文本向量表示的基础之上应用多层感知机(MLP)对文本向量表示进行映射,根据情感极性的类别数目N,最后采用具备N个输出单元的softmax层输出文本属于各类情感类别的概率。
5、考虑到社交媒体上用户的数据本身比较丰富,且与公司客户服务数据进行了关联,可以将用户的属性数据之类的融入到深度神经网络模型中,进一步提升情感分析效果的准确性,利用语言模型或者机器翻译监督数据量大的特点,借鉴迁移学习的思想,对基于深度神经网络的情感分析模型进行预训练,提升模型效果。
用户情绪的分析偏向个人化,用以上提到的情感极性分析技术对用户个人文本信息和个人属性数据,例如个人喜好、性别、职业等等,还有网上留下的种种信息记录,比如上网时间短,上网时长等等,来进行分析。
针对复杂社交网络拓扑结构的结构特点,本项目拟采用用户情感分析模型对用户节点的情感极性进行判别,在社区的基础之上采用投票方式对社区的情感极性进行判别,同时,在不考虑社区的基础上,在社交网络结构上运行图联通算法检测用户情感极性的传播范围。
首先,基于用户情绪分析模型对复杂社交网络上的用户节点的情感极性进行分析和判别,结合公司形象提升系统的复杂社交网络模型拓扑结构,采用投票的方式对社区用户的整体情感极性进行综合判别,投票方式的投票个体是对一个群体中的每个个体,对事情的情感态度,最终票数最高者作为该群体的情感状态。
同时,不以社区为基础,直接在复杂社交网络拓扑图上运行图联通算法,判断消极情绪当前传播的范围,综合判断不同群体的情感极性,考虑到用户的消极情绪只有在一个群体中开始发酵,才有可能发展成为一个大规模负面事件,而可能爆发的风险事件,对提前预防风险事件的大规模发酵具有积极意义。
针对复杂社会风险缓解策略本身比较难,超出了机器模型的能力范围,本方案为业务人员提供支持,由业务人员制定风险环节策略,在数据量累计足够之后,根据风险事件的特点去对缓解策略进行评估排序,看作一个推荐的问题,最终反馈给业务人员,作为业务人员的辅助,进一步提升效率。
不同的事件最终形成的负面影响程度是不同的,需要一个可以量化的指标体系来对不同的事件的影响程度进行评估,该部分拟充分研究和分析公司的业务场景,并结合相关历史事件的影响,对相关事件的影响程度做综合的评估,找到与事件影响程度关联较大的因素,提出对风险事件的不同方面进行评估的一系列风险评估指标,构建一套有效的且可行的风险评估指标体系,为项目的社会网络潜在风险事件识别模块构建基本的评价体系,用于指导模块的研究以及进一步改进,为公司的舆情监测系统评价体系提供参考。
发现社交网络上潜在风险事件后,结合复杂社交网络模型,分析热点事件的传播的特点。
1、识别复杂社会网络中公司业务相关的关键社区和关键节点,利用复杂社会网络中节点之间的单向影响力关系,评估关键节点在特定事件传播中的综合影响力,结合复杂社交网络上关键节点识别技术,辨识重点公关的关键社区和关键节点。
2、根据公司的业务场景需求,结合历史风险事件的影响,咨询相关领域专家,确定与风险事件相关程度较高的因素,并据此设计合理的风险指标评价参考。
3、在初期,将分析得到的关键节点、关键社区以及风险指标值等直接反馈给公司业务人员,由公司业务人员提供具体的风险缓解策略,同时记录进系统。在累计到足够的数据量之后,根据风险事件的特点,结合信息检索技术和推荐技术对可选的风险缓解策略进行排序,并将排序的结果反馈给业务人员,同时为业务人员提供。
工作原理:该公司形象提升系统的用户情感分析和预判系统,使用时,将公司客户服务数据和社交媒体数据进行相关性关联后的数据及用户在社交网络上的行为数据进行输入,然后基于传统机器学习的中文长本分析,采用词袋模型,朴素贝叶斯对情感极性进行预测,用于中长文本分析,通过文本特征工程的方式抽取文本内容的特征,接着基于深度学习的长、短文本分析针对社交媒体上的文本内容短文本的特点,拟采用深度神经网络的方式将中短文本映射到语义层面的高层次表示,进一步对文本的情感极性进行判别,同时,考虑到社交媒体本身丰富的信息以及公司客户服务的数据,可以在文本内容的基础上引入用户属性等上下文信息,提升用户情感极性判别的准确性,然后通过情感极性分析技术对用户个人文本信息和个人属性数据,及网上留下的种种信息记录来进行分析,群体情感分析针对复杂社交网络拓扑结构的结构特点,拟采用用户情感分析模型对用户节点的情感极性进行判别,在社区的基础之上采用投票方式对社区的情感极性进行判别,同时,在不考虑社区的基础上,在社交网络结构上运行图联通算法检测用户情感极性的传播范围,先基于用户情绪分析模型对复杂社交网络上的用户节点的情感极性进行分析和判别,结合公司形象提升系统的复杂社交网络模型拓扑结构,采用投票的方式对社区用户的整体情感极性进行综合判别,投票方式的投票个体是对一个群体中的每个个体,对事情的情感态度,最终票数最高者作为该群体的情感状态,同时,考虑到用户的消极情绪只有在一个群体中开始发酵,才有可能发展成为一个大规模负面事件,而可能爆发的风险事件,因此不以社区为基础,直接在复杂社交网络拓扑图上运行图联通算法,判断消极情绪当前传播的范围,综合判断不同群体的情感极性,对提前预防风险事件的大规模发酵具有积极意义,最后风险事件识别体系充分研究和分析公司的业务场景,并结合相关历史事件的影响,对相关事件的影响程度做综合的评估,找到与事件影响程度关联较大的因素,提出对风险事件的不同方面进行评估的一系列风险评估指标,构建一套有效的且可行的风险评估指标体系,发现社交网络上潜在风险事件后,结合复杂社交网络模型,对热点事件传播的特点进行分析。
本发明主要针对一种公司形象提升系统的用户情感分析和预判系统,本发明将综合利用基于传统机器学习的情感分析技术和深度学习模型来进行预测分析,解决机器理解文本深层意思、预测效率和精准度的问题,本方案通过对文本大数据进行深入挖掘,实现强化客户需求管理、探究客户情绪、优化客户服务体系等目的,同时说明识别社交网络中潜在的风险事件的方法,结合复杂社交网络模型,分析热点事件的传播的特点,构建系统的抑制风险事件的解决方案,通过主动服务、预先公关等手段中断可能的传播路径上的关键节点或者综合影响力较大的节点,为公司提供了在负面事件大规模蔓延之前阻止负面事件一步发展的可能,更好地维护公司的公众形象。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (9)

1.一种公司形象提升系统的用户情感分析和预判系统,其特征在于:包括情感极性预测模块、情感分析模块、风险识别模块与数据输入,所述情感极性预测模块由基于传统机器学习的中文长本分析与基于深度学习的长、短文本分析组成,所述情感极性预测模块对网络数据进行预测分析,所述情感极性预测模块由机结合机器学习模型和深度学习模型,对用户的情感进行分析,机器学习模型采用朴素贝叶斯算法中词频采用本方案提出的词频补数,增加预测准确率,深度学习模型采用自注意力机制,加强作用于风险事件的注意力,同时采用Encoder-Decoder框架,仿文本摘要功能实现对自注意力机制的加强,自注意力机制对文本的高层次向量表示序列进行融合,构建基于自注意力机制的循环神经网络情感分析模型;
所述情感分析模块由用户情绪分析与群体情绪分析组成,所述情感分析模块根据情感极性预测模块的技术,结合客户属性数据进行分析,所述群体情绪分析利用用户情绪分析模型,再结合复杂社交网络拓扑图,来预测群体情感,群体情绪分析方案对社区群体基于投票的方式进行融合;
所述风险识别模块由关键社区和关键节点及风险事件识别体系组成,结合关键社区和关键节点历史风险事件,提出风险事件抑制解决方案;
所述数据输入包括公司客户服务数据和社交媒体数据进行相关性关联后的数据及用户在社交网络上的行为数据,主要是用户发布、转发或者评论的文本的分析。
2.根据权利要求1所述的一种公司形象提升系统的用户情感分析和预判系统,其特征在于:所述情感极性预测模块中考虑到社交媒体上的数据大多是短文本数据,因此主要采用短文本情感分析技术,长文本和中长文本情感分析技术作为辅助,在模型方面,以深度学习情感分析技术为主,以基于传统监督学习的情感技术为辅,其中文本分长文本,中长文本,短文本,中长文本定义为3或4句话,长文本和短文本的长短分别在中长文本之上和之下。
3.根据权利要求1所述的一种公司形象提升系统的用户情感分析和预判系统,其特征在于:所述基于传统机器学习的中文长本分析采用词袋模型,朴素贝叶斯对情感极性进行预测,用于中长文本分析,通过文本特征工程的方式抽取文本内容的特征。
4.根据权利要求1所述的一种公司形象提升系统的用户情感分析和预判系统,其特征在于:所述基于深度学习的长、短文本分析针对社交媒体上的文本内容短文本的特点,拟采用深度神经网络的方式将中短文本映射到语义层面的高层次表示,进一步对文本的情感极性进行判别,同时,考虑到社交媒体本身丰富的信息以及公司客户服务的数据,可以在文本内容的基础上引入用户属性等上下文信息,提升用户情感极性判别的准确性。
5.根据权利要求1所述的一种公司形象提升系统的用户情感分析和预判系统,其特征在于:所述用户情绪分析偏向个人化,通过情感极性分析技术对用户个人文本信息和个人属性数据,及网上留下的种种信息记录来进行分析。
6.根据权利要求1所述的一种公司形象提升系统的用户情感分析和预判系统,其特征在于:所述群体情感分析针对复杂社交网络拓扑结构的结构特点,拟采用用户情感分析模型对用户节点的情感极性进行判别,在社区的基础之上采用投票方式对社区的情感极性进行判别,同时,在不考虑社区的基础上,在社交网络结构上运行图联通算法检测用户情感极性的传播范围。
7.根据权利要求6所述的一种公司形象提升系统的用户情感分析和预判系统,其特征在于:基于用户情绪分析模型对复杂社交网络上的用户节点的情感极性进行分析和判别,结合公司形象提升系统的复杂社交网络模型拓扑结构,采用投票的方式对社区用户的整体情感极性进行综合判别,投票方式的投票个体是对一个群体中的每个个体,对事情的情感态度,最终票数最高者作为该群体的情感状态。
8.根据权利要求6所述的一种公司形象提升系统的用户情感分析和预判系统,其特征在于:考虑到用户的消极情绪只有在一个群体中开始发酵,才有可能发展成为一个大规模负面事件,而可能爆发的风险事件,因此不以社区为基础,直接在复杂社交网络拓扑图上运行图联通算法,判断消极情绪当前传播的范围,综合判断不同群体的情感极性,对提前预防风险事件的大规模发酵具有积极意义。
9.根据权利要求1所述的一种公司形象提升系统的用户情感分析和预判系统,其特征在于:所述风险事件识别体系充分研究和分析公司的业务场景,并结合相关历史事件的影响,对相关事件的影响程度做综合的评估,找到与事件影响程度关联较大的因素,提出对风险事件的不同方面进行评估的一系列风险评估指标,构建一套有效的且可行的风险评估指标体系,发现社交网络上潜在风险事件后,结合复杂社交网络模型,对热点事件传播的特点进行分析。
CN201911183478.1A 2019-11-27 2019-11-27 一种公司形象提升系统的用户情感分析和预判系统 Active CN110909529B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911183478.1A CN110909529B (zh) 2019-11-27 2019-11-27 一种公司形象提升系统的用户情感分析和预判系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911183478.1A CN110909529B (zh) 2019-11-27 2019-11-27 一种公司形象提升系统的用户情感分析和预判系统

Publications (2)

Publication Number Publication Date
CN110909529A true CN110909529A (zh) 2020-03-24
CN110909529B CN110909529B (zh) 2023-03-24

Family

ID=69818556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911183478.1A Active CN110909529B (zh) 2019-11-27 2019-11-27 一种公司形象提升系统的用户情感分析和预判系统

Country Status (1)

Country Link
CN (1) CN110909529B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111985223A (zh) * 2020-08-25 2020-11-24 武汉长江通信产业集团股份有限公司 一种基于长短记忆网络和情感词典结合的情感计算方法
CN112307771A (zh) * 2020-10-29 2021-02-02 平安科技(深圳)有限公司 基于情感分析的课程分析方法、装置、设备及介质
CN112685559A (zh) * 2020-12-21 2021-04-20 深圳供电局有限公司 计量自动化系统的监测方法、装置、计算机设备和介质
CN113163155A (zh) * 2021-04-30 2021-07-23 咪咕视讯科技有限公司 用户头像生成方法、装置、电子设备及存储介质
CN117834780A (zh) * 2024-03-05 2024-04-05 济南云上电子科技有限公司 一种智能外呼客户意图预测分析系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105630970A (zh) * 2015-12-24 2016-06-01 哈尔滨工业大学 社会媒体数据处理系统及方法
CN106919673A (zh) * 2017-02-21 2017-07-04 浙江工商大学 基于深度学习的文本情绪分析系统
US20170243120A1 (en) * 2016-02-23 2017-08-24 Salesforce.Com, Inc. Data analytics systems and methods with personalized sentiment models
CN107193801A (zh) * 2017-05-21 2017-09-22 北京工业大学 一种基于深度信念网络的短文本特征优化及情感分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105630970A (zh) * 2015-12-24 2016-06-01 哈尔滨工业大学 社会媒体数据处理系统及方法
US20170243120A1 (en) * 2016-02-23 2017-08-24 Salesforce.Com, Inc. Data analytics systems and methods with personalized sentiment models
CN106919673A (zh) * 2017-02-21 2017-07-04 浙江工商大学 基于深度学习的文本情绪分析系统
CN107193801A (zh) * 2017-05-21 2017-09-22 北京工业大学 一种基于深度信念网络的短文本特征优化及情感分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冯兴杰等: "基于卷积神经网络和注意力模型的文本情感分析", 《计算机应用研究》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111985223A (zh) * 2020-08-25 2020-11-24 武汉长江通信产业集团股份有限公司 一种基于长短记忆网络和情感词典结合的情感计算方法
CN112307771A (zh) * 2020-10-29 2021-02-02 平安科技(深圳)有限公司 基于情感分析的课程分析方法、装置、设备及介质
CN112685559A (zh) * 2020-12-21 2021-04-20 深圳供电局有限公司 计量自动化系统的监测方法、装置、计算机设备和介质
CN112685559B (zh) * 2020-12-21 2024-01-23 深圳供电局有限公司 计量自动化系统的监测方法、装置、计算机设备和介质
CN113163155A (zh) * 2021-04-30 2021-07-23 咪咕视讯科技有限公司 用户头像生成方法、装置、电子设备及存储介质
CN113163155B (zh) * 2021-04-30 2023-09-05 咪咕视讯科技有限公司 用户头像生成方法、装置、电子设备及存储介质
CN117834780A (zh) * 2024-03-05 2024-04-05 济南云上电子科技有限公司 一种智能外呼客户意图预测分析系统
CN117834780B (zh) * 2024-03-05 2024-05-14 济南云上电子科技有限公司 一种智能外呼客户意图预测分析系统

Also Published As

Publication number Publication date
CN110909529B (zh) 2023-03-24

Similar Documents

Publication Publication Date Title
CN110909529B (zh) 一种公司形象提升系统的用户情感分析和预判系统
CN112199608B (zh) 基于网络信息传播图建模的社交媒体谣言检测方法
CN113051916B (zh) 一种社交网络中基于情感偏移感知的交互式微博文本情感挖掘方法
CN111914096A (zh) 基于舆情知识图谱的公共交通乘客满意度评价方法及系统
CN112749341B (zh) 重点舆情推荐方法、可读存储介质及数据处理装置
CN109359302A (zh) 一种领域化词向量的优化方法及基于其的融合排序方法
CN112966526A (zh) 一种基于情感词向量的汽车在线评论情感分析方法
CN115952292B (zh) 多标签分类方法、装置及计算机可读介质
CN111666496A (zh) 一种基于评论文本的组推荐方法
CN110188200A (zh) 一种使用社交上下文特征的深度微博情感分析方法
Lina et al. Fake news detection in the urdu language using CharCNN-RoBERTa
CN114443846A (zh) 一种基于多层级文本异构图的分类方法、装置及电子设备
Zhang et al. Bidirectional long short-term memory for sentiment analysis of Chinese product reviews
CN113486143A (zh) 一种基于多层级文本表示及模型融合的用户画像生成方法
Yu et al. Multi-module Fusion Relevance Attention Network for Multi-label Text Classification.
Soni et al. Deep learning, wordnet, and spacy based hybrid method for detection of implicit aspects for sentiment analysis
CN115309894A (zh) 一种基于对抗训练和tf-idf的文本情感分类方法及装置
Hajare et al. A machine learning pipeline to examine political bias with congressional speeches
CN114943216A (zh) 基于图注意力网络的案件微博属性级观点挖掘方法
Pushpakumar For movie reviews, A sentiment analysis using long short term memory networks
Jiang et al. Sentiment classification based on clause polarity and fusion via convolutional neural network
Gudakahriz et al. An experimental study on performance of text representation models for sentiment analysis
CN111723127A (zh) 基于文本摘要情感挖掘的股票趋势预测方法和系统
Pan et al. Automatic subject classification of public messages in e-government affairs
CN114595693A (zh) 一种基于深度学习的文本情感分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant