CN112182152B - 基于深度学习的新浪微博用户情感影响力分析方法 - Google Patents

基于深度学习的新浪微博用户情感影响力分析方法 Download PDF

Info

Publication number
CN112182152B
CN112182152B CN202011013190.2A CN202011013190A CN112182152B CN 112182152 B CN112182152 B CN 112182152B CN 202011013190 A CN202011013190 A CN 202011013190A CN 112182152 B CN112182152 B CN 112182152B
Authority
CN
China
Prior art keywords
matrix
convolution
text
max
microblog
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011013190.2A
Other languages
English (en)
Other versions
CN112182152A (zh
Inventor
韩东红
高翟
任延华
唐翔
吴刚
乔百友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN202011013190.2A priority Critical patent/CN112182152B/zh
Publication of CN112182152A publication Critical patent/CN112182152A/zh
Application granted granted Critical
Publication of CN112182152B publication Critical patent/CN112182152B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供提出了基于深度学习的新浪微博用户情感影响力分析方法,包括数据获取、数据预处理、构建多元情感特征词向量、文本进行情感分类和定义微博用户情感影响力,本发明中通过使用MSF‑CNN算法对微博文本进行情感分析能力高于w2c‑CNN算法,能很好的配合微博中书写自由、用词随意的语言环境,能很好的考虑微博文本的上下语境,提取出文本特征,同时考虑词语自身所携带的情感,能更好的进行情感分类。

Description

基于深度学习的新浪微博用户情感影响力分析方法
技术领域
本发明涉及数据算法领域,尤其涉及基于深度学习的新浪微博用户情感影响力分析方法。
背景技术
算法是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制,也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出,如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题,不同的算法可能用不同的时间、空间或效率来完成同样的任务,一个算法的优劣可以用空间复杂度与时间复杂度来衡量,进入Web2.0时代已经十多年,互联网技术的快速发展和移动终端设备的迅速普及为用户提供了一个发布和分享个人言论的在线网络平台,新浪微博是新浪公司在2009年推出的中国第一个实时性的社交网络平台,它的诞生是中国网络用户交互模式的一次重大变革,同时微博平台中最有价值、值得研究的地方之一,就是对微博用户影响力的研究。
但是由于目前影响力分析的研究重点主要在社交网络的拓扑结构和交互信息两方面,然而这种研究方式考虑并不全面,因为在微博这种社交网络平台中,用户经常会发表一些带有情感倾向的博文来获取他人的兴趣,从而与别人产生互动,这说明微博博文的信息也是衡量用户影响力的关键因素,但是这方面内容被许多研究人员忽略
发明内容
本发明的目的在于提供基于深度学习的新浪微博用户情感影响力分析方法,以解决上述技术问题。
本发明为解决上述技术问题,采用以下技术方案来实现:基于深度学习的新浪微博用户情感影响力分析方法,包括数据获取、数据预处理、构建多元情感特征词向量、文本进行情感分类和定义微博用户情感影响力,所述文本进行情感分类包括以下步骤:
S1、提出MSF-CNN模型,对微博文本进行情感分类,该模型包括输入层、卷积层、池化层和全连接层;
S2、MS作为输入层输入,选取分词后某篇微博的最长长度记为max_n,作为word2vec输出矩阵的横轴,其余文本长度不足max_n的部分自动补0,输出矩阵的纵轴是多元特征词向量的维度d+6,得到输入层的输出矩阵MS∈Rmax_n*(d+6),作为卷积层的输入;
S3、选取滤波器大小为h的卷积核在输入矩阵MS上滑动地选取能体现文本分类结果的局部特征,每个卷积核中的权重矩阵设为Wc∈Rh*(d+6),卷积核与MS从上至下的共max_n-h+1个子矩阵Localp∈Rh*(d+6),其中p∈[1,max_n-h+1],分别进行*卷积计算
Figure GDA0003161278350000021
其中Aa×b和Ba×b表示长度和宽度分别为a和b的卷积矩阵,xm,n和ym,n分别为矩阵Aa×b和Ba×b中m行n列的元素,f是CNN在前向传播训练时选取的激活函数
Figure GDA0003161278350000022
biasm,n是偏置矩阵的BIAS的一个分量,这样微博文本的多元特征词向量矩阵与每一个卷积核都进行了max_n-h+1次卷积操作,将每次卷积计算的输出顺序排列,得到卷积结果后的结果矩阵Res∈R(max_n-h+1)*1,共k次卷积计算后得到的卷积矩阵依次为Res1,Res2,Res3…Resk,这些矩阵依次排列后得到的卷积层的输出矩阵为
Figure GDA0003161278350000023
Figure GDA0003161278350000031
Cout∈Rk*(max_n-h+1),MSF-CNN的卷积层使用相同的滤波器对文本多元特征矩阵的不同区域进行卷积计算,泛化局部特征,从而将微博文本中最能表达情感倾向的语义和语序特征保留下来,作为池化层的输入;
S4、对经过卷积运算得到k个卷积矩阵的特征降维处理,抽取高效的情感特征,池化运算pooling(s(max_n-h+1)×1)=α(s1,s2,···,smax_n-h+1),其中α是池化算子,我们选择最大池化,将池化算子置为1,选取卷积操作后的矩阵Resi的最大值,记最大值为maxi,经过池化操作后得到了k维的特征向量Pool={pool1,pool2…poolk},作为全连接层的输入;
S5、池化层的输出向量以全连接的形式送入Softmax层,使用
Figure GDA0003161278350000032
Figure GDA0003161278350000033
进行计算,同时使用L2正则化约束,判定该文本属于极性三分类:积极、消极、中立中的哪一类,接下来使用反向传播算法对MSF-CNN神经网络中的相关参数进行更新;
在训练集Strain={(t1,l1),(t2,l2),(t3,l3)…(tn,ln)}中,li是微博文本ti的情感标签,假设yi是MSF-CNN神经网络预测的情感值,我们在反向传播过程中采用平方差损失函数,定义模型预测值与标签值的误差
Figure GDA0003161278350000034
Figure GDA0003161278350000035
代入误差公式E,得到公式
Figure GDA0003161278350000036
Figure GDA0003161278350000037
其中ac和ap是分类层和池化层的激活函数,Si是关于权重矩阵和偏置量的函数,损失函数误差E是关于权重矩阵和偏置矩阵的函数,调整权值和偏置量的大小会降低误差值E,选取随机梯度下降法迭代地求解误差E关于权重值和偏置值的导数,当误差值小于阈值时,结束反向传播过程,此时模型的各项参数达到最优,MSF-CNN模型训练结束,采用准确率、精确率、召回率和F1值四个指标对所提MSF-CNN模型分类效果进行了实验分析,验证了MSF-CNN算法的有效性。
优选的,通过WuScRank算法计算微博用户的影响力,通过网络爬虫技术来进行数据获取并转换成文本集合。
优选的,通过使用于python语言的gensim框架中的word2vec训练对文本进行分类,通过word2vec训练处理的词向量矩阵输入MSF-CNN神经网络。
本发明的有益效果是:
本发明中通过使用MSF-CNN算法对微博文本进行情感分析能力高于w2c-CNN算法,能很好的配合微博中书写自由、用词随意的语言环境,能很好的考虑微博文本的上下语境,提取出文本特征,同时考虑词语自身所携带的情感,能更好的进行情感分类。
附图说明
图1为本发明的总体流程图;
图2为本发明的基于权重分配的多元特征词向量的构建框架图;
图3为本发明的使用MSF-CNN进行微博文本情感分类原理图;
图4为本发明的基于话题的微博用户网络关系图;
图5为本发明的学习率对MSF-CNN分类准确率的影响图;
图6为本发明的滤波器对MSF-CNN分类准确率的影响图;
图7为本发明的word2vec和MSF-w2c在不同词向量维度上的准确率对比图;
图8为本发明的word2vec词向量预训练方式对MSF-CNN情感分类准确率的影响图;
图9为本发明的WuScRank分别与Degrees、ConformRank、PageRank在Precision@k的对比实验结果图;
图10为本发明的WuScRank分别与Degrees、ConformRank、PageRank在Kendall’sτ的对比实验结果图;
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施例和附图,进一步阐述本发明,但下述实施例仅仅为本发明的优选实施例,并非全部,基于实施方式中的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得其它实施例,都属于本发明的保护范围。
实施例1
MSF-CNN算法
实验环境:使用基于python语言的深度学习库Keras和Tensorflow库进行文本情感分析的实验,实验环境如表1所示;
Figure GDA0003161278350000051
Figure GDA0003161278350000061
表1
数据集:采取网络爬虫技术编写程序获取微博大V和普通用户的个人信息、用户的好友列表和粉丝列表、用户所发表的博文以及基于此博文的评论转发等文本内容,共爬取了新浪微博2万微博带V标签的名人和10万普通用户的数据,分别包括用户个人信息、用户好友关注信息、微博评论等信息,实验用到微博用户的微博文本数据,选取其中的10000条高效数据进行情感三分类标注,标注工作由多名人员共同完成,另外还有50000条已经标注好的三分类数据,共计60000条数据,MSF-CNN数据集具体内容如表2所示;
Figure GDA0003161278350000062
Figure GDA0003161278350000071
表2
这60000条数据作为MSF-CNN神经网络模型文本情感分类的训练和测试数据,采用10折交叉验证的方法对模型进行测试和训练;
实验评价指标:采用正确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1值(F1-Score)作为文本情感分类器的评价标准,定义如下:
正确率
Figure GDA0003161278350000072
精确率
Figure GDA0003161278350000073
召回率
Figure GDA0003161278350000074
F1值
Figure GDA0003161278350000075
其中TP、FP、TN、FN的含义如表3,情感分类混淆矩阵所示;
Figure GDA0003161278350000076
表3
混淆矩阵是分类器指标计算的可视化矩阵,用来比较分类器预测结果和实际标签值信息,表3中每一行代表样本的实际情感类别,每一列代表样本的预测情感类别,在实验中,使用准确率作为MSF-CNN在不同参数下分类的评价指标,在本算法与其他分类器对比的时候,采用算术平均精确率av_Precision、算术平均召回率av_Recall和算术平均F1值av_F1-Score作为情感分类的评价指标,即先对积极、消极和中性三个类别分别求精确率、召回率和F1值,再取平均值;
参数设置:选取w2c-skip_gram作为词向量预训练方式,MSF-CNN神经网络中相关参数和函数的取值设置如表4所示;
Figure GDA0003161278350000081
表4
图5/6/7/8给出了学习率、滤波器数量、词向量维度和词向量预训练方式对模型准确率的影响,表5给出了滤波器窗口大小对模型准确率的影响;
滤波器窗口大小 准确率
(2,3,4) 0.748
(3,4,5) 0.752
(4,5,6) 0.749
(2,3,4,5) 0.744
(3,4,5,6) 0.746
表5
MSF-CNN与其它分类器的比较:将MSF-CNN与其它分类器的对比,实验结果如表6所示;
情感分类算法 Accuracy av_Precision av_Recall av_F1-Score
基于情感词典 57.6% 55.3% 52.4% 53.8%
朴素贝叶斯 66.0% 64.7% 62.6% 63.6%
支持向量机 69.6% 67.3% 65.2% 66.2%
w2c-CNN 74.3% 72.6% 71.0% 71.7%
MSF-CNN 75.5% 73.8% 72.5% 73.1%
表6
从表6中可以得知,MSF-CNN分类的性能要优于w2c-CNN,远优于机器学习算法和基于情感词典的方法,其中基于情感词典的方法分类效果最差,这是由于新浪微博书写自由,用词随意,好多词语不能正确地在词典中匹配,朴素贝叶斯和支持向量机分类效果相差不大,但比神经网络训练的效果要差不少,这说明机器学习相对于深度学习算法来说,机器学习训练的特征不足,而使用w2c-CNN更多地考虑了微博文本的上下文语境,高效地提取文本特征,我们提出的MSF-CNN算法不仅考虑微博文本的上下文语境、语义特征,还考虑了词语自身的情感等特征,对情感分类的效果提升更大。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接触,也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正下方和斜下方,或仅仅表示第一特征水平高度小于第二特征。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (3)

1.基于深度学习的新浪微博用户情感影响力分析方法,包括数据获取、数据预处理、构建多元情感特征词向量、文本进行情感分类和定义微博用户情感影响力,所述文本进行情感分类包括以下步骤:
S1、提出MSF-CNN模型,对微博文本进行情感分类,该模型包括输入层、卷积层、池化层和全连接层;
S2、MS作为输入层输入,选取分词后某篇微博的最长长度记为max_n,作为word2vec输出矩阵的横轴,其余文本长度不足max_n的部分自动补0,输出矩阵的纵轴是多元特征词向量的维度d+6,得到输入层的输出矩阵MS∈Rmax_n*(d+6),作为卷积层的输入;
S3、选取滤波器大小为h的卷积核在输入矩阵MS上滑动地选取能体现文本分类结果的局部特征,每个卷积核中的权重矩阵设为Wc∈Rh*(d+6),卷积核与MS从上至下的共max_n-h+1个子矩阵Localp∈Rh*(d+6),其中p∈[1,max_n-h+1],分别进行*卷积计算
Figure FDA0003161278340000011
其中Aa×b和Ba×b表示长度和宽度分别为a和b的卷积矩阵,xm,n和ym,n分别为矩阵Aa×b和Ba×b中m行n列的元素,f是CNN在前向传播训练时选取的激活函数
Figure FDA0003161278340000012
biasm,n是偏置矩阵的BIAS的一个分量,这样微博文本的多元特征词向量矩阵与每一个卷积核都进行了max_n-h+1次卷积操作,将每次卷积计算的输出顺序排列,得到卷积结果后的结果矩阵Res∈R(max_n-h+1)*1,共k次卷积计算后得到的卷积矩阵依次为Res1,Res2,Res3…Resk,这些矩阵依次排列后得到的卷积层的输出矩阵为
Figure FDA0003161278340000013
Figure FDA0003161278340000021
Cout∈Rk*(max_n-h+1),MSF-CNN的卷积层使用相同的滤波器对文本多元特征矩阵的不同区域进行卷积计算,泛化局部特征,从而将微博文本中最能表达情感倾向的语义和语序特征保留下来,作为池化层的输入;
S4、对经过卷积运算得到k个卷积矩阵的特征降维处理,抽取高效的情感特征,池化运算pooling(S(max_n-h+1)×1)=α(s1,s2,…,smax_n-h+1),其中α是池化算子,我们选择最大池化,将池化算子置为1,选取卷积操作后的矩阵Resi的最大值,记最大值为maxi,经过池化操作后得到了k维的特征向量Pool={pool1,pool2…poolk},作为全连接层的输入;
S5、池化层的输出向量以全连接的形式送入Softmax层,使用
Figure FDA0003161278340000022
Figure FDA0003161278340000023
进行计算,同时使用L2正则化约束,判定该文本属于极性三分类:积极、消极、中立中的哪一类,接下来使用反向传播算法对MSF-CNN神经网络中的相关参数进行更新;
在训练集Strain={(t1,l1),(t2,l2),(t3,l3)…(tn,ln)}中,li是微博文本ti的情感标签,假设yi是MSF-CNN神经网络预测的情感值,我们在反向传播过程中采用平方差损失函数,定义模型预测值与标签值的误差
Figure FDA0003161278340000024
Figure FDA0003161278340000025
代入误差公式E,得到公式
Figure FDA0003161278340000026
Figure FDA0003161278340000027
其中ac和ap是分类层和池化层的激活函数,Si是关于权重矩阵和偏置量的函数,损失函数误差E是关于权重矩阵和偏置矩阵的函数,调整权值和偏置量的大小会降低误差值E,选取随机梯度下降法迭代地求解误差E关于权重值和偏置值的导数,当误差值小于阈值时,结束反向传播过程,此时模型的各项参数达到最优,MSF-CNN模型训练结束,采用准确率、精确率、召回率和F1值四个指标对所提MSF-CNN模型分类效果进行了实验分析,验证了MSF-CNN算法的有效性。
2.根据权利要求1所述的基于深度学习的新浪微博用户情感影响力分析方法,其特征在于:通过WuScRank算法计算微博用户的影响力,通过网络爬虫技术来进行数据获取并转换成文本集合。
3.根据权利要求2所述的基于深度学习的新浪微博用户情感影响力分析方法,其特征在于:通过使用于python语言的gensim框架中的word2vec训练对文本进行分类,通过word2vec训练处理的词向量矩阵输入MSF-CNN神经网络。
CN202011013190.2A 2020-09-24 2020-09-24 基于深度学习的新浪微博用户情感影响力分析方法 Active CN112182152B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011013190.2A CN112182152B (zh) 2020-09-24 2020-09-24 基于深度学习的新浪微博用户情感影响力分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011013190.2A CN112182152B (zh) 2020-09-24 2020-09-24 基于深度学习的新浪微博用户情感影响力分析方法

Publications (2)

Publication Number Publication Date
CN112182152A CN112182152A (zh) 2021-01-05
CN112182152B true CN112182152B (zh) 2021-09-03

Family

ID=73956138

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011013190.2A Active CN112182152B (zh) 2020-09-24 2020-09-24 基于深度学习的新浪微博用户情感影响力分析方法

Country Status (1)

Country Link
CN (1) CN112182152B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113241193B (zh) * 2021-06-01 2024-06-25 平安科技(深圳)有限公司 药物推荐模型训练方法、推荐方法、装置、设备及介质
CN113593326A (zh) * 2021-08-09 2021-11-02 江西工程学院 一种英语发音教学装置和方法
CN114580427B (zh) * 2021-12-29 2024-06-14 北京邮电大学 自媒体用户选择方法及相关设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109684646A (zh) * 2019-01-15 2019-04-26 江苏大学 一种基于话题影响力的微博话题情感分析方法
CN110362819A (zh) * 2019-06-14 2019-10-22 中电万维信息技术有限责任公司 基于卷积神经网络的文本情感分析方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10380254B2 (en) * 2014-09-10 2019-08-13 International Business Machines Corporation Association of an emotional influencer to a post in a social medium

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109684646A (zh) * 2019-01-15 2019-04-26 江苏大学 一种基于话题影响力的微博话题情感分析方法
CN110362819A (zh) * 2019-06-14 2019-10-22 中电万维信息技术有限责任公司 基于卷积神经网络的文本情感分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向微博用户的消费意图识别算法;贾云龙等;《北京大学学报(自然科学版)》;20200131;全文 *

Also Published As

Publication number Publication date
CN112182152A (zh) 2021-01-05

Similar Documents

Publication Publication Date Title
CN112182152B (zh) 基于深度学习的新浪微博用户情感影响力分析方法
Ullah et al. An algorithm and method for sentiment analysis using the text and emoticon
CN111160037B (zh) 一种支持跨语言迁移的细粒度情感分析方法
CN107862343B (zh) 基于规则和神经网络的商品评论属性级情感分类方法
CN107608956B (zh) 一种基于cnn-grnn的读者情绪分布预测算法
CN109376242B (zh) 基于循环神经网络变体和卷积神经网络的文本分类方法
Ishaq et al. Aspect-based sentiment analysis using a hybridized approach based on CNN and GA
CN103207913B (zh) 商品细粒度语义关系的获取方法和系统
CN109471942B (zh) 基于证据推理规则的中文评论情感分类方法及装置
CN109740154A (zh) 一种基于多任务学习的在线评论细粒度情感分析方法
CN106528528A (zh) 文本情感分析的方法及装置
CN103309953B (zh) 一种基于多rbfnn分类器集成的多样化图像标注和检索方法
CN102789498A (zh) 基于集成学习的中文评论文本的情感分类方法与系统
CN110415071B (zh) 一种基于观点挖掘分析的汽车竞品对比方法
CN111353044B (zh) 一种基于评论的情感分析方法及系统
CN110472245B (zh) 一种基于层次化卷积神经网络的多标记情绪强度预测方法
CN113486645A (zh) 一种基于深度学习的文本相似度检测方法
CN112287197A (zh) 动态记忆案件描述的涉案微博评论讽刺句检测方法
CN107818173B (zh) 一种基于向量空间模型的中文虚假评论过滤方法
CN115578137A (zh) 一种基于文本挖掘与深度学习模型的农产品期货价格预测方法及系统
CN113627969A (zh) 一种基于电商平台用户评论的产品问题分析方法和系统
Zhou et al. Active semi-supervised learning method with hybrid deep belief networks
Syn et al. Using latent semantic analysis to identify quality in use (qu) indicators from user reviews
CN117291190A (zh) 一种基于情感词典和lda主题模型的用户需求计算方法
CN117235253A (zh) 一种基于自然语言处理技术的卡车用户隐性需求挖掘方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant