CN113326694A - 基于情感传播的隐式情感词典生成方法 - Google Patents

基于情感传播的隐式情感词典生成方法 Download PDF

Info

Publication number
CN113326694A
CN113326694A CN202110542789.3A CN202110542789A CN113326694A CN 113326694 A CN113326694 A CN 113326694A CN 202110542789 A CN202110542789 A CN 202110542789A CN 113326694 A CN113326694 A CN 113326694A
Authority
CN
China
Prior art keywords
emotion
word
words
propagation
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110542789.3A
Other languages
English (en)
Other versions
CN113326694B (zh
Inventor
李显勇
李齐治
陈龙齐
杜亚军
范永全
陈晓亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xihua University
Original Assignee
Xihua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xihua University filed Critical Xihua University
Priority to CN202110542789.3A priority Critical patent/CN113326694B/zh
Publication of CN113326694A publication Critical patent/CN113326694A/zh
Application granted granted Critical
Publication of CN113326694B publication Critical patent/CN113326694B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及计算机领域,具体是基于情感传播的隐式情感词典生成方法,包括如下步骤:步骤一、通过网络爬虫技术提取出社交媒体中的文本数据,并对非正式文本数据进行处理,恢复成自然语言;步骤二、通过词法与句法分析将句子构成句法树,将句法树中的名词、动词以及形容词提取出来构建成为完全图;步骤三、在完全图中进行情感传播,当情感传播结束后即可获得隐式情感词典,解决了隐式情感词典的构建通过人工标注数据,耗费人力物力以及时间的问题。

Description

基于情感传播的隐式情感词典生成方法
技术领域
本发明涉及计算机领域,具体是指基于情感传播的隐式情感词典生成方法。
背景技术
现阶段针对隐式情感词典的构建是通过人工标注数据的方式实现,这是一种十分耗费人力物力以及时间的工作。
Stanford CoreNLP是斯坦福大学制作的开源NLP(Natural LanguageProcessing)工具,能够对中文进行词法与句法分析,以及命名实体识别;PolarityRank算法是结合了PageRank算法与Hits算法,通过情感传播,对词语图中情感值进行排名的一种算法;通过引入外部知识,可以更容易的得到初始情感值,减轻人为打标签的负担。
通过将上述三种方法引入隐式情感词典的构建,能够最大程度的解决人工标注耗费人力物力以及时间的问题。
发明内容
基于以上问题,本发明提供了基于情感传播的隐式情感词典生成方法,解决了隐式情感词典的构建通过人工标注数据,耗费人力物力以及时间的问题。
为解决以上技术问题,本发明采用的技术方案如下:
基于情感传播的隐式情感词典生成方法,包括如下步骤:
步骤一、通过网络爬虫技术提取出社交媒体中的文本数据,并对非正式文本数据进行处理,恢复成自然语言,恢复后的文本数据记为S={s1,s2,s3,......,sn},其中,sn表示第n个恢复成自然语言的句子;
步骤二、将恢复后的文本数据S={s1,s2,s3,......,sn}构建成为句法树T={t1,t2,t3,......,tn},其中tn表示第n个生成的句法树,将句法树中的名词、动词以及形容词提取出来构建成为完全图G={G1,G2,......,Gn},其中Gn表示第n个由句法树生成的完全图;
步骤三、在完全图Gn中进行情感传播,当情感传播结束后即可获得隐式情感词典;
所述步骤三具体包括:
步骤31、完全图Gn每个节点的词语称为显示情感词语vi,引入大连理工情感词典本体为显示情感词语vi分配初始情感值,其中,预设显示情感词语vi的情感值为
Figure BDA0003071562550000021
同时,需要对情感值
Figure BDA0003071562550000022
作归一化处理;
步骤32、预设完全图gn中每个节点的显示情感词语vi有两个情感值
Figure BDA0003071562550000023
Figure BDA0003071562550000024
其中,
Figure BDA0003071562550000025
是词语的正向情感值,
Figure BDA0003071562550000026
是负向情感值,根据大连理工情感词典本体的情感极性,为显示情感词语vi的两个情感值
Figure BDA0003071562550000027
Figure BDA0003071562550000028
分配初始情感值;
步骤33、情感传播开始后,计算显示情感词语vi的传播率、受到邻居节点的影响、错别字与词语错误搭配的情况、情感传播以及情感不传播的情况;
步骤34、每次情感传播后计算情感词语vi更新后的情感值;
步骤35、当更新后的情感值计算完成后,通过归一化手段获得显示情感词语vi的最终情感值
Figure BDA0003071562550000029
步骤36、通过显示情感词语vi的最终情感值
Figure BDA00030715625500000210
获得隐式情感词汇的情感极性,从而获得隐式情感词典。
进一步,所述步骤一中,对非正式文本数据进行处理,恢复成自然语言具体包括:
步骤11、清理掉无用信息,无用信息包括社交媒体为文本数据携带的内容、表情符号、非中文内容;
步骤12、将繁体中文转换成简体中文;
步骤13、对句子进行切割;
步骤14、经步骤11~13处理后的文本数据记为S={s1,s2,s3,......,sn}。
进一步,所述步骤二中具体包括如下步骤:
步骤21、利用Stanford CoreNLP软件将S中的句子进行词法与句法分析,构建句法树,句法树包括包含词语、词性以及词语之间的依赖关系;
步骤22、将句法树中的名词、动词以及形容词提取出来,并通过Stanford CoreNLP软件对每个句子sn进行命名实体识别,清理掉标签为DATE的命名实体,每一个句子sn提取出的词语记为wn={w1,w2,w3,......,wm},其中,wm表示第m个被提取出的词语;
步骤23、采用python处理图数据的库networkx进行完全图的构建,完全图中节点为提取出的词语wn,每两个节点间都有边,边权为该两个词语在语料库中出现的频率,完全图中所有句子构成语料库。
进一步,所述步骤31中,由于大连理工情感词典本体的情感极性是1,3,5,7,9,采用如下公式对显示情感词语vi的情感值
Figure BDA0003071562550000031
进行归一化处理:
Figure BDA0003071562550000032
进一步,步骤32中,显示情感词语vi的两个情感值
Figure BDA0003071562550000033
Figure BDA0003071562550000034
分配初始情感值的分配规则为:
完全图Gn中,如果没有词语出现在大连理工情感词典本体中,则
Figure BDA0003071562550000035
完全图Gn中,如果情感值为1,则
Figure BDA0003071562550000036
完全图Gn中,如果情感值为2,则
Figure BDA0003071562550000037
完全图Gn中,如果情感值为3,则
Figure BDA0003071562550000038
进一步,所述步骤33具体包括如下:
步骤331、显示情感词语vi在初始时刻的传播率为
Figure BDA0003071562550000039
且不传播率为
Figure BDA00030715625500000310
而任意时刻,传播率与不传播率之和为1,即
Figure BDA00030715625500000311
步骤332、计算每个节点在某一时刻受到邻居节点的影响,计算公式为:
Figure BDA00030715625500000312
wij=P(wordi,wordj);
Figure BDA00030715625500000313
其中,
Figure BDA00030715625500000314
表示显示情感词语vi在t时刻受到邻居节点的影响,wij表示词语i和词语j在语料库中的共现频率,
Figure BDA00030715625500000315
表示词语j在某一时刻的传播率,P(wordi,wordj)表示词语i和词语j在语料库中共现的概率,F(wordi,wordj)表示词语i和词语j在语料库中的共现频率,N表示语料库中所有句子的数量,完全图中所有句子构成语料库;
步骤333、计算每个时刻显示情感词语vi的情感传播情况
Figure BDA00030715625500000316
公式如下:
Figure BDA00030715625500000317
其中,λ用于衡量词语间情感传播的概率,μ用于衡量错别字与词语搭配错误的概率;
计算每个时刻显示情感词语vi的情感不传播情况
Figure BDA00030715625500000318
公式如下:
Figure BDA0003071562550000041
进一步,所述步骤34中,情感传播后正向的情感值为
Figure BDA0003071562550000042
负向的情感值为
Figure BDA0003071562550000043
其计算公式为:
Figure BDA0003071562550000044
Figure BDA0003071562550000045
其中,
Figure BDA0003071562550000046
表示该词语以相同的概率将情感传播给它的邻居节点。
进一步,所述步骤35中,归一化公式为:
Figure BDA0003071562550000047
进一步,所述步骤36中,获得隐式情感词汇的情感极性的公式为:
Figure BDA0003071562550000048
与现有技术相比,本发明的有益效果是:本发明通过网络爬虫技术与清洗,将非正式文本恢复为语言,并切割为句子,接着结合NLP技术中的词法句法分析以及命名实体识别,有效提取出文本中的名词、动词、形容词,并根据这些词语将句子构建成为了句法树;第三步,我们通过定义的规则将句法树构建成为了句法图,在句法图中进行相关的情感传播,情感传播过程中我们还考虑了传播参数以及词语搭配错误参数用于提高情感传播的准确率,最终我们对获得的词语的情感值进行归一化处理,便获得了我们最终的词典。
附图说明
图1为本实施例的流程图;
图2为本实施例构成的句法图;
图3为本实施例构成的完全图;
图4为本实施例情感传播的示意图。
具体实施方式
下面结合附图对本发明作进一步的说明。本发明的实施方式包括但不限于下列实施例。
如图1所示的基于情感传播的隐式情感词典生成方法,包括如下步骤:
步骤一、通过网络爬虫技术提取出社交媒体中的文本数据,并对非正式文本数据进行处理,恢复成自然语言,恢复后的文本数据记为S={s1,s2,s3,......,sn},其中,sn表示第n个恢复成自然语言的句子;
进一步的是,对非正式文本数据进行处理,恢复成自然语言具体包括:
步骤11、清理掉无用信息,无用信息包括如下:
(1)社交媒体为文本数据携带的内容,例如用户名连接“@username”,回复的内容“回复@username”;
(2)例如颜文字、表情符号等;
(3)非中文内容,例如网络流行语“xswl”;
(4)将话题标签替换为原文文字,例如“#专利”替换成“专利”;
步骤12、将繁体中文转换成简体中文,例如,“我愛中國”转化为“我爱中国”;
步骤13、对句子进行切割,由于社交媒体中用户对于标点符号胡乱使用,所以需要对句子进行切割,以免造成不用句子间的影响,切割的标准为“。”、“.”、“!”、“!”、“?”、“?”,例如“你们听见了吗?那个声音”切割为“你们听见了吗”,“那个声音”;
步骤14、经步骤11~13处理后的文本数据记为S={s1,s2,s3,......,sn}。
步骤二、将恢复后的文本数据S={s1,s2,s3,......,sn}构建成为句法树T={t1,t2,t3,......,tn},其中tn表示第n个生成的句法树,将句法树中的名词、动词以及形容词提取出来构建成为完全图G={G1,G2,......,Gn},其中Gn表示第n个由句法树生成的完全图;
进一步的是,具体包括如下步骤:
步骤21、利用Stanford CoreNLP软件将S中的句子进行词法与句法分析,构建句法树,句法树包括包含词语、词性以及词语之间的依赖关系,效果图如图2所示;
步骤22、将句法树中的名词、动词以及形容词提取出来,并通过Stanford CoreNLP软件对每个句子sn进行命名实体识别,清理掉标签为DATE的命名实体,每一个句子sn提取出的词语记为wn={w1,w2,w3,......,wm},其中,wm表示第m个被提取出的词语;
步骤23、采用python处理图数据的库networkx进行完全图的构建,如图3所示,完全图中节点为提取出的词语wn,每两个节点间都有边,边权为该两个词语在语料库中出现的频率,每个句子sn构建成的完全图Gi=(V,E),其中,V是由词语构成的节点集合,E是边集。
步骤三、在完全图中进行情感传播,当情感传播结束后即可获得隐式情感词典;
进一步的是,步骤三具体包括:
步骤31、通过引入外部知识,例如大连理工情感词汇本体,完全图Gn每个节点的词语称为显示情感词语vi,引入大连理工情感词典本体为显示情感词语vi分配初始情感值,其中,预设显示情感词语vi的情感值为
Figure BDA0003071562550000061
同时,需要对情感值
Figure BDA0003071562550000062
作归一化处理,由于大连理工情感词典本体的情感极性是1,3,5,7,9,采用如下公式对显示情感词语vi的情感值
Figure BDA0003071562550000063
进行归一化处理:
Figure BDA0003071562550000064
步骤32、预设完全图Gn中每个节点的显示情感词语vi有两个情感值
Figure BDA0003071562550000065
Figure BDA0003071562550000066
其中,
Figure BDA0003071562550000067
是词语的正向情感值,
Figure BDA0003071562550000068
是负向情感值,根据大连理工情感词典本体的情感极性,为显示情感词语vi的两个情感值
Figure BDA0003071562550000069
Figure BDA00030715625500000610
分配初始情感值,分配原则如下:
完全图Gn中,如果没有词语出现在大连理工情感词典本体中,则
Figure BDA00030715625500000611
完全图Gn中,如果情感值为1,则
Figure BDA00030715625500000612
完全图Gn中,如果情感值为2,则
Figure BDA00030715625500000613
完全图Gn中,如果情感值为3,则
Figure BDA00030715625500000614
步骤33、情感传播开始后,如图4所示,计算显示情感词语vi的传播率、受到邻居节点的影响、错别字与词语错误搭配的情况、情感传播以及情感不传播的情况,具体包括如下步骤:
步骤331、当分配初始情感值后,需要对节点间的边权进行赋值,赋值的内容为两节点在语料库中共现的概率,计算公式为:
wij=P(wordi,wordj),
Figure BDA00030715625500000615
其中,wij表示词语i和词语j在语料库中的共现频率,P(wordi,wordj)表示词语i和词语j在语料库中共现的概率,F(wordi,wordj)表示词语i和词语j在语料库中的共现频率,N表示语料库中所有句子的数量;
步骤332、完成以上工作后,进行情感传播,显示情感词语vi在初始时刻的传播率为evti,且不传播率为
Figure BDA0003071562550000071
而任意时刻,传播率与不传播率之和为1,即
Figure BDA0003071562550000072
步骤333、计算每个节点在某一时刻受到邻居节点的影响,计算公式为:
Figure BDA0003071562550000073
其中,
Figure BDA0003071562550000074
表示显示情感词语vi在t时刻受到邻居节点的影响;
步骤334、由于考虑到句子中有可能会有错别字与词语搭配错误的情况,特别是在非正式文本中会有词语之间搭配错误使用的情况,所以设置两个参数λ和μ来刻画情感传播率与情感不传播率,因此,计算每个时刻显示情感词语vi的情感传播情况
Figure BDA0003071562550000075
公式如下:
Figure BDA0003071562550000076
其中,λ用于衡量词语间情感传播的概率,μ用于衡量错别字与词语搭配错误的概率;
计算每个时刻显示情感词语vi的情感不传播情况
Figure BDA0003071562550000077
公式如下:
Figure BDA0003071562550000078
步骤34、每次情感传播后计算情感词语vi更新后的情感值,具体包括如下:
步骤334主要考虑到传播过程中的平衡,但是还需着重考虑情感的传播过程,情感传播后,显示情感词语vi能够传播
Figure BDA0003071562550000079
这么多比例的情感值,以此计算每次情感传播后词语的情感值,情感传播后正向的情感值为
Figure BDA00030715625500000710
负向的情感值为
Figure BDA00030715625500000711
其计算公式为:
Figure BDA00030715625500000712
Figure BDA00030715625500000713
其中,
Figure BDA00030715625500000714
表示该词语以相同的概率将情感传播给它的邻居节点。
步骤35、当更新后的情感值计算完成后,通过归一化手段获得显示情感词语vi的最终情感值
Figure BDA00030715625500000715
其中,归一化公式为:
Figure BDA00030715625500000716
步骤36、通过显示情感词语vi的最终情感值
Figure BDA0003071562550000081
获得隐式情感词汇的情感极性,从而获得隐式情感词典,其中,获得隐式情感词汇的情感极性的公式为:
Figure BDA0003071562550000082
如上即为本发明的实施例。上述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。

Claims (9)

1.基于情感传播的隐式情感词典生成方法,其特征在于,包括如下步骤:
步骤一、通过网络爬虫技术提取出社交媒体中的文本数据,并对非正式文本数据进行处理,恢复成自然语言,恢复后的文本数据记为S={s1,s2,s3,......,sn},其中,sn表示第n个恢复成自然语言的句子;
步骤二、将恢复后的文本数据S={s1,s2,s3,......,sn}构建成为句法树T={t1,t2,t3,......,tn},其中tn表示第n个生成的句法树,将句法树中的名词、动词以及形容词提取出来构建成为完全图G={G1,G2,......,Gn},其中Gn表示第n个由句法树生成的完全图;
步骤三、在完全图中进行情感传播,当情感传播结束后即可获得隐式情感词典;
所述步骤三具体包括:
步骤31、完全图Gn每个节点的词语称为显示情感词语vi,引入大连理工情感词典本体为显示情感词语vi分配初始情感值,其中,预设显示情感词语vi的情感值为
Figure FDA0003071562540000011
同时,需要对情感值
Figure FDA0003071562540000012
作归一化处理;
步骤32、预设完全图Gn中每个节点的显示情感词语vi有两个情感值
Figure FDA0003071562540000013
Figure FDA0003071562540000014
其中,
Figure FDA0003071562540000015
是词语的正向情感值,
Figure FDA0003071562540000016
是负向情感值,根据大连理工情感词典本体的情感极性,为显示情感词语vi的两个情感值
Figure FDA0003071562540000017
Figure FDA0003071562540000018
分配初始情感值;
步骤33、情感传播开始后,计算显示情感词语vi的传播率、受到邻居节点的影响、错别字与词语错误搭配的情况、情感传播以及情感不传播的情况;
步骤34、每次情感传播后计算情感词语vi更新后的情感值;
步骤35、当更新后的情感值计算完成后,通过归一化手段获得显示情感词语vi的最终情感值
Figure FDA0003071562540000019
步骤36、通过每个词语vi的最终情感值
Figure FDA00030715625400000110
获得该词语的情感词汇的情感极性,提取出其中的隐式词汇,构建成为隐式情感词典。
2.根据权利要求1所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤一中,对非正式文本数据进行处理,恢复成自然语言具体包括:
步骤11、清理掉无用信息,无用信息包括社交媒体为文本数据携带的内容、表情符号、非中文内容;
步骤12、将繁体中文转换成简体中文;
步骤13、对句子进行切割;
步骤14、经步骤11~13处理后的文本数据记为S={s1,s2,s3,......,sn}。
3.根据权利要求1所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤二中具体包括如下步骤:
步骤21、利用Stanford CoreNLP软件将S中的句子进行词法与句法分析,构建句法树,句法树包括包含词语、词性以及词语之间的依赖关系;
步骤22、将句法树中的名词、动词以及形容词提取出来,并通过Stanford CoreNLP软件对每个句子sn进行命名实体识别,清理掉标签为DATE的命名实体,每一个句子sn提取出的词语记为wn={w1,w2,w3,......,wm},其中,wm表示第m个被提取出的词语;
步骤23、采用python处理图数据的库networkx进行完全图的构建,完全图中节点为提取出的词语wn,每两个节点间都有边,边权为该两个词语在语料库中出现的频率,完全图中所有句子构成语料库。
4.根据权利要求1所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤31中,由于大连理工情感词典本体的情感极性是1,3,5,7,9,采用如下公式对显示情感词语vi的情感值
Figure FDA0003071562540000021
进行归一化处理:
Figure 2
5.根据权利要求4所述的基于情感传播的隐式情感词典生成方法,其特征在于,步骤32中,显示情感词语vi的两个情感值
Figure FDA0003071562540000023
Figure FDA0003071562540000024
分配初始情感值的分配规则为:
完全图Gn中,如果没有词语出现在大连理工情感词典本体中,则
Figure FDA0003071562540000025
完全图Gn中,如果情感值为1,则
Figure FDA0003071562540000026
完全图Gn中,如果情感值为2,则
Figure FDA0003071562540000027
完全图Gn中,如果情感值为3,则
Figure FDA0003071562540000028
6.根据权利要求5所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤33具体包括如下:
步骤331、显示情感词语vi在初始时刻的传播率为
Figure FDA0003071562540000029
且不传播率为
Figure FDA00030715625400000210
而任意时刻,传播率与不传播率之和为1,即
Figure FDA0003071562540000031
步骤332、计算每个节点在某一时刻受到邻居节点的影响,计算公式为:
Figure FDA0003071562540000032
wij=P(wordi,wordj);
Figure FDA0003071562540000033
其中,
Figure FDA0003071562540000034
表示显示情感词语vi在t时刻受到邻居节点的影响,wij表示词语i和词语j在语料库中的共现频率,
Figure FDA0003071562540000035
表示词语j在某一时刻的传播率,P(wordi,wordj)表示词语i和词语j在语料库中共现的概率,F(wordi,wordj)表示词语i和词语j在语料库中的共现频率,N表示语料库中所有句子的数量,完全图中所有句子构成语料库;
步骤333、计算每个时刻显示情感词语vi的情感传播情况
Figure FDA0003071562540000036
公式如下:
Figure FDA0003071562540000037
其中,λ用于衡量词语间情感传播的概率,μ用于衡量错别字与词语搭配错误的概率;
计算每个时刻显示情感词语vi的情感不传播情况
Figure FDA0003071562540000038
公式如下:
Figure FDA0003071562540000039
7.根据权利要求6所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤34中,情感传播后正向的情感值为
Figure FDA00030715625400000310
负向的情感值为
Figure FDA00030715625400000311
其计算公式为:
Figure FDA00030715625400000312
Figure FDA00030715625400000313
其中,
Figure FDA00030715625400000314
表示该词语以相同的概率将情感传播给它的邻居节点。
8.根据权利要求7所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤35中,归一化公式为:
Figure FDA00030715625400000315
9.根据权利要求8所述的基于情感传播的隐式情感词典生成方法,其特征在于,所述步骤36中,获得隐式情感词汇的情感极性的公式为:
Figure FDA0003071562540000041
CN202110542789.3A 2021-05-18 2021-05-18 基于情感传播的隐式情感词典生成方法 Active CN113326694B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110542789.3A CN113326694B (zh) 2021-05-18 2021-05-18 基于情感传播的隐式情感词典生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110542789.3A CN113326694B (zh) 2021-05-18 2021-05-18 基于情感传播的隐式情感词典生成方法

Publications (2)

Publication Number Publication Date
CN113326694A true CN113326694A (zh) 2021-08-31
CN113326694B CN113326694B (zh) 2022-09-30

Family

ID=77416015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110542789.3A Active CN113326694B (zh) 2021-05-18 2021-05-18 基于情感传播的隐式情感词典生成方法

Country Status (1)

Country Link
CN (1) CN113326694B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766331A (zh) * 2017-11-10 2018-03-06 云南大学 对单词情感值进行自动标定的方法
CN109376239A (zh) * 2018-09-29 2019-02-22 山西大学 一种用于中文微博情感分类的特定情感词典的生成方法
CN109947951A (zh) * 2019-03-19 2019-06-28 北京师范大学 一种可自动更新的用于金融文本分析的情感字典构建方法
CN111353044A (zh) * 2020-03-09 2020-06-30 重庆邮电大学 一种基于评论的情感分析方法及系统
CN112686765A (zh) * 2020-12-09 2021-04-20 天津大学 一种基于社交网络的信息传播规律挖掘方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766331A (zh) * 2017-11-10 2018-03-06 云南大学 对单词情感值进行自动标定的方法
CN109376239A (zh) * 2018-09-29 2019-02-22 山西大学 一种用于中文微博情感分类的特定情感词典的生成方法
CN109947951A (zh) * 2019-03-19 2019-06-28 北京师范大学 一种可自动更新的用于金融文本分析的情感字典构建方法
CN111353044A (zh) * 2020-03-09 2020-06-30 重庆邮电大学 一种基于评论的情感分析方法及系统
CN112686765A (zh) * 2020-12-09 2021-04-20 天津大学 一种基于社交网络的信息传播规律挖掘方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MILAGROS FERNÁNDEZ-GAVILANES 等: "Unsupervised method for sentiment analysis in online texts", 《EXPERT SYSTEMS WITH APPLICATIONS》 *
QIZHI LI 等: "ISWR: An Implicit Sentiment Words Recognition Model Based on Sentiment Propagation", 《CCF INTERNATIONAL CONFERENCE ON NATURAL LANGUAGE PROCESSING AND CHINESE COMPUTING NLPCC 2021: NATURAL LANGUAGE PROCESSING AND CHINESE COMPUTING》 *
野指针小李: "情感分析学习笔记(6)——PolarityRank算法python代码实现", 《HTTPS://BLOG.CSDN.NET/QQ_35357274/ARTICLE/DETAILS/109812071》 *

Also Published As

Publication number Publication date
CN113326694B (zh) 2022-09-30

Similar Documents

Publication Publication Date Title
Saha et al. Proposed approach for sarcasm detection in twitter
Bikel et al. An algorithm that learns what's in a name
JP6676110B2 (ja) 発話文生成装置とその方法とプログラム
Lertpiya et al. A preliminary study on fundamental Thai NLP tasks for user-generated web content
CN114528919A (zh) 自然语言处理方法、装置及计算机设备
Nyaung et al. Feature Based Summarizing and Ranking from Customer Reviews
Sharma et al. Knowledge-Based Method for Word Sense Disambiguation by Using Hindi WordNet.
Čibej et al. Normalisation, tokenisation and sentence segmentation of Slovene tweets
Mammadov et al. Part-of-speech tagging for azerbaijani language
Khorjuvenkar et al. Parts of speech tagging for Konkani language
CN113326694B (zh) 基于情感传播的隐式情感词典生成方法
Aliero et al. Systematic review on text normalization techniques and its approach to non-standard words
Agrawal et al. Comparative analysis of NLP models for Google Meet Transcript summarization
CN108694165A (zh) 面向产品评论的跨领域对偶情感分析方法
Alkazemi et al. AccurIT: a prototype of a machine translation engine for English to Arabic translation
Seresangtakul et al. Thai-Isarn dialect parallel corpus construction for machine translation
Bani et al. Combining conditional random fields and word embeddings to improve Amazigh part-of-speech Tagging
Kasmuri et al. Building a Malay-English code-switching subjectivity corpus for sentiment analysis
Satpathy et al. Analysis of Learning Approaches for Machine Translation Systems
Cabada et al. Methods for Data Representation
Jose et al. Lexical normalization model for noisy SMS text
Boroş et al. Romanian-English speech translation
Minn et al. Myanmar word stemming and part-of-speech tagging using rule based approach
JP2019087058A (ja) 文章中の省略を特定する人工知能装置
JP2002334076A (ja) テキスト処理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant