CN108549633A - 基于概率推理与情感认知的文本细粒度情感生成方法 - Google Patents

基于概率推理与情感认知的文本细粒度情感生成方法 Download PDF

Info

Publication number
CN108549633A
CN108549633A CN201810298349.6A CN201810298349A CN108549633A CN 108549633 A CN108549633 A CN 108549633A CN 201810298349 A CN201810298349 A CN 201810298349A CN 108549633 A CN108549633 A CN 108549633A
Authority
CN
China
Prior art keywords
emotion
text
variable
word
generation method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810298349.6A
Other languages
English (en)
Other versions
CN108549633B (zh
Inventor
柴玉梅
徐源音
王黎明
张卓
韩飞
韩慧
李永帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuxin Kunpeng Beijing Information Technology Co ltd
Original Assignee
Zhengzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University filed Critical Zhengzhou University
Priority to CN201810298349.6A priority Critical patent/CN108549633B/zh
Publication of CN108549633A publication Critical patent/CN108549633A/zh
Application granted granted Critical
Publication of CN108549633B publication Critical patent/CN108549633B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及基于概率推理与情感认知的文本细粒度情感生成方法,包括以下步骤:步骤1:准备训练方法所需的文本数据集;步骤2:对文本数据集进行处理;步骤3:提取构建贝叶斯网络所用的情感评估变量;步骤4:根据网络文本的特性,添加基于表情符号和词频的情感评估变量;步骤5:构建情感知识库;步骤6:构建常识知识库;步骤7:情感评估变量赋值;步骤8:学习情感生成贝叶斯网络的网络结构;步骤9,进行参数学习;步骤10:完成情感生成方法的构建工作。本发明利用情感认知方法解决其他情感生成方法中存在的忽视隐性情感的问题,同时利用贝叶斯网络计算情感产生的概率,比较每种情感类别概率的高低,生成文本包含的一或多种情感。

Description

基于概率推理与情感认知的文本细粒度情感生成方法
技术领域
本发明涉及机器学习和自然语言处理文本情感分析领域,具体涉 及到情感认知方法以及贝叶斯网络的推理思想领域,尤其涉及基于概 率推理与情感认知的文本细粒度情感生成方法。
背景技术
文本情感分析是自然语言处理的一个热门的研究领域,主要是能 自动识别用户在文本中所表达的情感类别。情感是是多种感觉、思想 和行为综合产生的心理和生理状态,泛指喜欢、厌恶、愤怒、惊讶、 自豪等。传统的情感分析主要是识别用户的情感倾向:正向、负向或 者中性,情感分析则是细粒度的情感分析任务,可以识别多种情感。 情感的生成方法有基于词典和规则的方法、基于机器学习的方法、基 于情感认知方法OCC、EMA的方法等。认知评估理论是认知心理学研 究中应用广泛和较为成熟的情感分析理论。情感认知方法OCC理论将 情感看为对事件的结果、智能体的行为和对象属性的认知评价。该方 法通过一系列情感诱发条件定义了22种情感产生规则。
基于词典和规则的方法通常使用大规模、高质量的情感词典,如 HowNet情感词典、台湾大学NTUSD简体中文情感词典等。仅依赖词 典匹配的方法只能识别出带有情感词的显性情感,对于不包含情感词 的文本识别效果不好。基于机器学习的方法常用的主要有支持向 量机(Support Vector Machines,SVMs)、卷积神经网络 (Convolutional NeuralNetwork,CNN)、长短期记忆网络(Long Short Term Memory networks,LSTM)等。机器学习的方法依赖特征 工程或者和所需参数较多,耗时较长,在细粒度的文本情感生成中精 度不高。贝叶斯网络(Bayesian Network,BN)又称为信念网络(Belief Network),是一种概率网络,是一组节点的联合概率分布,每一个节 点代表一个随机变量,节点间的有向边代表变量间的依赖关系。传统 的情感分析方法一般只识别一种情感,但人们通过文本表述的情感往 往不是单一的。贝叶斯网络基于概率推理的这种特性正适应于文本情 感分析,依据概率推理可识别人们可能想要表达的多种情感类别。
发明内容
针对现有技术的缺陷,本发明提出了基于概率推理与情感认知的 文本细粒度情感生成方法,利用情感认知方法解决其他情感生成方法 中存在的忽视隐性情感的问题,同时利用贝叶斯网络计算情感产生的 概率,提高情感类别生成的准确度。
为实现上述目的,本发明提出基于概率推理与情感认知的文本细 粒度情感生成方法,包括以下步骤:
步骤1:准备训练方法所需的文本数据集,选用七种情感进行文 本标注;
步骤2.:对文本数据集进行分析、词性标注、依存句法分析、语 义依存关系处理;
步骤3:根据情感认知方法OCC方法的情感产生规则,提取构建 贝叶斯网络所用的情感评估变量;
步骤4:根据网络文本的特性,添加基于表情符号的情感评估变 量;
步骤5:构建情感知识库;
步骤6:构建常识知识库;
步骤7:情感评估变量赋值;根据步骤2得到的数据预处理结果, 对步骤3和步骤4提取的情感评估变量进行赋值;
步骤8:学习情感生成贝叶斯网络的网络结构;
步骤9,使用EM方法对情感生成贝叶斯网络进行参数学习;
步骤10:完成情感生成方法的构建工作;输入一条文本,将依 次经过步骤2和步骤7处理后的结果输入网络方法,通过比较每类情 感的概率值,即可得到文本的情感类别。
进一步的,在步骤1中,情感认知方法OCC方法对应情感有22 种,分析后选用喜欢、幸福、恐惧、生气、厌恶、悲伤、惊讶共七种 情感对文本进行标注;在步骤2中对文本数据集使用哈工大语言云技 术平台进行处理;处理后的文本结构定义为S={w1,w2,…wN},wi表示一条 文本中的第i个词语对象;词语对象wi=<cont,pos,ne,arg,rel,par semRel,sePmar>,其中cont表示词语内容;pos代表词性;ne为命名 实体信息;arg=<type,beg,end>表示序号从beg至end构成的词组的语 义角色类别为type;rel表示依存句法关系,par为关系指向的父节 点词序号;semRel表示语义依存关系,semPar为关系指向的父节点词序号。
进一步的,在步骤3中情感评估变量如下:
情感评估变量
进一步的,在步骤4中添加基于表情符号的情感评估变量<exp、 elike、ehappiness、efear、esurprise、eanger、edisgust、esadness>, 其中exp表示是否有表情符号,其他变量表示对应的情感类型无为1, 有为2;添加基于统计词频情感评估变量<welike、whappiness、wfear、 wsurprise、wanger、wdisgust、wsadness>表示对应的情感类型无为 1,有为2。
进一步的,步骤5中的情感知识库是从HowNet情感极性词典、 大连理工大学情感词汇本体库、清华大学极性词典、台湾大学情感词 典共个中文情感词典中,归纳整理去除了低频生僻词,得到基础情感 极性词典包含正向情感词15630个,负向情感词18807个。
进一步的,步骤6中的构建常识知识库是提取HowNet知识库中Entity类作为基础object词典;再使用完整的HowNet知识库,通 过分析其概念结构,完善其他常识词典。
进一步的,常识知识库具体描述如下:
常识词典具体描述
进一步的,对步骤3和步骤4提取的情感评估变量进行赋值:
1)words,根据文本S中是否存在谓语关系<SBV、VOB、ADV、POB、 IOB、FOB、DBL〉,确定该文本是否为独词句;
2)rel,根据主谓关系SBV得到文本主语Sub,若Sub属于other, 则rel=2;若Sub属于self,则rel=1;如该句为独词句或以描述客 观事物为主,则rel=1;
3)au_obj,通过语义依存分析,得到客观事物的修饰语Feat; 根据修饰语极性确立au_obj的属性值;
4)sta_eve,通过分析谓词、宾语以及各自的修饰词的极性,确 定事件的属性;
5)au_eve,若事件相关主体rel=1,au_eve的属性值等同于 sta_eve;否则,通过分析文本中除相关主体所在的子句,以及插入 语的情感极性确定au_eve的属性值;
6)time,获取语义依存关系中的mTime、dTime、Time、mMod等 关系指向的词语,对其匹配confirmation和future词典,获取文本 的时间关系;
7)<exp、elike、ehappiness、efear、esurprise、eanger、edisgust、 esadness>,若文本中不存在表情,所有变量取1;若文本含有表情, 则exp=2,对每个表情对应情感叠加取值最高的两个情感变量赋值为 2,其他为1;
8)<welike、whappiness、wfear、wsurprise、wanger、wdisgust、 wsadness>根据标注数据集,通过计算每个词在每类情感类别下的词 频,去掉模糊度较高的词后对每个词赋予2个情感类别;在依此对文 本中对每个词对应情感叠加取值最高的两个情感变量赋值为2,其他 为1。
进一步的,贝叶斯网络结构中序号和变量的对应关系为:
exp=1;elike=2;ehappiness=3;efear=4;eanger=5;edisgust=6;esadness=7;esurprise=8;wlike=9;whappiness=10;wfear=11;wanger=12 ;wdisgust=13;wsadness=14;wsurprise=15;words=16;rel=17;au_ob j=18;au_eve=19;sta_eve=10;time=21;like=22;happiness=23;fear =24;anger=25;disgust=26;sadness=27;surprise=28。
进一步的,步骤9中的参数学习过程为:
1)对V中的每个变量xi,遍历每个父节点π(xi)可取的值j;对每个k遍历 对应的kr
2)初始化t=0;
3)对H中完整的数据集Y计算作为初始值;
4)对缺失数据集D计算:
5)当时:
t=t+1
6)将参数放入条件概率表CPT;
其中,t为迭代次数;θ为S中节点的条件概率,表示为 Dg表示第g个样本实例,共有N个;Xg表第g个样本示例中缺少的变量;V 表示S中所有的变量(节点){x1,x2,x3…xn}|,kr代表xi的第r个取值,共有Mi个;π(xi) 表示xi的父集。
有益效果
1)本发明使用情感认知方法提取文本信息,并融合文本表情特 征和情感词频特征,相较于传统的基于词典的或者机器学习的情感生 成方法而言,可有效捕捉文本中隐含的情感元素。
2)本发明使用贝叶斯网络作为最终的情感类别生成方法,将基 于概率推理贝叶斯网络应用于文本情感生成,可得到人们想要表达的 多种情感类别。同时,它可以解决在文本情感生成中中情感评估变量 的不完整性问题。
3)本发明同时可适用于随意性较强的网络文本。
附图说明
图1是本发明的系统流程图;
图2是本发明的系统结构示意图;
图3是本发明的情绪生成贝叶斯网络结构图;
图4是本发明实施例句的依存句法与语义分析结果。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合 附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描 述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明的方法步骤详细如下:
步骤1,准备训练方法所需的文本数据集,情感认知方法OCC方 法对应情感有22种,本发明分析后选用喜欢、幸福、恐惧、生气、 厌恶、悲伤、惊讶共七种情感对文本进行标注。
步骤2,对文本数据集使用哈工大语言云技术平台进行分析、词 性标注、依存句法分析、语义依存关系等等处理,处理后的文本结构 定义为S={w1,w2,…wN},wi表示一条文本中的第i个词语对象。词语对 象wi=<cont,pos,ne,arg,rel,par,semRel,semPar>,其中cont表示词语内容; pos代表词性;ne为命名实体信息;arg=<type,beg,end>表示序号从 beg至end构成的词组的语义角色类别为type;rel表示依存句法关 系,par为关系指向的父节点词序号;semRel表示语义依存关系, semPar为关系指向的父节点词序号。
步骤3,根据情感认知方法OCC方法的情感产生规则,提取构建 贝叶斯网络所用的情感评估变量,如表1所示。
表1情感评估变量
步骤4,根据网络文本的特性,添加基于表情符号的情感评估变 量<exp、elike、ehappiness、efear、esurprise、eanger、edisgust、 esadness>,其中exp表示是否有表情符号,其他变量表示对应的情感 类型无为1,有为2;添加基于统计词频情感评估变量<welike、 whappiness、wfear、wsurprise、wanger、wdisgust、wsadness>表 示对应的情感类型无为1,有为2。
步骤5,构建情感知识库。现常用的中文情感词典有四种,分别 为:HowNet情感极性词典、大连理工大学情感词汇本体库、清华大 学极性词典、台湾大学情感词典。归纳整理去除了低频生僻词,得到 基础情感极性词典包含正向情感词15630个,负向情感词18807个。
步骤6,构建常识知识库。本发明提取HowNet知识库中Entity 类作为基础object词典。再使用完整的HowNet知识库,通过分析其 概念结构,完善其他常识词典,常识知识库具体描述如表2所示。
表2常识词典具体描述
步骤7,情感评估变量赋值。根据步骤2得到的数据预处理结果, 对步骤3和步骤4提取的情感评估变量进行赋值。
1)words,根据文本S中是否存在谓语关系<SBV、VOB、ADV、POB、 IOB、FOB、DBL〉,确定该文本是否为独词句;
2)rel,根据主谓关系SBV得到文本主语Sub,若Sub属于other, 则rel=2;若Sub属于self,则rel=1;如该句为独词句或以描述客 观事物为主,则rel=1;
3)au_obj,通过语义依存分析,得到客观事物的修饰语Feat; 根据修饰语极性确立au_obj的属性值;
4)sta_eve,通过分析谓词、宾语以及各自的修饰词的极性,确 定事件的属性;
5)au_eve,若事件相关主体rel=1,au_eve的属性值等同于 sta_eve;否则,通过分析文本中除相关主体所在的子句,以及插入 语的情感极性确定au_eve的属性值;
6)time,获取语义依存关系中的mTime、dTime、Time、mMod等 关系指向的词语,对其匹配confirmation和future词典,获取文本 的时间关系;
7)<exp、elike、ehappiness、efear、esurprise、eanger、edisgust、 esadness>,若文本中不存在表情,所有变量取1;若文本含有表情, 则exp=2,对每个表情对应情感叠加取值最高的两个情感变量赋值为 2,其他为1;
8)<welike、whappiness、wfear、wsurprise、wanger、wdisgust、 wsadness>根据标注数据集,通过计算每个词在每类情感类别下的词 频,去掉模糊度较高的词后对每个词赋予2个情感类别;在依此对文 本中对每个词对应情感叠加取值最高的两个情感变量赋值为2,其他 为1。
步骤8,学习情感生成贝叶斯网络的网络结构。根据情感认知方 法的情感生成规则,绘制贝叶斯网络结构,如图3所示。
步骤9,使用EM方法对情感生成贝叶斯网络进行参数学习。
1)对V中的每个变量xi,遍历每个父节点π(xi)可取的值j;对 每个k遍历对应的kr。
2)初始化t=0。
3)对H中完整的数据集Y计算作为初始值。
4)对缺失数据集D计算:
5)当时:
t=t+1
6)将参数放入条件概率表CPT;
其中,t为迭代次数;θ为S中节点的条件概率,表示为 Dg表示第g个样本实例,共有N个;Xg表第g个样本示例中缺少的变量;V 表示S中所有的变量(节点){x1,x2,x3…xn},kr代表xi的第r个取值,共有Mi个;π(xi) 表示xi的父集。
步骤10,至此,已完成情感生成方法的构建工作。输入一条文 本,将依次经过步骤2和步骤7处理后的结果输入网络方法,通过比 较每类情感的概率值,即可得到文本的情感类别。
本发明以情感认知方法为基础,分析22种情感归并整理为7类 情感。根据方法情感生成的规则提取情感评估变量,同时融入网络文 本的表情特征和词频特征用以构建贝叶斯网络。该方法可处理较为随 意的网络文本,同时依据认知方法的原理可获取文本的隐性情感表达。
本发明以贝叶斯网络作为最终的情感生成方法,可减少文本情感 评估变量缺失时对情感生成的误差,同时以概率方式判定最终生成的 情感,具有较强的可解释性与可分析性。
如图2所示,本发明包含3个主要模块:
1)数据准备模块:该模块主要包含数据的预处理部分,如分词、 词性分析、依存句法分析等;以及情感词典和常识知识库的构建部分;
2)情感生成贝叶斯网络构建模块:该模块包含情感评估变量提 取与赋值以及贝叶斯网络的结构确立与参数学习,是本发明的核心部 分;
3)情感生成模块:该模块对上述模块完成结果的应用,即从输 入一条文本到生成文本情感的过程。
实施例1:
文本://@微博搞笑排行榜:鼓浪屿真不错,咱们一起去旅行![欢 欣鼓舞]
1)准备训练方法所需的文本数据集S共一万五千条,按喜欢、 幸福、恐惧、生气、厌恶、悲伤、惊讶共七种情感对文本进行标注。
2)对文本数据集S使用哈工大语言云技术平台进行分析、词性 标注、依存句法分析、语义依存关系等处理。
3)使用上文步骤3中提取的构建贝叶斯网络所用的情感评估变 量。
4)根据网络文本的特性,确定基于表情符号的情感评估变量<exp、 elike、ehappiness、efear、esurprise、eanger、edisgust、esadness>, 其中exp表示是否有表情符号,其他变量表示对应的情感类型无为1, 有为2;确定基于统计词频情感评估变量<welike、whappiness、wfear、wsurprise、wanger、wdisgust、wsadness>表示对应的情感类型无为 1,有为2。
5)按照上文步骤5和步骤6分别构建情感知识库和常识知识库。
6)依照上文步骤7所示的情感评估变量赋值方法对数据集S的 数据预处理结果逐条进行情绪评估变量的赋值。
7)根据情感认知方法的情感生成规则,绘制贝叶斯网络结构, 如图3所示。
并使用步骤8中所示的EM方法对情感生成贝叶斯网络进行参数 学习。至此,已完成情感生成方法的构建工作。
8)对测试文本进行数据预处理,先提取表情“[欢欣鼓舞]”, 在对文本做分词、词性标注等一系列分析,结果如图4所示。
9)情感评估变量赋值,文本包含表情,因而查找表情库匹配对 应情感,表情变量赋值结果为:<exp、elike、ehappiness、efear、 eanger、edisgust、esadness、esurprise>←<2 1 2 1 1 1 2 1>; 按照分词结果,以此累计每个词对应的情感,取最高的两类,对词频变量赋值结果为:<wlike、whappiness、wfear、wanger、wdisgust、 wsadness、wsurprise>←<1 2 1 1 2 1 1>;根据步骤六,使用情感词 典和常识知识库对情感认知变量赋值,结果为:<words、rel、au_obj、 au_eve、sta_eve、time>←<2 1 1 1 1 2>。
10)将情感评估变量<2 1 2 1 1 1 2 11 2 1 1 2 1 12 1 1 1 1 2>输入训练好的贝叶斯网络,使用联合推理后得到每个情感为正的概 率<(like 0.5362)、(happiness0.7971)、(surprise 0.0021)、(anger 0.0001)、(fear 0)、(disgust 0)、(sadness 0)>,取最高两类,最 终生成情感为happiness、like。
本实例取自微博网络文本,包含表情特征,最终生成情感与文本 表述情感基本一致。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在 本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应 包含在本发明的保护范围之内。

Claims (10)

1.基于概率推理与情感认知的文本细粒度情感生成方法,其特征在于,包括以下步骤:
步骤1:准备训练方法所需的文本数据集,选用七种情感进行文本标注;
步骤2:对文本数据集进行分析、词性标注、依存句法分析、语义依存关系处理;
步骤3:根据情感认知方法OCC方法的情感产生规则,提取构建贝叶斯网络所用的情感评估变量;
步骤4:根据网络文本的特性,添加基于表情符号和词频的情感评估变量;
步骤5:构建情感知识库;
步骤6:构建常识知识库;
步骤7:情感评估变量赋值;根据步骤2得到的数据预处理结果,对步骤3和步骤4提取的情感评估变量进行赋值;
步骤8:学习情感生成贝叶斯网络的网络结构;
步骤9,使用EM方法对情感生成贝叶斯网络进行参数学习;
步骤10:完成情感生成方法的构建工作;输入一条文本,将依次经过步骤2和步骤7处理后的结果输入网络方法,通过比较每类情感的概率值,即可得到文本的情感类别。
2.根据权利要求1所述的文本细粒度情感生成方法,其特征在于:在步骤1中,情感认知方法OCC方法对应情感有22种,分析后选用喜欢、幸福、恐惧、生气、厌恶、悲伤、惊讶共七种情感对文本进行标注;在步骤2中对文本数据集使用哈工大语言云技术平台进行处理;处理后的文本结构定义为S={w1,w2,…wN},wi表示一条文本中的第i个词语对象;词语对象wi=<cont,pos,ne,arg,rel,par,semRel,semPar>,其中cont表示词语内容;pos代表词性;ne为命名实体信息;arg=<type,beg,end>表示序号从beg至end构成的词组的语义角色类别为type;rel表示依存句法关系,par为关系指向的父节点词序号;semRel表示语义依存关系,semPar为关系指向的父节点词序号。
3.根据权利要求2所述的文本细粒度情感生成方法,其特征在于:步骤3中的情感评估变量如下:
情感评估变量
4.根据权利要求3所述的文本细粒度情感生成方法,其特征在于:所述步骤4中添加基于表情符号的情感评估变量<exp、elike、ehappiness、efear、esurprise、eanger、edisgust、esadness>,其中exp表示是否有表情符号,其他变量表示对应的情感类型无为1,有为2;添加基于统计词频情感评估变量<welike、whappiness、wfear、wsurprise、wanger、wdisgust、wsadness>表示对应的情感类型无为1,有为2。
5.根据权利要求4所述的文本细粒度情感生成方法,其特征在于:步骤5中的情感知识库是从HowNet情感极性词典、大连理工大学情感词汇本体库、清华大学极性词典、台湾大学情感词典共个中文情感词典中,归纳整理去除了低频生僻词,得到基础情感极性词典包含正向情感词15630个,负向情感词18807个。
6.根据权利要求5所述的文本细粒度情感生成方法,其特征在于:步骤6中的构建常识知识库是提取HowNet知识库中Entity类作为基础object词典;再使用完整的HowNet知识库,通过分析其概念结构,完善其他常识词典。
7.根据权利要求6所述的文本细粒度情感生成方法,其特征在于:常识知识库具体描述如下:
常识词典具体描述
8.根据权利要求7所述的文本细粒度情感生成方法,其特征在于:对步骤3和步骤4提取的情感评估变量进行赋值:
1)words,根据文本S中是否存在谓语关系<SBV、VOB、ADV、POB、IOB、FOB、DBL〉,确定该文本是否为独词句;
2)rel,根据主谓关系SBV得到文本主语Sub,若Sub属于other,则rel=2;若Sub属于self,则rel=1;如该句为独词句或以描述客观事物为主,则rel=1;
3)au_obj,通过语义依存分析,得到客观事物的修饰语Feat;根据修饰语极性确立au_obj的属性值;
4)sta_eve,通过分析谓词、宾语以及各自的修饰词的极性,确定事件的属性;
5)au_eve,若事件相关主体rel=1,au_eve的属性值等同于sta_eve;否则,通过分析文本中除相关主体所在的子句,以及插入语的情感极性确定au_eve的属性值;
6)time,获取语义依存关系中的mTime、dTime、Time、mMod等关系指向的词语,对其匹配confirmation和future词典,获取文本的时间关系;
7)<exp、elike、ehappiness、efear、esurprise、eanger、edisgust、esadness>,若文本中不存在表情,所有变量取1;若文本含有表情,则exp=2,对每个表情对应情感叠加取值最高的两个情感变量赋值为2,其他为1;
8)<welike、whappiness、wfear、wsurprise、wanger、wdisgust、wsadness>根据标注数据集,通过计算每个词在每类情感类别下的词频,去掉模糊度较高的词后对每个词赋予2个情感类别;在依此对文本中对每个词对应情感叠加取值最高的两个情感变量赋值为2,其他为1。
9.根据权利要求8所述的文本细粒度情感生成方法,其特征在于:贝叶斯网络结构中序号和变量的对应关系为:exp=1;elike=2;ehappiness=3;efear=4;eanger=5;edisgust=6;esadness=7;esurprise=8;wlike=9;whappiness=10;wfear=11;wanger=12;wdisgust=13;wsadness=14;wsurprise=15;words=16;rel=17;au_obj=18;au_eve=19;sta_eve=10;time=21;like=22;happiness=23;fear=24;anger=25;disgust=26;sadness=27;surprise=28。
10.根据权利要求9所述的文本细粒度情感生成方法,其特征在于:步骤9中的参数学习过程为:
1)对V中的每个变量xi,遍历每个父节点π(xi)可取的值j;对每个k遍历对应的kr
2)初始化t=0;
3)对H中完整的数据集Y计算作为初始值;
4)对缺失数据集D计算:
5)当时:
t=t+1
6)将参数放入条件概率表CPT;
其中,t为迭代次数;θ为S中节点的条件概率,表示为Dg表示第g个样本实例,共有N个;Xg表第g个样本示例中缺少的变量;V表示S中所有的变量(节点){x1,x2,x3…xn},kr代表xi的第r个取值,共有Mi个;π(xi)表示xi的父集。
CN201810298349.6A 2018-04-04 2018-04-04 基于概率推理与情感认知的文本细粒度情感生成方法 Active CN108549633B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810298349.6A CN108549633B (zh) 2018-04-04 2018-04-04 基于概率推理与情感认知的文本细粒度情感生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810298349.6A CN108549633B (zh) 2018-04-04 2018-04-04 基于概率推理与情感认知的文本细粒度情感生成方法

Publications (2)

Publication Number Publication Date
CN108549633A true CN108549633A (zh) 2018-09-18
CN108549633B CN108549633B (zh) 2021-09-21

Family

ID=63514285

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810298349.6A Active CN108549633B (zh) 2018-04-04 2018-04-04 基于概率推理与情感认知的文本细粒度情感生成方法

Country Status (1)

Country Link
CN (1) CN108549633B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109697284A (zh) * 2018-11-01 2019-04-30 天津大学 一种揭示中文语料中隐含情感的方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770580A (zh) * 2009-01-04 2010-07-07 中国科学院计算技术研究所 一种跨领域的文本情感分类器的训练方法和分类方法
CN103049435A (zh) * 2013-01-04 2013-04-17 浙江工商大学 文本细粒度情感分析方法及装置
CN103605658A (zh) * 2013-10-14 2014-02-26 北京航空航天大学 一种基于文本情感分析的搜索引擎系统
CN104462487A (zh) * 2014-12-19 2015-03-25 南开大学 一种融合多信息源的个性化在线新闻评论情绪预测方法
CN104794211A (zh) * 2015-04-24 2015-07-22 清华大学 基于微博文本的情绪诱因提取和诱因成分分析方法及系统
CN105893582A (zh) * 2016-04-01 2016-08-24 深圳市未来媒体技术研究院 一种社交网络用户情绪判别方法
CN106055596A (zh) * 2016-05-23 2016-10-26 南开大学 一种多标签在线新闻读者情绪预测方法
CN106897439A (zh) * 2017-02-28 2017-06-27 百度在线网络技术(北京)有限公司 文本的情感识别方法、装置、服务器以及存储介质
CN107577742A (zh) * 2017-08-28 2018-01-12 上海电机学院 一种基于贝叶斯方法的多关系社交网络模式挖掘方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770580A (zh) * 2009-01-04 2010-07-07 中国科学院计算技术研究所 一种跨领域的文本情感分类器的训练方法和分类方法
CN103049435A (zh) * 2013-01-04 2013-04-17 浙江工商大学 文本细粒度情感分析方法及装置
CN103605658A (zh) * 2013-10-14 2014-02-26 北京航空航天大学 一种基于文本情感分析的搜索引擎系统
CN104462487A (zh) * 2014-12-19 2015-03-25 南开大学 一种融合多信息源的个性化在线新闻评论情绪预测方法
CN104794211A (zh) * 2015-04-24 2015-07-22 清华大学 基于微博文本的情绪诱因提取和诱因成分分析方法及系统
CN105893582A (zh) * 2016-04-01 2016-08-24 深圳市未来媒体技术研究院 一种社交网络用户情绪判别方法
CN106055596A (zh) * 2016-05-23 2016-10-26 南开大学 一种多标签在线新闻读者情绪预测方法
CN106897439A (zh) * 2017-02-28 2017-06-27 百度在线网络技术(北京)有限公司 文本的情感识别方法、装置、服务器以及存储介质
CN107577742A (zh) * 2017-08-28 2018-01-12 上海电机学院 一种基于贝叶斯方法的多关系社交网络模式挖掘方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
FELIPE NEVES DA SILVA 等: ""Using Bayesian Networks to Structure the OCC Emotions Model"", 《JOURNAL OF INTELLIGENT COMPUTING》 *
乔向杰 等: ""基于OCC模型的E-Learning系统情感建模"", 《计算机科学》 *
吴鹏 等: ""基于深度学习和OCC情感规则的网络舆情情感识别研究"", 《情报学报》 *
庞娜: ""基于OCC模型的文本情感识别方法的研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109697284A (zh) * 2018-11-01 2019-04-30 天津大学 一种揭示中文语料中隐含情感的方法

Also Published As

Publication number Publication date
CN108549633B (zh) 2021-09-21

Similar Documents

Publication Publication Date Title
Rao Contextual sentiment topic model for adaptive social emotion classification
CN109271537B (zh) 一种基于蒸馏学习的文本到图像生成方法和系统
CN111914096A (zh) 基于舆情知识图谱的公共交通乘客满意度评价方法及系统
Jamal et al. Poetry classification using support vector machines
CN111797898B (zh) 一种基于深度语义匹配的在线评论自动回复方法
Chang et al. Research on detection methods based on Doc2vec abnormal comments
Zhou et al. Sentiment analysis of text based on CNN and bi-directional LSTM model
Liu et al. A multi-modal chinese poetry generation model
CN112434164B (zh) 一种兼顾话题发现和情感分析的网络舆情分析方法及系统
Vamshi et al. Topic model based opinion mining and sentiment analysis
Azim et al. Text to emotion extraction using supervised machine learning techniques
CN111858940A (zh) 一种基于多头注意力的法律案例相似度计算方法及系统
Sreelakshmi et al. An effective approach for detection of sarcasm in tweets
Basha et al. Parsing based sarcasm detection from literal language in tweets
Hajek et al. Neural networks with emotion associations, topic modeling and supervised term weighting for sentiment analysis
CN107894975A (zh) 一种基于Bi‑LSTM的分词方法
Fu et al. CONSK-GCN: conversational semantic-and knowledge-oriented graph convolutional network for multimodal emotion recognition
Zeng et al. Emotion wheel attention-based emotion distribution learning
CN108549633A (zh) 基于概率推理与情感认知的文本细粒度情感生成方法
Basri et al. A deep learning based sentiment analysis on bang-lish disclosure
Akmal et al. Corpus development for Indonesian product named entity recognition using semi-supervised approach
Jayaraman et al. Sarcasm Detection in News Headlines using Supervised Learning
Shalinda et al. Hate words detection among sri lankan social media text messages
Singh et al. Textual Conversational Sentiment Analysis in Deep Learning using capsule network
Panda et al. Patient reviews analysis using machine learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230509

Address after: 803, block B, No. 8 Xueqing Road (Science and technology wealth center), Haidian District, Beijing 100083

Patentee after: Fuxin Kunpeng (Beijing) Information Technology Co.,Ltd.

Address before: No.100, Kexue Avenue, high tech Industrial Development Zone, Zhengzhou City, Henan Province, 450000

Patentee before: Zhengzhou University

TR01 Transfer of patent right