CN109299463B - 一种情感得分的计算方法以及相关设备 - Google Patents

一种情感得分的计算方法以及相关设备 Download PDF

Info

Publication number
CN109299463B
CN109299463B CN201811126651.XA CN201811126651A CN109299463B CN 109299463 B CN109299463 B CN 109299463B CN 201811126651 A CN201811126651 A CN 201811126651A CN 109299463 B CN109299463 B CN 109299463B
Authority
CN
China
Prior art keywords
emotion
short sentence
words
word
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811126651.XA
Other languages
English (en)
Other versions
CN109299463A (zh
Inventor
彭小梅
张成林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Douyu Network Technology Co Ltd
Original Assignee
Wuhan Douyu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Douyu Network Technology Co Ltd filed Critical Wuhan Douyu Network Technology Co Ltd
Priority to CN201811126651.XA priority Critical patent/CN109299463B/zh
Publication of CN109299463A publication Critical patent/CN109299463A/zh
Application granted granted Critical
Publication of CN109299463B publication Critical patent/CN109299463B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种情感得分的计算方法及相关设备,用于解决了现有直播平台中人工收集用户对功能反馈的收集归纳,实现自动化识别功能问题并给出每个功能的情感偏向得分,有助于产品优化判断。该方法包括:获取所述直播平台的用户反馈文本;按照预设规则对所述用户反馈文本进行分词,得到分词集合;根据所述分词词集合确定功能词集合;将所述功能词集合中的每个功能词与所述直播平台对应的词库集合中的功能词库进行匹配,以确定功能句子集合;根据所述功能句子集合确定目标短句集合;确定所述目标短句集合的情感得分综合值;根据所述情感得分综合值确定所述目标功能的情感得分。

Description

一种情感得分的计算方法以及相关设备
技术领域
本发明涉及直播领域,尤其涉及一种情感得分的计算方法以及相关设备。
背景技术
舆情分析就是根据特定问题的需要,对针对这个问题的舆情进行深层次的思维加工和分析研究,得到相关结论的过程。
从现有的舆情分析来看,大多数的舆情分析是针对网络文章和微博文本的,对于直播平台用户评价内容的舆情分析暂时没有。对于情感分析,在以往的文本情感分析中,都是在一个句子中先找到情感词,再往后遍历寻找程度词,这样就会造成文本的情感计算出现错误
发明内容
本发明实施例提供了一种情感得分的计算方法以及相关设备,用于解决了现有直播平台中人工收集用户对功能反馈的收集归纳,实现自动化识别功能问题并给出每个功能的情感偏向得分,有助于产品优化判断。
本发明实施例的第一方面提供了一种情感得分的计算方法,应用于直播平台,包括:
获取所述直播平台的用户反馈文本;
按照预设规则对所述用户反馈文本进行分词,得到分词集合;
根据所述分词词集合确定功能词集合,所述功能词集合与所述分词集合具有关联关系;
将所述功能词集合中的每个功能词与所述直播平台对应的词库集合中的功能词库进行匹配,以确定功能句子集合;
根据所述功能句子集合确定目标短句集合,所述目标短句集合指示所述直播平台中的目标功能以及所述目标功能对应的问题;
确定所述目标短句集合的情感得分综合值;
根据所述情感得分综合值确定所述目标功能的情感得分,所述目标功能的情感得分指示所述功能句子集合对应的用户对所述目标功能的喜好程度。
可选地,所述获取所述直播平台的用户反馈文本之前,所述方法还包括:
创建所述直播平台对应的词库集合,所述词库集合包括日常系统词库、直播平台基础词库、停用词库、情感词库、程度词库、功能词库以及功能映射表。
可选地,所述按照预设规则对所述用户反馈文本进行分词,得到分词集合包括:
基于所述停用词库对所述用户反馈文本进行清洗,得到有效词集合;
根据无监督隐马尔科夫模型以及所述词库集合对所述有效词集合进行分词,以得到所述分词集合。
可选地,所述确定所述目标短句集合的情感得分综合值包括:
依次判断所述目标短句集合中的每个短句中情感词与程度词的出现顺序;
当所述目标短句集合中每个短句的情感词均先于程度词出现时,通过如下公式计算所述情感得分综合值:
Figure BDA0001812591010000021
其中,n为所述目标短句集合中的句子条数,i为遍历所述目标短句集合中的每个句子,sum_wi为所述情感综合得分,r为所述目标短句集合中每个短句中情感词的个数,j为遍历所述目标短句集合中的第i个短句中的每个情感词,1<i<n,0≤j<m;
当所述目标短句集合中每个短句的程度词均先于情感词出现时,通过如下公式计算所述情感得分综合值:
Figure BDA0001812591010000022
其中,sum_wi为所述情感综合得分,n为所述目标短句集合中的句子条数,i为遍历所述目标短句集合中的每个句子,m为所述目标短句集合中每个句子的程度词个数,p为所述目标短句集合中每个句子的程度词位置序列,q为所述目标短句集合中每个句子的程度词与情感词的位置序列;
当所述目标短句集合中包括情感词先于程度词出现的第一短句子集合以及程度词先于情感词出现的第二短句子集合时,通过如下公式计算所述情感得分综合值:
Figure BDA0001812591010000031
其中,sum_wi为所述情感综合得分,i为遍历所述目标短句集合中的每个句子,n为所述目标短句集合中的句子条数,r为所述第一短句子集合中的每个短句中情感词的个数,m为所述第二短句子集合中每个句子的程度词个数,p为所述第二短句子集合中每个句子的程度词位置序列,q为所述第二短句子集合中每个句子的程度词与情感词的位置序列。
可选地,所述根据所述情感得分综合值确定所述目标功能的情感得分包括:
通过如下公式计算所述目标功能的情感得分:
vo=average(sun_wi);
其中,vo为所述目标功能的情感得分,所述sun_wi为所述目标短句集合的情感得分综合值。
本发明实施例第二方面提供了一种情感得分的计算装置,应用于直播平台,包括:
获取单元,用于获取所述直播平台的用户反馈文本;
分词单元,用于按照预设规则对所述用户反馈文本进行分词,得到分词集合;
第一确定单元,用于根据所述分词词集合确定功能词集合,所述功能词集合与所述分词集合具有关联关系;
匹配单元,用于将所述功能词集合中的每个功能词与所述直播平台对应的词库集合中的功能词库进行匹配,以确定功能句子集合;
第二确定单元,用于根据所述功能句子集合确定目标短句集合,所述目标短句集合指示所述直播平台中的目标功能以及所述目标功能对应的问题;
第三确定单元,用于确定所述目标短句集合的情感得分综合值;
第四确定单元,用于根据所述情感得分综合值确定所述目标功能的情感得分,所述目标功能的情感得分指示所述功能句子集合对应的用户对所述目标功能的喜好程度。
可选地,所述装置还包括:
创建单元,用于创建所述直播平台对应的词库集合,所述词库集合包括日常系统词库、直播平台基础词库、停用词库、情感词库、程度词库、功能词库以及功能映射表。
可选地,所述分词单元具体用于:
基于所述停用词库对所述用户反馈文本进行清洗,得到有效词集合;
根据无监督隐马尔科夫模型以及所述词库集合对所述有效词集合进行分词,以得到所述分词集合。
可选地,所述第三确定单元具体用于:
依次判断所述目标短句集合中的每个短句中情感词与程度词的出现顺序;
当所述目标短句集合中每个短句的情感词均先于程度词出现时,通过如下公式计算所述情感得分综合值:
Figure BDA0001812591010000041
其中,n为所述目标短句集合中的句子条数,i为遍历所述目标短句集合中的每个句子,sum_wi为所述情感综合得分,r为所述目标短句集合中每个短句中情感词的个数,j为遍历所述目标短句集合中的第i个短句中的每个情感词,1<i<n,0≤j<m;
当所述目标短句集合中每个短句的程度词均先于情感词出现时,通过如下公式计算所述情感得分综合值:
Figure BDA0001812591010000051
其中,sum_wi为所述情感综合得分,n为所述目标短句集合中的句子条数,i为遍历所述目标短句集合中的每个句子,m为所述目标短句集合中每个句子的程度词个数,p为所述目标短句集合中每个句子的程度词位置序列,q为所述目标短句集合中每个句子的程度词与情感词的位置序列;
当所述目标短句集合中包括情感词先于程度词出现的第一短句子集合以及程度词先于情感词出现的第二短句子集合时,通过如下公式计算所述情感得分综合值:
Figure BDA0001812591010000052
其中,sum_wi为所述情感综合得分,i为遍历所述目标短句集合中的每个句子,n为所述目标短句集合中的句子条数,r为所述第一短句子集合中的每个短句中情感词的个数,m为所述第二短句子集合中每个句子的程度词个数,p为所述第二短句子集合中每个句子的程度词位置序列,q为所述第二短句子集合中每个句子的程度词与情感词的位置序列。
可选地,所述第四确定单元具体用于:
通过如下公式计算所述目标功能的情感得分:
vo=average(sun_wi);
其中,vo为所述目标功能的情感得分,所述sun_wi为所述目标短句集合的情感得分综合值。
本发明第三方面提供了一种电子设备,包括存储器、处理器,其特征在于,所述处理器用于执行存储器中存储的计算机管理类程序时实现如上述任意一项所述的情感得分的计算方法的步骤。
本发明第四方面提供了一种计算机可读存储介质,其上存储有计算机管理类程序,其特征在于:所述计算机管理类程序被处理器执行时实现如上述任意一项所述的情感得分的计算方法的步骤。
综上所述,本发明实施例中,可以通过用户反馈文本计算出直播平台中某个功能的情感得分,该情感得分指示用户对该某个功能的喜好程度,解决了现有直播平台中人工收集用户对功能反馈的收集归纳,实现自动化识别功能问题并给出每个功能的情感偏向得分,有助于产品优化判断。
附图说明
图1为本发明实施例提供的一种情感得分的计算方法的流程示意图;
图2为本发明实施例提供的一种情感得分的计算装置的实施例示意图;
图3为本发明实施例提供的一种情感得分的计算装置的硬件结构示意图;
图4为本发明实施例提供的一种电子设备的实施例示意图;
图5为本发明实施例提供的一种计算机可读存储介质的实施例示意图。
具体实施方式
本发明实施例提供了一种情感得分的计算方法和相关设备,用于解决了现有直播平台中人工收集用户对功能反馈的收集归纳,实现自动化识别功能问题并给出每个功能的情感偏向得分,有助于产品优化判断。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
下面从情感得分的计算装置的角度对情感得分的计算方法进行说明,该情感得分的计算装置可以为服务器,也可以为服务器中的服务单元。
请参阅图1,图1为本发明实施例提供的情感得分的计算方法的一个实施例示意图,该情感得分的计算方法应用于直播平台,包括:
101、获取直播平台的用户反馈文本。
本实施例中,情感得分的计算装置可以获取直播平台的用户反馈文本,该用户反馈文本例如是直播间的弹幕或者是直播平台对应的论坛上上面的留言等等,此处具体不限定如何获取直播平台的用户反馈文本。
需要说明的是,在获取直播平台的用户反馈文本之前,可以创建直播平台对应的词库集合,词库集合的建设是为了后期对用户反馈的文本进行功能问题识别及情感分析,该词库集合中包括日常系统词库、直播平台基础词库停用词库、情感词库、程度词库、功能词库以及功能映射表,下面对每个词库的作用进行说明:
系统词库:识别用户反馈文本中的一些非直播行业特有词,如“位置”、“情况”等词语;
直播平台基础词库:识别直播行业平台的特有词,如“直播”、“弹幕”等词语;
停用词库:去掉用户反馈文本中不产生任何作用和情感的词,如“我”、“你”等词语;
情感词库:判断句子的情感值:正面、中立和负面,如“赞”、“差”等词语;
程度词库:用于判断句子表达的情感程度,如“非常”、“很”等词语;
功能词库:识别用户反馈文本中的功能问题,如“清晰度”、“关注推荐”等词语;
功能映射表:因用户反馈的功能问题与正常的表述可能会存在较大差异性,所以就需要构建映射表进行功能词的修正表述;
在建设直播平台基础词库的过程中,采用的有监督隐马尔科夫模型算法(HiddenMarkov Model,HMM),训练直播平台的用户反馈文本的样本,对用户反馈文本进行分词,人工监督学习,不断的循环更新,直至词库集合构建完成。
需要说明的是,为了使得情感词库中的每个情感词表达的情感强度都不一样,将正负面情感词分为极强褒义词/极强贬义词和一般褒义词/一般贬义词,分别赋予相应的词权重weight值,其中极强褒义词/极强贬义词的权重weight值为±1.5,一般褒义词/一般贬义词的权重weight值为±1.0(其中,该1.5或者1.0根据HMM算法不断训练用户反馈文本样本得出)。
还需要说明的是,为了表达程度词库中每个程度词表达的情感强度不一样,将程度词分为5个等级,分别为极量程度词(权重score值设置为2.0)、高量程度词(权重score值设置为1.75)、中量程度词(权重score值设置为1.5)、低量程度词(权重score值设置为1.25)(上述数值同样是根据HMM算法不断训练用户反馈文本样本得出)。
102、按照预设规则对用户反馈文本进行分词,得到分词集合。
本实施例中,情感得分的计算装置可以按照预设规则对用户反馈文本进行分词,得到分词集合。具体的,可以首先基于直播平台对应的词库集合中的停用词库对用户反馈文本进行清洗,清洗掉用户反馈文本中的无效词(如去掉类似“我“、”今天“、”也“这样的词语),得到有效词集合,根据无监督隐马尔科夫模型HMM以及词库集合对有效词进行分词,以得到分词集合。
103、根据分词集合确定功能词集合。
本实施例中,由于用户反馈文本中的功能词的描述与直播平台中各项功能的描述是不相同的,因此需要采用TF-IDF算法对分出来的词进行词频和权重的统计,得到功能词集合,该功能词集合与分词集合具有关联关系,也就是说该功能词集合中的每个功能词都包含于分词集合中,并通过功能词映射表对功能词集合中的功能词进行修正,使得修正后的功能词与功能词库中的功能词相匹配,TF(Term Frequency)代表词频,IDF(InverseDocument Frequency)表示逆文档频率。如果某个词在文章中多次出现,而且不是停止词,那么它很可能就反应了这段文章的特性。再通过IDF来算出每个词的权重,不常见的词出现的频率越高,则权重越大(选取权重大于预设阈值的词作为功能词,得到功能词集合)。计算TF-IDF的公式为:
TF-IDF=TF(词频)*逆文档频率(IDF)。
104、将功能词集合中的每个功能词与直播平台对应的词库集合中的功能词库进行匹配,以确定功能句子集合。
本实施例中,情感得分的计算装置可以将功能词集合中的每个功能词与直播平台对应的词库集合中的功能词库进行匹配,以确定功能句子集合,其中该功能句子集合为用户反馈文本中用于描述直播平台中的功能的句子的集合,也就是说,在得到功能词集合之后,可以将功能词集合与直播平台中功能词库进行匹配,定位出用户反映的与直播平台的功能相关的句子标识,进而得到功能句子集合。
105、根据功能句子集合确定目标短句集合。
本实施例中,情感得分的计算装置可以根据功能句子集合确定目标短句集合,该目标短句集合指示直播平台中的目标功能以及该目标功能对应的问题,例如显示功能,对应的清晰度问题。具体的,可以将功能句子集合中的每个句子进行重新分词(具体分词方式上述已经进行说明,此处不在赘述),切割出描述直播平台中目标功能的功能问题的词组,形成“功能—功能对应问题”短句,最后结合目标功能对应的功能问题映射表,将描述目标功能的短句进行归纳整理、对反映目标功能的问题进行可读性修正,输出“功能-问题”标准句式,该“功能-问题”标准句式的集合即为目标短句集合。
106、确定目标短句集合的情感得分综合值。
本实施例中,情感得分的计算装置可以确定目标短句集合的情感得分综合值。可以理解的是,在对用户反馈内容文本分词后,根据直播平台中的情感词库、程度词库、直播平台基础词库、功能词库等识别用户反馈文本中的每类词,并赋予识别出的情感词权重weight值、程度词权重score值(非情感词默认weight=0,非程度词默认score=1)。根据汉语语法习惯,一般先出现描述情感词的程度词,然后再出现对应的情感词。基于此规则:在目标短句集合中的每个句子内部先查找是否存在程度词,如果没有,则情感词weight值求和;若有则查找程度词后面2个词中是否存在情感词,若有情感词,则情感得分为(score*weight),依次循环得到整句情感得分sum_w。
可以理解的是,目标短句集合中的句子包括三种情况,1、目标短句集合中的所有句子均是情感词先于程度词出现的句子,即目标短句集合中的所有句子均是“单一情感词”句式;2、目标短句集合中的所有句子均是程度词先于情感词出现,即目标短句集合中的所有句子均是“程度词-情感词”句式;3、目标短句集合中既包括情感词限于程度词出现的句子有包括程度词限于情感词出现的句子,即目标短句集合中包括两种句式,“单一情感词”句式和“程度词-情感词”句式。
首先,情感得分计算装置可以依次判断所述目标短句集合中的每个短句中情感词与程度词的出现顺序;之后,根据每个短句的情感词与程度词的出现顺序进行计算,具体如下:
1、当目标短句集合中每个短句的情感词均先于程度词出现时,通过如下公式计算情感得分综合值:
Figure BDA0001812591010000101
其中,n为目标短句集合中的句子条数,i为遍历目标短句集合中的每个句子,sum_wi为情感综合得分,r为目标短句集合中每个短句中情感词的个数,j为遍历目标短句集合中的第i个短句中的每个情感词,1<i<n,0≤j<m。
2、当目标短句集合中每个短句的程度词均先于情感词出现时,通过如下公式计算情感得分综合值:
Figure BDA0001812591010000102
其中,sum_wi为情感综合得分,n为目标短句集合中的句子条数,i为遍历目标短句集合中的每个句子,m为目标短句集合中每个句子的程度词个数,p为目标短句集合中每个句子的程度词位置序列,q为目标短句集合中每个句子的程度词与情感词的位置序列。
3、当目标短句集合中包括情感词先于程度词出现的第一短句子集合以及程度词先于情感词出现的第二短句子集合时,通过如下公式计算情感得分综合值:
Figure BDA0001812591010000103
其中,sum_wi为情感综合得分,i为遍历目标短句集合中的每个句子,n为目标短句集合中的句子条数,r为第一短句子集合中的每个短句中情感词的个数,m为第二短句子集合中每个句子的程度词个数,p为第二短句子集合中每个句子的程度词位置序列,q为第二短句子集合中每个句子的程度词与情感词的位置序列。
需要说明的是,对于目标短句集合中的“程度词-情感词”句式,计算情感得分时,程度词向后遍历2个词,若遍历到的第2个词也为程度词,则停止遍历;在计算时可设定程度词向后遍历k个词,k值根据实际效果调整。
107、根据情感得分综合值确定目标功能的情感得分。
本实施例中,在得到目标功能的情感得分综合值之后,可以根据该情感得分综合值确定目标功能的情感得分,具体的,
通过如下公式计算所述目标功能的情感得分:
vo=average(sun_wi);
其中,vo为目标功能的情感得分,sun_wi为目标短句集合的情感得分综合值。
也就是说,情感得分的计算装置可以在得到情感得分综合值之后,用该情感得分综合值除以目标短句集合中的句子数量,即可以得到每个句子的平均值,即为目标功能的情感得分。
可以理解的是,若情感得分大于0,则判定用户对该功能的情感偏正面;若情感得分等于0,则判定用户对该功能的情感偏中立;若情感得分小于0,则判定用户对该功能的情感偏负面,若偏负面程度较低(情感值较低)。
综上所述,可以看出,本申请实施例提供的技术方案中,可以通过用户反馈文本计算出直播平台中某个功能的情感得分,该情感得分指示用户对该某个功能的喜好程度,解决了人工收集用户对功能反馈的收集归纳,实现自动化识别功能问题并给出每个功能的情感偏向得分,有助于产品优化判断。
上面对本发明实施例中情感得分的计算方法进行了描述,下面对本发明实施例中的情感得分的计算装置进行描述。
请参阅图2,本发明实施例中情感得分的计算装置的一个实施例,该情感得分的计算装置应用于直播平台,包括:
获取单元201,用于获取所述直播平台的用户反馈文本;
分词单元202,用于按照预设规则对所述用户反馈文本进行分词,得到分词集合;
第一确定单元203,用于根据所述分词词集合确定功能词集合,所述功能词集合与所述分词集合具有关联关系;
匹配单元204,用于将所述功能词集合中的每个功能词与所述直播平台对应的词库集合中的功能词库进行匹配,以确定功能句子集合;
第二确定单元205,用于根据所述功能句子集合确定目标短句集合,所述目标短句集合指示所述直播平台中的目标功能以及所述目标功能对应的问题;
第三确定单元206,用于确定所述目标短句集合的情感得分综合值;
第四确定单元207,用于根据所述情感得分综合值确定所述目标功能的情感得分,所述目标功能的情感得分指示所述功能句子集合对应的用户对所述目标功能的喜好程度。
可选地,所述装置还包括:
创建单元208,用于创建所述直播平台对应的词库集合,所述词库集合包括日常系统词库、直播平台基础词库、停用词库、情感词库、程度词库、功能词库以及功能映射表。
可选地,所述分词单元202具体用于:
基于所述停用词库对所述用户反馈文本进行清洗,得到有效词集合;
根据无监督隐马尔科夫模型以及所述词库集合对所述有效词集合进行分词,以得到所述分词集合。
可选地,所述第三确定单元206具体用于:
依次判断所述目标短句集合中的每个短句中情感词与程度词的出现顺序;
当所述目标短句集合中每个短句的情感词均先于程度词出现时,通过如下公式计算所述情感得分综合值:
Figure BDA0001812591010000131
其中,n为所述目标短句集合中的句子条数,i为遍历所述目标短句集合中的每个句子,sum_wi为所述情感综合得分,r为所述目标短句集合中每个短句中情感词的个数,j为遍历所述目标短句集合中的第i个短句中的每个情感词,1<i<n,0≤j<m;
当所述目标短句集合中每个短句的程度词均先于情感词出现时,通过如下公式计算所述情感得分综合值:
Figure BDA0001812591010000132
其中,sum_wi为所述情感综合得分,n为所述目标短句集合中的句子条数,i为遍历所述目标短句集合中的每个句子,m为所述目标短句集合中每个句子的程度词个数,p为所述目标短句集合中每个句子的程度词位置序列,q为所述目标短句集合中每个句子的程度词与情感词的位置序列;
当所述目标短句集合中包括情感词先于程度词出现的第一短句子集合以及程度词先于情感词出现的第二短句子集合时,通过如下公式计算所述情感得分综合值:
Figure BDA0001812591010000133
其中,sum_wi为所述情感综合得分,i为遍历所述目标短句集合中的每个句子,n为所述目标短句集合中的句子条数,r为所述第一短句子集合中的每个短句中情感词的个数,m为所述第二短句子集合中每个句子的程度词个数,p为所述第二短句子集合中每个句子的程度词位置序列,q为所述第二短句子集合中每个句子的程度词与情感词的位置序列。
可选地,所述第四确定单元207具体用于:
通过如下公式计算所述目标功能的情感得分:
vo=average(sun_wi);
其中,vo为所述目标功能的情感得分,所述sun_wi为所述目标短句集合的情感得分综合值。
上面图2从模块化功能实体的角度对本发明实施例中的情感得分的计算装置进行了描述,下面从硬件处理的角度对本发明实施例中的情感得分的计算装置进行详细描述,请参阅图3,本发明实施例中的情感得分的计算装置300一个实施例,包括:
输入装置301、输出装置302、处理器303和存储器304(其中处理器303的数量可以一个或多个,图3中以一个处理器303为例)。在本发明的一些实施例中,输入装置301、输出装置302、处理器303和存储器304可通过总线或其它方式连接,其中,图3中以通过总线连接为例。
其中,通过调用存储器304存储的操作指令,处理器303,用于执行如下步骤:
获取所述直播平台的用户反馈文本;
按照预设规则对所述用户反馈文本进行分词,得到分词集合;
根据所述分词词集合确定功能词集合,所述功能词集合与所述分词集合具有关联关系;
将所述功能词集合中的每个功能词与所述直播平台对应的词库集合中的功能词库进行匹配,以确定功能句子集合;
根据所述功能句子集合确定目标短句集合,所述目标短句集合指示所述直播平台中的目标功能以及所述目标功能对应的问题;
确定所述目标短句集合的情感得分综合值;
根据所述情感得分综合值确定所述目标功能的情感得分,所述目标功能的情感得分指示所述功能句子集合对应的用户对所述目标功能的喜好程度。
通过调用存储器304存储的操作指令,处理器303,还用于执行图1对应的实施例中的任一方式。
请参阅图4,图4为本发明实施例提供的电子设备的实施例示意图。
如图4所示,本发明实施例提供了一种电子设备,包括存储器410、处理器420及存储在存储器420上并可在处理器420上运行的计算机程序411,处理器420执行计算机程序411时实现以下步骤:
获取所述直播平台的用户反馈文本;
按照预设规则对所述用户反馈文本进行分词,得到分词集合;
根据所述分词词集合确定功能词集合,所述功能词集合与所述分词集合具有关联关系;
将所述功能词集合中的每个功能词与所述直播平台对应的词库集合中的功能词库进行匹配,以确定功能句子集合;
根据所述功能句子集合确定目标短句集合,所述目标短句集合指示所述直播平台中的目标功能以及所述目标功能对应的问题;
确定所述目标短句集合的情感得分综合值;
根据所述情感得分综合值确定所述目标功能的情感得分,所述目标功能的情感得分指示所述功能句子集合对应的用户对所述目标功能的喜好程度。
在具体实施过程中,处理器420执行计算机程序411时,可以实现图1对应的实施例中任一实施方式。
由于本实施例所介绍的电子设备为实施本发明实施例中一种情感得分的计算装置所采用的设备,故而基于本发明实施例中所介绍的方法,本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式,所以在此对于该电子设备如何实现本发明实施例中的方法不再详细介绍,只要本领域所属技术人员实施本发明实施例中的方法所采用的设备,都属于本发明所欲保护的范围。
请参阅图5,图5为本发明实施例提供的一种计算机可读存储介质的实施例示意图。
如图5所示,本实施例提供了一种计算机可读存储介质500,其上存储有计算机程序511,该计算机程序511被处理器执行时实现如下步骤:
获取所述直播平台的用户反馈文本;
按照预设规则对所述用户反馈文本进行分词,得到分词集合;
根据所述分词词集合确定功能词集合,所述功能词集合与所述分词集合具有关联关系;
将所述功能词集合中的每个功能词与所述直播平台对应的词库集合中的功能词库进行匹配,以确定功能句子集合;
根据所述功能句子集合确定目标短句集合,所述目标短句集合指示所述直播平台中的目标功能以及所述目标功能对应的问题;
确定所述目标短句集合的情感得分综合值;
根据所述情感得分综合值确定所述目标功能的情感得分,所述目标功能的情感得分指示所述功能句子集合对应的用户对所述目标功能的喜好程度。
在具体实施过程中,该计算机程序511被处理器执行时可以实现图1对应的实施例中任一实施方式。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机软件指令,当计算机软件指令在处理设备上运行时,使得处理设备执行如图1对应实施例中的风电场数字化平台设计的方法中的流程。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修该,或者对其中部分技术特征进行等同替换;而这些修该或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种情感得分的计算方法,应用于直播平台,其特征在于,包括:
获取所述直播平台的用户反馈文本;
按照预设规则对所述用户反馈文本进行分词,得到分词集合;
根据所述分词集合确定功能词集合,所述功能词集合与所述分词集合具有关联关系;
将所述功能词集合中的每个功能词与所述直播平台对应的词库集合中的功能词库进行匹配,以确定功能句子集合;
根据所述功能句子集合确定目标短句集合,所述目标短句集合指示所述直播平台中的目标功能以及所述目标功能对应的问题;
确定所述目标短句集合的情感得分综合值;
根据所述情感得分综合值确定所述目标功能的情感得分,所述目标功能的情感得分指示所述功能句子集合对应的用户对所述目标功能的喜好程度。
2.根据权利要求1所述的方法,其特征在于,所述获取所述直播平台的用户反馈文本之前,所述方法还包括:
创建所述直播平台对应的词库集合,所述词库集合包括日常系统词库、直播平台基础词库、停用词库、情感词库、程度词库、功能词库以及功能映射表。
3.根据权利要求2所述的方法,其特征在于,所述按照预设规则对所述用户反馈文本进行分词,得到分词集合包括:
基于所述停用词库对所述用户反馈文本进行清洗,得到有效词集合;
根据无监督隐马尔科夫模型以及所述词库集合对所述有效词集合进行分词,以得到所述分词集合。
4.根据权利要求1所述的方法,其特征在于,所述确定所述目标短句集合的情感得分综合值包括:
依次判断所述目标短句集合中的每个短句中情感词与程度词的出现顺序;
当所述目标短句集合中每个短句的情感词均先于程度词出现时,通过如下公式计算所述情感得分综合值:
Figure FDA0003824898920000021
其中,n为所述目标短句集合中的句子条数,i为遍历所述目标短句集合中的每个句子,sum_wi为所述情感得分综合值,r为所述目标短句集合中每个短句中情感词的个数,j为遍历所述目标短句集合中的第i个短句中的每个情感词,1<i<n,0≤j<m;
当所述目标短句集合中每个短句的程度词均先于情感词出现时,通过如下公式计算所述情感得分综合值:
Figure FDA0003824898920000022
其中,sum_wi为所述情感得分综合值,n为所述目标短句集合中的句子条数,i为遍历所述目标短句集合中的每个句子,m为所述目标短句集合中每个句子的程度词个数,p为所述目标短句集合中每个句子的程度词位置序列,q为所述目标短句集合中每个句子的程度词与情感词的位置序列;
当所述目标短句集合中包括情感词先于程度词出现的第一短句子集合以及程度词先于情感词出现的第二短句子集合时,通过如下公式计算所述情感得分综合值:
Figure FDA0003824898920000023
其中,sum_wi为所述情感得分综合值,i为遍历所述目标短句集合中的每个句子,n为所述目标短句集合中的句子条数,r为所述第一短句子集合中的每个短句中情感词的个数,m为所述第二短句子集合中每个句子的程度词个数,p为所述第二短句子集合中每个句子的程度词位置序列,q为所述第二短句子集合中每个句子的程度词与情感词的位置序列。
5.根据权利要求1所述的方法,其特征在于,所述根据所述情感得分综合值确定所述目标功能的情感得分包括:
通过如下公式计算所述目标功能的情感得分:
vo=average(sun_wi);
其中,vo为所述目标功能的情感得分,所述sun_wi为所述目标短句集合的情感得分综合值。
6.一种情感得分的计算装置,应用于直播平台,其特征在于,包括:
获取单元,用于获取所述直播平台的用户反馈文本;
分词单元,用于按照预设规则对所述用户反馈文本进行分词,得到分词集合;
第一确定单元,用于根据所述分词集合确定功能词集合,所述功能词集合与所述分词集合具有关联关系;
匹配单元,用于将所述功能词集合中的每个功能词与所述直播平台对应的词库集合中的功能词库进行匹配,以确定功能句子集合;
第二确定单元,用于根据所述功能句子集合确定目标短句集合,所述目标短句集合指示所述直播平台中的目标功能以及所述目标功能对应的问题;
第三确定单元,用于确定所述目标短句集合的情感得分综合值;
第四确定单元,用于根据所述情感得分综合值确定所述目标功能的情感得分,所述目标功能的情感得分指示所述功能句子集合对应的用户对所述目标功能的喜好程度。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
创建单元,用于创建所述直播平台对应的词库集合,所述词库集合包括日常系统词库、直播平台基础词库、停用词库、情感词库、程度词库、功能词库以及功能映射表。
8.根据权利要求6所述的装置,其特征在于,所述第三确定单元具体用于:
依次判断所述目标短句集合中的每个短句中情感词与程度词的出现顺序;
当所述目标短句集合中每个短句的情感词均先于程度词出现时,通过如下公式计算所述情感得分综合值:
Figure FDA0003824898920000041
其中,n为所述目标短句集合中的句子条数,i为遍历所述目标短句集合中的每个句子,sum_wi为所述情感得分综合值,r为所述目标短句集合中每个短句中情感词的个数,j为遍历所述目标短句集合中的第i个短句中的每个情感词,1<i<n,0≤j<m;
当所述目标短句集合中每个短句的程度词均先于情感词出现时,通过如下公式计算所述情感得分综合值:
Figure FDA0003824898920000042
其中,sum_wi为所述情感得分综合值,n为所述目标短句集合中的句子条数,i为遍历所述目标短句集合中的每个句子,m为所述目标短句集合中每个句子的程度词个数,p为所述目标短句集合中每个句子的程度词位置序列,q为所述目标短句集合中每个句子的程度词与情感词的位置序列;
当所述目标短句集合中包括情感词先于程度词出现的第一短句子集合以及程度词先于情感词出现的第二短句子集合时,通过如下公式计算所述情感得分综合值:
Figure FDA0003824898920000043
其中,sum_wi为所述情感得分综合值,i为遍历所述目标短句集合中的每个句子,n为所述目标短句集合中的句子条数,r为所述第一短句子集合中的每个短句中情感词的个数,m为所述第二短句子集合中每个句子的程度词个数,p为所述第二短句子集合中每个句子的程度词位置序列,q为所述第二短句子集合中每个句子的程度词与情感词的位置序列。
9.一种电子设备,包括存储器、处理器,其特征在于,所述处理器用于执行存储器中存储的计算机管理类程序时实现如权利要求1至5中任意一项所述的情感得分的计算方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机管理类程序,其特征在于:所述计算机管理类程序被处理器执行时实现如权利要求1至5中任意一项所述的情感得分的计算方法的步骤。
CN201811126651.XA 2018-09-26 2018-09-26 一种情感得分的计算方法以及相关设备 Active CN109299463B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811126651.XA CN109299463B (zh) 2018-09-26 2018-09-26 一种情感得分的计算方法以及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811126651.XA CN109299463B (zh) 2018-09-26 2018-09-26 一种情感得分的计算方法以及相关设备

Publications (2)

Publication Number Publication Date
CN109299463A CN109299463A (zh) 2019-02-01
CN109299463B true CN109299463B (zh) 2022-12-02

Family

ID=65164565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811126651.XA Active CN109299463B (zh) 2018-09-26 2018-09-26 一种情感得分的计算方法以及相关设备

Country Status (1)

Country Link
CN (1) CN109299463B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109862397B (zh) * 2019-02-02 2021-11-09 广州虎牙信息科技有限公司 一种视频分析方法、装置、设备和存储介质
CN110634017A (zh) * 2019-08-23 2019-12-31 深圳市新系区块链技术有限公司 信息分类方法、装置及设备
CN112101033B (zh) * 2020-09-01 2021-06-15 广州威尔森信息科技有限公司 一种汽车口碑的情感分析方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130018892A1 (en) * 2011-07-12 2013-01-17 Castellanos Maria G Visually Representing How a Sentiment Score is Computed
US20150286627A1 (en) * 2014-04-03 2015-10-08 Adobe Systems Incorporated Contextual sentiment text analysis
CN104331451B (zh) * 2014-10-30 2017-12-26 南京大学 一种基于主题的网络用户评论的推荐度评分方法
WO2016122532A1 (en) * 2015-01-29 2016-08-04 Hewlett Packard Enterprise Development Lp Net promoter score determination
CN108021548A (zh) * 2016-10-28 2018-05-11 北京国双科技有限公司 一种情感特征的识别方法及装置
CN108241682B (zh) * 2016-12-26 2021-03-30 北京国双科技有限公司 确定文本情感的方法及装置

Also Published As

Publication number Publication date
CN109299463A (zh) 2019-02-01

Similar Documents

Publication Publication Date Title
CN105786991B (zh) 结合用户情感表达方式的中文情感新词识别方法和系统
CN107977363B (zh) 标题生成方法、装置和电子设备
CN105955965A (zh) 问句信息处理方法及装置
CN108268668B (zh) 一种基于话题多样性的文本数据观点摘要挖掘方法
KR101508260B1 (ko) 문서 특징을 반영하는 요약문 생성 장치 및 방법
CN108062304A (zh) 一种基于机器学习的商品评论数据的情感分析方法
CN109299463B (zh) 一种情感得分的计算方法以及相关设备
CN108875040A (zh) 词典更新方法及计算机可读存储介质
CN110472043B (zh) 一种针对评论文本的聚类方法及装置
CN111126060B (zh) 一种主题词的提取方法、装置、设备及存储介质
CN112395395B (zh) 文本关键词提取方法、装置、设备及存储介质
CN102682120B (zh) 一种网络评论精华文本的获取方法和装置
CN110210028A (zh) 针对语音转译文本的领域特征词提取方法、装置、设备及介质
CN109271524B (zh) 知识库问答系统中的实体链接方法
CN102929861A (zh) 一种文本情感指数计算方法和系统
CN108073571B (zh) 一种多语言文本质量评估方法及系统、智能文本处理系统
CN113254593B (zh) 文本摘要生成方法、装置、计算机设备及存储介质
CN109829151B (zh) 一种基于分层狄利克雷模型的文本分割方法
CN108845982A (zh) 一种基于词的关联特征的中文分词方法
CN109117475B (zh) 一种文本改写的方法以及相关设备
CN105956158B (zh) 基于海量微博文本和用户信息的网络新词自动提取的方法
CN110674301A (zh) 一种情感倾向预测方法、装置、系统及存储介质
CN111914554A (zh) 领域新词识别模型的训练方法、领域新词识别方法及设备
CN108255803B (zh) 文档情感的判断方法和装置
CN110245361B (zh) 短语对提取方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant