CN109558484A - 基于相似度词序矩阵的电力客服工单情感量化分析方法 - Google Patents

基于相似度词序矩阵的电力客服工单情感量化分析方法 Download PDF

Info

Publication number
CN109558484A
CN109558484A CN201811247199.2A CN201811247199A CN109558484A CN 109558484 A CN109558484 A CN 109558484A CN 201811247199 A CN201811247199 A CN 201811247199A CN 109558484 A CN109558484 A CN 109558484A
Authority
CN
China
Prior art keywords
word
emotion
work order
similarity
word2vec
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201811247199.2A
Other languages
English (en)
Inventor
景伟强
张爽
沈皓
罗欣
朱蕊倩
魏骁雄
陈博
麻吕斌
葛岳军
陈奕汝
钟震远
叶红豆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Huayun Information Technology Co Ltd
Original Assignee
Zhejiang Huayun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Huayun Information Technology Co Ltd filed Critical Zhejiang Huayun Information Technology Co Ltd
Priority to CN201811247199.2A priority Critical patent/CN109558484A/zh
Publication of CN109558484A publication Critical patent/CN109558484A/zh
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于相似度词序矩阵的电力客服工单情感量化分析方法,涉及一种电力客服工单分析方法。传统的情感分析方法不能有效甄别情感强度。本发明包括基于Word2Vec相似度情感词拓展联想步骤、多元情感语料库构建步骤、相似度词序矩阵情感量化算法步骤;对工单进行分类梳理、数据清洗,基于百度词库形成初始化多元情感词库,采用逆向最大匹配算法进行工单文本分词,基于Word2Vec神经网络构建融合客户诉求语义的积极词、消极词、否定词、程度副词、以及词序的词向量,通过机器学习训练生成融合诉求情感的学习模型,基于词性亲疏关系来拓展词性语料库,采用相似度词序矩阵量化算法进行情感量化计算,完成客服工单情感量化分析,有效区分情感强弱差异。

Description

基于相似度词序矩阵的电力客服工单情感量化分析方法
技术领域
本发明涉及一种电力客服工单分析方法,尤其涉及基于相似度词序矩阵的电力客服工单情感量化分析方法。
背景技术
随着社会经济的发展,电力体制改革的不断深化,供电企业只有坚持以客户为中心,提升客户满意度,才能取得市场化竞争优势。而95598作为客户交流与沟通的重要渠道窗口,通过对客服工单中隐含的客户特征、情感信息进行深度挖掘,实现量化客户诉求情感分析,有利于快速了解客户的关注焦点,有利于根据客户情感倾向性识别潜在的投诉客户,有利于支撑工单紧急度优先处理与分析,有利于根据反馈信息判别某项业务的实施效果,这些对电力企业和客户都将具有十分重要的意义。
传统方式下,针对工单诉求情感分析,需要设立多名诉求分析专职对客户诉求工单进行人工分析和处理,耗费大量人力成本。
情感分析主要是面向非结构化文本的自然语言处理,通过对文本中隐藏的情感信息进行分析,挖掘人对于事物或者事件所持有的观点和态度。目前,普遍情感分析侧重于情感极性分类,简单表示为情感是正向的还是负向的;而情感强度体现则需要量化情感手段实现。传统情感分析过程主要分为三部分:特征工程、特征选择和机器学习算法应用。它偏向于使用工程特征或者极性转移规则来提高准确率。而对文本的情感量化分析计算在国内外研究并不多,多数研究侧重于情感倾向性分类。
传统的情感分析方法基于词袋(bag-of-word)特征和词频统计,同时多数研究侧重于情感倾向性分类,这种方法存在以下三方面缺陷:(1)缺失词的上下文顺序和语义理解;(2)忽略词的语义间差异;(3)侧重于情感倾向性分类无法体现情感强弱差异。总之不能有效甄别情感强度。
发明内容
本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供基于相似度词序矩阵的电力客服工单情感量化分析方法,以达到有效甄别情感强度的目的。为此,本发明采取以下技术方案。
基于相似度词序矩阵的电力客服工单情感量化分析方法,包括基于Word2Vec相似度情感词拓展联想步骤、多元情感语料库构建步骤、相似度词序矩阵情感量化算法步骤;
Word2Vec相似度情感词拓展联想步骤:用于初始化多元分类词库,分类词库分为积极词、消极词、中性词、否定词、程度副词,通过Word2Vec相似度矩阵实现相近情感词拓展关联,同时这些词融合客户诉求语义的词性倾向和词序强弱关系;通过对工单诉求进行Word2Vec深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系;
多元情感语料库构建步骤:用于基于词向量空间距离亲疏关系,丰富拓展初始化情感分类词,构建融合客户诉求情感倾向的多元情感语料库;在对电力客服业务工单和不满意工单进行文本特征分词过程中,基于百度词库与电力专有词库,采用逆向最大匹配算法,形成初步语料库梳理,涉及积极词、消极词、中性词、否定词、程度副词五类词性分类;通过Word2Vec构建词向量,经过机器学习训练形成以初步情感语料库为中心的倾向性词空间距离关系,从而进一步提炼拓展多元词性语料库;
相似度词序矩阵情感量化算法步骤:用于根据情感语料库提炼成果,基于Word2Vec神经网络的构建词向量极性空间关系,计算单一工单诉求相似度情感量化得分;完成客服工单情感量化分析,确定紧急程度;
其中情感量化计算公式为:
(i=0,1,...,T-1)
AN-P=WordsNearest(Lnegative,Lpositive,10000)
AP-N=WordsNearest(Lpositive,Lnegative,10000)
式中:Smolecule表示所有词情感量化分子累计求和,T表示单一诉求所有词总量,SEQ表示单一工单诉求相似度情感量化得分,words[i]表示经过分词的工单诉求数组中第i个词,AN-P基于消极词到积极词关联最近词语有序集合,AP-N基于积极词到消极词关联最近词语有序集合,Ldegree表示程度副词集合,Lnay表示否定词集合,Lpositive表示积极词集合,Lnegative表示消极词集合,Lneutral表示中性词集合,表示第i词在AP-N有序集合中的排列位置,表示第i词在AN-P有序集合中的排列位置,WordsNearest则为Wotd2vec空间关联关系方法,δlow、δneutral、δinterval分别表示情感量化消极系数下限、情感量化中性系数下限、情感量化中性区间。
本技术方案基于Word2Vec神经网络对历史客户工单进行深度学习,通过学习模型中词向量空间距离表征相近语义和词的亲疏关系,同时通过Word2Vec建模后的同一极性亲疏关系来构建词序,通过词序来表示同一情感倾向的强弱关系。通过上述技术手段在情感量化计算中融合词的上下文顺序、语义理解和词间的情感强弱差异,根据历史工单诉求与语义相近理解、同一词性的两个词情感强弱差异来影响情感量化计算结果。
在无监督模式下丰富拓展有限的情感语料库,简化大量人力情感语料梳理工作,基于有限的情感语料库拓展丰富缺失的情感语料。基于有限的情感语料,融合电力业务专有词库,基于Word2Vec神经网络对历史工单深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系,即以有限情感语料库为中心的倾向性词空间亲疏关系,从而进一步提炼拓展多元词性语料库。
本技术方案能对各个工单诉求有效区分情感强弱差异,实现情感量化分析评价而非投诉倾向性分类,以决定业务处理的紧急程度。加入情感在线计算与分析介入,可以全方位地为客户考虑,理解客户情绪,通过对客户情感的预判,为在适当时机介入差异化情感安抚和疏导,减少客户在线咨询时间,提升客户满意度。
作为优选技术手段:δlow、δneutral、δinterval分别为0.2、0.5、0.1。
作为优选技术手段:电力客服工单情感量化分析方法包括基于Word2Vec相似度情感词拓展联想,用于初始化多元分类词库,分类词库分为积极词、消极词、中性词、否定词、程度副词,通过Word2Vec相似度矩阵实现相近情感词拓展关联,同时这些词融合客户诉求语义的词性倾向和词序强弱关系;通过对工单诉求进行Word2Vec深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系。
作为优选技术手段:电力客服工单情感量化分析方法包括多元情感语料库构建,用于基于词向量空间距离亲疏关系,丰富拓展初始化情感分类词,构建融合客户诉求情感倾向的多源情感语料库;在对电力客服业务工单和不满意工单进行文本特征分词过程中,基于百度词库与电力专有词库,采用逆向最大匹配算法,形成初步语料库梳理,涉及积极词、消极词、中性词、否定词、程度副词五类词性分类;通过Word2Vec构建词向量,经过机器学习训练形成以初步情感语料库为中心的倾向性词空间距离关系,从而进一步提炼拓展多元词性语料库。
作为优选技术手段:多元情感语料库构建包括以下步骤:
a)结合电力客服工单文本特征,对历史电力客服工单和不满意工单进行分类梳理、数据清洗,基于百度词库梳理形成词料;
b)初始化语料梳理,语料分为积极词、消极词、中性词、否定词、程度副词;
c)初始化语料词库;
d)输入一段时序的工单诉求信息;
e)通过Word2Vec神经网络工单分词深度学习,获得学习模型;
f)通过Word2Vec亲疏关联关系分离词性;
g)更新多元语料库。
作为优选技术手段:步骤e),包括以下子步骤:
e01)定义学习模型参数,参数包括正则参数、迭代次数、学习速率、最小词频、窗口大小;
e02)创建Word2Vec学习模型;
e03)输入一段时序的工单诉求信息;
e04)对诉求文本分词;
e05)判断是否小于学习迭代次数,若小于迭代次数,则进入步骤e06),若大于迭代次数,则进入步骤e08);
e06)实时同步记录学习进度,包括当前学习次数、学习时间间隔;
e07)Word2Vec网络随机梯度下降分组学习,包括偏向与权重学习更新;回至步骤e05);
e08)完成学习任务将学习模型回写数据库。
作为优选技术手段:在步骤e01)中,迭代次数为100;学习速率为0.001。
作为优选技术手段:在情感量化计算后,进行数据的归一化处理,通过归一化处理最终得到工单情感量化结果。
有益效果:
一、本技术方案以Word2Vec和相似度词序矩阵实现情感极性亲疏空间量化关系,打破传统的基于词袋特征和词频统计的情感分析方法,技术融合历史工单的上下文顺序、语义理解、语义间的差异等关键因素,实现情感倾向性分类到情感量化评价转变,支持在线实时情感运算分析,提升日常客户情感预判与风险预警能力;从客户情感角度实现对工单紧急程度划分,区分工单的紧急程度;从投诉风险角度实现工单每日情感异动预警,管控客户情感投诉风险;可以应用在日常电子坐席服务过程中,嵌入情感在线计算与分析,实时理解客户情绪,通过对客户情感的预判,在适当时机介入差异化情感安抚和疏导,减少客户在线咨询时间,提升客户满意度。
二、本技术方案可实现组件式封装,扩展性较好,适应性强,同时对模型训练过程进行统一监控,所有建模参数功能实现可以通过前台页面配置完成,减少开发人员压力,提升需求响应及时性;
三、基于Word2Vec和相似度词序矩阵的情感量化分析技术,融合电力客服专有词库和特有业务应用,可进行需求个性化定制,功能具有模型训练全过程可视化监控、情感计算线上实时运算、区域/业务情感差异分析的特点。
附图说明
图1是本发明的总流程图。
图2是本发明的客户诉求专有词向量空间距离关系图。
图3是本发明的多元情感语料库构建流程图。
图4是本发明的情感嵌入式智能在线电子座席处理流程图。
图5是本发明的服务申请欠费复电登记业务情感量化趋势图。
图6是本发明的情感量化分析机器学习训练过程监控功能图。
图7是本发明的工单情感量化分析功能图。
具体实施方式
以下结合说明书附图对本发明的技术方案做进一步的详细说明。
本发明包括基于Word2Vec相似度情感词拓展联想步骤、多元情感语料库构建步骤、相似度词序矩阵情感量化算法步骤;
Word2Vec相似度情感词拓展联想步骤:用于初始化多元分类词库,分类词库分为积极词、消极词、中性词、否定词、程度副词,通过Word2Vec相似度矩阵实现相近情感词拓展关联,同时这些词融合客户诉求语义的词性倾向和词序强弱关系;通过对工单诉求进行Word2Vec深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系;
多元情感语料库构建步骤:用于基于词向量空间距离亲疏关系,丰富拓展初始化情感分类词,构建融合客户诉求情感倾向的多元情感语料库;在对电力客服业务工单和不满意工单进行文本特征分词过程中,基于百度词库与电力专有词库,采用逆向最大匹配算法,形成初步语料库梳理,涉及积极词、消极词、中性词、否定词、程度副词五类词性分类;通过Word2Vec构建词向量,经过机器学习训练形成以初步情感语料库为中心的倾向性词空间距离关系,从而进一步提炼拓展多元词性语料库;
相似度词序矩阵情感量化算法步骤:用于根据情感语料库提炼成果,基于Word2Vec神经网络的构建词向量极性空间关系,计算单一工单诉求相似度情感量化得分;完成客服工单情感量化分析,确定紧急程度;
其中情感量化计算公式为:
(i=0,1,...,T-1)
AN-P=WordsNearest(Lnegative,Lpositive,10000)
AP-N=WordsNearest(Lpositive,Lnegative,10000)
式中:Smolecule表示所有词情感量化分子累计求和,T表示单一诉求所有词总量,SEQ表示单一工单诉求相似度情感量化得分,words[i]表示经过分词的工单诉求数组中第i个词,AN-P基于消极词到积极词关联最近词语有序集合,AP-N基于积极词到消极词关联最近词语有序集合,Ldegree表示程度副词集合,Lnay表示否定词集合,Lpositive表示积极词集合,Lnegative表示消极词集合,Lneutral表示中性词集合,表示第i词在AP-N有序集合中的排列位置,表示第i词在AN-P有序集合中的排列位置,WordsNearest则为Word2vec空间关联关系方法,δlow、δneutral、δinterval分别表示情感量化消极系数下限、情感量化中性系数下限、情感量化中性区间,默认设置分别0.2、0.5、0.1。
本技术方案基于Word2Vec深度学习技术实现,结合电力客服工单文本特征,对历史电力客服工单和不满意工单进行分类梳理、数据清洗,再基于百度词库梳理形成初始化多元情感词库,采用逆向最大匹配算法进行工单文本分词,基于Word2Vec神经网络构建融合客户诉求语义的积极词、消极词、否定词、程度副词、以及词序的词向量,通过历史客服工单进行机器学习训练生成融合诉求情感的学习模型,基于模型中的词性亲疏关系来拓展词性语料库,最后研发相似度词序矩阵量化算法完成客服工单情感量化分析;总体设计思路如图1所示:
其包括步骤:
一、工单分词聚类;将词分为积极词、消极词、中性词、否定词、程度副词;
二、多元语料库提炼;
三、深度学习建模;
四、模型学习训练;采用Word2Vec神经网络,动量系数为0.9,学习速率为0.1,激活函数Relu,随机梯度下降算法,100轮迭代学习;
五、情感量化计算,采用相似度矩阵情感量化算法,基于Word2Vec词向量相似度量化、情感倾向性量化计算、归一化处理。
本技术方案通过基于Word2Vec相似度情感词拓展联想、多元情感语料库构建、相似度词序矩阵情感量化算法实现三个关键环节完成的一种基于Word2Vec和相似度词序矩阵的电力客服工单情感量化分析方法,有效支撑工单紧急程度甄别与投诉情感风险分析。
1)基于Word2Vec相似度情感词拓展联想:该过程实现初始化多元分类词库(积极词、消极词、中性词、否定词、程度副词),通过Word2Vec相似度矩阵实现相近情感词拓展关联,同时这些词融合客户诉求语义的词性倾向和词序强弱关系。
Word2Vec是一个用于处理文本的双层神经网络。它的输入是文本语料,输出则是一组向量:该语料中词语的特征向量。Word2Vec实现在向量空间内将词的向量按相似性进行分组,以分布式的数值形式来表示词的上下文等特征。如给出足够的数据、用法和上下文,Word2Vec就能根据过去经验对词的意义进行高度准确的预测。这样的预测结果可以用于建立一个词与其他词之间的联系。Word2Vec衡量词的余弦相似性,无相似性表示为90度角,而相似度为1的完全相似则表示为0度角,即完全重合。
通过对近两年的工单诉求进行Word2Vec深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系,如图2所示。
2)多元情感语料库构建:该过程实现基于上述词向量空间距离亲疏关系,丰富拓展初始化情感分类词,构建融合客户诉求情感倾向的多元情感语料库。在对电力客服业务工单和不满意工单进行文本特征分词过程中,基于百度词库与电力专有词库,采用逆向最大匹配算法,形成初步语料库梳理,主要涉及积极词、消极词、中性词、否定词、程度副词五类词性分类。为了实现优化拓展丰富情感语料库,通过Word2Vec构建词向量,经过机器学习训练形成以初步情感语料库为中心的倾向性词空间距离关系,从而进一步提炼拓展多元词性语料库,词性语料库词典见表1所示,Word2Vec神经网络模型训练参数如表2所示,具体实现过程见图3所示。
表1多元情感语料库词典实例
表2 Word2Vec模型训练参数
为在情感量化计算中融合词的上下文顺序、语义理解和词间的情感强弱差异,即如何根据历史工单诉求与语义相近理解、同一词性的两个词情感强弱差异来影响情感量化计算结果。本技术方案基于Word2Vec神经网络对历史客户工单进行深度学习,通过学习模型中词向量空间距离表征相近语义和词的亲疏关系,如图2所示,同时通过Word2Vec建模后的同一极性亲疏关系来构建词序,通过词序来表示同一情感倾向的强弱关系。
为在无监督模式下丰富拓展有限的情感语料库,即如何简化大量人力情感语料梳理工作,基于有限的情感语料库拓展丰富缺失的情感语料。需要基于有限的情感语料,融合电力业务专有词库;本技术方案基于Word2Vec神经网络对历史工单深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系,即以有限情感语料库为中心的倾向性词空间亲疏关系,从而进一步提炼拓展多元词性语料库。
为实现对各个工单诉求有效区分情感强弱差异,即如何实现情感量化分析评价而非投诉倾向性分类。从客户情感诉求角度来说,情感强弱程度在一定程度上决定业务处理的紧急程度,情感极性越偏向消极则容易引发投诉,因此情感量化计算极为重要。本技术方案通过根据上述情感语料库提炼成果,基于Word2Vec神经网络的构建词向量极性空间关系,通过自主研发的相似度矩阵情感量化算法,实现各个诉求工单的客户感知情感量化计算,具体见上述相似度词序矩阵情感量化算法实现。
基于Word2Vec和相似度词序矩阵的电力客服工单情感量化分析除了有效支撑工单紧急程度甄别与投诉情感风险分析外,还可用于日常电子座席服务中,如图4所示,在各网省公司的日常电子座席服务中,加入情感在线计算与分析介入,可以全方位地为客户考虑,理解客户情绪,通过对客户情感的预判,为在适当时机介入差异化情感安抚和疏导,减少客户在线咨询时间,提升客户满意度。
本发明通过对工单受理内容进行分词,结合相似度矩阵情感量化算法,实现对逐一分词情感量化分解,具体实例如表1所示,通过归一化处理最终得到工单情感量化结果,同时各业务类型工单的情感量化得分差异明显,可以从客户情感角度实现对工单紧急程度划分,通过对工单客户诉求的情感分析,能够区分工单的紧急程度。同一业务情感得分越低,工单的紧急程度越高,理论上需要优先予以处理。
表3工单受理内容情感量化实例
如图5所示,从7日、14日线可以看出服务申请欠费复电登记业务客户情感4月份总体趋于平衡,其中图中表现突出的是4月25日快速下降,降幅为11.16%,通过针对性分析4月25日欠费复电登记工单,相比之前同类型工单发现,存在两张工单明确标注中/高潜在投诉倾向,同时在客户诉求意愿上表达进一步投诉倾向。因此,通过工单每日情感异动差异有利于构建基于客户情感的投诉风险预警与管控。
以上可知,本技术方案在实际应用中具有以下几点优点:一是以Word2Vec和相似度词序矩阵实现情感极性亲疏空间量化关系,打破传统的基于词袋特征和词频统计的情感分析方法,技术融合历史工单的上下文顺序、语义理解、语义间的差异等关键因素,实现情感倾向性分类到情感量化评价转变,支持在线实时情感运算分析,提升日常客户情感预判与风险预警能力;二是可以主流开源的DL4j深度学习技术突破口,所有功能实现组件式封装,扩展性较好,适应性强,同时对模型训练过程进行统一监控,所有建模参数功能实现可以通过前台页面配置完成,减少开发人员压力,提升需求响应及时性,其中模型训练监控页面如图6情感量化分析机器学习训练过程监控功能图;三是它作为基于Word2Vec和相似度词序矩阵的情感量化分析技术,融合电力客服专有词库和特有业务应用,并进行需求个性化定制,功能具有模型训练全过程可视化监控、情感计算线上实时运算、区域/业务情感差异分析等特点,具体功能界面见图7工单情感量化分析功能图;而这一关键技术在实际应用主要表现为以下三方面:(1)从客户情感角度实现对工单紧急程度划分,区分工单的紧急程度;(2)从投诉风险角度实现工单每日情感异动预警,管控客户情感投诉风险。(3)可以应用在日常电子坐席服务过程中,嵌入情感在线计算与分析,实时理解客户情绪,通过对客户情感的预判,在适当时机介入差异化情感安抚和疏导,减少客户在线咨询时间,提升客户满意度。
以上图1、2所示的基于相似度词序矩阵的电力客服工单情感量化分析方法是本发明的具体实施例,已经体现出本发明实质性特点和进步,可根据实际的使用需要,在本发明的启示下,对其进行形状、结构等方面的等同修改,均在本方案的保护范围之列。

Claims (6)

1.基于相似度词序矩阵的电力客服工单情感量化分析方法,其特征在于:包括基于Word2Vec相似度情感词拓展联想步骤、多元情感语料库构建步骤、相似度词序矩阵情感量化算法步骤;
Word2Vec相似度情感词拓展联想步骤:用于初始化多元分类词库,分类词库分为积极词、消极词、中性词、否定词、程度副词,通过Word2Vec相似度矩阵实现相近情感词拓展关联,同时这些词融合客户诉求语义的词性倾向和词序强弱关系;通过对工单诉求进行Word2Vec深度学习形成积极词、消极词、中性词、否定词、程度副词之间的空间关联关系;
多元情感语料库构建步骤:用于基于词向量空间距离亲疏关系,丰富拓展初始化情感分类词,构建融合客户诉求情感倾向的多元情感语料库;在对电力客服业务工单和不满意工单进行文本特征分词过程中,基于百度词库与电力专有词库,采用逆向最大匹配算法,形成初步语料库梳理,涉及积极词、消极词、中性词、否定词、程度副词五类词性分类;通过Word2Vec构建词向量,经过机器学习训练形成以初步情感语料库为中心的倾向性词空间距离关系,从而进一步提炼拓展多元词性语料库;
相似度词序矩阵情感量化算法步骤:用于根据情感语料库提炼成果,基于Word2Vec神经网络的构建词向量极性空间关系,计算单一工单诉求相似度情感量化得分;完成客服工单情感量化分析,确定紧急程度;
其中情感量化计算公式为:
AN-P=WordsNearest(Lnegative,Lpositive,10000)
AP-N=WordsNearest(Lpositive,Lnegative,10000)
式中:Smolecule表示所有词情感量化分子累计求和,T表示单一诉求所有词总量,SEQ表示单一工单诉求相似度情感量化得分,words[i]表示经过分词的工单诉求数组中第i个词,AN-P基于消极词到积极词关联最近词语有序集合,AP-N基于积极词到消极词关联最近词语有序集合,Ldegree表示程度副词集合,Lnay表示否定词集合,Lpositive表示积极词集合,Lnegative表示消极词集合,Lneutral表示中性词集合,表示第i词在AP-N有序集合中的排列位置,表示第i词在AN-P有序集合中的排列位置,WordsNearest则为Word2vec空间关联关系方法,δlow、δneutral、δinterval分别表示情感量化消极系数下限、情感量化中性系数下限、情感量化中性区间。
2.根据权利要求1所述的基于相似度词序矩阵的电力客服工单情感量化分析方法,其特征在于:δlow、δneutral、δinterval分别为0.2、0.5、0.1。
3.根据权利要求1所述的基于相似度词序矩阵的电力客服工单情感量化分析方法,其特征在于:多元情感语料库构建包括以下步骤:
a)结合电力客服工单文本特征,对历史电力客服工单和不满意工单进行分类梳理、数据清洗,基于百度词库梳理形成词料;
b)初始化语料梳理,语料分为积极词、消极词、中性词、否定词、程度副词;
c)初始化语料词库;
d)输入一段时序的工单诉求信息;
e)通过Word2Vec神经网络工单分词深度学习,获得学习模型;
f)通过Word2Vec亲疏关联关系分离词性;
g)更新多元语料库。
4.根据权利要求3所述的基于相似度词序矩阵的电力客服工单情感量化分析方法,其特征在于:步骤e),包括以下子步骤:
e01)定义学习模型参数,参数包括正则参数、迭代次数、学习速率、最小词频、窗口大小;
e02)创建Word2Vec学习模型;
e03)输入一段时序的工单诉求信息;
e04)对诉求文本分词;
e05)判断是否小于学习迭代次数,若小于迭代次数,则进入步骤e06),若大于迭代次数,则进入步骤e08);
e06)实时同步记录学习进度,包括当前学习次数、学习时间间隔;
e07)Word2Vec网络随机梯度下降分组学习,包括偏向与权重学习更新;回至步骤e05);
e08)完成学习任务将学习模型回写数据库。
5.根据权利要求4所述的基于相似度词序矩阵的电力客服工单情感量化分析方法,其特征在于:在步骤e01)中,迭代次数为100;学习速率为0.001。
6.根据权利要求1所述的基于相似度词序矩阵的电力客服工单情感量化分析方法,其特征在于:在情感量化计算后,进行数据的归一化处理,通过归一化处理最终得到工单情感量化结果。
CN201811247199.2A 2018-10-24 2018-10-24 基于相似度词序矩阵的电力客服工单情感量化分析方法 Withdrawn CN109558484A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811247199.2A CN109558484A (zh) 2018-10-24 2018-10-24 基于相似度词序矩阵的电力客服工单情感量化分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811247199.2A CN109558484A (zh) 2018-10-24 2018-10-24 基于相似度词序矩阵的电力客服工单情感量化分析方法

Publications (1)

Publication Number Publication Date
CN109558484A true CN109558484A (zh) 2019-04-02

Family

ID=65865115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811247199.2A Withdrawn CN109558484A (zh) 2018-10-24 2018-10-24 基于相似度词序矩阵的电力客服工单情感量化分析方法

Country Status (1)

Country Link
CN (1) CN109558484A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263154A (zh) * 2019-05-17 2019-09-20 广州艾媒数聚信息咨询股份有限公司 一种网络舆情情感态势量化方法、系统及存储介质
CN110444261A (zh) * 2019-07-11 2019-11-12 新华三大数据技术有限公司 序列标注网络训练方法、电子病历处理方法及相关装置
CN111080482A (zh) * 2019-12-16 2020-04-28 国家电网有限公司客户服务中心 一种用电客户情感指数的量化评估方法
CN111291932A (zh) * 2020-02-12 2020-06-16 徐佳慧 面向投融资关系网络链路预测的方法、装置和设备
CN112016321B (zh) * 2020-10-13 2021-02-05 上海一嗨成山汽车租赁南京有限公司 用于邮件处理的方法、电子设备和存储介质
CN115170153A (zh) * 2022-06-10 2022-10-11 天翼爱音乐文化科技有限公司 一种基于多维属性的工单处理方法、装置及存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263154A (zh) * 2019-05-17 2019-09-20 广州艾媒数聚信息咨询股份有限公司 一种网络舆情情感态势量化方法、系统及存储介质
CN110444261A (zh) * 2019-07-11 2019-11-12 新华三大数据技术有限公司 序列标注网络训练方法、电子病历处理方法及相关装置
CN110444261B (zh) * 2019-07-11 2023-02-03 新华三大数据技术有限公司 序列标注网络训练方法、电子病历处理方法及相关装置
CN111080482A (zh) * 2019-12-16 2020-04-28 国家电网有限公司客户服务中心 一种用电客户情感指数的量化评估方法
CN111291932A (zh) * 2020-02-12 2020-06-16 徐佳慧 面向投融资关系网络链路预测的方法、装置和设备
CN112016321B (zh) * 2020-10-13 2021-02-05 上海一嗨成山汽车租赁南京有限公司 用于邮件处理的方法、电子设备和存储介质
CN115170153A (zh) * 2022-06-10 2022-10-11 天翼爱音乐文化科技有限公司 一种基于多维属性的工单处理方法、装置及存储介质
CN115170153B (zh) * 2022-06-10 2023-04-21 天翼爱音乐文化科技有限公司 一种基于多维属性的工单处理方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN109670167A (zh) 一种基于Word2Vec的电力客服工单情感量化分析方法
CN109558484A (zh) 基于相似度词序矩阵的电力客服工单情感量化分析方法
Yu et al. LSTM-EFG for wind power forecasting based on sequential correlation features
CN107992982B (zh) 一种基于深度学习的非结构化数据的违约概率预测方法
CN110598005B (zh) 一种面向公共安全事件的多源异构数据知识图谱构建方法
CN111143576A (zh) 一种面向事件的动态知识图谱构建方法和装置
CN109344391A (zh) 基于神经网络的多特征融合中文新闻文本摘要生成方法
CN107066445B (zh) 一种属性情感词向量的深度学习方法
Tian et al. On-site text classification and knowledge mining for large-scale projects construction by integrated intelligent approach
CN109597891A (zh) 基于双向长短时记忆神经网络的文本情感分析方法
CN110968701A (zh) 用于图神经网络的关系图谱建立方法以及装置、设备
CN109543034A (zh) 基于知识图谱的文本聚类方法、装置及可读存储介质
CN109447244A (zh) 一种结合门控循环单元神经网络的广告推荐方法
CN111710428B (zh) 一种建模全局和局部上下文交互的生物医学文本表示方法
CN107808168B (zh) 一种基于强弱关系的社交网络用户行为预测方法
CN110111083A (zh) 一种基于深度学习构建职业规划的系统
CN109918649A (zh) 一种基于微博文本的自杀风险识别方法
Huang et al. Research on urban modern architectural art based on artificial intelligence and GIS image recognition system
CN110457472A (zh) 基于som聚类算法的针对电商产品评论的情感关联分析方法
CN115099450A (zh) 基于融合模型的家庭碳排放监测核算平台
Xie Innovative design of artificial intelligence in intangible cultural heritage
CN113868374B (zh) 基于多头注意力机制的图卷积网络生物医学信息提取方法
Liu Language database construction method based on big data and deep learning
CN110245292A (zh) 一种基于神经网络过滤噪声特征的自然语言关系抽取方法
CN110059316A (zh) 一种基于数据感知的动态科技资源语义分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20190402