CN108319666A - 一种基于多模态舆情分析的供电服务评估方法 - Google Patents

一种基于多模态舆情分析的供电服务评估方法 Download PDF

Info

Publication number
CN108319666A
CN108319666A CN201810055254.1A CN201810055254A CN108319666A CN 108319666 A CN108319666 A CN 108319666A CN 201810055254 A CN201810055254 A CN 201810055254A CN 108319666 A CN108319666 A CN 108319666A
Authority
CN
China
Prior art keywords
text
mfcc
value
information
electric service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810055254.1A
Other languages
English (en)
Other versions
CN108319666B (zh
Inventor
沈然
王正国
胡若云
涂莹
丁麒
吴慧
颜拥
吕诗宁
谷泓杰
朱斌
何韵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Zhejiang Electric Power Co Ltd
Marketing Service Center of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
State Grid Zhejiang Electric Power Co Ltd
Electric Power Research Institute of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Zhejiang Electric Power Co Ltd, Electric Power Research Institute of State Grid Zhejiang Electric Power Co Ltd filed Critical State Grid Zhejiang Electric Power Co Ltd
Priority to CN201810055254.1A priority Critical patent/CN108319666B/zh
Publication of CN108319666A publication Critical patent/CN108319666A/zh
Application granted granted Critical
Publication of CN108319666B publication Critical patent/CN108319666B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Hospice & Palliative Care (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Child & Adolescent Psychology (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Psychiatry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于多模态舆情分析的供电服务评估方法,涉及一种供电服务评估方法。目前,客户诉求内容以文本数据为主,其信息量大且非结构化。本发明包括以下步骤:基于增减分量法和长短时记忆网络的方法进行语音特征情感识别;基于word2vec与LSTM方式进行文本诉求分类。本技术方案将语音进行特征抽取并结合文本特征能有效地提高模型的情感识别的精度;将文本进行分词与特征抽取后,通过结合语音的特征信息,可以使模型更好地挖掘到文本诉求中有用的信息,使用带注意机制的深度循环神经网络在不同时刻注意不同的关键词,使模型更好地捕捉上下文之间的语义关系,挖掘目标文本中的时序信息以及语义信息,从而提高文本分类的准确率。

Description

一种基于多模态舆情分析的供电服务评估方法
技术领域
本发明涉及一种供电服务评估方法,尤其涉及一种基于多模态舆情分析的供电服务评估方法。
背景技术
供电服务是电力供应过程中,电力企业为了满足客户获得和使用电力产品的各种相关需求而做出的服务。在电力企业供电服务的质量要求随着电力体制改革的推进而不断提高的背景下,改良供电服务评估方法势在必行。而针对用户的反馈建立一种更加有效、准确的分析模型对于改良供电服务评估方法则是一个很好的切入点。因为用户提交的文本反馈与语音反馈是企业了解客户、挖掘客户诉求并据此改进服务的重要渠道。其中,相对于客户诉求的文本数据而言,语音数据包含有多维度的情感信息,如语速、声调和音量等。这些多维度的情感信息使得语音数据更能反映出用户的真实情感。而客户诉求内容以文本数据为主,其具有信息量大和非结构化的特点。
现有的语言情感分析与识别系统以及文本诉求挖掘系统基于传统的机器学习算法,非常依赖于人工提取的特征,因此存在特征提取的瓶颈。而基于全连接神经网络的方法也存在参数太多、无法利用数据中时间序列信息等问题。与深度神经网络相比,循环神经网络有序贯记忆性,这种能力的重要性在语言理解显得尤为突出,因为语言理解需要首先理解语境,而在理论上,深度循环神经网络可以记住很长窗口的信息。其次,深度循环神经网络可以端到端训练,不依赖于人工提取的特征,适合处理非结构化的客户诉求内容。特别地,基于注意力机制的神经网络成为了最近神经网络研究的一个热点。和传统深度循环神经网络相比,通过基于word2vec与LSTM的神经网络,模型可以在不同地时刻注意到不同的关键词,从而模型可以更好地捕捉上下文间的语义关系,挖掘客户诉求文本中的时序信息以及语义信息,提高最终诉求类别的准确率。
语音信号的特征表达是提取音频信号中具有辨识性成分,例如MFCC特征,然后送入情感识别模块完成情感的判断。然而MFCC特征并没有考虑同一帧梅尔(Mel)滤波结果相邻系数之间的关系以及同一帧梅尔(Mel)滤波结果同一系数相邻帧之间的关系,这样可能会丢失语谱图中较多有用的信息。并且MFCC特征参数在语音识别中对于中、高频信号的识别精度不高。因此采用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提取3个特征参数贡献最高的几阶倒谱分量组成新的特征参数提高语音情感识别率显得尤为重要。针对客户诉求的文本分类任务,通常采用决策树、KNN(K-NearestNeighbor)算法、支持向量机等,但决策树存在忽略数据集中属性之间的相关性及过度拟合等问题;KNN算法输出的可解释性不强;支持向量机对缺失数据敏感、对非线性问题没有通用的解决方案等。
发明内容
本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种基于多模态舆情分析的供电服务评估方法,以达到准确进行供电服务客户的语音情感分析与识别以及客户文本诉求的目的。为此,本发明采取以下技术方案。
一种基于多模态舆情分析的供电服务评估方法,包括以下步骤:
1)基于增减分量法和长短时记忆网络的方法进行语音特征情感识别,具体步骤包括:
11)对语音数据提取MFCC、IMFCC、Mid-MFCC语音特征;
12)采用增减分量法求出上述特征参数中倒谱分量对情感识别的贡献;将特征参数中对识别率贡献最高的几阶系数组合到一起,构成新的特征参数IMF-M-MFCC;
13)采用长短时记忆网络将输入的IMF-M-MFCC特征序列分类为相应的情感类别;将获得的IMF-M-MFCC特征序列进行输出,经过逐层传递,捕获整个序列中的语义信息,以及综合语音序列中上下文信息,最终将这些信息逐步保留并编码成针对语音情感的高层语义用于最终的语音情感识别;
2)基于word2vec与LSTM方式进行文本诉求分类,具体步骤包括:
21)对客户文本诉求数据进行预处理,包括:
211)处理文本编码格式问题,使用统一规范的编码,避免出现中英文乱码情况;
212)去除文本的无关信息,无关信息包括标点符号,网址和表情;对所有样本数据中的文本内容进行分词;
213)去除文本数据中的停用词,并将所有英文字母转换成小写;
22)基于文本语料库中的词频,选择出现频率最高的词或单词组合形成词典;对于高频次的单词进行抽样来减少训练样本的个数;
23)根据各词的词频建立哈夫曼树并生成节点所在的二进制码,该二进制码反映了对应节点在树中的位置;根据编码能够从根节点一步步找到对应的叶子节点;接着,初始化各非叶子节点的中间向量和叶子节点中的词向量;
24)训练中间向量和词向量,即回到语料库,逐句的读取一系列的词,用梯度下降算出梯度,再更新非叶子节点处向量的词与词向量的值;由于词典的大小导致网络将会拥有大规模的权重矩阵,因此训练过程中采用负采样,使训练样本仅更新一小部分权重,降低梯度下降过程中的计算量;
25)将得到的词向量作为后续LSTM网络的输入;LSTM处理短文本特征时对于由多个句子组成的客户诉求,先对文本进行分句,然后使用平均的情感值来表示该文本诉求的情感值;输入LSTM网络的则是句子中各个词汇对应的词向量;句子长度统一,不足的用零向量补齐;对于输入的词向量,用隐藏层状态hi作为其在网络中的中间表示;每一层的LSTM单元中,由遗忘门决定遗忘信息;输入门决定单元中需要更新的值,创建新的候选值,输入门、遗忘门与新的候选值一起产生新的状态;最终,由输出门决定输出的值,得到该隐藏层的状态;
26)将LSTM最后一层隐藏层状态为当前输入句的表示,经过一层softmax,得到该句的情感值;重复上述步骤,将各个分句的情感值累加,取平均值作为诉求文本的情感值。
对于同一个用户,客户的语音和文本内容可能同时存在,本技术方案的模型可以扩展成多模态的情感分析和诉求挖掘任务模型。具体而言,由于文本内容中同样存在客户的情感信息,将语音进行特征抽取并结合文本特征能有效地提高模型的情感识别的精度。另一方面,由于语音序列中同样存在客户的诉求信息,将文本进行分词与特征抽取后,通过结合语音的特征信息,可以使模型更好地挖掘到文本诉求中有用的信息;本技术方案使用带注意机制的深度循环神经网络在不同时刻注意不同的关键词,使模型更好地捕捉上下文之间的语义关系,挖掘目标文本中的时序信息以及语义信息,从而提高文本分类的准确率。
作为优选技术手段:在步骤11)中,MFCC特征抽取包括步骤:
111)对原始语音信号进行预加重、分帧和加窗预处理操作,得到短时信号x(n);
112)对短时信号x(n)进行傅立叶变换(DFT/FFT),得到线性频谱Xa(k);
113)对Xa(k)取模的平方,得到离散功率谱X(k);
114)对X(k)用Mel滤波器组进行滤波,在对输出求对数能量mi
115)对mi进行离散余弦变换(DCT)得到MFCC,此变换和简化为:
式中Cn表示的是MFCC的系数,L表示MFCC的阶数。
作为优选技术手段:在步骤12)中,采用增减分量法计算倒谱分量对情感识别的贡献的公式为:
其中,R(i)表示第i阶倒谱分量的平均贡献值,n为倒谱阶数,p(i,j)为从第i阶到第j阶倒谱系数特征的识别率。
作为优选技术手段:选取平均贡献最大的8阶MFCC倒谱分量、4阶Mid-MFCC倒谱分量和4阶IMFCC倒谱分量组成16阶混合特征。
作为优选技术手段:在步骤24)中,目标函数为:
L=logG=logΠw∈CΠu∈Context(w)g(u);
这里,∏u∈Context(w)g(u)表示对于一个给定样本(w,Context(w))希望最大化的量;g(u)定义为:
g(u)=ΠZ∈{u}∪NEG(u)p(z|w)
其中NEG(u)表示处理词u时生成的负样本子集;条件概率
作为优选技术手段:在步骤22)中,选择出现频率最高的前20000个词或单词组合形成词典。
作为优选技术手段:在步骤25)中,每一层的LSTM单元中,由遗忘门
ft=σ(Wf·[ht-1,xt]+bf)
决定遗忘信息;输入门决定单元中需要更新的值,同时一个激活函数用以创建新的候选值:
it=σ(Wi·[ht-1,xt]+bi)
输入门、遗忘门与新的候选值一起产生新的状态:
最终,由输出门决定输出的值,ht即为该隐藏层的状态:
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanh(Ct)。
有益效果:
本技术方案利用数据中时间序列信息,应对语音识别中对中、高频信号识别精度不高的问题,避免人工提取特征,提高模型的适用范围,考虑语义上下文以及大幅减少特征维度。
本发明所提出的方案能够获得一个针对供电服务客户的语音情感分析、识别,以及客户诉求的文本挖掘的基于多模态舆情分析的供电服务评估方法。模型可以分析语音数据中多维度的情感信息,如语速、声调和音量等。与文本数据相比,这些多维度的情感信息使得语音数据更能反映出用户的真实情感。而客户诉求内容以文本数据为主,其具有信息量大和非结构化的特点。
本发明的模型以端到端的方式训练,不依赖于人工提取的特征,适合处理非结构化的客户诉求内容。并且成功利用了数据中时间序列信息,对音频信号中的中、高频信号识别精度高,可以考虑语义上下文,大幅减少了特征维度。
附图说明
图1为本发明的流程图。
图2为本发明的基于增减分量法和长短时记忆网络的语音特征情感识别的流程图。
图3为本发明的深度循环神经网络的文本诉求分类的流程图。
图4为本发明的MFCC各阶分量在语音情感识别中的平均贡献图。
图5为本发明的循环神经网络RNN训练图。
图6为本发明的Google的word2vec示意图。
图7为本发明的LSTM的网络结构。
具体实施方式
以下结合说明书附图对本发明的技术方案做进一步的详细说明。
本发明包括以下步骤:
步骤1:基于增减分量法和长短时记忆网络的方法进行语音特征情感识别,流程如附图2所示,详细步骤如下:
步骤1.1:对语音数据提取MFCC、IMFCC、Mid-MFCC语音特征,其中MFCC特征抽取包括:
1)对原始语音信号进行预加重、分帧和加窗等预处理操作,得到短时信号x(n)
2)对短时信号x(n)进行傅立叶变换(DFT/FFT),得到线性频谱Xa(k)
3)对Xa(k)取模的平方,得到离散功率谱X(k)
4)对X(k)用Mel滤波器组进行滤波,在对输出求对数能量mi
5)对mi进行离散余弦变换(DCT)得到MFCC,此变换和简化为:
式中Cn表示的是MFCC的系数,L表示MFCC的阶数。而IMFCC特征的提取与MFCC的区别在于运用的滤波器组的结构不同,与MFCC相比在高频上获得了较高的分辨率。同理,Mid-MFCC特征抽取与其他的区别也是在于滤波器组的结构,其针对的则是中频上的高分辨率。
步骤1.2:采用增减分量法求出上述特征参数中倒谱分量对情感识别的贡献,具体公式为:
其中,R(i)表示第i阶倒谱分量的平均贡献值,n为倒谱阶数,p(i,j)为从第i阶到第j阶倒谱系数特征的识别率。并选取平均贡献最大的8阶MFCC倒谱分量、4阶Mid-MFCC倒谱分量和4阶IMFCC倒谱分量组成16阶混合特征,也就是说将特征参数中对识别率贡献最高的几阶系数组合到一起,构成新的特征参数IMF-M-MFCC,其中各阶分量的平均贡献如附图4所示;
步骤1.3:采用长短时记忆网络(LSTM,Long Short Term Memory)将输入的IMF-M-MFCC特征序列分类为相应的情感类别。将获得的IMF-M-MFCC特征序列进行输出,经过逐层传递,捕获整个序列中的语义信息,以及综合语音序列中上下文信息,最终将这些信息逐步保留并编码成针对语音情感的高层语义用于最终的语音情感识别;
步骤2:基于深度循环神经网络的文本诉求分类,流程图附图1右半部分,具体方法如下:
步骤2.1:对客户文本诉求数据进行预处理,包括:
1)处理文本编码格式问题,使用统一规范的编码,避免出现中英文乱码等情况;
2)对文本进行去除标点符号,网址和表情等无关信息,可采用正则表达式;对所有样本数据中的文本内容进行分词(Text segment);
3)去除文本数据中的停用词,并将所有英文字母转换成小写;
步骤2.2:基于文本语料库中的词频,选择出现频率最高的前20000个词或单词组合(wordpairs)形成词典;对于高频次的单词进行抽样来减少训练样本的个数;
步骤2.3:根据各词的词频建立哈夫曼树(Huffman Tree)并生成节点所在的二进制码,该二进制码反映了节点在树中的位置。根据编码能够从根节点一步步找到对应的叶子节点;接着,初始化各非叶子节点的中间向量和叶子节点中的词向量;
步骤2.4:训练中间向量和词向量,即回到语料库,逐句的读取一系列的词,用梯度下降算出梯度,再更新非叶子节点处向量的词与词向量的值;由于词典的大小导致网络将会拥有大规模的权重矩阵,因此训练过程中可采用负采样(negative sampling)使训练样本仅更新一小部分权重,降低梯度下降过程中的计算量;目标函数是:
G=Πw∈CΠu∈Context(w)g(u) (0.3)
这里,∏u∈Context(w)g(u)表示对于一个给定样本(w,Context(w))希望最大化的量;g(u)定义为:
g(u)=ΠZ∈{u}∪NEG(u)p(z|w) (0.4)
其中NEG(u)表示处理词u时生成的负样本子集;条件概率因此,最终的目标函数为:
L=logG=logΠw∈CΠu∈Context(w)g(u) (0.5)
附图6是Google的word2vec模型示意图,左侧是算法的第一个模型CBOW(Continuous Bag-of-Words Model)是在原始的NNLM模型中进行改造:1.移除前向反馈神经网络中非线性的hidden layer,直接将中间层的embedding layer与输出层的softmaxlayer连接;2.忽略上下文环境的序列信息:输入的所有词向量均汇总到同一个embeddinglayer;3.将future words纳入上下文环境;CBOW模型等价于一个词袋模型的向量乘以一个embedding矩阵,从而得到一个连续的embedding向量。附图6右侧所示的Skip-gram模型则与CBOW模型相反,CBOW模型是从context对target word的预测中学习到词向量的表达,而Skip-gram则是从target word对context的预测中学习到word vector,其本质是计算输入word的input vector与目标word的output vector之间的余弦相似度,并进行softmax归一化。
步骤2.5:前述步骤得到的词向量(word embedding)矩阵作为后续LSTM网络的输入;通常情况下LSTM处理短文本特征,对于由多个句子组成的客户诉求,可以先对文本进行分句,然后使用平均的情感值来表示该文本诉求的情感值;输入LSTM网络的则是句子中各个词汇对应的词向量;需要注意的是句子长度是统一的,不足的用零向量补齐;对于输入的词向量,用隐藏层状态hi作为其在网络中的中间表示;每一层的LSTM单元中,由遗忘门(forget gate)
ft=σ(Wf·[ht-1,xt]+bf) (0.6)
决定遗忘信息;输入门(input gate)决定单元中需要更新的值,同时一个激活函数用以创建新的后选值:
it=σ(Wi·[ht-1,xt]+bi) (0.7)
输入门、遗忘门与新的候选值一起产生新的状态:
最终,由输出门(output gate)决定输出的值,ht即为该隐藏层的状态:
ot=σ(Wo·[ht-1,xt]+bo) (0.10)
ht=ot*tanh(Ct) (0.11)
步骤2.6:将LSTM最后一层隐藏层状态hn作为当前输入句的表示,经过一层softmax,得到该句的情感值;重复上述步骤,将各个分句的情感值累加,取平均值作为诉求文本的情感值。LSTM结构如附图7所示。
以上图1-7所示的一种基于多模态舆情分析的供电服务评估方法是本发明的具体实施例,已经体现出本发明实质性特点和进步,可根据实际的使用需要,在本发明的启示下,对其进行形状、结构等方面的等同修改,均在本方案的保护范围之列。

Claims (7)

1.一种基于多模态舆情分析的供电服务评估方法,其特征在于包括以下步骤:
1)基于增减分量法和长短时记忆网络的方法进行语音特征情感识别,具体步骤包括:
11)对语音数据提取MFCC、IMFCC、Mid-MFCC语音特征;
12)采用增减分量法求出上述特征参数中倒谱分量对情感识别的贡献;将特征参数中对识别率贡献最高的几阶系数组合到一起,构成新的特征参数IMF-M-MFCC;
13)采用长短时记忆网络将输入的IMF-M-MFCC特征序列分类为相应的情感类别;将获得的IMF-M-MFCC特征序列进行输出,经过逐层传递,捕获整个序列中的语义信息,以及综合语音序列中上下文信息,最终将这些信息逐步保留并编码成针对语音情感的高层语义用于最终的语音情感识别;
2)基于word2vec与LSTM方式进行文本诉求分类,具体步骤包括:
21)对客户文本诉求数据进行预处理,包括:
211)处理文本编码格式问题,使用统一规范的编码,避免出现中英文乱码情况;
212)去除文本的无关信息,无关信息包括标点符号,网址和表情;对所有样本数据中的文本内容进行分词;
213)去除文本数据中的停用词,并将所有英文字母转换成小写;
22)基于文本语料库中的词频,选择出现频率最高的词或单词组合形成词典;对于高频次的单词进行抽样来减少训练样本的个数;
23)根据各词的词频建立哈夫曼树并生成节点所在的二进制码,该二进制码反映了对应节点在树中的位置;根据编码能够从根节点一步步找到对应的叶子节点;接着,初始化各非叶子节点的中间向量和叶子节点中的词向量;
24)训练中间向量和词向量,即回到语料库,逐句的读取一系列的词,用梯度下降算出梯度,再更新非叶子节点处向量的词与词向量的值;由于词典的大小导致网络将会拥有大规模的权重矩阵,因此训练过程中采用负采样,使训练样本仅更新一小部分权重,降低梯度下降过程中的计算量;
25)将得到的词向量作为后续LSTM网络的输入;LSTM处理短文本特征时对于由多个句子组成的客户诉求,先对文本进行分句,然后使用平均的情感值来表示该文本诉求的情感值;输入LSTM网络的则是句子中各个词汇对应的词向量;句子长度统一,不足的用零向量补齐;对于输入的词向量,用隐藏层状态hi作为其在网络中的中间表示;每一层的LSTM单元中,由遗忘门决定遗忘信息;输入门决定单元中需要更新的值,创建新的候选值,输入门、遗忘门与新的候选值一起产生新的状态;最终,由输出门决定输出的值,得到该隐藏层的状态;
26)将LSTM最后一层隐藏层状态为当前输入句的表示,经过一层softmax,得到该句的情感值;重复上述步骤,将各个分句的情感值累加,取平均值作为诉求文本的情感值。
2.根据权利要求1所述的一种基于多模态舆情分析的供电服务评估方法,其特征在于:在步骤11)中,MFCC特征抽取包括步骤:
111)对原始语音信号进行预加重、分帧和加窗预处理操作,得到短时信号x(n);
112)对短时信号x(n)进行傅立叶变换(DFT/FFT),得到线性频谱Xa(k);
113)对Xa(k)取模的平方,得到离散功率谱X(k);
114)对X(k)用Mel滤波器组进行滤波,在对输出求对数能量mi
115)对mi进行离散余弦变换(DCT)得到MFCC,此变换和简化为:
式中Cn表示的是MFCC的系数,L表示MFCC的阶数。
3.根据权利要求2所述的一种基于多模态舆情分析的供电服务评估方法,其特征在于:在步骤12)中,采用增减分量法计算倒谱分量对情感识别的贡献的公式为:
其中,R(i)表示第i阶倒谱分量的平均贡献值,n为倒谱阶数,p(i,j)为从第i阶到第j阶倒谱系数特征的识别率。
4.根据权利要求3所述的一种基于多模态舆情分析的供电服务评估方法,其特征在于:选取平均贡献最大的8阶MFCC倒谱分量、4阶Mid-MFCC倒谱分量和4阶IMFCC倒谱分量组成16阶混合特征。
5.根据权利要求1所述的一种基于多模态舆情分析的供电服务评估方法,其特征在于:在步骤24)中,目标函数为:
L=log G=logΠw∈CΠu∈Context(w)g(u);
其中∏u∈Context(w)g(u)表示对于一个给定样本(w,Context(w))希望最大化的量;g(u)定义为:
g(u)=ΠZ∈{u}∪NEG(u)p(z|w)
其中NEG(u)表示处理词u时生成的负样本子集;条件概率
6.根据权利要求1所述的一种基于多模态舆情分析的供电服务评估方法,其特征在于:在步骤22)中,选择出现频率最高的前20000个词或单词组合形成词典。
7.根据权利要求1所述的一种基于多模态舆情分析的供电服务评估方法,其特征在于:在步骤25)中,每一层的LSTM单元中,由遗忘门ft=σ(Wf·[ht-1,xt]+bf)
决定遗忘信息;输入门决定单元中需要更新的值,同时一个激活函数用以创建新的候选值:
it=σ(Wi·[ht-1,xt]+bi)
输入门、遗忘门与新的候选值一起产生新的状态:
最终,由输出门决定输出的值,ht即为该隐藏层的状态:
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanh(Ct)。
CN201810055254.1A 2018-01-19 2018-01-19 一种基于多模态舆情分析的供电服务评估方法 Active CN108319666B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810055254.1A CN108319666B (zh) 2018-01-19 2018-01-19 一种基于多模态舆情分析的供电服务评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810055254.1A CN108319666B (zh) 2018-01-19 2018-01-19 一种基于多模态舆情分析的供电服务评估方法

Publications (2)

Publication Number Publication Date
CN108319666A true CN108319666A (zh) 2018-07-24
CN108319666B CN108319666B (zh) 2021-09-28

Family

ID=62887754

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810055254.1A Active CN108319666B (zh) 2018-01-19 2018-01-19 一种基于多模态舆情分析的供电服务评估方法

Country Status (1)

Country Link
CN (1) CN108319666B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255025A (zh) * 2018-08-01 2019-01-22 华中科技大学鄂州工业技术研究院 一种短文本分类方法
CN109444841A (zh) * 2018-12-26 2019-03-08 清华大学 基于修正切换函数的平滑变结构滤波方法及系统
CN110097894A (zh) * 2019-05-21 2019-08-06 焦点科技股份有限公司 一种端到端的语音情感识别的方法和系统
CN110188263A (zh) * 2019-05-29 2019-08-30 国网山东省电力公司电力科学研究院 一种面向异构时距的科学研究热点预测方法及系统
CN110413779A (zh) * 2019-07-16 2019-11-05 深圳供电局有限公司 一种针对电力行业的词向量训练方法及其系统、介质
CN110909224A (zh) * 2019-11-22 2020-03-24 浙江大学 一种基于人工智能的敏感数据自动分类识别方法及系统
CN111210807A (zh) * 2020-02-21 2020-05-29 厦门快商通科技股份有限公司 语音识别模型训练方法、系统、移动终端及存储介质
CN111209392A (zh) * 2018-11-20 2020-05-29 百度在线网络技术(北京)有限公司 污染企业的挖掘方法、装置及设备
CN111222344A (zh) * 2020-01-03 2020-06-02 支付宝(杭州)信息技术有限公司 训练神经网络的方法、装置及电子设备
CN111311330A (zh) * 2020-02-25 2020-06-19 上海昌投网络科技有限公司 一种基于LightGBM和文本挖掘的社群精准营销方法及装置
CN111554304A (zh) * 2020-04-25 2020-08-18 中信银行股份有限公司 用户标签获取方法、装置及设备
CN111694949A (zh) * 2019-03-14 2020-09-22 京东数字科技控股有限公司 一种多文本分类方法和装置
CN111753549A (zh) * 2020-05-22 2020-10-09 江苏大学 一种基于注意力机制的多模态情感特征学习、识别方法
CN112131391A (zh) * 2020-11-25 2020-12-25 江苏电力信息技术有限公司 一种基于胶囊网络的供电服务客户诉求文本分类方法
CN112699944A (zh) * 2020-12-31 2021-04-23 中国银联股份有限公司 退单处理模型训练方法、处理方法、装置、设备及介质
CN112711618A (zh) * 2019-12-27 2021-04-27 山东鲁能软件技术有限公司 一种客户诉求情感分析方法及装置
CN113627179A (zh) * 2021-10-13 2021-11-09 广东机电职业技术学院 一种基于大数据的威胁情报预警文本分析方法及系统
CN116128546A (zh) * 2023-01-06 2023-05-16 河北科迪新能源科技有限公司 一种电力行业对外服务窗口的ai舆情监测系统和方法
CN117617921A (zh) * 2024-01-23 2024-03-01 吉林大学 基于物联网的智能血压监控系统及方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105469065A (zh) * 2015-12-07 2016-04-06 中国科学院自动化研究所 一种基于递归神经网络的离散情感识别方法
CN106294322A (zh) * 2016-08-04 2017-01-04 哈尔滨工业大学 一种基于lstm的汉语零指代消解方法
US20170025117A1 (en) * 2015-07-23 2017-01-26 Samsung Electronics Co., Ltd. Speech recognition apparatus and method
CN106372058A (zh) * 2016-08-29 2017-02-01 中译语通科技(北京)有限公司 一种基于深度学习的短文本情感要素抽取方法及装置
CN106599933A (zh) * 2016-12-26 2017-04-26 哈尔滨工业大学 一种基于联合深度学习模型的文本情感分类方法
CN106776581A (zh) * 2017-02-21 2017-05-31 浙江工商大学 基于深度学习的主观性文本情感分析方法
CN107093422A (zh) * 2017-01-10 2017-08-25 上海优同科技有限公司 一种语音识别方法和语音识别系统
CN107180077A (zh) * 2017-04-18 2017-09-19 北京交通大学 一种基于深度学习的社交网络谣言检测方法
US20170270100A1 (en) * 2016-03-18 2017-09-21 International Business Machines Corporation External Word Embedding Neural Network Language Models
CN107239439A (zh) * 2017-04-19 2017-10-10 同济大学 基于word2vec的舆情倾向性分析方法
CN107331384A (zh) * 2017-06-12 2017-11-07 平安科技(深圳)有限公司 语音识别方法、装置、计算机设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170025117A1 (en) * 2015-07-23 2017-01-26 Samsung Electronics Co., Ltd. Speech recognition apparatus and method
CN105469065A (zh) * 2015-12-07 2016-04-06 中国科学院自动化研究所 一种基于递归神经网络的离散情感识别方法
US20170270100A1 (en) * 2016-03-18 2017-09-21 International Business Machines Corporation External Word Embedding Neural Network Language Models
CN106294322A (zh) * 2016-08-04 2017-01-04 哈尔滨工业大学 一种基于lstm的汉语零指代消解方法
CN106372058A (zh) * 2016-08-29 2017-02-01 中译语通科技(北京)有限公司 一种基于深度学习的短文本情感要素抽取方法及装置
CN106599933A (zh) * 2016-12-26 2017-04-26 哈尔滨工业大学 一种基于联合深度学习模型的文本情感分类方法
CN107093422A (zh) * 2017-01-10 2017-08-25 上海优同科技有限公司 一种语音识别方法和语音识别系统
CN106776581A (zh) * 2017-02-21 2017-05-31 浙江工商大学 基于深度学习的主观性文本情感分析方法
CN107180077A (zh) * 2017-04-18 2017-09-19 北京交通大学 一种基于深度学习的社交网络谣言检测方法
CN107239439A (zh) * 2017-04-19 2017-10-10 同济大学 基于word2vec的舆情倾向性分析方法
CN107331384A (zh) * 2017-06-12 2017-11-07 平安科技(深圳)有限公司 语音识别方法、装置、计算机设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周萍等: "混合MFCC特征参数应用于语音情感识别", 《计算机测量与控制》 *

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255025A (zh) * 2018-08-01 2019-01-22 华中科技大学鄂州工业技术研究院 一种短文本分类方法
CN111209392B (zh) * 2018-11-20 2023-06-20 百度在线网络技术(北京)有限公司 污染企业的挖掘方法、装置及设备
CN111209392A (zh) * 2018-11-20 2020-05-29 百度在线网络技术(北京)有限公司 污染企业的挖掘方法、装置及设备
CN109444841A (zh) * 2018-12-26 2019-03-08 清华大学 基于修正切换函数的平滑变结构滤波方法及系统
CN109444841B (zh) * 2018-12-26 2020-08-04 清华大学 基于修正切换函数的平滑变结构滤波方法及系统
CN111694949A (zh) * 2019-03-14 2020-09-22 京东数字科技控股有限公司 一种多文本分类方法和装置
CN111694949B (zh) * 2019-03-14 2023-12-05 京东科技控股股份有限公司 一种多文本分类方法和装置
CN110097894A (zh) * 2019-05-21 2019-08-06 焦点科技股份有限公司 一种端到端的语音情感识别的方法和系统
CN110097894B (zh) * 2019-05-21 2021-06-11 焦点科技股份有限公司 一种端到端的语音情感识别的方法和系统
CN110188263A (zh) * 2019-05-29 2019-08-30 国网山东省电力公司电力科学研究院 一种面向异构时距的科学研究热点预测方法及系统
CN110413779A (zh) * 2019-07-16 2019-11-05 深圳供电局有限公司 一种针对电力行业的词向量训练方法及其系统、介质
CN110413779B (zh) * 2019-07-16 2022-05-03 深圳供电局有限公司 一种针对电力行业的词向量训练方法及其系统、介质
CN110909224B (zh) * 2019-11-22 2022-06-10 浙江大学 一种基于人工智能的敏感数据自动分类识别方法及系统
CN110909224A (zh) * 2019-11-22 2020-03-24 浙江大学 一种基于人工智能的敏感数据自动分类识别方法及系统
CN112711618A (zh) * 2019-12-27 2021-04-27 山东鲁能软件技术有限公司 一种客户诉求情感分析方法及装置
CN111222344B (zh) * 2020-01-03 2023-07-18 支付宝(杭州)信息技术有限公司 训练神经网络的方法、装置及电子设备
CN111222344A (zh) * 2020-01-03 2020-06-02 支付宝(杭州)信息技术有限公司 训练神经网络的方法、装置及电子设备
CN111210807A (zh) * 2020-02-21 2020-05-29 厦门快商通科技股份有限公司 语音识别模型训练方法、系统、移动终端及存储介质
CN111210807B (zh) * 2020-02-21 2023-03-31 厦门快商通科技股份有限公司 语音识别模型训练方法、系统、移动终端及存储介质
CN111311330A (zh) * 2020-02-25 2020-06-19 上海昌投网络科技有限公司 一种基于LightGBM和文本挖掘的社群精准营销方法及装置
CN111554304A (zh) * 2020-04-25 2020-08-18 中信银行股份有限公司 用户标签获取方法、装置及设备
CN111753549A (zh) * 2020-05-22 2020-10-09 江苏大学 一种基于注意力机制的多模态情感特征学习、识别方法
CN111753549B (zh) * 2020-05-22 2023-07-21 江苏大学 一种基于注意力机制的多模态情感特征学习、识别方法
CN112131391A (zh) * 2020-11-25 2020-12-25 江苏电力信息技术有限公司 一种基于胶囊网络的供电服务客户诉求文本分类方法
CN112699944A (zh) * 2020-12-31 2021-04-23 中国银联股份有限公司 退单处理模型训练方法、处理方法、装置、设备及介质
CN112699944B (zh) * 2020-12-31 2024-04-23 中国银联股份有限公司 退单处理模型训练方法、处理方法、装置、设备及介质
CN113627179B (zh) * 2021-10-13 2021-12-21 广东机电职业技术学院 一种基于大数据的威胁情报预警文本分析方法及系统
CN113627179A (zh) * 2021-10-13 2021-11-09 广东机电职业技术学院 一种基于大数据的威胁情报预警文本分析方法及系统
CN116128546A (zh) * 2023-01-06 2023-05-16 河北科迪新能源科技有限公司 一种电力行业对外服务窗口的ai舆情监测系统和方法
CN117617921A (zh) * 2024-01-23 2024-03-01 吉林大学 基于物联网的智能血压监控系统及方法
CN117617921B (zh) * 2024-01-23 2024-03-26 吉林大学 基于物联网的智能血压监控系统及方法

Also Published As

Publication number Publication date
CN108319666B (zh) 2021-09-28

Similar Documents

Publication Publication Date Title
CN108319666A (zh) 一种基于多模态舆情分析的供电服务评估方法
CN107203511B (zh) 一种基于神经网络概率消歧的网络文本命名实体识别方法
CN108984530B (zh) 一种网络敏感内容的检测方法及检测系统
CN106502985B (zh) 一种用于生成标题的神经网络建模方法及装置
JP6444530B2 (ja) 音声言語理解システム
CN109887484B (zh) 一种基于对偶学习的语音识别与语音合成方法及装置
CN107122479B (zh) 一种基于深度学习的用户密码猜测系统
CN106383816B (zh) 基于深度学习的中文少数民族地区地名的识别方法
CN111414461B (zh) 一种融合知识库与用户建模的智能问答方法及系统
CN109670041A (zh) 一种基于双通道文本卷积神经网络的带噪非法短文本识别方法
CN103514170B (zh) 一种语音识别的文本分类方法和装置
CN108388554B (zh) 基于协同过滤注意力机制的文本情感识别系统
CN113239186A (zh) 一种基于多依存关系表示机制的图卷积网络关系抽取方法
CN110727778A (zh) 一种面向税务的智能问答系统
CN106682089A (zh) 一种基于RNNs的短信自动安全审核的方法
Kadyan et al. A comparative study of deep neural network based Punjabi-ASR system
CN111046183A (zh) 用于文本分类的神经网络模型的构建方法和装置
CN112070139A (zh) 基于bert与改进lstm的文本分类方法
CN109918477A (zh) 一种基于变分自编码器的分布式检索资源库选择方法
CN110826298A (zh) 一种智能辅助定密系统中使用的语句编码方法
CN115064154A (zh) 混合语言语音识别模型的生成方法及装置
CN111460147A (zh) 一种基于语义增强的标题短文本分类方法
CN111159405B (zh) 基于背景知识的讽刺检测方法
CN113076744A (zh) 一种基于卷积神经网络的文物知识关系抽取方法
CN112818124A (zh) 一种基于注意力神经网络的实体关系抽取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210128

Address after: 311100 Building 5, 138 Yunlian Road, Yuhang District, Hangzhou City, Zhejiang Province

Applicant after: Marketing service center of State Grid Zhejiang Electric Power Co., Ltd

Applicant after: STATE GRID ZHEJIANG ELECTRIC POWER Co.,Ltd.

Address before: The eight district of Hangzhou city in Zhejiang province 310014 Huadian Zhaohui under No. 1 Lane

Applicant before: ELECTRIC POWER SCIENTIFIC RESEARCH INSTITUTE OF STATE GRID ZHEJIANG ELECTRIC POWER Co.,Ltd.

Applicant before: STATE GRID ZHEJIANG ELECTRIC POWER Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant