CN105427869A - 一种基于深度学习的会话情感自动分析方法 - Google Patents
一种基于深度学习的会话情感自动分析方法 Download PDFInfo
- Publication number
- CN105427869A CN105427869A CN201510731781.6A CN201510731781A CN105427869A CN 105427869 A CN105427869 A CN 105427869A CN 201510731781 A CN201510731781 A CN 201510731781A CN 105427869 A CN105427869 A CN 105427869A
- Authority
- CN
- China
- Prior art keywords
- text
- feature
- voice
- analysis method
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 title claims abstract description 16
- 230000014509 gene expression Effects 0.000 claims abstract description 23
- 238000004458 analytical method Methods 0.000 claims abstract description 16
- 230000004927 fusion Effects 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 8
- 230000002996 emotional effect Effects 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 238000007418 data mining Methods 0.000 abstract description 2
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 238000012546 transfer Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 210000004218 nerve net Anatomy 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Psychiatry (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Hospice & Palliative Care (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Child & Adolescent Psychology (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于深度学习的会话情感自动分析方法,属于自然语言处理、数据挖掘领域。本发明基于去噪自编码器学习语音和文本的表示,再通过深度学习方法将两种表示深度融合,得到高层的统一表示,基于融合后的高层表示再进行情感分析。利用本发明提供的技术方案,可以深度融合声学和文本两种特征,提高情感分类的准确率。
Description
技术领域
本发明属于自然语言处理、数据挖掘领域,具体涉及基于深度学习的语音会话中的情感分析方法。
背景技术
语音会话的情感分析是通过分析话语来判断会话人的情感状态,如高兴、满意、愤怒等。语音会话大量存在于实际领域,包括各种呼叫中心、人机交互系统等。会话情感自动分析有助于动态了解会话人的心理状态和情绪情感变化,有着广阔的应用前景。以呼叫中心为例,通过分析客服对话过程中会话人的情绪和情感变化,管理人员可以发现客户服务过程中服务员态度是否友好,客户是否有不满情绪,以尽早解决问题。
针对语音会话的情感分析,一般的做法是对一段话提取一系列声学特征,基于这些声学特征训练分类器。然而,只使用声学特征的问题在于无法考虑到话语的语义信息,而语义与情感是密切相关的。
近些年来,语言信息逐步受到重视。通常做法是使用自动语音识别(ASR)技术将语音转换为文本,然后从文本中提取一系列文本特征,再利用音学和文本二种特征进行会话的情感分析。基于声学和文本两种特征,目前主要有两种方法:一是先分别用两种特征训练两个独立的分类器,然后将两个独立分类器的结果再进行结合,得到最终结果。这种方法只对两种分类结果进行结合,忽视了特征之间的关联性。二是将两种特征直接合并,在合并的基础上再进行分类。然而,声学特征和文本特征的低层表示通常是非线性关系,这种直接合并难以捕获到两种特征之间的关联,而且合并后的维度可能非常大。本发明的主要目的是通过深度学习方法将声学特征和文本特征有机融合在一起,使彼此之间的关联通过一种新的表示形式统一表达出来,形成高层表示,作为分类器的输入,以此进行会话的情感分析。
发明内容
本发明提供一种语音会话中的情感分析方法,将语音会话中的声音特征与文本特征进行融合并得到高层的表示。
为了便于说明,首先引入如下几个概念:
情感分类:对会话人的情感状态进行分析,将话语划分到正确的情感类别中。根据实际需求的不同,可以定义不同的情感类别。
词向量:使用低维实数向量表示一个词的信息。与传统的稀疏表示相比,词向量没有维数灾难的问题。
自编码器(AE)[1]:只有一层隐藏节点,输入和输出通常具有相同节点数的神经网络,可以学习到输入的压缩表示。
去噪自编码器(DAE)[1]:随机地将自编码器的一些输入置零,迫使隐藏层单元发现更多鲁棒性好的特征。
多特征栈式去噪自编码器(MSDA):基于去噪自编码器,可以在多种不同特征甚至不同类型特征组合上进行学习,得到融合后的高层表示。
本发明的目的是提供一种新的方法,通过深度学习将语音会话中的声学特征和文本特征融合在一起,得到一种高层的表示,用于语音会话的情感分析。所得到的高层表示并不是简单的组合,更不是直接的拼接,而是通过深度学习进行非线性变换得到的。
本发明的原理是:首先使用ASR将语音识别文本,然后分别提取声学特征和文本特征,接下来使用MSDA将两种特征深度融合,得到高层表示,最后基于该表示,使用分类器进行情感分类。
本发明对应的流程图如图1所示,详细技术方案如下:
A.将一通对话根据说话人转变和声音停顿分割为若干段语音,执行如下操作:
A1.识别说话人转换点的候选
A2.通过聚类确定说话人转换点
A3.将时长超过某一阈值的停顿切分
B.使用ASR技术将语音转换为文本
C.提取声学特征,执行如下操作:
C1.提取一段语音中每一帧的特征
C2.基于多个统计量得到一段语音的全局特征
D.提取文本特征,执行如下操作:
D1.基于大规模语料训练,学习到每个词的向量表示
D2.基于词向量计算口语会话中每段文本的表示
E.形成两种特征的融合表示并进行情感分类,执行如下操作:
E1.分别学习声学特征和文本特征的表示
E2.通过深度学习,再将两种表示进行深度融合,得到高层表示
E3.基于融合的高层表示训练分类器,对每段语音分类
利用本发明提供的技术方案,可以充分利用声学和文本两种特征,通过深度学习得到融合的高层表示,提高情感分类的准确率。
附图说明
图1为本发明流程示意图;
图2为本发明基于深度学习的两种特征融合框架。
具体实施方式
下面通过一个实例对本发明作说明。需要注意的是,公布实施例的目的在于帮助进一步理解本发明。在不脱离本发明及所附的权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施本例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。
假定需要分析一通中文语音对话(如售后服务的语音对话),判断其中是否存在不友好(负面情感)的话语,如果有,则标记出来。
首先需要将对话按照会话双方说话人的切换来切分。对话切分主要包括两步:识别说话人转换点和无监督聚类。这里将语音中所有字的边界作为转换点的候选,然后通过聚类将同一人连续所说的字合并,从而确定说话人的转换点,再按转换点将会话进行切分。为避免处理会话一方过长的连续话语,还会将针对切分后,话语时长超过某一阈值的静音在静音处再作切分。
在切分之后,使用ASR引擎将每段语音转换为文本。本例使用的ASR引擎包含5个部分:特征提取、声学模型、语言模型、词典、解码器。特征为40维的对数filter-banks[2]。声学模型、语言模型和词典组合成一个加权有限状态传感器(weightedfinitestatetransducers,WFST)[3]。
根据切分的结果提取每段语音的声学特征。一段语音被划分为若干帧,每帧时长25毫秒。本例中对每帧提取26个声学特征(包括12个MFCC、8个LSP、3个F0、2个Intensity和1个MZCR)以及每个特征的一阶导数,共计52个特征。然后使用19个统计量(包括4个Regression、6个Percentile、3个Moment和6个Extreme)计算一段语音的全局特征,这样每段语音的声学特征可表示为一个988维的向量。
基于语音转换后的文本,提取每段话语的文本特征。为了提取文本特征,先需要基于大规模语料进行训练,学习到词向量。词向量的学习可以直接使用开源工具Word2Vec,大规模语料可以使用中文Gigaword、维基百科和搜狗新闻语料等,也可以使用其他大规模语料。词向量维度可以根据情况设置,例如设置为200维。对每段话语的文本s,首先进行分词,将每个词对应到预先训练得到的词向量上。文本s的特征则为,该段文本包含的词所对应的词向量的平均值,即
其中F(s)表示s的文本特征,EMB(wi)表示s中词wi的词向量,|s|表示s中词的个数。
最后,基于本发明提出的MSDA模型,学习将声音和文本两种特征融合的高层表示,进行情感分类。MSDA的结构如图2所示。MSDA的基本构成单元是DAE。声学特征和文本特征输入到MSDA后,各自通过DAE学习到相应的表示。这两种特征的表示合并(串接)后,继续通过深层学习,得到融合的高层表示,该表示作为分类器的输入最终得到情感类别。MSDA的训练过程包括两步:首先是无指导的预训练,使用无标注数据从下往上依次训练。然后使用有标注数据做有指导的微调。分类结果的计算可以使用深度神经网中常用的Softmax方法(也可以使用其他方法)。针对训练数据中不同的情感类别数量不平衡的问题,在损失函数中可以针对不同的类别设置不同的权重因子。预测时选择Softmax给出的最大概率类别作为预测的情感类别。
参考文献:
[1]P.Vincent,H.Larochelle,I.Lajoie,Y.Bengio,andP.A.Manzagol.2010.Stackeddenoisingautoencoders:Learningusefulrepresentationsinadeepnetworkwithalocaldenoisingcriterion.TheJournalofMachineLearningResearch,11,3371-3408.
[2]L.Deng,J.Li,J.T.Huang,K.Yao,D.Yu,F.Seide,M.L.Seltzer,G.Zweig,X.He,J.Williams,Y.Gong,andA.Acero.2013.RecentadvancesindeeplearningforspeechresearchatMicrosoft.ICASSP,pages8604-8608.
[3]C.Allauzen,M.Mohri,M.Riley,andB.Roark.2004.Ageneralizedconstructionofintegratedspeechrecognitiontransducers.ICASSP,volume1,pages761-764.
Claims (6)
1.一种会话情感自动分析方法,具体包括如下步骤:
A.将一通对话根据说话人转变和声音停顿分割为若干段语音;
B.使用ASR技术将语音转换为文本;
C.提取声学特征,执行如下操作:
C1.提取一段语音中每一帧的特征;
C2.基于多个统计量得到一段语音的全局特征;
D.提取文本特征,执行如下操作:
D1.基于大规模语料训练,学习到每个词的向量表示;
D2.基于词向量计算口语会话中每段文本的表示;
E.形成两种特征的融合表示并进行情感分类,执行如下操作:
E1.分别学习声学特征和文本特征的表示;
E2.通过深度学习,再将两种表示进行深度融合,得到高层表示;
E3.基于融合的高层表示训练分类器,对每段语音分类。
2.如权利要求1所述的会话情感自动分析方法,其特征在于,步骤A具体执行如下操作:
A1.识别说话人转换点的候选;
A2.通过聚类确定说话人转换点;
A3.将时长超过某一阈值的停顿切分。
3.如权利要求1所述的会话情感自动分析方法,其特征在于,步骤B中ASR引擎包含:特征提取、声学模型、语言模型、词典、解码器。
4.如权利要求1所述的会话情感自动分析方法,其特征在于,步骤D中文本特征为该段文本包含的词所对应的词向量的平均值,即
其中F(s)表示s的文本特征,EMB(wi)表示s中词wi的词向量,|s|表示s中词的个数。
5.如权利要求1所述的会话情感自动分析方法,其特征在于,步骤E中使用MSDA将两种特征深度融合,得到高层表示。
6.如权利要求5所述的会话情感自动分析方法,其特征在于,MSDA的过程包括:首先是无指导的预训练,使用无标注数据从下往上依次训练,然后使用有标注数据做有指导的微调。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510731781.6A CN105427869A (zh) | 2015-11-02 | 2015-11-02 | 一种基于深度学习的会话情感自动分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510731781.6A CN105427869A (zh) | 2015-11-02 | 2015-11-02 | 一种基于深度学习的会话情感自动分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105427869A true CN105427869A (zh) | 2016-03-23 |
Family
ID=55506023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510731781.6A Pending CN105427869A (zh) | 2015-11-02 | 2015-11-02 | 一种基于深度学习的会话情感自动分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105427869A (zh) |
Cited By (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105702251A (zh) * | 2016-04-20 | 2016-06-22 | 中国科学院自动化研究所 | 基于Top-k加强音频词袋模型的语音情感识别方法 |
CN106407177A (zh) * | 2016-08-26 | 2017-02-15 | 西南大学 | 基于聚类分析的突发事件在线群体行为检测方法 |
CN106448660A (zh) * | 2016-10-31 | 2017-02-22 | 闽江学院 | 一种引入大数据分析的自然语言模糊边界确定方法 |
CN106503805A (zh) * | 2016-11-14 | 2017-03-15 | 合肥工业大学 | 一种基于机器学习的双模态人人对话情感分析系统及其方法 |
CN106601228A (zh) * | 2016-12-09 | 2017-04-26 | 百度在线网络技术(北京)有限公司 | 基于人工智能韵律预测的样本标注方法及装置 |
CN106951558A (zh) * | 2017-03-31 | 2017-07-14 | 广东睿盟计算机科技有限公司 | 一种基于深度搜索的税务智能咨询平台的数据处理方法 |
CN107220311A (zh) * | 2017-05-12 | 2017-09-29 | 北京理工大学 | 一种利用局部嵌入话题建模的文本表示方法 |
CN107293309A (zh) * | 2017-05-19 | 2017-10-24 | 四川新网银行股份有限公司 | 一种基于客户情绪分析提升舆情监控效率的方法 |
CN107402914A (zh) * | 2016-05-20 | 2017-11-28 | 富士通株式会社 | 自然语言深度学习系统和方法 |
CN107452405A (zh) * | 2017-08-16 | 2017-12-08 | 北京易真学思教育科技有限公司 | 一种根据语音内容进行数据评价的方法及装置 |
CN107818795A (zh) * | 2017-11-15 | 2018-03-20 | 苏州驰声信息科技有限公司 | 一种英语口语的测评方法及装置 |
CN107886955A (zh) * | 2016-09-29 | 2018-04-06 | 百度在线网络技术(北京)有限公司 | 一种语音会话样本的身份识别方法、装置及设备 |
CN108039181A (zh) * | 2017-11-02 | 2018-05-15 | 北京捷通华声科技股份有限公司 | 一种声音信号的情感信息分析方法和装置 |
CN108062954A (zh) * | 2016-11-08 | 2018-05-22 | 科大讯飞股份有限公司 | 语音识别方法和装置 |
CN108090038A (zh) * | 2016-11-11 | 2018-05-29 | 科大讯飞股份有限公司 | 文本断句方法及系统 |
CN108255805A (zh) * | 2017-12-13 | 2018-07-06 | 讯飞智元信息科技有限公司 | 舆情分析方法及装置、存储介质、电子设备 |
CN108305642A (zh) * | 2017-06-30 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 情感信息的确定方法和装置 |
CN108305643A (zh) * | 2017-06-30 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 情感信息的确定方法和装置 |
CN108305641A (zh) * | 2017-06-30 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 情感信息的确定方法和装置 |
CN108536654A (zh) * | 2018-04-13 | 2018-09-14 | 科大讯飞股份有限公司 | 识别文本展示方法及装置 |
CN108563628A (zh) * | 2018-03-07 | 2018-09-21 | 中山大学 | 基于hred和内外记忆网络单元的情感对话生成方法 |
CN108831450A (zh) * | 2018-03-30 | 2018-11-16 | 杭州鸟瞰智能科技股份有限公司 | 一种基于用户情绪识别的虚拟机器人人机交互方法 |
CN108874896A (zh) * | 2018-05-22 | 2018-11-23 | 大连理工大学 | 一种基于神经网络和幽默特征的幽默识别方法 |
CN108985358A (zh) * | 2018-06-29 | 2018-12-11 | 北京百度网讯科技有限公司 | 情绪识别方法、装置、设备及存储介质 |
WO2019001458A1 (zh) * | 2017-06-30 | 2019-01-03 | 腾讯科技(深圳)有限公司 | 情感信息的确定方法和装置 |
CN109189919A (zh) * | 2018-07-27 | 2019-01-11 | 广州市香港科大霍英东研究院 | 文本多视角情感分类的方法、系统、终端及存储介质 |
CN109243490A (zh) * | 2018-10-11 | 2019-01-18 | 平安科技(深圳)有限公司 | 司机情绪识别方法及终端设备 |
CN109417504A (zh) * | 2017-04-07 | 2019-03-01 | 微软技术许可有限责任公司 | 自动聊天中的语音转发 |
CN109543187A (zh) * | 2018-11-23 | 2019-03-29 | 中山大学 | 电子病历特征的生成方法、装置及存储介质 |
CN109784414A (zh) * | 2019-01-24 | 2019-05-21 | 出门问问信息科技有限公司 | 一种电话客服中客户情绪检测方法、装置及电子设备 |
CN109949830A (zh) * | 2019-03-12 | 2019-06-28 | 中国联合网络通信集团有限公司 | 用户意图识别方法及设备 |
CN110134947A (zh) * | 2019-04-17 | 2019-08-16 | 中国科学院计算技术研究所 | 一种基于不平衡多源数据的情感分类方法及系统 |
US10388283B2 (en) | 2017-09-21 | 2019-08-20 | Tata Consultancy Services Limited | System and method for improving call-centre audio transcription |
CN110246509A (zh) * | 2019-06-15 | 2019-09-17 | 河南工业大学 | 一种用于语音测谎的栈式去噪自编码器及深度神经网络结构 |
CN110390956A (zh) * | 2019-08-15 | 2019-10-29 | 龙马智芯(珠海横琴)科技有限公司 | 情感识别网络模型、方法及电子设备 |
CN110959159A (zh) * | 2017-07-25 | 2020-04-03 | 谷歌有限责任公司 | 话语分类器 |
CN111199750A (zh) * | 2019-12-18 | 2020-05-26 | 北京葡萄智学科技有限公司 | 一种发音评测方法、装置、电子设备及存储介质 |
CN111291179A (zh) * | 2018-12-06 | 2020-06-16 | 北京嘀嘀无限科技发展有限公司 | 一种对话分类方法、装置、电子设备及存储介质 |
CN111508530A (zh) * | 2020-04-13 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 语音情感识别方法、装置及存储介质 |
CN111508501A (zh) * | 2020-07-02 | 2020-08-07 | 成都晓多科技有限公司 | 一种电话机器人中带口音的语音识别方法及系统 |
WO2020233504A1 (en) * | 2019-05-17 | 2020-11-26 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for emotion recognition |
CN112395456A (zh) * | 2021-01-20 | 2021-02-23 | 北京世纪好未来教育科技有限公司 | 音频数据分类方法、训练方法及装置、介质、计算机设备 |
CN112765971A (zh) * | 2019-11-05 | 2021-05-07 | 北京火山引擎科技有限公司 | 文本语音的转换方法、装置、电子设备及存储介质 |
CN110085211B (zh) * | 2018-01-26 | 2021-06-29 | 上海智臻智能网络科技股份有限公司 | 语音识别交互方法、装置、计算机设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102201240A (zh) * | 2011-05-27 | 2011-09-28 | 中国科学院自动化研究所 | 基于逆滤波的谐波噪声激励模型声码器 |
CN103971690A (zh) * | 2013-01-28 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 一种声纹识别方法和装置 |
CN104200804A (zh) * | 2014-09-19 | 2014-12-10 | 合肥工业大学 | 一种面向人机交互的多类信息耦合的情感识别方法 |
CN104240720A (zh) * | 2013-06-24 | 2014-12-24 | 北京大学深圳研究生院 | 一种基于多重分形和信息融合的语音情感识别方法 |
CN104899298A (zh) * | 2015-06-09 | 2015-09-09 | 华东师范大学 | 一种基于大规模语料特征学习的微博情感分析方法 |
-
2015
- 2015-11-02 CN CN201510731781.6A patent/CN105427869A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102201240A (zh) * | 2011-05-27 | 2011-09-28 | 中国科学院自动化研究所 | 基于逆滤波的谐波噪声激励模型声码器 |
CN103971690A (zh) * | 2013-01-28 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 一种声纹识别方法和装置 |
CN104240720A (zh) * | 2013-06-24 | 2014-12-24 | 北京大学深圳研究生院 | 一种基于多重分形和信息融合的语音情感识别方法 |
CN104200804A (zh) * | 2014-09-19 | 2014-12-10 | 合肥工业大学 | 一种面向人机交互的多类信息耦合的情感识别方法 |
CN104899298A (zh) * | 2015-06-09 | 2015-09-09 | 华东师范大学 | 一种基于大规模语料特征学习的微博情感分析方法 |
Non-Patent Citations (3)
Title |
---|
P VINCENT 等: ""Stacked Denoising Autoencoders:Learning Useful Representations in a Deep Network with a Local Denoising Criterion"", 《JOURNAL OF MACHINE LEARNING RESEARCH》 * |
张良均 等著: "《R语言数据分析与挖掘实践》", 30 September 2015, 机械工业出版社 * |
杨铁军 主编: "《产业专利分析报告(第33册)——智能识别》", 30 June 2015, 知识产权出版社 * |
Cited By (71)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105702251B (zh) * | 2016-04-20 | 2019-10-22 | 中国科学院自动化研究所 | 基于Top-k加强音频词袋模型的语音情感识别方法 |
CN105702251A (zh) * | 2016-04-20 | 2016-06-22 | 中国科学院自动化研究所 | 基于Top-k加强音频词袋模型的语音情感识别方法 |
CN107402914A (zh) * | 2016-05-20 | 2017-11-28 | 富士通株式会社 | 自然语言深度学习系统和方法 |
CN106407177A (zh) * | 2016-08-26 | 2017-02-15 | 西南大学 | 基于聚类分析的突发事件在线群体行为检测方法 |
CN107886955A (zh) * | 2016-09-29 | 2018-04-06 | 百度在线网络技术(北京)有限公司 | 一种语音会话样本的身份识别方法、装置及设备 |
CN107886955B (zh) * | 2016-09-29 | 2021-10-26 | 百度在线网络技术(北京)有限公司 | 一种语音会话样本的身份识别方法、装置及设备 |
CN106448660A (zh) * | 2016-10-31 | 2017-02-22 | 闽江学院 | 一种引入大数据分析的自然语言模糊边界确定方法 |
CN106448660B (zh) * | 2016-10-31 | 2019-09-17 | 闽江学院 | 一种引入大数据分析的自然语言模糊边界确定方法 |
CN108062954B (zh) * | 2016-11-08 | 2020-12-08 | 科大讯飞股份有限公司 | 语音识别方法和装置 |
CN108062954A (zh) * | 2016-11-08 | 2018-05-22 | 科大讯飞股份有限公司 | 语音识别方法和装置 |
CN108090038B (zh) * | 2016-11-11 | 2022-01-14 | 科大讯飞股份有限公司 | 文本断句方法及系统 |
CN108090038A (zh) * | 2016-11-11 | 2018-05-29 | 科大讯飞股份有限公司 | 文本断句方法及系统 |
CN106503805B (zh) * | 2016-11-14 | 2019-01-29 | 合肥工业大学 | 一种基于机器学习的双模态人人对话情感分析方法 |
CN106503805A (zh) * | 2016-11-14 | 2017-03-15 | 合肥工业大学 | 一种基于机器学习的双模态人人对话情感分析系统及其方法 |
CN106601228A (zh) * | 2016-12-09 | 2017-04-26 | 百度在线网络技术(北京)有限公司 | 基于人工智能韵律预测的样本标注方法及装置 |
CN106951558A (zh) * | 2017-03-31 | 2017-07-14 | 广东睿盟计算机科技有限公司 | 一种基于深度搜索的税务智能咨询平台的数据处理方法 |
CN106951558B (zh) * | 2017-03-31 | 2020-06-12 | 广东睿盟计算机科技有限公司 | 一种基于深度搜索的税务智能咨询平台的数据处理方法 |
CN109417504A (zh) * | 2017-04-07 | 2019-03-01 | 微软技术许可有限责任公司 | 自动聊天中的语音转发 |
US11233756B2 (en) | 2017-04-07 | 2022-01-25 | Microsoft Technology Licensing, Llc | Voice forwarding in automated chatting |
CN107220311B (zh) * | 2017-05-12 | 2020-12-08 | 北京理工大学 | 一种利用局部嵌入话题建模的文本表示方法 |
CN107220311A (zh) * | 2017-05-12 | 2017-09-29 | 北京理工大学 | 一种利用局部嵌入话题建模的文本表示方法 |
CN107293309A (zh) * | 2017-05-19 | 2017-10-24 | 四川新网银行股份有限公司 | 一种基于客户情绪分析提升舆情监控效率的方法 |
CN108305642A (zh) * | 2017-06-30 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 情感信息的确定方法和装置 |
CN108305641A (zh) * | 2017-06-30 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 情感信息的确定方法和装置 |
WO2019001458A1 (zh) * | 2017-06-30 | 2019-01-03 | 腾讯科技(深圳)有限公司 | 情感信息的确定方法和装置 |
CN108305641B (zh) * | 2017-06-30 | 2020-04-07 | 腾讯科技(深圳)有限公司 | 情感信息的确定方法和装置 |
CN108305643A (zh) * | 2017-06-30 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 情感信息的确定方法和装置 |
CN108305643B (zh) * | 2017-06-30 | 2019-12-06 | 腾讯科技(深圳)有限公司 | 情感信息的确定方法和装置 |
CN108305642B (zh) * | 2017-06-30 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 情感信息的确定方法和装置 |
CN110959159A (zh) * | 2017-07-25 | 2020-04-03 | 谷歌有限责任公司 | 话语分类器 |
CN107452405A (zh) * | 2017-08-16 | 2017-12-08 | 北京易真学思教育科技有限公司 | 一种根据语音内容进行数据评价的方法及装置 |
US10388283B2 (en) | 2017-09-21 | 2019-08-20 | Tata Consultancy Services Limited | System and method for improving call-centre audio transcription |
CN108039181A (zh) * | 2017-11-02 | 2018-05-15 | 北京捷通华声科技股份有限公司 | 一种声音信号的情感信息分析方法和装置 |
CN107818795B (zh) * | 2017-11-15 | 2020-11-17 | 苏州驰声信息科技有限公司 | 一种英语口语的测评方法及装置 |
CN107818795A (zh) * | 2017-11-15 | 2018-03-20 | 苏州驰声信息科技有限公司 | 一种英语口语的测评方法及装置 |
CN108255805B (zh) * | 2017-12-13 | 2022-02-25 | 讯飞智元信息科技有限公司 | 舆情分析方法及装置、存储介质、电子设备 |
CN108255805A (zh) * | 2017-12-13 | 2018-07-06 | 讯飞智元信息科技有限公司 | 舆情分析方法及装置、存储介质、电子设备 |
CN110085211B (zh) * | 2018-01-26 | 2021-06-29 | 上海智臻智能网络科技股份有限公司 | 语音识别交互方法、装置、计算机设备和存储介质 |
CN108563628A (zh) * | 2018-03-07 | 2018-09-21 | 中山大学 | 基于hred和内外记忆网络单元的情感对话生成方法 |
CN108831450A (zh) * | 2018-03-30 | 2018-11-16 | 杭州鸟瞰智能科技股份有限公司 | 一种基于用户情绪识别的虚拟机器人人机交互方法 |
CN108536654B (zh) * | 2018-04-13 | 2022-05-17 | 科大讯飞股份有限公司 | 识别文本展示方法及装置 |
CN108536654A (zh) * | 2018-04-13 | 2018-09-14 | 科大讯飞股份有限公司 | 识别文本展示方法及装置 |
CN108874896B (zh) * | 2018-05-22 | 2020-11-06 | 大连理工大学 | 一种基于神经网络和幽默特征的幽默识别方法 |
CN108874896A (zh) * | 2018-05-22 | 2018-11-23 | 大连理工大学 | 一种基于神经网络和幽默特征的幽默识别方法 |
CN108985358A (zh) * | 2018-06-29 | 2018-12-11 | 北京百度网讯科技有限公司 | 情绪识别方法、装置、设备及存储介质 |
CN109189919A (zh) * | 2018-07-27 | 2019-01-11 | 广州市香港科大霍英东研究院 | 文本多视角情感分类的方法、系统、终端及存储介质 |
CN109189919B (zh) * | 2018-07-27 | 2020-11-13 | 广州市香港科大霍英东研究院 | 文本多视角情感分类的方法、系统、终端及存储介质 |
CN109243490A (zh) * | 2018-10-11 | 2019-01-18 | 平安科技(深圳)有限公司 | 司机情绪识别方法及终端设备 |
CN109543187B (zh) * | 2018-11-23 | 2021-09-17 | 中山大学 | 电子病历特征的生成方法、装置及存储介质 |
CN109543187A (zh) * | 2018-11-23 | 2019-03-29 | 中山大学 | 电子病历特征的生成方法、装置及存储介质 |
CN111291179B (zh) * | 2018-12-06 | 2023-12-08 | 北京嘀嘀无限科技发展有限公司 | 一种对话分类方法、装置、电子设备及存储介质 |
CN111291179A (zh) * | 2018-12-06 | 2020-06-16 | 北京嘀嘀无限科技发展有限公司 | 一种对话分类方法、装置、电子设备及存储介质 |
CN109784414A (zh) * | 2019-01-24 | 2019-05-21 | 出门问问信息科技有限公司 | 一种电话客服中客户情绪检测方法、装置及电子设备 |
CN109949830A (zh) * | 2019-03-12 | 2019-06-28 | 中国联合网络通信集团有限公司 | 用户意图识别方法及设备 |
CN109949830B (zh) * | 2019-03-12 | 2021-03-30 | 中国联合网络通信集团有限公司 | 用户意图识别方法及设备 |
CN110134947B (zh) * | 2019-04-17 | 2021-03-26 | 中国科学院计算技术研究所 | 一种基于不平衡多源数据的情感分类方法及系统 |
CN110134947A (zh) * | 2019-04-17 | 2019-08-16 | 中国科学院计算技术研究所 | 一种基于不平衡多源数据的情感分类方法及系统 |
WO2020233504A1 (en) * | 2019-05-17 | 2020-11-26 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for emotion recognition |
CN110246509B (zh) * | 2019-06-15 | 2021-07-13 | 河南工业大学 | 一种用于语音测谎的栈式去噪自编码器及深度神经网络结构 |
CN110246509A (zh) * | 2019-06-15 | 2019-09-17 | 河南工业大学 | 一种用于语音测谎的栈式去噪自编码器及深度神经网络结构 |
CN110390956A (zh) * | 2019-08-15 | 2019-10-29 | 龙马智芯(珠海横琴)科技有限公司 | 情感识别网络模型、方法及电子设备 |
CN112765971A (zh) * | 2019-11-05 | 2021-05-07 | 北京火山引擎科技有限公司 | 文本语音的转换方法、装置、电子设备及存储介质 |
CN112765971B (zh) * | 2019-11-05 | 2023-11-17 | 北京火山引擎科技有限公司 | 文本语音的转换方法、装置、电子设备及存储介质 |
CN111199750A (zh) * | 2019-12-18 | 2020-05-26 | 北京葡萄智学科技有限公司 | 一种发音评测方法、装置、电子设备及存储介质 |
CN111199750B (zh) * | 2019-12-18 | 2022-10-28 | 北京葡萄智学科技有限公司 | 一种发音评测方法、装置、电子设备及存储介质 |
CN111508530A (zh) * | 2020-04-13 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 语音情感识别方法、装置及存储介质 |
CN111508530B (zh) * | 2020-04-13 | 2024-02-13 | 腾讯科技(深圳)有限公司 | 语音情感识别方法、装置及存储介质 |
CN111508501B (zh) * | 2020-07-02 | 2020-09-29 | 成都晓多科技有限公司 | 一种电话机器人中带口音的语音识别方法及系统 |
CN111508501A (zh) * | 2020-07-02 | 2020-08-07 | 成都晓多科技有限公司 | 一种电话机器人中带口音的语音识别方法及系统 |
CN112395456B (zh) * | 2021-01-20 | 2021-04-13 | 北京世纪好未来教育科技有限公司 | 音频数据分类方法、训练方法及装置、介质、计算机设备 |
CN112395456A (zh) * | 2021-01-20 | 2021-02-23 | 北京世纪好未来教育科技有限公司 | 音频数据分类方法、训练方法及装置、介质、计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105427869A (zh) | 一种基于深度学习的会话情感自动分析方法 | |
Badshah et al. | Deep features-based speech emotion recognition for smart affective services | |
CN107993665B (zh) | 多人会话场景中发言人角色确定方法、智能会议方法及系统 | |
CN107092596B (zh) | 基于attention CNNs和CCR的文本情感分析方法 | |
Mirheidari et al. | Detecting Signs of Dementia Using Word Vector Representations. | |
CN102982811B (zh) | 一种基于实时解码的语音端点检测方法 | |
Agarwalla et al. | Machine learning based sample extraction for automatic speech recognition using dialectal Assamese speech | |
CN107437415B (zh) | 一种智能语音交互方法及系统 | |
CN105427858B (zh) | 实现语音自动分类的方法及系统 | |
Ingale et al. | Speech emotion recognition | |
CN110211594B (zh) | 一种基于孪生网络模型和knn算法的说话人识别方法 | |
CN105760852A (zh) | 一种融合脸部表情和语音的驾驶员情感实时识别方法 | |
CN105679310A (zh) | 一种用于语音识别方法及系统 | |
CN105374352A (zh) | 一种语音激活方法及系统 | |
CN109036467A (zh) | 基于tf-lstm的cffd提取方法、语音情感识别方法及系统 | |
CN110992959A (zh) | 一种语音识别方法及系统 | |
CN116110405B (zh) | 一种基于半监督学习的陆空通话说话人识别方法及设备 | |
Utane et al. | Emotion recognition through Speech | |
CN109243427A (zh) | 一种车辆故障诊断方法及装置 | |
Huang et al. | Emotional speech feature normalization and recognition based on speaker-sensitive feature clustering | |
CN111091809B (zh) | 一种深度特征融合的地域性口音识别方法及装置 | |
Sinha et al. | Acoustic-phonetic feature based dialect identification in Hindi Speech | |
CN114898779A (zh) | 融合多模态的语音情感识别方法及系统 | |
CN115249479A (zh) | 基于brnn的电网调度复杂语音识别方法、系统及终端 | |
CN114254096A (zh) | 一种基于交互机器人对话的多模态情感预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160323 |