CN106653000A

CN106653000A - 一种基于语音信息的情感强度实验方法

Info

Publication number: CN106653000A
Application number: CN201611007085.1A
Authority: CN
Inventors: 孙颖; 王少玄; 张子恒; 张雪英; 姚慧; 宋春晓; 黄丽霞
Original assignee: Taiyuan University of Technology
Current assignee: Taiyuan University of Technology
Priority date: 2016-11-16
Filing date: 2016-11-16
Publication date: 2017-05-10

Abstract

一种基于语音信息的情感强度实验方法，所述实验方法是根据已经建立的成熟语音库，选取部分语料作为样本，以中性情感为基准，根据相似度划分算法计算得到情感强度量化表，从而对情感语音进行强度等级划分。本发明经过情感强度划分算法划分量化后的基本情感语音得到了较好的识别结果，证明了本实验所采用的划分算法是有效的。

Description

一种基于语音信息的情感强度实验方法

技术领域

本发明涉及一种情感强度实验方法，尤其是涉及一种基于语音信息的情感强度实验方法。

背景技术

语言是人类沟通的最有效的方式，语言中不仅包含了文字信息，同时还包含了大量能反映说话人情感状态的信息。语音情感识别是通过计算机对说话人的情感状态进行认知判断。

目前的语音情感识别研究，大部分集中在基本的离散情感语音识别，例如判断语句是高兴还是生气，并没在对高兴或者生气程度的研究上达成一致的共识，这就造成了研究领域的局限性。

近些年，在语音处理技术发展中，情感语音强度划分的研究逐渐得到了广泛关注，虽然相关的研究取得了一定的成果，但是并未对每种基本情感语音的强度进行量化，也未对每种情感语音的强度级别界限做出具体规定。

因此，需要进一步对情感语音的强度进行研究，就需要对情感强度进行量化，并具体划分等级。

发明内容

本发明的目的是对连续情感语音识别领域中，通过建立一种基于语音信息的情感强度划分方法，对情感语音的强度进行量化算，实现情感语音的等级划分，并提供一种基于语音信息的情感强度实验方法。

本发明的目的是通过以下技术方案来实现的。

一种基于语音信息的情感强度实验方法，所述方法是按下列步骤进行的：

1）选取语音库中的情感语音；

2）对情感语音信号进行加重、分帧加窗的预处理；

3）提取情感语音的语速、能量、平均过零率、基频、共振峰和MFCCs的特征；

4）利用强度划分算法对情感语音进行三个等级的强度划分；

5）使用识别网络对划分后的情感语音识别验证。

在上述技术方案中，每个步骤的具体技术特征如下。

所述选取语音库中的情感语音是选取语音库中语义清晰、情感分明的情感语句，包括高兴、悲伤、生气、害怕、厌恶、无聊和中性七类情感语音，并用于情感语音的实验。

所述对情感语音信号进行加重、分帧加窗的预处理是使用数字滤波器按照6dB/oct的比例对信号预加重，然后使用汉明窗对语音信号进行加权实现分帧，帧长为256，帧移为128，其中汉明窗的窗函数如下：

所述提取情感语音的语速、能量、平均过零率、基频、共振峰和MFCCs的特征中的能量是1阶差分的最大值、最小值和均值；基频是一阶差分的最大值、最小值和均值；共振峰是第1-3共振峰及其一阶差分的最大值、最小值和均值；MFCCs是MFCC0-MFCC12阶的偏度、峰度、均值、方差和中值，共98维。

5、根据权利要求1所述的实验方法，所述利用强度划分算法对情感语音进行三个等级的强度划分的具体步骤如下：

1）计算中性情感语音的特征均值：

对数据库中的中性情感语音做特征提取，设为语音中的一个特征，每句语音提取个特征，分别求取每句中性情感语音的每个特征的均值，存放在下列矩阵中：

2）提取基本情感语音的特征并计算其与中性情感语音特征均值的欧式距离：

提取每句负性情感语音的个特征参数，根据下述公式求得每句负性情感语音到中性情感语音的欧式距离：

3）计算情感语音的相似度：

将步骤2）中求得的个欧式距离，带入下式，得到每句负性情感语音和中性情感语音的相似度：

。

4）情感语音的强度划分：

根据步骤3）求出每句情感语音的相似度值，对所有情感语音按照相似度值从小到大进行排序，并根据相似度制定情感强度量化表，将每种基本情感语音划分为三个等级，一级最弱，三级最强。

6、根据权利要求1所述的实验方法，所述使用识别网络对划分后的情感语音识别验证是使用支持向量机作为识别网络，将划分等级后的情感语音作为输入，验证了建立的情感强度划分算法的有效性。

上述的一种基于语音信息的情感强度实验方法，与现有技术相比，本方法建立了一种基于语音信息的情感强度划分方法，实现了对连续情感语音的定量分析以及强度划分，使用支持向量机验证了情感强度划分算法的有效性。

附图说明

图1是本发明情感强度划分算法的流程图。

图2是本发明根据本实验中采用的实验数据建立的情感强度量化表图。

具体实施方式

下面对本发明的具体实施方式作出进一步的说明。

本发明上述所提供的一种基于语音信息的情感强度实验方法，是在连续情感语音识别中，通过建立一种基于语音信息的情感强度划分方法，对情感语音的强度进行量化，实现情感语音的等级划分，具体实施方式如下。

实施一种基于语音信息的情感强度实验方法，该方法是按下列步骤进行的：

步骤一、选取语音库中的情感语音；

步骤二、对情感语音信号进行加重、分帧加窗的预处理；

步骤三、提取情感语音的语速、能量、平均过零率、基频、共振峰和MFCCs的特征；

步骤四、利用强度划分算法对情感语音进行三个等级的强度划分；

步骤五、使用识别网络对划分后的情感语音识别验证。

在上述实施方案中，步骤一中、选取语音库中的情感语音是选取语音库中语义比较清晰、情感比较分明的情感语句，包括高兴、悲伤、生气、害怕、厌恶、无聊和中性七类情感语音，并用于情感语音的实验中。

在上述实施方案中，步骤二中、对情感语音信号进行加重和分帧加窗的预处理是使用数字滤波器按照6dB/oct的比例对信号预加重，然后使用汉明窗对语音信号进行加权实现分帧，帧长为256，帧移为128，其中汉明窗的窗函数如下：

在上述实施方案中，步骤三中、提取情感语音的语速、能量、平均过零率、基频、共振峰和MFCCs的特征中的能量是1阶差分的最大值、最小值和均值；基频是一阶差分的最大值、最小值和均值；共振峰是第1-3共振峰及其一阶差分的最大值、最小值和均值；MFCCs是MFCC0-MFCC12阶的偏度、峰度、均值、方差和中值，共98维。

在上述实施方案中，步骤四中、利用强度划分算法对情感语音进行三个等级的强度划分的具体步骤如下：

1）计算中性情感语音的特征均值：

3）计算情感语音的相似度：

4）情感语音的强度划分：

在上述实施方案中，步骤五中、使用识别网络对划分后的情感语音识别验证是使用支持向量机作为识别网络，将划分等级后的情感语音作为输入，验证了建立的情感强度划分算法的有效性。

上述实施的一种基于语音信息的情感强度实验方法是根据已经建立的成熟语音库，选取部分语料作为样本，以中性情感为基准，根据相似度划分算法计算得到情感强度量化表，从而对情感语音进行强度等级划分，经过情感强度划分算法划分量化后的基本情感语音得到了较好的识别结果，也证明了本实验所采用的划分实验方法是有效的，本实验方法特别适用于人机交换系统，以进一步提高人机系统的情感语音智能水平。

Claims

1.一种基于语音信息的情感强度实验方法，所述方法是按下列步骤进行的：

1）选取语音库中的情感语音；

2）对情感语音信号进行加重、分帧加窗的预处理；

4）利用强度划分算法对情感语音进行三个等级的强度划分；

5）使用识别网络对划分后的情感语音识别验证。

2.根据权利要求1所述的实验方法，所述选取语音库中的情感语音是选取语音库中语义清晰、情感分明的情感语句，包括高兴、悲伤、生气、害怕、厌恶、无聊和中性七类情感语音，并用于情感语音的实验。

3.根据权利要求1所述的实验方法，所述对情感语音信号进行加重、分帧加窗的预处理是使用数字滤波器按照6dB/oct的比例对信号预加重，然后使用汉明窗对语音信号进行加权实现分帧，帧长为256，帧移为128，其中汉明窗的窗函数如下：

。

4.根据权利要求1所述的实验方法，所述提取情感语音的语速、能量、平均过零率、基频、共振峰和MFCCs的特征中的能量是1阶差分的最大值、最小值和均值；基频是一阶差分的最大值、最小值和均值；共振峰是第1-3共振峰及其一阶差分的最大值、最小值和均值；MFCCs是MFCC0-MFCC12阶的偏度、峰度、均值、方差和中值，共98维。

5.根据权利要求1所述的实验方法，所述利用强度划分算法对情感语音进行三个等级的强度划分的具体步骤如下：

1）计算中性情感语音的特征均值：

3）计算情感语音的相似度：

4）情感语音的强度划分：

6.根据权利要求1所述的实验方法，所述使用识别网络对划分后的情感语音识别验证是使用支持向量机作为识别网络，将划分等级后的情感语音作为输入，验证了建立的情感强度划分算法的有效性。