CN108205686A

CN108205686A - 视频情感分类方法及装置

Info

Publication number: CN108205686A
Application number: CN201711275006.XA
Authority: CN
Inventors: 仝小敏; 李鹏; 吉祥; 吴鸽鹏
Original assignee: China Electronics Technology Group Corp CETC
Current assignee: China Electronics Technology Group Corp CETC; Electronic Science Research Institute of CTEC
Priority date: 2017-12-06
Filing date: 2017-12-06
Publication date: 2018-06-26

Abstract

本发明公开了一种视频情感分类方法及装置，所述分类方法包括：获得用户观看视频时的脑电图信号的时间序列数据；从获得的时间序列数据中选择分类特征；根据所述分类特征，对所述视频的视频情感进行分类。本发明通过从脑电图信号的时间序列数据中提取特征，挖掘出更有效的分类特征，从而大大提高视频情感的分类准确率。

Description

视频情感分类方法及装置

技术领域

本发明涉及情感识别技术领域，特别是涉及一种视频情感分类方法及装置。

背景技术

视频情感识别是计算机视觉的研究热点，视频情感识别是为了识别视频中包含的积极、消极等情感，按照不同的情感类型将视频进行分类，视频情感识别在视频推荐、视频分类、广告设计等领域有重要的研究价值。

现有的视频情感分类方法通过提取脑电图信号的时域和频域特征等传统方法实现分类，由于只能从海量大脑响应数据中提取到数量有限的特征，把大量有效的特征给过滤掉了，难以涵盖所有有分辨能力的特征，分类准确率还有待提高。

发明内容

为了克服上述缺陷，本发明要解决的技术问题是提供一种视频情感分类方法及装置，用以至少提高现有视频情感分类的准确率。

为解决上述技术问题，本发明中的一种视频情感分类方法，包括：

获得用户观看视频时的脑电图信号的时间序列数据；

从获得的时间序列数据中选择分类特征；

根据所述分类特征，对所述视频的视频情感进行分类。

为解决上述技术问题，本发明中的一种视频情感分类装置，包括存储器和处理器；所述存储器存储有视频情感分类计算机程序，所述处理器执行所述计算机程序，以实现如上所述方法的步骤。

本发明有益效果如下：

本发明通过从脑电图信号的时间序列数据中提取特征，挖掘出更有效的分类特征，从而大大提高视频情感的分类准确率。

附图说明

图1是本发明实施例中一种视频情感分类方法的流程图；

图2是本发明实施例中一种视频情感分类装置的结构示意图。

具体实施方式

为了解决现有技术的问题，本发明提供了一种视频情感分类方法及装置，以下结合附图以及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不限定本发明。

实施例一

本发明实施例提供一种视频情感分类方法，如图1所示，所述方法包括：

S101，获得用户观看视频时的脑电图信号的时间序列数据；

S102，从获得的时间序列数据中选择分类特征；

S103，根据所述分类特征，对所述视频的视频情感进行分类。

本发明实施例中视频也可以称为音乐视频。

本发明实施例中脑电图信号也可以简称为脑电图。

作为视频情感识别的一个指标，视频愉悦度被用来评价视频的积极和消极程度，视频愉悦度识别算法研究近年来受到研究者的关注。本发明实施例中特征选择是为了从数据中选取能够有效区分不同愉悦度视频的特征，但是目前的数据处理方法得到的脑电图特征分类准确率还有待提高，原因在于现有脑电图时域和频域信号的分类能力有限，数据中隐藏的辨识特征没有得到的挖据，有效特征产生了丢失，其实，脑电图时间序列中包含人类识别视频情感的特征，蕴藏着丰富的情感分类特征，因此，相对于传统的时域和频域特征，本发明实施例直接对脑电图信号的时间序列数据进行预处理和特征提取，避免有效分类特征的丢失，从而挖掘出脑电图中包含的更有效的情感分类特征。

在上述实施例的基础上，进一步提出上述实施例的变型。

在本发明实施例中，可选地，所述获得用户观看视频时的脑电图信号的时间序列数据，包括：

通过多个脑电图采集通道，采集用户观看多个视频时的脑电图信号的时间序列数据。

为了描述简洁，本发明实施例中脑电图采集通道可以简称为脑电图通道或通道。

本发明实施例中用户也可以称为测试者。

例如，通过32个通道，采集用户40个视频的脑电图信号。

在本发明实施例中，可选地，所述通过多个脑电图采集通道，采集用户观看多个视频时的脑电图信号的时间序列数据之后，包括：

将采集的时间序列数据中每一列数据的数据范围调整一致，得到各个脑电图采集通道的标准化时间序列数据。

在本发明实施例中，可选地，所述从获得的时间序列数据中选择分类特征，包括：

从各个脑电图采集通道的标准化时间序列数据中选择分类特征。

在本发明实施例中，可选地，通过最小冗余最大相关度标准mRMR，从各个脑电图采集通道的标准化时间序列数据中选择分类特征。

在本发明实施例中，可选地，所述根据所述分类特征，对所述视频的视频情感进行分类，包括：

根据所述分类特征，标注各个视频的视频愉悦度。

在本发明实施例中，可选地，所述将采集的时间序列数据中每一列的时间序列数据的范围调整一致，包括：

对于每个脑电图采集通道：

根据所述视频的数量和预设的列长，确定该脑电图采集通道采集的间序列数据；

对于每一列，根据该列对应的间序列数据、该列对应的间序列数据的平均值和该列对应的间序列数据的标准差，确定该列的标准化间序列数据。

在本发明实施例中，可选地，采用下式确定该列的标准化间序列数据Data′(j)：

Data′(j)＝(Data(j)-μ(Data(j)))/σ(Data(j)) (1)

式中，j表示列数，Data(j)表示脑电图采集通道采集的第j列间序列数据，μ(Data(j))表示Data(j)的平均值，σ(Data(j))表示Data(j)的标准差。

在本发明实施例中，可选地，所述列长为每个脑电图采集通道在预设时间内采集的数据长度。本发明实施例中预设时间采用1分钟(60秒)，列长采用8064。

例如，对每个测试者的每个脑电图通道，利用mRMR特征选择算法对每个通道的脑电图信号进行特征选择，然后将每个通道提取的脑电图特征用于该测试者的40个视频的愉悦度分类，得到每个测试者每个脑电图通道数据对40个视频的愉悦度分类准确率，最后计算每个测试者40个通道的平均分类准确率作为该测试者对40个视频的分类准确率。

详细地，本发明实施例首先针对每个测试者每个脑电图通道所对应的40个视频的数据按列标准化，使得脑电图数据范围一致，利于后续处理；其次，采用mRMR特征选择方法对每个测试者的每个脑电图通道的时间序列数据直接进行特征选择，从而挖掘出时间序列中潜藏的具有较强情感分类能力的特征；最后，针对每个测试者的每个脑电图通道，利用选择得到的特征对40个视频进行视频愉悦度分类，得到40个视频的愉悦度分类准确率，将每个脑电图通道的分类准确率进行平均作为该测试者对40个视频的最后分类准确率。

以下以DEAP数据库的脑电图信号为例，说明本发明实施例中方法，实现过程包括：

(1)标准化过程：

输入32个测试者观看40个音乐视频的脑电图信号，对每个测试者的脑电图信号按列进行如下数据标准化处理。

对于每个测试者的每个脑电图采集通道，对其观看40视频的脑电图初始信号Data进行标准化，将数据范围调整一致，便于后续特征选择方法进行处理。其中Data＝40×8064，40表示每个测试者观看的40个音乐视频，8064为1分钟内每个通道采集的数据长度，对Data按列进行数据标准化处理，公式如下：

Data′(j)＝(Data(j)-μ(Data(j)))/σ(Data(j)) (1)

(2)脑电图特征选择过程：

利用mRMR特征选择方法对每个测试者的每个通道脑电图信号进行特征选择，得到分类准确率高的脑电图特征。

对于单个测试者的每个脑电图通道数据，我们分别利用mRMR特征选择方法进行特征选择，选择出每个通道最有区分能力的特征。mRMR特征算法目的是为了选取与分类最相关的特征，同时特征之间的冗余度最小，符合脑电图信号特征提取的需求，mRMR定义了如下两个函数实现最大相关和最小冗余：

其中，S表示特征的集合，c表示类别，I(x_i；c)表示特征与类别之间的互信息；I(x_i,x_j)表示特征与特征之间的互信息，互信息的定义如下所示：

其中，x，y表示两个随机变量，p(x)、p(y)、p(x,y)表示概率密度函数。

mRMR算法中要实现的特征与类别最大相关，特征之间最小冗余通过以下函数实现：

maxΦ(D,R),Φ＝D-R (5)

最佳特征集合的选择为假定一个有m个特征的数据集S_m，需要从剩下的数据{S-S_m}选择使得公式(5)最大化的第m+1个特征为：

(3)音乐视频的愉悦度分类。

利用每个测试者的脑电图特征对音乐视频进行分类，得到每个测试者每个通道脑电图信号对40个音乐视频的分类准确率，将32个通道的分类准确率平均得到该测试者对40个音乐视频的愉悦度分类准确率。

本发明实施例采用4折交叉验证，即将40个视频的脑电图数据分为4份，每次采用3份作为训练集，剩余1份作为测试集，采用SVM作为分类器，重复4次，保证每份数据都被测试过，将4次测试结果进行平均，得到该测试者的某个通道对40个视频的分类准确率。

(4)输出分类准确率。

为了验证本发明实施例的有效性，将本发明实施例与基于时域特征的方法、基于频域特征的方法、卡方特征选择方法进行了对比实验，相对于传统方法和卡方特征选择算法，本发明实施例中的32个测试者平均分类准确率为86.2％，比传统的时域特征提高了15.4％，比传统的频域特征提高了16.4％，比卡方特征选择方法提高了9.1％，本发明测试者最高分类准确率为91.9％，比传统的时域特征测试者最高分类准确率提高了9.4％，比传统的频域特征测试者最高分类准确率提高了6.9％，比卡方特征选择提高了5.3％。从结果中可以看出，本发明实施例提出的特征选择算法可以获取到分类准确率更高的特征。

实施例二

本发明实施例提供一种视频情感分类装置，如图2所示，所述装置包括存储器20和处理器22；所述存储器20存储有视频情感分类计算机程序，所述处理器22执行所述计算机程序，以实现如实施例一中任意一项所述方法的步骤。

本发明实施例在具体实现时可以参阅实施例一，具有相应的技术效果。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种视频情感分类方法，其特征在于，所述方法包括：

获得用户观看视频时的脑电图信号的时间序列数据；

从获得的时间序列数据中选择分类特征；

根据所述分类特征，对所述视频的视频情感进行分类。

2.如权利要求1所述的方法，其特征在于，所述获得用户观看视频时的脑电图信号的时间序列数据，包括：

3.如权利要求2所述的方法，其特征在于，所述通过多个脑电图采集通道，采集用户观看多个视频时的脑电图信号的时间序列数据之后，包括：

4.如权利要求3所述的方法，其特征在于，所述从获得的时间序列数据中选择分类特征，包括：

5.如权利要求4所述的方法，其特征在于，通过最小冗余最大相关度标准，从各个脑电图采集通道的标准化时间序列数据中选择分类特征。

6.如权利要求4所述的方法，其特征在于，所述根据所述分类特征，对所述视频的视频情感进行分类，包括：

根据所述分类特征，标注各个视频的视频愉悦度。

7.如权利要求3所述的方法，其特征在于，所述将采集的时间序列数据中每一列的时间序列数据的范围调整一致，包括：

对于每个脑电图采集通道：

8.如权利要求7所述的方法，其特征在于，采用下式确定该列的标准化间序列数据Data′(j)：

Data′(j)＝(Data(j)-μ(Data(j)))/σ(Data(j))；

9.如权利要求7所述的方法，其特征在于，所述列长为每个脑电图采集通道在预设时间内采集的数据长度。

10.一种视频情感分类装置，其特征在于，所述装置包括存储器和处理器；所述存储器存储有视频情感分类计算机程序，所述处理器执行所述计算机程序，以实现如权利要求1-9中任意一项所述方法的步骤。