WO2021031817A1

WO2021031817A1 - 情绪识别方法、装置、计算机装置及存储介质

Info

Publication number: WO2021031817A1
Application number: PCT/CN2020/105630
Authority: WO
Inventors: 刘利
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2019-08-21
Filing date: 2020-07-29
Publication date: 2021-02-25
Also published as: CN110705584A

Abstract

本申请提供了一种情绪识别方法、装置、计算机装置及存储介质。所述情绪识别方法包括：获取训练样本集，所述训练样本集中的每个训练样本为用户步行的加速度时间序列，每个训练样本带有标签，所述标签标记所述训练样本对应的情绪类别；对所述训练样本集中的每个训练样本提取多个特征；根据所述训练样本集中的各个训练样本的多个特征构建多个分类回归树；根据所述多个分类回归树生成随机森林；将待识别用户的多个特征输入所述随机森林，根据所述随机森林的输出确定所述待识别用户的情绪类别，其中所述待识别用户的多个特征根据所述待识别用户步行的加速度时间序列得到。本申请实现了根据用户步行过程中的加速度数据识别用户情绪。

Description

情绪识别方法、装置、计算机装置及存储介质

本申请要求于2019年8月21日提交中国专利局、申请号为201910775783.3、发明名称为“情绪识别方法、装置、计算机装置及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，具体涉及一种情绪识别方法、装置、计算机装置及存储介质。

背景技术

随着人工智能技术的进步，情绪识别已是目前人工智能领域中最活跃的研究课题之一。其目的是对人类的图像序列进行检测、跟踪和识别，更科学地解释人类行为。情绪识别可以应用于生活的各个方面：游戏厂商可以智能分析玩家的情绪，根据不同表情针对性地和玩家交互，提高游戏的体验；相机厂商可以利用该项技术捕捉人类表情，比如当需要一张微笑或者生气的照片时，可以捕获被拍人员的面部表情并快速完成拍照工作；政府或社会学家可以在公共场合安装摄像头，分析整个社会群体的表情和肢体动作以了解人们的生活工作压力；商厦可以根据顾客对商品的购物时的动作及表情视频，对产品做相关的市场调查。

在实际应用中，发明人意识到单纯基于人脸表情的情绪识别研究已遇到瓶颈，一方面，基于实验室视角的正面人脸表情识别已达到极高识别率，但相关算法在应用于自然态人脸表情识别时却识别率较低；另一方面，在运动中人的肢体动作和情绪也有着强相关关系，肢体动作同样是人们获取情绪的重要线索，在很多应用场合中，能够为情绪识别提供有效的帮助。因此，如果能从人的肢体动作识别出人的情绪变化，是对情绪识别技术的一个重大补充，并对今后人类情感智能识别相关应用的发展具有重要价值。

发明内容

鉴于以上内容，有必要提出一种情绪识别方法、装置、计算机装置及存储介质，其可以提高情绪识别的场景适应性。

本申请的第一方面提供一种情绪识别方法，其中，所述方法包括：

获取训练样本集，所述训练样本集中的每个训练样本为用户步行的加速度时间序列，每个训练样本带有标签，所述标签标记所述训练样本对应的情绪类别；

对所述训练样本集中的每个训练样本提取多个特征；

根据所述训练样本集中的各个训练样本的多个特征构建多个分类回归树；

根据所述多个分类回归树生成随机森林；

将待识别用户的多个特征输入所述随机森林，根据所述随机森林的输出确定所述待识别用户的情绪类别，其中所述待识别用户的多个特征根据所述待识别用户步行的加速度时间序列得到。

本申请的第二方面提供一种计算机装置，其中，所述计算机装置包括处理器，所述处理器用于执行存储器中存储的计算机可读指令以实现以下步骤：

对所述训练样本集中的每个训练样本提取多个特征；

根据所述多个分类回归树生成随机森林；

本申请的第三方面提供一种存储介质，所述存储介质上存储有计算机可读指令，其中，所述计算机可读指令被处理器执行时实现以下步骤：

对所述训练样本集中的每个训练样本提取多个特征；

根据所述多个分类回归树生成随机森林；

本申请的第四方面提供一种情绪识别装置，其中，所述装置包括：

获取模块，用于获取训练样本集，所述训练样本集中的每个训练样本为用户步行的加速度时间序列，每个训练样本带有标签，所述标签标记所述训练样本对应的情绪类别；

提取模块，用于对所述训练样本集中的每个训练样本提取多个特征；

构建模块，用于根据所述训练样本集中的各个训练样本的多个特征构建多个分类回归树；

生成模块，用于根据所述多个分类回归树生成随机森林；

识别模块，用于将待识别用户的多个特征输入所述随机森林，根据所述随机森林的输出确定所述待识别用户的情绪类别，其中所述待识别用户的多个特征根据所述待识别用户步行的加速度时间序列得到。

本申请以带有情绪类别标签的用户步行的加速度时间序列为训练样本，根据各个训练样本生成随机森林，利用所述随机森林对待识别用户的加速度时间序列进行识别。本申请实现了根据用户步行过程中的加速度数据识别用户的情绪。

附图说明

图1是本申请实施例提供的情绪识别方法的流程图。

图2是本申请实施例提供的情绪识别装置的结构图。

图3是本申请实施例提供的计算机装置的示意图。

具体实施方式

为了能够更清楚地理解本申请的上述目的、特征和优点，下面结合附图和具体实施例对本申请进行详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本申请，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请。

优选地，本申请的情绪识别方法应用在一个或者多个计算机装置中。所述计算机装置是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机装置可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机装置可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

实施例一

图1是本申请实施例一提供的情绪识别方法的流程图。所述情绪识别方法应用于计算机装置。

本申请情绪识别方法涉及机器学习，用于根据用户步行过程中的加速度数据识别所述用户的情绪。

如图1所示，所述情绪识别方法包括：

101，获取训练样本集，所述训练样本集中的每个训练样本为用户步行的加速度时间序列，每个训练样本带有标签，所述标签标记所述训练样本对应的情绪类别。

可以在预设时间内，通过用户的手腕和/或脚踝上的加速度传感器采集用户步行过程中加速度数据，根据所述加速度数据得到所述加速度时间序列。每个加速度时间序列可以包括预设数量的加速度数据，例如100个加速度数据。或者，每个加速度时间序列可以包括预设时间(例如60秒)内的加速度数据。所述加速度数据可以是X轴、Y轴或Z轴方向的加速度数据，从而得到X轴、Y轴或Z轴方向的加速度时间序列。

例如，通过用户步行过程中用户手腕上的加速度传感器采集预设数量(例如100个)的X轴方向的加速度数据，将采集的预设数量的X轴方向的加速度数据组成一个加速度时间序列，得到一个训练样本。又如，通过用户步行过程中用户脚踝上的加速度传感器按照预设时间间隔采集预设时长(例如60秒)内X轴方向的加速度数据，将采集的预设时长内X轴方向的加速度数据组成一个加速度时间序列，得到一个训练样本。

每个训练样本对应一个标签，用于标识情绪类别。所述情绪类别可以包括正面情绪(激动、开心)、中性情绪(平静)或负面情绪(悲伤、哀愁)。所述标签可以是数字，例如1、2、3。例如，若用户的情绪为正面情绪，对应的标签为3；若用户的情绪为中性情绪，对应的标签为2；若用户的情绪为负面情绪，对应的标签为1。

用户处于不同情绪时，用户步行的加速度数据不同。可以在用户不同情绪时采集用户的加速度数据，得到带有不同标签的训练样本。

通过采集用户步行的加速度数据获得的多个训练样本组成所述训练样本集。

所述训练样本集可以包括多个用户的训练样本，即多个用户步行的加速度时间序列。或者，所述训练样本集可以包括一个用户的训练样本，即一个用户步行的加速度时间序列。

102，对所述训练样本集中的每个训练样本提取多个特征。

对所述训练样本集中的每个训练样本提取多个特征是对每个训练样本提取多个相同的特征。

所述多个特征可以包括加速度时间序列的标准差、平均值、峰值、偏态系数、FFT系数、功率谱密度平均值、功率谱密度标准偏差、坐标轴系数。

加速度时间序列的偏态系数是加速度时间序列分布不对称的度量值。若一个训练样本是对称的，则所述偏态系数等于0；若一个训练样本是左偏的，则所述偏态系数小于0；若一个训练样本是右偏的，则所述偏态系数大于0。

加速度时间序列的FFT系数是对所述加速度时间序列进行FFT(Fast Fourier Transform，快速傅里叶变换)变换得到的系数，可以取第2维到第32维的FFT系数。

若训练样本为X轴方向的加速度时间序列，则对应的坐标轴系数为：

其中，cov(Y,Z)为所述训练样本Y轴方向的加速度时间序列与所述训练样本Z轴方向的加速度时间序列的协方差，D(Y)为所述训练样本Y轴方向的加速度时间序列的方差，D(Z)为所述训练样本Z轴方向的加速度时间序列的方差；

若所述训练样本为Y轴方向的加速度时间序列，则所述坐标轴系数为ρ _XZ，ρ _XZ的计算公式可以参照上述ρ _YZ；

若所述训练样本为Z轴方向的加速度时间序列，则所述坐标轴系数为ρ _XY，ρ _XY的计算公式可以参照上述ρ _YZ。

在本实施例中，可以对所述训练样本集中的每个训练样本的多个特征进行归一化处理，得到每个训练样本归一化后的多个特征。

所述对所述训练样本集中的每个训练样本的多个特征进行归一化处理可以包括：

选择所述训练样本集中的第i个训练样本；

选择所述第i个训练样本的第j个特征；

计算所述训练样本集中所述第j个特征的均值U _j和方差σ _j；

对所述第i个训练样本的第j个特征进行归一化计算：

其中，B _ij为所述第i个训练样本的第j个特征归一化后的值，b _ij为所述第i个训练样本的第j个特征归一化前的值。i＝1,2，…，N，N为所述训练样本集中训练样本的数量。j＝1,2，…，M；M为每个训练样本的特征的数量。

所述第i个训练样本的第j个特征是指所述第i个训练样本的多个特征中的第j个特征。

在对所述训练样本集中的每个训练样本提取多个特征之前，所述方法还包括：

对所述训练样本集中的每个训练样本进行预处理。

所述对每个训练样本集中的每个训练样本进行预处理包括：

对所述训练样本进行降噪；和/或

对所述训练样本中的缺失值进行填充；和/或

对所述训练样本中的异常值进行修正。

具体地，对所述训练样本进行降噪可以包括：对所述训练样本进行移动平均降噪。

可以按照以下公式对训练样本进行移动平均降噪：

其中，output[i]是所述训练样本(即加速度时间序列)中第i个加速度数据对应的输出，w为常量，取值为3或5，input[i+j]是所述训练样本中第i+j个加速度数据。

还可以采用其他方法对所述训练样本进行降噪。例如，可以对所述训练样本进行小波降噪。

具体地，所述对所述训练样本中的缺失值进行填充可以包括：取所述训练样本中所述缺失值的前后若干个加速度数据(例如缺失值的前5个和后5个加速度数据)，用所述缺失值的前后若干个加速度数据的平均值填充所述缺失值。或者，可以采用K-最近邻算法，确定距离有缺失值的训练样本最近的K个训练样本(例如根据欧式距离确定距离有缺失值的训练样本最近的K个训练样本)，将K个训练样本的数据加权平均来估计该训练样本的缺失值。或者，可以采用其他方法填补所述缺失值。例如，可以通过回归拟合的方法或者插值法对所述缺失值进行填补。

对所述训练样本中的异常值进行修正的方法可以与填补缺失值的方法相同。例如，可以取所述训练样本中所述异常值的前后若干个加速度数据(例如异常值的前5个和后5个加速度数据)，用所述异常值的前后若干个加速度数据的平均值修正所述异常值。或者，可以采用K-最近邻算法，确定距离有异常值的训练样本最近的K个训练样本(例如根据欧式距离确定距离有异常值的训练样本最近的K个训练样本)，将K个训练样本的数据加权平均来估计该训练样本的异常值。或者，可以采用其他方法修正所述异常值。例如，可以通过回归拟合的方法或者插值法对所述异常值进行修正。

可以理解，修正异常值的方法可以不同于填补缺失值的方法。

103，根据所述训练样本集中的各个训练样本的多个特征构建多个分类回归树。

在一具体实施例中，所述根据所述训练样本集的各个训练样本的多个特征构建多个分类回归树可以包括：

(1)从所述训练样本集中随机选取Q个训练样本作为待分类样本；

(2)从所述待分类样本的多个特征中随机选取K个特征；

(3)确定所述待分类样本的所述K个特征中最优的切分特征和切分点，根据所述最优的切分特征和切分点将所述待分类样本划分为两个子集；

(4)计算划分的每个子集中的待分类样本的标签的均值；

(5)对于划分的每个子集，重复执行步骤(2)-(4)，直至满足预设停止条件。

所述最优的切分特征和切分点可以根据如下目标函数确定：

上式表示遍历待分类样本的K个特征(即切分特征j)的所有特征值(即切分点s)，根据平方误差最小准则找到最优的切分特征和切分点。

其中，x _i是所述待分类样本中的第i个训练样本，y _i是x _i的标签。

R ₁，R ₂是根据待分类样本的K个特征中的一个切分特征和一个切分点得到的两个子集，R ₁(j,s)＝{x|x ^(j)≤s}，R ₂(j,s)＝{x|x ^(j)>s}，x ^(j)是待分类样本的第j个特征的特征值。也就是说，R ₁(j,s)是第j个特征的特征值小于或等于s的待分类样本的集合，R ₂(j,s)＝{x|x ^(j)>s}是第j个特征的特征值大于s的待分类样本的集合。

其中，N ₁是子集R ₁中待分类样本的个数，N ₂是子集R ₂中待分类样本的个数。

所述满足预设停止条件可以包括：

若所述子集中待分类样本的数量小于或等于第一预设值，则满足预设停止条件；或者

若所述最优的切分特征和切分点对应的平方误差小于第二预设值，则满足预设停止条件，其中

或者

若随机选取的所有K个特征中不同特征的数量大于或等于第三预设值，则满足预设停止条件。

执行一次上述步骤(1)-(5)，可以得到一个分类回归树。也就是说，每次从所有训练样本中随机选取Q个训练样本作为待分类样本(即执行步骤(1))，对所述待分类样本进行逐层划分(即执行步骤(2)-(5))，根据各次划分的切分特征和切分点，得到一个分类回归树。分类回归树的根节点对应初始的待分类样本，分类回归树的每个叶子节点对应一个不再划分的子集。分类回归树的输出为叶子节点对应的输出，即划分到叶子节点的待分类样本的标签的均值。

重复执行上述步骤(1)-(5)，即可得到多个分类回归树。

104，根据所述多个分类回归树生成随机森林。

将多个分类回归树组成所述随机森林，不同分类回归树之间相互独立。所述随机森林的输入就是所述随机森林中每个分类回归树的输入；所述随机森林的输出为所述随机森林中所有分类回归树的输出的平均值。

在本实施例中，所述根据所述多个分类回归树生成随机森林包括：

对所述多个分类回归树进行剪枝处理；

根据剪枝处理后的所述多个分类回归树生成所述随机森林。

对所述多个分类回归树进行剪枝处理包括：

(1)从所述多个分类回归树选择一个分类回归树记为T ₀；

(2)初始化参数：k＝0，T＝T ₀，α＝+∞；

(3)在分类回归树T中自下而上地对各内部节点(非叶子节点)t计算C(T _t)，|T _t|以及

α＝min(α,g(t))

其中，T _t表示以t为根节点的子树，C(t)是根据划分到内部节点t的待分类样本得到的预测误差，C(Tt)是根据划分到子树T _t的待分类样本得到的预测误差，C(t)是根据划分到t节点的待分类样本得到的预测误差，|T _t|是所述子树T _t的叶子节点的数量；

(4)自上而下地遍历内部节点t，若g(t)＝α，进行剪枝，剪去所述节点t的子树，t变为叶子节点，剔除剪去的子树的g(t)，α＝min(g(t))，并计算叶子节点t对应区域中的待分类样本的标签的均值，得到分类回归树T；

(5)对参数进行赋值：k＝k+1，T _k＝T；

(6)若T不是由根节点单独构成的树，则回到步骤(4)；

(7)采用交叉验证法在子树序列T ₀，T ₁，…，T _n中选择最优子树T _α。

105，将待识别用户的多个特征输入所述随机森林，根据所述随机森林的输出确定所述待识别用户的情绪类别，其中所述待识别用户的多个特征根据所述待识别用户步行的加速度时间序列得到。

具体地，所述随机森林中的每个分类回归树以待识别用户的多个特征作为输入，根据所述待识别用户的多个特征对所述待识别用户进行分类，得到所述分类回归树的输出；计算所述随机森林中所有分类回归树的输出的平均值，得到所述随机森林的输出；根据所述随机森林的输出确定所述待识别用户的情绪类别。

可以选择与所述随机森林的输出差值最小的标签对应的情绪类别作为所述待识别用户的情绪类别。

待识别用户可以包含在训练样本对应的用户中。例如，所述训练样本集包括用户A的训练样本，所述待识别用户为用户A。或者，所述训练样本集包括用户A、用户B、用户C、用户D的训练样本，所述待识别用户为用户A。

或者，待识别用户可以不包含在训练样本对应的用户中。例如，所述训练样本集包括用户A、用户B、用户C、用户D的训练样本，所述待识别用户为用户E。

实施例一的情绪识别方法以带有情绪类别标签的用户步行的加速度时间序列为训练样本，根据各个训练样本生成随机森林，利用所述随机森林对待识别用户的加速度时间序列进行识别。实施例一实现了根据用户步行过程中的加速度数据识别所述用户的情绪。

实施例二

图2是本申请实施例二提供的情绪识别装置的结构图。所述情绪识别装置20应用于计算机装置。所述情绪识别装置20根据用户步行过程中的加速度数据识别所述用户的情绪。如图2所示，所述情绪识别装置20可以包括获取模块201、提取模块202、构建模块203、生成模块204、识别模块205。

获取模块201，用于获取训练样本集，所述训练样本集中的每个训练样本为用户步行的加速度时间序列，每个训练样本带有标签，所述标签标记所述训练样本对应的情绪类别。

提取模块202，用于对所述训练样本集中的每个训练样本提取多个特征。

选择所述训练样本集中的第i个训练样本；

选择所述第i个训练样本的第j个特征；

计算所述训练样本集中所述第j个特征的均值U _j和方差σ _j；

对所述第i个训练样本的第j个特征进行归一化计算：

对所述训练样本集中的每个训练样本进行预处理。

所述对每个训练样本集中的每个训练样本进行预处理包括：

对所述训练样本进行降噪；和/或

对所述训练样本中的缺失值进行填充；和/或

对所述训练样本中的异常值进行修正。

可以按照以下公式对训练样本进行移动平均降噪：

构建模块203，用于根据所述训练样本集中的各个训练样本的多个特征构建多个分类回归树。

(2)从所述待分类样本的多个特征中随机选取K个特征；

(4)计算划分的每个子集中的待分类样本的标签的均值；

所述最优的切分特征和切分点可以根据如下目标函数确定：

所述满足预设停止条件可以包括：

或者

重复执行上述步骤(1)-(5)，即可得到多个分类回归树。

生成模块204，用于根据所述多个分类回归树生成随机森林。

对所述多个分类回归树进行剪枝处理；

根据剪枝处理后的所述多个分类回归树生成所述随机森林。

对所述多个分类回归树进行剪枝处理包括：

(1)从所述多个分类回归树选择一个分类回归树记为T ₀；

(2)初始化参数：k＝0，T＝T ₀，α＝+∞；

α＝min(α,g(t))

(5)对参数进行赋值：k＝k+1，T _k＝T；

(6)若T不是由根节点单独构成的树，则回到步骤(4)；

识别模块205，用于将待识别用户的多个特征输入所述随机森林，根据所述随机森林的输出确定所述待识别用户的情绪类别，其中所述待识别用户的多个特征根据所述待识别用户步行的加速度时间序列得到。

实施例二的情绪识别装置20以带有情绪类别标签的用户步行的加速度时间序列为训练样本，根据各个训练样本生成随机森林，利用所述随机森林对待识别用户的加速度时间序列进行识别。实施例二实现了根据用户步行过程中的加速度数据识别所述用户的情绪。

实施例三

本实施例提供一种存储介质，该存储介质上存储有计算机可读指令，该计算机可读指令被处理器执行时实现上述情绪识别方法实施例中的步骤，例如图1所示的101-105：

101，获取训练样本集，所述训练样本集中的每个训练样本为用户步行的加速度时间序列，每个训练样本带有标签，所述标签标记所述训练样本对应的情绪类别；

102，对所述训练样本集中的每个训练样本提取多个特征；

103，根据所述训练样本集中的各个训练样本的多个特征构建多个分类回归树；

104，根据所述多个分类回归树生成随机森林；

或者，该计算机可读指令被处理器执行时实现上述装置实施例中各模块的功能，例如图2中的模块201-205：

获取模块201，用于获取训练样本集，所述训练样本集中的每个训练样本为用户步行的加速度时间序列，每个训练样本带有标签，所述标签标记所述训练样本对应的情绪类别；

提取模块202，用于对所述训练样本集中的每个训练样本提取多个特征；

构建模块203，用于根据所述训练样本集中的各个训练样本的多个特征构建多个分类回归树；

生成模块204，用于根据所述多个分类回归树生成随机森林；

实施例四

图3为本申请实施例四提供的计算机装置的示意图。所述计算机装置30包括存储器301、处理器302以及存储在所述存储器301中并可在所述处理器302上运行的计算机程序303，例如情绪识别程序。所述处理器302执行所述计算机程序303时实现上述情绪识别方法实施例中的步骤，例如图1所示的101-105：

102，对所述训练样本集中的每个训练样本提取多个特征；

104，根据所述多个分类回归树生成随机森林；

或者，该计算机程序被处理器执行时实现上述装置实施例中各模块的功能，例如图2中的模块201-205：

生成模块204，用于根据所述多个分类回归树生成随机森林；

示例性的，所述计算机程序303可以被分割成一个或多个模块，所述一个或者多个模块被存储在所述存储器301中，并由所述处理器302执行，以完成本方法。所述一个或多个模块可以是能够完成特定功能的一系列计算机可读指令段，该指令段用于描述所述计算机程序303在所述计算机装置30中的执行过程。例如，所述计算机程序303可以被分割成图2中的获取模块201、提取模块202、构建模块203、生成模块204、识别模块205，各模块具体功能参见实施例二。

所述计算机装置30可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。本领域技术人员可以理解，所述示意图3仅仅是计算机装置30的示例，并不构成对计算机装置30的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述计算机装置30还可以包括输入输出设备、网络接入设备、总线等。

所称处理器302可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array， FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器302也可以是任何常规的处理器等，所述处理器302是所述计算机装置30的控制中心，利用各种接口和线路连接整个计算机装置30的各个部分。

所述存储器301可用于存储所述计算机程序303，所述处理器302通过运行或执行存储在所述存储器301内的计算机程序或模块，以及调用存储在存储器301内的数据，实现所述计算机装置30的各种功能。所述存储器301可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据计算机装置30的使用所创建的数据(比如音频数据)等。此外，存储器301可以包括易失性和非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件或其他存储器件。

所述计算机装置30集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机可读指令代码，所述计算机可读指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括：能够携带所述计算机可读指令代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、存储器、只读存储器(ROM，Read-Only Memory)、随机存储器(RAM，Random Access Memory)等。所述计算机可读存储介质可以是非易失性，也可以是易失性的。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

上述以软件功能模块的形式实现的集成的模块，可以存储在一个计算机可读存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其他的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他模块或步骤，单数不排除复数。系统权利要求中陈述的多个模块或装置也可以由一个模块或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本申请的技术方案而非限制，尽管参照较佳实施例对本申请进行了详细说明，本领域的普通技术人员应当理解，可以对本申请的技术方案进行修改或等同替换，而不脱离本申请技术方案的精神和范围。

Claims

一种情绪识别方法，其中，所述方法包括：

获取训练样本集，所述训练样本集中的每个训练样本为用户步行的加速度时间序列，每个训练样本带有标签，所述标签标记所述训练样本对应的情绪类别；

对所述训练样本集中的每个训练样本提取多个特征；

根据所述训练样本集中的各个训练样本的多个特征构建多个分类回归树；

根据所述多个分类回归树生成随机森林；

将待识别用户的多个特征输入所述随机森林，根据所述随机森林的输出确定所述待识别用户的情绪类别，其中所述待识别用户的多个特征根据所述待识别用户步行的加速度时间序列得到。
如权利要求1所述的情绪识别方法，其中，所述多个特征包括如下各项的任意组合：

加速度时间序列的标准差、平均值、峰值、偏态系数、FFT系数、功率谱密度平均值、功率谱密度标准偏差、坐标轴系数。
如权利要求1所述的情绪识别方法，其中，所述方法还包括：

对所述训练样本集中的每个训练样本的多个特征进行归一化处理，得到每个训练样本归一化后的多个特征；

所述根据所述训练样本集中的各个训练样本的多个特征构建多个分类回归树包括：

根据每个训练样本归一化后的多个特征构建所述多个分类回归树。
如权利要求1所述的情绪识别方法，其中，所述对所述训练样本集中的每个训练样本提取多个特征之前，所述方法还包括：

对所述训练样本进行降噪；和/或

对所述训练样本中的缺失值进行填充；和/或

对所述训练样本中的异常值进行修正。
如权利要求4所述的情绪识别方法，其中，所述对所述训练样本进行降噪包括：

按照以下公式对所述训练样本进行移动平均降噪：

其中，output[i]是所述训练样本中第i个加速度数据对应的输出，w为常量，取值为3或5，input[i+j]是所述训练样本中第i+j个加速度数据。
如权利要求1所述的情绪识别方法，其中，所述根据所述训练样本集的各个训练样本的多个特征构建多个分类回归树包括：

从所述训练样本集中随机选取Q个训练样本作为待分类样本；

从所述待分类样本的多个特征中随机选取K个特征；

确定所述待分类样本的所述K个特征中最优的切分特征和切分点，根据所述最优的切分特征和切分点将所述待分类样本划分为两个子集；

计算划分的每个子集中的待分类样本的标签的均值；

对于划分的每个子集，重复执行所述从所述待分类样本的多个特征中随机选取K个特征至所述计算划分的每个子集中的待分类样本的标签的均值，直至满足预设停止条件。
如权利要求1所述的情绪识别方法，其中，所述根据所述多个分类回归树生成随机森林包括：

对所述多个分类回归树进行剪枝处理；

根据剪枝处理后的所述多个分类回归树生成所述随机森林。
一种计算机装置，其中，所述计算机装置包括处理器，所述处理器用于执行存储器中存储的计算机可读指令以实现以下步骤：

获取训练样本集，所述训练样本集中的每个训练样本为用户步行的加速度时间序列，每个训练样本带有标签，所述标签标记所述训练样本对应的情绪类别；

对所述训练样本集中的每个训练样本提取多个特征；

根据所述训练样本集中的各个训练样本的多个特征构建多个分类回归树；

根据所述多个分类回归树生成随机森林；

将待识别用户的多个特征输入所述随机森林，根据所述随机森林的输出确定所述待识别用户的情绪类别，其中所述待识别用户的多个特征根据所述待识别用户步行的加速度时间序列得到。
如权利要求8所述的计算机装置，其中，所述多个特征包括如下各项的任意组合：

加速度时间序列的标准差、平均值、峰值、偏态系数、FFT系数、功率谱密度平均值、功率谱密度标准偏差、坐标轴系数。
如权利要求8所述的计算机装置，其中，所述处理器执行所述计算机可读指令还用以实现以下步骤：

对所述训练样本集中的每个训练样本的多个特征进行归一化处理，得到每个训练样本归一化后的多个特征；

所述处理器执行所述计算机可读指令以实现所述根据所述训练样本集中的各个训练样本的多个特征构建多个分类回归树时，具体包括：

根据每个训练样本归一化后的多个特征构建所述多个分类回归树。
如权利要求8所述的计算机装置，其中，所述处理器执行所述计算机可读指令以实现所述对所述训练样本集中的每个训练样本提取多个特征之前，还用以实现以下步骤：

对所述训练样本进行降噪；和/或

对所述训练样本中的缺失值进行填充；和/或

对所述训练样本中的异常值进行修正。
如权利要求11所述的计算机装置，其中，所述处理器执行所述计算机可读指令以实现所述对所述训练样本进行降噪时，具体包括：

按照以下公式对所述训练样本进行移动平均降噪：

其中，output[i]是所述训练样本中第i个加速度数据对应的输出，w为常量，取值为3或5，input[i+j]是所述训练样本中第i+j个加速度数据。
如权利要求8所述的计算机装置，其中，所述处理器执行所述计算机可读指令以实现所述根据所述训练样本集的各个训练样本的多个特征构建多个分类回归树时，具体包括：

从所述训练样本集中随机选取Q个训练样本作为待分类样本；

从所述待分类样本的多个特征中随机选取K个特征；

确定所述待分类样本的所述K个特征中最优的切分特征和切分点，根据所述最优的切分特征和切分点将所述待分类样本划分为两个子集；

计算划分的每个子集中的待分类样本的标签的均值；

对于划分的每个子集，重复执行所述从所述待分类样本的多个特征中随机选取K个特征至所述计算划分的每个子集中的待分类样本的标签的均值，直至满足预设停止条件。
如权利要求8所述的计算机装置，其中，所述处理器执行所述计算机可读指令以实现所述根据所述多个分类回归树生成随机森林时，具体包括：

对所述多个分类回归树进行剪枝处理；

根据剪枝处理后的所述多个分类回归树生成所述随机森林。
一种存储介质，所述存储介质上存储有计算机可读指令，其中，所述计算机可读指令被处理器执行时实现以下步骤：

获取训练样本集，所述训练样本集中的每个训练样本为用户步行的加速度时间序列，每个训练样本带有标签，所述标签标记所述训练样本对应的情绪类别；

对所述训练样本集中的每个训练样本提取多个特征；

根据所述训练样本集中的各个训练样本的多个特征构建多个分类回归树；

根据所述多个分类回归树生成随机森林；

将待识别用户的多个特征输入所述随机森林，根据所述随机森林的输出确定所述待识别用户的情绪类别，其中所述待识别用户的多个特征根据所述待识别用户步行的加速度时间序列得到。
如权利要求15所述的存储介质，其中，所述计算机可读指令被所述处理器执行还实现以下步骤：

对所述训练样本集中的每个训练样本的多个特征进行归一化处理，得到每个训练样本归一化后的多个特征；

所述计算机可读指令被所述处理器执行以实现所述根据所述训练样本集中的各个训练样本的多个特征构建多个分类回归树时，具体包括：

根据每个训练样本归一化后的多个特征构建所述多个分类回归树。
如权利要求15所述的存储介质，其中，所述计算机可读指令被所述处理器执行以实现所述对所述训练样本集中的每个训练样本提取多个特征之前，还实现以下步骤：

对所述训练样本进行降噪；和/或

对所述训练样本中的缺失值进行填充；和/或

对所述训练样本中的异常值进行修正。
如权利要求17所述的存储介质，其中，所述计算机可读指令被所述处理器执行以实现所述对所述训练样本进行降噪时，具体包括：

按照以下公式对所述训练样本进行移动平均降噪：

其中，output[i]是所述训练样本中第i个加速度数据对应的输出，w为常量，取值为3或5，input[i+j]是所述训练样本中第i+j个加速度数据。
如权利要求15所述的存储介质，其中，所述计算机可读指令被所述处理器执行以实现所述根据所述训练样本集的各个训练样本的多个特征构建多个分类回归树时，具体包括：

从所述训练样本集中随机选取Q个训练样本作为待分类样本；

从所述待分类样本的多个特征中随机选取K个特征；

确定所述待分类样本的所述K个特征中最优的切分特征和切分点，根据所述最优的切分特征和切分点将所述待分类样本划分为两个子集；

计算划分的每个子集中的待分类样本的标签的均值；

对于划分的每个子集，重复执行所述从所述待分类样本的多个特征中随机选取K个特征至所述计算划分的每个子集中的待分类样本的标签的均值，直至满足预设停止条件。
一种情绪识别装置，其中，所述装置包括：

获取模块，用于获取训练样本集，所述训练样本集中的每个训练样本为用户步行的加速度时间序列，每个训练样本带有标签，所述标签标记所述训练样本对应的情绪类别；

提取模块，用于对所述训练样本集中的每个训练样本提取多个特征；

构建模块，用于根据所述训练样本集中的各个训练样本的多个特征构建多个分类回归树；

生成模块，用于根据所述多个分类回归树生成随机森林；

识别模块，用于将待识别用户的多个特征输入所述随机森林，根据所述随机森林的输出确定所述待识别用户的情绪类别，其中所述待识别用户的多个特征根据所述待识别用户步行的加速度时间序列得到。