WO2021036664A1

WO2021036664A1 - 基于微表情的客户满意度识别方法、装置、终端及介质

Info

Publication number: WO2021036664A1
Application number: PCT/CN2020/105631
Authority: WO
Inventors: 严月强
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2019-08-26
Filing date: 2020-07-29
Publication date: 2021-03-04
Also published as: CN110705349A

Abstract

本申请涉及人工智能技术领域，提供了一种基于微表情的客户满意度识别方法、装置、终端及介质，所述方法包括：每隔预设采集周期获取客户的全身图像和预设时长的音频数据；从全身图像中提取预定点的表情特征和肢体特征，从音频数据中提取语速特征和音调特征；同时将表情特征输入至表情满意度识别模型中得到第一满意度分值，将肢体特征输入至肢体满意度识别模型中得到第二满意度分值，将语速特征和音调特征输入至语音满意度识别模型中得到第三满意度分值；根据所述第一、第二和第三满意度分值计算所述客户的最终满意度并输出。本申请能够解决在整个服务过程中客户无表情时无法计算客户的满意度的技术问题。

Description

基于微表情的客户满意度识别方法、装置、终端及介质

本申请要求于2019年08月26日提交中国专利局、申请号为201910792765.6，发明名称为“基于微表情的客户满意度识别方法、装置、终端及介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，具体涉及一种基于微表情的客户满意度识别方法、装置、终端及介质。

背景技术

随着人类对服务质量的要求越来越高，客户对服务的满意度成为了人们关注的焦点，目前的满意度调查都是通过用户主动输入或填写问卷的形式获取，但通常情况下用户不愿意输入或者碍于情面不好意思输入较低的分数，导致满意度调查结果不准确。发明人意识到，现有技术中虽然也有通过微表情识别技术来识别用户的满意度，但是微表情识别技术需要获取到用户的面部表情，才能识别出用户的满意度，倘若用户无面部表情时，或者在用户佩戴有口罩、低头等情况下导致无法获取面部表情时，则无法通过微表情识别技术来识别用户的满意度。

因此，有必要提供一种新的方案，能够解决客户无表情时客户的满意度的识别问题。

发明内容

鉴于以上内容，有必要提出一种基于微表情的客户满意度识别方法、装置、终端及介质，能够解决在整个服务过程中客户无表情时无法计算客户的满意度的技术问题。

本申请的第一方面提供一种基于微表情的客户满意度识别方法，所述方法包括：

每隔预设采集周期获取客户的全身图像和预设时长的音频数据；

从所述全身图像中提取预定点的表情特征和肢体特征，及从所述音频数据中提取语速特征和音调特征；

同时将所述表情特征输入至预先训练好的表情满意度识别模型中，将所述肢体特征输入至预先训练好的肢体满意度识别模型中，将所述语速特征和音调特征输入至预先训练好的语音满意度识别模型中；

获取所述表情满意度识别模型输出的第一满意度分值、所述肢体满意度识别模型输出的第二满意度分值及语音满意度识别模型输出的第三满意度分值；

根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度并输出。

本申请的第二方面提供一种基于微表情的客户满意度识别装置，所述装置包括：

第一获取模块，用于每隔预设采集周期获取客户的全身图像和预设时长的音频数据；

提取模块，用于从所述全身图像中提取预定点的表情特征和肢体特征，及从所述音频数据中提取语速特征和音调特征；

输入模块，用于同时将所述表情特征输入至预先训练好的表情满意度识别模型中，将所述肢体特征输入至预先训练好的肢体满意度识别模型中，将所述语速特征和音调特征输入至预先训练好的语音满意度识别模型中；

第二获取模块，用于获取所述表情满意度识别模型输出的第一满意度分值、所述肢体满意度识别模型输出的第二满意度分值及语音满意度识别模型输出的第三满意度分值；

计算模块，用于根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度并输出。

本申请的第三方面提供一种终端，所述终端包括处理器，所述处理器用于执行存储器中存储的计算机可读指令时实现以下步骤：

本申请的第四方面提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现以下步骤：

综上所述，本申请所述的基于微表情的客户满意度识别方法、装置、终端及介质，可应用在智慧政务等领域，从而推动智慧城市的发展。本申请通过在服务过程中，采集客户的表情特征、肢体特征、语速特征和音调特征，然后利用多个满意度识别模型分别对所述的表情特征、肢体特征、语速特征和音调特征进行识别，得到不同的满意度分值，最后基于不同的满意度分值计算得到最终的满意度。相对于现有技术中单一采用面部表情而言，能够解决在整个服务过程中客户无表情时无法计算客户的满意度的技术问题，且通过采用多个特征，综合考虑了客户的全方位信息，计算得到的满意度更具现实意义，提高了满意度的采集成功率，保证了满意度采集的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1是本申请实施例一提供的基于微表情的客户满意度识别方法的流程图。

图2是本申请实施例二提供的基于微表情的客户满意度识别装置的结构图。

图3是本申请实施例三提供的终端的结构示意图。

如下具体实施方式将结合上述附图进一步说明本申请。

具体实施方式

为了能够更清楚地理解本申请的上述目的、特征和优点，下面结合附图和具体实施例对本申请进行详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本申请，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请。

实施例一

在本实施例中，所述基于微表情的客户满意度识别方法可以应用于终端中，对于需要进行语音控制的终端，可以直接在终端上集成本申请的方法所提供的基于微表情的客户满意度识别的功能，或者以软件开发工具包(Software Development Kit，SKD)的形式运行在终端中。

如图1所示，所述基于微表情的客户满意度识别方法具体包括以下步骤，根据不同的需求，该流程图中步骤的顺序可以改变，某些可以省略。

S11，每隔预设采集周期获取客户的全身图像和预设时长的音频数据。

本实施例中，可以预先设置采集周期，如可以设置每5秒或者10秒为一个采集周期。

在客服与客户的交互过程中，控制预先装设的摄像装置每隔预设周期获取一次客户的全身图像，在获取客户的全身图像的同时，还采集客户的预设时长的一段音频数据。

在其他实施例中，还可以预先设置第一采集周期和第二采集周期，在所述第一采集周期内采集客户的全身图像，在所述第二采集周期内采集客户的音频数据。

S12，从所述全身图像中提取预定点的表情特征和肢体特征，及从所述音频数据中提取语速特征和音调特征。

面部表情是一种可完成精细信息沟通的体语形式，人的面部有十块肌肉，可产生极其丰富的表情，准确传达各种不同的心态和情感，通过面部表情可确定出客户的肯定和否定、愉悦和失望、满意和不满意等情感。一般来说，表现满意的关键部位是嘴、颊、眉、额头，表现不满意的关键部位是嘴、眉头。譬如，一个人眉毛上扬、挤在一起，呈现出的是一种恐惧、忧虑的表情；鼻孔外翻、嘴唇紧抿，呈现出的是一种愤怒的表情；下巴扬起、嘴角下垂，呈现出的是一种自责的表情。因此，可以预先设定嘴角、眼脸、眉毛、额头、下巴为特征点，即，嘴角、眼脸、眉毛、额头、下巴等部位为预定点。

具体的，所述从所述全身图像中提取预定点的表情特征包括：根据预先设置的人脸检测算法从所述全身图像中检测出人脸；提取出所述人脸中预定点的表情特征。

在通过肢体动作表达情绪时，也会有一些惯用的动作，手势、站姿和身体姿势都能表现出某种情绪，例如，鼓掌表示兴奋；顿足表示生气，搓手表示焦虑，锤头表示沮丧等。因此，在获取到客户的全身图像之后，提取出全身图像中的手势、站姿和身体姿势等肢体特征。

语速的快慢、音调的高低能够表达不同的情绪，比如，人在愤怒的情况下，语速较快、音调较高；人在欢喜的情况下，则语速较缓、音调适中；而人在悲伤的情况下，语速较慢、音调较低。因此，在获取到客户的预设时长的音频数据之后，提取出所述音频数据中的语速和音调。

本实施例中，提取表情特征、肢体特征、语速特征和音调特征均为现有技术，在此不再详细赘述。

S13，将所述表情特征输入至预先训练好的表情满意度识别模型中，将所述肢体特征输入至预先训练好的肢体满意度识别模型中，将所述语速特征和音调特征输入至预先训练好的语音满意度识别模型中。

本实施例中，所述表情满意度识别模型、肢体满意度识别模型、语音满意度识别模型均是预先训练好的满意度识别模型，在得到表情特征、肢体特征、语速特征和音调特征之后，同时将表情特征、肢体特征、语速特征和音调特征分别输入至表情满意度识别模型、肢体满意度识别模型、语音满意度识别模型中进行满意度识别。

其中，所述表情满意度识别模型的训练过程包括：

1)获取历史用户的表情特征及对应的满意度分值，形成数据集；

2)将所述数据集随机分为第一数量的训练集和第二数量的测试集；

3)将所述训练集输入至预设卷积神经网络中进行训练，得到表情满意度识别模型；

4)将所述测试集输入至所述表情满意度识别模型中进行测试，得到测试通过率；

5)判断所述测试通过率是否大于预设通过率阈值；

6)当所述测试通过率大于或者等于所述预设通过率阈值时，结束表情满意度识别模型的训练；否则，当所述测试通过率小于所述预设通过率阈值时，重新训练表情满意度识别模型直至所述测试通过率大于或者等于所述预设通过率阈值。

关于所述肢体满意度识别模型和语音满意度识别模型的训练过程同所述表情满意度识别过程，在此不再详细阐述。

本实施例中，根据不同的表情特征、肢体特征、语速特征和音调特征预先设置不同的满意度分值，例如，开心的表情对应的满意度分值为5分，恼羞成怒的表情对应的满意度为-5分。为了便于表述，将无表情对应的满意度分值记为0分。语速快、音调高对应的满意度分值为-5分；语速平缓、音调适中对应的满意度分值为5分。

可以在后续服务过程中，将用户的表情特征、肢体特征、语速特征和音调特征及满意度分值作为新的数据，以增加所述数据集的数量，并基于新的数据集来重新训练表情满意度识别模型、肢体满意度识别模型、语音满意度识别模型，从而不断的提高各个满意度识别模型的识别率。

S14，获取所述表情满意度识别模型输出的第一满意度分值、所述肢体满意度识别模型输出的第二满意度分值及语音满意度识别模型输出的第三满意度分值。

本实施例中，将表情特征输入至表情满意度识别模型中之后，即可通过表情满意度识别模型输出第一满意度分值，所述第一满意度分值代表了客户的表情特征对应的满意度情况。同理，将肢体特征输入至肢体满意度识别模型中之后，即可通过肢体满意度识别模型输出第二满意度分值，所述第二满意度分值代表了客户的肢体特征对应的满意度情况。将语速特征和音调特征输入至语音满意度识别模型中之后，即可通过语音满意度识别模型输出第三满意度分值，所述第三满意度分值代表了客户的语速特征和音调特征对应的满意度情况。不同的满意度分值，代表了不同的满意度情况。

S15，根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度并输出。

本实施例中，将所述第一满意度分值、第二满意度分值和第三满意度分值进行加和平均即可得到客户的最终满意度。

因此可见，客户的最终满意度是根据表情特征、肢体特征、语速特征和音调特征综合计算得到的，有效的结合了客户的全方位信息，得到的满意度更具参考意义。且当客户无表情、或者无语音交互、或者无肢体中的任意一种的情况下，依然能计算得到满意度。

优选的，所述根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度包括：

统计采集的次数；

根据所述采集的次数计算多个所述第一满意度分值的第一平均满意度分值、多个所述第二满意度分值的第二平均满意度分值及多个所述第三满意度分值的第三平均满意度分值；

计算所述第一平均满意度分值与预设第一权重值的乘积，得到第一最终满意度；

计算所述第二平均满意度分值与预设第二权重值的乘积，得到第二最终满意度；

计算所述第三平均满意度分值与预设第三权重值的乘积，得到第三最终满意度；

对所述第一最终满意度、所述第二最终满意度和所述第三最终满意度进行加和平均，得到所述最终满意度。

本实施例中，由于表情特征最能直观的表达出客户的情绪，肢体特征带有一定的惯性，因此，可以预先设置表情特征对应的第一权重值最大，肢体特征对应的第二权重值最小，语速特征和音调特征对应的第三权重值居中。所述第一权重值、第二权重值和第三权重值之和为1。

示例性，假设在2分钟的交互过程中，每隔10秒采集一次客户的全身图像和3秒的语音片段，则通过表情满意度识别模型可以输出12个第一满意度分值、12个第二满意度分值和12个第三满意度分值。将12个第一满意度分值进行加总后除以12，即可得到第一平均满意度分值。同理，可以计算出第二平均满意度分值及第三平均满意度分值。最后根据第一平均满意度分值与第一权重值、第二平均满意度分值与第二权重值、第三平均满意度分值与第三权重值，计算得到最终满意度。采用统计学的方法计算得到的最终满意度代表了在服务的过程中的一个总体的满意度。

进一步的，在所述根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度之后，所述方法还包括：

判断所述最终满意度是否小于预设满意度阈值；

若确定所述最终满意度小于所述预设满意度阈值时，根据预设告警方式对客服进行告警。

本实施例中，将客服的服务过程的满意程度分为四个等级，第一等级：客户非常满意；第二等级：客户比较满意；第三等级：客户基本满意；第四等级：客户非常满意。不同等级的满意度对应不同的满意度分值，如第一等级对应的满意度分值为15-20分，第一等级对应的满意度分值为10-15分；第三等级对应的满意度分值为5-10分，第四等级对应的满意度分值为0-5分。预先设置一个满意度阈值，例如，5分，当最终满意度小于5分时，确定客户非常不满意，根据预先设置的告警方式对客服进行告警。

所述预设告警方式可以是，在客服的显示屏幕上显示告警内容；或者通过邮件、短信方式发送告警信息。

通过在服务结束后，得到最终满意度，并当最终满意度低于预设满意度阈值时，对客服进行告警，有助于提高客服在后续的服务质量。

在其他实施例中，当获取所述表情满意度识别模型输出的第一满意度分值、所述肢体满意度识别模型输出的第二满意度分值及语音满意度识别模型输出的第三满意度分值之后，所述方法还包括：

判断所述第一满意度分值是否小于第一满意度分值阈值、所述第二满意度分值是否小于第二满意度分值阈值、所述第三满意度分值是否小于第三满意度分值阈值；

当确定所述第一满意度分值小于所述第一满意度分值阈值，或者所述第二满意度分值小于所述第二满意度分值阈值，或者所述第三满意度分值小于所述第三满意度分值阈值时，记录次数增加1；

判断所述记录次数是否大于记录次数阈值；

当确定所述记录次数大于所述记录次数阈值时，根据所述预设告警方式对客户进行告警。

本实施例中，从第一个采集周期获取到客户的全身图像和语音片段，并根据多个满意度识别模型识别出客户这第一个采集周期的满意度分值，当有一个满意度分值小于预设满意度分值时，将记录次数增加1。在后续的采集周期内，若随着记录次数的增加，当记录次数大于记录次数阈值时，表明在客服服务的过程中，客户已经明显的表现出了不满意的情绪，且不满意的情绪的次数较多，此时需要对客服进行告警，使得客服提高服务质量，避免将客户的不满意情绪爆发到不可收拾的地步。

更进一步的，在所述根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度之后，所述方法还包括：

从所述第一满意度分值中筛选出最低的第一目标满意度分值、从所述第二满意度分值中筛选出最低的第二目标满意度分值、所述第三满意度分值中筛选出最低的第三目标满意度分值；

识别所述第一目标满意度分值、所述第二目标满意度分值、所述第三目标满意度分值的目标时间节点；

从获取的客服的视频流中提取对应所述目标时间节点的预设时长的视频片段；

将所述视频片段发送给所述客服。

本实施例中，还通过摄像装置拍摄客服的整个服务的视频流，由于在客服与客户交互的过程中，可能会存在某一时刻言语不当或者其他因素导致在该时刻时，客户的满意度非常低，此时通过满意度识别模型输出的满意度分值也会非常低，将该时刻对应的视频片段提取出来发送给客户进行观看与分析，便于后续服务时改善言语不当等行为，有助于提高服务质量。

本申请所述的一种基于微表情的客户满意度识别方法，可应用在智慧政务等领域，从而推动智慧城市的发展。本申请通过在服务过程中，采集客户的表情特征、肢体特征、语速特征和音调特征，然后利用多个满意度识别模型分别对所述的表情特征、肢体特征、语速特征和音调特征进行识别，得到不同的满意度分值，最后基于不同的满意度分值计算得到最终的满意度。相对于现有技术中单一采用面部表情而言，能够解决在整个服务过程中客户无表情时无法计算客户的满意度的技术问题，且通过采用多个特征，综合考虑了客户的全方位信息，计算得到的满意度更具现实意义，提高了满意度的采集成功率，保证了满意度采集的准确性。

实施例二

在一些实施例中，所述基于微表情的客户满意度识别装置20可以包括多个由计算机可读指令所组成的功能模块。所述基于微表情的客户满意度识别装置20中的各个程序段的计算机可读指令可以存储于终端的存储器中，并由所述至少一个处理器所执行，以执行(详见图1描述)基于微表情的客户满意度识别的功能。

本实施例中，所述基于微表情的客户满意度识别装置20，根据其所执行的功能，可以被划分为多个功能模块。所述功能模块可以包括：第一获取模块201、提取模块202、输入模块203、训练模块204、第二获取模块205、计算模块206、告警模块207及筛选模块208。本申请所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机可读指令，其存储在存储器中。在本实施例中，关于各模块的功能将在后续的实施例中详述。

第一获取模块201，用于每隔预设采集周期获取客户的全身图像和预设时长的音频数据。

提取模块202，用于从所述全身图像中提取预定点的表情特征和肢体特征，及从所述音频数据中提取语速特征和音调特征。

输入模块203，用于将所述表情特征输入至预先训练好的表情满意度识别模型中，将所述肢体特征输入至预先训练好的肢体满意度识别模型中，将所述语速特征和音调特征输入至预先训练好的语音满意度识别模型中。

训练模块204，用于训练所述表情满意度识别模型，包括：

5)判断所述测试通过率是否大于预设通过率阈值；

第二获取模块205，用于获取所述表情满意度识别模型输出的第一满意度分值、所述肢体满意度识别模型输出的第二满意度分值及语音满意度识别模型输出的第三满意度分值。

计算模块206，用于根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度并输出。

优选的，所述计算模块206根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度包括：

统计采集的次数；

进一步的，在所述根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度之后，所述基于微表情的客户满意度识别装置20还包括：

告警模块207，用于判断所述最终满意度是否小于预设满意度阈值；若确定所述最终满意度小于所述预设满意度阈值时，根据预设告警方式对客服进行告警。

在其他实施例中，当获取所述表情满意度识别模型输出的第一满意度分值、所述肢体满意度识别模型输出的第二满意度分值及语音满意度识别模型输出的第三满意度分值之后，所述基于微表情的客户满意度识别装置20还包括：

判断所述记录次数是否大于记录次数阈值；

更进一步的，在所述根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度之后，所述基于微表情的客户满意度识别装置20还包括：

筛选模块208，用于从所述第一满意度分值中筛选出最低的第一目标满意度分值、从所述第二满意度分值中筛选出最低的第二目标满意度分值、所述第三满意度分值中筛选出最低的第三目标满意度分值；识别所述第一目标满意度分值、所述第二目标满意度分值、所述第三目标满意度分值的目标时间节点；从获取的客服的视频流中提取对应所述目标时间节点的预设时长的视频片段；将所述视频片段发送给所述客服。

本申请所述的一种基于微表情的客户满意度识别装置，可应用在智慧政务等领域，从而推动智慧城市的发展。本申请通过在服务过程中，采集客户的表情特征、肢体特征、语速特征和音调特征，然后利用多个满意度识别模型分别对所述的表情特征、肢体特征、语速特征和音调特征进行识别，得到不同的满意度分值，最后基于不同的满意度分值计算得到最终的满意度。相对于现有技术中单一采用面部表情而言，能够解决在整个服务过程中客户无表情时无法计算客户的满意度的技术问题，且通过采用多个特征，综合考虑了客户的全方位信息，计算得到的满意度更具现实意义，提高了满意度的采集成功率，保证了满意度采集的准确性。

实施例三

参阅图3所示，为本申请实施例三提供的终端的结构示意图。在本申请较佳实施例中，所述终端3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。

本领域技术人员应该了解，图3示出的终端的结构并不构成本申请实施例的限定，既可以是总线型结构，也可以是星形结构，所述终端3还可以包括比图示更多或更少的其他硬件或者软件，或者不同的部件布置。

在一些实施例中，所述终端3包括一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的智能设备，其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述终端3还可包括客户设备，所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、数码相机等。

需要说明的是，所述终端3仅为举例，其他现有的或今后可能出现的电子产品如可适应于本申请，也应包含在本申请的保护范围以内，并以引用方式包含于此。

在一些实施例中，所述存储器31用于存储计算机可读指令和各种数据，例如安装在所述终端3中的基于微表情的客户满意度识别装置20，并在终端3的运行过程中实现高速、自动地完成程序或数据的存取。所述存储器31包括易失性和非易失性存储器，例如随机存取存储器(Random Access Memory，RAM)、只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable Read-Only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory，OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者其他能够用于携带或存储数据的计算机可读的存储介质。所述计算机可读存储介质可以是非易失性，也可以是易失性的。在一些实施例中，所述至少一个处理器32可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(Central Processing unit，CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述至少一个处理器32是所述终端3的控制核心(Control Unit)，利用各种接口和线路连接整个终端3的各个部件，通过运行或执行存储在所述存储器31内的程序或者模块，以及调用存储在所述存储器31内的数据，以执行终端3的各种功能和处理数据，例如执行基于微表情的客户满意度识别的功能。

在一些实施例中，所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。

尽管未示出，所述终端3还可以包括给各个部件供电的电源(比如电池)，优选的，电源可以通过电源管理装置与所述至少一个处理器32逻辑相连，从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述终端3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等，在此不再赘述。

应该了解，所述实施例仅为说明之用，在专利申请范围上并不受此结构的限制。

上述以软件功能模块的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，终端，或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分。

在进一步的实施例中，结合图2，所述至少一个处理器32可执行所述终端3的操作装置以及安装的各类应用程序(如所述的基于微表情的客户满意度识别装置20)、计算机可读指令等，例如，上述的各个模块。

所述存储器31中存储有计算机可读指令，且所述至少一个处理器32可调用所述存储器31中存储的计算机可读指令以执行相关的功能。例如，图2中所述的各个模块是存储在所述存储器31中的计算机可读指令，并由所述至少一个处理器32所执行，从而实现所述各个模块的功能以达到基于微表情的客户满意度识别的目的。

在本申请的一个实施例中，所述存储器31存储多个指令，所述多个指令被所述至少一个处理器32所执行以实现基于微表情的客户满意度识别的功能。

具体地，所述至少一个处理器32对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述，在此不赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本申请不限于上述示范性实施例的细节，而且在不背离本申请的精神或基本特征的情况下，能够以其他的具体形式实现本申请。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或，单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本申请的技术方案而非限制，尽管参照较佳实施例对本申请进行了详细说明，本领域的普通技术人员应当理解，可以对本申请的技术方案进行修改或等同替换，而不脱离本申请技术方案的精神和范围。

Claims

一种基于微表情的客户满意度识别方法，其中，所述方法包括：

每隔预设采集周期获取客户的全身图像和预设时长的音频数据；

从所述全身图像中提取预定点的表情特征和肢体特征，及从所述音频数据中提取语速特征和音调特征；

同时将所述表情特征输入至预先训练好的表情满意度识别模型中，将所述肢体特征输入至预先训练好的肢体满意度识别模型中，将所述语速特征和音调特征输入至预先训练好的语音满意度识别模型中；

获取所述表情满意度识别模型输出的第一满意度分值、所述肢体满意度识别模型输出的第二满意度分值及语音满意度识别模型输出的第三满意度分值；

根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度并输出。
如权利要求1所述的基于微表情的客户满意度识别方法，其中，所述根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度包括：

统计采集的次数；

根据所述采集的次数计算多个所述第一满意度分值的第一平均满意度分值、多个所述第二满意度分值的第二平均满意度分值及多个所述第三满意度分值的第三平均满意度分值；

计算所述第一平均满意度分值与预设第一权重值的乘积，得到第一最终满意度；

计算所述第二平均满意度分值与预设第二权重值的乘积，得到第二最终满意度；

计算所述第三平均满意度分值与预设第三权重值的乘积，得到第三最终满意度；

对所述第一最终满意度、所述第二最终满意度和所述第三最终满意度进行加和平均，得到所述最终满意度。
如权利要求1所述的基于微表情的客户满意度识别方法，其中，在所述根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度之后，所述方法还包括：

判断所述最终满意度是否小于预设满意度阈值；

若确定所述最终满意度小于所述预设满意度阈值时，根据预设告警方式对客服进行告警。
如权利要求3所述的基于微表情的客户满意度识别方法，其中，当获取所述表情满意度识别模型输出的第一满意度分值、所述肢体满意度识别模型输出的第二满意度分值及语音满意度识别模型输出的第三满意度分值之后，所述方法还包括：

判断所述第一满意度分值是否小于第一满意度分值阈值、所述第二满意度分值是否小于第二满意度分值阈值、所述第三满意度分值是否小于第三满意度分值阈值；

当确定所述第一满意度分值小于所述第一满意度分值阈值，或者所述第二满意度分值小于所述第二满意度分值阈值，或者所述第三满意度分值小于所述第三满意度分值阈值时，记录次数增加1；

判断所述记录次数是否大于记录次数阈值；

当确定所述记录次数大于所述记录次数阈值时，根据所述预设告警方式对客户进行告警。
如权利要求1所述的基于微表情的客户满意度识别方法，其中，在所述根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度之后，所述方法还包括：

从所述第一满意度分值中筛选出最低的第一目标满意度分值、从所述第二满意度分值中筛选出最低的第二目标满意度分值、所述第三满意度分值中筛选出最低的第三目标满意度分值；

识别所述第一目标满意度分值、所述第二目标满意度分值、所述第三目标满意度分值的目标时间节点；

从获取的客服的视频流中提取对应所述目标时间节点的预设时长的视频片段；

将所述视频片段发送给所述客服。
如权利要求1所述的基于微表情的客户满意度识别方法，其中，所述表情满意度识别模型的训练过程包括：

获取历史用户的表情特征及对应的满意度分值，形成数据集；

将所述数据集随机分为第一数量的训练集和第二数量的测试集；

将所述训练集输入至预设卷积神经网络中进行训练，得到表情满意度识别模型；

将所述测试集输入至所述表情满意度识别模型中进行测试，得到测试通过率；

判断所述测试通过率是否大于预设通过率阈值；

当所述测试通过率大于或者等于所述预设通过率阈值时，结束表情满意度识别模型的训练；否则，当所述测试通过率小于所述预设通过率阈值时，重新训练表情满意度识别模型直至所述测试通过率大于或者等于所述预设通过率阈值。
如权利要求1至6中任意一项所述的基于微表情的客户满意度识别方法，其中，从所述全身图像中提取预定点的表情特征包括：

根据预先设置的人脸检测算法从所述全身图像中检测出人脸；

提取所述人脸中预定点的表情特征，所述预定点包括：嘴角、眼脸、眉毛、额头、下巴。
一种基于微表情的客户满意度识别装置，其中，所述装置包括：

第一获取模块，用于每隔预设采集周期获取客户的全身图像和预设时长的音频数据；

提取模块，用于从所述全身图像中提取预定点的表情特征和肢体特征，及从所述音频数据中提取语速特征和音调特征；

输入模块，用于同时将所述表情特征输入至预先训练好的表情满意度识别模型中，将所述肢体特征输入至预先训练好的肢体满意度识别模型中，将所述语速特征和音调特征输入至预先训练好的语音满意度识别模型中；

第二获取模块，用于获取所述表情满意度识别模型输出的第一满意度分值、所述肢体满意度识别模型输出的第二满意度分值及语音满意度识别模型输出的第三满意度分值；

计算模块，用于根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度并输出。
一种终端，其中，所述终端包括处理器，所述处理器用于执行存储器中存储的计算机可读指令以实现以下步骤：

每隔预设采集周期获取客户的全身图像和预设时长的音频数据；

从所述全身图像中提取预定点的表情特征和肢体特征，及从所述音频数据中提取语速特征和音调特征；

同时将所述表情特征输入至预先训练好的表情满意度识别模型中，将所述肢体特征输入至预先训练好的肢体满意度识别模型中，将所述语速特征和音调特征输入至预先训练好的语音满意度识别模型中；

获取所述表情满意度识别模型输出的第一满意度分值、所述肢体满意度识别模型输出的第二满意度分值及语音满意度识别模型输出的第三满意度分值；

根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度并输出。
如权利要求9所述的终端，其中，所述处理器执行所述计算机可读指令以实现根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度时，具体包括：

统计采集的次数；

根据所述采集的次数计算多个所述第一满意度分值的第一平均满意度分值、多个所述第二满意度分值的第二平均满意度分值及多个所述第三满意度分值的第三平均满意度分值；

计算所述第一平均满意度分值与预设第一权重值的乘积，得到第一最终满意度；

计算所述第二平均满意度分值与预设第二权重值的乘积，得到第二最终满意度；

计算所述第三平均满意度分值与预设第三权重值的乘积，得到第三最终满意度；

对所述第一最终满意度、所述第二最终满意度和所述第三最终满意度进行加和平均，得到所述最终满意度。
如权利要求9所述的终端，其中，在所述根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度之后，所述处理器执行所述计算机可读指令还用以实现以下步骤：

判断所述最终满意度是否小于预设满意度阈值；

若确定所述最终满意度小于所述预设满意度阈值时，根据预设告警方式对客服进行告警。
如权利要求11所述的终端，其中，当获取所述表情满意度识别模型输出的第一满意度分值、所述肢体满意度识别模型输出的第二满意度分值及语音满意度识别模型输出的第三满意度分值之后，所述处理器执行所述计算机可读指令还用以实现以下步骤：

判断所述第一满意度分值是否小于第一满意度分值阈值、所述第二满意度分值是否小于第二满意度分值阈值、所述第三满意度分值是否小于第三满意度分值阈值；

当确定所述第一满意度分值小于所述第一满意度分值阈值，或者所述第二满意度分值小于所述第二满意度分值阈值，或者所述第三满意度分值小于所述第三满意度分值阈值时，记录次数增加1；

判断所述记录次数是否大于记录次数阈值；

当确定所述记录次数大于所述记录次数阈值时，根据所述预设告警方式对客户进行告警。
如权利要求9所述的终端，其中，在所述根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度之后，所述处理器执行所述计算机可读指令还用以实现以下步骤：

从所述第一满意度分值中筛选出最低的第一目标满意度分值、从所述第二满意度分值中筛选出最低的第二目标满意度分值、所述第三满意度分值中筛选出最低的第三目标满意度分值；

识别所述第一目标满意度分值、所述第二目标满意度分值、所述第三目标满意度分值的目标时间节点；

从获取的客服的视频流中提取对应所述目标时间节点的预设时长的视频片段；

将所述视频片段发送给所述客服。
如权利要求9所述的终端，其中，所述表情满意度识别模型的训练过程包括：

获取历史用户的表情特征及对应的满意度分值，形成数据集；

将所述数据集随机分为第一数量的训练集和第二数量的测试集；

将所述训练集输入至预设卷积神经网络中进行训练，得到表情满意度识别模型；

将所述测试集输入至所述表情满意度识别模型中进行测试，得到测试通过率；

判断所述测试通过率是否大于预设通过率阈值；

当所述测试通过率大于或者等于所述预设通过率阈值时，结束表情满意度识别模型的训练；否则，当所述测试通过率小于所述预设通过率阈值时，重新训练表情满意度识别模型直至所述测试通过率大于或者等于所述预设通过率阈值。
如权利要求9至14中任意一项所述的终端，其中，所述处理器执行所述计算机可读指令以实现从所述全身图像中提取预定点的表情特征时，具体包括：

根据预先设置的人脸检测算法从所述全身图像中检测出人脸；

提取所述人脸中预定点的表情特征，所述预定点包括：嘴角、眼脸、眉毛、额头、下巴。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，其中，所述计算机可读指令被处理器执行时实现以下步骤：

每隔预设采集周期获取客户的全身图像和预设时长的音频数据；

从所述全身图像中提取预定点的表情特征和肢体特征，及从所述音频数据中提取语速特征和音调特征；

同时将所述表情特征输入至预先训练好的表情满意度识别模型中，将所述肢体特征输入至预先训练好的肢体满意度识别模型中，将所述语速特征和音调特征输入至预先训练好的语音满意度识别模型中；

获取所述表情满意度识别模型输出的第一满意度分值、所述肢体满意度识别模型输出的第二满意度分值及语音满意度识别模型输出的第三满意度分值；

根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度并输出。
如权利要求16所述的计算机可读存储介质，其中，所述计算机可读指令被处理器执行以实现根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度时，具体包括：

统计采集的次数；

根据所述采集的次数计算多个所述第一满意度分值的第一平均满意度分值、多个所述第二满意度分值的第二平均满意度分值及多个所述第三满意度分值的第三平均满意度分值；

计算所述第一平均满意度分值与预设第一权重值的乘积，得到第一最终满意度；

计算所述第二平均满意度分值与预设第二权重值的乘积，得到第二最终满意度；

计算所述第三平均满意度分值与预设第三权重值的乘积，得到第三最终满意度；

对所述第一最终满意度、所述第二最终满意度和所述第三最终满意度进行加和平均，得到所述最终满意度。
如权利要求16所述的计算机可读存储介质，其中，在所述根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度之后，所述计算机可读指令被所述处理器执行还用以实现以下步骤：

判断所述最终满意度是否小于预设满意度阈值；

若确定所述最终满意度小于所述预设满意度阈值时，根据预设告警方式对客服进行告警。
如权利要求18所述的计算机可读存储介质，其中，当获取所述表情满意度识别模型输出的第一满意度分值、所述肢体满意度识别模型输出的第二满意度分值及语音满意度识别模型输出的第三满意度分值之后，所述计算机可读指令被所述处理器执行还用以实现以下步骤：

判断所述第一满意度分值是否小于第一满意度分值阈值、所述第二满意度分值是否小于第二满意度分值阈值、所述第三满意度分值是否小于第三满意度分值阈值；

当确定所述第一满意度分值小于所述第一满意度分值阈值，或者所述第二满意度分值小于所述第二满意度分值阈值，或者所述第三满意度分值小于所述第三满意度分值阈值时，记录次数增加1；

判断所述记录次数是否大于记录次数阈值；

当确定所述记录次数大于所述记录次数阈值时，根据所述预设告警方式对客户进行告警。
如权利要求16所述的计算机可读存储介质，其中，在所述根据所述第一满意度分值、所述第二满意度分值和所述第三满意度分值计算所述客户的最终满意度之后，所述计算机可读指令被所述处理器执行还用以实现以下步骤：

从所述第一满意度分值中筛选出最低的第一目标满意度分值、从所述第二满意度分值中筛选出最低的第二目标满意度分值、所述第三满意度分值中筛选出最低的第三目标满意度分值；

识别所述第一目标满意度分值、所述第二目标满意度分值、所述第三目标满意度分值的目标时间节点；

从获取的客服的视频流中提取对应所述目标时间节点的预设时长的视频片段；

将所述视频片段发送给所述客服。