CN112118410A

CN112118410A - 业务处理方法、装置、终端及存储介质

Info

Publication number: CN112118410A
Application number: CN201910553467.1A
Authority: CN
Inventors: 孙华昱
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2019-06-20
Filing date: 2019-06-20
Publication date: 2020-12-22
Anticipated expiration: 2039-06-20
Also published as: CN112118410B

Abstract

本发明实施例公开了一种业务处理方法、装置、终端及介质，其中方法包括：获取待处理的目标图像及与所述目标图像相关联的参考图像；所述目标图像与所述参考图像是属于同一图像序列中的连续图像，且参考图像在所述图像序列中排列在所述目标图像之前，所述目标图像包括目标对象；获取所述目标图像的类别及参考图像的类别；若所述目标图像的类别和所述参考图像的类别相同，则获取与所述类别属性相匹配的图像装饰元素；采用所述图像装饰元素对所述目标图像中的目标对象进行装饰处理。本发明实施例可以提升业务处理的准确性以及处理效率。

Description

业务处理方法、装置、终端及存储介质

技术领域

本申请涉及互联网技术领域，具体涉及图像处理技术领域，尤其涉及一种业务处理方法、一种业务处理装置、一种终端及一种计算机存储介质。

背景技术

图像是指所有具有视觉效果的画面，其是人类社会活动中最常用的信息载体。目前，在显示图像的过程中，用户通常会选择添加一些挂件动画至图像中以增加图像的趣味性；具体的，用户可通过挂件功能选择器手动选择适合目标图像的挂件动画；终端检测到用户的选择指令后，可根据该选择指令将用户所选择的挂件动画添加至目标图像中。发明人在实践中发现，当前技术需要用户手动选择并添加挂件动画，其操作繁琐，便利性较低；并且，用户手动选择的挂件动画通常与目标图像并不匹配，其准确性降低。

发明内容

本发明实施例提供了一种业务处理方法、装置、终端及计算机存储介质，可以提升业务处理的准确性以及处理效率。

一方面，本发明实施例提供了一种业务处理方法，所述业务处理方法包括：

获取待处理的目标图像及与所述目标图像相关联的参考图像；所述目标图像与所述参考图像是属于同一图像序列中的连续图像，且所述参考图像在所述图像序列中排列在所述目标图像之前，所述目标图像包括目标对象；

获取所述目标图像的类别及所述参考图像的类别；

若所述目标图像的类别和所述参考图像的类别相同，则获取与所述类别相匹配的图像装饰元素；

采用所述图像装饰元素对所述目标图像中的目标对象进行装饰处理。

另一方面，本发明实施例提供了一种业务处理装置，该业务处理装置包括：

获取单元，用于获取待处理的目标图像及与所述目标图像相关联的参考图像；所述目标图像与所述参考图像是属于同一图像序列中的连续图像，且所述参考图像在所述图像序列中排列在所述目标图像之前，所述目标图像包括目标对象；

所述获取单元，用于获取所述目标图像的类别及所述参考图像的类别；

所述获取单元，用于若所述目标图像的类别和所述参考图像的类别相同，则获取与所述类别相匹配的图像装饰元素；

处理单元，用于采用所述图像装饰元素对所述目标图像中的目标对象进行装饰处理。

再一方面，本发明实施例提供了一种终端，所述终端包括输入设备和输出设备，所述终端还包括：

处理器，适于实现一条或多条指令；以及，

计算机存储介质，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由所述处理器加载并执行如下步骤：

获取所述目标图像的类别及所述参考图像的类别；

再一方面，本发明实施例提供了一种计算机存储介质，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由处理器加载并执行如下步骤：

获取所述目标图像的类别及所述参考图像的类别；

本发明实施例在对目标图像中的目标对象进行装饰处理时，可以先获取目标图像的类别以及与目标图像相关联的参考图像的类别。由于参考图像和目标图像是属于同一个图像序列中的连续图像，因此若目标图像的类别和参考图像的类别相同，则可以保证获取到的目标图像的类别是准确的。此时，可根据该类别自动获取相匹配的图像装饰元素，并采用图像装饰元素对目标图像中的目标对象进行装饰处理。在上述的业务处理流程中，无需用户人为选择图像装饰元素，可简化操作，提高便利性；并且，终端通过同一图像序列中的连续图像的类别来确保目标图像的类别的准确性，从而可以提高图像装饰元素的准确性。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1a是本发明实施例提供的一种业务处理系统的架构示意图；

图1b是本发明实施例提供的另一种业务处理系统的架构示意图；

图2是本发明实施例提供的一种业务处理方法的流程示意图；

图3是本发明另一实施例提供的一种业务处理方法的流程示意图；

图4a是本发明实施例提供的一种模型结构的示意图；

图4b是本发明实施例提供的一种模型性能的测试结果示意图；

图4c是本发明实施例提供的另一种模型性能的测试结果示意图；

图5a是本发明另一实施例提供的一种业务处理方法的流程示意图；

图5b是本发明实施例提供的一种业务处理方法的应用场景图；

图5c是本发明实施例提供的一种业务处理方法的另一应用场景图；

图5d是本发明实施例提供的一种业务处理方法的另一应用场景图；

图5e是本发明实施例提供的一种业务处理方法的另一应用场景图；

图5f是本发明实施例提供的一种业务处理方法的另一应用场景图；

图6是本发明实施例提供的一种业务处理装置的结构示意图；

图7是本发明实施例提供的一种终端的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

本发明实施例提出了一种业务处理方法，该业务处理方法可应用于业务处理系统中，该业务处理系统可至少包括至少一个终端11、服务器12以及配置系统13。其中，终端11可用于执行该业务处理方法以实现自动为目标图像中的目标对象添加图像装饰元素，简化业务处理流程，提升图像显示的趣味性以及业务处理的准确性；该终端11可包括但不限于：智能手机、平板电脑、膝上计算机等便携式设备，以及台式计算机等等；目标对象可以包括但不限于：用户的人脸、用户的手势以及用户的身体姿态等等。服务器12可用于为终端11提供用于对图像进行类别预测的检测模型，该检测模型是一种深度学习模型，检测模型可以以模型文件的形式存储在服务器12中；该服务器12可以是数据处理服务器、应用服务器、web服务器等独立服务器，还可以是网络系统(例如内容分发网络(Content DeliveryNetwork，CDN))中的节点服务器等；配置系统13可用于为终端11提供关于检测模型的运行参数、模型下载链接等配置信息；其中，运行参数可包括第一参数和/或第二参数，第一参数用于指示业务处理的周期时长(如1分钟)，第二参数用于指示进行业务处理所需的图像数量(如1个目标图像和2个参考图像)。在物理部署上述业务处理系统时，可以将服务器12和配置系统13分开部署，即服务器12和配置系统13为相互独立的服务器，其具体的系统架构可参见如图1a所示；也可以将服务器12和配置系统13作为一个整体进行部署，即可将配置系统13部署在服务器12内部，其具体的系统架构可参见如图1b所示；为便于阐述，后续均以图1a所示的业务处理系统为例进行说明。

请参见图2，是本发明实施例提出一种业务处理方法的流程示意图，该业务处理方法可以由第一终端执行，所述第一终端可以是上述业务处理系统中的任一终端。如图2所示，该业务处理方法可包括以下步骤S201-S204：

S201，获取待处理的目标图像及与目标图像相关联的参考图像。

其中，目标图像与参考图像是属于同一图像序列中的连续图像，且参考图像在图像序列中排列在目标图像之前；参考图像的数量可以为一个或多个，对此不作限定。此处的图像序列可包括：在第一终端和第二终端执行通信业务的过程中，第一终端调用摄像组件对目标对象进行图像采集得到的视频序列；所述通信业务包括视频会话业务或视频直播业务；即此情况下的图像序列是调用摄像组件实时采集到的视频序列。或者，图像序列可包括：第一终端响应于用户的视频播放请求，从本地空间或者服务器处获取到的视频序列；即此情况下的图像序列是已录制完成的视频序列，如电影的视频序列、综艺节目的视频序列、电视剧的视频序列，等等。

目标图像包括目标对象，该目标对象可以包括但不限于第一终端所指示用户的人脸、手势以及身体姿态，等等。该目标图像可以是图像序列中采集时间最晚的且包含目标对象的帧图像；例如，图像序列包括6帧图像，则目标图像可以为第6帧图像。目标图像也可以是图像序列中的包含目标对象的任一帧图像；例如，图像序列包括6帧图像且每帧图像均包括目标对象，则目标图像可以为第3帧图像。目标图像还可以是图像序列的显示过程中，图像序列中位于当前显示的帧图像之后的下一帧图像；例如，图像序列包括10帧图像，当前显示的帧图像为第5帧图像，则目标图像可以是图像序列中的第6帧图像。

S202，获取目标图像的类别及参考图像的类别。

第一终端可以预先根据配置系统下发的配置参数从服务器处获取并加载得到检测模型；具体的，第一终端可利用模型加载框架(如Tensorflow-Mobile框架(一种模型加载框架)、Tensorflow-Lite框架(一种模型加载框架)等)进行模型加载，得到检测模型。在执行步骤S202时，可调用检测模型对目标图像进行类别预测，得到目标图像的类别；以及调用检测模型对参考图像进行类别预测，得到参考图像的类别。

由前述可知，目标对象包括以下任一项：第一终端所指示用户的人脸、手势及身体姿态；相应的，目标图像的类别可包括以下任一维度下的类别：表情维度、手势维度以及姿态维度；参考图像的类别也可包括以下任一维度下的类别：表情维度、手势维度以及姿态维度；目标图像的类别所属的维度和参考图像的类别所属的维度相同。目标图像的类别所属的维度以及检测模型的类型均可根据目标对象确定；例如，若目标对象为人脸，则目标图像的类别所属的维度为表情维度，检测模型的类型为表情分类模型；又如，若目标对象为手势，则目标图像的类别所属的维度为手势维度，检测模型的类型为手势识别模型，等等。

S203，若目标图像的类别和参考图像的类别相同，则获取与该类别相匹配的图像装饰元素。

若目标图像的类别和参考图像的类别相同，则可以表明目标图像的类别是准确的；此时，可以获取与该类别相匹配的图像装饰元素，此处的图像装饰元素可包括挂件动画、图像贴纸等。在具体实施过程中，可以先获取元素数据库，在元素数据库中筛选出与目标图像的类别相关联的关联元素；从筛选出的关联元素中确定图像装饰元素。在一种实施方式中，若关联元素的数量为1个，则可将该关联元素作为图像装饰元素。再一种实施方式中，若关联元素的数量为多个，则可以从这多个关联元素中选取任一个关联元素作为图像装饰元素；或者，根据这多个关联元素的历史使用频次，从多个关联元素中选取历史使用频次最高的关联元素作为图像装饰元素。

S204，采用图像装饰元素对目标图像中的目标对象进行装饰处理。

在具体实施过程中，第一终端可以调用程序接口将图像装饰元素绘制在目标图像中的目标对象上，以实现对目标对象的装饰处理。其中，程序接口可包括但不限于：OpenGL(一种3D程序接口)、Open Inventor(一种高级图形库)、DirectX(一种应用程序接口)，等等。

请参见图3，是本发明实施例提供的另一种业务处理方法的流程示意图。该方法可以由第一终端执行，该第一终端可以是上述业务处理系统中的任一终端。请参见图3，该业务处理方法可包括以下步骤S301-S305：

S301，获取待处理的目标图像及与目标图像相关联的参考图像。

在一种实施方式中，若图像序列包括：在第一终端和第二终端执行通信业务的过程中，第一终端调用摄像组件对目标对象进行图像采集得到的视频序列；则步骤S301的具体实施方式可以是：第一终端响应于业务处理的触发事件，获取关于目标对象的视频序列；此处的业务处理的触发事件可包括：业务处理周期到达的事件；所谓业务处理周期到达的事件是指：第一终端的当前时间与上一次对进行业务处理的时间之间的间隔时长等于业务处理周期的周期时长的事件，所述当前时间是指第一终端的系统记录的时间；例如第一终端的系统所记录的时间为8:00，那么当前时间为8:00；业务处理周期的周期时长可以根据经验值或者业务需求设置，例如设置为1秒钟、1分钟、5分钟等等。

在获取到视频序列之后，可以从视频序列中选取采集时间最晚的帧图像作为目标图像，即将视频序列中最新采集到的帧图像作为目标图像。然后，可按照视频序列中各帧图像的采集顺序，从视频序列中倒序选取位于目标图像之前的连续一帧或多帧图像作为参考图像。例如，视频序列包括10帧图像，那么目标图像为第10帧图像；若参考图像的数量为1个，则从视频序列中选取第9帧图像作为参考图像；若参考图像的数量为2个，则从视频序列中选取第8帧和第9帧图像作为参考图像；若参考图像的数量为3个，则从视频序列中选取第7帧至第9帧图像作为参考图像，以此类推。

再一种实施方式中，若图像序列包括：第一终端响应于用户的视频播放请求，从本地空间或者服务器处获取到的视频序列；则步骤S301的具体实施方式可以是：在视频序列的显示过程中，获取当前显示的帧图像；从视频序列中获取位于当前显示的帧图像之后的下一帧图像作为目标图像；并按照视频序列中各帧图像的播放顺序，从视频序列中倒序选取位于目标图像之前的连续一帧或多帧图像作为参考图像。

S302，调用目标检测模型对目标图像进行类别预测，得到目标图像的类别。

S303，调用目标检测模型对参考图像进行类别预测，得到参考图像的类别。

在执行步骤S302-S303之前，第一终端可先获取目标检测模型。在获取到目标检测模型之后，再基于目标检测模型分别执行步骤S302和S303。其中，获取目标检测模型的具体实施方式可以是：第一终端可响应于用户登陆操作，向配置系统发送模型配置的信息请求；该信息请求携带模型标识；用户登陆操作是指：用户登陆个人账号的操作。然后，第一终端可接收配置系统下发的与模型标识相关联的配置信息，该配置信息包括：模型下载链接及模型数字签名；所谓模型数字签名是指只有信息的发送者才能产生的且其他人无法伪造的一段数字串，其具体可以是MD5(一种不可逆的加密算法)字符串、MD4(一种不可逆的加密算法)字符串或者MD2(一种不可逆的加密算法)字符串等等。第一终端在接收到配置信息之后，可以从本地空间中获取当前存储的检测模型，并根据该数字签名判断是否更新当前存储的检测模型。具体的，第一终端可以采用不可逆的加密算法(如MD5)对当前存储的检测模型进行加密运算，并将加密运算所得到的数字签名和配置信息中的模型数字签名进行比对。若两者一致，则表明不需要更新当前存储的检测模型；此时，可将当前存储的检测模型作为目标检测模型。若两者不一致，则表明需要更新当前存储的检测模型，此时可根据模型下载链接从服务器处下载新的检测模型作为目标检测模型。

应理解的是，在上述过程中，若第一终端从本地空间中获取当前存储的检测模型失败，则表明本地空间没有存储检测模型，此情况下，第一终端在获取到配置信息之后，可以直接根据配置信息中的模型下载链接从服务器处下载新的检测模型作为目标检测模型。在一种实施方式中，目标检测模型可以是MobileNet模型(一种视觉神经网络模型)。再一种实施方式中，若第一终端为智能手机、平板电脑等便携式设备，则为了兼顾第一终端的性能和准确率，本发明实施例还参考MobileNet模型的模型结构提出了一个比MobileNet模型更轻量的类别预测模型；即目标检测模型还可以是该类别预测模型，其具体的模型结构可参见图4a中右侧图像所示。当目标检测模型为类别预测模型时，该目标检测模型可包括瓶颈层(Bottleneck层)和全连接层；所述瓶颈层用于对输入的帧图像进行特征提取，全连接层用于根据所述瓶颈层提取到的特征对所述输入的帧图像进行类别预测。本发明实施例还对这两个模型的性能进行了测试，其测试结果可参见图4b所示：由于类别预测模型采用了Bottleneck层替换了Conv层，这样可减少模型的参数量以及减少整个模型的网络层次；从而使得类别预测模型所需的参数量和计算量均小于比MobileNet模型所需的参数量和计算量。由此可见，类别预测模型比MobileNet模型更轻量，并且类别预测模型的性能优于MobileNet模型的性能。

需要说明的是，目标检测模型是预先训练好的具有良好性能的模型，下面以目标检测模型是类别预测模型为例，对目标检测模型的训练过程进行阐述：

s11，获取样本集以及初始模型。

样本集中包括多个样本图像以及每个样本图像的类别标签；样本集中的样本图像的数量可以根据实际需求或者经验值设置，例如设置为2550张。其中，获取样本集可至少包括以下两种实施方式：第一种：采用人工收集和标注的方式获取；具体的，通过与目标对象所属的维度相关的关键字搜集视频片段，例如目标对象所属的维度为表情维度，则关键字可以为表情关键字(如微笑表情、闭眼表情等)；其次，截取搜集到的视频片段中包含目标对象的帧图像作为样本图像，例如目标对象为人脸，则可截取搜集到的视频片段中包含人脸的帧图像作为样本图像；然后，通过专业的标注人员对该样本图像进行类别标注，得到样本图像的类别标签。第二种：采用用户众测的方式获取；具体的，可在众测平台发布用于搜集包含目标对象的各个样本图像的应用程序，获取用户上传至该应用程序中的样本图像，并对其进行类别标注，得到各样本图像的类别标签。

s12，采用样本集对初始模型进行迭代训练，得到性能完善的目标检测模型。

若样本集中的样本图像的数量较少，则可直接采用样本集对初始模型进行迭代训练，得到性能完善的检测模型；若样本集中的样本图像的数量较多，则可以通过分批训练的方式采用样本集对初始模型进行迭代训练，得到性能完善的检测模型。在分批训练的过程中，可根据经验值或者业务需求设置batchsize(每批次的样本图像的数量)的取值，例如设置为batchsize＝8。在模型训练的过程中，每个样本图像可以重复使用，其使用次数(epoch)也可根据经验值或者业务需求设置；例如若设置为epoch＝100，则表明每个样本图像可重复使用100次。

在具体的模型训练过程中，可将样本图像和样本图像的类别标签输入至初始模型中，初始模型可对样本图像进行特征学习，并根据学习到的特征预测样本图像的类别；然后可按照减小预测得到的类别与类别标签之间的差异的方向，优化初始模型的各个参数。每一轮训练完成后，均可根据训练结果调整Bottleneck层的扩张系数和输出通道数；其中，扩张系数用于对输入至Bottleneck层的特征维度进行扩张，从而获取更多的特征信息，提高准确率；输出通道数是指Bottleneck层输出的特征的通道数，通过调整输出通道数，可以降低目标检测模型的参数量。迭代上述步骤，则可训练得到性能完善的目标检测模型。本发明实施例还采用了550张(该数值可根据实际需要调整)对该目标检测模型进行了测试，其测试结果可参见图4c所示；在本次测试过程中，目标检测模型的模型大小为450kb。

S304，若目标图像的类别和参考图像的类别相同，则获取与类别相匹配的图像装饰元素。

S305，采用图像装饰元素对目标图像中的目标对象进行装饰处理。

在具体实施过程中，目标对象包括多个区域；例如，若目标对象为人脸，则目标对象可包括嘴巴区域、鼻子区域、眼睛区域等；若目标对象为手势，则目标对象可包括手指区域、手掌区域等。目标对象的各个区域可采用检测算法对目标对象进行检测得到，该检测算法根据目标对象确定：若目标对象是人脸，则检测算法可以为人脸识别算法；若目标对象是手势，则检测算法可以为手势识别算法，等等。相应的，第一终端可以先在目标对象的多个区域中确定与图像装饰元素相关联的元素绘制区域；然后将图像装饰元素绘制在该元素绘制区域，以对目标图像中的目标对象进行装饰处理。其中，将图像装饰元素绘制在元素绘制区域的具体实施方式可以为：确定元素绘制区域在目标图像中的位置坐标以及绘制尺寸；将图像装饰元素的尺寸调整至绘制尺寸，并将尺寸调整后的图像装饰元素绘制在位置坐标处。

第一终端在得到装饰处理后的目标图像之后，可以显示装饰处理后的目标图像。在一种实施方式中，若图像序列包括：第一终端响应于用户的视频播放请求，从本地空间或者服务器处获取到的视频序列，则第一终端可以在视频播放界面显示装饰处理后的目标图像。再一种实施方式中，若图像序列包括：在第一终端和第二终端执行通信业务的过程中，第一终端调用摄像组件对目标对象进行图像采集得到的视频序列，则第一终端可在通信界面中显示装饰处理后的目标图像，该通信界面包括视频会话界面或者视频直播界面；并将图像装饰元素和目标图像发送至第二终端，以使得第二终端在通信界面中显示装饰处理后的目标图像。其中，由于装饰处理后的目标图像包括了图像装饰元素，因此第一终端在将图像装饰元素和目标图像发送至第二终端时，可以直接将装饰处理后的目标图像发送至第二终端以使得第二终端在通信界面中直接显示装饰处理后的目标图像。在一种实施方式中，为减少网络传输量，还可以对装饰处理后的目标图像进行压缩处理，将压缩后的目标图像发送至第二终端，以使得第二终端先解压压缩后的目标图像，并在通信界面中显示装饰处理后的目标图像。另一种实施方式中，第一终端也可获取图像装饰元素的元素标识，将元素标识和目标图像发送至第二终端，以使得第二终端根据元素标识获取图像装饰元素，并采用图像装饰元素对目标图像中的目标对象进行装饰处理，然后在通信界面中显示装饰处理后的目标图像。

基于上述的描述，终端可以根据实际的业务需求，将上述所提及的业务处理方法运用在不同的应用场景中，例如视频会话的应用场景、视频直播的应用场景以及视频播放的应用场景，等等；其中，视频播放的应用场景是指播放提前录制完成的视频的应用场景，如电影视频播放的应用场景、综艺视频播放的应用场景等。下面以将该业务处理方法运用在视频会话的应用场景中，并以目标对象为人脸为例，对该业务处理方法的具体应用流程进行阐述；其具体应用过程可一并参见图5a所示：

用户a若想要和用户b进行视频会话，则可以打开第一终端内具有视频功能的目标应用；第一终端检测到用户a打开目标应用的操作后，可以启动并运行该目标应用，并输出包括多个联系人的通讯录界面，如图5b所示；其中，目标应用可以是以下任一应用：独立的视频应用、具有视频功能的即时通讯应用(例如QQ、微信)，等等。第一终端在启动目标应用后，可以拉取配置信息并下载模型；具体的，第一终端可以先从配置系统处请求得到配置信息，该配置信息可至少包括模型下载链接；然后根据该下载链接从内容分发网络中的节点服务器处下载模型。

用户a可以在通讯录界面中选择用户b并打开与用户b的会话界面，如图5c所示；然后，用户a可通过会话界面中的视频接口发起双人视频会话，如图5d所示；此时，第一终端可利用模型加载框架进行模型加载，得到表情分类模型。当视频会话连接成功后，在用户a和用户b的视频会话过程中，第一终端可调用摄像头采集关于用户a的视频序列。并调用表情分类模型对视频序列中的各帧图像进行类别预测，得到各帧图像的表情类别。若连续N帧图像的表情类别相同，则可从数据库中获取与该表情类别相关联的图像装饰元素；其中，N的取值可根据经验值或者业务需求设置，例如设置为N＝5。在得到图像装饰元素之后，第一终端可以利用人脸识别算法检测第N帧图像中的人脸五官的位置，然后将图像装饰元素绘制在相应的人脸区域，并在视频会话界面中显示绘制元素后的第N帧图像；以图像装饰元素为“猫耳朵”为例，则与“猫耳朵”相对应的人脸区域为头顶区域，因此可以将该“猫耳朵”绘制在人脸的头顶区域，如图5e所示。第一终端还可将绘制元素后的第N帧图像通过视频通道发送至第二终端，以使得第二终端在视频会话界面中显示该绘制元素后的第N帧图像，如图5f所示。可选的，第一终端可以先压缩绘制元素后的第N帧图像，然后将压缩后的帧图像发送至第二终端，以减少网络传输量，提供图像传输效率以及图像显示的实时性。

由此可见，第一终端可实时采集视频会话的视频序列，并调用深度学习模型对视频序列中的各帧图像进行类别预测以识别得到用户a的面部的表情类别；然后可根据表情类别自动添加并绘制相应的图像装饰元素至图像中，无需用户a人为地选择图像装饰元素，可简化业务处理的流程，提高业务处理效率以及准确性。第一终端还可将融合了元素装饰效果的帧图像发送至第二终端，使得第一终端和第二终端的视频会话界面均会显示绘制元素后的帧图像，从而可以提升视频会话的趣味性和可玩性。需要说明的是，在用户a和用户b的视频会话过程中，第二终端也可调用摄像头采集关于用户b的视频序列，并执行后续的表情识别、元素绘制等一系列业务处理，其具体实施过程可以参见上述第一终端的具体实施过程，在此不再赘述。

基于上述业务处理方法实施例的描述，本发明实施例还公开了一种业务处理装置，所述业务处理装置可以是运行于终端中的一个计算机程序(包括程序代码)。该业务处理装置可以执行图2至图3所示的方法。请参见图6，所述业务处理装置可以运行如下单元：

获取单元101，用于获取待处理的目标图像及与所述目标图像相关联的参考图像；所述目标图像与所述参考图像是属于同一图像序列中的连续图像，且所述参考图像在所述图像序列中排列在所述目标图像之前，所述目标图像包括目标对象；

所述获取单元101，用于获取所述目标图像的类别及所述参考图像的类别；

所述获取单元101，用于若所述目标图像的类别和所述参考图像的类别相同，则获取与所述类别相匹配的图像装饰元素；

处理单元102，用于采用所述图像装饰元素对所述目标图像中的目标对象进行装饰处理。

在一种实施方式中，所述图像序列包括：在第一终端和第二终端执行通信业务的过程中，第一终端调用摄像组件对所述目标对象进行图像采集得到的视频序列；所述通信业务包括视频会话业务或视频直播业务；

所述目标对象包括以下任一项：第一终端所指示用户的人脸、手势以及身体姿态；所述目标图像的类别包括以下任一维度下的类别：表情维度、手势维度以及姿态维度。

再一种实施方式中，获取单元101在用于获取待处理的目标图像及与所述目标图像相关联的参考图像时，具体用于：

第一终端响应于业务处理的触发事件，获取关于所述目标对象的视频序列；

从所述视频序列中选取采集时间最晚的帧图像作为目标图像；

按照所述视频序列中各帧图像的采集顺序，从所述视频序列中倒序选取位于所述目标图像之前的连续一帧或多帧图像作为参考图像。

再一种实施方式中，处理单元102还可用于：

第一终端在通信界面中显示装饰处理后的目标图像，所述通信界面包括视频会话界面或者视频直播界面；

将所述图像装饰元素和所述目标图像发送至第二终端，以使得所述第二终端在所述通信界面中显示装饰处理后的目标图像。

再一种实施方式中，获取单元101在用于将所述图像装饰元素和所述目标图像发送至第二终端，以使得在所述第二终端在所述通信界面中显示装饰处理后的目标图像时，具体用于：

对所述装饰处理后的目标图像进行压缩处理，将压缩后的目标图像发送至第二终端，以使得所述第二终端解压所述压缩后的目标图像，并在所述通信界面中显示所述装饰处理后的目标图像；或者，

获取所述图像装饰元素的元素标识，将所述元素标识和所述目标图像发送至所述第二终端，以使得所述第二终端根据所述元素标识获取图像装饰元素，并采用所述图像装饰元素对所述目标图像中的目标对象进行装饰处理，在所述通信界面中显示装饰处理后的目标图像。

再一种实施方式中，所述目标对象包括多个区域；相应的，处理单元102在用于采用所述图像装饰元素对所述目标图像中的目标对象进行装饰处理时，具体用于：

在所述目标对象的多个区域中确定与所述图像装饰元素相关联的元素绘制区域；

将所述图像装饰元素绘制在所述元素绘制区域，以对所述目标图像中的目标对象进行装饰处理。

再一种实施方式中，处理单元102在用于将所述图像装饰元素绘制在所述元素绘制区域时，具体用于：

确定所述元素绘制区域在所述目标图像中的位置坐标以及绘制尺寸；

将所述图像装饰元素的尺寸调整至所述绘制尺寸，并将尺寸调整后的图像装饰元素绘制在所述位置坐标处。

再一种实施方式中，获取单元101在用于获取所述目标图像的类别及参考图像的类别时，具体用于：

调用目标检测模型对所述目标图像进行类别预测，得到所述目标图像的类别；以及调用所述目标检测模型对所述参考图像进行类别预测，得到所述参考图像的类别；

其中，所述目标检测模型包括瓶颈层和全连接层；所述瓶颈层用于对输入的帧图像进行特征提取，所述全连接层用于根据所述瓶颈层提取到的特征对所述输入的帧图像进行类别预测。

再一种实施方式中，获取单元101还可用于：

响应于用户登陆操作，向配置系统发送模型配置的信息请求，所述信息请求携带模型标识；

接收所述配置系统下发的与所述模型标识相关联的配置信息，所述配置信息包括：模型下载链接及模型数字签名；

从本地空间中获取当前存储的检测模型，并根据所述模型数字签名判断是否更新所述当前存储的检测模型；

若是，则根据所述模型下载链接从服务器处下载新的检测模型作为目标检测模型；若否，则将所述当前存储的检测模型作为所述目标检测模型。

根据本发明的一个实施例，图2至图3所示的业务处理方法所涉及的各个步骤均可以是由图6所示的业务处理装置中的各个单元来执行的。例如，图2中所示的步骤S201-S203可由图6中所示的获取单元101来执行，步骤S204可由图6中所示的处理单元102来执行；又如，图3中所示的步骤S301-S304可由图6中所示的获取单元101来执行，步骤S305可由图6中所示的处理单元102来执行。根据本发明的另一个实施例，图6所示的业务处理装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成，或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成，这可以实现同样的操作，而不影响本发明的实施例的技术效果的实现。上述单元是基于逻辑功能划分的，在实际应用中，一个单元的功能也可以由多个单元来实现，或者多个单元的功能由一个单元实现。在本发明的其它实施例中，基于业务处理装置也可以包括其它单元，在实际应用中，这些功能也可以由其它单元协助实现，并且可以由多个单元协作实现。

根据本发明的另一个实施例，可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用计算设备上运行能够执行如图2至图3中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造如图6中所示的业务处理装置设备，以及来实现本发明实施例的业务处理方法。所述计算机程序可以记载于例如计算机可读记录介质上，并通过计算机可读记录介质装载于上述计算设备中，并在其中运行。

基于上述方法实施例以及装置实施例的描述，本发明实施例还提供一种终端。请参见图7，该终端至少包括处理器201、输入设备202、输出设备203以及计算机存储介质204。所述输入设备202中还可包括摄像组件，摄像组件可用于采集图像，所述摄像组件可以是终端出厂时配置在终端上的组件，也可以是与终端相连接的外部组件。其中，终端内的处理器201、输入设备202、输出设备203以及计算机存储介质204可通过总线或其他方式连接。

计算机存储介质204可以存储在终端的存储器中，所述计算机存储介质204用于存储计算机程序，所述计算机程序包括程序指令，所述处理器201用于执行所述计算机存储介质204存储的程序指令。处理器201(或称CPU(Central Processing Unit，中央处理器))是终端的计算核心以及控制核心，其适于实现一条或多条指令，具体适于加载并执行一条或多条指令从而实现相应方法流程或相应功能；在一个实施例中，本发明实施例所述的处理器201可以用于进行一系列的业务处理，包括：获取待处理的目标图像及与所述目标图像相关联的参考图像；所述目标图像与所述参考图像是属于同一图像序列中的连续图像，且所述参考图像在所述图像序列中排列在所述目标图像之前，所述目标图像包括目标对象；获取所述目标图像的类别及所述参考图像的类别；若所述目标图像的类别和所述参考图像的类别相同，则获取与所述类别相匹配的图像装饰元素；采用所述图像装饰元素对所述目标图像中的目标对象进行装饰处理，等等。

本发明实施例还提供了一种计算机存储介质(Memory)，所述计算机存储介质是终端中的记忆设备，用于存放程序和数据。可以理解的是，此处的计算机存储介质既可以包括终端中的内置存储介质，当然也可以包括终端所支持的扩展存储介质。计算机存储介质提供存储空间，该存储空间存储了终端的操作系统。并且，在该存储空间中还存放了适于被处理器201加载并执行的一条或多条的指令，这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是，此处的计算机存储介质可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器；可选的还可以是至少一个位于远离前述处理器的计算机存储介质。

在一个实施例中，可由处理器201加载并执行计算机存储介质中存放的一条或多条指令，以实现上述有关业务处理实施例中的方法的相应步骤；具体实现中，计算机存储介质中的一条或多条指令由处理器201加载并执行如下步骤：

获取所述目标图像的类别及所述参考图像的类别；

再一种实施方式中，在获取待处理的目标图像及与所述目标图像相关联的参考图像时，所述一条或多条指令由处理器201加载并具体执行：

再一种实施方式中，所述一条或多条指令还可由处理器201加载并执行：

再一种实施方式中，在将所述图像装饰元素和所述目标图像发送至第二终端，以使得在所述第二终端在所述通信界面中显示装饰处理后的目标图像时，所述一条或多条指令由处理器201加载并具体执行：

再一种实施方式中，所述目标对象包括多个区域；相应的，在采用所述图像装饰元素对所述目标图像中的目标对象进行装饰处理时，所述一条或多条指令由处理器201加载并具体执行：

再一种实施方式中，在将所述图像装饰元素绘制在所述元素绘制区域时，所述一条或多条指令由处理器201加载并具体执行：

再一种实施方式中，在获取所述目标图像的类别及参考图像的类别时，所述一条或多条指令由处理器201加载并具体执行：

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种业务处理方法，其特征在于，包括：

获取所述目标图像的类别及所述参考图像的类别；

2.如权利要求1所述的方法，其特征在于，所述图像序列包括：在第一终端和第二终端执行通信业务的过程中，第一终端调用摄像组件对所述目标对象进行图像采集得到的视频序列；所述通信业务包括视频会话业务或视频直播业务；

3.如权利要求2所述的方法，其特征在于，所述获取待处理的目标图像及与所述目标图像相关联的参考图像，包括：

4.如权利要求2所述的方法，其特征在于，所述方法还包括：

5.如权利要求4所述的方法，其特征在于，所述将所述图像装饰元素和所述目标图像发送至第二终端，以使得在所述第二终端在所述通信界面中显示装饰处理后的目标图像，包括：

6.如权利要求1所述的方法，其特征在于，所述目标对象包括多个区域；所述采用所述图像装饰元素对所述目标图像中的目标对象进行装饰处理，包括：

7.如权利要求6所述的方法，其特征在于，所述将所述图像装饰元素绘制在所述元素绘制区域，包括：

8.如权利要求1-7任一项所述的方法，其特征在于，所述获取所述目标图像的类别及参考图像的类别，包括：

9.如权利要求8所述的方法，其特征在于，所述方法还包括：

10.一种业务处理装置，其特征在于，包括：

11.一种终端，包括输入设备和输出设备，其特征在于，还包括：

处理器，适于实现一条或多条指令；以及，

计算机存储介质，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由所述处理器加载并执行如权利要求1-9任一项所述的业务处理方法。

12.一种计算机存储介质，其特征在于，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由处理器加载并执行如权利要求1-9任一项所述的业务处理方法。