CN111489284B

CN111489284B - 一种图像处理方法、装置和用于图像处理的装置

Info

Publication number: CN111489284B
Application number: CN201910088235.3A
Authority: CN
Inventors: 徐祯; 谷枫; 李斌
Original assignee: Beijing Sogou Technology Development Co Ltd
Current assignee: Beijing Sogou Technology Development Co Ltd
Priority date: 2019-01-29
Filing date: 2019-01-29
Publication date: 2024-02-06
Anticipated expiration: 2039-01-29
Also published as: CN111489284A

Abstract

本发明实施例提供了一种图像处理方法、装置和用于图像处理的装置。其中的方法具体包括：从目标图像中提取目标头部图像；对连续帧图像的初始帧进行头部检测，以确定所述初始帧中的模板头部图像、以及所述模板头部图像在所述初始帧中的位置；在所述初始帧的后续帧中，将所述模板头部图像作为跟踪对象进行跟踪，以得到所述模板头部图像在所述后续帧中的位置；在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像。本发明实施例可以减少对连续帧图像中每一帧图像逐个进行替换的手工操作成本、以及可以提高表情包头像的替换效率。

Description

一种图像处理方法、装置和用于图像处理的装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种图像处理方法、装置和用于图像处理的装置。

背景技术

表情包是利用图片来表示感情的一种方式，广泛应用于社交应用中，例如，表情包可以基于时下流行的明星、语录、动漫、影视截图为素材，配上一系列相匹配的文字，用以表达特定的情感。

随着计算机技术的发展，可以将表情包中的头像替换为用户自己的头像，以增加表情包的趣味性。然而，替换表情包的头像通常是通过人工操作来完成的。例如，如果要将某个GIF(Graphics Interchange Format，图像互换格式)表情包中的头像替换为用户照片中的用户头像，则需要通过人工使用专业图像处理软件从用户照片中抠取用户头像素材，由于GIF表情包通常包含多帧图像，因此，还需要手工将抠取得到的用户头像素材一帧一帧地贴到表情包的每一帧图像中相应的位置。

可以看出，目前的表情包替换过程较为繁琐，不仅导致替换的效率较低，而且需要较高的人力成本。

发明内容

本发明实施例提供一种图像处理方法、装置和用于图像处理的装置，可以提高表情包头像的替换效率。

为了解决上述问题，本发明实施例公开了一种图像处理方法，所述方法包括：

从目标图像中提取目标头部图像；

对连续帧图像的初始帧进行头部检测，以确定所述初始帧中的模板头部图像、以及所述模板头部图像在所述初始帧中的位置；

在所述初始帧的后续帧中，将所述模板头部图像作为跟踪对象进行跟踪，以得到所述模板头部图像在所述后续帧中的位置；

在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像。

另一方面，本发明实施例公开了一种图像处理装置，所述装置包括：

提取模块，用于从目标图像中提取目标头部图像；

检测模块，用于对连续帧图像的初始帧进行头部检测，以确定所述初始帧中的模板头部图像、以及所述模板头部图像在所述初始帧中的位置；

跟踪模块，用于在所述初始帧的后续帧中，将所述模板头部图像作为跟踪对象进行跟踪，以得到所述模板头部图像在所述后续帧中的位置；

替换模块，用于在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像。

再一方面，本发明实施例公开了一种用于图像处理的装置，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

从目标图像中提取目标头部图像；

又一方面，本发明实施例公开了一种机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得装置执行如前述一个或多个所述的图像处理方法。

本发明实施例包括以下优点：

本发明实施例首先从目标图像中提取目标头部图像，然后对连续帧图像的初始帧进行头部检测，以确定所述初始帧中的模板头部图像、以及所述模板头部图像在所述初始帧中的位置，并且在所述初始帧的后续帧中，将所述模板头部图像作为跟踪对象进行跟踪，以得到所述模板头部图像在所述后续帧中的位置。最后，在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像。

通过本发明实施例，可以对连续帧图像的每一帧图像中的模板头部图像进行自动定位以及自动替换，不仅可以减少对连续帧图像中每一帧图像逐个进行替换的手工操作成本，而且可以提高表情包头像的替换效率。

此外，本发明实施例仅需对初始帧进行一次头部检测，可以减少头部检测的次数，进而可以提高表情包头像的替换效率。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明的一种图像处理方法实施例的步骤流程图；

图2是本发明的一种连续帧图像中两帧图像的示意图；

图3是图2对应的处理后图像的示意图；

图4是本发明的一种图像处理装置实施例的结构框图；

图5是本发明的一种用于图像处理的装置800的框图；及

图6是本发明的一些实施例中服务器的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

方法实施例

参照图1，示出了本发明的一种图像处理方法实施例的步骤流程图，具体可以包括如下步骤：

步骤101、从目标图像中提取目标头部图像；

步骤102、对连续帧图像的初始帧进行头部检测，以确定所述初始帧中的模板头部图像、以及所述模板头部图像在所述初始帧中的位置；

步骤103、在所述初始帧的后续帧中，将所述模板头部图像作为跟踪对象进行跟踪，以得到所述模板头部图像在所述后续帧中的位置；

步骤104、在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像。

本发明实施例的图像处理方法可应用于替换表情包头像的场景，为便于描述，本发明实施例将目标图像中的人物称为目标人物，目标图像中目标人物的头部图像称为目标头部图像，以及将连续帧图像的各帧图像中出现的人物称为模板人物，模板人物的头部图像称为模板头部图像。通过本发明实施例，可以将连续帧图像中的模板头部图像替换为目标图像中的目标头部图像。其中，头部图像中可以包括头发、脸部轮廓、五官等头部特征，以及耳环、眼镜等配饰信息，通过本发明实施例，在对表情包的头像进行替换之后，可以在表情包中保留目标人物原有的发型以及面部特征。

本发明实施例的图像处理方法可应用于电子设备，所述电子设备包括但不限于：服务器、智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3，Moving Picture Experts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4，Moving Picture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。

具体地，本发明实施例首先从目标图像中提取目标头部图像。所述目标图像的格式可以为jpg(Joint Photo graphic Experts Group，一种图片格式)、BMP(Bitmap，图像文件格式)或RAW(RAW Image Format，无损压缩格式)等可以被电子设备识别的任意格式。可以理解，本发明实施例对所述目标图像的具体来源不加以限制，例如，所述目标图像可以是所述电子设备中存储的用户图片，也可以是从网上下载的网络图片，还可以是通过所述电子设备的摄像头实施拍摄得到的照片等任意图像。

在本发明的一种可选实施例中，所述从目标图像中提取目标头部图像，具体可以包括：

步骤S11、根据头部检测模型，确定目标图像中的目标头部区域；其中，所述头部检测模型为根据样本头部图像、以及所述样本头部图像对应的头部标注信息训练得到的深度神经网络模型；

步骤S12、根据所述目标头部区域，提取目标头部图像。

其中，所述头部检测模型可以为根据大量的训练样本和机器学习方法，对现有的神经网络进行有监督训练而得到的。所述头部检测模型可以是融合了多种神经网络的分类模型。所述神经网络包括但不限于以下的至少一种或者至少两种的组合、叠加、嵌套：CNN(Convolutional Neural Network，卷积神经网络)、LSTM(Long Short-Term Memory，长短时记忆)网络、RNN(Simple Recurrent Neural Network，循环神经网络)、注意力神经网络等。

所述头部检测模型的训练样本可以包括：样本头部图像和每一个样本头部图像对应的头部标注信息，所述头部标注信息具体可以包括用于指示样本头部图像中的像素是否属于头部区域的标注、以及用于指示属于头部区域的像素位置的标注(例如坐标值等)。

在本发明实施例中，可以将目标图像输入所述头部检测模型，所述头部检测模型可以对目标图像中的像素点进行分类，以确定目标图像中的目标头部区域，所述目标头部区域具体可以包括：目标人物的头发以及脸部区域，所述脸部区域中可以包括：脸部轮廓、五官以及耳环、眼镜等配饰等。

在确定目标图像中的目标头部区域之后，可以提取目标头部区域中的像素点，以得到目标头部图像。

然后，对连续帧图像的初始帧进行头部检测，以确定所述初始帧中的模板头部图像、以及所述模板头部图像在所述初始帧中的位置，并且在所述初始帧的后续帧中，将所述模板头部图像作为跟踪对象进行跟踪，以得到所述模板头部图像在所述后续帧中的位置。其中，所述初始帧具体可以为连续帧图像中的第一帧图像。本发明实施例对所述后续帧的数目不加以限制，所述后续帧的数目可以大于或等于0。

可以看出，本发明实施例仅需对初始帧进行一次头部检测，可以减少头部检测的次数，进而可以提高表情包头像的替换效率。

当然，本发明实施例对所述连续帧图像的具体来源不加以限制，例如，所述连续帧图像可以为GIF格式的表情包，或者，所述连续帧图像还可以为任意的视频片段等。

可以理解，本发明实施例对检测模板头部图像的具体方式不加以限制。例如，可以先根据人脸检测算法，对初始帧进行人脸检测，以得到初始帧中的模板人脸图像，再根据模板人脸图像的位置，确定模板头部图像的位置。

或者，还可以利用头部检测算法，如AdaBoost(Adaptive Boosting，自适应增强)法、SVM(Support Vector Machine，支持向量机)法、贝叶斯法、或者利用已训练的神经网络模型，对连续帧图像的初始帧进行头部检测，以检测初始帧中的模板头部图像、以及确定模板头部图像的位置。

在确定初始帧中模板头部图像的位置之后，可以将初始帧中的模板头部图像作为跟踪对象，在初始帧的后续帧中进行跟踪，以得到初始帧中的模板头部图像在后续帧中的位置。

可以理解，本发明实施例对跟踪模板头部图像所采用的跟踪算法不加以限制。例如，可以基于模板头部图像的轮廓信息、颜色信息(如头发的颜色及其分布等)以及运动信息(如头部表面各点之间的运动相关性)等特征，对模板头部头像进行跟踪。基于上述头部图像的特征信息，可以采用的头部跟踪算法包括但不限于：模型法，对模板头部及其器官进行建模，利用模型匹配来实现对模板头部图像的跟踪。灰度分布法，求解三维空间内头部表面的灰度分布马赛克图，利用匹配来实现对模板头部图像的跟踪。块特征法，通过批量块特征的运动矢量计算来对模板头部图像的跟踪，其具有精度高、不依赖于具体模型等优点。

可选地，还可以采用光流法，对所述模板头部图像进行跟踪。光流是指空间运动物体在观察成像平面上的像素运动的瞬时速度，光流法是利用图像序列中像素在时间域上的变化以及相邻帧之间的相关性来找到上一帧跟当前帧之间存在的对应关系，从而计算出相邻帧之间物体的运动信息的一种方法。例如LK(Lucas-Kanade Method，卢卡斯-卡纳德方法)光流法。

需要说明的是，对于采用何种头部跟踪算法，可由本领域技术人员根据实际需要进行选取，可以是本发明实施例中所描述的头部跟踪算法，也可以是本发明实施例中所未描述的头部跟踪算法。

最后，在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像。

具体地，可以采用线性映射等方式覆盖所述模板头部图像，例如，可以对所述模板头部图像通过平移、旋转、缩放等方式，覆盖在所述模板头部图像的位置。

由此，通过本发明实施例，可以对连续帧图像的每一帧图像中的模板头部图像进行自动定位以及自动替换，不仅可以减少对连续帧图像中每一帧图像逐个进行替换的手工操作成本，而且可以提高表情包头像的替换效率。

可选地，在本发明实施例中，所述目标图像、以及所述连续帧图像中的头部图像并不局限于真人，还可以为卡通人物、漫画人物等虚拟人物的头部图像。

在本发明的一种可选实施例中，所述目标头部图像和/或所述模板头部图像的数目大于1，且各目标头部图像与各模板头部图像之间具有对应关系；

所述在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像，具体可以包括：

根据目标头部与模板头部之间的对应关系，在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖与所述模板头部图像对应的目标头部图像，以得到处理后的连续帧图像。

在本发明实施例中，所述目标头部图像的数目可以大于1，例如，可以从多个目标图像中提取多个目标头部图像，或者，也可以从一个目标图像中提取多个目标头部图像。当然，所述模板头部图像的数目也可以大于1，例如，若表情包中包括三个模板头部图像，则可以提取三个目标头部图像，将表情包中的三个模板头部图像替换为三个目标头部图像。

可以理解，本发明实施例对目标头部图像与模板头部图像之间的对应关系不加以限制，本领域技术人员可以根据实际需要进行设置。例如，目标头部图像与模板头部图像之间可以是一对一的关系，也可以是一对多或者多对一的关系等。以包含三个模板头部图像的表情包为例，可以将这三个模板头部图像替换为同一个目标头部图像，也可以替换为三个不同的目标头部图像等。

参照图2，示出了本发明的一种连续帧图像中两帧图像的示意图，如图2所示，其中两帧图像的每一帧图像中均包含三个模板人物，也即每一帧图像中均包含三个模板头部图像(如图中的矩形框区域)，假设将左边的模板头部头像记为模板头部图像A，中间的模板头部图像记为模板头部图像B，以及右边的模板头部图像记为模板头部图像C，则图2中的两帧图像中分别包含模板头部图像A、模板头部图像B和模板头部图像C。

参照图3，示出了图2对应的处理后图像的示意图，图3所示的两帧图像中的三个模板头部图像被替换为三个不同的目标头部图像，且两帧图像中的目标头部图像与模板头部图像之间的对应关系保持一致。也即，对于图3所示的两帧图像中的前一帧图像(图3中的上图)，将模板头部图像A替换为目标头部图像A，将模板头部图像B替换为目标头部图像B，以及将模板头部图像C替换为目标头部图像C；则对于图3所示的两帧图像中的后一帧图像(图3中的下图)，也将模板头部图像A替换为目标头部图像A，将模板头部图像B替换为目标头部图像B，以及将模板头部图像C替换为目标头部图像C。

在本发明的一种可选实施例中，所述在所述初始帧的后续帧中，将所述模板头部图像作为跟踪对象进行跟踪，以得到所述模板头部图像在所述后续帧中的位置，具体可以包括：

步骤S21、若确定所述后续帧中存在更新的模板头部图像，则根据所述更新的模板头部图像，更新所述跟踪对象，以得到更新后的跟踪对象；其中，所述更新的模板头部图像包括：新增的模板头部图像和/或减少的模板头部图像；

步骤S22、对所述更新后的跟踪对象进行跟踪，以得到更新后的模板头部图像在所述后续帧中的位置；

在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像或更新后的模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像。

在具体应用中，所述连续帧图像的每一帧图像中可能包括不同的模板人物，因此，也可能包括不同的模板头部图像。为了可以准确替换表情包的每一帧中的模板头部图像，本发明实施例在所述初始帧的后续帧中跟踪模板头部图像的过程中，判断所述后续帧中是否存在更新的模板头部图像，若存在，则根据所述更新的模板头部图像，更新所述跟踪对象，以得到更新后的跟踪对象，并且对所述更新后的跟踪对象进行跟踪，以得到更新后的模板头部图像在所述后续帧中的位置。

在本发明的一种应用示例中，假设某个表情包的初始帧中包括三个模板人物，如模板人物A、模板人物B和模板人物C，因此，在初始帧中可以检测到三个模板头部图像，如模板头部图像A、模板头部图像B和模板头部图像C。在后续帧中需要跟踪模板头部图像A、模板头部图像B和模板头部图像C这三个头像。假设在第2帧以及后续几帧中，仍然包括上述三个模板人物，而在第5帧中，出现新的模板人物如模板人物D，则在第5帧中存在新增的模板头部图像D，因此，在后面替换头像的操作过程中，需要在第5帧中替换更新后的模板头部图像，包括：模板头部图像A、模板头部图像B、模板头部图像C和模板头部图像D，并且在第5帧的后续帧中需要跟踪更新后的跟踪对象，包括：模板头部图像A、模板头部图像B、模板头部图像C和模板头部图像D。假设在第10帧中，模板人物A消失了，则第10帧中存在减少的模板头部图像A，第10帧中更新后的模板头部图像包括：模板头部图像B、模板头部图像C和模板头部图像D。因此，在后面替换头像的操作过程中，需要在第10帧中替换更新后的模板头部图像，包括：模板头部图像B、模板头部图像C和模板头部图像D，并且在第10帧的后续帧中需要跟踪更新后的跟踪对象，包括：模板头部图像B、模板头部图像C和模板头部图像D。

在确定表情包中每一帧中的模板头部图像的位置之后，可以在模板头部图像或更新后的模板头部图像的位置，覆盖所述目标头部图像。具体地，在上述示例中，对于第一帧(初始帧)至第4帧，在各帧中模板头部图像A、模板头部图像B和模板头部图像C所在位置，覆盖对应的目标头部图像。对于第5帧至第9帧，在各帧中模板头部图像A、模板头部图像B、模板头部图像C和模板头部图像D所在位置，覆盖对应的目标头部图像。对于第10帧，在模板头部图像B、模板头部图像C和模板头部图像D所在位置，覆盖对应的目标头部图像。

由此，本发明实施例可以根据表情包中模板头部图像的变化，对跟踪对象进行更新，以准确地跟踪各模板头部图像，进而可以实现表情包头像替换的准确性。

在本发明的一种可选实施例中，所述确定所述后续帧中存在更新的模板头部图像，具体可以包括：

步骤S31、对所述后续帧中任意的连续两帧分别进行头部检测，以确定所述连续两帧中的前序帧中各模板头部图像对应的第一检测框，以及所述连续两帧中的后序帧中各模板头部图像对应的第二检测框；

步骤S32、若确定所述第一检测框的数目与所述第二检测框的数目不相同，且所述第一检测框中任意两个检测框的并交比超过预设比值，以及所述第二检测框中任意两个检测框的并交比超过预设比值，则确定所述后续帧中存在更新的模板头部图像。

本发明实施例可以对初始帧的后续帧中的任意连续两帧进行检测，以判断初始帧的后续帧中是否存在更新的模板头部图像。本发明实施例将连续两帧中的前一帧图像称为前序帧，连续两帧中的后一帧图像称为后序帧。

可以理解，本发明实施例可以采用已有的任意头部检测算法，如AdaBoost法、SVM法、贝叶斯法、或者利用神经网络模型，对所述后续帧中任意的连续两帧，分别进行头部检测，以确定连续两帧中的前序帧中各模板头部图像对应的第一检测框，以及连续两帧中的后序帧中各模板头部图像对应的第二检测框，所述第一检测框和所述第二检测框可以为矩形框，用于指示被检测图像中可能存在模板头部的区域。

在具体应用中，可以对比前序帧中的第一检测框的数目、以及后序帧中的第二检测框的数目，判断当前帧中是否存在更新的模板头部图像。例如，如果第二检测框的数目大于第一检测框的数目，则可以认为后序帧中存在新增的模板头部图像；同理，如果第二检测框的数目小于第一检测框的数目，则可以认为后序帧中存在减少的模板头部图像。

然而，在实际应用中，由于头部检测过程中可能存在的误差，对于同一个模板头部，可能会出现两个距离很近的检测框，这两个检测框实际上表示的是同一个模板头部。

因此，单独根据检测框的数目判断后续帧中是否出现新增的或者减少的模板头部图像，可能出现判断不准确的情况。为了提高判断后续帧中是否存在更新的模板头部图像的准确性，在第一检测框的数目与第二检测框的数目不相同的情况下，本发明实施例进一步判断第一检测框中任意两个检测框的并交比是否均超过预设比值，以及第二检测框中任意两个检测框的并交比是否均超过预设比值，若是，则可以确定所述后续帧中存在更新的模板头部图像。

其中，并交比(Intersection-over-Union，IoU)是目标检测中使用的一个概念，可以表示两个检测框的交叠率，即两个检测框的交集与并集的比值。如果并交比超过预设比值，则可以认为这两个检测框表示的是同一个检测对象，最理想的情况是并交比为1，也即两个检测框完全重叠。

因此，在本发明实施例中，如果第一检测框中任意两个检测框的并交比均超过预设比值，说明第一检测框中的每一个检测框都表示一个模板头部图像，同理，如果第二检测框中任意两个检测框的并交比均超过预设比值，说明第二检测框中的每一个检测框都表示一个模板头部图像。

由此，如果第二检测框的数目大于第一检测框的数目，并且第一检测框中任意两个检测框的并交比均超过预设比值，以及第二检测框中任意两个检测框的并交比均超过预设比值，则可以确定后序帧中存在新增的模板头部图像，也即，可以确定连续两帧中存在更新的模板头部图像，因此，可以确定初始帧的后续帧中存在更新的模板头部图像；如果第二检测框的数目小于第一检测框的数目，并且第一检测框中任意两个检测框的并交比均超过预设比值，以及第二检测框中任意两个检测框的并交比均超过预设比值，则可以确定后序帧中存在减少的模板头部图像，也即，可以确定连续两帧中存在更新的模板头部图像，因此，可以确定初始帧的后续帧中存在更新的模板头部图像。

步骤S41、对所述后续帧中任意的连续两帧分别进行行人检测，以确定所述连续两帧中的前序帧中包含的第一行人，以及确定所述连续两帧中的后序帧中包含的第二行人；

步骤S42、分别对所述第一行人、以及所述第二行人进行身份识别，以确定所述第一行人的行人身份、以及所述第二行人的行人身份；

步骤S43、若确定所述第一行人的行人身份与所述第二行人的行人身份不匹配，则确定所述后续帧中存在更新的模板头部图像。

其中，行人检测是指利用计算机视觉技术判断图像或者视频序列中是否存在行人并给予精确定位。本发明实施例可以采用任何常规的行人检测算法，如HOG(Histogram ofOriented Gradient，方向梯度直方图)结合SVM的行人检测算法，对所述后续帧中任意的连续两帧，分别进行行人检测。

利用行人检测算法检测图像中的行人，可以获得若干行人检测框。所述行人检测框可以是矩形框，用于指示被检测图像中可能存在行人的区域。此外，利用行人检测算法检测图像中的行人还可以获得与每个行人检测框对应的置信度，用于表示该行人检测框中确实存在行人的概率。

本发明实施例可以对前序帧中包括的第一行人进行身份识别，以确定第一行人的行人身份，以及对后序帧中包括的第二行人进行身份识别，以确定第二行人的行人身份。

具体地，可以对检测出的第一行人以及第二行人，采用人脸检测算法，检测出第一行人的人脸图像，以及第二行人的人脸图像，将检测出的人脸图像与已建立的人脸数据库进行比对，进行人脸识别，以确定第一行人的行人身份和第二行人的行人身份。

将第二行人中的每一个行人的行人身份、与第一行人中的每一个行人的行人身份进行匹配，如果存在无法匹配的行人身份，则可以确定连续两帧中存在更新的模板头部图像。

在实际应用中，人物的头部被帽子、衣物等遮挡的概率较高，因此，通过头部图像的检测框判断后续帧中是否存在更新的模板头部图像，可能会受到遮挡物的影响导致判断错误的情况发生，为了提高判断的准确性，本发明实施例利用行人检测的方法，检测图像中的行人，人物的整个身体被遮挡的概率较小，因此，根据检测出的行人身份，判断后续中是否存在更新的模板头部图像，可以提高判断的准确性。

在本发明的一种可选实施例中，所述在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像之前，所述方法还可以包括：

步骤S51、根据面部朝向识别模型，确定所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的面部朝向信息；其中，所述面部朝向识别模型为根据样本头部图像、以及所述样本头部图像对应的面部朝向标注信息训练得到的深度神经网络模型；

步骤S52、根据所述模板头部图像的面部朝向信息，调整所述目标头部图像中的面部朝向，以得到调整后的目标头部图像；

所述在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像，包括：

在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述调整后的目标头部图像，以得到处理后的连续帧图像。

本发明实施例在对连续帧图像中的模板头部图像进行替换之前，还可以对连续帧图像的每一帧中的头部图像进行姿态估计，以确定模板头部的面部朝向。其中，面部朝向指人脸的正面朝向相对于拍摄摄像头的偏转程度。具体地，可以用姿态角表示面部朝向，所述姿态角具体可以包括俯仰角(pitch)、偏航角(yaw)、翻滚角(roll)三种角度，分别代表上下翻转，左右翻转，平面内旋转的角度。其中，俯仰角可以为人脸绕x轴旋转的角度，偏航角可以为人脸绕y轴旋转的角度，翻滚角可以为人脸绕z轴旋转的角度。通过上述姿态角，可以确定模板头部图像的面部朝向信息，也即模板头部图像中人脸相对于拍摄摄像头的偏转程度。

可以理解，在实际应用中，可以按照各种人脸姿态估计的方法对模板头部图像进行人脸姿态估计，以确定模板头部图像的面部朝向信息。其中，人脸姿态估计的方法可以包括但不限于以下至少一种：基于模型的方法，基于人脸特征点的方法，基于分类的方法等。

具体地，本发明实施例可以根据面部朝向识别模型，确定目标头部的面部朝向，所述面部朝向模型可以为根据大量的训练样本和机器学习方法，对现有的神经网络进行有监督训练而得到的深度神经网络模型。

可以理解，所述面部朝向识别模型可以是融合了多种神经网络的分类模型。所述神经网络包括但不限于以下的至少一种或者至少两种的组合、叠加、嵌套：CNN、LSTM、RNN、注意力神经网络等。

所述面部朝向模型的训练样本可以包括：样本头部图像以及每一个样本头部图像对应的面部朝向标注信息。利用机器学习方法，将多个样本头部图像中的每个样本头部图像作为输入，将输入的样本头部图像对应的面部朝向标注信息作为输出，可以训练得到面部朝向识别模型。

由于表情包中的模板头部图像可能具有不同的面部朝向，本发明实施例可以根据面部朝向识别模型检测表情包中模板头部图像的面部朝向，并根据模板头部的面部朝向，调整目标头部图像的面部朝向，使得目标头部图像的面部朝向与模板头部图像的面部朝向一致，例如，模板头部图像的面部朝向为人脸绕y轴向右旋转30度，而目标头部图像的面部朝向为正面朝向，则可以将目标头部图像进行旋转调整，得到人脸绕y轴向右旋转30度的调整后的目标头部图像，再将调整后的目标头部图像覆盖在相对应的模板头部图像位置，由此，可以使得替换后的图像更加自然。

综上，本发明实施例首先从目标图像中提取目标头部图像，然后对连续帧图像的初始帧进行头部检测，以确定所述初始帧中的模板头部图像、以及所述模板头部图像在所述初始帧中的位置，并且在所述初始帧的后续帧中，将所述模板头部图像作为跟踪对象进行跟踪，以得到所述模板头部图像在所述后续帧中的位置。最后，在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

装置实施例

参照图4，示出了本发明的一种图像处理装置实施例的结构框图，所述装置具体可以包括：

提取模块401，用于从目标图像中提取目标头部图像；

检测模块402，用于对连续帧图像的初始帧进行头部检测，以确定所述初始帧中的模板头部图像、以及所述模板头部图像在所述初始帧中的位置；

跟踪模块403，用于在所述初始帧的后续帧中，将所述模板头部图像作为跟踪对象进行跟踪，以得到所述模板头部图像在所述后续帧中的位置；

替换模块404，用于在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像。

可选地，所述跟踪模块403，具体可以包括：

更新子模块，用于若确定所述后续帧中存在更新的模板头部图像，则根据所述更新的模板头部图像，更新所述跟踪对象，以得到更新后的跟踪对象；其中，所述更新的模板头部图像包括：新增的模板头部图像和/或减少的模板头部图像；

跟踪子模块，用于对所述更新后的跟踪对象进行跟踪，以得到更新后的模板头部图像在所述后续帧中的位置；

所述替换模块404，具体可以包括：

第一替换子模块，用于在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像或更新后的模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像。

可选地，所述更新子模块，具体可以包括：

第一检测单元，用于对所述后续帧中任意的连续两帧分别进行头部检测，以确定所述连续两帧中的前序帧中各模板头部图像对应的第一检测框，以及所述连续两帧中的后序帧中各模板头部图像对应的第二检测框；

第一判断单元，用于若确定所述第一检测框的数目与所述第二检测框的数目不相同，且所述第一检测框中任意两个检测框的并交比超过预设比值，以及所述第二检测框中任意两个检测框的并交比超过预设比值，则确定所述后续帧中存在更新的模板头部图像。

可选地，所述更新子模块，具体可以包括：

第二检测单元，用于对所述后续帧中任意的连续两帧分别进行行人检测，以确定所述连续两帧中的前序帧中包含的第一行人，以及确定所述连续两帧中的后序帧中包含的第二行人；

身份识别单元，用于分别对所述第一行人、以及所述第二行人进行身份识别，以确定所述第一行人的行人身份、以及所述第二行人的行人身份；

第二判断单元，用于若确定所述第一行人的行人身份与所述第二行人的行人身份不匹配，则确定所述后续帧中存在更新的模板头部图像。

可选地，所述提取模块401，具体可以包括：

头部检测子模块，用于根据头部检测模型，确定目标图像中的目标头部区域；其中，所述头部检测模型为根据样本头部图像、以及所述样本头部图像对应的头部标注信息训练得到的深度神经网络模型；

图像提取子模块，用于根据所述目标头部区域，提取目标头部图像。

可选地，所述目标头部图像和/或所述模板头部图像的数目大于1，且各目标头部图像与各模板头部图像之间具有对应关系；

所述替换模块404，具体可以包括：

第二替换子模块，用于根据目标头部与模板头部之间的对应关系，在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖与所述模板头部图像对应的目标头部图像，以得到处理后的连续帧图像。

可选地，所述装置还可以包括：

朝向识别模块，用于根据面部朝向识别模型，确定所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的面部朝向信息；其中，所述面部朝向识别模型为根据样本头部图像、以及所述样本头部图像对应的面部朝向标注信息训练得到的深度神经网络模型；

朝向调整模块，用于根据所述模板头部图像的面部朝向信息，调整所述目标头部图像中的面部朝向，以得到调整后的目标头部图像；

所述替换模块404，具体可以包括：

第三替换子模块，用于在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述调整后的目标头部图像，以得到处理后的连续帧图像。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本发明实施例提供了一种用于图像处理的装置，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：从目标图像中提取目标头部图像；对连续帧图像的初始帧进行头部检测，以确定所述初始帧中的模板头部图像、以及所述模板头部图像在所述初始帧中的位置；在所述初始帧的后续帧中，将所述模板头部图像作为跟踪对象进行跟踪，以得到所述模板头部图像在所述后续帧中的位置；在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像。

图5是根据一示例性实施例示出的一种用于图像处理的装置800的框图。例如，装置800可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图5，装置800可以包括以下一个或多个组件：处理组件802，存储器804，电源组件806，多媒体组件808，音频组件810，输入/输出(I/O)的接口812，传感器组件814，以及通信组件816。

处理组件802通常控制装置800的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理组件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统，一个或多个电源，及其他与为装置800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风(MIC)，当装置800处于操作模式，如呼叫模式、记录模式和语音信息处理模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。

I/O接口812为处理组件802和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器，用于为装置800提供各个方面的状态评估。例如，传感器组件814可以检测到设备800的打开/关闭状态，组件的相对定位，例如所述组件为装置800的显示器和小键盘，传感器组件814还可以检测装置800或装置800一个组件的位置改变，用户与装置800接触的存在或不存在，装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件816还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频信息处理(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器804，上述指令可由装置800的处理器820执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

图6是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processingunits，CPU)1922(例如，一个或一个以上处理器)和存储器1932，一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中，存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1922可以设置为与存储介质1930通信，在服务器1900上执行存储介质1930中的一系列指令操作。

服务器1900还可以包括一个或一个以上电源1926，一个或一个以上有线或无线网络接口1950，一个或一个以上输入输出接口1958，一个或一个以上键盘1956，和/或，一个或一个以上操作系统1941，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时，使得装置能够执行图1所示的图像处理方法。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时，使得装置能够执行一种图像处理方法，所述方法包括：从目标图像中提取目标头部图像；对连续帧图像的初始帧进行头部检测，以确定所述初始帧中的模板头部图像、以及所述模板头部图像在所述初始帧中的位置；在所述初始帧的后续帧中，将所述模板头部图像作为跟踪对象进行跟踪，以得到所述模板头部图像在所述后续帧中的位置；在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像。

本发明实施例公开了A1、一种图像处理方法，包括：

从目标图像中提取目标头部图像；

A2、根据A1所述的方法，所述在所述初始帧的后续帧中，将所述模板头部图像作为跟踪对象进行跟踪，以得到所述模板头部图像在所述后续帧中的位置，包括：

若确定所述后续帧中存在更新的模板头部图像，则根据所述更新的模板头部图像，更新所述跟踪对象，以得到更新后的跟踪对象；其中，所述更新的模板头部图像包括：新增的模板头部图像和/或减少的模板头部图像；

对所述更新后的跟踪对象进行跟踪，以得到更新后的模板头部图像在所述后续帧中的位置；

A3、根据A2所述的方法，所述确定所述后续帧中存在更新的模板头部图像，包括：

对所述后续帧中任意的连续两帧分别进行头部检测，以确定所述连续两帧中的前序帧中各模板头部图像对应的第一检测框，以及所述连续两帧中的后序帧中各模板头部图像对应的第二检测框；

若确定所述第一检测框的数目与所述第二检测框的数目不相同，且所述第一检测框中任意两个检测框的并交比超过预设比值，以及所述第二检测框中任意两个检测框的并交比超过预设比值，则确定所述后续帧中存在更新的模板头部图像。

A4、根据A2所述的方法，所述确定所述后续帧中存在更新的模板头部图像，包括：

对所述后续帧中任意的连续两帧分别进行行人检测，以确定所述连续两帧中的前序帧中包含的第一行人，以及确定所述连续两帧中的后序帧中包含的第二行人；

分别对所述第一行人、以及所述第二行人进行身份识别，以确定所述第一行人的行人身份、以及所述第二行人的行人身份；

若确定所述第一行人的行人身份与所述第二行人的行人身份不匹配，则确定所述后续帧中存在更新的模板头部图像。

A5、根据A1所述的方法，所述从目标图像中提取目标头部图像，包括：

根据头部检测模型，确定目标图像中的目标头部区域；其中，所述头部检测模型为根据样本头部图像、以及所述样本头部图像对应的头部标注信息训练得到的深度神经网络模型；

根据所述目标头部区域，提取目标头部图像。

A6、根据A1至A5中任一所述的方法，所述目标头部图像和/或所述模板头部图像的数目大于1，且各目标头部图像与各模板头部图像之间具有对应关系；

A7、根据A1至A5中任一所述的方法，所述在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像之前，所述方法还包括：

根据面部朝向识别模型，确定所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的面部朝向信息；其中，所述面部朝向识别模型为根据样本头部图像、以及所述样本头部图像对应的面部朝向标注信息训练得到的深度神经网络模型；

根据所述模板头部图像的面部朝向信息，调整所述目标头部图像中的面部朝向，以得到调整后的目标头部图像；

本发明实施例公开了B8、一种图像处理装置，所述装置包括：

提取模块，用于从目标图像中提取目标头部图像；

B9、根据B8所述的装置，所述跟踪模块，包括：

所述替换模块，包括：

B10、根据B9所述的装置，所述更新子模块，包括：

B11、根据B9所述的装置，所述更新子模块，包括：

B12、根据B8所述的装置，所述提取模块，包括：

B13、根据B8至B12中任一所述的装置，所述目标头部图像和/或所述模板头部图像的数目大于1，且各目标头部图像与各模板头部图像之间具有对应关系；

所述替换模块，包括：

B14、根据B8至B12中任一所述的装置，所述装置还包括：

所述替换模块，包括：

本发明实施例公开了C15、一种用于图像处理的装置，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

从目标图像中提取目标头部图像；

C16、根据C15所述的装置，所述在所述初始帧的后续帧中，将所述模板头部图像作为跟踪对象进行跟踪，以得到所述模板头部图像在所述后续帧中的位置，包括：

C17、根据C16所述的装置，所述确定所述后续帧中存在更新的模板头部图像，包括：

C18、根据C16所述的装置，所述确定所述后续帧中存在更新的模板头部图像，包括：

C19、根据C15所述的装置，所述从目标图像中提取目标头部图像，包括：

根据所述目标头部区域，提取目标头部图像。

C20、根据C15至C19中任一所述的装置，所述目标头部图像和/或所述模板头部图像的数目大于1，且各目标头部图像与各模板头部图像之间具有对应关系；

C21、根据C15至C19中任一所述的装置，所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

本发明实施例公开了D22、一种机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得装置执行如A1至A7中一个或多个所述的图像处理方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

以上对本发明所提供的一种图像处理方法、一种图像处理装置和一种用于图像处理的装置，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种图像处理方法，其特征在于，所述方法包括：

从目标图像中提取目标头部图像；

在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像；

所述在所述初始帧的后续帧中，将所述模板头部图像作为跟踪对象进行跟踪，以得到所述模板头部图像在所述后续帧中的位置，包括：

对所述更新后的跟踪对象进行跟踪，以得到更新后的模板头部图像在所述后续帧中的位置。

2.根据权利要求1所述的方法，其特征在于，所述在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像，包括：

3.根据权利要求2所述的方法，其特征在于，所述确定所述后续帧中存在更新的模板头部图像，包括：

4.根据权利要求2所述的方法，其特征在于，所述确定所述后续帧中存在更新的模板头部图像，包括：

5.根据权利要求1所述的方法，其特征在于，所述从目标图像中提取目标头部图像，包括：

根据所述目标头部区域，提取目标头部图像。

6.根据权利要求1至5中任一所述的方法，其特征在于，所述目标头部图像和/或所述模板头部图像的数目大于1，且各目标头部图像与各模板头部图像之间具有对应关系；

7.根据权利要求1至5中任一所述的方法，其特征在于，所述在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像之前，所述方法还包括：

8.一种图像处理装置，其特征在于，所述装置包括：

提取模块，用于从目标图像中提取目标头部图像；

替换模块，用于在所述连续帧图像的初始帧、以及所述初始帧的后续帧中所述模板头部图像的位置，覆盖所述目标头部图像，以得到处理后的连续帧图像；

所述跟踪模块包括：

跟踪子模块，用于对所述更新后的跟踪对象进行跟踪，以得到更新后的模板头部图像在所述后续帧中的位置。

9.一种用于图像处理的装置，其特征在于，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

从目标图像中提取目标头部图像；

10.一种机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得装置执行如权利要求1至7任一项的图像处理方法。