WO2022027447A1

WO2022027447A1 - 图像处理方法、相机及移动终端

Info

Publication number: WO2022027447A1
Application number: PCT/CN2020/107433
Authority: WO
Inventors: 李广; 朱传杰; 李志强; 李静
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2020-08-06
Filing date: 2020-08-06
Publication date: 2022-02-10
Also published as: CN113841112A

Abstract

本申请实施例公开了一种图像处理方法，包括：获取分身效果指令；根据所述分身效果指令，对拍摄有运动主体的原始视频进行处理，得到目标视频，所述目标视频包括所述运动主体及所述运动主体对应的至少一个动态分身，所述动态分身以指定时延重复所述运动主体的运动。本申请实施例公开的方法，实现了分身的视频效果，提高了用户制作视频的趣味性，使用户可以制作富有创意的视频。

Description

图像处理方法、相机及移动终端

技术领域

本申请涉及图像处理技术领域，尤其涉及一种图像处理方法、相机、移动终端及计算机可读存储介质。

背景技术

随着视频技术的发展，越来越多的电子设备具有拍摄视频的功能。通过拍摄视频，人们可以轻松的记录下所见所闻。而在拍摄视频后，为了增加视频内容的创意，人们可以在视频中增加各种效果。

发明内容

本申请实施例提供了一种图像处理方法、相机、移动终端及计算机可读存储介质，可以实现一种分身的视频效果。

本申请实施例第一方面提供了一种图像处理方法，包括：

获取分身效果指令；

根据所述分身效果指令，对拍摄有运动主体的原始视频进行处理，得到目标视频，所述目标视频包括所述运动主体及所述运动主体对应的至少一个动态分身，所述动态分身以指定时延重复所述运动主体的运动。

本申请实施例第二方面提供了一种相机，包括：处理器与存储计算机程序的存储器；

所述处理器在执行所述计算机程序时实现以下步骤：

获取分身效果指令；

本申请实施例第三方面提供了一种移动终端，包括：处理器与存储计算机程序的存储器；

所述处理器在执行所述计算机程序时实现以下步骤：

获取分身效果指令；

本申请实施例第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面中的任一种图像处理方法。

本申请实施例提供的图像处理方法，可以在获取分身效果指令后，对拍摄有运动主体的原始视频进行处理，使视频中的运动主体具有至少一个动态分身，并且动态分身可以以指定时延重复运动主体的运动。本申请实施例提供了一种视频的分身效果，提高了用户制作视频的趣味性，使用户可以制作富有创意的视频。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1A是本申请实施例提供的原始视频中的第N帧。

图1B是图1A所示的第N帧在处理后的效果图。

图2是本申请实施例提供的一种图像处理方法的流程图。

图3是本申请实施例提供的一种相机的结构图。

图4是本申请实施例提供的一种移动终端的结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供了一种图像处理方法，该图像处理方法可以对视频中的运动主体增加分身效果，即可以使运动主体具有至少一个与该运动主体对应的动态分身，动态分身可以以指定时延重复该运动主体的运动。

可以参考图1A与图1B，图1A是本申请实施例提供的原始视频中的第N帧，图1B是该第N帧在处理后的效果图。若原始视频中第N帧的运动主体是X，则在目标视频(即对原始视频进行处理后得到的视频)的第N帧中，该运动主体X可以具有至少一个分身，如图1B中具有两个分身X’与X”，分身在第N帧中所做的动作是运动主体X曾经做过的动作，比如，在一个例子中，X’所做的动作可以是运动主体X在5帧前的动作，X”所做的动作可以是运动主体X在10帧前的动作。

需要注意的是，图1A和图1B所示的仅是一个视频帧在处理前后的效果，而当多个视频帧被连续播放时，从视频效果上，每一个分身并不是静态的，而是动态的以一定的时延在重复运动主体的动作，即每一个分身可以是动态分身。

还需注意的是，图1A与图1B仅是为方便理解而提供的示例，在实际应用时，分身的数量、分身落后的时延、分身的透明度等分身效果的参数都可以由用户自行设定或者使用系统的默认参数，该部分内容的实现将在后文中展开说明。

本申请实施例提供的图像处理方法，可以实现分身效果，提高了用户制作视频的趣味性，使用户可以制作富有创意的视频。

下面可以参见图2，图2是本申请实施例提供的一种图像处理方法的流程图。该方法可以应用于相机、移动终端、图像处理设备及其他的电子设备，该方法包括：

S210、获取分身效果指令。

S220、根据分身效果指令，对拍摄有运动主体的原始视频进行处理，得到具有分身效果的目标视频。

分身效果指令可以是由用户触发。在一个例子中，分身效果指令可以是交互界面中的一个按键，用户点击该按键后，可以触发对原始视频进行分身效果的处理。在一个例子中，分身效果指令也可以是一个实体按键。当然，分身效果指令也可以通过其他方式触发，比如可以通过语音、触摸手势等等。

分身效果指令中可以包括以下一种或多种信息：分身个数、分身帧间隔、分身透明度。分身帧间隔可以是相邻分身之间动作的相差帧数。如前所述，这些信息可以由用户自行设置，也可以使用系统的默认参数。

在获取分身效果指令后，可以对拍摄有运动主体的原始视频进行处理，在一种实施方式中，对拍摄有运动主体的原始视频进行处理，可以包括以下步骤：

S221、从拍摄有运动主体的原始视频中获取第一视频帧和第二视频帧。

S222、将第一视频帧映射至第二视频帧对应的空间。

S223、根据映射后的第一视频帧与第二视频帧，合成第一目标视频帧。

其中，第一视频帧对应的时刻早于第二视频帧，比如，第二视频帧可以是第i帧，则第一视频帧对应的帧序号小于i，如i-3、i-5等。

分身效果的实现，可以通过将第一视频帧中的运动主体融合至第二视频帧中，从而使第二视频帧中的运动主体具有分身，该分身即为第一视频帧的运动主体。

考虑到在对运动主体进行拍摄的时候，拍摄者通常会改变拍摄的角度，换言之，第一视频帧对应的拍摄角度与第二视频帧对应的拍摄角度可能不同。那么，在将第一视频帧中的运动主体融合至第二视频帧中时，为了使分身效果更加自然、真实，可以将第一视频帧映射至第二视频帧对应的空间，再进行两者的合成。

举个例子，比如原始视频中的运动主体正在奔跑，其中，第一视频帧中的运动主体处在空中，第一视频帧的拍摄角度对应在拍摄者的左前方，若第二视频帧中的运动主体正好落地，第二视频帧中的拍摄角度对应拍摄者的正前方，则可以将第一视频帧通过空间变换等方式映射成对应正前方的拍摄角度，得到对第一视频帧中的运动主体、以正前方的角度进行拍摄所能得到的图像(即映射后的第一视频帧)。由于该映射后的第一视频帧与第二视频帧的拍摄角度匹配，因此合成出的第一目标视频帧中的分身效果更自然、真实。

在一种实施方式中，原始视频可以是通过相机在原地进行旋转拍摄得到。需要注意的是，所谓的原地是指相机在世界坐标系中的坐标大致不变，比如，若相机在世界坐标系中的位移量小于或等于预设阈值，则可以认为相机仍在原地。而在拍摄时，相机可以在原地任意的旋转，比如可以从左转到右，也可以从上转到下，本申请对此不作限制。

由于原始视频是通过相机在原地进行旋转拍摄得到的，即相机在世界坐标系上的坐标大致不变，因此在第一视频帧映射至第二视频帧对应的空间时，所涉及的只是二维的空间变换，即只需计算旋转量即可，无需对整个场景进行三维建模，从而大大降低实现分身效果所需的计算资源，分身效果的处理速度大幅度提升，可以做到实时处理，从而极大方便了用户进行视频分享。

在一种实施方式中，原始视频可以是在获取到分身效果指令之后实时拍摄得到的。比如，相机中可以配置有分身效果的拍摄模式，用户可以通过点击等操作触发该拍摄模式、发出分身效果指令，则相机在获取到分身效果指令后可以进入拍摄模式。在拍摄前，相机可以通过文字、语音等方式提示用户在原地进行拍摄。

对分身效果的处理，可以是相机一边进行原始视频的拍摄一边对已拍摄得到的视频帧进行分身效果的处理，也可以在用户完成原始视频的拍摄后，相机再对原始视频进行分身效果的处理。

在用户进行原始视频的拍摄时，相机还可以实时定位其在世界坐标系中的位置，若检测到相机的位移量超出预设阈值，可以暂停拍摄并向用户发出位移过大的提醒。

在一种实施方式中，原始视频也可以是用户从视频素材中选取的片段。比如，用户所拍摄的视频可以包括风景对应的片段以及人物运动对应的片段，则用户可以截选出人物运动对应的片段，对该人物运动对应的片段添加分身效果。

在一种实施方式中，相机可以装载在云台上且相机配置有自动跟随目标的算法，则在对运动主体进行拍摄时，相机在云台的控制下可以在原地自动跟随运动主体进行旋转拍摄。

在将第一视频帧映射至第二视频帧对应的空间时，具体的，可以通过空间变换矩阵对第一视频帧进行处理。

空间变换矩阵的确定可以有多种方式，在一种实施方式中，空间变换矩阵可以是旋转矩阵。旋转矩阵可以利用相机的位姿信息进行计算，相机的位姿信息可以通过相机的惯性测量单元IMU获取。比如，可以获取拍摄第一视频帧时对应的相机位姿信息，以及获取拍摄第二视频帧对应的相机位姿信息，根据第一视频帧与第二视频帧两者对应的相机位姿信息的差值，可以计算出旋转矩阵。

在另一种实施方式中，空间变换矩阵还可以包括单应性矩阵。单应性矩阵可以根据第一视频帧与第二视频帧的特征匹配结果计算得出。具体的，特征匹配可以针对视频帧中的指定区域(指定内容)进行，在一个例子中，该指定区域比如可以是除运动主体以外的背景区域(场景区域)。通过对第一视频帧的背景区域进行特征点提取，对第二视频帧的背景区域进行特征点提取，从而可以对提取出的特征点进行特征匹配，得到多个匹配出的多个特征对，根据这些特征对，可以计算单应性矩阵。

进一步的，考虑到匹配出的多个特征对并不一定均匹配准确，即有一些匹配出的特征对可能是不可信、不准确的，因此可以对多个特征对进行筛选，筛选出其中的匹配正确的可信特征对，再根据筛选出的可信特征对计算单应性矩阵。

在一种实施方式中，映射后的第一视频帧可以与第二视频帧合成，从而得到第一目标视频帧。第一目标视频帧可以是目标视频中的一帧。考虑到第一视频帧映射至第二视频帧对应的空间时，对第一视频帧的空间变换并不是绝对准确的，即计算出的第一视频帧与第二视频帧之间的空间关系有一定的误差，因此，若直接利用映射后的整个第一视频帧与第二视频帧进行合成，则合成得到的第一目标视频帧将出现画面模糊，且当前帧主体也会变得透明。所以，在另一种实施方式中，可以对映射后的第一视频帧进行运动主体的提取，提取出分身图像，再将该分身图像与第二视频帧进行合成。

对映射后的第一视频帧进行运动主体的提取有多种可行的方式。在一种实施方式中，可以通过对第一视频帧进行主体分割，得到运动主体对应的原始掩膜；可以通过空间变换矩阵将该原始掩膜映射至第二视频帧对应的空间，得到目标掩膜；该目标掩膜可以用于对映射后的第一视频帧进行处理，比如可以使该目标掩膜与映射后的第一视频帧相乘，则可以提取出映射后的第一视频帧中的运动主体，得到分身图像。

上述实施方式中，在得到目标掩膜之后，进一步的，还可以去除该目标掩膜中与第二视频帧中的运动主体重叠的部分。具体实现时，比如可以对第二视频帧进行主体分割，得到第二视频帧对应的运动主体的掩膜，则可以将目标掩膜中的与该第二视频帧对应的运动主体的掩膜重叠的部分去除。在对目标掩膜进行上述重叠部分的去除处理后，可以利用处理后的目标掩膜对映射后的第一视频帧进行处理，从而可以使最终合成得到的第一目标视频帧中，运动主体不会与分身有过多重叠。

在得到目标掩膜之后，还可以对目标掩膜进行模糊处理，具体的，可以对目标掩膜中的非0值(即运动主体对应的区域)进行高斯模糊，比如可以对目标掩膜的非0值乘以255再限制到255。通过对目标掩膜进行模糊处理，可以使提取得到的分身图像与第二视频帧的融合效果更加自然，在目标视频帧中的分身不会有明显的边界等图像处理痕迹，分身效果更加真实。

对于多分身效果的实现，在一种实施方式中，可以采用FIR式合成。采用FIR式合成时，前文所提及的第一视频帧可以有多个，即第一视频帧可以是指代对应的时刻早于第二视频帧的一类视频帧，第一目标视频帧可以是目标视频中开始有分身的任一帧。FIR式合成可以将用于制作分身的每个第一视频帧都合成到第二视频帧中，从而实现第二视频帧中的运动主体具有多个分身。比如，在一个例子中，若希望合成得到的第一目标视频帧中运动主体具有3个分身，第二视频帧比如可以是第10帧，第一视频帧比如可以包括第1帧、第4帧与第7帧，那么，在实现运动主体的3个分身时，可以将该第1帧、第4帧与第7帧合成到第10帧中，从而使第10帧的运动主体具有 3个分身，3个分身分别对应第1帧、第4帧与第7帧中的运动主体。

需要注意的是，由于一个分身对应原始视频中的一个视频帧，因此，若需要实现K个分身，则第二视频帧的帧序号可以大于K，从而可以有至少K个用于制作分身的第一视频帧。

上述将第1帧、第4帧与第7帧合成到第10帧的例子中，分身帧间隔为3帧。分身帧间隔可以用于表征相邻分身之间在动作上相差的帧数，比如在合成得到的第一目标视频帧中，第7帧对应的分身在动作上落后运动主体3帧，第4帧对应的分身落后第7帧对应的分身3帧，第1帧对应的分身落后第4帧对应的分身3帧。合成得到的第一目标视频帧与第二视频帧的帧序号对应，即第一目标视频帧为目标视频中的第10帧。而对于目标视频的第11帧，若仍然是实现3个分身，则可以将原始视频中的第2帧、第5帧与第8帧合成至原始视频中的第11帧得到。而对于目标视频帧的第13帧，可以将原始视频中的第4帧、第7帧、第10帧合成至原始视频的第13帧得到。目标视频后续的视频帧的合成思路相同，在此不再赘述。

上述所提供的FIR式合成方式，当需要合成K个分身时，需要将K个第一视频帧合成至第二视频帧，计算量很大。因此，本申请实施例提供另一种实施方式，可以采用IIR式合成，即可以利用已合成得到的目标视频帧来合成后续的目标视频帧，从而可以大大减少计算量。

对于IIR式合成，前文所提及的第一视频帧可以是原始视频中的一帧，将映射后的第一视频帧合成至第二视频帧中，可以得到具有1个分身的第一目标视频帧。在合成得到第一目标视频帧之后，还可以从原始视频中获取第三视频帧，第三视频帧对应的时刻晚于所述第二视频帧，且第一视频帧、第二视频帧与第三视频帧之间的帧间隔相同。比如第一视频帧是原始视频中的第1帧，第二视频帧是原始视频中的第4帧，则获取的第三视频帧可以是原始视频中的第7帧。

获取第三视频帧后，可以将已合成的第一目标视频帧映射至第三视频帧对应的空间，再根据映射后的第一目标视频帧与第三视频帧，合成第二目标视频帧。由于第一目标视频帧中已包括运动主体以及该运动主体对应的1个分身，因此合成的第二目标视频帧中可以包括运动主体以及该运动主体对应的2个分身。

可以理解的是，在IIR式合成中，合成得到的第一目标视频帧具有1个分身。举个例子，比如若设置分身帧间隔为3，则目标视频的第1帧、第2帧与第3帧均没有分身，目标视频的第4帧开始有1个分身，该第4帧是利用原始视频中的第1帧与第4帧合成得到的；目标视频的第5帧有1个分身，该第5帧是利用原始视频中的第2 帧与第5帧合成得到的；目标视频的第6帧有1个分身，该第6帧是利用原始视频中的第3帧与第6帧合成得到的，则第一目标视频帧可以是第4帧、第5帧或第6帧中的任一帧。

对于目标视频的第7帧，在IIR式合成中，该第7帧可以具有2个分身，其可以利用已合成的目标视频的第4帧与原始视频的第7帧合成得到；目标视频的第8帧可以具有2个分身，该第8帧可以利用已合成的目标视频的第5帧与原始视频的第8帧合成得到；目标视频的第9帧可以具有2个分身，该第9帧可以利用已合成的目标视频的第6帧与原始视频的第9帧合成得到；目标视频的第10帧可以具有3个分身，该第10帧可以利用已合成的目标视频的第7帧与原始视频的第10帧合成得到……以此类推。

可见，在IIR式合成中，当需要合成K个分身时，可以利用已合成的具有K-1个分身的目标视频帧与原始视频中的对应视频帧进行合成，换言之，无论合成多少个分身，每一目标视频帧的合成均只是两个视频帧的合成，相比FIR式合成而言计算量大大降低。

对于将第一目标视频帧映射至第三视频帧对应的空间，由于第一目标视频帧在空间上实际与原始视频的第二视频帧对应，因此，可以使用第二视频帧映射至第三视频帧所对应的空间变换矩阵来进行第一目标视频帧的映射。而对于第二视频帧映射至第三视频帧对应的空间变换矩阵，前文已有具体实现的说明，比如可以利用第二视频帧与第三视频帧之间的相机位姿信息的差值计算旋转矩阵，又或者可以对第二视频帧与第三视频帧进行特征匹配以计算单应性矩阵。

在一种实施方式中，也可以对映射后的第一目标视频帧的运动主体进行提取。具体的，可以参考下面提供的实施例。

若第一视频帧为第i-fs帧，第二视频帧为第i帧，第三视频帧为第i+fs帧，fs为分身帧间隔，可以对第一视频帧、第二视频帧与第三视频帧分别进行主体分割，得到各自对应的掩膜M(i-fs)、M(i)、M(i+fs)(掩膜可以分离出视频帧中的运动主体)。可以计算用于将第一视频帧F(i-fs)映射至第二视频帧F(i)的空间变换矩阵H(i)，计算用于将第二视频帧F(i)映射至第三视频帧F(i+fs)的空间变换矩阵H(i+fs)，具体的计算方式可以参考前文中的相关说明。

通过H(i)可以将掩膜M(i-fs)映射到第二视频帧对应的空间，得到目标掩膜，可以对目标掩膜除去与M(i)重叠的部分，得到掩膜Mch(i-fs)。对该掩膜Mch(i-fs)，还可以进行高斯模糊，得到掩膜Mchb(i-fs)。

通过H(i)可以将第一视频帧F(i-fs)映射到第二视频帧F(i)对应的空间，得到映射后的第一视频帧Fch(i-fs)。利用掩膜Mchb(i-fs)对映射后的第一视频帧Fch(i-fs)进行运动主体的提取，提取出的分身图像可以与第二视频帧F(i)合成，从而可以得到第一目标视频帧Fc(i)。

进一步的，可以通过式子Mc(i)＝M(i)+Mch(i-fs)./r，计算第一目标视频帧对应的掩膜Mc(i)。由于Mch(i-fs)对应第一视频帧的运动主体，M(i)对应第二视频帧的运动主体，因此，可以通过Mch(i-fs)./r实现对第一视频帧的运动主体进行衰减，其中r为衰减系数，其可以根据需求进行设置。比如可以设置r＝2，则最终效果上，运动主体的分身在动作上落后的帧数越多，其对应的透明度将越大，如图1B所示，运动主体X的透明度为0％，分身X’的透明度可以为50％，分身X”的透明度可以为75％。当然，若想使各分身不透明，也可以设置r＝1，即不进行衰减。

衰减后的掩膜Mch(i-fs)./r可以与第二视频帧的运动主体对应的掩膜M(i)结合，从而得到第一目标视频帧对应的掩膜Mc(i)，该掩膜Mc(i)可以提取出第一目标视频帧中的运动主体与分身。

还可以通过对掩膜Mc(i)中的像素值进行限制，比如可以使掩膜Mc(i)中像素值低于预设阈值的部分为0，从而，在与衰减系数配合下，可以达到限制分身的数量的效果。当然，分身数量的限制还有其他的方法，本申请对此不做限制。

对掩膜Mc(i)，可以通过H(i+fs)进行映射，对映射后的掩膜Mc(i)可以除去与M(i+fs)重叠的部分，得到Mch(i)。同样的，可以对Mch(i)进行高斯模糊，得到Mchb(i)。通过H(i+fs)可以将第一目标视频帧Fc(i)映射到第三视频帧F(i+fs)对应的空间，得到映射后的第一目标视频帧Fch(i)。利用掩膜Mchb(i)对映射后的第一目标视频帧Fch(i)进行运动主体以及分身的提取，提取出的分身图像可以与第三视频帧F(i+fs)合成，从而可以得到第二目标视频帧Fc(i+fs)。

对于目标视频后续的视频帧的合成，可以参考上述第二目标视频帧的合成方式，在此不再赘述。

在一种实施方式中，分身帧间隔可以是变化的，即可以实现非等间隔的分身效果。比如在目标视频的第i帧中，运动主体可以具有三个分身，第一个分身可以对应原始视频中的第i-2帧(与运动主体的间隔是2帧)，第二个分身可以对应原始视频中的第i-5帧(与第一个分身的间隔是3帧)，第三个分身可以对应原始视频中的第i-9帧(与第二个分身的间隔是4帧)。

以上为本申请实施例提供的图像处理方法的详细说明。

本申请实施例提供的图像处理方法，可以对视频进行处理，使视频中的运动主体具有分身，提高了视频的创意与视频制作的趣味性。并且，通过约束用户在原地进行原始视频的拍摄，可以大大降低对原始视频增加分身效果所需的计算量，从而无需使用AE等后处理特效软件也可以实现分身效果，使用户在相机、移动终端等电子设备上就可以对视频进行分身效果的处理，极大的方便了用户进行视频制作和分享。

下面可以参考图3，图3是本申请实施例提供的一种相机的结构图，该相机可以是手机等电子设备上的配置相机，也可以是无人机上搭载的相机，也可以是运动相机。该相机可以包括镜头、图像传感器、处理器310与存储计算机程序的存储器320。

镜头与图像传感器可以用于进行视频拍摄。

处理器可以用于对所拍摄的视频进行处理，其在执行所述计算机程序时实现以下步骤：

获取分身效果指令；

可选的，所述处理器对拍摄有运动主体的原始视频进行处理时用于，从拍摄有运动主体的原始视频中获取第一视频帧和第二视频帧，其中，所述第一视频帧对应的时刻早于所述第二视频帧；将所述第一视频帧映射至所述第二视频帧对应的空间；根据映射后的所述第一视频帧与所述第二视频帧，合成第一目标视频帧。

可选的，所述处理器将所述第一视频帧映射至所述第二视频帧对应的空间时用于，通过空间变换矩阵对所述第一视频帧进行空间变换，以将所述第一视频帧映射至所述第二视频帧对应的空间。

可选的，还包括：惯性测量单元IMU；

所述空间变换矩阵包括旋转矩阵，所述旋转矩阵基于所述第一视频帧对应的相机位姿信息与所述第二视频帧对应的相机位姿信息计算得到，所述相机位姿信息通过所述IMU获取。

可选的，所述空间变换矩阵包括单应性矩阵，所述处理器还用于，对所述第一视频帧与所述第二视频帧进行特征匹配，并根据匹配结果计算所述单应性矩阵。

可选的，所述匹配结果包括所述第一视频帧与所述第二视频帧之间的多个特征对；

所述处理器根据匹配结果计算所述单应性矩阵时用于，对所述多个特征对进行筛选，并根据筛选出的可信特征对，计算所述单应性矩阵。

可选的，所述处理器对所述第一视频帧与所述第二视频帧进行特征匹配时用于，分别针对所述第一视频帧与所述第二视频帧的指定区域提取特征点，对提取出的特征点进行特征匹配。

可选的，所述指定区域包括除所述运动主体以外的背景区域。

可选的，所述处理器根据映射后的所述第一视频帧与所述第二视频帧，合成第一目标视频帧时用于，对映射后的所述第一视频帧中的运动主体进行提取，得到分身图像；根据所述分身图像与所述第二视频帧，合成所述第二视频帧对应的目标视频帧。

可选的，所述处理器对映射后的所述第一视频帧中的运动主体进行提取时用于，通过所述运动主体对应的目标掩膜对映射后的所述第一视频帧进行处理。

可选的，所述处理器还用于，对所述第一视频帧进行运动主体分割，得到所述运动主体对应的原始掩膜；将所述原始掩膜映射至所述第二视频帧对应的空间，得到所述目标掩膜。

可选的，所述处理器还用于，在通过所述目标掩膜对映射后的所述第一视频帧进行处理之前，去除所述目标掩膜中与所述第二视频帧中的运动主体重叠的部分。

可选的，所述处理器还用于，在通过所述目标掩膜对映射后的所述第一视频帧进行处理之前，对所述目标掩膜进行模糊处理。

可选的，所述处理器还用于，从所述原始视频中获取第三视频帧，所述第三视频帧对应的时刻晚于所述第二视频帧，且所述第一视频帧、所述第二视频帧与第三视频帧之间的帧间隔相同；将所述第一目标视频帧映射至所述第三视频帧对应的空间；根据映射后的所述第一目标视频帧与所述第三视频帧，合成第二目标视频帧。

可选的，所述原始视频是通过所述相机在原地进行旋转拍摄得到的。

可选的，所述原始视频是通过所述相机在原地跟随所述运动主体进行旋转拍摄得到的。

可选的，不同的所述动态分身具有不同的透明度。

可选的，所述动态分身落后所述运动主体的帧数与所述动态分身的透明度正相关。

可选的，所述分身效果指令包括以下一种或多种信息：分身个数、分身帧间隔、分身透明度。

可选的，所述分身效果指令由用户触发。

可选的，所述原始视频是在获取到所述分身效果指令之后实时拍摄得到的。

可选的，所述处理器还用于，在拍摄所述原始视频时，判断所述相机在世界坐标系中的位移量是否小于或等于预设阈值。

可选的，所述原始视频是用户从所拍摄视频中选取的片段。

以上所提供的各种实施方式的相机，其具体的实现可以参考前文中的相关说明，在此不再赘述。

本申请实施例提供的相机，可以对视频进行处理，使视频中的运动主体具有分身，提高了视频的创意与视频制作的趣味性。并且，通过约束用户在原地进行原始视频的拍摄，可以大大降低对原始视频增加分身效果所需的计算量，从而无需使用AE等后处理特效软件也可以实现分身效果，极大的方便了用户进行视频制作和分享。在一种实施方式中，还提出了IIR式的合成方式，进一步减少了实现多个分身所需的计算量，使分身效果实现所需的硬件条件大大降低。

本申请实施例还提供了一种移动终端，可以参见图4，图4是本申请实施例提供的一种移动终端的结构图。

在一种实施方式中，该移动终端可以与相机进行有线或无线连接，从相机处获取相机拍摄的原始视频，对原始视频进行分身效果的处理。在一种实施方式中，该移动终端可以自身配置了相机，原始视频可以是自身相机拍摄得到的视频。

移动终端可以包括处理器410与存储计算机程序的存储器420；

所述处理器在执行所述计算机程序时实现以下步骤：

获取分身效果指令；

可选的，所述空间变换矩阵包括旋转矩阵，所述旋转矩阵基于所述第一视频帧对应的相机位姿信息与所述第二视频帧对应的相机位姿信息计算得到。

可选的，所述原始视频是通过相机在原地进行旋转拍摄得到的。

可选的，不同的所述动态分身具有不同的透明度。

可选的，所述分身效果指令由用户触发。

可选的，所述移动终端配置有相机，所述原始视频是在获取到所述分身效果指令之后通过所述相机实时拍摄得到的。

可选的，所述原始视频是用户从所拍摄视频中选取的片段。

以上所提供的各种实施方式的移动终端，其具体的实现可以参考前文中的相关说明，在此不再赘述。

本申请实施例提供的移动终端，可以对视频进行处理，使视频中的运动主体具有分身，提高了视频的创意与视频制作的趣味性。并且，通过约束用户在原地进行原始视频的拍摄，可以大大降低对原始视频增加分身效果所需的计算量，从而无需使用AE等后处理特效软件也可以实现分身效果，极大的方便了用户进行视频制作和分享。在一种实施方式中，还提出了IIR式的合成方式，进一步减少了实现多个分身所需的计算量，使分身效果实现所需的硬件条件大大降低。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时本申请实施例提供任一种图像处理方法。

以上实施例中对每个步骤分别提供了多种实施方式，至于每个步骤具体采用哪种实施方式，在不存在冲突或矛盾的基础上，本领域技术人员可以根据实际情况自由选择或组合，由此构成各种不同的实施例。而本申请文件限于篇幅，未对各种不同的实施例展开说明，但可以理解的是，各种不同的实施例也属于本申请实施例公开的范围。

本申请实施例可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可用存储介质包括永久性和非永久性、可移动和非可移动媒体，可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于：相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明实施例所提供的方法、电子设备等进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

一种图像处理方法，其特征在于，包括：

获取分身效果指令；

根据所述分身效果指令，对拍摄有运动主体的原始视频进行处理，得到目标视频，所述目标视频包括所述运动主体及所述运动主体对应的至少一个动态分身，所述动态分身以指定时延重复所述运动主体的运动。
根据权利要求1所述的方法，其特征在于，所述对拍摄有运动主体的原始视频进行处理，包括：

从拍摄有运动主体的原始视频中获取第一视频帧和第二视频帧，其中，所述第一视频帧对应的时刻早于所述第二视频帧；

将所述第一视频帧映射至所述第二视频帧对应的空间；

根据映射后的所述第一视频帧与所述第二视频帧，合成第一目标视频帧。
根据权利要求2所述的方法，其特征在于，所述将所述第一视频帧映射至所述第二视频帧对应的空间，包括：

通过空间变换矩阵对所述第一视频帧进行空间变换，以将所述第一视频帧映射至所述第二视频帧对应的空间。
根据权利要求3所述的方法，其特征在于，所述空间变换矩阵包括旋转矩阵，所述旋转矩阵基于所述第一视频帧对应的相机位姿信息与所述第二视频帧对应的相机位姿信息计算得到。
根据权利要求3所述的方法，其特征在于，所述空间变换矩阵包括单应性矩阵，所述单应性矩阵基于以下方式确定：

对所述第一视频帧与所述第二视频帧进行特征匹配，并根据匹配结果计算所述单应性矩阵。
根据权利要求5所述的方法，其特征在于，所述匹配结果包括所述第一视频帧与所述第二视频帧之间的多个特征对；

所述根据匹配结果计算所述单应性矩阵，包括：

对所述多个特征对进行筛选，并根据筛选出的可信特征对，计算所述单应性矩阵。
根据权利要求5所述的方法，其特征在于，所述对所述第一视频帧与所述第二视频帧进行特征匹配，包括：

分别针对所述第一视频帧与所述第二视频帧的指定区域提取特征点，对提取出的特征点进行特征匹配。
根据权利要求7所述的方法，其特征在于，所述指定区域包括除所述运动主体以外的背景区域。
根据权利要求2所述的方法，其特征在于，所述根据映射后的所述第一视频帧与所述第二视频帧，合成第一目标视频帧，包括：

对映射后的所述第一视频帧中的运动主体进行提取，得到分身图像；

根据所述分身图像与所述第二视频帧，合成所述第二视频帧对应的目标视频帧。
根据权利要求9所述的方法，其特征在于，所述对映射后的所述第一视频帧中的运动主体进行提取，包括：

通过所述运动主体对应的目标掩膜对映射后的所述第一视频帧进行处理。
根据权利要求10所述的方法，其特征在于，所述目标掩膜基于以下方式得到：

对所述第一视频帧进行运动主体分割，得到所述运动主体对应的原始掩膜；

将所述原始掩膜映射至所述第二视频帧对应的空间，得到所述目标掩膜。
根据权利要求10所述的方法，其特征在于，在通过所述目标掩膜对映射后的所述第一视频帧进行处理之前，还包括：

去除所述目标掩膜中与所述第二视频帧中的运动主体重叠的部分。
根据权利要求10所述的方法，其特征在于，在通过所述目标掩膜对映射后的所述第一视频帧进行处理之前，还包括：

对所述目标掩膜进行模糊处理。
根据权利要求2所述的方法，其特征在于，所述方法还包括：

从所述原始视频中获取第三视频帧，所述第三视频帧对应的时刻晚于所述第二视频帧，且所述第一视频帧、所述第二视频帧与第三视频帧之间的帧间隔相同；

将所述第一目标视频帧映射至所述第三视频帧对应的空间；

根据映射后的所述第一目标视频帧与所述第三视频帧，合成第二目标视频帧。
根据权利要求1所述的方法，其特征在于，所述原始视频是通过相机在原地进行旋转拍摄得到的。
根据权利要求15所述的方法，其特征在于，所述原始视频是通过所述相机在原地跟随所述运动主体进行旋转拍摄得到的。
根据权利要求1所述的方法，其特征在于，不同的所述动态分身具有不同的透明度。
根据权利要求17所述的方法，其特征在于，所述动态分身落后所述运动主体的帧数与所述动态分身的透明度正相关。
根据权利要求1所述的方法，其特征在于，所述分身效果指令包括以下一种或多种信息：分身个数、分身帧间隔、分身透明度。
根据权利要求1所述的方法，其特征在于，所述分身效果指令由用户触发。
根据权利要求1所述的方法，其特征在于，所述原始视频是在获取到所述分身效果指令之后实时拍摄得到的。
根据权利要求21所述的方法，其特征在于，所述方法还包括：

在拍摄所述原始视频时，判断相机在世界坐标系中的位移量是否小于或等于预设阈值。
根据权利要求1所述的方法，其特征在于，所述原始视频是用户从所拍摄视频中选取的片段。
一种相机，其特征在于，包括：处理器与存储计算机程序的存储器；

所述处理器在执行所述计算机程序时实现以下步骤：

获取分身效果指令；

根据所述分身效果指令，对拍摄有运动主体的原始视频进行处理，得到目标视频，所述目标视频包括所述运动主体及所述运动主体对应的至少一个动态分身，所述动态分身以指定时延重复所述运动主体的运动。
根据权利要求24所述的相机，其特征在于，所述处理器对拍摄有运动主体的原始视频进行处理时用于，从拍摄有运动主体的原始视频中获取第一视频帧和第二视频帧，其中，所述第一视频帧对应的时刻早于所述第二视频帧；将所述第一视频帧映射至所述第二视频帧对应的空间；根据映射后的所述第一视频帧与所述第二视频帧，合成第一目标视频帧。
根据权利要求25所述的相机，其特征在于，所述处理器将所述第一视频帧映射至所述第二视频帧对应的空间时用于，通过空间变换矩阵对所述第一视频帧进行空间变换，以将所述第一视频帧映射至所述第二视频帧对应的空间。
根据权利要求26所述的相机，其特征在于，还包括：惯性测量单元IMU；

所述空间变换矩阵包括旋转矩阵，所述旋转矩阵基于所述第一视频帧对应的相机位姿信息与所述第二视频帧对应的相机位姿信息计算得到，所述相机位姿信息通过所述IMU获取。
根据权利要求26所述的相机，其特征在于，所述空间变换矩阵包括单应性矩阵，所述处理器还用于，对所述第一视频帧与所述第二视频帧进行特征匹配，并根据匹配结果计算所述单应性矩阵。
根据权利要求28所述的相机，其特征在于，所述匹配结果包括所述第一视频帧与所述第二视频帧之间的多个特征对；

所述处理器根据匹配结果计算所述单应性矩阵时用于，对所述多个特征对进行筛选，并根据筛选出的可信特征对，计算所述单应性矩阵。
根据权利要求28所述的相机，其特征在于，所述处理器对所述第一视频帧与所述第二视频帧进行特征匹配时用于，分别针对所述第一视频帧与所述第二视频帧的指定区域提取特征点，对提取出的特征点进行特征匹配。
根据权利要求30所述的相机，其特征在于，所述指定区域包括除所述运动主体以外的背景区域。
根据权利要求25所述的相机，其特征在于，所述处理器根据映射后的所述第一视频帧与所述第二视频帧，合成第一目标视频帧时用于，对映射后的所述第一视频帧中的运动主体进行提取，得到分身图像；根据所述分身图像与所述第二视频帧，合成所述第二视频帧对应的目标视频帧。
根据权利要求32所述的相机，其特征在于，所述处理器对映射后的所述第一视频帧中的运动主体进行提取时用于，通过所述运动主体对应的目标掩膜对映射后的所述第一视频帧进行处理。
根据权利要求33所述的相机，其特征在于，所述处理器还用于，对所述第一视频帧进行运动主体分割，得到所述运动主体对应的原始掩膜；将所述原始掩膜映射至所述第二视频帧对应的空间，得到所述目标掩膜。
根据权利要求33所述的相机，其特征在于，所述处理器还用于，在通过所述目标掩膜对映射后的所述第一视频帧进行处理之前，去除所述目标掩膜中与所述第二视频帧中的运动主体重叠的部分。
根据权利要求33所述的相机，其特征在于，所述处理器还用于，在通过所述目标掩膜对映射后的所述第一视频帧进行处理之前，对所述目标掩膜进行模糊处理。
根据权利要求25所述的相机，其特征在于，所述处理器还用于，从所述原始视频中获取第三视频帧，所述第三视频帧对应的时刻晚于所述第二视频帧，且所述第一视频帧、所述第二视频帧与第三视频帧之间的帧间隔相同；将所述第一目标视频帧映射至所述第三视频帧对应的空间；根据映射后的所述第一目标视频帧与所述第三视频帧，合成第二目标视频帧。
根据权利要求24所述的相机，其特征在于，所述原始视频是通过所述相机在原地进行旋转拍摄得到的。
根据权利要求38所述的相机，其特征在于，所述原始视频是通过所述相机在原地跟随所述运动主体进行旋转拍摄得到的。
根据权利要求24所述的相机，其特征在于，不同的所述动态分身具有不同的透明度。
根据权利要求40所述的相机，其特征在于，所述动态分身落后所述运动主体的帧数与所述动态分身的透明度正相关。
根据权利要求24所述的相机，其特征在于，所述分身效果指令包括以下一种或多种信息：分身个数、分身帧间隔、分身透明度。
根据权利要求24所述的相机，其特征在于，所述分身效果指令由用户触发。
根据权利要求24所述的相机，其特征在于，所述原始视频是在获取到所述分身效果指令之后实时拍摄得到的。
根据权利要求44所述的相机，其特征在于，所述处理器还用于，在拍摄所述原始视频时，判断所述相机在世界坐标系中的位移量是否小于或等于预设阈值。
根据权利要求24所述的相机，其特征在于，所述原始视频是用户从所拍摄视频中选取的片段。
一种移动终端，其特征在于，包括：处理器与存储计算机程序的存储器；

所述处理器在执行所述计算机程序时实现以下步骤：

获取分身效果指令；

根据所述分身效果指令，对拍摄有运动主体的原始视频进行处理，得到目标视频，所述目标视频包括所述运动主体及所述运动主体对应的至少一个动态分身，所述动态分身以指定时延重复所述运动主体的运动。
根据权利要求47所述的移动终端，其特征在于，所述处理器对拍摄有运动主体的原始视频进行处理时用于，从拍摄有运动主体的原始视频中获取第一视频帧和第二视频帧，其中，所述第一视频帧对应的时刻早于所述第二视频帧；将所述第一视频帧映射至所述第二视频帧对应的空间；根据映射后的所述第一视频帧与所述第二视频帧，合成第一目标视频帧。
根据权利要求48所述的移动终端，其特征在于，所述处理器将所述第一视频帧映射至所述第二视频帧对应的空间时用于，通过空间变换矩阵对所述第一视频帧进行空间变换，以将所述第一视频帧映射至所述第二视频帧对应的空间。
根据权利要求49所述的移动终端，其特征在于，所述空间变换矩阵包括旋转矩阵，所述旋转矩阵基于所述第一视频帧对应的相机位姿信息与所述第二视频帧对应的相机位姿信息计算得到。
根据权利要求49所述的移动终端，其特征在于，所述空间变换矩阵包括单应性矩阵，所述处理器还用于，对所述第一视频帧与所述第二视频帧进行特征匹配，并根据匹配结果计算所述单应性矩阵。
根据权利要求51所述的移动终端，其特征在于，所述匹配结果包括所述第一视频帧与所述第二视频帧之间的多个特征对；

所述处理器根据匹配结果计算所述单应性矩阵时用于，对所述多个特征对进行筛选，并根据筛选出的可信特征对，计算所述单应性矩阵。
根据权利要求51所述的移动终端，其特征在于，所述处理器对所述第一视频帧与所述第二视频帧进行特征匹配时用于，分别针对所述第一视频帧与所述第二视频帧的指定区域提取特征点，对提取出的特征点进行特征匹配。
根据权利要求53所述的移动终端，其特征在于，所述指定区域包括除所述运动主体以外的背景区域。
根据权利要求48所述的移动终端，其特征在于，所述处理器根据映射后的所述第一视频帧与所述第二视频帧，合成第一目标视频帧时用于，对映射后的所述第一视频帧中的运动主体进行提取，得到分身图像；根据所述分身图像与所述第二视频帧，合成所述第二视频帧对应的目标视频帧。
根据权利要求55所述的移动终端，其特征在于，所述处理器对映射后的所述第一视频帧中的运动主体进行提取时用于，通过所述运动主体对应的目标掩膜对映射后的所述第一视频帧进行处理。
根据权利要求56所述的移动终端，其特征在于，所述处理器还用于，对所述第一视频帧进行运动主体分割，得到所述运动主体对应的原始掩膜；将所述原始掩膜映射至所述第二视频帧对应的空间，得到所述目标掩膜。
根据权利要求56所述的移动终端，其特征在于，所述处理器还用于，在通过所述目标掩膜对映射后的所述第一视频帧进行处理之前，去除所述目标掩膜中与所述第二视频帧中的运动主体重叠的部分。
根据权利要求56所述的移动终端，其特征在于，所述处理器还用于，在通过所述目标掩膜对映射后的所述第一视频帧进行处理之前，对所述目标掩膜进行模糊处理。
根据权利要求48所述的移动终端，其特征在于，所述处理器还用于，从所述原始视频中获取第三视频帧，所述第三视频帧对应的时刻晚于所述第二视频帧，且所述第一视频帧、所述第二视频帧与第三视频帧之间的帧间隔相同；将所述第一目标视频帧映射至所述第三视频帧对应的空间；根据映射后的所述第一目标视频帧与所述第三视频帧，合成第二目标视频帧。
根据权利要求47所述的移动终端，其特征在于，所述原始视频是通过相机在原地进行旋转拍摄得到的。
根据权利要求61所述的移动终端，其特征在于，所述原始视频是通过所述相机在原地跟随所述运动主体进行旋转拍摄得到的。
根据权利要求47所述的移动终端，其特征在于，不同的所述动态分身具有不同的透明度。
根据权利要求63所述的移动终端，其特征在于，所述动态分身落后所述运动主体的帧数与所述动态分身的透明度正相关。
根据权利要求47所述的移动终端，其特征在于，所述分身效果指令包括以下一种或多种信息：分身个数、分身帧间隔、分身透明度。
根据权利要求47所述的移动终端，其特征在于，所述分身效果指令由用户触发。
根据权利要求47所述的移动终端，其特征在于，所述移动终端配置有相机，所述原始视频是在获取到所述分身效果指令之后通过所述相机实时拍摄得到的。
根据权利要求67所述的移动终端，其特征在于，所述处理器还用于，在拍摄所述原始视频时，判断所述相机在世界坐标系中的位移量是否小于或等于预设阈值。
根据权利要求47所述的移动终端，其特征在于，所述原始视频是用户从所拍摄视频中选取的片段。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-23任一项所述的图像处理方法。