CN117479008A - 一种视频处理方法、电子设备及芯片系统 - Google Patents

一种视频处理方法、电子设备及芯片系统 Download PDF

Info

Publication number
CN117479008A
CN117479008A CN202311810620.7A CN202311810620A CN117479008A CN 117479008 A CN117479008 A CN 117479008A CN 202311810620 A CN202311810620 A CN 202311810620A CN 117479008 A CN117479008 A CN 117479008A
Authority
CN
China
Prior art keywords
camera
center
target object
view
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311810620.7A
Other languages
English (en)
Other versions
CN117479008B (zh
Inventor
司晨
吴乐乐
邵涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honor Device Co Ltd
Original Assignee
Honor Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honor Device Co Ltd filed Critical Honor Device Co Ltd
Priority to CN202311810620.7A priority Critical patent/CN117479008B/zh
Publication of CN117479008A publication Critical patent/CN117479008A/zh
Application granted granted Critical
Publication of CN117479008B publication Critical patent/CN117479008B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • H04N23/663Remote control of cameras or camera parts, e.g. by remote control devices for controlling interchangeable camera parts based on electronic image sensor signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/69Control of means for changing angle of the field of view, e.g. optical zoom objectives or electronic zooming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/95Computational photography systems, e.g. light-field imaging systems
    • H04N23/951Computational photography systems, e.g. light-field imaging systems by using two or more images to influence resolution, frame rate or aspect ratio

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Studio Devices (AREA)

Abstract

本申请公开一种视频处理方法、电子设备及芯片系统,属于终端技术领域,方法包括:获取第一图像帧;第一图像帧为目标对象在第一位置时,通过第一摄像头采集的图像帧;对第一图像帧进行裁剪处理,得到第一送显图像;获取第二图像帧;第二图像帧为目标对象移动至第二位置时,通过第一摄像头采集的图像帧;在目标对象在第一摄像头的视场的位置满足摄像头切换条件的情况下,切换第一摄像头为第二摄像头,并且对通过第二摄像头采集的第三图像帧进行裁剪处理,得到第二送显图像。这样,当目标对象移出长焦摄像头视场时,可以自动切换具有更大视场的广角摄像头作为送显摄像头,以使显示的画面中始终保持有目标对象,扩展电子设备的追焦能力。

Description

一种视频处理方法、电子设备及芯片系统
技术领域
本申请属于终端技术领域,由于涉及一种视频处理方法、电子设备及芯片系统。
背景技术
影随人动是一种可以应用于相机、视频类应用程序中的拍摄功能。开启影随人动功能后,电子设备可以通过摄像头采集视频图像,并可以对视频图像中目标对象进行检测跟踪。在目标对象的位置发生变化时,能够基于位置变化后的目标对象进行裁剪处理,使裁剪得到的送显图像中包括目标对象。这样,电子设备显示的画面中始终保持有目标对象,以达到影随人动的效果。
但是,当目标对象移出当前摄像头视场所覆盖的范围时,无法继续跟踪目标对象,导致目标对象跟踪失败。
发明内容
本申请提供一种视频处理方法、电子设备及芯片系统,当目标对象移出长焦摄像头视场时,可以自动切换具有更大视场的广角摄像头作为送显摄像头,以使显示的画面中始终保持有目标对象,扩展电子设备的追焦能力。
第一方面,本申请提供一种视频处理方法,应用于电子设备,所述电子设备包括第一摄像头和第二摄像头,所述第一摄像头和所述第二摄像头的视场不同;所述方法包括:获取第一图像帧;所述第一图像帧为目标对象在第一位置时,通过所述第一摄像头采集的图像帧;其中,在所述目标对象在第一位置时,所述目标对象在所述第一摄像头视场内;对所述第一图像帧进行裁剪处理,得到第一送显图像;获取第二图像帧;所述第二图像帧为所述目标对象移动至第二位置时,通过所述第一摄像头采集的图像帧;所述第一位置与所述第二位置不同;在所述目标对象位于所述第二位置时,所述目标对象在所述第一摄像头的视场的位置满足摄像头切换条件的情况下,切换所述第一摄像头为所述第二摄像头,并且对第三图像帧进行裁剪处理,得到第二送显图像;其中,所述第三图像帧为所述目标对象在第二位置时,通过所述第二摄像头采集的图像帧。
当目标对象由第一位置移动到第二位置时,可以基于位于第二位置的目标对象在第一摄像头的视场的位置,决策是否切换第一摄像头为第二摄像头。
具体的,在所述第一摄像头的视场小于所述第二摄像头的视场的情况下(例如,第一摄像头为长焦摄像头,第二摄像头为广角摄像头),如果在所述目标对象位于所述第二位置时,所述目标对象超出所述第一摄像头的视场边界、且未超过所述第二摄像头的视场边界,则切换所述第一摄像头为所述第二摄像头。这样,当目标对象移出长焦摄像头视场时,可以自动切换具有更大视场的广角摄像头作为送显摄像头,以使显示的画面中始终保持有目标对象,扩展电子设备的追焦能力。
具体的,在所述第一摄像头的视场大于所述第二摄像头的视场的情况下(例如,第一摄像头为广角摄像头,第二摄像头为长焦摄像头),如果在所述目标对象位于所述第二位置时,所述目标对象完全位于所述第二摄像头的视场,则切换所述第一摄像头为所述第二摄像头。这样,当目标对象由广角摄像头视场移动至长焦摄像头视场时,可以自动切换具有更小视场的长焦摄像头作为送显摄像头。这样,既可以使显示的画面中始终保持有目标对象,又能够提升显示画面的质量。
在一种可实现方式中,所述在所述目标对象位于所述第二位置时,所述目标对象在所述第一摄像头的视场的位置满足摄像头切换条件的情况下,切换所述第一摄像头为所述第二摄像头,包括:获取所述目标对象在第二位置时的第一焦距放大倍率;基于所述第一焦距放大倍率,确定第一中心裁剪框;所述第一中心裁剪框为第一摄像头坐标系下的裁剪框,所述第一中心裁剪框的中心与所述第二图像帧的中心重合;基于所述第二图像帧,确定第一摄像头坐标系下所述目标对象相对第二图像帧的中心的第一偏移量;基于所述第一中心裁剪框和所述第一偏移量,确定第一非中心裁剪框;所述第一非中心裁剪框为第一摄像头坐标系下的裁剪框,所述第一非中心裁剪框的中心与所述第二图像帧中所述目标对象的中心重合;在所述第一非中心裁剪框超出所述第一摄像头的视场边界、且未超过所述第二摄像头的视场边界的情况下,切换所述第一摄像头为所述第二摄像头。
这样,基于目标对象所在的第二位置以及第一焦距放大倍率,可以得到第一摄像头坐标系下的第一非中心裁剪框。进而基于第一非中心裁剪框与第一摄像头的视场边界之间的位置关系,确定是否满足摄像头切换条件。这样,可以保证电子设备每次显示的画面中目标对象均位于画面中心。
在一种可实现方式中,所述在所述目标对象位于所述第二位置时,所述目标对象在所述第一摄像头的视场的位置满足摄像头切换条件的情况下,切换所述第一摄像头为所述第二摄像头,包括:获取所述目标对象在第二位置时的第一焦距放大倍率;基于所述第一焦距放大倍率,确定第一中心裁剪框;所述第一中心裁剪框为第一摄像头坐标系下的裁剪框,所述第一中心裁剪框的中心与所述第二图像帧的中心重合;基于所述第二图像帧,确定第一摄像头坐标系下所述目标对象相对第二图像帧中心的第一偏移量;基于所述第一中心裁剪框和所述第一偏移量,确定第一非中心裁剪框;所述第一非中心裁剪框为第一摄像头坐标系下的裁剪框,所述第一非中心裁剪框的中心与所述第二图像帧中所述目标对象的中心重合;在所述第一非中心裁剪框完全位于所述第二摄像头的视场的情况下,切换所述第一摄像头为所述第二摄像头。
这样,当第一非中心裁剪框完全移入所述第二摄像头的视场时,可以切换具有更小视场的第二摄像头,以提升显示画面的质量。并且基于第一非中心裁剪框与第二摄像头的视场之间的位置关系,确定是否满足摄像头切换条件,可以保证电子设备每次显示的画面中目标对象均位于画面中心。
在一种可实现方式中,所述对第三图像帧进行裁剪处理,得到第二送显图像,包括:基于所述第一焦距放大倍率,确定第二中心裁剪框;所述第二中心裁剪框为第二摄像头坐标系下的裁剪框,所述第二中心裁剪框的中心与所述第三图像帧的中心重合;基于所述第一偏移量、视场偏移量以及第一坐标转换因子,确定所述第二摄像头坐标系下所述目标对象相对第三图像帧的中心的第二偏移量;所述视场偏移量为所述第一摄像头的视场中心相对于所述第二摄像头的视场中心的偏移量;所述第一坐标转换因子为所述第一摄像头坐标系与所述第二摄像头坐标系之间的坐标转换因子;基于所述第二中心裁剪框和所述第二偏移量,确定第二非中心裁剪框;所述第二非中心裁剪框为第二摄像头坐标系下的裁剪框,所述第二非中心裁剪框的中心与所述第三图像帧中所述目标对象的中心重合;利用所述第二非中心裁剪框对所述第三图像帧进行裁剪处理,得到第二送显图像。
这样,由于在计算第二非中心裁剪框时,考虑了第一摄像头和第二摄像头视场中心的偏移量。因此,在基于与第二摄像头相适配的第二非中心裁剪框以及第二摄像头采集的第三图像帧进行裁剪处理后,得到的第二送显图像中目标对象依然位于第二送显图像的中心。这样,可以实现以目标对象为中心的摄像头切换,从而保证目标对象在显示的画面中的位移最小,以控制画面抖动量最小,使用户不会感知到摄像头切换操作,提高用户体验。
在一种可实现方式中,所述对所述第一图像帧进行裁剪处理,得到第一送显图像,包括:获取所述目标对象在第一位置时的第二焦距放大倍率;基于所述第二焦距放大倍率,确定第三中心裁剪框;所述第三中心裁剪框为第一摄像头坐标系下的裁剪框,所述第三中心裁剪框的中心与所述第一图像帧的中心重合;基于所述第一图像帧,确定第一摄像头坐标系下所述目标对象相对第一图像帧中心的第三偏移量;基于所述第三中心裁剪框和所述第三偏移量,确定第三非中心裁剪框;所述第三非中心裁剪框的中心与所述第一图像帧中所述目标对象的中心重合;利用所述第三非中心裁剪框对所述第一图像帧进行裁剪处理,得到第一送显图像。
这样,由于计算第三非中心裁剪框时,既考虑到了目标对象当前所处的位置,又考虑到当前焦距放大倍率。因此,该方案既可以应用于影随人动等追焦场景,又可以应用于指向性变焦场景。
在一种可实现方式中,所述方法还包括:在所述目标对象位于所述第一位置时,所述目标对象在所述第一摄像头的视场的位置满足第二摄像头启用条件的情况下,开启所述第二摄像头;通过所述第一摄像头采集所述第二图像帧以及通过所述第二摄像头采集所述第三图像帧。
这样,在满足第二摄像头启用条件的情况下,提前开启第二摄像头,以为摄像头切换时提供相适配的图像。
在一种可实现方式中,在所述第一摄像头的视场小于所述第二摄像头的视场的情况下,所述第二摄像头启用条件包括:在所述目标对象位于所述第一位置时,所述目标对象未超出所述第一摄像头的视场边界、且所述目标对象与所述第一摄像头的视场边界之间间距小于第一阈值。
这样,在目标对象要移出第一摄像头的视场边界的情况下,可以提前开启第二摄像头。这样,在目标对象移出第一摄像头的视场边界时,依然可以通过第二摄像头采集到目标对象。
在一种可实现方式中,在所述第一摄像头的视场大于所述第二摄像头的视场的情况下,所述第二摄像头启用条件包括: 在所述目标对象位于所述第一位置时,所述目标对象与第一摄像头的视场的交集大于第二阈值。
这样,在目标对象要完全移入第二摄像头的视场边界的情况下,可以提前开启第二摄像头。这样,在目标对象完全移入第二摄像头的视场边界时,可以通过第二摄像头采集到画质更好的、包括目标对象的。
在一种可实现方式中,所述基于所述第二图像帧,确定第一摄像头坐标系下所述目标对象相对第二图像帧的中心的第一偏移量,包括:基于所述第二图像帧,确定预览坐标系下所述目标对象相对预览中心的第四偏移量;基于所述第四偏移量与第二坐标转换因子,将所述第四偏移量转换为所述第一偏移量;所述第二坐标转换因子为所述第一摄像头坐标系与所述预览坐标系之间的坐标转换因子。
这样,通过将预览坐标系的偏移量转换为第一摄像头坐标系的偏移量,可以便于后续统一基于第一摄像头坐标系下的偏移量计算各摄像头对应的中心裁剪框和非中心裁剪框。
在一种可实现方式中,所述第一摄像头为长焦摄像头,所述第二摄像头为广角摄像头;或者,所述第一摄像头为广角摄像头,所述第二摄像头为长焦摄像头。
第二方面,本申请还提供一种电子设备,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,当所述处理器执行所述计算机指令时,使所述电子设备执行如第一方面中任一项所述的方法。
第三方面,本申请还提供一种芯片系统,所述芯片系统包括处理器;所述处理器与存储器耦合,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,当所述处理器执行所述计算机指令时,如第一方面中任一项所述的方法被执行。
第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序或指令,当所述计算机程序或指令在计算机上运行时,使得计算机执行如第一方面中任一项所述的方法。
附图说明
图1为本申请实施例提供的一种视频处理方法的工作流程示意图;
图2为本申请实施例提供的一种影随人动的应用场景示意图;
图3为本申请实施例提供的又一种影随人动的应用场景示意图;
图4为本申请实施例提供的一种电子设备的硬件结构示意图;
图5为本申请实施例提供的一种电子设备的软件结构框图;
图6A为本申请实施例提供的一种视频处理方法的工作流程示意图;
图6B为本申请实施例提供的又一种视频处理方法的工作流程示意图;
图7为本申请实施例提供的一种焦距放大倍率设置界面示意图;
图8为本申请实施例提供的一种计算非中心裁剪框的工作流程示意图;
图9为本申请实施例提供的一种目标对象在第一位置时,相对于长焦摄像头视场中心的偏移量S1的示意图;
图10为本申请实施例提供的一种长焦摄像头与广角摄像头的视场中心偏移的示意图;
图11为本申请实施例提供的一种非中心裁剪框R3-1与长焦摄像头视场的边界的位置关系的示意图;
图12为本申请实施例提供的一种第一送显图像的处理流程示意图;
图13为本申请实施例提供的一种第二送显图像的处理流程示意图;
图14A为本申请实施例提供的一种基于非中心裁剪框R4-2对第三图像帧进行裁剪处理的流程示意图;
图14B为本申请实施例提供的基于非中心裁剪框R4-2'对第三图像帧进行裁剪处理的流程示意图;
图15为本申请实施例提供的一种非中心裁剪框R5-1在不同位置的示意图;
图16为本申请实施例提供的一种指向性变焦场景下视频处理方法的工作流程示意图;
图17为本申请实施例提供的一种指向性变焦场景下非中心裁剪框的变化示意图;
图18为本申请实施例提供的又一种指向性变焦场景下非中心裁剪框的变化示意图;
图19为本申请实施例提供的一种视频处理方法的工作流程示意图;
图20为本申请实施例提供的一种芯片的结构框图。
具体实施方式
为便于对本申请的技术方案的理解,以下首先对本申请所涉及到的一些概念进行说明。
1.摄像头视场角(angle of view,FOV):是指摄像头能够观察到的最大范围,通常以角度来表示这个最大范围,而该角度可以称为摄像头FOV。被摄对象透过摄像头在焦平面上形成可见影像所包括的面积,可以称为摄像头视场或者镜头视场。
摄像头视场的大小与焦距有关,焦距越小,摄像头视场越大。以长焦摄像头和广角摄像头为例,长焦摄像头的焦距大于广角摄像头的焦距。例如,长焦摄像头的焦距可以在70mm至300mm之间,广角摄像头的焦距可以小于20mm。对应的,长焦摄像头视场小于广角摄像头视场。
2.送显摄像头:是指用于将拍摄的图像显示在电子设备屏幕上的摄像头。例如,送显摄像头为长焦摄像头或者广角摄像头。
3.送显视场:受电子设备的屏幕尺寸的限制,屏幕通常无法显示摄像头视场内采集到的所有内容。在一种可实现方式中,可以通过裁剪框在摄像头视场内裁剪出想要显示的内容,其中,裁剪框所框选的区域可以称为送显视场,送显视场对应的图像可以称为送显图像。后续,可以基于屏幕的分辨率,对送显图像进行上采样或下采样处理,得到预览图像。最后,可以将预览图像输出到屏幕进行显示。
4.预览坐标系:是指预览图像所在的坐标系。预览坐标系可以表示被摄物体在预览尺度下的尺寸、位置等。预览坐标系也可以称为出图像素坐标系。
5.摄像头坐标系:是指摄像头采集的原始图像所在的坐标系。摄像头坐标系可以表示被摄物体在摄像头尺度下的尺寸、位置等。
摄像头坐标系又可以分为长焦摄像头坐标系和广角摄像头坐标系。其中,长焦摄像头坐标系可以表示被摄物体在长焦摄像头尺度下的尺寸、位置等。长焦摄像头坐标系也可以理解为,用于表示被摄物体在长焦摄像头视场下的尺寸、位置等。广角摄像头坐标系可以表示被摄物体在广角摄像头尺度下的尺寸、位置等。广角摄像头坐标系也可以理解为,用于表示被摄物体在广角摄像头视场下的尺寸、位置等。
示例性的,如图1所示,电子设备包括长焦摄像头和广角摄像头。长焦摄像头对应的视场为长焦摄像头视场10,广角摄像头对应的视场为广角摄像头视场11。其中,长焦摄像头视场10小于广角摄像头视场11。长焦摄像头视场10对应的坐标系为长焦摄像头坐标系XOY,广角摄像头视场11对应的坐标系为广角摄像头坐标系X'O'Y'。其中,摄像头采集的原始图像的尺寸与对应的摄像头视场相同。
摄像头采集到原始图像后,可以通过裁剪框12在原始图像上裁剪得到包括目标对象(例如,人脸13)的图像。其中,裁剪框12所框选的区域为送显视场。
基于裁剪框12对原始图像进行裁剪处理后,可以得到送显图像14。对送显图像14进行下采样(或者,上采样)处理,可以得到预览图像15。最后,可以将预览图像15输出至电子设备的屏幕进行显示。其中,预览图像15对应的坐标系为预览坐标系UOV。
可见,图1中视场由小到大的排序为:送显视场(图1中裁剪框12所框选的区域)、长焦摄像头视场10、广角摄像头视场11。
影随人动是一种可以应用于相机、视频类应用程序中的拍摄功能。开启影随人动功能后,电子设备可以通过摄像头采集视频图像,并可以对视频图像中目标对象进行检测跟踪。在目标对象的位置发生变化时,能够基于位置变化后的目标对象进行裁剪处理,使裁剪得到的送显图像中包括目标对象。这样,电子设备显示的画面中始终保持有目标对象,以达到影随人动的效果。
示例性的,如图2所示,以长焦摄像头作为送显摄像头,目标对象为人物16的人脸为例,对影随人动进行示例性说明。
当人物16位于位置A时,人脸位于长焦摄像头视场10内。这样,可以通过裁剪框12从长焦摄像头视场10裁剪得到包括人脸的送显图像。当人物16由位置A移动至位置B时,人脸依然位于长焦摄像头视场10内。这样,依然可以通过裁剪框12从长焦摄像头视场10裁剪得到包括人脸的送显图像。
但是,如果人物16移出长焦摄像头视场所覆盖的范围。例如,人物16移动至位置C时,由于长焦摄像头视场无法覆盖位于位置C的人物16,因此,裁剪框12无法从长焦摄像头视场裁剪得到包括人脸的送显图像,导致对象跟踪失败。
可见,目前当目标对象移出长焦摄像头视场所覆盖的范围时,无法继续追踪目标对象,进而导致对象跟踪失败。
本申请实施例提供一种视频处理方法,当目标对象移出长焦摄像头视场时,可以自动切换具有更大视场的广角摄像头作为送显摄像头,以使显示的画面中始终保持有目标对象,扩展电子设备的追焦能力。对应的,当目标对象由广角摄像头视场移动至长焦摄像头视场时,可以自动切换具有更小视场的长焦摄像头作为送显摄像头。这样,既可以使显示的画面中始终保持有目标对象,又能够提升显示画面的质量。
示例性的,如图3中(a)所示,以目标对象为人物16的人脸为例,在人物16位于位置A时,送显摄像头为长焦摄像头,通过长焦摄像头采集图像。此时的裁剪框12位于长焦摄像头视场10内。对应的,通过裁剪框12在长焦摄像头视场10内裁剪送显内容(即人脸)。如图3中(b)所示,人物16由位置A移动至位置C时,切换送显摄像头为广角摄像头,并通过广角摄像头采集图像,此时的裁剪框12位于广角摄像头视场11内。对应的,通过裁剪框12在广角摄像头视场11内裁剪送显内容。如图3中(c)所示,人物16由位置C移动至位置B时,切换送显摄像头为长焦摄像头,并通过长焦摄像头采集图像,此时的裁剪框12位于长焦摄像头视场10内。对应的,通过裁剪框12在长焦摄像头视场10内裁剪送显内容。由此可见,在人物16移出长焦摄像头视场10的情况下,可以切换送显摄像头为广角摄像头继续追踪人物16,从而扩展电子设备的追焦能力。在人物16重新移回长焦摄像头视场10的情况下,可以再切换送显摄像头为长焦摄像头继续追踪人物16,以提升画面质量。
本申请实施例提供的视频处理方法可以应用于包括至少两个摄像头的电子设备。其中,至少两个摄像头的焦距不同,也就是说,至少两个摄像头的视场不同。应理解,本申请实施例仅以电子设备包括长焦摄像头和广角摄像头为例进行示例性说明,并不表示对摄像头的数量的限定,电子设备还可以包括更多的摄像头。例如,电子设备还可以包括超广角摄像头等,其中,超广角摄像头的视场大于广角摄像头的视场。
电子设备可以是手机、智慧屏、平板电脑、可穿戴电子设备、车载电子设备、增强现实(augmented reality,AR)设备、虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)、投影仪等等,本申请实施例对电子设备的具体类型不作任何限制。
图4为本申请实施例提供的一种电子设备的硬件结构示意图。如图4所示,以电子设备100为手机为例,电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本发明实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口130等。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为电子设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在电子设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC ,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system ,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
电子设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。
电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP 用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
本申请实施例中,ISP可以包括图像前端处理模块(image processing front-end,IFE)和图像后端处理模块(image processing back-end,IPE)。其中,IFE可以对摄像头采集的图像进行裁剪处理得到送显图像。进一步的,IPE可以对裁剪得到的送显图像进行去噪和锐化等图像处理,以优化显示画面的质量。最后,经过IPE处理后的图像可以发送至屏幕进行显示。
在一些实施例中,IPE还可以对送显图像进行上采样或者下采样处理,得到预览图像。其中,预览图像的分辨率与电子设备的屏幕的分辨率相适配。进一步的,IPE可以对预览图像进行去噪和锐化等图像处理,以优化显示画面的质量。最后,经过IPE处理后的预览图像可以发送至屏幕进行显示。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。
本申请实施例中,电子设备100可以包括多个摄像头193。示例性的,电子设备100可以包括第一摄像头和第二摄像头,其中,第一摄像头和第二摄像头的焦距不同。例如,第一摄像头为长焦摄像头,第二摄像头为广角摄像头。
其中,第一摄像头和第二摄像头可以同时工作或单独工作。例如,可以控制第一摄像头和第二摄像头同时工作,分别采集同一场景下的图像。这样,可以得到同一场景在不同摄像头视场下的图像。再例如,也可以控制第一摄像头和第二摄像头中任一摄像头单独工作,采集图像。这样,可以得到一个摄像头视场下的图像。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。电子设备100可以支持一种或多种视频编解码器。这样,电子设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network ,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。处理器110通过运行存储在内部存储器121的指令,和/或存储在设置于处理器中的存储器的指令,执行电子设备100的各种功能应用以及数据处理。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和电子设备100的接触和分离。电子设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。电子设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在电子设备100中,不能和电子设备100分离。
电子设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本发明实施例以分层架构的Android系统为例,示例性说明电子设备100的软件结构。
图5是本申请实施例的电子设备100的软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统可以分为五层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,硬件抽象层(hardwareabstraction layer,HAL)以及内核层。
应用程序层可以包括一系列应用程序包。
如图5所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
本申请实施例的视频处理方法可以应用于相机应用程序或者视频应用程序。例如,可以在电子设备中的设置开启影随人动功能,电子设备检测到视频应用程序请求打开相机的指令后,可以开启影随人动功能。或者,可以在相机应用程序中设置开启影随人动功能,电子设备检测到相机应用程序请求打开相机的指令后,可以开启影随人动功能。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
如图5所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如: MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
HAL是设备内核驱动的抽象接口,实现向更高级别的java API框架提供访问底层设备的应用程序接口。硬件抽象层可以包括多个库模块,例如,显示模块、音频模块、蓝牙模块、Wi-Fi模块等。每个模块可以为特定类型的硬件组件实现一个接口。当框架API要求访问设备硬件时,Android系统将为该硬件组件加载库模块。
本申请实施例中,HAL还可以包括SAT算法模块。其中,SAT算法模块可以包括裁剪计算子模块和摄像头切换决策子模块。
本申请实施例中,裁剪计算子模块可以用于计算各摄像头坐标系下裁剪框的尺寸和位置。并且可以基于当前摄像头坐标系下裁剪框的尺寸和位置,检测裁剪框是否超出当前摄像头视场边界。
如果检测到裁剪框超出当前摄像头视场边界,则裁剪计算子模块可以通知摄像头切换决策子模块决策摄像头切换策略。例如,切换策略可以包括将送显摄像头由长焦摄像头切换为广角摄像头,或者,将送显摄像头由广角摄像头切换为长焦摄像头。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。其中,硬件可以包括图4所示的硬件结构。
示例性的,软件架构中的SAT算法模块可以与硬件中ISP交互,以实现本申请实施例提供的视频处理方法。
具体的,本申请实施例提供的视频处理方法可以应用于视频通话、视频会议应用、长短视频应用、视频直播类应用、视频网课应用、人像智能运镜应用场景、系统相机录像功能录制视频、视频监控以及智能猫眼等人像拍摄类场景等。
下面以相机录制视频场景为例,结合电子设备的软件和硬件对本申请实施例提供的视频处理方法进行详细说明。
如图6A和图6B所示,本申请实施例提供的一种视频处理方法可以包括以下步骤:
S201,接收用户输入的相机应用程序(application,APP)启动操作。
在一些实施例中,用户可以通过触控相机APP控件唤醒相机APP,或者通过语音唤醒相机APP。
以通过触控相机APP控件唤醒相机APP为例,当用户在触摸传感器180K上进行触摸操作时,相应的硬件中断被发送至内核层。内核层将触摸操作加工成原始输入事件,原始输入事件例如包括触摸坐标和触摸操作的时间戳等信息。原始输入事件被存储在内核层,应用程序框架层从内核层获取原始输入事件,识别出原始输入事件对应的控件,并通知该控件对应的应用程序。例如,上述触摸操作为单击操作,上述控件对应的应用程序为相机APP,相机APP被单击操作唤醒后,可以通过API调用内核层的摄像头驱动,通过摄像头驱动控制摄像头193进行拍摄。
S202,接收用户输入的焦距放大倍率(zoomRatio)。
启动相机APP后,用户可以在相机APP的录像界面设置焦距放大倍率。
示例性的,如图7所示,相机APP启动后,在录像界面20可以包括多个焦距放大倍率选项21以及焦距放大倍率调整条22。例如,焦距放大倍率选项可以包括0.6x、1x、2x、5x、10x等。这样,用户可以通过点击焦距放大倍率选项21中任意一个选项设置焦距放大倍率。或者,用户也可以通过触控焦距放大倍率调整条22,设置对应的焦距放大倍率。其中,通过焦距放大倍率调整条21可以设置0x至10x中任一焦距放大倍率。
电子设备可以基于用户设置的焦距放大倍率,启用对应的摄像头。例如,用户设置的焦距放大倍率大于0、且小于2倍时,可以启用广角摄像头,以实现更大的取景范围。用户设置的焦距放大倍率大于或者等于2倍时,可以启用长焦广角摄像头,以实现更小的取景范围。
示例性的,用户点击10x选项后,电子设备后台算法可以基于当前设置的焦距放大倍率10x,启用焦距更大的长焦摄像头采集图像。用户点击0.6x选项后,电子设备后台算法可以基于当前设置的焦距放大倍率0.6x,启用焦距更小的广角摄像头采集图像。
S203,裁剪计算子模块基于当前焦距放大倍率,计算各摄像头坐标系下的中心裁剪框。
首先需要说明的是,本申请实施例中的裁剪框可以分为中心裁剪框和非中心裁剪框。其中,中心裁剪框的中心与摄像头视场中心(或者摄像头拍摄的图像的中心)重合,非中心裁剪框的中心与摄像头视场中心不重合。也就是说,中心裁剪框偏移后可以得到非中心裁剪框。
其次需要说明的是,不同摄像头坐标系对应的中心裁剪框不同。具体的,不同摄像头坐标系对应的中心裁剪框的尺寸和位置均不同。
示例性的,长焦摄像头和广角摄像头的视场不同,对应拍摄的图像尺寸不同。这样,同一被摄物在长焦摄像头坐标系和广角摄像头坐标系下的尺寸、位置不同。同样的,中心裁剪框在长焦摄像头坐标系和广角摄像头坐标系下的尺寸和位置也不同。
如图8中(a)所示,长焦摄像头坐标系XOY下的中心裁剪框R1可以表示为(w1,h1,a1)。如图8中(b)所示,广角摄像头坐标系X'O'Y'下的中心裁剪框R2可以表示为(w2,h2,a2)。其中,w1为中心裁剪框R1在X轴方向的长度,h1为中心裁剪框R1在Y轴方向的长度,a1可以为中心裁剪框R1上任一点在长焦摄像头坐标系中的坐标。例如,a1可以是长焦摄像头坐标系下的中心裁剪框R1的中心坐标、顶点坐标等。w2为中心裁剪框R2在X'轴方向的长度,h2为中心裁剪框R2在Y'轴方向的长度,a2可以为中心裁剪框R2上任一点在广角摄像头坐标系中的坐标。例如,a2可以是广角摄像头坐标系下的中心裁剪框R2的中心坐标、顶点坐标等。其中,w1与w2不同,h1与h2不同,a1与a2不同。通常的,w1<w2,h1<h2。
在一些实施例中,可以采用如下公式(1)、(2)和(3),计算各摄像头坐标系下的中心裁剪框:
(1)
(2)
(3)
其中,公式(1)中,表示当前摄像头的视场(当前摄像头即为送显摄像头),zoomRatio表示当前焦距放大倍率,/>表示当前zoomRatio下的送显视场。
公式(2)中,表示当前摄像头的最大分辨率,/>表示当前摄像头坐标系对应的中心裁剪框。
公式(3)中,表示其他摄像头的最大分辨率,/>表示其他摄像头的视场,/>表示其他摄像头坐标系对应的中心裁剪框。
其中,、/>、/>、/>均为摄像头参数,相当于已知参数。
示例性的,结合图8所示,以当前摄像头为长焦摄像头,其他摄像头为广角摄像头为例。可以利用上述公式(1)和公式(2),基于当前zoomRatio、长焦摄像头的,计算得到长焦摄像头坐标系XOY对应的中心裁剪框R1(w1,h1,a1)。以及,可以利用上述公式(1)和公式(3),基于当前zoomRatio、广角摄像头的/>和/>,计算得到广角摄像头坐标系X'O'Y'对应的中心裁剪框R2(w2,h2,a2)。
S204,接收用户输入的影随人动功能启动操作。
在一种可实现方式中,可以在电子设备的设置界面中设置开启影随人动的功能。在利用相机录制视频时,可以自动开启影随人动的功能执行本申请实施例的视频处理方法。
在一种可实现方式中,可以在电子设备的相机中设置开启影随人动功能,根据设置可以在录制视频时开启影随人动的功能,执行本申请实施例的视频处理方法。
下面以当前焦距放大倍率不变,送显摄像头由长焦摄像头切换为广角摄像头为例,对本申请实施例提供的视频处理方法进行说明。也就是说,以下示例中当前摄像头为长焦摄像头,其他摄像头为广角摄像头。
S205,获取第一图像帧。
第一图像帧为通过长焦摄像头采集的、且目标对象在第一位置时的图像。其中,目标对象在第一位置时,目标对象在长焦摄像头视场内。
示例性的,如图9中(a)所示,第一图像帧为通过长焦摄像头采集的、且目标对象在位置A时的图像。目标对象在位置A时,目标对象在长焦摄像头视场10内。
第一图像帧的分辨率大小为全尺寸,即第一图像帧包括长焦摄像头视场10内全部内容。例如,长焦摄像头的最大分辨率为4096×2160,则获取的第一图像帧的分辨率可以为4096×2160。
S206,基于第一图像帧,确定目标对象在第一位置时,目标对象相对于长焦摄像头视场中心的偏移量S1以及目标对象相对于广角摄像头视场中心的偏移量S2。
在一些实施例中,可以利用人脸检测算法对第一图像帧进行人脸检测,确定目标对象(以目标对象为人脸为例)在预览坐标系下的坐标信息。
目前,一些人脸检测算法中,为了减少运算量,通常对全尺寸的第一图像帧进行下采样处理,得到预览尺度下的图像帧。然后,对预览尺度下的图像帧进行人脸检测,得到人脸在预览坐标系下的坐标信息。因此,在一些实施例中,人脸检测算法得到的目标对象的坐标信息为预览坐标系下的坐标。其中,人脸检测算法可以参见相关技术的描述,此处不再赘述。
人脸检测算法得到目标对象在预览坐标系UOV下的坐标信息后,可以输出给裁剪计算子模块。然后,裁剪计算子模块可以先确定目标对象在预览坐标系UOV下相对预览中心的偏移量S0。再将目标对象在预览坐标系UOV下的偏移量S0转换为长焦摄像头坐标系XOY下的偏移量S1,即得到目标对象相对于长焦摄像头视场中心的偏移量S1。
其中,偏移量S0为目标对象在预览坐标系UOV下的坐标与预览坐标系UOV下预览中心坐标的差值。
在一种可实现方式中,将预览坐标系UOV下的偏移量S0转换为长焦摄像头坐标系XOY下偏移量S1,可以采用下述方式实现:先确定预览坐标系UOV与长焦摄像头坐标系XOY的转换因子。然后,基于转换因子/>和预览坐标系UOV下的偏移量S0,确定长焦摄像头坐标系XOY下偏移量S1。
示例性的,可以采用下述公式(4)和公式(5),将预览坐标系UOV下的偏移量S0转换为长焦摄像头坐标系XOY下偏移量S1:
(4)
(5)
其中,公式(4)中,表示预览坐标系UOV与当前摄像头坐标系的转换因子(也可以成为第二坐标转换因子),/>表示当前摄像头在当前zoomRatio下的中心裁剪框,/>表示预览坐标系UOV下的中心裁剪框。例如,如果当前摄像头为长焦摄像头,则/>表示长焦摄像头坐标系对应的中心裁剪框。如果当前摄像头为广角摄像头,则表示长焦摄像头坐标系对应的中心裁剪框。
公式(5)中,表示预览坐标系UOV下的偏移量,/>表示当前摄像头坐标系下的偏移量。
这样,如果当前使用的摄像头为长焦摄像头,则可以基于长焦摄像头坐标系下的中心裁剪框和公式(4),计算得到预览坐标系UOV与长焦摄像头坐标系XOY的转换因子/>。然后,可以基于计算得到的转换因子/>、偏移量S0和公式(5),计算得到目标对象在长焦摄像头坐标系下的偏移量S1。
示例性的,如图9中(b)所示,基于上述公式(4)和公式(5),可以计算得到长焦摄像头坐标系XOY下目标对象的中心M1相对长焦摄像头视场10的中心MO的偏移量为S1。
在一种可实现方式中,确定人脸相对于广角摄像头视场中心的偏移量S2,可以采用下述方式实现:先确定人脸在长焦摄像头坐标系XOY下的偏移量S1。然后,基于长焦摄像头坐标系XOY和广角摄像头坐标系X'O'Y'的转换因子,将长焦摄像头坐标系XOY下人脸的偏移量S1转换为广角摄像头坐标系X'O'Y'下人脸的偏移量S2。
示例性的,可以采用下述公式(6)和公式(7),将长焦摄像头坐标系XOY下人脸的偏移量S1转换为广角摄像头坐标系X'O'Y'下人脸的偏移量S2:
(6)
(7)
其中,公式(6)中,表示长焦摄像头坐标系XOY和广角摄像头坐标系X'O'Y'的转换因子(也可以称为第二坐标转换因子),对/>、/>、/>、/>的描述可以参见对公式(1)、公式(2)和公式(3)的描述,此处不再赘述。
公式(7)中,表示广角摄像头坐标系X'O'Y'下的偏移量,/>可以利用公式(4)和公式(5)计算得到,此处不再赘述。
表示长焦摄像头和广角摄像头视场的中心的偏移量。由于长焦摄像头和广角摄像头的硬件设计原因,长焦摄像头的视场中心与广角摄像头的视场中心不相同。这样,长焦摄像头拍摄的图像的中心与广角摄像头拍摄的图像的中心之间具有一定的偏移,该偏移量即为/>
示例性的,如图10所示,长焦摄像头视场10的视场中心为K1,广角摄像头视场11的视场中心为K2。K1与K2不重叠,K1与K2之间的偏移量为
其中,K1与K2之间的偏移量可以通过标定数据计算得到。具体可以参考相关技术,此处不再赘述。
这样,如果当前使用的摄像头为长焦摄像头,则可以先利用上述公式(4)和公式(5)计算得到目标对象在长焦摄像头坐标系下的偏移量S1。然后,再利用上述公式(6)和公式(7)计算得到目标对象在广角摄像头坐标系下的偏移量S2。
S207,裁剪计算子模块基于偏移量S1和偏移量S2,确定目标对象在第一位置时各摄像头坐标系对应的非中心裁剪框。
在一种可实现方式中,确定长焦摄像头坐标系下对应的非中心裁剪框R3-1,可以采用下述方式实现:可以基于步骤S203计算得到的长焦摄像头坐标系下的中心裁剪框R1(w1,h1,a1)和偏移量S1,确定长焦摄像头坐标系下对应的非中心裁剪框R3-1。
示例性的,可以利用公式(8)计算长焦摄像头坐标系下对应的非中心裁剪框R3-1:
(8)
其中,公式(8)中,表示当前摄像头坐标系下的非中心裁剪框R3-1,表示当前摄像头坐标系下的中心裁剪框R1,/>表示当前摄像头坐标系下的偏移量S1。
示例性的,如图8中(a)和(c)所示,长焦摄像头坐标系下的中心裁剪框R1为(w1,h1,a1),目标对象在长焦摄像头坐标系下的偏移量为S1,则利用上述公式(8),可以得到长焦摄像头坐标系下的非中心裁剪框为R3-1(w1,h1,a1+S1)。
也就是说,长焦摄像头坐标下的中心裁剪框R1由位置a1偏移S1后,得到非中心裁剪框R3-1(w1,h1,a1+S1)。其中,偏移后的非中心裁剪框R3-1与中心裁剪框R1的位置不同,但是尺寸相同。
在一种可实现方式中,确定广角摄像头坐标系下对应的非中心裁剪框R4-1,可以采用下述方式实现:可以基于步骤S203计算得到的广角摄像头坐标系下的中心裁剪框R2(w2,h2,a2)以及步骤S207计算得到的偏移量S2,确定广角摄像头坐标系下对应的非中心裁剪框R4-1。
示例性的,可采用公式(9),计算广角摄像头坐标系X'O'Y'下的非中心裁剪框R4-1:
(9)
公式(9)中,表示广角摄像头坐标系X'O'Y'下的非中心裁剪框R4-1,表示广角摄像头坐标系X'O'Y'下的中心裁剪框,/>可以通过公式(6)和公式(7)计算得到。
示例性的,如图8中(b)和(d)所示,广角摄像头坐标系下的中心裁剪框R2为(w2,h2,a2),目标对象在广角摄像头坐标系下的偏移量为S2,则广角摄像头坐标系下的非中心裁剪框R4-1为(w2,h2,a2+S2)。
也就是说,广角摄像头坐标下的中心裁剪框R2由位置a2偏移S2后,得到非中心裁剪框R4-1(w2,h2,a2+S2)。其中,偏移后的非中心裁剪框R4-1与中心裁剪框R2的位置不同,但是尺寸相同。
裁剪计算子模块确定目标对象在第一位置时各摄像头坐标系对应的非中心裁剪框后,可以分别执行下述步骤S208和步骤S209。
S208,裁剪计算子模块将目标对象在第一位置时各摄像头坐标系对应的非中心裁剪框信息发送给IFE。
S209,裁剪计算子模块确定目标对象在第一位置时长焦摄像头坐标系下的非中心裁剪框R3-1在长焦摄像头视场内的位置。
目标对象在第一位置时,长焦摄像头坐标系下的非中心裁剪框R3-1在长焦摄像头视场内的位置,可以包括如下三种情况:
第一种情况,如图3中(c)所示,非中心裁剪框R3-1完全在长焦摄像头视场10内,并且非中心裁剪框R3-1靠近长焦摄像头视场10的边界。
第二种情况,如图3中(a)所示,非中心裁剪框R3-1完全在长焦摄像头视场10内,并且非中心裁剪框R3-1未靠近长焦摄像头视场10的边界。
第三种情况,如图3中(b)所示,非中心裁剪框R3-1的一部分超出长焦摄像头视场10边界。也就是说,非中心裁剪框R3-1的一部分在长焦摄像头视场10内,另一部分不在长焦摄像头视场10内。
本申请实施例对确定非中心裁剪框R3-1是否完全在长焦摄像头视场10内的具体方式不进行限定。例如,如果非中心裁剪框R3-1与长焦摄像头视场10的交集小于非中心裁剪框R3-1,则确定非中心裁剪框R3-1部分或全部不在长焦摄像头视场10内。否则,确定非中心裁剪框R3-1完全在长焦摄像头视场10内。
再例如,如果非中心裁剪框R3-1上所有坐标都在长焦摄像头视场10内,则可以确定非中心裁剪框R3-1完全在长焦摄像头视场10内。否则,可以确定非中心裁剪框R3-1部分或全部不在长焦摄像头视场10内。
本申请实施例对确定非中心裁剪框R3-1是否靠近长焦摄像头视场10的边界的具体方式不进行限定。
在一种可实现方式中,确定非中心裁剪框R3-1是否靠近长焦摄像头视场10的边界,可以采用下述方式实现:确定非中心裁剪框R3-1上特定点与长焦摄像头视场10的四个边界线之间的距离。如果各距离均大于或者等于对应的距离阈值,则可以确定非中心裁剪框R3-1未靠近长焦摄像头视场10的边界。如果各距离中存在小于距离阈值的距离,则可以确定非中心裁剪框R3-1靠近长焦摄像头视场10的边界。
示例性的,以非中心裁剪框R3-1上特定点为左上角顶点D1为例。如图11所示,顶点D1与长焦摄像头视场10的左边界线之间的距离为m1,顶点D1与长焦摄像头视场10的上边界线之间的距离为m2,顶点D1与长焦摄像头视场10的下边界线之间的距离为m3,顶点D1与长焦摄像头视场10的右边界线之间的距离为m4。其中,顶点D1与长焦摄像头视场10的左边界线之间的距离阈值可以为m1',顶点D1与长焦摄像头视场10的上边界线之间的距离阈值可以为m2',顶点D1与长焦摄像头视场10的下边界线之间的距离阈值可以为m3',顶点D1与长焦摄像头视场10的右边界线之间的距离阈值可以为m4'。这样,如果同时满足m1≥m1'、m2≥m2'、m3≥m3'、m4≥m4',则可以确定非中心裁剪框R3-1未靠近长焦摄像头视场10的边界。否则,确定非中心裁剪框R3-1靠近长焦摄像头视场10的边界。
例如,m1'和m2'可以为10个像素点的距离,m3'可以为10个像素点的距离与h2加和后的距离,m4'可以为10个像素点的距离与w2加和后的距离。
在一种可实现方式中,确定非中心裁剪框R3-1是否靠近长焦摄像头视场10的边界,还可以采用下述方式实现:分别确定非中心裁剪框R3-1左边框与长焦摄像头视场10的左边界线之间的距离,非中心裁剪框R3-1右边框与长焦摄像头视场10的右边界线之间的距离,非中心裁剪框R3-1上边框与长焦摄像头视场10的上边界线之间的距离,非中心裁剪框R3-1下边框与长焦摄像头视场10的下边界线之间的距离。然后,确定各距离是否都大于或者等于距离阈值。如果各距离都大于或者等于距离阈值,则可以确定非中心裁剪框R3-1未靠近长焦摄像头视场10的边界。否则,确定非中心裁剪框R3-1靠近长焦摄像头视场10的边界。例如,距离阈值为10个像素点的距离。
本申请实施例中第一图像帧为启动影随人动功能后,长焦摄像头采集的目标对象在长焦摄像头视场内的图像。因此,对于第一图像帧来说,非中心裁剪框R3-1在长焦摄像头视场内的位置可以为上述第一种情况或者第二种情况。对于第一图像帧之后的任一图像帧来说,非中心裁剪框R3-1在长焦摄像头视场内的位置可以为上述第一种情况、第二种情况和第三种情况中任一种情况。
对应的,如果第一图像帧满足上述第二种情况,则可以执行以下步骤S210,如果第一图像帧满足上述第一种情况,则在步骤S210的基础上还包括S211和S212。
S210,IFE基于长焦摄像头坐标系下的非中心裁剪框R3-1对第一图像帧进行裁剪处理,得到第一送显图像。
示例性的,如图12中(a)、(b)、(c)和(d)所示,IFE基于非中心裁剪框R3-1(w1,h1,a1+S1)对第一图像帧进行裁剪处理,得到第一送显图像(如图12中(d)所示)。其中,第一送显图像为非中心裁剪框R3-1所框选区域对应的图像,例如,图12中人脸图像。
IFE得到第一送显图像后,IPE对第一送显图像进行上采样处理或者下采样处理,得到第一预览图像(如图12中(e)所示)。其中,IPE对第一送显图像进行上采样处理或者下采样处理的目的是将第一送显图像的分辨率与屏幕的分辨率适配,以提供更好画面显示效果。
之后,IPE可以对第一预览图像进行图像画质优化处理,得到处理后的第一预览图像(如图12中(f)所示)。其中,图像画质优化处理可以包括对第一预览图像的去噪、锐化等优化处理,提升图像的画质。其中,不同摄像头对应的去噪、锐化等优化参数不同。
示例性的,对于长焦摄像头采集的图像,可以使用长焦摄像头对应的去噪、锐化等优化参数进行处理。对于广角摄像头采集的图像,可以使用广角摄像头对应的去噪、锐化等优化参数进行处理。
在一些实施例中,IFE向IPE发送第一送显图像时,可以携带第一标志,第一标志可以用于指示第一预览图像为长焦摄像头采集的图像。这样,IPE可以基于第一标志,使用长焦摄像头对应的去噪、锐化等优化参数对第一预览图像进行处理。
最后,IPE将处理后的第一预览图像发送至屏幕进行显示。
示例性的,如图12中(g)所示,处理后的第一预览图像最终显示在电子设备的图像显示界面的中心位置。
S211,如果第一图像帧满足上述第一种情况,则启动广角摄像头,得到第二图像帧和第三图像帧。
S212,将第二图像帧和第三图像帧发送给IFE。
启动广角摄像头后,广角摄像头和长焦摄像头同时工作。即广角摄像头和长焦摄像头同时对同一场景进行图像采集。这样,可以得到同一场景在长焦摄像头视场下的第二图像帧以及广角摄像头视场下的第三图像帧。
示例性的,第二图像帧为目标对象在第二位置时长焦摄像头采集的图像。第三图像帧为目标对象在第二位置时广角摄像头采集的图像。
需要说明的是,在第一图像帧满足上述第二种情况的情况下,需要启用两个摄像头同时采集图像。但是,后续依然以长焦摄像头作为送显摄像头,直至将送显摄像头切换为广角摄像头。
下面对第二送显图像的处理流程进行说明。结合图6B和图13所示,对第二送显图像的处理流程可以包括以下步骤:
S301,获取第二图像帧。
第二图像帧为通过长焦摄像头采集的、且目标对象在第二位置时的图像。
S302,基于第二图像帧,确定目标对象在第二位置时,各摄像头坐标系对应的非中心裁剪框。
其中,确定目标对象在第二位置时,长焦摄像头坐标系下的非中心裁剪框R3-2以及广角摄像头坐标系下的非中心裁剪框R4-2的方法可以参见步骤S206至S207的描述,此处不再赘述。
S303,将目标对象在第二位置时,各摄像头坐标系对应的非中心裁剪框发送给IFE。
S304,确定目标对象在第二位置时,长焦摄像头坐标系下的非中心裁剪框R3-2在长焦摄像头视场内的位置。
其中,确定目标对象在第二位置时,长焦摄像头坐标系下的非中心裁剪框R3-2在长焦摄像头视场内的位置的具体实现方式可以参见步骤S209的描述,此处不再赘述。
类似的,目标对象在第二位置时,长焦摄像头坐标系下的非中心裁剪框R3-2在长焦摄像头视场内的位置包括步骤S209中描述的三种情况。
S305,如果目标对象在第二位置时满足第二种情况,则可以采用步骤S210提供的方法,对第二图像帧进行图像处理。
也就是说,如果目标对象在第二位置时满足第二种情况,则采用非中心裁剪框R3-2,对第二图像帧进行裁剪处理得到第二送显图像。并且可以依然单独采用长焦摄像头采集图像。
S306,如果目标对象在第二位置时满足第一种情况,则可以采用步骤S210至S212提供的方法,对第二图像帧进行图像处理。
也就是说,如果目标对象在第二位置时满足第一种情况,则采用非中心裁剪框R3-2,对第二图像帧进行裁剪处理得到第二送显图像。并且可以启用广角摄像头,这样,启用广角摄像头后,长焦摄像头和广角摄像头可以同时采集图像。
如果目标对象在第二位置时满足第三种情况,则执行下述步骤S307至S308。
S307,如果目标对象在第二位置时满足第三种情况,则摄像头切换决策子模块确定将送显摄像头切换为广角摄像头。
需要说明的是,本申请实施例中,步骤S211中启用广角摄像头是指同时启用广角摄像头和长焦摄像头采集同一场景对应的图像,但是,对应的送显摄像头依然为长焦摄像头。类似的,步骤S306中启用长焦摄像头是指同时启用广角摄像头和长焦摄像头采集同一场景对应的图像,但是,对应的送显摄像头依然为广角摄像头。
步骤S307中,将送显摄像头切换为广角摄像头后,可以关闭长焦摄像头,只采用广角摄像头采集图像,以降低功耗。
S308,IFE基于目标对象在第二位置对应的广角摄像头坐标下的非中心裁剪框R4-2,对第三图像帧进行裁剪处理,得到第二送显图像。
本申请实施例在目标对象移出长焦摄像头视场的情况下,基于与广角摄像头相适配的非中心裁剪框R4-2以及广角摄像头采集的第三图像帧进行裁剪处理。
参考公式(6)、(7)和(9)的描述可知,由于本申请实施例计算得到的广角摄像头坐标对应的非中心裁剪框考虑了长焦摄像头和广角摄像头视场中心的偏移量。因此,基于与广角摄像头相适配的非中心裁剪框R4-2对第三图像帧进行裁剪处理后,得到的第二送显图像中目标对象依然位于第二送显图像的中心。这样,可以实现以目标对象为中心的摄像头切换,从而保证目标对象在显示的画面中的位移最小,以控制画面抖动量最小,使用户不会感知到摄像头切换操作,提高用户体验。
图14A为本申请实施例提供的基于非中心裁剪框R4-2对第三图像帧进行裁剪处理的流程示意图。图14B为本申请实施例提供的基于非中心裁剪框R4-2'对第三图像帧进行裁剪处理的流程示意图。
其中,非中心裁剪框R4-2为基于考虑了长焦摄像头和广角摄像头视场中心的偏移量,计算得到的广角摄像头坐标对应的非中心裁剪框。非中心裁剪框R4-2'为基于未考虑长焦摄像头和广角摄像头视场中心的偏移量,计算得到的广角摄像头坐标对应的非中心裁剪框。
示例性的,如图14A所示,基于非中心裁剪框R4-2对第三图像帧进行裁剪处理,得到的第二送显图像中目标对象依然位于第二送显图像的中心。如图14B所示,基于非中心裁剪框R4-2'对第三图像帧进行裁剪处理,得到的第二送显图像中目标对象并不是位于第二送显图像的中心,而是相对第二送显图像的中心有一定的偏移。而该偏移实际上是由于计算非中心裁剪框R4-2'时,未考虑长焦摄像头和广角摄像头视场中心的偏移量造成的。
这样,结合图12和图14A所示,在将送显摄像头由长焦摄像头切换为广角摄像头的情况下,目标对象在第一送显图像的中心,以及目标对象在第二送显图像的中心。这样,在屏幕基于第一送显图像显示的画面和基于第二送显图像显示的画面中目标对象的位置相同。从用户的角度看,目标对象由第一位置移动至第二位置时,最终屏幕上显示的画面中目标对象的位置没有变化,从而用户不会感知到摄像头切换操作。
结合图12和图14B所示,在将送显摄像头由长焦摄像头切换为广角摄像头的情况下,目标对象在第一送显图像的中心,但是目标对象不在第二送显图像的中心。这样,在屏幕基于第一送显图像显示的画面和基于第二送显图像显示的画面中目标对象的位置不相同。从用户的角度看,目标对象由第一位置移动至第二位置时,最终屏幕上显示的画面中目标对象出现抖动,从而影响用户体验。
类似的,IFE得到第二送显图像后,IPE对第二送显图像进行上采样处理或者下采样处理,得到第二预览图像。
IPE对第二预览图像进行图像画质优化处理,得到处理后的第二预览图像。并将处理后的第二预览图像发送至屏幕进行显示。
在一些实施例中,IFE向IPE发送第二送显图像时,可以携带第二标志,第二标志可以用于指示使用广角摄像头对应的去噪、锐化等优化参数对第二预览图像进行处理。
需要说明的是,上述实施例仅以对第一送显图像和第二送显图像的处理过程为例,对本申请实施例提供的由长焦摄像头切换为广角摄像头的方案进行示例性说明,对后续的送显图像的处理流程可以参见上述实施例的描述,此处不再赘述。
下面对送显摄像头由广角摄像头切换为长焦摄像头的方案进行说明。
请继续参见图6B,如果当前送显摄像头为广角摄像头,则第一图像帧为广角摄像头采集的目标对象在第一位置时的图像。
进一步的,可以参考上述公式(1)至公式(9),计算得到目标对象在第一位置时广角摄像头坐标系对应的非中心裁剪框R5-1以及长焦摄像头坐标系对应的非中心裁剪框R6-1。其中,公式(1)至公式(9)中的当前摄像头为广角摄像头,其他摄像头为长焦摄像头。
接着,可以基于确定目标对象在第一位置时,广角摄像头坐标系下的非中心裁剪框R5-1相对长焦摄像头视场的边界的位置。
其中,非中心裁剪框R5-1相对长焦摄像头视场的边界的位置可以包括如下四种情况:
第一种情况:非中心裁剪框R5-1完全不在长焦摄像头视场内(图中未示出)。
第二种情况:如图15中(a)所示,非中心裁剪框R5-1的小部分在长焦摄像头视场内。其中,非中心裁剪框R5-1的小部分在长焦摄像头视场内,表示非中心裁剪框R5-1距离完全进入长焦摄像头视场还有一段距离。
第三种情况:如图15中(b)所示,非中心裁剪框R5-1的大部分在长焦摄像头视场内。其中,非中心裁剪框R5-1的大部分在长焦摄像头视场内,表示非中心裁剪框R5-1可能即将完全进入长焦摄像头视场。
第四种情况:如图15中(c)所示,非中心裁剪框R5-1完全在长焦摄像头视场内。
本申请实施例对判断非中心裁剪框R5-1相对长焦摄像头视场的边界的位置的具体方式不进行限定。
在一种可实现方式中,可以基于非中心裁剪框R5-1与长焦摄像头视场的交集,判断非中心裁剪框R5-1相对长焦摄像头视场的边界位置。例如:如果非中心裁剪框R5-1与长焦摄像头视场的交集为零,则可以确定非中心裁剪框R5-1完全不在长焦摄像头视场内。如果非中心裁剪框R5-1与长焦摄像头视场的交集大于第一阈值、且小于第二阈值(第二阈值为非中心裁剪框R5-1对应的面积),则可以确定非中心裁剪框R5-1的大部分在长焦摄像头视场内。如果非中心裁剪框R5-1与长焦摄像头视场的交集大于零、且小于第一阈值,则可以确定非中心裁剪框R5-1的小部分在长焦摄像头视场内。如果非中心裁剪框R5-1与长焦摄像头视场的交集等于第二阈值(第二阈值为非中心裁剪框R5-1对应的面积),则可以确定非中心裁剪框R5-1的完全在长焦摄像头视场内。
在一种可实现方式中,也可以基于非中心裁剪框R5-1是否接近长焦摄像头视场10的边界,确定非中心裁剪框R5-1相对长焦摄像头视场的位置。具体的,可以参见步骤S209的描述,此处不再赘述。
对应的,如果目标对象在第一位置时,满足上述第一种情况和第二种情况,则采用目标对象在第一位置时广角摄像头坐标系下的非中心裁剪框R5-1,对第一图像帧进行裁剪处理得到第一送显图像。并且可以依然单独采用广角摄像头采集图像,并以广角摄像头作为送显摄像头。具体的,可以参见步骤S210的描述,此处不再赘述。
如果目标对象在第一位置时,满足上述第三种情况,则采用目标对象在第一位置时广角摄像头坐标系下的非中心裁剪框R5-1,对第一图像帧进行裁剪处理得到第一送显图像。并且可以启用长焦摄像头,并且依然以广角摄像头作为送显摄像头。这样,启用长焦摄像头后,长焦摄像头和广角摄像头可以同时采集图像。例如,目标对象移动至第二位置时,广角摄像头采集到第二图像帧,长焦摄像头采集到第三图像帧。具体的,可以参见步骤S211和S212的描述,此处不再赘述。
类似的,第二送显图像的处理流程为:可以先基于第二图像帧,确定目标对象在第二位置时,广角摄像头坐标系下的非中心裁剪框R5-2以及长焦摄像头坐标系下的非中心裁剪框R6-2。然后,确定目标对象在第二位置时,非中心裁剪框R5-2在长焦摄像头视场内的位置。
如果目标对象在第二位置时,满足上述第一种情况和第二种情况,则采用目标对象在第二位置时广角摄像头坐标系下的非中心裁剪框R5-2,对第二图像帧进行裁剪处理得到第二送显图像。并且可以依然单独采用广角摄像头采集图像,并以广角摄像头作为送显摄像头。具体的,可以参见步骤S210的描述,此处不再赘述。
如果目标对象在第二位置时,满足上述第三种情况,则采用目标对象在第二位置时广角摄像头坐标系下的非中心裁剪框R5-2,对第二图像帧进行裁剪处理得到第二送显图像。并且可以启用长焦摄像头,并且依然以广角摄像头作为送显摄像头。这样,启用长焦摄像头后,长焦摄像头和广角摄像头可以同时采集图像。例如,目标对象移动至第三位置时,广角摄像头采集到第四图像帧,长焦摄像头采集到第五图像帧。具体的,可以参见步骤S211和S212的描述,此处不再赘述。
如果目标对象在第二位置时,满足上述第四种情况,则摄像头切换决策子模块确定将送显摄像头切换为长焦摄像头。并且,IFE基于目标对象在第二位置对应的长焦摄像头坐标下的非中心裁剪框R6-2,对第三图像帧进行裁剪处理,得到第二送显图像。
这样,本申请实施例在目标对象由广角摄像头视场完全移动至长焦摄像头视场的情况下,切换送显摄像头为长焦摄像头,并且基于与长焦摄像头相适配的非中心裁剪框R6-2以及长焦摄像头采集的第三图像帧进行裁剪处理。这样,得到的第二送显图像中目标对象依然位于第二送显图像的中心。这样,可以实现以目标对象为中心的摄像头切换,从而保证目标对象在显示的画面中的位移最小,以控制画面抖动量最小,使用户不会感知到摄像头切换操作,提高用户体验。
综上,本申请实施例提供的视频处理方法,可以应用于影随人动场景。在送显摄像头为长焦摄像头,并且目标对象由长焦摄像头视场移动至靠近长焦摄像头视场边界位置时,可以提前启动广角摄像头。这样,当目标对象移出长焦摄像头视场时,广角摄像头依然可以采集到目标对象。对应的,当目标对象移出长焦摄像头视场时,切换送显摄像头为广角摄像头,并可以采用与广角摄像头适配的非中心裁剪框对广角摄像头预先采集的图像进行处理。这样,一方面可以实现以目标对象为中心的摄像头切换,从而保证目标对象在显示的画面中的位移最小。另一方面,通过将摄像头切换为广角摄像头,可以扩展电子设备的追焦能力。
类似的,在送显摄像头为广角摄像头,并且目标对象重新移回至靠近长焦摄像头视场边界位置时,可以提前启用长焦摄像头。这样,当目标对象移回长焦摄像头视场时,切换送显摄像头为长焦摄像头,并且可以采用与长焦摄像头适配的非中心裁剪框对长焦摄像头预先采集的图像进行处理。这样,一方面可以实现以目标对象为中心的摄像头切换,从而保证目标对象在显示的画面中的位移最小。另一方面,通过将摄像头切换为长焦摄像头,可以提升显示画面的质量。
需要说明的是,本申请实施例仅以影随人动场景进行示例性说明,并不表示对本申请实施例提供的视频处理方法的应用场景的限定。例如,本申请实施例提供的视频处理方法还可以应用于指向性变焦等场景。
其中,指向性变焦场景是指在视频拍摄时使用变焦功能跟踪拍摄某一个特定目标人物或物体的场景。
示例性的,拍摄者可以先通过触屏或其他控制方式,选择视频画面中的某一个感兴趣的拍摄对象(即目标对象)。然后,在视频拍摄过程中,如果目标对象移动,可以通过调整焦距放大倍率实现光学变焦效果,使目标对象保持在画面中心区域,实现对目标对象的“指向性变焦”跟踪效果。例如,在体育赛事、野生动物等拍摄场景,可以采用指向性变焦功能,实时自动跟踪并聚焦拍摄视频中特定感兴趣的目标对象的。
下面对指向性变焦场景下应用本申请实施例提供的视频处理方法进行说明。
如图16中(a)所示,在当前焦距放大倍率为第一倍率(也可以称为第一焦距放大倍率),且送显摄像头为长焦摄像头时,通过长焦摄像头采集图像,此时的裁剪框12位于长焦摄像头视场10内。对应的,通过裁剪框12在长焦摄像头视场10内裁剪送显内容(即人脸)。如图16中(b)所示,在当前焦距放大倍率变为第二倍率(也可以称为第二焦距放大倍率,例如,第二倍率大于第一倍率)时,此时的裁剪框12超出长焦摄像头视场10内,切换送显摄像头为广角摄像头。如图16中(c)所示,在当前焦距放大倍率变为第三倍率(也可以称为第三焦距放大倍率,例如,第三倍率小于第二倍率)时,此时的裁剪框12在长焦摄像头视场10内,切换送显摄像头为长焦摄像头。
这样,可以基于不同焦距放大倍率下的裁剪框12与长焦摄像头视场10之间的位置关系,动态切换送显摄像头,以达到扩展电子设备的追焦能力、以及提升显示画面的质量的效果。
下面首先对指向性变焦场景下,送显摄像头由长焦摄像头切换为广角摄像的方案进行说明。
获取第一图像帧。第一图像帧为目标对象位于第一位置、且焦距放大倍率为第一倍率时,长焦摄像头采集的图像。
进一步的,可以利用上述公式(1)至公式(9),计算得到目标对象在第一位置、且焦距放大倍率为第一倍率时,长焦摄像头坐标系对应的非中心裁剪框R3-1以及广角摄像头坐标系对应的非中心裁剪框R4-1。其中,公式(1)至公式(9)中,当前焦距放大倍率为第一倍率,当前摄像头为长焦摄像头,其他摄像头为广角摄像头。
接着,可以基于确定目标对象在第一位置、且焦距放大倍率为第一倍率时,长焦摄像头坐标系下的非中心裁剪框R3-1相对长焦摄像头视场的边界的位置。具体可以参见,步骤S209的描述,此处不再赘述。
如果目标对象在第一位置、且焦距放大倍率为第一倍率时, 非中心裁剪框R3-1完全在长焦摄像头视场10内,并且非中心裁剪框R7未靠近长焦摄像头视场10的边界,则可以执行步骤S210。
如果目标对象在第一位置、且焦距放大倍率为第一倍率时, 非中心裁剪框R3-1完全在长焦摄像头视场内,并且非中心裁剪框R3-1靠近长焦摄像头视场10的边界(如图17中(a)所示),则在步骤S210的基础上还包括S211和S212。
接着,获取第二图像帧。第二图像帧为目标对象位于第二位置、且焦距放大倍率为第二倍率时,长焦摄像头采集的图像。其中,第一倍率与第二倍率不同,第一位置与第二位置可以相同或者不同。
进一步的,可以再次利用上述公式(1)至公式(9),计算得到目标对象在第二位置、且焦距放大倍率为第二倍率时,长焦摄像头坐标系对应的非中心裁剪框R3-2以及广角摄像头坐标系对应的非中心裁剪框R4-2。其中,公式(1)至公式(9)中,当前焦距放大倍率为第二倍率,当前摄像头为长焦摄像头,其他摄像头为广角摄像头。
然后,可以基于确定目标对象在第二位置、且焦距放大倍率为第二倍率时,长焦摄像头坐标系下的非中心裁剪框R3-2相对长焦摄像头视场的边界的位置。具体可以参见,步骤S209的描述,此处不再赘述。
如果目标对象在第二位置、且焦距放大倍率为第二倍率时, 非中心裁剪框R3-2完全在长焦摄像头视场10内,并且非中心裁剪框R3-2未靠近长焦摄像头视场10的边界,则可以执行步骤S210。
如果目标对象在第二位置、且焦距放大倍率为第二倍率时, 非中心裁剪框R3-2完全在长焦摄像头视场内,并且非中心裁剪框R3-2靠近长焦摄像头视场10的边界,则在步骤S210的基础上还包括S211和S212。
如果目标对象在第二位置、且焦距放大倍率为第二倍率时, 非中心裁剪框R3-2的一部分超出长焦摄像头视场10(如图17中(b)所示),则可以执行步骤S307至S308。即将送显摄像头切换为广角摄像头,并基于目标对象在第二位置、且焦距放大倍率为第二倍率时的非中心裁剪框R4-2,对第三图像帧进行裁剪处理,得到第二送显图像。具体可以参见步骤S307至S308的描述,此处不再赘述。
下面对指向性变焦场景下,送显摄像头由广角摄像头切换为长焦摄像的方案进行说明。
获取第一图像帧。第一图像帧为目标对象位于第一位置、且焦距放大倍率为第一倍率时,广角摄像头采集的图像。
进一步的,可以利用上述公式(1)至公式(9),计算得到目标对象在第一位置、且焦距放大倍率为第一倍率时,广角摄像头坐标系对应的非中心裁剪框R5-1以及长焦摄像头坐标系对应的非中心裁剪框R6-1。其中,公式(1)至公式(9)中,当前焦距放大倍率为第一倍率,当前摄像头为广角摄像头,其他摄像头为长焦摄像头。
接着,可以基于确定目标对象在第一位置、且焦距放大倍率为第一倍率时, 广角摄像头坐标系下的非中心裁剪框R5-1相对长焦摄像头视场的边界的位置。具体可以参见,步骤S209的描述,此处不再赘述。
如果目标对象在第一位置、且焦距放大倍率为第一倍率时, 非中心裁剪框R5-1完全在长焦摄像头视场10内,并且非中心裁剪框R5-1未接近长焦摄像头视场10的边界(如图18中(a)所示),则可以执行步骤S210。
如果目标对象在第一位置、且焦距放大倍率为第一倍率时, 非中心裁剪框R5-1完全在长焦摄像头视场内,并且非中心裁剪框R5-1接近长焦摄像头视场10的边界,则在步骤S210的基础上还包括S211和S212。
接着,获取第二图像帧。第二图像帧为目标对象位于第二位置、且焦距放大倍率为第二倍率时,广角摄像头采集的图像。其中,第一倍率与第二倍率不同,第一位置与第二位置可以相同或者不同。
进一步的,可以再次利用上述公式(1)至公式(9),计算得到目标对象在第二位置、且焦距放大倍率为第二倍率时,广角摄像头坐标系对应的非中心裁剪框R5-2以及长焦摄像头坐标系对应的非中心裁剪框R6-2。其中,公式(1)至公式(9)中,当前焦距放大倍率为第二倍率,当前摄像头为广角摄像头,其他摄像头为长焦摄像头。
然后,可以基于确定目标对象在第二位置、且焦距放大倍率为第二倍率时的非中心裁剪框R5-2相对长焦摄像头视场的边界的位置。具体可以参见,步骤S209的描述,此处不再赘述。
如果目标对象在第二位置、且焦距放大倍率为第二倍率时,非中心裁剪框R5-2完全不在长焦摄像头视场内,或者,非中心裁剪框R5-2的小部分在长焦摄像头视场内。则采用非中心裁剪框R5-2,对第二图像帧进行裁剪处理得到第二送显图像。并且可以依然单独采用广角摄像头采集图像。具体的,可以参见步骤S210的描述,此处不再赘述。
如果目标对象在第二位置、且焦距放大倍率为第二倍率时, 非中心裁剪框R5-2的大部分在长焦摄像头视场内,则在步骤S210的基础上还包括S211和S212。则采用非中心裁剪框R5-2,对第二图像帧进行裁剪处理得到第二送显图像。并且可以启用长焦摄像头,这样,启用长焦摄像头后,长焦摄像头和广角摄像头可以同时采集图像。例如,目标对象移动至第三位置、且焦距放大倍率为第三倍率时,广角摄像头采集到第四图像帧,长焦摄像头采集到第五图像帧。具体的,可以参见步骤S211和S212的描述,此处不再赘述。
如果目标对象在第二位置、且焦距放大倍率为第二倍率时, 非中心裁剪框R5-2完全在长焦摄像头视场内(如图18中(b)所示),则将送显摄像头切换为长焦摄像头。并基于目标对象在第二位置、且焦距放大倍率为第二倍率时,广角摄像头坐标下的非中心裁剪框R6-2,对第三图像帧进行裁剪处理,得到第二送显图像。具体可以参见步骤S307至S308的描述,此处不再赘述。
需要说明的是,上述实施例仅以长焦摄像头和广角摄像头这两个摄像头的切换过程为例进行示例性说明,并不表示对摄像头切换方案的限定。
示例性的,电子设备还可以包括超广角摄像头,这样,在送显摄像头为长焦摄像头时,如果目标对象移出长焦摄像头视场,则可以切换送显摄像头为广角摄像头。在送显摄像头为广角摄像头时,如果目标对象进一步移出广角摄像头视场,则可以切换送显摄像头为超广角摄像头。类似的,在送显摄像头为超广角摄像头时,如果目标对象移动进入广角摄像头视场,则可以切换送显摄像头为广角摄像头。在送显摄像头为广角摄像头时,如果目标对象进一步移动进入长焦摄像头视场,则可以切换送显摄像头为长焦摄像头。
其中,送显摄像头由广角摄像头切换为超广角摄像头,以及,送显摄像头由超广角摄像头切换为广角摄像头的具体实现过程可以参见上述实施例的描述,此处不再赘述。
还需要说明的是,上述实施例仅以基于第二图像帧,确定目标对象在第二位置时各摄像头坐标系对应的非中心裁剪框为例进行示例性说明,并不表示对应确定非中心裁剪框方法的限定。例如,也可以基于第一图像帧和第二图像帧,确定目标对象在第二位置时各摄像头坐标系对应的非中心裁剪框。
示例性的,可以先基于第一图像帧,确定目标对象在第一位置时相对摄像头视场中心的偏移量S3。然后,基于第一图像帧和第二图像,确定目标对象在第二位置时相对第一位置的偏移量S4。最后,可以基于偏移量S3、偏移量S4以及目标对象在第一位置时的非中心裁剪框,确定目标对象在第二位置时的非中心裁剪框。
图19为本申请实施例提供的一种视频处理方法的工作流程示意图。如图19所示,该方法可以包括以下步骤:
S401,获取第一图像帧;第一图像帧为目标对象在第一位置时,通过第一摄像头采集的图像帧;其中,在目标对象在第一位置时,目标对象在第一摄像头视场内。
S402,对第一图像帧进行裁剪处理,得到第一送显图像。
在一种可实现方式中,对第一图像帧进行裁剪处理,得到第一送显图像,可以采用下述方式实现:获取目标对象在第一位置时的第二焦距放大倍率;基于第二焦距放大倍率,确定第三中心裁剪框;第三中心裁剪框为第一摄像头坐标系下的裁剪框,第三中心裁剪框的中心与第一图像帧的中心重合;基于第一图像帧,确定第一摄像头坐标系下目标对象相对第一图像帧中心的第三偏移量;基于第三中心裁剪框和第三偏移量,确定第三非中心裁剪框;第三非中心裁剪框的中心与第一图像帧中目标对象的中心重合;利用第三非中心裁剪框对第一图像帧进行裁剪处理,得到第一送显图像。
具体可以参见步骤S201至S210的描述,此处不再赘述。例如,第三中心裁剪框可以为中心裁剪框R1,第三非中心裁剪框可以为非中心裁剪框R3-1,第三偏移量可以为S1。
在一种可实现方式中,在目标对象位于第一位置时,目标对象在第一摄像头的视场的位置满足第二摄像头启用条件的情况下,启用第二摄像头;通过第一摄像头采集第二图像帧以及通过第二摄像头采集第三图像帧。
其中,在第一摄像头的视场小于第二摄像头的视场的情况下,第二摄像头启用条件包括:在目标对象位于第一位置时,目标对象未超出第一摄像头的视场边界、且目标对象与第一摄像头的视场边界之间间距小于第一阈值。
具体可以参见步骤S209的描述,此处不再赘述。例如,第一阈值可以为步骤S209中的距离阈值。
其中,在第一摄像头的视场大于第二摄像头的视场的情况下,第二摄像头启用条件包括:在目标对象位于第一位置时,目标对象与第一摄像头的视场的交集大于第二阈值。
具体可以参见上述实施例中对送显摄像头由广角摄像头切换为长焦摄像头的方案的描述,此处不再赘述。例如,第二阈值可以为面积阈值。
S403,获取第二图像帧;第二图像帧为目标对象移动至第二位置时,通过第一摄像头采集的图像帧;第一位置与第二位置不同。
S404,在目标对象位于第二位置时,目标对象在第一摄像头的视场的位置满足摄像头切换条件的情况下,切换第一摄像头为第二摄像头,并且对第三图像帧进行裁剪处理,得到第二送显图像;其中,第三图像帧为目标对象在第二位置时,通过第二摄像头采集的图像帧。
其中,在第一摄像头的视场小于第二摄像头的视场的情况下,摄像头切换条件包括:在目标对象位于第二位置时,目标对象超出第一摄像头的视场边界、且未超过第二摄像头的视场边界。
例如,第一摄像头为长焦摄像头,第二摄像头为广角摄像头。具体可以参见上述实施例中对送显摄像头由长焦角摄像头切换为广角摄像头的方案的描述,此处不再赘述。
在一种可实现方式中,在目标对象位于第二位置时,目标对象在第一摄像头的视场的位置满足摄像头切换条件的情况下,切换第一摄像头为第二摄像头,可以采用下述方式实现:获取目标对象在第二位置时的第一焦距放大倍率;基于第一焦距放大倍率,确定第一中心裁剪框;第一中心裁剪框为第一摄像头坐标系下的裁剪框,第一中心裁剪框的中心与第二图像帧的中心重合;基于第二图像帧,确定第一摄像头坐标系下目标对象相对第二图像帧的中心的第一偏移量;基于第一中心裁剪框和第一偏移量,确定第一非中心裁剪框;第一非中心裁剪框为第一摄像头坐标系下的裁剪框,第一非中心裁剪框的中心与第二图像帧中目标对象的中心重合;在第一非中心裁剪框超出第一摄像头的视场边界、且未超过第二摄像头的视场边界的情况下,切换第一摄像头为第二摄像头。
具体可以参见步骤S301至S308的描述,此处不再赘述。例如,第一非中心裁剪框可以为非中心裁剪框R3-2。
在一种可实现方式中,基于第二图像帧,确定第一摄像头坐标系下目标对象相对第二图像帧的中心的第一偏移量,可以采用下述方式实现:基于第二图像帧,确定预览坐标系下目标对象相对预览中心的第四偏移量;基于第四偏移量与第二坐标转换因子,将第四偏移量转换为第一偏移量;第二坐标转换因子为第一摄像头坐标系与预览坐标系之间的坐标转换因子。
具体可以参见步骤S206的描述,此处不再赘述。
其中,在第一摄像头的视场大于第二摄像头的视场的情况下,摄像头切换条件包括:在目标对象位于第二位置时,目标对象完全位于第二摄像头的视场。
例如,第一摄像头为广角摄像头,第二摄像头为长焦摄像头。具体可以参见上述实施例中对送显摄像头由广角摄像头切换为长焦摄像头的方案的描述,此处不再赘述。
在一种可实现方式中,在目标对象位于第二位置时,目标对象在第一摄像头的视场的位置满足摄像头切换条件的情况下,切换第一摄像头为第二摄像头,可以采用下述方式实现:获取目标对象在第二位置时的第一焦距放大倍率;基于第一焦距放大倍率,确定第一中心裁剪框;第一中心裁剪框为第一摄像头坐标系下的裁剪框,第一中心裁剪框的中心与第二图像帧的中心重合;基于第二图像帧,确定第一摄像头坐标系下目标对象相对第二图像帧中心的第一偏移量;基于第一中心裁剪框和第一偏移量,确定第一非中心裁剪框;第一非中心裁剪框为第一摄像头坐标系下的裁剪框,第一非中心裁剪框的中心与第二图像帧中目标对象的中心重合;在第一非中心裁剪框完全位于第二摄像头的视场的情况下,切换第一摄像头为第二摄像头。
在一种可实现方式中,对第三图像帧进行裁剪处理,得到第二送显图像,可以采用下述方式实现:基于第一焦距放大倍率,确定第二中心裁剪框;第二中心裁剪框为第二摄像头坐标系下的裁剪框,第二中心裁剪框的中心与第三图像帧的中心重合;基于第一偏移量、视场偏移量以及第一坐标转换因子,确定第二摄像头坐标系下目标对象相对第三图像帧的中心的第二偏移量;视场偏移量为第一摄像头的视场中心相对于第二摄像头的视场中心的偏移量;第一坐标转换因子为第一摄像头坐标系与第二摄像头坐标系之间的坐标转换因子;基于第二中心裁剪框和第二偏移量,确定第二非中心裁剪框;第二非中心裁剪框为第二摄像头坐标系下的裁剪框,第二非中心裁剪框的中心与第三图像帧中目标对象的中心重合;利用第二非中心裁剪框对第三图像帧进行裁剪处理,得到第二送显图像。
具体可以参见上述实施例中对送显摄像头由广角摄像头切换为长焦摄像头的方案的描述,此处不再赘述。例如,第二非中心裁剪框可以为非中心裁剪框R6-2。
本文中描述的各个方法实施例可以为独立的方案,也可以根据内在逻辑进行组合,这些方案都落入本申请的保护范围中。
可以理解的是,上述各个方法实施例中,由电子设备实现的方法和操作,也可以由可用于电子设备的部件(例如芯片或者电路)实现。
上述实施例对本申请提供的视频处理方法进行了介绍。可以理解的是,电子设备为了实现上述功能,其包含了执行每一个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例还提供了一种处理装置,该处理装置包括至少一个处理器和通信接口。所述通信接口用于为所述至少一个处理器提供信息输入和/或输出,所述至少一个处理器用于执行上述方法实施例中的方法。
应理解,上述处理装置可以是一个芯片。例如,参见图20,图20为本申请实施例提供的一种芯片的结构框图。图20所示的芯片可以为通用处理器,也可以为专用处理器。该芯片500可以包括至少一个处理器501。其中,所述至少一个处理器501可以用于支持上述任一实施例对应的技术方案。
可选的,该芯片500还可以包括收发器502,收发器502用于接受处理器501的控制,用于支持上述任一实施例对应的技术方案。可选的,图5所示的芯片500还可以包括存储介质503。具体的,所述收发器502可以替换为通信接口,所述通信接口为所述至少一个处理器501提供信息输入和/或输出。
需要说明的是,图20所示的芯片500可以使用下述电路或者器件来实现:一个或多个现场可编程门阵列(field programmable gate array,FPGA)、可编程逻辑器件(programmable logic device,PLD)、专用集成芯片(application specific integratedcircuit,ASIC)、系统芯片(system on chip,SoC)、中央处理器(central processor unit,CPU)、网络处理器(network processor,NP)、数字信号处理电路(digital signalprocessor,DSP)、微控制器(micro controller unit,MCU),控制器、状态机、门逻辑、分立硬件部件、任何其他适合的电路、或者能够执行本申请通篇所描述的各种功能的电路的任意组合。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
应注意,本申请实施例中的处理器可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
可以理解,本申请实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(directrambus RAM,DR RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
根据本申请实施例提供的方法,本申请实施例还提供一种计算机程序产品,该计算机程序产品包括:计算机程序或指令,当该计算机程序或指令在计算机上运行时,使得该计算机执行方法实施例中任意一个实施例的方法。
根据本申请实施例提供的方法,本申请实施例还提供一种计算机存储介质,该计算机存储介质存储有计算机程序或指令,当该计算机程序或指令在计算机上运行时,使得该计算机执行方法实施例中任意一个实施例的方法。
根据本申请实施例提供的方法,本申请实施例还提供一种电子设备,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,当所述处理器执行所述计算机指令时,使所述电子设备执行方法实施例中任意一个实施例的方法。
根据本申请实施例提供的方法,本申请实施例还提供了一种芯片系统,该芯片系统包括处理器,所述处理器与存储器耦合,用于执行所述存储器中存储的计算机程序或指令,当所述计算机程序或指令被执行时,可使芯片系统实施方法实施例中的全部或部分步骤。该芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各种说明性逻辑块(illustrative logical block)和步骤(step),能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
上述本申请实施例提供的计算机存储介质、计算机程序产品、电子设备均用于执行上文所提供的方法,因此,其所能达到的有益效果可参考上文所提供的方法对应的有益效果,在此不再赘述。
应理解,在本申请的各个实施例中,各步骤的执行顺序应以其功能和内在逻辑确定,各步骤序号的大小并不意味着执行顺序的先后,不对实施例的实施过程构成限定。
本说明书的各个部分均采用递进的方式进行描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点介绍的都是与其他实施例不同之处。尤其,对于装置、计算机存储介质、计算机程序产品、电子设备的实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
以上所述的本申请实施方式并不构成对本申请保护范围的限定。

Claims (15)

1.一种视频处理方法,其特征在于,应用于电子设备,所述电子设备包括第一摄像头和第二摄像头,所述第一摄像头和所述第二摄像头的视场不同;所述方法包括:
获取第一图像帧;所述第一图像帧为目标对象在第一位置时,通过所述第一摄像头采集的图像帧;其中,在所述目标对象在第一位置时,所述目标对象在所述第一摄像头视场内;
对所述第一图像帧进行裁剪处理,得到第一送显图像;
获取第二图像帧;所述第二图像帧为所述目标对象移动至第二位置时,通过所述第一摄像头采集的图像帧;所述第一位置与所述第二位置不同;
在所述目标对象位于所述第二位置时,所述目标对象在所述第一摄像头的视场的位置满足摄像头切换条件的情况下,切换所述第一摄像头为所述第二摄像头,并且对第三图像帧进行裁剪处理,得到第二送显图像;其中,所述第三图像帧为所述目标对象在第二位置时,通过所述第二摄像头采集的图像帧。
2.根据权利要求1所述的方法,其特征在于,在所述第一摄像头的视场小于所述第二摄像头的视场的情况下,所述摄像头切换条件包括:在所述目标对象位于所述第二位置时,所述目标对象超出所述第一摄像头的视场边界、且未超过所述第二摄像头的视场边界。
3.根据权利要求1所述的方法,其特征在于,在所述第一摄像头的视场大于所述第二摄像头的视场的情况下,所述摄像头切换条件包括:在所述目标对象位于所述第二位置时,所述目标对象完全位于所述第二摄像头的视场。
4.根据权利要求2所述的方法,其特征在于,所述在所述目标对象位于所述第二位置时,所述目标对象在所述第一摄像头的视场的位置满足摄像头切换条件的情况下,切换所述第一摄像头为所述第二摄像头,包括:
获取所述目标对象在第二位置时的第一焦距放大倍率;
基于所述第一焦距放大倍率,确定第一中心裁剪框;所述第一中心裁剪框为第一摄像头坐标系下的裁剪框,所述第一中心裁剪框的中心与所述第二图像帧的中心重合;
基于所述第二图像帧,确定第一摄像头坐标系下所述目标对象相对第二图像帧的中心的第一偏移量;
基于所述第一中心裁剪框和所述第一偏移量,确定第一非中心裁剪框;所述第一非中心裁剪框为第一摄像头坐标系下的裁剪框,所述第一非中心裁剪框的中心与所述第二图像帧中所述目标对象的中心重合;
在所述第一非中心裁剪框超出所述第一摄像头的视场边界、且未超过所述第二摄像头的视场边界的情况下,切换所述第一摄像头为所述第二摄像头。
5.根据权利要求3所述的方法,其特征在于,所述在所述目标对象位于所述第二位置时,所述目标对象在所述第一摄像头的视场的位置满足摄像头切换条件的情况下,切换所述第一摄像头为所述第二摄像头,包括:
获取所述目标对象在第二位置时的第一焦距放大倍率;
基于所述第一焦距放大倍率,确定第一中心裁剪框;所述第一中心裁剪框为第一摄像头坐标系下的裁剪框,所述第一中心裁剪框的中心与所述第二图像帧的中心重合;
基于所述第二图像帧,确定第一摄像头坐标系下所述目标对象相对第二图像帧中心的第一偏移量;
基于所述第一中心裁剪框和所述第一偏移量,确定第一非中心裁剪框;所述第一非中心裁剪框为第一摄像头坐标系下的裁剪框,所述第一非中心裁剪框的中心与所述第二图像帧中所述目标对象的中心重合;
在所述第一非中心裁剪框完全位于所述第二摄像头的视场的情况下,切换所述第一摄像头为所述第二摄像头。
6.根据权利要求4或5所述的方法,其特征在于,所述对第三图像帧进行裁剪处理,得到第二送显图像,包括:
基于所述第一焦距放大倍率,确定第二中心裁剪框;所述第二中心裁剪框为第二摄像头坐标系下的裁剪框,所述第二中心裁剪框的中心与所述第三图像帧的中心重合;
基于所述第一偏移量、视场偏移量以及第一坐标转换因子,确定所述第二摄像头坐标系下所述目标对象相对第三图像帧的中心的第二偏移量;所述视场偏移量为所述第一摄像头的视场中心相对于所述第二摄像头的视场中心的偏移量;所述第一坐标转换因子为所述第一摄像头坐标系与所述第二摄像头坐标系之间的坐标转换因子;
基于所述第二中心裁剪框和所述第二偏移量,确定第二非中心裁剪框;所述第二非中心裁剪框为第二摄像头坐标系下的裁剪框,所述第二非中心裁剪框的中心与所述第三图像帧中所述目标对象的中心重合;
利用所述第二非中心裁剪框对所述第三图像帧进行裁剪处理,得到第二送显图像。
7.根据权利要求1所述的方法,其特征在于,所述对所述第一图像帧进行裁剪处理,得到第一送显图像,包括:
获取所述目标对象在第一位置时的第二焦距放大倍率;
基于所述第二焦距放大倍率,确定第三中心裁剪框;所述第三中心裁剪框为第一摄像头坐标系下的裁剪框,所述第三中心裁剪框的中心与所述第一图像帧的中心重合;
基于所述第一图像帧,确定第一摄像头坐标系下所述目标对象相对第一图像帧中心的第三偏移量;
基于所述第三中心裁剪框和所述第三偏移量,确定第三非中心裁剪框;所述第三非中心裁剪框的中心与所述第一图像帧中所述目标对象的中心重合;
利用所述第三非中心裁剪框对所述第一图像帧进行裁剪处理,得到第一送显图像。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述目标对象位于所述第一位置时,所述目标对象在所述第一摄像头的视场的位置满足第二摄像头启用条件的情况下,开启所述第二摄像头;
通过所述第一摄像头采集所述第二图像帧以及通过所述第二摄像头采集所述第三图像帧。
9.根据权利要求8所述的方法,其特征在于,在所述第一摄像头的视场小于所述第二摄像头的视场的情况下,所述第二摄像头启用条件包括:
在所述目标对象位于所述第一位置时,所述目标对象未超出所述第一摄像头的视场边界、且所述目标对象与所述第一摄像头的视场边界之间间距小于第一阈值。
10.根据权利要求8所述的方法,其特征在于,在所述第一摄像头的视场大于所述第二摄像头的视场的情况下,所述第二摄像头启用条件包括:
在所述目标对象位于所述第一位置时,所述目标对象与第一摄像头的视场的交集大于第二阈值。
11.根据权利要求4所述的方法,其特征在于,所述基于所述第二图像帧,确定第一摄像头坐标系下所述目标对象相对第二图像帧的中心的第一偏移量,包括:
基于所述第二图像帧,确定预览坐标系下所述目标对象相对预览中心的第四偏移量;
基于所述第四偏移量与第二坐标转换因子,将所述第四偏移量转换为所述第一偏移量;所述第二坐标转换因子为所述第一摄像头坐标系与所述预览坐标系之间的坐标转换因子。
12.根据权利要求1所述的方法,其特征在于,所述第一摄像头为长焦摄像头,所述第二摄像头为广角摄像头;或者,所述第一摄像头为广角摄像头,所述第二摄像头为长焦摄像头。
13.一种电子设备,其特征在于,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,当所述处理器执行所述计算机指令时,使所述电子设备执行如权利要求1-12中任一项所述的方法。
14.一种芯片系统,其特征在于,所述芯片系统包括处理器;所述处理器与存储器耦合,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,当所述处理器执行所述计算机指令时,如权利要求1-12中任一项所述的方法被执行。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序或指令,当所述计算机程序或指令在计算机上运行时,使得计算机执行如权利要求1-12中任一项所述的方法。
CN202311810620.7A 2023-12-27 2023-12-27 一种视频处理方法、电子设备及芯片系统 Active CN117479008B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311810620.7A CN117479008B (zh) 2023-12-27 2023-12-27 一种视频处理方法、电子设备及芯片系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311810620.7A CN117479008B (zh) 2023-12-27 2023-12-27 一种视频处理方法、电子设备及芯片系统

Publications (2)

Publication Number Publication Date
CN117479008A true CN117479008A (zh) 2024-01-30
CN117479008B CN117479008B (zh) 2024-05-03

Family

ID=89635110

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311810620.7A Active CN117479008B (zh) 2023-12-27 2023-12-27 一种视频处理方法、电子设备及芯片系统

Country Status (1)

Country Link
CN (1) CN117479008B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110506416A (zh) * 2018-07-27 2019-11-26 华为技术有限公司 一种终端切换摄像头的方法及终端
KR20200081057A (ko) * 2018-12-27 2020-07-07 주식회사 주원테크놀러지 카메라 시스템의 센터 보정 방법 및 장치
CN114285992A (zh) * 2020-06-19 2022-04-05 厦门紫光展锐科技有限公司 变焦控制方法、系统、设备及介质
CN115002342A (zh) * 2022-05-05 2022-09-02 深圳市睿联技术股份有限公司 目标对象跟踪方法、装置、摄像机及存储介质
CN115225800A (zh) * 2021-04-14 2022-10-21 华为技术有限公司 多摄像头变焦方法、装置及设备
CN115484375A (zh) * 2021-05-31 2022-12-16 华为技术有限公司 拍摄方法及电子设备
CN116939357A (zh) * 2022-04-02 2023-10-24 华为技术有限公司 微距拍摄方法、电子设备和计算机可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110506416A (zh) * 2018-07-27 2019-11-26 华为技术有限公司 一种终端切换摄像头的方法及终端
KR20200081057A (ko) * 2018-12-27 2020-07-07 주식회사 주원테크놀러지 카메라 시스템의 센터 보정 방법 및 장치
CN114285992A (zh) * 2020-06-19 2022-04-05 厦门紫光展锐科技有限公司 变焦控制方法、系统、设备及介质
CN115225800A (zh) * 2021-04-14 2022-10-21 华为技术有限公司 多摄像头变焦方法、装置及设备
CN115484375A (zh) * 2021-05-31 2022-12-16 华为技术有限公司 拍摄方法及电子设备
CN116939357A (zh) * 2022-04-02 2023-10-24 华为技术有限公司 微距拍摄方法、电子设备和计算机可读存储介质
CN115002342A (zh) * 2022-05-05 2022-09-02 深圳市睿联技术股份有限公司 目标对象跟踪方法、装置、摄像机及存储介质

Also Published As

Publication number Publication date
CN117479008B (zh) 2024-05-03

Similar Documents

Publication Publication Date Title
WO2020073959A1 (zh) 图像捕捉方法及电子设备
CN110506416B (zh) 一种终端切换摄像头的方法及终端
JP2023501663A (ja) 撮影方法および電子デバイス
JP7355941B2 (ja) 長焦点シナリオにおける撮影方法および端末
WO2021143269A1 (zh) 一种长焦场景下的拍摄方法及移动终端
CN116055874B (zh) 一种对焦方法和电子设备
CN117278850A (zh) 一种拍摄方法及电子设备
WO2023160179A1 (zh) 倍率切换方法和倍率切换装置
CN115686182B (zh) 增强现实视频的处理方法与电子设备
CN114466101B (zh) 显示方法及电子设备
CN117479008B (zh) 一种视频处理方法、电子设备及芯片系统
CN115225753A (zh) 拍摄方法、相关装置及系统
CN115460343B (zh) 图像处理方法、设备及存储介质
CN116095512B (zh) 终端设备的拍照方法及相关装置
CN116055871B (zh) 视频处理方法及其相关设备
CN116055872B (zh) 图像获取方法、电子设备和计算机可读存储介质
CN115802144B (zh) 视频拍摄方法及相关设备
CN115633255B (zh) 视频处理方法和电子设备
CN117641116A (zh) 一种控制摄像头帧率的方法及电子设备
CN116095225A (zh) 终端设备的图像处理方法及装置
CN117762279A (zh) 控制方法、电子设备、存储介质及程序产品
CN113452895A (zh) 一种拍摄方法及设备
CN117115003A (zh) 去除噪声的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant