CN112700454B - 图像裁剪方法、装置、电子设备及存储介质 - Google Patents
图像裁剪方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112700454B CN112700454B CN202011581046.9A CN202011581046A CN112700454B CN 112700454 B CN112700454 B CN 112700454B CN 202011581046 A CN202011581046 A CN 202011581046A CN 112700454 B CN112700454 B CN 112700454B
- Authority
- CN
- China
- Prior art keywords
- target image
- image
- target
- size
- main
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 210000000746 body region Anatomy 0.000 claims description 35
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000002372 labelling Methods 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 10
- 238000009966 trimming Methods 0.000 description 8
- 230000006978 adaptation Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
Abstract
本公开关于一种图像裁剪方法、装置、电子设备及存储介质,该方法包括获取目标图像和目标裁剪尺寸;对目标图像进行主体识别,得到目标图像的主体区域在目标图像中的位置信息;以目标图像的任意一个角为原点构建目标坐标系;在目标图像的尺寸比例信息满足预设动态调整条件的情况下,根据位置信息确定主体区域的关键像素点对应的主边坐标和主体区域对应的主边长度;根据主边坐标和主边长度确定裁剪偏移数据;基于裁剪偏移数据和目标裁剪尺寸对目标图像进行裁剪,得到裁剪后图像。利用本公开实施例可以有效保留图像的主体内容,且可以大大提高图像裁剪效率。
Description
技术领域
本公开涉及图像处理技术领域,尤其涉及一种图像裁剪方法、装置、电子设备及存储介质。
背景技术
随着多媒体技术的快速发展,以及摄影的便捷化,用户对图像编辑的需求越来越大。相关技术中,例如在短视频领域中,为了使同一视频封面(图像)在不同的需求场景下能够以不同的比例展示出来,就需要对图像进行裁剪,但不同场景下的裁剪比例不同,且不同图像的布局也不同,存在裁剪后图像无法有效保留图像主体内容,且裁剪效率低下等问题。
发明内容
本公开提供一种图像裁剪方法、装置、电子设备及存储介质,以至少解决相关技术中存在的裁剪后图像无法有效保留图像主体内容,且裁剪效率低下等问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种图像裁剪方法,包括:
获取目标图像和目标裁剪尺寸;
对所述目标图像进行主体识别,得到所述目标图像的主体区域在所述目标图像中的位置信息;
以所述目标图像的任意一个角为原点构建目标坐标系;
在所述目标图像的尺寸比例信息满足预设动态调整条件的情况下,根据所述位置信息确定所述主体区域的关键像素点对应的主边坐标和所述主体区域对应的主边长度;所述主边坐标为所述关键像素点在所述目标坐标系沿所述目标图像的主边方向上的坐标,所述主边长度为所述主体区域在所述目标坐标系沿所述主边方向上的长度;所述主边方向为所述目标图像的长边在所述目标坐标系中的方向;
根据所述主边坐标和所述主边长度确定裁剪偏移数据;
基于所述裁剪偏移数据和所述目标裁剪尺寸对所述目标图像进行裁剪,得到裁剪后图像。
可选的,所述基于所述裁剪偏移数据和所述目标裁剪尺寸对所述目标图像进行裁剪,得到裁剪后图像包括:
生成与所述目标裁剪尺寸对应的裁剪框;
将所述裁剪框的中心与所述目标图像的中心对齐;
基于所述裁剪偏移数据,将所述裁剪框沿所述主边方向移动;
将所述目标图像与移动后的裁剪框重叠区域作为所述裁剪后图像。
可选的,所述目标图像的尺寸比例信息包括宽高比或高宽比,所述方法还包括:
根据所述目标裁剪尺寸确定尺寸比例下限阈值;
判断所述目标图像的宽高比是否小于所述尺寸比例下限阈值,或所述目标图像的高宽比是否小于所述尺寸比例下限阈值;
在判断出所述目标图像的宽高比小于所述尺寸比例下限阈值,或所述目标图像的高宽比小于所述尺寸比例下限阈值的情况下,确定所述目标图像的尺寸比例信息满足所述预设动态调整条件。
可选的,所述根据所述主边坐标和所述主边长度确定裁剪偏移数据包括:
计算所述主边坐标与二分之一的所述主体区域对应的主边长度间的第一差值;
将所述第一差值作为所述裁剪偏移数据。
可选的,在所述计算所述主边坐标与二分之一的所述主体区域对应的主边长度间的第一差值之前,所述方法还包括:
获取所述目标图像的主边长度和非主边长度;
根据所述非主边长度和尺寸比例上限阈值,确定所述目标坐标系中沿所述主边方向的上限坐标,所述尺寸比例上限阈值为所述尺寸比例下限阈值的倒数;
根据所述目标图像的主边长度和所述尺寸比例上限阈值,确定所述目标坐标系中沿所述主边方向的下限坐标;
在所述主边坐标在所述上限坐标和所述下限坐标之间,且所述下限坐标大于两倍的所述上限坐标的情况下,判断所述主边坐标是否大于二分之一的所述下限坐标;
在判断出所述主边坐标小于等于二分之一的所述下限坐标的情况下,计算主边坐标与二分之一的所述下限坐标间的第二差值,以及计算所述上限坐标与二分一的所述主体区域对应的主边长度间的第三差值;
将所述第二差值与所述第三差值之间的和,作为所述裁剪偏移数据。
可选的,所述方法还包括:
在判断出所述主边坐标大于二分之一的所述下限坐标的情况下,基于所述目标裁剪尺寸对所述目标图像进行居顶裁剪,得到裁剪后图像。
可选的,所述方法还包括:
在所述主边坐标不在所述上限坐标和所述下限坐标之间或,所述主边坐标在所述上限坐标和所述下限坐标之间且所述下限坐标小于等于两倍的所述上限坐标的情况下,执行所述计算所述主边坐标与二分之一的所述主体区域对应的主边长度间的第一差值的操作。
可选的,所述方法还包括:
当所述目标图像的尺寸比例信息不满足所述预设动态调整条件时,基于所述目标裁剪尺寸对所述目标图像进行居中裁剪,得到裁剪后图像。
可选的,在对所述目标图像进行主体识别,得到所述目标图像的主体区域在所述目标图像中的位置信息之后,所述方法还包括:
根据所述位置信息判断所述主体区域是否触及所述目标图像的四边;
在判断的结果为是的情况下,沿所述主体区域触及的边和所述目标裁剪尺寸对所述目标图像进行裁剪,得到裁剪后图像。
可选的,在所述获取目标图像和目标裁剪尺寸之后,所述方法还包括:
确定所述目标图像的宽度信息和高度信息;
在所述宽度信息大于所述目标裁剪尺寸中的宽度信息,或所述高度信息大于所述目标裁剪尺寸中的高度信息的情况下,执行所述对所述目标图像进行主体识别,得到所述目标图像的主体区域在所述目标图像中的位置信息的操作。
可选的,所述对所述目标图像进行主体识别,得到所述目标图像的主体区域在所述目标图像中的位置信息包括:
将所述目标图像输入主体识别模型,进行主体识别处理,得到所述目标图像的主体区域在所述目标图像中的位置信息;
其中,所述主体识别模型为基于具有主体位置标注信息的样本图像对待训练神经网络进行训练得到的模型。
根据本公开实施例的第二方面,提供一种图像裁剪装置,包括:
信息获取模块,被配置为执行获取目标图像和目标裁剪尺寸;
主体识别模块,被配置为执行对所述目标图像进行主体识别,得到所述目标图像的主体区域在所述目标图像中的位置信息;
目标坐标系构建模块,被配置为执行以所述目标图像的任意一个角为原点构建目标坐标系;
主边信息确定模块,被配置为执行在所述目标图像的尺寸比例信息满足预设动态调整条件的情况下,根据所述位置信息确定所述主体区域的关键像素点对应的主边坐标和所述主体区域对应的主边长度;所述主边坐标为所述关键像素点在所述目标坐标系沿所述目标图像的主边方向上的坐标,所述主边长度为所述主体区域在所述目标坐标系沿所述主边方向上的长度;所述主边方向为所述目标图像的长边在所述目标坐标系中的方向;
裁剪偏移数据确定模块,被配置为执行根据所述主边坐标和所述主边长度确定裁剪偏移数据;
裁剪模块,被配置为执行基于所述裁剪偏移数据和所述目标裁剪尺寸对所述目标图像进行裁剪,得到裁剪后图像。
可选的,所述裁剪模块包括:
裁剪框生成单元,被配置为执行生成与所述目标裁剪尺寸对应的裁剪框;
中心对齐单元,被配置为执行将所述裁剪框的中心与所述目标图像的中心对齐;
裁剪框移动单元,被配置为执行基于所述裁剪偏移数据,将所述裁剪框沿所述主边方向移动;
裁剪后图像确定单元,被配置为执行将所述目标图像与移动后的裁剪框重叠区域作为所述裁剪后图像。
可选的,所述目标图像的尺寸比例信息包括宽高比或高宽比,所述装置还包括:
尺寸比例下限阈值确定模块,被配置为执行根据所述目标裁剪尺寸确定尺寸比例下限阈值;
第一判断模块,被配置为执行判断所述目标图像的宽高比是否小于所述尺寸比例下限阈值,或所述目标图像的高宽比是否小于所述尺寸比例下限阈值;
预设动态调整条件确定模块,被配置为执行在判断出所述目标图像的宽高比小于所述尺寸比例下限阈值,或所述目标图像的高宽比小于所述尺寸比例下限阈值的情况下,确定所述目标图像的尺寸比例信息满足所述预设动态调整条件。
可选的,所述裁剪偏移数据确定模块包括:
第一差值计算单元,被配置为执行计算所述主边坐标与二分之一的所述主体区域对应的主边长度间的第一差值;
第一裁剪偏移数据确定单元,被配置为执行将所述第一差值作为所述裁剪偏移数据。
可选的,所述裁剪偏移数据确定模块还包括:
长度信息获取单元,被配置为执行获取所述目标图像的主边长度和非主边长度;
上限坐标确定单元,被配置为执行根据所述非主边长度和尺寸比例上限阈值,确定所述目标坐标系中沿所述主边方向的上限坐标,所述尺寸比例上限阈值为所述尺寸比例下限阈值的倒数;
下限坐标确定单元,被配置为执行根据所述目标图像的主边长度和所述尺寸比例上限阈值,确定所述目标坐标系中沿所述主边方向的下限坐标;
判断单元,被配置为执行在所述主边坐标在所述上限坐标和所述下限坐标之间,且所述下限坐标大于两倍的所述上限坐标的情况下,判断所述主边坐标是否大于二分之一的所述下限坐标;
第二差值计算单元,被配置为执行在判断出所述主边坐标小于等于二分之一的所述下限坐标的情况下,计算主边坐标与二分之一的所述下限坐标间的第二差值,以及计算所述上限坐标与二分一的所述主体区域对应的主边长度间的第三差值;
第二裁剪偏移数据确定单元,被配置为执行将所述第二差值与所述第三差值之间的和,作为所述裁剪偏移数据。
可选的,所述裁剪偏移数据确定模块还包括:
居顶裁剪单元,被配置为执行在判断出所述主边坐标大于二分之一的所述下限坐标的情况下,基于所述目标裁剪尺寸对所述目标图像进行居顶裁剪,得到裁剪后图像。
可选的,所述第一差值计算单元还被配置为执行在所述主边坐标不在所述上限坐标和所述下限坐标之间或,所述主边坐标在所述上限坐标和所述下限坐标之间且所述下限坐标小于等于两倍的所述上限坐标的情况下,执行所述计算所述主边坐标与二分之一的所述主体区域对应的主边长度间的第一差值的操作。
可选的,所述装置还包括:
居中裁剪模块,被配置为执行当所述目标图像的尺寸比例信息不满足所述预设动态调整条件时,基于所述目标裁剪尺寸对所述目标图像进行居中裁剪,得到裁剪后图像。
可选的,所述装置还包括:
第二判断模块,被配置为执行根据所述位置信息判断所述主体区域是否触及所述目标图像的四边;
第二裁剪模块,被配置为执行在判断的结果为是的情况下,沿所述主体区域触及的边和所述目标裁剪尺寸对所述目标图像进行裁剪,得到裁剪后图像。
可选的,所述装置还包括:
尺寸信息获取模块,被配置为执行确定所述目标图像的宽度信息和高度信息;
所述主体识别还被配置为执行在所述宽度信息大于所述目标裁剪尺寸中的宽度信息,或所述高度信息大于所述目标裁剪尺寸中的高度信息的情况下,执行所述对所述目标图像进行主体识别,得到所述目标图像的主体区域在所述目标图像中的位置信息的操作。
可选的,所述主体识别具体被配置为执行将所述目标图像输入主体识别模型,进行主体识别处理,得到所述目标图像的主体区域在所述目标图像中的位置信息;
其中,所述主体识别模型为基于具有主体位置标注信息的样本图像对待训练神经网络进行训练得到的模型。
根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如上述第一方面中任一项所述的方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行本公开实施例的第一方面中任一所述方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本公开实施例的第一方面中任一所述方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
通过对目标图像进行主体识别,得到目标图像的主体区域在目标图像中的位置信息,并以目标图像的任意一个角为原点构建目标坐标系,在目标图像的尺寸比例信息满足预设动态调整条件的情况下,根据上述位置信息确定主体区域的关键像素点对应的主边坐标和主体区域对应的主边长度,该主边坐标和主边长度可以有效反映目标图像中主体区域的布局情况,并结合主边坐标和主边长度自动快速的确定裁剪偏移数据,可以实现结合目标图像中主体区域的布局情况动态的确定出裁减偏移数据,基于该裁剪偏移数据和目标裁剪尺寸对目标图像进行裁剪,得到的裁剪后图像可以有效保留图像的主体内容,且可以大大提高图像裁剪效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种应用环境的示意图;
图2是根据一示例性实施例示出的一种图像裁剪方法的流程图;
图3是根据一示例性实施例示出的一种目标坐标系的示意图;
图4是根据一示例性实施例示出的一种在目标坐标系中确定主边坐标和主边长度的示意图;
图5是根据一示例性实施例示出的一种根据主边坐标和主边长度确定裁剪偏移数据的流程图;
图6是根据一示例性实施例示出的一种根据主边坐标和主边长度确定裁剪偏移数据的流程图;
图7是根据一示例性实施例示出的一种基于裁剪偏移数据和目标裁剪尺寸对目标图像进行裁剪,得到裁剪后图像的流程图;
图8是根据一示例性实施例示出的一种图像裁剪装置框图;
图9是根据一示例性实施例示出的一种用于图像裁剪的电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
请参阅图1,图1是根据一示例性实施例示出的一种应用环境的示意图,如图1所示,该应用环境可以包括服务器01和终端02。
在一个可选的实施例中,服务器01可以用于动态确定裁剪偏移数据,并将目标裁剪尺寸和确定出的裁剪偏移数据发送给终端02。具体的,服务器01可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
在一个可选的实施例中,终端02可以结合服务器01发送的目标裁剪尺寸和确定出的裁剪偏移数据对目标图像进行裁剪。可选的,可以为用户提供图像裁剪的效果反馈渠道,以便结合实际情况更新图像裁剪策略,以更好的保留图像主体内容。具体的,终端02可以包括但不限于智能手机、台式计算机、平板电脑、笔记本电脑、智能音箱、数字助理、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、智能可穿戴设备等类型的电子设备。可选的,电子设备上运行的操作系统可以包括但不限于安卓系统、IOS系统、linux、windows等。
此外,需要说明的是,图1所示的仅仅是本公开提供的一种应用环境,在实际应用中,还可以包括其他应用环境,例如可以由服务器01结合目标裁剪尺寸和确定出的裁剪偏移数据对目标图像进行裁剪。
本说明书实施例中,上述服务器01以及终端02可以通过有线或无线通信方式进行直接或间接地连接,本公开在此不做限制。
图2是根据一示例性实施例示出的一种图像裁剪方法的流程图,如图2所示,该图像裁剪方法用于服务器、终端、边缘计算节点等电子设备中,具体的,可以包括以下步骤。
在步骤S201中,获取目标图像和目标裁剪尺寸。
本说明书实施例中,目标图像可以为任意图像;在一个具体应用场景中,目标图像可以为需要展示的视频封面图像。具体的,目标裁剪尺寸可以为裁剪后图像的尺寸信息,具体的,该尺寸信息可以包括宽度信息和高度信息。
在一个可选的实施例中,为了保证裁剪后图像的效果,对于需要横屏展示的图像(裁剪后图像)可以选取宽大于高的图像作为原始的目标图像;反之,对于需要竖屏展示的图像可以选取宽小于高的图像作为原始的目标图像。相应的,目标图像可以为尺寸信息对应展示方式与目标裁剪尺寸对应展示方式一致的图像。具体的,展示方式可以包括横屏展示和竖屏展示。其中,在图像的尺寸信息指示该图像的宽小于高时,该尺寸信息对应的展示方式为竖屏展示;在图像的尺寸信息指示该图像的宽大于高时,该尺寸信息对应的展示方式为横屏展示。
在一个可选的实施例中,在获取目标图像和目标裁剪尺寸之后,上述方法还包括:
确定目标图像的宽度信息和高度信息;
在宽度信息大于目标裁剪尺寸中的宽度信息,或高度信息大于目标裁剪尺寸中的高度信息的情况下,执行步骤S203。
在实际应用中,在目标图像较大的情况下,才会需要对目标图像进行裁剪,相应的,可以通过对目标图像的尺寸信息(宽度信息和高度信息)与目标裁剪尺寸的比较,确定合理确定是否需要对目标图像进行裁剪。
在步骤S203中,对目标图像进行主体识别,得到目标图像的主体区域在目标图像中的位置信息。
在一个具体的实施例中,目标图像的主体区域可以为目标图像的主要内容所在的区域,具体的,该主要内容可以为文本信息,也可以为人脸等图像信息。在一个可选的实施例中,目标图像中的主要内容可以对应一个连通区域或至少两个连通区域,相应的,在目标图像中的主要内容对应至少两个连通区域的情况下,可以将上述至少两个连通区域的最小外界矩形框形成的区域作为目标图像的主体区域。
在一个具体的实施例中,可以结合预先训练好的主体识别模型,对目标图像进行主体识别,相应的,可以将目标图像输入主体识别模型,进行主体识别处理,得到目标图像的主体区域在目标图像中的位置信息。
在一个具体的实施例中,主体识别模型可以为基于具有主体位置标注信息的样本图像对待训练神经网络进行训练得到的模型。具体的,可以将样本图像输入待训练神经网络进行主体识别,得到样本图像的主体区域在样本图像的预测位置信息;计算预测位置信息与主体位置标注信息间的损失信息,基于损失信息训练待训练神经网络,得到主体识别模型。具体的,这里的主体位置标注信息可以为标注的样本图像的主体区域在样本图像的位置信息。
在一个具体的实施例中,目标图像的主体区域在目标图像中的位置信息可以为主体区域与目标图像的相对位置信息。在实际应用中,待训练神经网络在训练过程中,会识别目标图像的主体区域和主体区域的中心位置(该中心位置对应的像素点可以作为主体区域的关键像素点);确定目标图像的主体区域的长度信息和宽度信息,并基于主体区域的长度信息和宽度信息确定主体区域占据目标图像的长宽比例,基于该长宽比例和主体区域的关键像素点就可以确定目标图像的主体区域在目标图像中的位置信息。
在一个可选的实施例中,在对目标图像进行主体识别,得到目标图像的主体区域在目标图像中的位置信息之后,上述方法还包括:
根据位置信息判断主体区域是否触及目标图像的四边;
在判断的结果为是的情况下,沿主体区域触及的边和目标裁剪尺寸对目标图像进行裁剪,得到裁剪后图像。
在实际应用中,若目标图像的主体区域触及目标图像的任意一边的情况下,可以直接沿主体区域触及的边和目标裁剪尺寸对目标图像进行裁剪。在一个具体的实施例中,例如主体区域直接触及目标图像的顶部,可以居顶裁剪出目标裁剪尺寸的图像作为裁剪后图像。在一个具体的实施例中,例如主体区域直接触及目标图像的顶部和左部,可以沿着目标图像的顶边和左边,裁剪出目标裁剪尺寸的图像作为裁剪后图像。
上述实施例中,在目标图像的主题区域触及目标图像的四边的情况下,直接沿主体区域触及的边进行裁剪,可以有效保留主体区域,进而使裁剪后图像更好的反映目标图像的主体内容。
在步骤S205中,以目标图像的任意一个角为原点构建目标坐标系。
在一个可选的实施例中,为了精准的掌握目标图像中主体区域的布局情况,可以以目标图像的任意一个角为原点构建目标坐标系。在一个具体的实施例中,如图3所示,图3中100为目标图像,假设以目标图像100的左上角为原点,相应的,以目标图像100的宽为x轴,目标图像100的高为y轴,形成目标坐标系。
在步骤S207中,在目标图像的尺寸比例信息满足预设动态调整条件的情况下,根据位置信息确定主体区域的关键像素点对应的主边坐标和主体区域对应的主边长度。
在一个具体的实施例中,目标图像的尺寸比例信息满足预设动态调整条件可以表征目标图像的尺寸比例信息与目标裁剪尺寸对应的尺寸比例信息间的差异较大;反之,目标图像的尺寸比例信息不满足预设动态调整条件可以表征目标图像的尺寸比例信息与目标裁剪尺寸对应的尺寸比例信息间的差异较小。
在一个可选的实施例中,上述方法还可以包括:
当目标图像的尺寸比例信息不满足预设动态调整条件时,基于目标裁剪尺寸对目标图像进行居中裁剪,得到裁剪后图像。
在实际应用中,图像的主体区域往往在该图像的居中位置;相应的,在目标图像的尺寸比例信息与目标裁剪尺寸对应的尺寸比例信息间的差异较小的情况下,可以直接基于目标裁剪尺寸对目标图像进行居中裁剪,得到裁剪后图像。
在一个具体的实施例中,当目标图像的宽小于高时,即目标图像适合竖屏展示的情况下,目标图像的尺寸比例信息可以包括宽高比;当目标图像的宽大于高时,即目标图像适合横屏展示的情况下,目标图像的尺寸比例信息可以包括高宽比。在一个具体的实施例中,目标图像的尺寸比例信息满足预设动态调整条件可以包括目标图像的宽高比小于尺寸比例下限阈值,或目标图像的高宽比小于尺寸比例下限阈值。相应的,上述方法还可以包括:
根据目标裁剪尺寸确定尺寸比例下限阈值。
判断目标图像的宽高比是否小于尺寸比例下限阈值,或目标图像的高宽比是否小于尺寸比例下限阈值;
在判断出目标图像的宽高比小于尺寸比例下限阈值,或目标图像的高宽比小于尺寸比例下限阈值的情况下,确定目标图像的尺寸比例信息满足预设动态调整条件;
在判断出目标图像的宽高比大于等于尺寸比例下限阈值,或目标图像的高宽比大于等于尺寸比例下限阈值的情况下,确定目标图像的尺寸比例信息不满足预设动态调整条件。
在一个具体的实施例中,如果目标裁剪尺寸对应的是竖屏的尺寸(即宽小于高),可以将目标裁剪尺寸对应的宽高比作为尺寸比例下限阈值;如果目标裁剪尺寸对应的是横屏的尺寸(即宽大于高),可以将目标裁剪尺寸对应的高宽比作为尺寸比例下限阈值。
上述实施例中,在判断出目标图像的宽高比小于尺寸比例下限阈值,或目标图像的高宽比小于尺寸比例下限阈值的情况下,可以确定目标图像的尺寸比例信息与目标裁剪尺寸对应的尺寸比例信息间的差异较大(目标图像的尺寸比例信息满足预设动态调整条件)的情况下,可以结合目标图像中主图区域的布局来裁剪。
在一个具体的实施例中,上述主边坐标为主体区域的关键像素点在目标坐标系沿目标图像的主边方向上的坐标,上述主边长度为主体区域在目标坐标系沿主边方向上的长度;上述主边方向可以为目标图像的长边在目标坐标系中的方向;
在一个具体的实施例中,结合图4所示,100为目标图像,200为目标图像的主体区域,201为主体区域的关键像素点,202为主体区域的与目标图像的长边平行的边;目标坐标系中的目标图像100的高大于宽,相应的,高所在的y轴方向为主边方向,主体区域的关键像素点对应的主边坐标为y1,主体区域对应的主边长度为y3-y2。
在步骤S209中,根据主边坐标和主边长度确定裁剪偏移数据。
在一个具体的实施例中,裁减偏移数据可以表征用于裁减目标图像的裁剪框的中心与目标图像的中心沿主边方向的偏移量;具体的,裁减框的尺寸为目标裁剪尺寸。
在一个具体的实施例中,如图5所示,根据主边坐标和主边长度确定裁剪偏移数据可以包括以下步骤:
在步骤S501中,计算主边坐标与二分之一的主边长度间的第一差值;
在步骤S503中,将第一差值作为裁剪偏移数据。
上述实施例中,将主边坐标与二分之一的主边长度间的第一差值作为裁减偏移数据,可以使得裁剪后图像的中心与目标图像的主体区域的关键像素点在主边侧对齐,进而可以更好的保留主体区域。
在实际应用中,竖屏场景下拍摄的目标图像中,存在一些主体区域中有人物图像,由于人物图像中人脸区域往往是较重要的主体内容部分,且人脸区域靠主体区域的较上部分,相应的,为了更好的突出主体内容。在一个可选的实施例中,如图7所示,在计算主边坐标与二分之一的主边长度间的第一差值之前,上述根据主边坐标和主边长度确定裁剪偏移数据还可以包括以下步骤:
在步骤S505中,获取目标图像的主边长度和非主边长度。
在一个具体的实施例中,可以比较目标图像的宽度信息和高度信息,得到比较结果;根据比较结果确定目标图像的主边长度和非主边长度;具体的,可以将较长的边作为主边,相应的,若比较结果为宽度信息大于高度信息,可以将宽度信息作为主边长度,高度信息作为非主边长度;若比较结果为宽度信息小于高度信息,可以将高度信息作为主边长度,宽度信息作为非主边长度。
在步骤S507中,根据非主边长度和尺寸比例上限阈值,确定目标坐标系中沿主边方向的上限坐标,该尺寸比例上限阈值为尺寸比例下限阈值的倒数。
本说明书实施例中,上限坐标可以为图像裁剪的上边界所对应主边方向上的坐标;在一个具体的实施例中,根据非主边长度和尺寸比例上限阈值,确定目标坐标系中沿主边方向的上限坐标可以结合下述公式:
curMin = L2 * ratioMax / 2
其中,curMin表示上限坐标,L2表示非主边长度,ratioMax表示尺寸比例上限阈值。
在步骤S509中,根据目标图像的主边长度和尺寸比例上限阈值,确定目标坐标系中沿主边方向的下限坐标;
本说明书实施例中,下限坐标可以为图像裁剪的下边界所对应主边方向上的坐标;在一个具体的实施例中,根据目标图像的主边长度和尺寸比例上限阈值,确定目标坐标系中沿主边方向的下限坐标可以结合下述公式:
curMain = L1 * ratioMax / 2
其中,curMain 表示下限坐标,L1表示主边长度,ratioMax表示尺寸比例上限阈值。
在步骤S511中,在主边坐标在上限坐标和下限坐标之间,且下限坐标大于两倍的上限坐标的情况下,判断主边坐标是否大于二分之一的下限坐标。
在步骤S513中,在判断出主边坐标小于等于二分之一的下限坐标的情况下,计算主边坐标与二分之一的下限坐标间的第二差值,以及计算上限坐标与二分一的主体区域对应的主边长度间的第三差值。
在实际应用中,在主边坐标在上限坐标和下限坐标之间,且下限坐标大于两倍的上限坐标,且判断出主边坐标小于等于二分之一的下限坐标的情况下,可以确定主体内容在上下边界间,且可以裁剪下边界下面的区域。
在步骤S515中,将第二差值与第三差值之间的和,作为裁剪偏移数据。
在一个可选的实施例中,如图6所示,上述根据主边坐标和主边长度确定裁剪偏移数据还可以包括以下步骤:
在步骤S517中,在判断出主边坐标大于二分之一的下限坐标的情况下,基于目标裁剪尺寸对目标图像进行居顶裁剪,得到裁剪后图像。
在实际应用中,在判断出主边坐标大于二分之一的下限坐标的情况下,可以确定主体内容相对靠顶部,可以居顶裁剪。
在一个可选的实施例中,如图6所示,在主边坐标不在上限坐标和下限坐标之间或,主边坐标在上限坐标和下限坐标之间且下限坐标小于等于两倍的上限坐标的情况下,执行步骤S501。
在步骤S211中,基于裁剪偏移数据和目标裁剪尺寸对目标图像进行裁剪,得到裁剪后图像。
在一个可选的实施例中,如图7所示,基于裁剪偏移数据和目标裁剪尺寸对目标图像进行裁剪,得到裁剪后图像可以包括以下步骤:
在步骤S701中,生成与目标裁剪尺寸对应的裁剪框;
在步骤S703中,将裁剪框的中心与目标图像的中心对齐;
在步骤S705中,基于裁剪偏移数据,将裁剪框沿主边方向移动;
在步骤S707中,将目标图像与移动后的裁剪框重叠区域作为裁剪后图像。
在一个具体的实施例中,裁剪框的尺寸为目标裁剪尺寸。在一个具体的实施例中,假设生成裁剪偏移数据时构建的目标坐标系的原点为目标图像的上边两个点,且目标图像的主边为高;相应的,若裁剪偏移数据大于0,裁剪框可以往上移动该裁剪偏移数据对应的偏移量;反之,若裁剪偏移数据小于0,裁剪框可以往下移动该裁剪偏移数据对应的偏移量。
由以上本说明书实施例提供的技术方案可见,本说明书通过对目标图像进行主体识别,得到目标图像的主体区域在目标图像中的位置信息,并以目标图像的任意一个角为原点构建目标坐标系,在目标图像的尺寸比例信息满足预设动态调整条件的情况下,根据上述位置信息确定主体区域的关键像素点对应的主边坐标和主体区域对应的主边长度,该主边坐标和主边长度可以有效反映目标图像中主体区域的布局情况,并结合主边坐标和主边长度自动快速的确定裁剪偏移数据,可以实现结合目标图像中主体区域的布局情况动态的确定出裁减偏移数据,基于该裁剪偏移数据和目标裁剪尺寸对目标图像进行裁剪,得到的裁剪后图像可以有效保留图像的主体内容,且可以大大提高图像裁剪效率。
图8是根据一示例性实施例示出的一种图像裁剪装置框图。参照图8,该装置包括:
信息获取模块810,可以被配置为执行获取目标图像和目标裁剪尺寸;
主体识别模块820,可以被配置为执行对所述目标图像进行主体识别,得到所述目标图像的主体区域在所述目标图像中的位置信息;
目标坐标系构建模块830,可以被配置为执行以所述目标图像的任意一个角为原点构建目标坐标系;
主边信息确定模块840,可以被配置为执行在所述目标图像的尺寸比例信息满足预设动态调整条件的情况下,根据所述位置信息确定所述主体区域的关键像素点对应的主边坐标和所述主体区域对应的主边长度;所述主边坐标为所述关键像素点在所述目标坐标系沿所述目标图像的主边方向上的坐标,所述主边长度为所述主体区域在所述目标坐标系沿所述主边方向上的长度;所述主边方向为所述目标图像的长边在所述目标坐标系中的方向;
裁剪偏移数据确定模块850,可以被配置为执行根据所述主边坐标和所述主边长度确定裁剪偏移数据;
裁剪模块860,可以被配置为执行基于所述裁剪偏移数据和所述目标裁剪尺寸对所述目标图像进行裁剪,得到裁剪后图像。
可选的,所述裁剪模块860包括:
裁剪框生成单元,被配置为执行生成与所述目标裁剪尺寸对应的裁剪框;
中心对齐单元,被配置为执行将所述裁剪框的中心与所述目标图像的中心对齐;
裁剪框移动单元,被配置为执行基于所述裁剪偏移数据,将所述裁剪框沿所述主边方向移动;
裁剪后图像确定单元,被配置为执行将所述目标图像与移动后的裁剪框重叠区域作为所述裁剪后图像。
可选的,所述目标图像的尺寸比例信息包括宽高比或高宽比,所述装置还包括:
尺寸比例下限阈值确定模块,被配置为执行根据所述目标裁剪尺寸确定尺寸比例下限阈值;
第一判断模块,被配置为执行判断所述目标图像的宽高比是否小于所述尺寸比例下限阈值,或所述目标图像的高宽比是否小于所述尺寸比例下限阈值;
预设动态调整条件确定模块,被配置为执行在判断出所述目标图像的宽高比小于所述尺寸比例下限阈值,或所述目标图像的高宽比小于所述尺寸比例下限阈值的情况下,确定所述目标图像的尺寸比例信息满足所述预设动态调整条件。
可选的,所述裁剪偏移数据确定模块850包括:
第一差值计算单元,被配置为执行计算所述主边坐标与二分之一的所述主体区域对应的主边长度间的第一差值;
第一裁剪偏移数据确定单元,被配置为执行将所述第一差值作为所述裁剪偏移数据。
可选的,所述裁剪偏移数据确定模块850还包括:
长度信息获取单元,被配置为执行获取所述目标图像的主边长度和非主边长度;
上限坐标确定单元,被配置为执行根据所述非主边长度和尺寸比例上限阈值,确定所述目标坐标系中沿所述主边方向的上限坐标,所述尺寸比例上限阈值为所述尺寸比例下限阈值的倒数;
下限坐标确定单元,被配置为执行根据所述目标图像的主边长度和所述尺寸比例上限阈值,确定所述目标坐标系中沿所述主边方向的下限坐标;
判断单元,被配置为执行在所述主边坐标在所述上限坐标和所述下限坐标之间,且所述下限坐标大于两倍的所述上限坐标的情况下,判断所述主边坐标是否大于二分之一的所述下限坐标;
第二差值计算单元,被配置为执行在判断出所述主边坐标小于等于二分之一的所述下限坐标的情况下,计算主边坐标与二分之一的所述下限坐标间的第二差值,以及计算所述上限坐标与二分一的所述主体区域对应的主边长度间的第三差值;
第二裁剪偏移数据确定单元,被配置为执行将所述第二差值与所述第三差值之间的和,作为所述裁剪偏移数据。
可选的,所述裁剪偏移数据确定模块850还包括:
居顶裁剪单元,被配置为执行在判断出所述主边坐标大于二分之一的所述下限坐标的情况下,基于所述目标裁剪尺寸对所述目标图像进行居顶裁剪,得到裁剪后图像。
可选的,所述第一差值计算单元还被配置为执行在所述主边坐标不在所述上限坐标和所述下限坐标之间或,所述主边坐标在所述上限坐标和所述下限坐标之间且所述下限坐标小于等于两倍的所述上限坐标的情况下,执行所述计算所述主边坐标与二分之一的所述主体区域对应的主边长度间的第一差值的操作。
可选的,所述装置还包括:
居中裁剪模块,被配置为执行当所述目标图像的尺寸比例信息不满足所述预设动态调整条件时,基于所述目标裁剪尺寸对所述目标图像进行居中裁剪,得到裁剪后图像。
可选的,所述装置还包括:
第二判断模块,被配置为执行根据所述位置信息判断所述主体区域是否触及所述目标图像的四边;
第二裁剪模块,被配置为执行在判断的结果为是的情况下,沿所述主体区域触及的边和所述目标裁剪尺寸对所述目标图像进行裁剪,得到裁剪后图像。
可选的,所述装置还包括:
尺寸信息获取模块,被配置为执行确定所述目标图像的宽度信息和高度信息;
所述主体识别还被配置为执行在所述宽度信息大于所述目标裁剪尺寸中的宽度信息,或所述高度信息大于所述目标裁剪尺寸中的高度信息的情况下,执行所述对所述目标图像进行主体识别,得到所述目标图像的主体区域在所述目标图像中的位置信息的操作。
可选的,所述主体识别具体被配置为执行将所述目标图像输入主体识别模型,进行主体识别处理,得到所述目标图像的主体区域在所述目标图像中的位置信息;
其中,所述主体识别模型为基于具有主体位置标注信息的样本图像对待训练神经网络进行训练得到的模型。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图9是根据一示例性实施例示出的一种用于图像裁剪的电子设备的框图,该电子设备可以是终端,其内部结构图可以如图9所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像裁剪方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在示例性实施例中,还提供了一种电子设备,包括:处理器;用于存储该处理器可执行指令的存储器;其中,该处理器被配置为执行该指令,以实现如本公开实施例中的图像裁剪方法。
在示例性实施例中,还提供了一种计算机可读存储介质,当该存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行本公开实施例中的图像裁剪方法。
在示例性实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行本公开实施例中的图像裁剪方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本公开所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可 包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (25)
1.一种图像裁剪方法,其特征在于,包括:
获取目标图像和目标裁剪尺寸;
对所述目标图像进行主体识别,得到所述目标图像的主体区域在所述目标图像中的位置信息;
以所述目标图像的任意一个角为原点构建目标坐标系;
在所述目标图像的尺寸比例信息满足预设动态调整条件的情况下,根据所述位置信息确定所述主体区域的关键像素点对应的主边坐标和所述主体区域对应的主边长度;所述主边坐标为所述关键像素点在所述目标坐标系沿所述目标图像的主边方向上的坐标,所述主边长度为所述主体区域在所述目标坐标系沿所述主边方向上的长度;所述主边方向为所述目标图像的长边在所述目标坐标系中的方向;
根据所述主边坐标和所述主边长度确定裁剪偏移数据;
基于所述裁剪偏移数据和所述目标裁剪尺寸对所述目标图像进行裁剪,得到裁剪后图像。
2.根据权利要求1所述的图像裁剪方法,其特征在于,所述基于所述裁剪偏移数据和所述目标裁剪尺寸对所述目标图像进行裁剪,得到裁剪后图像包括:
生成与所述目标裁剪尺寸对应的裁剪框;
将所述裁剪框的中心与所述目标图像的中心对齐;
基于所述裁剪偏移数据,将所述裁剪框沿所述主边方向移动;
将所述目标图像与移动后的裁剪框重叠区域作为所述裁剪后图像。
3.根据权利要求1所述的图像裁剪方法,其特征在于,所述目标图像的尺寸比例信息包括宽高比或高宽比,所述方法还包括:
根据所述目标裁剪尺寸确定尺寸比例下限阈值;
判断所述目标图像的宽高比是否小于所述尺寸比例下限阈值,或所述目标图像的高宽比是否小于所述尺寸比例下限阈值;
在判断出所述目标图像的宽高比小于所述尺寸比例下限阈值,或所述目标图像的高宽比小于所述尺寸比例下限阈值的情况下,确定所述目标图像的尺寸比例信息满足所述预设动态调整条件。
4.根据权利要求3所述的图像裁剪方法,其特征在于,所述根据所述主边坐标和所述主边长度确定裁剪偏移数据包括:
计算所述主边坐标与二分之一的所述主体区域对应的主边长度间的第一差值;
将所述第一差值作为所述裁剪偏移数据。
5.根据权利要求4所述的图像裁剪方法,其特征在于,在所述计算所述主边坐标与二分之一的所述主体区域对应的主边长度间的第一差值之前,所述方法还包括:
获取所述目标图像的主边长度和非主边长度;
根据所述非主边长度和尺寸比例上限阈值,确定所述目标坐标系中沿所述主边方向的上限坐标,所述尺寸比例上限阈值为所述尺寸比例下限阈值的倒数;
根据所述目标图像的主边长度和所述尺寸比例上限阈值,确定所述目标坐标系中沿所述主边方向的下限坐标;
在所述主边坐标在所述上限坐标和所述下限坐标之间,且所述下限坐标大于两倍的所述上限坐标的情况下,判断所述主边坐标是否大于二分之一的所述下限坐标;
在判断出所述主边坐标小于等于二分之一的所述下限坐标的情况下,计算主边坐标与二分之一的所述下限坐标间的第二差值,以及计算所述上限坐标与二分一的所述主体区域对应的主边长度间的第三差值;
将所述第二差值与所述第三差值之间的和,作为所述裁剪偏移数据。
6.根据权利要求5所述的图像裁剪方法,其特征在于,所述方法还包括:
在判断出所述主边坐标大于二分之一的所述下限坐标的情况下,基于所述目标裁剪尺寸对所述目标图像进行居顶裁剪,得到裁剪后图像。
7.根据权利要求5所述的图像裁剪方法,其特征在于,所述方法还包括:
在所述主边坐标不在所述上限坐标和所述下限坐标之间或,所述主边坐标在所述上限坐标和所述下限坐标之间且所述下限坐标小于等于两倍的所述上限坐标的情况下,执行所述计算所述主边坐标与二分之一的所述主体区域对应的主边长度间的第一差值的操作。
8.根据权利要求1至7任一所述的图像裁剪方法,其特征在于,所述方法还包括:
当所述目标图像的尺寸比例信息不满足所述预设动态调整条件时,基于所述目标裁剪尺寸对所述目标图像进行居中裁剪,得到裁剪后图像。
9.根据权利要求1至7任一所述的图像裁剪方法,其特征在于,在对所述目标图像进行主体识别,得到所述目标图像的主体区域在所述目标图像中的位置信息之后,所述方法还包括:
根据所述位置信息判断所述主体区域是否触及所述目标图像的四边;
在判断的结果为是的情况下,沿所述主体区域触及的边和所述目标裁剪尺寸对所述目标图像进行裁剪,得到裁剪后图像。
10.根据权利要求1至7任一所述的图像裁剪方法,其特征在于,在所述获取目标图像和目标裁剪尺寸之后,所述方法还包括:
确定所述目标图像的宽度信息和高度信息;
在所述宽度信息大于所述目标裁剪尺寸中的宽度信息,或所述高度信息大于所述目标裁剪尺寸中的高度信息的情况下,执行所述对所述目标图像进行主体识别,得到所述目标图像的主体区域在所述目标图像中的位置信息的操作。
11.根据权利要求1至7任一所述的图像裁剪方法,其特征在于,所述对所述目标图像进行主体识别,得到所述目标图像的主体区域在所述目标图像中的位置信息包括:
将所述目标图像输入主体识别模型,进行主体识别处理,得到所述目标图像的主体区域在所述目标图像中的位置信息;
其中,所述主体识别模型为基于具有主体位置标注信息的样本图像对待训练神经网络进行训练得到的模型。
12.一种图像裁剪装置,其特征在于,包括:
信息获取模块,被配置为执行获取目标图像和目标裁剪尺寸;
主体识别模块,被配置为执行对所述目标图像进行主体识别,得到所述目标图像的主体区域在所述目标图像中的位置信息;
目标坐标系构建模块,被配置为执行以所述目标图像的任意一个角为原点构建目标坐标系;
主边信息确定模块,被配置为执行在所述目标图像的尺寸比例信息满足预设动态调整条件的情况下,根据所述位置信息确定所述主体区域的关键像素点对应的主边坐标和所述主体区域对应的主边长度;所述主边坐标为所述关键像素点在所述目标坐标系沿所述目标图像的主边方向上的坐标,所述主边长度为所述主体区域在所述目标坐标系沿所述主边方向上的长度;所述主边方向为所述目标图像的长边在所述目标坐标系中的方向;
裁剪偏移数据确定模块,被配置为执行根据所述主边坐标和所述主边长度确定裁剪偏移数据;
裁剪模块,被配置为执行基于所述裁剪偏移数据和所述目标裁剪尺寸对所述目标图像进行裁剪,得到裁剪后图像。
13.根据权利要求12所述的图像裁剪装置,其特征在于,所述裁剪模块包括:
裁剪框生成单元,被配置为执行生成与所述目标裁剪尺寸对应的裁剪框;
中心对齐单元,被配置为执行将所述裁剪框的中心与所述目标图像的中心对齐;
裁剪框移动单元,被配置为执行基于所述裁剪偏移数据,将所述裁剪框沿所述主边方向移动;
裁剪后图像确定单元,被配置为执行将所述目标图像与移动后的裁剪框重叠区域作为所述裁剪后图像。
14.根据权利要求12所述的图像裁剪装置,其特征在于,所述目标图像的尺寸比例信息包括宽高比或高宽比,所述装置还包括:
尺寸比例下限阈值确定模块,被配置为执行根据所述目标裁剪尺寸确定尺寸比例下限阈值;
第一判断模块,被配置为执行判断所述目标图像的宽高比是否小于所述尺寸比例下限阈值,或所述目标图像的高宽比是否小于所述尺寸比例下限阈值;
预设动态调整条件确定模块,被配置为执行在判断出所述目标图像的宽高比小于所述尺寸比例下限阈值,或所述目标图像的高宽比小于所述尺寸比例下限阈值的情况下,确定所述目标图像的尺寸比例信息满足所述预设动态调整条件。
15.根据权利要求14所述的图像裁剪装置,其特征在于,所述裁剪偏移数据确定模块包括:
第一差值计算单元,被配置为执行计算所述主边坐标与二分之一的所述主体区域对应的主边长度间的第一差值;
第一裁剪偏移数据确定单元,被配置为执行将所述第一差值作为所述裁剪偏移数据。
16.根据权利要求15所述的图像裁剪装置,其特征在于,所述裁剪偏移数据确定模块还包括:
长度信息获取单元,被配置为执行获取所述目标图像的主边长度和非主边长度;
上限坐标确定单元,被配置为执行根据所述非主边长度和尺寸比例上限阈值,确定所述目标坐标系中沿所述主边方向的上限坐标,所述尺寸比例上限阈值为所述尺寸比例下限阈值的倒数;
下限坐标确定单元,被配置为执行根据所述目标图像的主边长度和所述尺寸比例上限阈值,确定所述目标坐标系中沿所述主边方向的下限坐标;
判断单元,被配置为执行在所述主边坐标在所述上限坐标和所述下限坐标之间,且所述下限坐标大于两倍的所述上限坐标的情况下,判断所述主边坐标是否大于二分之一的所述下限坐标;
第二差值计算单元,被配置为执行在判断出所述主边坐标小于等于二分之一的所述下限坐标的情况下,计算主边坐标与二分之一的所述下限坐标间的第二差值,以及计算所述上限坐标与二分一的所述主体区域对应的主边长度间的第三差值;
第二裁剪偏移数据确定单元,被配置为执行将所述第二差值与所述第三差值之间的和,作为所述裁剪偏移数据。
17.根据权利要求16所述的图像裁剪装置,其特征在于,所述裁剪偏移数据确定模块还包括:
居顶裁剪单元,被配置为执行在判断出所述主边坐标大于二分之一的所述下限坐标的情况下,基于所述目标裁剪尺寸对所述目标图像进行居顶裁剪,得到裁剪后图像。
18.根据权利要求16所述的图像裁剪装置,其特征在于,所述第一差值计算单元还被配置为执行在所述主边坐标不在所述上限坐标和所述下限坐标之间或,所述主边坐标在所述上限坐标和所述下限坐标之间且所述下限坐标小于等于两倍的所述上限坐标的情况下,执行所述计算所述主边坐标与二分之一的所述主体区域对应的主边长度间的第一差值的操作。
19.根据权利要求12至18任一所述的图像裁剪装置,其特征在于,所述装置还包括:
居中裁剪模块,被配置为执行当所述目标图像的尺寸比例信息不满足所述预设动态调整条件时,基于所述目标裁剪尺寸对所述目标图像进行居中裁剪,得到裁剪后图像。
20.根据权利要求12至18任一所述的图像裁剪装置,其特征在于,所述装置还包括:
第二判断模块,被配置为执行根据所述位置信息判断所述主体区域是否触及所述目标图像的四边;
第二裁剪模块,被配置为执行在判断的结果为是的情况下,沿所述主体区域触及的边和所述目标裁剪尺寸对所述目标图像进行裁剪,得到裁剪后图像。
21.根据权利要求12至18任一所述的图像裁剪装置,其特征在于,所述装置还包括:
尺寸信息获取模块,被配置为执行确定所述目标图像的宽度信息和高度信息;
所述主体识别还被配置为执行在所述宽度信息大于所述目标裁剪尺寸中的宽度信息,或所述高度信息大于所述目标裁剪尺寸中的高度信息的情况下,执行所述对所述目标图像进行主体识别,得到所述目标图像的主体区域在所述目标图像中的位置信息的操作。
22.根据权利要求12至18任一所述的图像裁剪装置,其特征在于,所述主体识别具体被配置为执行将所述目标图像输入主体识别模型,进行主体识别处理,得到所述目标图像的主体区域在所述目标图像中的位置信息;
其中,所述主体识别模型为基于具有主体位置标注信息的样本图像对待训练神经网络进行训练得到的模型。
23.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至11中任一项所述的图像裁剪方法。
24.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得图像裁剪设备能够执行如权利要求1至11中任一项所述的图像裁剪方法。
25.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的图像裁剪方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011581046.9A CN112700454B (zh) | 2020-12-28 | 2020-12-28 | 图像裁剪方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011581046.9A CN112700454B (zh) | 2020-12-28 | 2020-12-28 | 图像裁剪方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112700454A CN112700454A (zh) | 2021-04-23 |
CN112700454B true CN112700454B (zh) | 2024-05-14 |
Family
ID=75511278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011581046.9A Active CN112700454B (zh) | 2020-12-28 | 2020-12-28 | 图像裁剪方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112700454B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113763242A (zh) * | 2021-05-17 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置及计算机可读存储介质 |
CN113538460B (zh) * | 2021-07-12 | 2022-04-08 | 中国科学院地质与地球物理研究所 | 一种页岩ct图像裁剪方法及系统 |
CN113691731B (zh) * | 2021-09-07 | 2023-06-23 | 联想(北京)有限公司 | 一种处理方法、装置和电子设备 |
CN114727117A (zh) * | 2022-03-04 | 2022-07-08 | 上海深至信息科技有限公司 | 一种超声扫查视频的打包方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108520247A (zh) * | 2018-04-16 | 2018-09-11 | 腾讯科技(深圳)有限公司 | 对图像中的对象节点的识别方法、装置、终端及可读介质 |
CN108776970A (zh) * | 2018-06-12 | 2018-11-09 | 北京字节跳动网络技术有限公司 | 图像处理方法和装置 |
CN109146892A (zh) * | 2018-07-23 | 2019-01-04 | 北京邮电大学 | 一种基于美学的图像裁剪方法及装置 |
CN109344806A (zh) * | 2018-10-31 | 2019-02-15 | 第四范式(北京)技术有限公司 | 利用多任务目标检测模型执行目标检测的方法和系统 |
CN110706150A (zh) * | 2019-07-12 | 2020-01-17 | 北京达佳互联信息技术有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN110796048A (zh) * | 2019-10-18 | 2020-02-14 | 武汉大学 | 一种基于深度神经网络的船舰目标实时检测方法 |
CN111144426A (zh) * | 2019-12-28 | 2020-05-12 | 广东拓斯达科技股份有限公司 | 一种分拣方法、装置、设备和存储介质 |
CN111340028A (zh) * | 2020-05-18 | 2020-06-26 | 创新奇智(北京)科技有限公司 | 一种文本定位方法、装置、电子设备及存储介质 |
CN111667487A (zh) * | 2020-04-29 | 2020-09-15 | 平安科技(深圳)有限公司 | 一种图片裁剪方法、装置及计算机设备 |
CN112132836A (zh) * | 2020-08-14 | 2020-12-25 | 咪咕文化科技有限公司 | 视频图像裁剪方法、装置、电子设备及存储介质 |
-
2020
- 2020-12-28 CN CN202011581046.9A patent/CN112700454B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108520247A (zh) * | 2018-04-16 | 2018-09-11 | 腾讯科技(深圳)有限公司 | 对图像中的对象节点的识别方法、装置、终端及可读介质 |
CN108776970A (zh) * | 2018-06-12 | 2018-11-09 | 北京字节跳动网络技术有限公司 | 图像处理方法和装置 |
CN109146892A (zh) * | 2018-07-23 | 2019-01-04 | 北京邮电大学 | 一种基于美学的图像裁剪方法及装置 |
CN109344806A (zh) * | 2018-10-31 | 2019-02-15 | 第四范式(北京)技术有限公司 | 利用多任务目标检测模型执行目标检测的方法和系统 |
CN110706150A (zh) * | 2019-07-12 | 2020-01-17 | 北京达佳互联信息技术有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN110796048A (zh) * | 2019-10-18 | 2020-02-14 | 武汉大学 | 一种基于深度神经网络的船舰目标实时检测方法 |
CN111144426A (zh) * | 2019-12-28 | 2020-05-12 | 广东拓斯达科技股份有限公司 | 一种分拣方法、装置、设备和存储介质 |
CN111667487A (zh) * | 2020-04-29 | 2020-09-15 | 平安科技(深圳)有限公司 | 一种图片裁剪方法、装置及计算机设备 |
CN111340028A (zh) * | 2020-05-18 | 2020-06-26 | 创新奇智(北京)科技有限公司 | 一种文本定位方法、装置、电子设备及存储介质 |
CN112132836A (zh) * | 2020-08-14 | 2020-12-25 | 咪咕文化科技有限公司 | 视频图像裁剪方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
基于像素的椭圆窗口裁剪算法;唐棣;阎晓敏;孙岩;;计算机工程与设计(第22期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112700454A (zh) | 2021-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112700454B (zh) | 图像裁剪方法、装置、电子设备及存储介质 | |
KR102592270B1 (ko) | 얼굴 랜드마크 검출 방법과 장치, 컴퓨터 장치, 및 저장 매체 | |
CN110751149B (zh) | 目标对象标注方法、装置、计算机设备和存储介质 | |
CN111898411B (zh) | 文本图像标注系统、方法、计算机设备和存储介质 | |
WO2021012382A1 (zh) | 配置聊天机器人的方法、装置、计算机设备和存储介质 | |
CN111368678B (zh) | 图像处理方法及相关装置 | |
AU2019457052B2 (en) | Table processing method and apparatus, and intelligent interactive tablet and storage medium | |
WO2023035531A1 (zh) | 文本图像超分辨率重建方法及其相关设备 | |
CN111429338B (zh) | 用于处理视频的方法、装置、设备和计算机可读存储介质 | |
CN111291753B (zh) | 基于图像的文本识别方法、装置及存储介质 | |
CN110705207A (zh) | 一种文档显示方法、装置、计算机设备以及存储介质 | |
US11288538B2 (en) | Object functionality predication methods, computer device, and storage medium | |
CN110796663A (zh) | 图片剪裁方法、装置、设备和存储介质 | |
CN111583264A (zh) | 图像分割网络的训练方法、图像分割方法和存储介质 | |
CN113610864B (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN114222181B (zh) | 一种图像处理方法、装置、设备及介质 | |
US11881007B2 (en) | Video cropping method and apparatus, device, and storage medium | |
CN114332297A (zh) | 图像的绘制方法、装置、计算机设备和存储介质 | |
CN112101106B (zh) | 人脸关键点确定方法、装置以及存储介质 | |
CN113096069A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
KR20240055440A (ko) | 시선의 방향이 변동되는 발화자 주변의 자막 배치를 제어하는 전자장치 및 그 제어방법 | |
CN115114391A (zh) | 地图数据生成方法、地图显示方法、装置、设备及介质 | |
CN114119994A (zh) | 基于mvs数据的建筑物立面纹理提取方法、装置及电子设备 | |
CN116229460A (zh) | 一种基于深度补全的空间标注方法和系统 | |
CN114820575A (zh) | 图像验证方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |