CN113837195A - 图像处理方法、装置、设备和存储介质 - Google Patents
图像处理方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN113837195A CN113837195A CN202111217656.5A CN202111217656A CN113837195A CN 113837195 A CN113837195 A CN 113837195A CN 202111217656 A CN202111217656 A CN 202111217656A CN 113837195 A CN113837195 A CN 113837195A
- Authority
- CN
- China
- Prior art keywords
- image
- coordinate
- target
- size
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 29
- 238000000034 method Methods 0.000 claims description 37
- 230000003321 amplification Effects 0.000 claims description 9
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Processing (AREA)
Abstract
本申请公开了一种图像处理方法、装置、设备和存储介质,属于图像处理技术领域。该图像处理方法包括:获取目标对象在第一图像中的第一坐标;根据第一图像的尺寸、目标尺寸和第一坐标,确定第二坐标;显示目标尺寸的第二图像,其中,第二图像是基于第一图像生成的,第二图像的中心位置为第二坐标。
Description
技术领域
本申请属于图像处理技术领域,具体涉及一种图像处理方法、装置、设备和存储介质。
背景技术
随着移动互联网的蓬勃发展和电子设备的不断普及,不同尺寸的显示终端不断涌现以适应用户的不同需求。
相关技术中,为了使图像内容能够自适应于不同尺寸、不同比例的显示终端,保证不同设备的用户都能够舒适地观看同样的图像内容,通常需要对原始图像进行处理,调整原始图像的尺寸。但是,当原始图像中显著物的位置靠近边缘时,相关技术中的处理方式可能会丢失掉原始图像中的显著物,因此无法保证图像内容的完整性。
发明内容
本申请实施例的目的是提供一种图像处理方法、装置、设备和存储介质,能够解决相关技术的处理方式会丢失掉原始图像中的显著物,无法保证图像内容的完整性的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种图像处理方法,该方法包括:获取目标对象在第一图像中的第一坐标;根据第一图像的尺寸、目标尺寸和第一坐标,确定第二坐标;显示目标尺寸的第二图像,其中,第二图像是基于第一图像生成的,第二图像的中心位置为第二坐标。
第二方面,本申请实施例提供了一种图像处理装置,该装置包括:获取模块,用于获取目标对象在第一图像中的第一坐标;确定模块,用于根据第一图像的尺寸、目标尺寸和第一坐标,确定第二坐标;显示模块,用于显示目标尺寸的第二图像,其中,第二图像是基于第一图像生成的,第二图像的中心位置为第二坐标。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第一方面的图像处理方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,该可读存储介质上存储程序或指令,程序或指令被处理器执行时实现如第一方面的图像处理方法的步骤。
第五方面,本申请实施例提供了一种芯片,该芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面的图像处理方法的步骤。
在本申请实施例中,电子设备可以获取目标对象在第一图像中的第一坐标,并根据第一图像的尺寸、目标尺寸和第一坐标,确定第二坐标。由于第二坐标是基于目标对象的第一坐标,即基于目标对象在第一图像中的所在位置确定的,因此得到的第二坐标充分依据了目标对象的位置。在第一图像的基础上,以第二坐标作为中心位置生成目标尺寸的第二图像,能够保证第二图像的图像内容以目标对象为主,避免丢失掉目标对象,从而保证裁剪后图像内容的完整性。
附图说明
图1是本申请实施例提供的图像处理方法的流程示意图之一;
图2是本申请实施例提供的图像处理方法的流程示意图之二;
图3是本申请实施例提供的第一图像的示例的示意图;
图4是本申请实施例提供的预设联合网络模型的示例的结构示意图;
图5是本申请实施例提供的图像处理方法的流程示意图之三;
图6是本申请实施例提供的图像处理方法的流程示意图之四;
图7是本申请实施例提供的一种图像处理装置的结构示意图;
图8是本申请实施例提供的一种电子设备的结构示意图;
图9是本申请实施例的一种电子设备的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
针对相关技术中出现的问题,本申请实施例提供了一种图像处理方法,电子设备可以获取目标对象在第一图像中的第一坐标,并根据第一图像的尺寸、目标尺寸和第一坐标,确定第二坐标。由于第二坐标是基于目标对象的第一坐标,即基于目标对象在第一图像中的所在位置确定的,因此得到的第二坐标充分依据了目标对象的位置。在第一图像的基础上,以第二坐标作为中心位置生成目标尺寸的第二图像,能够保证第二图像的图像内容以目标对象为主,避免丢失掉目标对象,从而保证裁剪后图像内容的完整性,解决了相关技术中的处理方式会丢失掉原始图像中的显著物,无法保证图像内容的完整性的问题。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的图像处理方法进行详细地说明。
图1是本申请实施例提供的一种图像处理方法的流程示意图,该图像处理方法的执行主体可以为电子设备。需要说明的是,上述执行主体并不构成对本申请的限定。
如图1所示,本申请实施例提供的图像处理方法可以包括步骤110-步骤130。
步骤110,获取目标对象在第一图像中的第一坐标。
其中,该目标对象可以为第一图像中的显著物,例如人、动物、汽车、美食、建筑物等,本申请在此不做具体限定。第一坐标可以为目标对象在第一图像中的位置坐标。
步骤120,根据第一图像的尺寸、目标尺寸和第一坐标,确定第二坐标。
其中,该目标尺寸可以根据具体需求进行设置,本申请在此不做具体限定。
在一个实施例中,该目标尺寸可以为电子设备屏幕对应的最佳显示尺寸。
例如,该目标尺寸可以为电子设备的屏幕尺寸1284*2778。或者,该目标尺寸可以为电子设备屏幕对应的最佳显示尺寸,例如电子设备的屏幕尺寸为1284*2778,则最佳显示尺寸可以为屏幕尺寸的20%,即256*555。
在另一个实施例中,该目标尺寸可以为电子设备中应用程序对应的最佳显示尺寸。
示例性地,该目标尺寸可以为社交应用程序对应的最佳显示尺寸900*500。
步骤130,显示目标尺寸的第二图像。
其中,第二图像是基于第一图像生成的,第二图像的中心位置为第二坐标。
在一个实施例中,在步骤130之前,该方法还可以包括:以第二坐标为裁剪中心对第一图像进行裁剪,生成目标尺寸的第二图像。
示例性地,目标尺寸可以为900*500,因此可以以第二坐标为裁剪中心,从尺寸为1000*700的第一图像中裁剪900*500的图像区域,得到第二图像。
在另一个实施例中,步骤130可以包括:在第一图像中,以第二坐标为中心位置确定目标尺寸的显示区域,显示区域中显示的图像为第二图像。
本申请实施例提供了的图像处理方法,电子设备可以获取目标对象在第一图像中的第一坐标,并根据第一图像的尺寸、目标尺寸和第一坐标,确定第二坐标。由于第二坐标是基于目标对象的第一坐标,即基于目标对象在第一图像中的所在位置确定的,因此得到的第二坐标充分依据了目标对象的位置。在第一图像的基础上,以第二坐标作为中心位置生成目标尺寸的第二图像,能够保证第二图像的图像内容以目标对象为主,避免丢失掉目标对象,从而保证裁剪后图像内容的完整性。
下面结合具体的实施例,详细介绍上述步骤110-步骤130。
首先涉及步骤110,获取目标对象在第一图像中的第一坐标。
相关技术中,通常采用均匀缩放Scaling技术,对原始图像进行插值或下采样得到目标尺寸的图像,然而当需要改变原始图像宽高比来进行均匀缩放时,会导致图像主要内容的拉伸变形。
在本申请的一些实施例中,在步骤110之前,该方法还可以包括下述步骤:获取第二尺寸的原始图像;在第二尺寸大于目标尺寸的情况下,确定原始图像为第一图像;在第二尺寸小于目标尺寸的情况下,按照第二放大比例对原始图像进行放大,得到第一图像。
其中,第二尺寸为原始图像的尺寸,第二尺寸可以包括第二宽度值和第二高度值,目标尺寸可以包括目标宽度值和目标高度值,第二放大比例可以为目标宽度值与第二宽度值的比值、目标高度值与第二高度值的比值中的最大值。
示例性地,第二尺寸可以为300*300,目标尺寸可以为900*500,则第二尺寸小于目标尺寸,因此需要对原始图像进行放大。其中,目标宽度值与第二宽度值的比值900/300大于500/300,因此基于第二放大比例3将原始图像放大为900*900,得到第一图像。
在另一个示例中,第二尺寸可以为1000*500,大于目标尺寸900*500,因此无需对原始图像进行放大,直接将1000*500的原始图像作为第一图像。
在本申请实施例中,在原始图像的尺寸小于目标尺寸的情况下,通过等比例放大原始图像,以及基于放大后的原始图像生成目标尺寸的第二图像,能够避免第二图像中的图像内容被拉伸变形,改善图像内容的显示效果。
在本申请的另一些实施例中,在第二尺寸小于目标尺寸的情况下,按照第二放大比例对原始图像进行放大,得到第一图像,可以包括:在第二尺寸小于目标尺寸,且大于预设倍数与目标尺寸的乘积的情况下,按照第二放大比例对原始图像进行放大,得到第一图像。
其中,预设倍数小于1,预设倍数可以根据具体需求进行设置。例如,预设倍数可以为0.6等。
在一个实施例中,在原始图像的第二尺寸小于预设倍数与目标尺寸的乘积的情况下,可以直接输出原始图像。
示例性地,原始图像可以为表情图片,第二尺寸为50*50,这种情况下若对其进行放大会导致图片失真,因此可以直接输出。
在本申请的一些实施例中,图2是本申请实施例提供的一种图像处理方法的流程示意图,步骤110可以包括图2所示的步骤210-步骤230。
步骤210,获取第一图像中目标对象的识别信息。
其中,识别信息可以包括目标对象的类别信息,以及目标对象对应的目标框的坐标信息和第一尺寸信息。
类别信息可以为目标对象对应的类别,例如人、动物、美食、植物、建筑物等。
目标框可以用于标注目标对象在第一图像中的位置。
示例性地,如图3所示,目标对象可以为小狗,目标框301可以将小狗的位置在第一图像302中标注出来。
在本申请的一些实施例中,可以将第一图像放至坐标系,得到目标框对应的坐标信息。例如,将第一图像的两边分别与平面直角坐标系的x轴、y轴对齐,可以得到目标框的四个角分别对应的坐标信息。
示例性地,目标框301的坐标信息可以为(x,y,w,h)=(200,50,250,150),其中,(x,y)可以为目标框的左下角坐标,目标框的第一尺寸信息可以包括第一图像的宽度值w和第一图像的高度值h。
需要说明的是,目标框对应的坐标信息,可以包括目标框的任意一个角的坐标。
在本申请的一些实施例中,可以通过预设联合网络模型,获取第一图像中目标对象的识别信息。
其中,预设联合网络模型可以包括特征提取模块、显著性模块和分类模块。特征提取模块:用于通过卷积神经网络获取第一图像的高级特征,并计算每个特征维度的梯度损失。显著性模块:主要包括残差块、全连接层和softmax层,用于对提取的高级特征进一步进行残差和全连接处理。分类模块:用于基于显著物特征和第一图像的高级特征,判断显著物的类别。
示例性地,图4为预设联合网络模型的示例,如图4所示,预设联合网络模型400可以包括特征提取模块401、显著性模块402和分类模块403。向预设联合网络模型400输入第一图像404之后,可以得到包含目标框的第一图像302和类别信息“小狗”。
步骤220,在目标框对应的第一尺寸小于或等于目标尺寸的情况下,根据坐标信息和第一尺寸信息,确定目标框的中心坐标为第一坐标。
其中,第一尺寸可以包括第一宽度值和第一高度值,第一宽度值可以为目标框的宽,第一高度值可以为目标框的高,目标尺寸可以包括目标宽度值和目标高度值。
具体地,坐标信息可以包括第一横坐标和第一纵坐标,步骤220可以具体包括:在第一宽度值小于或等于目标宽度值的情况下,根据第一横坐标、第一宽度值,确定目标框对应的中心坐标的横坐标为第一坐标的横坐标;在第一高度值小于或等于目标高度值的情况下,根据第一纵坐标、第一高度值,确定目标框对应的中心坐标的纵坐标为第一坐标的纵坐标。
在一个实施例中,在坐标信息为目标框的左下角坐标值的情况下,第一坐标的横坐标(或者目标框对应的中心坐标的横坐标)可以为第一横坐标与0.5倍第一宽度值的和值;第一坐标的纵坐标(或者目标框对应的中心坐标的纵坐标)可以为第一纵坐标与0.5倍第一高度值的和值。
步骤230,在第一尺寸大于目标尺寸的情况下,根据坐标信息、第一尺寸信息以及类别信息对应的预设权重,确定第一坐标。
其中,预设权重可以用于表征目标对象的部位的重要程度,预设权重可以包括宽度权重和高度权重。宽度权重用于表征目标对象x轴方向(或者宽度方向)上部位的重要程度,宽度权重越大,目标对象在x轴方向上距离原点越远的部位的重要程度越高,此时第一坐标在x轴方向上需要适当远离原点,因此第一坐标的横坐标越大;高度权重用于表征目标对象在y轴方向(或者高度方向)上部位的重要程度,高度权重越大,目标对象在y轴方向上距离原点越远的部位的重要程度越高,此时第一坐标在y轴方向上需要适当远离原点,因此第一坐标的纵坐标越大。宽度权重与高度权重的和为1。
由于不同类别的目标对象对应的部位重要程度不同,因此不同类别信息对应的预设权重不同。
例如,对于类别为人的目标对象,头部的重要程度较高,即目标对象在y轴方向上距离原点越远的部位的重要程度较高,因此高度权重可以设置为0.8,宽度权重可以设置为0.2。
又例如,对于图3中的类别为小狗的目标对象,头部的重要程度较高,即在x轴方向上靠近原点的部位的重要程度较高,因此宽度权重可以设置为0.3,高度权重可以设置为0.7。
需要说明的是,不同类别信息对应的预设权重可以根据具体需求或经验值进行设置,本申请在此不做具体限定。
例如,对于类别为人的目标对象,只想保留上半身图像,因此高度权重可以设置较高,以使第一坐标可以尽量在y轴方向上远离原点。
具体地,坐标信息可以包括第一横坐标和第一纵坐标,步骤230可以具体包括:在第一宽度值大于目标宽度值的情况下,根据第一横坐标、第一宽度值、类别信息对应的宽度权重,确定第一坐标的横坐标;在第一高度值大于目标高度值的情况下,根据第一纵坐标、第一高度值、类别信息对应的高度权重,确定第一坐标的纵坐标。
在一个实施例中,在坐标信息为目标框的左下角坐标值的情况下,第一坐标的横坐标可以为第一横坐标与第三数值的和值,第三数值可以为0.5倍第一宽度值与宽度权重的乘积;第一坐标的纵坐标可以为第一纵坐标与第四数值的和值,第四数值可以为0.5倍第一高度值与高度权重的乘积。
在一个实施例中,在坐标信息为目标框的左下角坐标值的情况下,可以根据公式(1)和公式(2)确定第一坐标的横坐标cx1和纵坐标cy1。
其中,x为第一横坐标,y为第一纵坐标,w为第一宽度值,h为第一高度值,pow为目标宽度值,poh为目标高度值,aw为预设权重中的宽度权重,ah为预设权重中的高度权重。
示例性地,目标框的左下角坐标(x,y)=(400,400),w=160,h=300,pow=200,poh=200,aw=0.2,aw=0.8。由于w小于pow,第一坐标的横坐标cx1=400+160*0.5=480;h大于poh,第一坐标的纵坐标cy1=400+300/2*0.8=520,第一坐标为(480,520)。
在本申请实施例中,在目标框的第一尺寸小于或等于目标尺寸的情况下,说明整个目标框可以完全显示在目标尺寸的图像中,此时可以将目标框的中心位置的坐标,即目标框的中心坐标,作为第一坐标,从而准确地确定出第一图像中目标对象的中心位置。在目标框的第一尺寸大于目标尺寸的情况下,说明整个目标框无法完全显示在目标尺寸的图像中,因此可以在目标框的中心坐标的基础上,根据用于表征目标对象的部位的重要程度的预设权重,将第一坐标有目的性地向目标对象的重要程度较高的部位偏移,从而保证在基于第一坐标得到第二坐标之后,以第二坐标作为中心位置生成第二图像时,尽可能地在第二图像中保留目标对象的重要程度较高的部位,提升第二图像的显示效果。
其次涉及步骤120,根据第一图像的尺寸、目标尺寸和第一坐标,确定第二坐标。
在本申请的一些实施例中,第一图像的尺寸可以包括第一边缘长度值,目标尺寸可以包括第二边缘长度值,图5是本申请实施例提供的再一种图像处理方法的流程示意图。
如图5所示,在步骤110之后,步骤120可以具体包括步骤510-步骤530。
步骤510,在第一坐标的坐标值小于第一数值的情况下,根据第一数值确定第二坐标,第一数值为第二边缘长度值的二分之一。
具体地,第一坐标的坐标值可以包括第二横坐标和第二纵坐标,第一边缘长度值可以包括第一图像对应的第四宽度值和第四高度值,第二边缘长度值可以包括目标尺寸对应的目标宽度值和目标高度值,第一数值可以包括第一目标数值和第二目标数值。
在一个实施例中,步骤510可以具体包括:在第二横坐标小于第一目标数值的情况下,确定第一目标数值为第二坐标的横坐标,第一目标数值为目标宽度值的二分之一;在第二纵坐标小于第二目标数值的情况下,确定第二目标数值为第二坐标的纵坐标,第二目标数值为目标高度值的二分之一。
步骤520,在第一坐标的坐标值大于第二数值的情况下,根据第一边缘长度值和第二边缘长度值确定第二坐标,第二数值为第一边缘长度值与第二边缘长度值的差值的二分之一。
具体地,第二数值可以包括第三目标数值和第四目标数值。
步骤520可以具体包括:在第二横坐标小于第三目标数值的情况下,确定第四宽度值与0.5倍目标宽度值的差值为第二坐标的横坐标,第三目标数值为第四宽度值与目标宽度值的差值的二分之一;在第二纵坐标小于第四目标数值的情况下,确定第四高度值与0.5倍目标高度值的差值为第二坐标的纵坐标,第四目标数值为第四高度值与目标高度值的差值的二分之一。
步骤530,在第一坐标的坐标值不小于第一数值,或者不大于第二数值的情况下,确定第一坐标为第二坐标。
在一个实施例中,在步骤120中,可以基于公式(3)和公式(4)确定第二坐标(cx2,cy2)。
其中,cx1为第二横坐标,cy1为第二纵坐标,pw为第四宽度值,ph为第四高度值,pow为目标宽度值,poh为目标高度值。
在本申请实施例中,若第一坐标的坐标值(横坐标和/或纵坐标)小于第二边缘长度值的二分之一,或者大于第一边缘长度值与第二边缘长度值的差值的二分之一时,说明第一坐标靠近第一图像的边缘位置。若在第一图像中以第一坐标为中心位置生成第二图像,例如以第一坐标为裁剪中心对第一图像进行裁剪,则裁剪范围会超出第一图像的范围。因此,在坐标值小于第二边缘长度值的二分之一的情况下,可以根据第二边缘长度值的二分之一对裁剪中心坐标进行调整,得到第二坐标;在坐标值大于第一边缘长度值与第二边缘长度值的差值的二分之一,可以根据第一边缘长度值与第二边缘长度值的差值的二分之一对第一坐标进行调整,得到离第一图像的中心距离更近、远离边缘位置的第二坐标。这样,在以第二坐标为中心位置进行裁剪时,能够保证裁剪范围不会超出第一图像范围,提升裁剪的成功率。
相关技术中,当对原始图像进行裁剪时,会识别原始图像中的人脸区域,将人物居中处理,裁剪得到目标尺寸的图像。一方面,若原始图像存在多个人时,则无法对图像进行有效裁剪处理;另一方面,当原始图像存在美食、大楼、动物等其他显著物时,将人物居中处理进行裁剪处理,会裁剪掉其他显著物。
基于此,在本申请的一些实施例中,为了能够对包含多个显著物的原始图像进行有效处理,图6是本申请实施例提供的再一种图像处理方法的流程示意图。其中,步骤110可以包括图6所示的步骤610,步骤120可以包括图6所示的步骤620和步骤630。
步骤610,在第一图像中的目标对象可以包括至少两个的情况下,获取每个目标对象对应的第一坐标,得到至少两个第一坐标。
需要说明的是,步骤610中获取每个目标对象对应的第一坐标的方式,与步骤210-步骤230中确定第一坐标的方式相同,为了简洁,在此不再赘述。
步骤620,在至少两个第一坐标满足第一预设条件的情况下,根据第一图像的尺寸、目标尺寸和第一坐标,确定每个第一坐标对应的第二坐标,得到至少两个第二坐标。
其中,第一预设条件可以包括:至少两个第一坐标之间的距离大于第一距离的二分之一,第一距离为目标尺寸与至少两个目标对象的尺寸平均值的差值。
第一预设条件可以如公式(5)和公式(6)所示:
pow和poh分别为目标尺寸中的目标宽度值和目标高度值。在第一图像中包括两个目标对象的情况下,(x1,y1)和(x2,y2)为两个目标对象分别对应的第一坐标,w1和w2为两个目标对象分别对应的第一宽度值,h1和h2为两个目标对象分别对应的第一高度值;在第一图像中包括至少三个目标对象的情况下,(x1,y1)和(x2,y2)为至少三个目标对象中距离最远的两个目标对象分别对应的第一坐标,w1和w2为距离最远的两个目标对象分别对应的第一宽度值,h1和h2为距离最远的两个目标对象分别对应的第一宽度值。
当至少两个第一坐标满足第一预设条件时,说明对于目标尺寸而言,至少两个目标对象在第一图像中距离过远,或目标对象在第一图像中所占的显示面积过大,若想将至少两个目标对象完整地裁剪在一起,则裁剪范围一定大于目标尺寸,因此若将第一图像中的至少两个目标对象裁剪在一起生成目标尺寸的第二图像,则第二图像中会丢失掉目标对象的部分特征,无法保证图像内容的完整性。基于此,可以确定每个目标对象对应的第二坐标,基于每个第二坐标生成一张目标尺寸的第二图像,保证每张第二图像中可以包含一个完整的目标对象,通过增加第二图像的数量,保证了图像内容的完整性。
例如,(x1,y1)、(x2,y2)和(x3,y3)为第一图像中3个目标对象分别对应的第一坐标,则在3个第一坐标满足第一预设条件的情况下,确定(x1,y1)、(x2,y2)和(x3,y3)分别对应的第二坐标,得到3个第二坐标。
需要说明的是,步骤620中确定每个第一坐标对应的第二坐标的方式,可以具体包括步骤510-步骤530,为了简洁,在此不再赘述。
步骤630,在至少两个第一坐标不满足第一预设条件的情况下,根据至少两个第一坐标确定第三坐标,并根据第一图像的尺寸、目标尺寸和第三坐标,确定第二坐标,其中,第三坐标为至少两个目标对象的中心的坐标。
当至少两个第一坐标不满足第一预设条件时,若想将至少两个目标对象完整地裁剪在一起,则裁剪范围不会超出目标尺寸,因此即使将第一图像中的至少两个目标对象裁剪在一起生成目标尺寸的第二图像,也可以保证图像内容的完整性。基于此,可以确定至少两个目标对象的中心的坐标,即第三坐标,以第三坐标为中心位置生成一张目标尺寸的第二图像,可以保证第二图像中可以包含所有目标对象的特征,保证了图像内容的完整性。
在一个实施例中,根据至少两个第一坐标确定第三坐标,可以包括:确定至少两个第一坐标的坐标值的平均值为第三坐标的坐标值。
需要说明的是,步骤630中根据第三坐标确定第二坐标的方式,类似于根据第一坐标确定第二坐标的方式,下面结合实施例进行说明。
在一个实施例中,第一图像的尺寸可以包括第一边缘长度值,目标尺寸可以包括第二边缘长度值,步骤620中根据第一图像的尺寸、目标尺寸和第三坐标,确定第二坐标,可以具体包括:在第三坐标的坐标值小于第一数值的情况下,根据第一数值确定第二坐标,第一数值为第二边缘长度值的二分之一;在第三坐标的坐标值大于第二数值的情况下,根据第一边缘长度值和第二边缘长度值确定第二坐标,第二数值为第一边缘长度值与第二边缘长度值的差值的二分之一;在第三坐标的坐标值不小于第一数值,或者不大于第二数值的情况下,确定第三坐标为第二坐标。
在本申请实施例中,在第一图像中包括不止一个目标对象的场景下,可以确定每个目标对象对应的第一坐标,得到至少两个第一坐标。在至少两个第一坐标满足第一预设条件的情况下,表征至少两个第一坐标之间的距离大于第一距离的二分之一,说明对于目标尺寸而言,至少两个目标对象在第一图像中距离过远,或目标对象在第一图像中所占的显示面积过大。因此,可以确定每个目标对象对应的第二坐标,基于每个第二坐标生成一张目标尺寸的第二图像,保证每张第二图像中可以包含一个完整的目标对象,通过增加第二图像的数量,保证了图像内容的完整性。在至少两个第一坐标不满足第一预设条件的情况下,表征至少两个第一坐标之间的距离小于或等于第一距离的二分之一,说明对于目标尺寸而言,至少两个目标对象在第一图像中距离不会过远,并且目标对象在第一图像中所占的显示面积也不大。因此,可以确定至少两个目标对象的中心的坐标,即第三坐标,以第三坐标为中心位置生成一张目标尺寸的第二图像,可以保证第二图像中可以包含所有目标对象的特征,保证了图像内容的完整性。因此,在第一图像中包括不止一个目标对象的场景下,通过本申请实施例可以对第一图像进行有效处理,同时不会遗漏掉第一图像中除人以外的其他显著物,保证原始图像中图像内容的完整性,有效提升第二图像的显示效果。
在本申请的一些实施例中,如图6所示,在步骤620之后,方法还可以包括:
步骤640,在得到至少两个第二坐标的情况下,分别基于每个第二坐标对第一图像进行裁剪,得到至少两张目标尺寸的第二图像。
在本申请实施例中,在需要对第一图像中的至少两个目标对象分开进行裁剪的场景下,分别以每个第二坐标为中心位置对第一图像进行裁剪,可以得到至少两张目标尺寸的第二图像,且每张第二图像中可以包含一个完整的目标对象。因此通过至少两张第二图像,可以完整地保留所有目标对象,避免丢失掉原始图像中的显著物特征,从而保证原始图像内容的完整性。
在本申请的一些实施例中,为了避免第二图像中目标对象的显示面积太小,影响用户正常查看,在获取目标对象在第一图像中的第一坐标之后,方法还可以包括:在目标对象的显示面积占第一图像的第一比值小于第一预设阈值的情况下,基于第一放大比例放大第一图像并更新第一坐标,其中,第一放大比例为第一预设阈值与第一比值的比值。
其中,第一预设阈值可以根据具体需求进行设置,本申请在此不做具体限定。
示例性地,第一图像的尺寸为600*800,第一坐标为(480,520),第一预设阈值为15%,目标对象的显示面积占第一图像的第一比值为12%,则可以根据第一放大比例15/12将第一图像由600*800放大为750*1000,并将第一坐标更新为(480*15/12,520*15/12)=(600,650)。
在本申请实施例中,在目标对象的显示面积占第一图像的第一比值小于第一预设阈值的情况下,可以基于第一放大比例放大第一图像,增大第一图像中目标对象的显示面积。这样,在基于放大后的第一图像生成第二图像时,能够提升第二图像中目标对象的显示面积,省略用户需要对第二图像进行放大查看的步骤,提升用户图像查看体验。
需要说明的是,本申请实施例提供的图像处理方法,执行主体可以为图像处理装置,或者该图像处理装置中的用于执行图像处理的方法的控制模块。本申请实施例中以图像处理装置执行图像处理的方法为例,说明本申请实施例提供的图像处理装置。下面对图像处理装置进行详细介绍。
图7是本申请提供的一种图像处理装置的结构示意图。
如图7所示,本申请实施例提供一种图像处理装置700,该图像处理装置700包括:获取模块710、确定模块720和显示模块730。
其中,获取模块710,用于获取目标对象在第一图像中的第一坐标;确定模块720,用于根据第一图像的尺寸、目标尺寸和第一坐标,确定第二坐标;显示模块730,用于显示目标尺寸的第二图像,其中,第二图像是基于第一图像生成的,第二图像的中心位置为第二坐标。
本申请实施例提供的图像处理装置,可以获取目标对象在第一图像中的第一坐标,并根据第一图像的尺寸、目标尺寸和第一坐标,确定第二坐标。由于第二坐标是基于目标对象的第一坐标,即基于目标对象在第一图像中的所在位置确定的,因此得到的第二坐标充分依据了目标对象的位置。在第一图像的基础上,以第二坐标作为中心位置生成目标尺寸的第二图像,能够保证第二图像的图像内容以目标对象为主,避免丢失掉目标对象,从而保证裁剪后图像内容的完整性。
在本申请的一些实施例中,获取模块710包括:获取单元,用于获取第一图像中目标对象的识别信息,识别信息包括目标对象的类别信息,以及目标对象对应的目标框的坐标信息和第一尺寸信息;确定单元,用于在目标框对应的第一尺寸小于或等于目标尺寸的情况下,根据坐标信息和第一尺寸信息,确定目标框的中心坐标,得到第一坐标;确定单元,还用于在第一尺寸大于目标尺寸的情况下,根据坐标信息、第一尺寸信息以及类别信息对应的预设权重,确定第一坐标。
在本申请实施例中,在目标框的第一尺寸小于或等于目标尺寸的情况下,说明整个目标框可以完全显示在目标尺寸的图像中,此时可以将目标框的中心位置的坐标,即目标框的中心坐标,作为第一坐标,从而准确地确定出第一图像中目标对象的中心位置。在目标框的第一尺寸大于目标尺寸的情况下,说明整个目标框无法完全显示在目标尺寸的图像中,因此可以在目标框的中心坐标的基础上,根据用于表征目标对象的部位的重要程度的预设权重,将第一坐标有目的性地向目标对象的重要程度较高的部位偏移,从而保证在基于第一坐标得到第二坐标之后,以第二坐标作为中心位置生成第二图像时,尽可能地在第二图像中保留目标对象的重要程度较高的部位,提升第二图像的显示效果。
在本申请的一些实施例中,第一图像的尺寸包括第一边缘长度值,目标尺寸包括第二边缘长度值,确定模块720具体用于:在第一坐标的坐标值小于第一数值的情况下,根据第一数值确定第二坐标,第一数值为第二边缘长度值的二分之一;在第一坐标的坐标值大于第二数值的情况下,根据第一边缘长度值和第二边缘长度值确定第二坐标,第二数值为第一边缘长度值与第二边缘长度值的差值的二分之一;在第一坐标的坐标值不小于第一数值,或者不大于第二数值的情况下,确定第一坐标为第二坐标。
在本申请实施例中,若第一坐标的坐标值(横坐标和/或纵坐标)小于第二边缘长度值的二分之一,或者大于第一边缘长度值与第二边缘长度值的差值的二分之一时,说明第一坐标靠近第一图像的边缘位置。若在第一图像中以第一坐标为中心位置生成第二图像,例如以第一坐标为裁剪中心对第一图像进行裁剪,则裁剪范围会超出第一图像的范围。因此,在坐标值小于第二边缘长度值的二分之一的情况下,可以根据第二边缘长度值的二分之一对裁剪中心坐标进行调整,得到第二坐标;在坐标值大于第一边缘长度值与第二边缘长度值的差值的二分之一,可以根据第一边缘长度值与第二边缘长度值的差值的二分之一对第一坐标进行调整,得到离第一图像的中心距离更近、远离边缘位置的第二坐标。这样,在以第二坐标为中心位置进行裁剪时,能够保证裁剪范围不会超出第一图像范围,提升裁剪的成功率。
在本申请的一些实施例中,获取模块710具体用于:在第一图像中的目标对象包括至少两个的情况下,获取每个目标对象对应的第一坐标,得到至少两个第一坐标;确定模块720具体用于:在至少两个第一坐标满足第一预设条件的情况下,根据第一图像的尺寸、目标尺寸和第一坐标,确定每个第一坐标对应的第二坐标,得到至少两个第二坐标;在至少两个第一坐标不满足第一预设条件的情况下,根据至少两个第一坐标确定第三坐标,并根据第一图像的尺寸、目标尺寸和第三坐标,确定第二坐标,其中,第三坐标为至少两个目标对象的中心的坐标。
在本申请实施例中,在第一图像中包括不止一个目标对象的场景下,可以确定每个目标对象对应的第一坐标,得到至少两个第一坐标。在至少两个第一坐标满足第一预设条件的情况下,表征至少两个第一坐标之间的距离大于第一距离的二分之一,说明对于目标尺寸而言,至少两个目标对象在第一图像中距离过远,或目标对象在第一图像中所占的显示面积过大。因此,可以确定每个目标对象对应的第二坐标,基于每个第二坐标生成一张目标尺寸的第二图像,保证每张第二图像中可以包含一个完整的目标对象,通过增加第二图像的数量,保证了图像内容的完整性。在至少两个第一坐标不满足第一预设条件的情况下,表征至少两个第一坐标之间的距离小于或等于第一距离的二分之一,说明对于目标尺寸而言,至少两个目标对象在第一图像中距离不会过远,并且目标对象在第一图像中所占的显示面积也不大。因此,可以确定至少两个目标对象的中心的坐标,即第三坐标,以第三坐标为中心位置生成一张目标尺寸的第二图像,可以保证第二图像中可以包含所有目标对象的特征,保证了图像内容的完整性。因此,在第一图像中包括不止一个目标对象的场景下,通过本申请实施例可以对第一图像进行有效处理,同时不会遗漏掉第一图像中除人以外的其他显著物,保证原始图像中图像内容的完整性,有效提升第二图像的显示效果。
在本申请的一些实施例中,该装置还包括:裁剪模块,用于在得到至少两个第二坐标的情况下,分别基于每个第二坐标对第一图像进行裁剪,得到至少两张目标尺寸的第二图像。
在本申请实施例中,在需要对第一图像中的至少两个目标对象分开进行裁剪的场景下,分别以每个第二坐标为中心位置对第一图像进行裁剪,可以得到至少两张目标尺寸的第二图像,且每张第二图像中可以包含一个完整的目标对象。因此通过至少两张第二图像,可以完整地保留所有目标对象,避免丢失掉原始图像中的显著物特征,从而保证原始图像内容的完整性。
在本申请的一些实施例中,该装置还包括:缩放模块,用于在获取目标对象在第一图像中的第一坐标之后,在目标对象的显示面积占第一图像的第一比值小于第一预设阈值的情况下,基于第一放大比例放大第一图像并更新第一坐标,其中,第一放大比例为第一预设阈值与第一比值的比值。
在本申请的一些实施例中,获取模块710,还用于在获取目标对象在第一图像中的第一坐标之前,获取第二尺寸的原始图像;确定模块720,还用于:在第二尺寸大于目标尺寸的情况下,确定原始图像为第一图像;在第二尺寸小于目标尺寸的情况下,按照第二放大比例对原始图像进行放大,得到第一图像;其中,第二尺寸包括第二宽度值和第二高度值,目标尺寸包括目标宽度值和目标高度值,第二放大比例为目标宽度值与第二宽度值的比值、目标高度值与第二高度值的比值中的最大值。
在本申请实施例中,在原始图像的尺寸小于目标尺寸的情况下,通过等比例放大原始图像,以及基于放大后的原始图像生成目标尺寸的第二图像,能够避免第二图像中的图像内容被拉伸变形,改善图像内容的显示效果。
本申请实施例提供的图像处理装置能够实现图1-图6的方法实施例中电子设备所实现的各个过程,为避免重复,这里不再赘述。
本申请实施例中的图像处理装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personaldigital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的图像处理装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为iOS操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
可选地,如图8所示,本申请实施例还提供一种电子设备800,包括处理器801,存储器802,存储在存储器802上并可在处理器801上运行的程序或指令,该程序或指令被处理器801执行时实现上述图像处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要注意的是,本申请实施例中的电子设备包括上述的移动电子设备和非移动电子设备。
图9为本申请实施例的一种电子设备的硬件结构示意图。
该电子设备900包括但不限于:射频单元901、网络模块902、音频输出单元903、输入单元904、传感器905、显示单元906、用户输入单元907、接口单元908、存储器909、以及处理器910等部件。
其中,上述输入单元904可以包括图像捕获装置,例如摄像头。
本领域技术人员可以理解,电子设备900还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器910逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图9中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器910,用于:获取目标对象在第一图像中的第一坐标;根据第一图像的尺寸、目标尺寸和第一坐标,确定第二坐标;显示单元906,用于显示目标尺寸的第二图像,其中,第二图像是基于第一图像生成的,第二图像的中心位置为第二坐标。
在本申请实施例中,可以获取目标对象在第一图像中的第一坐标,并根据第一图像的尺寸、目标尺寸和第一坐标,确定第二坐标。由于第二坐标是基于目标对象的第一坐标,即基于目标对象在第一图像中的所在位置确定的,因此得到的第二坐标充分依据了目标对象的位置。在第一图像的基础上,以第二坐标作为中心位置生成目标尺寸的第二图像,能够保证第二图像的图像内容以目标对象为主,避免丢失掉目标对象,从而保证裁剪后图像内容的完整性。
在本申请的一些实施例中,处理器910具体用于:获取第一图像中目标对象的识别信息,识别信息包括目标对象的类别信息,以及目标对象对应的目标框的坐标信息和第一尺寸信息;在目标框对应的第一尺寸小于或等于目标尺寸的情况下,根据坐标信息和第一尺寸信息,确定目标框的中心坐标,得到第一坐标;在第一尺寸大于目标尺寸的情况下,根据坐标信息、第一尺寸信息以及类别信息对应的预设权重,确定第一坐标。
在本申请实施例中,在目标框的第一尺寸小于或等于目标尺寸的情况下,说明整个目标框可以完全显示在目标尺寸的图像中,此时可以将目标框的中心位置的坐标,即目标框的中心坐标,作为第一坐标,从而准确地确定出第一图像中目标对象的中心位置。在目标框的第一尺寸大于目标尺寸的情况下,说明整个目标框无法完全显示在目标尺寸的图像中,因此可以在目标框的中心坐标的基础上,根据用于表征目标对象的部位的重要程度的预设权重,将第一坐标有目的性地向目标对象的重要程度较高的部位偏移,从而保证在基于第一坐标得到第二坐标之后,以第二坐标作为中心位置生成第二图像时,尽可能地在第二图像中保留目标对象的重要程度较高的部位,提升第二图像的显示效果。
在本申请的一些实施例中,第一图像的尺寸包括第一边缘长度值,目标尺寸包括第二边缘长度值,处理器910具体用于:在第一坐标的坐标值小于第一数值的情况下,根据第一数值确定第二坐标,第一数值为第二边缘长度值的二分之一;在第一坐标的坐标值大于第二数值的情况下,根据第一边缘长度值和第二边缘长度值确定第二坐标,第二数值为第一边缘长度值与第二边缘长度值的差值的二分之一;在第一坐标的坐标值不小于第一数值,或者不大于第二数值的情况下,确定第一坐标为第二坐标。
在本申请实施例中,若第一坐标的坐标值(横坐标和/或纵坐标)小于第二边缘长度值的二分之一,或者大于第一边缘长度值与第二边缘长度值的差值的二分之一时,说明第一坐标靠近第一图像的边缘位置。若在第一图像中以第一坐标为中心位置生成第二图像,例如以第一坐标为裁剪中心对第一图像进行裁剪,则裁剪范围会超出第一图像的范围。因此,在坐标值小于第二边缘长度值的二分之一的情况下,可以根据第二边缘长度值的二分之一对裁剪中心坐标进行调整,得到第二坐标;在坐标值大于第一边缘长度值与第二边缘长度值的差值的二分之一,可以根据第一边缘长度值与第二边缘长度值的差值的二分之一对第一坐标进行调整,得到离第一图像的中心距离更近、远离边缘位置的第二坐标。这样,在以第二坐标为中心位置进行裁剪时,能够保证裁剪范围不会超出第一图像范围,提升裁剪的成功率。
在本申请的一些实施例中,处理器910具体用于:在第一图像中的目标对象包括至少两个的情况下,获取每个目标对象对应的第一坐标,得到至少两个第一坐标;在至少两个第一坐标满足第一预设条件的情况下,根据第一图像的尺寸、目标尺寸和第一坐标,确定每个第一坐标对应的第二坐标,得到至少两个第二坐标;在至少两个第一坐标不满足第一预设条件的情况下,根据至少两个第一坐标确定第三坐标,并根据第一图像的尺寸、目标尺寸和第三坐标,确定第二坐标,其中,第三坐标为至少两个目标对象的中心的坐标。
在本申请实施例中,在第一图像中包括不止一个目标对象的场景下,可以确定每个目标对象对应的第一坐标,得到至少两个第一坐标。在至少两个第一坐标满足第一预设条件的情况下,表征至少两个第一坐标之间的距离大于第一距离的二分之一,说明对于目标尺寸而言,至少两个目标对象在第一图像中距离过远,或目标对象在第一图像中所占的显示面积过大。因此,可以确定每个目标对象对应的第二坐标,基于每个第二坐标生成一张目标尺寸的第二图像,保证每张第二图像中可以包含一个完整的目标对象,通过增加第二图像的数量,保证了图像内容的完整性。在至少两个第一坐标不满足第一预设条件的情况下,表征至少两个第一坐标之间的距离小于或等于第一距离的二分之一,说明对于目标尺寸而言,至少两个目标对象在第一图像中距离不会过远,并且目标对象在第一图像中所占的显示面积也不大。因此,可以确定至少两个目标对象的中心的坐标,即第三坐标,以第三坐标为中心位置生成一张目标尺寸的第二图像,可以保证第二图像中可以包含所有目标对象的特征,保证了图像内容的完整性。因此,在第一图像中包括不止一个目标对象的场景下,通过本申请实施例可以对第一图像进行有效处理,同时不会遗漏掉第一图像中除人以外的其他显著物,保证原始图像中图像内容的完整性,有效提升第二图像的显示效果。
在本申请的一些实施例中,处理器910,还用于在得到至少两个第二坐标的情况下,分别基于每个第二坐标对第一图像进行裁剪,得到至少两张目标尺寸的第二图像。
在本申请实施例中,在需要对第一图像中的至少两个目标对象分开进行裁剪的场景下,分别以每个第二坐标为中心位置对第一图像进行裁剪,可以得到至少两张目标尺寸的第二图像,且每张第二图像中可以包含一个完整的目标对象。因此通过至少两张第二图像,可以完整地保留所有目标对象,避免丢失掉原始图像中的显著物特征,从而保证原始图像内容的完整性。
在本申请的一些实施例中,处理器910,还用于在获取目标对象在第一图像中的第一坐标之后,在目标对象的显示面积占第一图像的第一比值小于第一预设阈值的情况下,基于第一放大比例放大第一图像并更新第一坐标,其中,第一放大比例为第一预设阈值与第一比值的比值。
在本申请的一些实施例中,处理器910还用于:在获取目标对象在第一图像中的第一坐标之前,获取第二尺寸的原始图像;在第二尺寸大于目标尺寸的情况下,确定原始图像为第一图像;在第二尺寸小于目标尺寸的情况下,按照第二放大比例对原始图像进行放大,得到第一图像;其中,第二尺寸包括第二宽度值和第二高度值,目标尺寸包括目标宽度值和目标高度值,第二放大比例为目标宽度值与第二宽度值的比值、目标高度值与第二高度值的比值中的最大值。
在本申请实施例中,在原始图像的尺寸小于目标尺寸的情况下,通过等比例放大原始图像,以及基于放大后的原始图像生成目标尺寸的第二图像,能够避免第二图像中的图像内容被拉伸变形,改善图像内容的显示效果。
应理解的是,本申请实施例中,输入单元904可以包括图形处理器(GraphicsProcessing Unit,GPU)9041和麦克风9042,图形处理器9041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元906可包括显示面板9061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板9061。用户输入单元907包括触控面板9071以及其他输入设备9072。触控面板9071,也称为触摸屏。触控面板9071可包括触摸检测装置和触摸控制器两个部分。其他输入设备9072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器909可用于存储软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器910可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器910中。
本申请实施例还提供一种可读存储介质,可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述图像处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,处理器为上述实施例中的电子设备中的处理器。可读存储介质,包括计算机可读存储介质,计算机可读存储介质的示例包括非暂态计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现上述图像处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。
Claims (10)
1.一种图像处理方法,其特征在于,所述方法包括:
获取目标对象在第一图像中的第一坐标;
根据所述第一图像的尺寸、目标尺寸和所述第一坐标,确定第二坐标;
显示目标尺寸的第二图像,其中,所述第二图像是基于所述第一图像生成的,所述第二图像的中心位置为所述第二坐标。
2.根据权利要求1所述的方法,其特征在于,所述获取目标对象在第一图像中的第一坐标,包括:
获取所述第一图像中所述目标对象的识别信息,所述识别信息包括所述目标对象的类别信息,以及所述目标对象对应的目标框的坐标信息和第一尺寸信息;
在所述目标框对应的第一尺寸小于或等于所述目标尺寸的情况下,根据所述坐标信息和所述第一尺寸信息,确定所述目标框的中心坐标为所述第一坐标;
在所述第一尺寸大于目标尺寸的情况下,根据所述坐标信息、所述第一尺寸信息以及所述类别信息对应的预设权重,确定所述第一坐标。
3.根据权利要求1所述的方法,其特征在于,所述第一图像的尺寸包括第一边缘长度值,所述目标尺寸包括第二边缘长度值,所述根据所述第一图像的尺寸、目标尺寸和所述第一坐标,确定第二坐标,包括:
在所述第一坐标的坐标值小于第一数值的情况下,根据所述第一数值确定所述第二坐标,所述第一数值为所述第二边缘长度值的二分之一;
在所述第一坐标的坐标值大于第二数值的情况下,根据所述第一边缘长度值和第二边缘长度值确定所述第二坐标,所述第二数值为所述第一边缘长度值与第二边缘长度值的差值的二分之一;
在所述第一坐标的坐标值不小于第一数值,或者不大于第二数值的情况下,确定所述第一坐标为所述第二坐标。
4.根据权利要求1所述的方法,其特征在于,所述获取目标对象在第一图像中的第一坐标,包括:
在所述第一图像中的目标对象包括至少两个的情况下,获取每个目标对象对应的第一坐标,得到至少两个第一坐标;
所述根据所述第一图像的尺寸、目标尺寸和所述第一坐标,确定第二坐标,包括:
在所述至少两个第一坐标满足第一预设条件的情况下,根据所述第一图像的尺寸、目标尺寸和所述第一坐标,确定每个第一坐标对应的第二坐标,得到至少两个第二坐标;
在所述至少两个第一坐标不满足第一预设条件的情况下,根据所述至少两个第一坐标确定第三坐标,并根据所述第一图像的尺寸、目标尺寸和所述第三坐标,确定第二坐标,其中,所述第三坐标为至少两个目标对象的中心的坐标。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
在得到至少两个第二坐标的情况下,分别基于每个第二坐标对所述第一图像进行裁剪,得到至少两张目标尺寸的第二图像。
6.根据权利要求1-5任意一项所述的方法,其特征在于,在所述获取目标对象在第一图像中的第一坐标之后,所述方法还包括:
在所述目标对象的显示面积占所述第一图像的第一比值小于第一预设阈值的情况下,基于第一放大比例放大所述第一图像并更新所述第一坐标,其中,所述第一放大比例为所述第一预设阈值与所述第一比值的比值。
7.根据权利要求1-5任意一项所述的方法,其特征在于,在所述获取目标对象在第一图像中的第一坐标之前,所述方法还包括:
获取第二尺寸的原始图像;
在所述第二尺寸大于目标尺寸的情况下,确定所述原始图像为所述第一图像;
在所述第二尺寸小于目标尺寸的情况下,按照第二放大比例对所述原始图像进行放大,得到所述第一图像;
其中,所述第二尺寸包括第二宽度值和第二高度值,所述目标尺寸包括目标宽度值和目标高度值,所述第二放大比例为所述目标宽度值与第二宽度值的比值、所述目标高度值与第二高度值的比值中的最大值。
8.一种图像处理装置,其特征在于,所述装置包括:
获取模块,用于获取目标对象在第一图像中的第一坐标;
确定模块,用于根据所述第一图像的尺寸、目标尺寸和所述第一坐标,确定第二坐标;
显示模块,用于显示目标尺寸的第二图像,其中,所述第二图像是基于所述第一图像生成的,所述第二图像的中心位置为所述第二坐标。
9.根据权利要求8所述的装置,其特征在于,所述获取模块包括:
获取单元,用于获取所述第一图像中所述目标对象的识别信息,所述识别信息包括所述目标对象的类别信息,以及所述目标对象对应的目标框的坐标信息和第一尺寸信息;
确定单元,用于在所述目标框对应的第一尺寸小于或等于所述目标尺寸的情况下,根据所述坐标信息和所述第一尺寸信息,确定所述目标框的中心坐标,得到所述第一坐标;
所述确定单元,还用于在所述第一尺寸大于目标尺寸的情况下,根据所述坐标信息、所述第一尺寸信息以及所述类别信息对应的预设权重,确定所述第一坐标。
10.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-7任一项所述的图像处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111217656.5A CN113837195A (zh) | 2021-10-19 | 2021-10-19 | 图像处理方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111217656.5A CN113837195A (zh) | 2021-10-19 | 2021-10-19 | 图像处理方法、装置、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113837195A true CN113837195A (zh) | 2021-12-24 |
Family
ID=78965593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111217656.5A Pending CN113837195A (zh) | 2021-10-19 | 2021-10-19 | 图像处理方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113837195A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150363952A1 (en) * | 2014-06-12 | 2015-12-17 | Hisense Electric Co., Ltd. | Image Obtaining Method, Photographing Apparatus And Storage Medium |
CN106817533A (zh) * | 2015-11-27 | 2017-06-09 | 小米科技有限责任公司 | 图像处理方法及装置 |
CN108647590A (zh) * | 2018-04-25 | 2018-10-12 | 董志忠 | 一种智能头像处理算法 |
CN110211195A (zh) * | 2019-05-22 | 2019-09-06 | 北京字节跳动网络技术有限公司 | 生成图像集合的方法、装置、电子设备和计算机可读存储介质 |
CN210007799U (zh) * | 2018-10-26 | 2020-01-31 | 深圳市道通智能航空技术有限公司 | 图像处理系统及无人机 |
CN112036317A (zh) * | 2020-08-31 | 2020-12-04 | 成都新潮传媒集团有限公司 | 一种人脸图像截取方法、装置及计算机设备 |
CN112307978A (zh) * | 2020-10-30 | 2021-02-02 | 腾讯科技(深圳)有限公司 | 目标检测方法、装置、电子设备及可读存储介质 |
CN113205031A (zh) * | 2021-04-27 | 2021-08-03 | 广东小天才科技有限公司 | 图像识别方法、装置、终端设备及存储介质 |
-
2021
- 2021-10-19 CN CN202111217656.5A patent/CN113837195A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150363952A1 (en) * | 2014-06-12 | 2015-12-17 | Hisense Electric Co., Ltd. | Image Obtaining Method, Photographing Apparatus And Storage Medium |
CN106817533A (zh) * | 2015-11-27 | 2017-06-09 | 小米科技有限责任公司 | 图像处理方法及装置 |
CN108647590A (zh) * | 2018-04-25 | 2018-10-12 | 董志忠 | 一种智能头像处理算法 |
CN210007799U (zh) * | 2018-10-26 | 2020-01-31 | 深圳市道通智能航空技术有限公司 | 图像处理系统及无人机 |
CN110211195A (zh) * | 2019-05-22 | 2019-09-06 | 北京字节跳动网络技术有限公司 | 生成图像集合的方法、装置、电子设备和计算机可读存储介质 |
CN112036317A (zh) * | 2020-08-31 | 2020-12-04 | 成都新潮传媒集团有限公司 | 一种人脸图像截取方法、装置及计算机设备 |
CN112307978A (zh) * | 2020-10-30 | 2021-02-02 | 腾讯科技(深圳)有限公司 | 目标检测方法、装置、电子设备及可读存储介质 |
CN113205031A (zh) * | 2021-04-27 | 2021-08-03 | 广东小天才科技有限公司 | 图像识别方法、装置、终端设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111612873B (zh) | Gif图片生成方法、装置及电子设备 | |
CN110100251B (zh) | 用于处理文档的设备、方法和计算机可读存储介质 | |
CN113126862B (zh) | 截屏方法、装置、电子设备以及可读存储介质 | |
CN112269522A (zh) | 图像处理方法、装置、电子设备和可读存储介质 | |
CN108111747A (zh) | 一种图像处理方法、终端设备及计算机可读介质 | |
CN112449110B (zh) | 图像处理方法、装置及电子设备 | |
CN112099714B (zh) | 截图方法、装置、电子设备及可读存储介质 | |
CN113946250A (zh) | 文件夹显示方法、装置及电子设备 | |
CN113689525A (zh) | 文字美化方法、装置、可读存储介质和电子设备 | |
CN112309449A (zh) | 音频录制方法及装置 | |
CN111639639B (zh) | 检测文本区域的方法、装置、设备及存储介质 | |
WO2021051580A1 (zh) | 基于分组批量的图片检测方法、装置及存储介质 | |
CN113610864B (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN113392820B (zh) | 动态手势识别方法、装置、电子设备及可读存储介质 | |
CN113837195A (zh) | 图像处理方法、装置、设备和存储介质 | |
CN112150486A (zh) | 图像处理方法及装置 | |
CN113157184A (zh) | 内容显示方法、装置、电子设备和可读存储介质 | |
CN114049473A (zh) | 图像处理方法及装置 | |
CN114118029A (zh) | 图像处理方法、装置、设备和存储介质 | |
CN113473012A (zh) | 虚化处理方法、装置和电子设备 | |
CN113271378A (zh) | 图像处理方法、装置及电子设备 | |
CN112887607A (zh) | 拍摄提示的方法及装置 | |
CN112165584A (zh) | 录像方法、装置、电子设备以及可读存储介质 | |
CN112381719B (zh) | 图像处理方法及装置 | |
JP2014153747A (ja) | 画像複雑度に基づいてキャラクタ表示を制御するプログラム、情報機器及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |