CN115830303A - 图像处理方法、装置及存储介质 - Google Patents
图像处理方法、装置及存储介质 Download PDFInfo
- Publication number
- CN115830303A CN115830303A CN202111082939.3A CN202111082939A CN115830303A CN 115830303 A CN115830303 A CN 115830303A CN 202111082939 A CN202111082939 A CN 202111082939A CN 115830303 A CN115830303 A CN 115830303A
- Authority
- CN
- China
- Prior art keywords
- image
- sub
- target
- edge
- coordinates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本公开涉及一种图像处理方法、装置及存储介质。图像处理方法包括:获取待处理图像,对所述待处理图像进行目标检测,得到至少一个目标的边框坐标;根据每个所述目标的边框坐标,对所述待处理图像进行剪裁,得到与每个所述目标对应的子图像;对每个所述子图像进行边缘检测,确定每个所述子图像的边缘点坐标,并确定每个所述子图像的属性类别;根据每个所述子图像的边缘点坐标和属性类别,对所述待处理图像进行装饰,得到目标图像。通过本公开,可快速便捷地制作图片博客。
Description
技术领域
本公开涉及图像处理领域,尤其涉及一种图像处理方法、装置及存储介质。
背景技术
随着智能终端的快速普及,社会已经进入了流媒体时代,视频和图像已经逐渐取代了文字,成为了人们获取信息的主要方式。同时,人们的社交生活也逐渐发生了改变,例如80后流行在博客里写日记,称为日记博客(diary-log,Blog),90后流行用视频记录生活,称为视频博客(video-log,Vlog),而00后则用文字贴纸照片占领网络,称为图片博客(photo-log,Plog)。
目前,制作Plog时,一般都是用户自己在各类图片处理APP上选取图片,然后手动进行DIY和编辑,形成Plog。这种手工方式效率低下,用户创造不便捷。
发明内容
为克服相关技术中存在的问题,本公开提供一种图像处理方法、装置及存储介质。
根据本公开实施例的第一方面,提供一种图像处理方法,包括:
获取待处理图像,对所述待处理图像进行目标检测,得到至少一个目标的边框坐标;
根据每个所述目标的边框坐标,对所述待处理图像进行剪裁,得到与每个所述目标对应的子图像;
对每个所述子图像进行边缘检测,确定每个所述子图像的边缘点坐标,并确定每个所述子图像的属性类别;
根据每个所述子图像的边缘点坐标和属性类别,对所述待处理图像进行装饰,得到目标图像。
可选地,所述对所述待处理图像进行目标检测,得到至少一个目标的边框坐标,包括:
将所述待处理图像输入预先训练的目标检测模型中,并获取所述目标检测模型输出的检测结果;所述检测结果包括:多个目标的边框坐标;
其中,所述目标检测模型基于如下方式训练得到:
将图像数据集作为模型的输入,其中,所述图像数据集中的每一图像包含样本目标的标注框,将所述标注框的标注框坐标以及所述样本目标的向量置信度作为模型的目标输出,对所述模型进行训练,以得到所述目标检测模型,所述样本目标的向量置信度描述所述样本目标对应的属性类别的概率。
可选地,所述根据每个所述目标的边框坐标,对所述待处理图像进行剪裁,得到与每个所述目标对应的子图像,包括:
按照预设的边框坐标变化量,对每个所述目标的边框坐标向外扩充,得到每个所述目标的修正边框坐标;
根据每个所述目标的修正边框坐标,对所述待处理图像进行剪裁,得到与每个所述目标对应的子图像。
可选地,所述对每个所述子图像进行边缘检测,确定每个所述子图像的边缘点坐标,包括:
将每个所述子图像作为目标子图像,获取所述目标子图像的边缘强度图,其中,所述边缘强度图为与所述目标子图像具有相同分辨率的灰度图;
将所述边缘强度图中包括的像素点与预设的像素阈值进行比较,将像素值大于所述像素阈值的像素点作为所述边缘强度图的边缘点;
将所述边缘点的坐标,确定为所述目标子图像的边缘点坐标。
可选地,所述检测结果还包括:每个所述目标的多维第一向量置信度,每一维度所述第一向量置信度描述对应目标的第一属性类别的概率;
所述确定每个所述子图像的属性类别,包括:
将每个所述子图像作为目标子图像,从所述目标子图像的多维第一向量置信度中获取最高的第一向量置信度;
根据最高的第一向量置信度,得到所述目标子图像对应的第一属性类别。
可选地,所述确定每个所述子图像的属性类别,包括:
将每个所述子图像输入预先训练的分类模型中,通过所述分类模型提取每个所述子图像的特征,根据每个所述子图像的特征,输出每个所述子图像的多维第二向量置信度,其中,每一维度所述第二向量置信度描述对应子图的第二属性类别的概率;
将每个所述子图像作为目标子图像,将所述目标子图像的每一第二向量置信度与预设的置信度阈值进行比较,获取大于所述置信度阈值且置信度最高的第二向量置信度,根据所述置信度最高的第二向量置信度,得到所述目标子图像对应的第二属性类别。
可选地,所述根据每个所述子图像的边缘点坐标和属性类别,对所述待处理图像进行装饰,得到目标图像,包括:
根据每个所述子图像的边缘点坐标,确定所述子图像的边缘线条,以及根据每个所述子图像的属性类别,确定与每个所述子图像匹配的装饰贴纸,所述装饰贴纸包括图像类装饰贴纸、文字类装饰贴纸、表情类装饰贴纸中的一种或几种;
根据所述边缘线条,以及与每个所述子图像匹配的装饰贴纸,对所述待处理图像进行装饰,得到目标图像。
可选地,所述确定所述子图像的边缘线条,包括:
根据每个所述子图像的边缘点坐标,从预先存储的线条素材库中随机选择一种风格的线条,将选择的线条作为每个所述子图像的边缘线条;
所述确定与每个所述子图像匹配的装饰贴纸,包括:
根据每个所述子图像的属性类别,按照与属性类别的相关度由强到弱的顺序,输出每个所述子图像的备选装饰贴纸;
获取备选装饰贴纸中被选择的目标装饰贴纸,将所述目标备选贴纸作为与每个所述子图像匹配的装饰贴纸。
根据本公开实施例的第二方面,提供一种图像处理装置,包括:
检测模块,用于获取待处理图像,对所述待处理图像进行目标检测,得到至少一个目标的边框坐标;
剪裁模块,用于根据每个所述目标的边框坐标,对所述待处理图像进行剪裁,得到与每个所述目标对应的子图像;
确定模块,用于对每个所述子图像进行边缘检测,确定每个所述子图像的边缘点坐标,并确定每个所述子图像的属性类别;
装饰模块,用于根据每个所述子图像的边缘点坐标和属性类别,对所述待处理图像进行装饰,得到目标图像。
可选地,所述检测模块采用如下方式对所述待处理图像进行目标检测,得到至少一个目标的边框坐标:
将所述待处理图像输入预先训练的目标检测模型中,并获取所述目标检测模型输出的检测结果;所述检测结果包括:多个目标的边框坐标;
其中,所述目标检测模型基于如下方式训练得到:
将图像数据集作为模型的输入,其中,所述图像数据集中的每一图像包含样本目标的标注框,将所述标注框的标注框坐标以及所述样本目标的向量置信度作为模型的目标输出,对所述模型进行训练,以得到所述目标检测模型,所述样本目标的向量置信度描述所述样本目标对应的属性类别的概率。
可选地,所述剪裁模块采用如下方式对所述待处理图像进行剪裁,得到与每个所述目标对应的子图像:
根据每个所述目标的边框坐标,按照预设的边框坐标变化量,对每个所述目标的边框坐标向外扩充,得到每个所述目标的修正边框坐标;
根据每个所述目标的修正边框坐标,对所述待处理图像进行剪裁,得到与每个所述目标对应的子图像。
可选地,所述确定模块采用如下方式对每个所述子图像进行边缘检测,确定每个所述子图像的边缘点坐标:
将每个所述子图像作为目标子图像,获取所述目标子图像的边缘强度图,其中,所述边缘强度图为与所述目标子图像具有相同分辨率的灰度图;
将所述边缘强度图中包括的像素点与预设的像素阈值进行比较,将像素值大于所述像素阈值的像素点作为所述边缘强度图的边缘点;
将所述边缘点的坐标,确定为所述目标子图像的边缘点坐标。
可选地,所述检测结果还包括:每个所述目标的多维第一向量置信度,每一维度所述第一向量置信度描述对应目标的第一属性类别的概率;
所述确定模块采用如下方式确定每个所述子图像的属性类别:
将每个所述子图像作为目标子图像,从所述目标子图像的多维第一向量置信度中获取最高的第一向量置信度;
根据最高的第一向量置信度,得到所述目标子图像对应的第一属性类别。
可选地,所述确定模块采用如下方式确定每个所述子图像的属性类别:
将每个所述子图像输入预先训练的分类模型中,通过所述分类模型提取每个所述子图像的特征,根据每个所述子图像的特征,输出每个所述子图像的多维第二向量置信度,其中,每一维度所述第二向量置信度描述对应子图的第二属性类别的概率;
将每个所述子图像作为目标子图像,将所述目标子图像的每一第二向量置信度与预设的置信度阈值进行比较,获取大于所述置信度阈值且置信度最高的第二向量置信度,根据所述置信度最高的第二向量置信度,得到所述目标子图像对应的第二属性类别。
可选地,所述装饰模块采用如下方式根据每个所述子图像的边缘点坐标和属性类别,对所述待处理图像进行装饰,得到目标图像:
根据每个所述子图像的边缘点坐标,确定所述子图像的边缘线条,以及根据每个所述子图像的属性类别,确定与每个所述子图像匹配的装饰贴纸,所述装饰贴纸包括图像类装饰贴纸、文字类装饰贴纸、表情类装饰贴纸中的一种或几种;
根据所述边缘线条,以及与每个所述子图像匹配的装饰贴纸,对所述待处理图像进行装饰,得到目标图像。
可选地,所述装饰模块采用如下方式确定所述子图像的边缘线条:
根据每个所述子图像的边缘点坐标,从预先存储的线条素材库中随机选择一种风格的线条,将选择的线条作为每个所述子图像的边缘线条;
所述确定与每个所述子图像匹配的装饰贴纸,包括:
根据每个所述子图像的属性类别,按照与属性类别的相关度由强到弱的顺序,输出每个所述子图像的备选装饰贴纸;
获取备选装饰贴纸中被选择的目标装饰贴纸,将所述目标备选贴纸作为与每个所述子图像匹配的装饰贴纸。
根据本公开实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提供的图像处理方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:通过对所述待处理图像进行目标检测,得到至少一个目标的边框坐标,根据每个所述目标的边框坐标,对所述待处理图像进行剪裁,得到与每个所述目标对应的子图像,对每个所述子图像进行边缘检测,确定每个所述子图像的边缘点坐标,并确定每个所述子图像的属性类别之后,可根据每个所述子图像的边缘点坐标和属性类别,基于预先存储的线条素材库和装饰贴纸图库对所述待处理图像进行装饰,实现快速便捷地制作plog。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种图像处理方法的流程图。
图2是根据一示例性实施例示出的一种图像处理装置的框图。
图3是根据一示例性实施例示出的一种装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种图像处理方法的流程图,如图1所示,图像处理方法用于终端中,包括以下步骤。
在步骤S11中,获取待处理图像,对待处理图像进行目标检测,得到至少一个目标的边框坐标。
本公开中,目标可以是图像中包括的对象,例如动物、植物、人物等等。得到的目标的边框坐标例如可以是标记边框左上角额坐标和边框右下角的坐标。
一种实施方式中,例如可通过如下方式对待处理图像进行目标检测,得到至少一个目标的边框坐标:
将待处理图像输入预先训练的目标检测模型中,并获取目标检测模型输出的检测结果;检测结果包括:多个目标的边框坐标。
例如,待处理图像为多人一起聚餐的图像,对待处理图像进行目标检测,分别得到每个人物的边框坐标和食物的边框坐标。具体地,可以将待处理图像输入目标检测模型中,获取目标检测模型输出的多个人物的边框坐标,以及食物的边框坐标。
其中,目标检测模型基于如下方式训练得到:
将图像数据集作为模型的输入,其中,图像数据集中的每一图像包含样本目标的标注框,将标注框的标注框坐标以及样本目标的向量置信度作为模型的目标输出,对模型进行训练,以得到目标检测模型,样本目标的向量置信度描述样本目标对应的属性类别的概率。
示例地,目标检测模型的基本架构可以是D2Det。图像数据集可以是公开数据集object365数据集,对目标检测模型训练时,训练标签可以是图片中样本目标的标注框坐标,将包含样本目标的标注框的图片输入模型,通过模型输出样本目标的365类属性类别的向量置信度以及边框坐标。
在步骤S12中,根据每个目标的边框坐标,对待处理图像进行剪裁,得到与每个目标对应的子图像。
一种实施方式中,例如可通过如下方式对待处理图像进行剪裁,得到与每个目标对应的子图像:
按照预设的边框坐标变化量,对每个目标的边框坐标向外扩充,得到每个目标的修正边框坐标,根据每个目标的修正边框坐标,对待处理图像进行剪裁,得到与每个目标对应的子图像。
例如,对每个目标的边框坐标向外扩20像素,然后根据外扩得到的修正边框,对待处理图像进行剪裁,得到与每个目标对应的子图像。
针对上述多人聚餐的图像,在得到目标的边框坐标即每个人物的边框坐标和食物的边框坐标之后,例如可对每个人物以及食物的边框向外扩充,例如向外扩充20像素,然后根据外扩得到的每个人物以及食物的修正边框,对该多人聚餐的图像进行剪裁,得到与每个人物以及食物对应的子图像。
在步骤S13中,对每个子图像进行边缘检测,确定每个子图像的边缘点坐标,并确定每个子图像的属性类别。
一种实施方式中,例如可通过如下方式对每个子图像进行边缘检测,确定每个子图像的边缘点坐标:
将每个子图像作为目标子图像,获取目标子图像的边缘强度图,其中,边缘强度图为与目标子图像具有相同分辨率的灰度图,将边缘强度图中包括的像素点与预设的像素阈值进行比较,将像素值大于像素阈值的像素点作为边缘强度图的边缘点,将边缘点的坐标,确定为目标子图像的边缘点坐标。
示例性地,例如可将目标子图像输入预先训练的边缘检测模型,通过边缘检测模型获取目标子图像的边缘强度图,并输出。其中,边缘检测模型的基本框架可以是DcNet,使用公开数据集PASCAL Instance Occlusion Datsset(PIOD)对边缘检测模型进行训练,输入图片例如随机裁剪为320*320像素,标签为描述目标边缘的一系列坐标点。通过边缘检测模型进行推理时,输入单张图片,输出为该图片的边缘强度图,通过输出的边缘强度图中像素值的大小,代表边缘强度图的边缘即边界的可能性大小。
之后,再将边缘强度图中包括的像素点与预设的像素阈值进行比较,将像素值大于像素阈值的像素点作为边缘强度图的边缘点,并确定为每个目标子图像的边缘点坐标。
为了快速确定每个子图像的属性类别,一种实施方式中,目标检测模型输出的检测结果还包括:每个目标的多维第一向量置信度,每一维度第一向量置信度描述对应目标的第一属性类别的概率,进而在对待处理图像进行目标检测,得到至少一个目标的边框坐标的同时,可一并确定得到每个子图像的属性类别。
具体地,可将每个子图像作为目标子图像,将每个子图像作为目标子图像,从目标子图像的多维第一向量置信度中获取最高的第一向量置信度,根据最高的第一向量置信度,得到目标子图像对应的第一属性类别。
其中,第一属性类别对应365类的分类类别,在该分类中,例如可将鞋子分为运动鞋、拖鞋、皮鞋、长筒靴、其他鞋等等。
在实际制作plog时,不需要细粒度的分类类别,例如只需要对图像中的目标分类为鞋即可,故,本公开中,可不采用目标检测模型输出的每个目标的多维第一向量置信度的检测结果,而是重新确定每个子图像的属性类别。
示例地,可通过如下方式确定每个子图像的属性类别:
将每个子图像输入预先训练的分类模型中,通过分类模型提取每个子图像的特征,根据每个子图像的特征,输出每个子图像的多维第二向量置信度,其中,每一维度第二向量置信度描述对应子图的第二属性类别的概率。将每个子图像作为目标子图像,将目标子图像的每一第二向量置信度与预设的置信度阈值进行比较,获取大于置信度阈值且置信度最高的第二向量置信度,根据置信度最高的第二向量置信度,得到目标子图像对应的第二属性类别。
其中,分类模型可以是基于CNN的图像分类器。假设收集的图像第二属性类别数为N,则该图像分类器可以输出一个N维向量,向量的第i维度(i∈{1,2,3...N})表示该分类器将这张图片分为第i属性类别的置信度。
例如针对上述多人聚餐的图像,在得到与每个人物对应的子图像以及与食物对应的子图像后,可分别获取每个子图像的边缘强度图,,将每个子图像的边缘强度图中包括的像素点与预设的像素阈值进行比较,将像素值大于像素阈值的像素点作为该边缘强度图的边缘点,将该边缘强度图的边缘点的坐标确定为对应子图像的边缘点坐标。
在确定子图像的属性类别时,可通过目标检测模型输出的每个目标即子图像的多维第一向量置信度确定,由于目标检测模型基于365类分类类别的样本图像训练得到,故通过目标检测模型确定的子图像的属性类别粒度比较细,例如可得到人物中包括的男生的属性类别和女生的属性类别。
而实际制作plog时,不需要类似目标检测模型输出的细粒度的分类类别,故,本公开中,可另外训练一个分类模型,将每个子图像输入该分类模型中,通过该分类模型得到子图像的人物的属性类别和子图像的食物的属性类别。
在步骤S14中,根据每个子图像的边缘点坐标和属性类别,对待处理图像进行装饰,得到目标图像。
一种实施方式中,可通过如下方式根据每个子图像的边缘点坐标和属性类别,对待处理图像进行装饰,得到目标图像:
根据每个子图像的边缘点坐标,从预先存储的线条素材库中随机选择一种风格的线条,对每个子图像的边缘进行描边,其中,线条可以是包括各种风格的实线和虚线。
根据每个子图像的属性类别,从装饰贴纸图库中输出与每个子图像属性类别的最相关的装饰贴纸。
其中,装饰贴纸包括图像类装饰贴纸、文字类装饰贴纸、表情类装饰贴纸中的一种或几种。
例如针对上述多人聚餐的图像,根据每个人物子图像的边缘点坐标,以及食物子图像的边缘点坐标,可以从预先存储的线条素材库中随机选择一种风格的线条,对每个子图像的边缘进行描边。以及根据每个子图像的属性类别,从装饰贴纸图库中输出与每个子图像属性类别的最相关的装饰贴纸,例如输出与人物相关的“聚会时光”的文字贴纸,气球图像的图像类贴纸,以及与食物相关的爱心图像的图像类贴纸和流口水表情的表情类贴纸。
根据与子图像相关的装饰贴纸,可按照将“聚会时光”的文字贴纸置于聚餐的图像的中间位置,将气球图像的图像类贴纸置于人物周围,将爱心图像的图像类贴纸和流口水表情的表情类贴纸置于食物周围,得到装饰后的目标图像。
此外,为满足用户个性化需求,可根据每个子图像的边缘点坐标,从预先存储的线条素材库中随机选择多种风格的线条输出,供用户选择,将用户选择的线条作为对应子图像的边缘线条,对待处理图像中对应的子图像进行描边。并且用户可针对线条进行二次编辑或者风格切换。
根据每个子图像的属性类别,按照与属性类别的相关度由强到弱的顺序,从装饰贴纸图库中输出每个子图像的备选装饰贴纸。基于用户对备选装饰贴纸的选择,获取备选装饰贴纸中被选择的目标装饰贴纸,将目标备选贴纸作为与每个子图像匹配的装饰贴纸。
在本公开的示例性实施例中,通过对待处理图像进行目标检测,得到至少一个目标的边框坐标,根据每个目标的边框坐标,对待处理图像进行剪裁,得到与每个目标对应的子图像,对每个子图像进行边缘检测,确定每个子图像的边缘点坐标,并确定每个子图像的属性类别之后,可根据每个子图像的边缘点坐标和属性类别,基于预先存储的线条素材库和装饰贴纸图库对待处理图像进行装饰,实现快速便捷地制作plog。
图2是根据一示例性实施例示出的一种图像处理装置200的框图。参照图2,图像处理装置,包括:
检测模块201,用于获取待处理图像,对所述待处理图像进行目标检测,得到至少一个目标的边框坐标;
剪裁模块202,用于根据每个所述目标的边框坐标,对所述待处理图像进行剪裁,得到与每个所述目标对应的子图像;
确定模块203,用于对每个所述子图像进行边缘检测,确定每个所述子图像的边缘点坐标,并确定每个所述子图像的属性类别;
装饰模块204,用于根据每个所述子图像的边缘点坐标和属性类别,对所述待处理图像进行装饰,得到目标图像。
可选地,所述检测模块201采用如下方式对所述待处理图像进行目标检测,得到至少一个目标的边框坐标:
将所述待处理图像输入预先训练的目标检测模型中,并获取所述目标检测模型输出的检测结果;所述检测结果包括:多个目标的边框坐标;
其中,所述目标检测模型基于如下方式训练得到:
将图像数据集作为模型的输入,其中,所述图像数据集中的每一图像包含样本目标的标注框,将所述标注框的标注框坐标以及所述样本目标的向量置信度作为模型的目标输出,对所述模型进行训练,以得到所述目标检测模型,所述样本目标的向量置信度描述所述样本目标对应的属性类别的概率。
可选地,所述剪裁模块202采用如下方式对所述待处理图像进行剪裁,得到与每个所述目标对应的子图像:
根据每个所述目标的边框坐标,按照预设的边框坐标变化量,对每个所述目标的边框坐标向外扩充,得到每个所述目标的修正边框坐标;
根据每个所述目标的修正边框坐标,对所述待处理图像进行剪裁,得到与每个所述目标对应的子图像。
可选地,所述确定模块203采用如下方式对每个所述子图像进行边缘检测,确定每个所述子图像的边缘点坐标:
将每个所述子图像作为目标子图像,获取所述目标子图像的边缘强度图,其中,所述边缘强度图为与所述目标子图像具有相同分辨率的灰度图;
将所述边缘强度图中包括的像素点与预设的像素阈值进行比较,将像素值大于所述像素阈值的像素点作为所述边缘强度图的边缘点;
将所述边缘点的坐标,确定为所述目标子图像的边缘点坐标。
可选地,所述检测结果还包括:每个所述目标的多维第一向量置信度,每一维度所述第一向量置信度描述对应目标的第一属性类别的概率;
所述确定模块203采用如下方式确定每个所述子图像的属性类别:
将每个所述子图像作为目标子图像,从所述目标子图像的多维第一向量置信度中获取最高的第一向量置信度;
根据最高的第一向量置信度,得到所述目标子图像对应的第一属性类别。
可选地,所述确定模块203采用如下方式确定每个所述子图像的属性类别:
将每个所述子图像输入预先训练的分类模型中,通过所述分类模型提取每个所述子图像的特征,根据每个所述子图像的特征,输出每个所述子图像的多维第二向量置信度,其中,每一维度所述第二向量置信度描述对应子图的第二属性类别的概率;
将每个所述子图像作为目标子图像,将所述目标子图像的每一第二向量置信度与预设的置信度阈值进行比较,获取大于所述置信度阈值且置信度最高的第二向量置信度,根据所述置信度最高的第二向量置信度,得到所述目标子图像对应的第二属性类别。
可选地,所述装饰模块204采用如下方式根据每个所述子图像的边缘点坐标和属性类别,对所述待处理图像进行装饰,得到目标图像:
根据每个所述子图像的边缘点坐标,确定所述子图像的边缘线条,以及根据每个所述子图像的属性类别,确定与每个所述子图像匹配的装饰贴纸,所述装饰贴纸包括图像类装饰贴纸、文字类装饰贴纸、表情类装饰贴纸中的一种或几种;
根据所述边缘线条,以及与每个所述子图像匹配的装饰贴纸,对所述待处理图像进行装饰,得到目标图像。
可选地,所述装饰模块204采用如下方式确定所述子图像的边缘线条:
根据每个所述子图像的边缘点坐标,从预先存储的线条素材库中随机选择一种风格的线条,将选择的线条作为每个所述子图像的边缘线条;
所述确定与每个所述子图像匹配的装饰贴纸,包括:
根据每个所述子图像的属性类别,按照与属性类别的相关度由强到弱的顺序,输出每个所述子图像的备选装饰贴纸;
获取备选装饰贴纸中被选择的目标装饰贴纸,将所述目标备选贴纸作为与每个所述子图像匹配的装饰贴纸。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开提供的图像处理方法的步骤。
图3是根据一示例性实施例示出的一种用于图像处理的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图3,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电力组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的图像处理方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述图像处理方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述图像处理方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的图像处理方法的代码部分。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (11)
1.一种图像处理方法,其特征在于,包括:
获取待处理图像,对所述待处理图像进行目标检测,得到至少一个目标的边框坐标;
根据每个所述目标的边框坐标,对所述待处理图像进行剪裁,得到与每个所述目标对应的子图像;
对每个所述子图像进行边缘检测,确定每个所述子图像的边缘点坐标,并确定每个所述子图像的属性类别;
根据每个所述子图像的边缘点坐标和属性类别,对所述待处理图像进行装饰,得到目标图像。
2.根据权利要求1所述的方法,其特征在于,所述对所述待处理图像进行目标检测,得到至少一个目标的边框坐标,包括:
将所述待处理图像输入预先训练的目标检测模型中,并获取所述目标检测模型输出的检测结果;所述检测结果包括:多个目标的边框坐标;
其中,所述目标检测模型基于如下方式训练得到:
将图像数据集作为模型的输入,其中,所述图像数据集中的每一图像包含样本目标的标注框,将所述标注框的标注框坐标以及所述样本目标的向量置信度作为模型的目标输出,对所述模型进行训练,以得到所述目标检测模型,所述样本目标的向量置信度描述所述样本目标对应的属性类别的概率。
3.根据权利要求1所述的方法,其特征在于,所述根据每个所述目标的边框坐标,对所述待处理图像进行剪裁,得到与每个所述目标对应的子图像,包括:
按照预设的边框坐标变化量,对每个所述目标的边框坐标向外扩充,得到每个所述目标的修正边框坐标;
根据每个所述目标的修正边框坐标,对所述待处理图像进行剪裁,得到与每个所述目标对应的子图像。
4.根据权利要求1所述的方法,其特征在于,所述对每个所述子图像进行边缘检测,确定每个所述子图像的边缘点坐标,包括:
将每个所述子图像作为目标子图像,获取所述目标子图像的边缘强度图,其中,所述边缘强度图为与所述目标子图像具有相同分辨率的灰度图;
将所述边缘强度图中包括的像素点与预设的像素阈值进行比较,将像素值大于所述像素阈值的像素点作为所述边缘强度图的边缘点;
将所述边缘点的坐标,确定为所述目标子图像的边缘点坐标。
5.根据权利要求2所述的方法,其特征在于,所述检测结果还包括:每个所述目标的多维第一向量置信度,每一维度所述第一向量置信度描述对应目标的第一属性类别的概率;
所述确定每个所述子图像的属性类别,包括:
将每个所述子图像作为目标子图像,从所述目标子图像的多维第一向量置信度中获取最高的第一向量置信度;
根据最高的第一向量置信度,得到所述目标子图像对应的第一属性类别。
6.根据权利要求1所述的方法,其特征在于,所述确定每个所述子图像的属性类别,包括:
将每个所述子图像输入预先训练的分类模型中,通过所述分类模型提取每个所述子图像的特征,根据每个所述子图像的特征,输出每个所述子图像的多维第二向量置信度,其中,每一维度所述第二向量置信度描述对应子图的第二属性类别的概率;
将每个所述子图像作为目标子图像,将所述目标子图像的每一第二向量置信度与预设的置信度阈值进行比较,获取大于所述置信度阈值且置信度最高的第二向量置信度,根据所述置信度最高的第二向量置信度,得到所述目标子图像对应的第二属性类别。
7.根据权利要求1所述的方法,其特征在于,所述根据每个所述子图像的边缘点坐标和属性类别,对所述待处理图像进行装饰,得到目标图像,包括:
根据每个所述子图像的边缘点坐标,确定所述子图像的边缘线条,以及根据每个所述子图像的属性类别,确定与每个所述子图像匹配的装饰贴纸,所述装饰贴纸包括图像类装饰贴纸、文字类装饰贴纸、表情类装饰贴纸中的一种或几种;
根据所述边缘线条,以及与每个所述子图像匹配的装饰贴纸,对所述待处理图像进行装饰,得到目标图像。
8.根据权利要求7所述的方法,其特征在于,所述确定所述子图像的边缘线条,包括:
根据每个所述子图像的边缘点坐标,从预先存储的线条素材库中随机选择一种风格的线条,将选择的线条作为每个所述子图像的边缘线条;
所述确定与每个所述子图像匹配的装饰贴纸,包括:
根据每个所述子图像的属性类别,按照与属性类别的相关度由强到弱的顺序,输出每个所述子图像的备选装饰贴纸;
获取备选装饰贴纸中被选择的目标装饰贴纸,将所述目标备选贴纸作为与每个所述子图像匹配的装饰贴纸。
9.一种图像处理装置,其特征在于,包括:
检测模块,用于获取待处理图像,对所述待处理图像进行目标检测,得到至少一个目标的边框坐标;
剪裁模块,用于根据每个所述目标的边框坐标,对所述待处理图像进行剪裁,得到与每个所述目标对应的子图像;
确定模块,用于对每个所述子图像进行边缘检测,确定每个所述子图像的边缘点坐标,并确定每个所述子图像的属性类别;
装饰模块,用于根据每个所述子图像的边缘点坐标和属性类别,对所述待处理图像进行装饰,得到目标图像。
10.一种图像处理装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:实现权利要求1~8中任一项所述方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1~8中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111082939.3A CN115830303A (zh) | 2021-09-15 | 2021-09-15 | 图像处理方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111082939.3A CN115830303A (zh) | 2021-09-15 | 2021-09-15 | 图像处理方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115830303A true CN115830303A (zh) | 2023-03-21 |
Family
ID=85515582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111082939.3A Pending CN115830303A (zh) | 2021-09-15 | 2021-09-15 | 图像处理方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115830303A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117435110A (zh) * | 2023-10-11 | 2024-01-23 | 书行科技(北京)有限公司 | 一种图片处理方法、装置、电子设备和存储介质 |
-
2021
- 2021-09-15 CN CN202111082939.3A patent/CN115830303A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117435110A (zh) * | 2023-10-11 | 2024-01-23 | 书行科技(北京)有限公司 | 一种图片处理方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106776890B (zh) | 视频播放进度的调整方法及装置 | |
CN105094760B (zh) | 一种图片标记方法及装置 | |
CN104615769B (zh) | 图片分类方法及装置 | |
US10013600B2 (en) | Digital image processing method and apparatus, and storage medium | |
CN107818180B (zh) | 视频关联方法、视频显示方法、装置及存储介质 | |
EP3226204A1 (en) | Method and apparatus for intelligently capturing image | |
CN107665238B (zh) | 图片处理方法和装置、用于图片处理的装置 | |
CN111506758B (zh) | 物品名称确定方法、装置、计算机设备及存储介质 | |
CN106485567B (zh) | 物品推荐方法及装置 | |
CN111986076A (zh) | 图像处理方法及装置、互动式展示装置和电子设备 | |
CN110781323A (zh) | 多媒体资源的标签确定方法、装置、电子设备及存储介质 | |
CN111553372B (zh) | 一种训练图像识别网络、图像识别搜索的方法及相关装置 | |
CN111526287A (zh) | 图像拍摄方法、装置、电子设备、服务器、系统及存储介质 | |
CN113099297A (zh) | 卡点视频的生成方法、装置、电子设备及存储介质 | |
CN112464031A (zh) | 交互方法、装置、电子设备以及存储介质 | |
CN110764627A (zh) | 一种输入方法、装置和电子设备 | |
CN104077597A (zh) | 图像分类方法及装置 | |
CN110019897B (zh) | 显示图片的方法及装置 | |
CN111783517A (zh) | 图像识别方法、装置、电子设备及存储介质 | |
CN107943317B (zh) | 输入方法及装置 | |
CN104902318B (zh) | 播放控制方法及终端设备 | |
CN115830303A (zh) | 图像处理方法、装置及存储介质 | |
CN113157972A (zh) | 视频封面文案的推荐方法、装置、电子设备及存储介质 | |
CN111831615A (zh) | 一种影音文件的生成方法、装置和系统 | |
US11922725B2 (en) | Method and device for generating emoticon, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |