CN108921086A - 图像处理方法和装置、存储介质、电子设备 - Google Patents

图像处理方法和装置、存储介质、电子设备 Download PDF

Info

Publication number
CN108921086A
CN108921086A CN201810699340.6A CN201810699340A CN108921086A CN 108921086 A CN108921086 A CN 108921086A CN 201810699340 A CN201810699340 A CN 201810699340A CN 108921086 A CN108921086 A CN 108921086A
Authority
CN
China
Prior art keywords
image
detected
foreground target
area
classification label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810699340.6A
Other languages
English (en)
Inventor
刘耀勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201810699340.6A priority Critical patent/CN108921086A/zh
Publication of CN108921086A publication Critical patent/CN108921086A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/35Categorising the entire scene, e.g. birthday party or wedding scene
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及一种图像处理方法和装置、电子设备、计算机可读存储介质,对待检测图像进行前景目标检测,得到前景目标检测结果,前景目标检测结果包括前景目标的面积占待检测图像总面积的比值及前景目标的分类标签;当前景目标的面积占待检测图像总面积的比值大于等于预设阈值的时候,则不对待检测图像进行背景分类;将前景目标的分类标签作为待检测图像的场景分类标签。因此,此时就可以不对待检测图像进行背景分类。直接将前景目标的分类标签作为整个待检测图像的场景分类标签。从而可以简化并加快待检测图像的场景识别过程,进而可以降低功耗,提高效率。

Description

图像处理方法和装置、存储介质、电子设备
技术领域
本申请涉及计算机技术领域,特别是涉及一种图像处理方法和装置、存储介质、电子设备。
背景技术
随着移动终端的普及和移动互联网的迅速发展,移动终端的用户使用量越来越大。移动终端中的拍照功能已经成为用户常用功能之一。在拍照的过程中或在拍照之后,移动终端都可能会对图像进行场景识别,因此如何更加准确地对图像进行场景识别就成为了目前亟待解决的问题之一。
发明内容
本申请实施例提供一种图像处理方法和装置、存储介质、电子设备,可以提高对图像进行场景分类的准确性。
一种图像处理方法,包括:
对待检测图像进行前景目标检测,得到前景目标检测结果,所述前景目标检测结果包括前景目标的面积占所述待检测图像总面积的比值及前景目标的分类标签;
当前景目标的面积占所述待检测图像总面积的比值大于等于预设阈值的时候,则不对所述待检测图像进行背景分类;
将所述前景目标的分类标签作为所述待检测图像的场景分类标签。
一种图像处理装置,所述装置包括:
前景目标区域获取模块,用于从待检测图像中获取前景目标区域;
计算模块,用于计算出所述前景目标区域的面积占所述待检测图像总面积的比值,所述比值即为前景目标的面积占所述待检测图像总面积的比值;
前景目标的分类标签获取模块,用于对所述前景目标区域进行目标检测,得到所述前景目标的分类标签;
前景目标检测结果获取模块,用于根据所述前景目标的面积占所述待检测图像总面积的比值及所述前景目标的分类标签得到前景目标检测结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的图像处理方法的步骤。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时执行如上所述的图像处理方法的步骤。
上述图像处理方法和装置、存储介质、电子设备,对待检测图像进行前景目标检测,得到前景目标检测结果,前景目标检测结果包括前景目标的面积占待检测图像总面积的比值及前景目标的分类标签;当前景目标的面积占待检测图像总面积的比值大于等于预设阈值的时候,则不对待检测图像进行背景分类;将前景目标的分类标签作为待检测图像的场景分类标签。首先对待检测图像进行前景目标检测,前景目标检测一般可以快速捕捉到待检测图像中的前景目标。再判断所得到的前景目标的面积占待检测图像总面积的比值是否大于等于预设阈值,若是则说明前景目标占整个图像的比例较大,也就是说明此时待检测图像的背景部分占待检测图像的比例太小,以至于并不能体现出背景信息。因此,此时就可以不对待检测图像进行背景分类。直接将前景目标的分类标签作为整个待检测图像的场景分类标签。从而可以简化并加快待检测图像的场景识别过程,进而可以降低功耗,提高效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中电子设备的内部结构图;
图2为一个实施例中图像处理方法的流程图;
图3为一个实施例中神经网络的架构示意图;
图4为图2中对待检测图像进行前景目标检测,得到前景目标检测结果的方法的流程图;
图5为另一个实施例中图像处理方法的流程图;
图6为一个实施例中图像处理装置的结构示意图;
图7为图6中前景目标检测模块的结构示意图;
图8为另一个实施例中图像处理装置的结构示意图;
图9为再一个实施例中图像处理装置的结构示意图;
图10为一个实施例中提供的电子设备相关的手机的部分结构的框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中电子设备的内部结构示意图。如图1所示,该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该处理器用于提供计算和控制能力,支撑整个电子设备的运行。存储器用于存储数据、程序等,存储器上存储至少一个计算机程序,该计算机程序可被处理器执行,以实现本申请实施例中提供的适用于电子设备的场景识别方法。存储器可包括磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random-Access-Memory,RAM)等。例如,在一个实施例中,存储器包括非易失性存储介质及内存储器。非易失性存储介质存储有操作系统和计算机程序。该计算机程序可被处理器所执行,以用于实现以下各个实施例所提供的一种图像处理方法。内存储器为非易失性存储介质中的操作系统计算机程序提供高速缓存的运行环境。网络接口可以是以太网卡或无线网卡等,用于与外部的电子设备进行通信。该电子设备可以是手机、平板电脑或者个人数字助理或穿戴式设备等。
在一个实施例中,如图2所示,提供了一种图像处理方法,以该方法应用于图1中的电子设备为例进行说明,包括:
步骤220,对待检测图像进行前景目标检测,得到前景目标检测结果,前景目标检测结果包括前景目标的面积占待检测图像总面积的比值及前景目标的分类标签。
用户使用电子设备(具有拍照功能)进行拍照,获取待检测图像。待检测图像可以是拍照预览画面,也可以是拍照后保存到电子设备中的照片。对待检测图像进行前景目标检测,得到前景目标检测结果,其中待检测图像一般包括前景目标和背景区域。当然,当对前景目标近距离拍摄时,可能背景区域就很小以至于可以忽略,此时的待检测图像就可以认为只包括前景目标,而没有背景区域。一般情况下待检测图像的前景目标包括:人像、婴儿、猫、狗、美食等,背景区域包括风景、海滩、雪景、蓝天、绿草、夜景、黑暗、背光、日出/日落、烟火、聚光灯、室内等。当然,以上并不是穷举。对待检测图像进行前景目标检测,检测出前景目标具体为人像、婴儿、猫、狗、美食等中的哪一类,且得出前景目标的面积占待检测图像总面积的比值。
步骤240,当前景目标的面积占待检测图像总面积的比值大于等于预设阈值的时候,则不对待检测图像进行背景分类。
对待检测图像进行前景目标检测,得到前景目标检测结果之后,前景目标检测结果包括前景目标的面积占待检测图像总面积的比值及前景目标的分类标签。若前景目标检测结果为:前景目标的面积占待检测图像总面积的比值大于等于预设阈值,那么将前景目标的分类标签直接作为待检测图像的场景分类标签,而忽略待检测图像中背景区域,即不对待检测图像进行背景分类。
具体地,采用神经网络模型对图像进行目标检测,神经网络模型的具体训练过程为:将包含有指定图像类别和指定对象类别的训练图像输入到神经网络,通过神经网络的基础网络层进行特征提取,将提取的图像特征输入到分类网络层和目标检测网络层,在分类网络层得到反映训练图像中背景图像所属指定图像类别的第一预测置信度与第一真实置信度之间的差异的第一损失函数,在目标检测网络层得到反映训练图像中前景目标所属指定对象类别的第二预测置信度与第二真实置信度之间的差异的第二损失函数;将第一损失函数和第二损失函数进行加权求和得到目标损失函数;根据目标损失函数调整神经网络的参数,对神经网络进行训练。从而训练出神经网络模型,根据该神经网络模型对图像进行场景识别,得到图像所属的场景类别。
图3为一个实施例中神经网络模型的架构示意图。如图3所示,神经网络的输入层接收带有图像类别标签的训练图像,通过基础网络(如VGG网络)进行特征提取,并将提取的图像特征输出给特征层,由该特征层对图像进行类别检测得到第一损失函数,对前景目标根据图像特征进行目标检测得到第二损失函数,对前景目标根据前景目标进行位置检测得到位置损失函数,将第一损失函数、第二损失函数和位置损失函数进行加权求和得到目标损失函数。神经网络包括数据输入层、基础网络层、分类网络层、目标检测网络层和两个输出层。数据输入层用于接收原始图像数据。基础网络层对输入层输入的图像进行预处理以及特征提取。该预处理可包括去均值、归一化、降维和白化处理。去均值是指将输入数据各个维度都中心化为0,目的是将样本的中心拉回到坐标系原点上。归一化是将幅度归一化到同样的范围。白化是指对数据各个特征轴上的幅度归一化。图像数据进行特征提取,例如利用VGG16的前5层卷积层对原始图像进行特征提取,再将提取的特征输入到分类网络层和目标检测网络层。在分类网络层可采用如Mobilenet网络的深度卷积、点卷积对特征进行检测,然后输入到输出层得到图像分类所属指定图像类别的第一预测置信度,然后根据第一预测置信度与第一真实置信度求差得到第一损失函数;在目标检测网络层可采用如SSD网络,在VGG16的前5层的卷积层后级联卷积特征层,在卷积特征层使用一组卷积滤波器来预测指定对象类别所对应的预选默认边界框相对于真实边界框的偏移量参数和指定对象类别所对应的第二预测置信度。感兴趣区域为预选默认边界框的区域。根据偏移量参数构建位置损失函数,根据第二预测置信度与第二真实置信度的差异得到第二损失函数。将第一损失函数、第二损失函数和位置损失函数加权求和得到目标损失函数,根据目标损失函数采用反向传播算法调整神经网络的参数,对神经网络进行训练。采用训练好的神经网络对待检测图像进行识别时,神经网络输入层接收输入的待检测图像,提取待检测图像的特征,输入到分类网络层进行图像分类识别,在第一输出层通过softmax分类器输出背景图像所属各个指定图像类别的置信度,选取置信度最高且超过置信度阈值的图像类别作为该图像的背景图像所属的图像类别。将提取的待检测图像的特征输入到目标检测网络层进行前景目标检测,在第二输出层通过softmax分类器输出前景目标所属指定对象类别的置信度及对应的位置,选取置信度最高且超过置信度阈值的指定对象类别作为该图像中前景目标所属的对象类别,并输出该对象类别对应的位置。
步骤260,将前景目标的分类标签作为待检测图像的场景分类标签。
在上述得出了待检测图像的前景目标检测结果之后。若前景目标检测结果为:前景目标的面积占待检测图像总面积的比值大于等于预设阈值的时候,则不对待检测图像进行背景分类,直接将前景目标的分类标签作为待检测图像的场景分类标签。
本申请实施例中,首先对待检测图像进行前景目标检测,前景目标检测一般可以快速捕捉到待检测图像中的前景目标。再判断所得到的前景目标的面积占待检测图像总面积的比值是否大于等于预设阈值,若是则说明前景目标占整个图像的比例较大,也就是说明此时待检测图像的背景部分占待检测图像的比例太小,以至于并不能体现出背景信息。因此,此时就可以不对待检测图像进行背景分类。直接将前景目标的分类标签作为整个待检测图像的场景分类标签。从而可以简化并加快待检测图像的场景识别过程,进而可以降低功耗,提高效率。
在一个实施例中,如图4所示,步骤220,对待检测图像进行前景目标检测,得到前景目标检测结果,包括:
步骤222,从待检测图像中获取前景目标区域。
为了对待检测图像中的前景目标进行目标检测,就需要先从待检测图像中获取到前景目标区域。前景目标区域即前景目标在待检测图像中所在的区域。从待检测图像中获取到前景目标区域可以采用图像分割的方法,图像分割是实现机器视觉图像自动识别与分析的重要方法,其分割质量对后续图像的分析具有重要影响。图像分割一般可采用三种途径实现,具体为区域分割、边界分割和边界形成分割。例如,对于一张包含人像和雪景的待检测图像,前景目标为人像,背景区域为雪景。此时获取前景目标区域即为获取人像在待检测图像中的所在的区域。前景目标区域可以是与前景目标轮廓较为近似的不规则矩形的区域,当然如果更加精确,前景目标区域可以是几乎沿着前景目标的轮廓的区域。
步骤224,计算出前景目标区域的面积占待检测图像总面积的比值,比值即为前景目标的面积占待检测图像总面积的比值。
在获取前景目标区域之后,计算出前景目标区域的面积占图像总面积的比值。在上述包含人像和雪景的待检测图像中,则先计算出人像所在区域的面积,再计算出待检测图像的总面积,从而最终计算出人像所在区域的面积占待检测图像总面积的比值。
步骤226,对前景目标区域进行目标检测,得到前景目标的分类标签。
采用图3所示的神经网络模型对待检测图像的前景目标区域进行目标检测,即可以得出前景目标的分类标签。例如,前景目标的分类标签一般可以是人像、婴儿、猫、狗、美食等中的一类或多类。
步骤228,根据前景目标的面积占待检测图像总面积的比值及前景目标的分类标签得到前景目标检测结果。
前景目标检测结果由两部分构成,即所计算出的前景目标区域的面积占待检测图像总面积的比值、前景目标的分类标签。
本申请实施例中,对待检测图像进行前景目标检测,得到前景目标检测结果。其中,前景目标检测结果包括所计算出的前景目标区域的面积占待检测图像总面积的比值,及对前景目标区域进行目标检测,所得到的前景目标的分类标签。如此,便于后续根据前景目标区域的面积占待检测图像总面积的比值,来判断待检测图像的场景分类标签是只需要考虑前景目标的分类标签即可,还是需要同时考虑背景区域的分类标签。从而可以根据比值的大小情况,选择性进行对待检测图像的背景区域进行场景识别,得到待检测图像的背景区域的分类标签的步骤,从而降低了功耗,提高了效率。
在一个实施例中,如图5所示,在对待检测图像进行前景目标检测,得到前景目标检测结果之后,包括:
步骤520,判断前景目标区域的面积占图像总面积的比值是否大于等于预设阈值;
步骤540,若前景目标区域的面积占图像总面积的比值小于预设阈值,则对待检测图像的背景区域进行场景识别,得到待检测图像的背景区域的分类标签;
步骤560,将待检测图像的背景区域的分类标签与前景目标的分类标签的组合,作为待检测图像的场景分类标签。
具体地,在判断出前景目标区域的面积占图像总面积的比值小于预设阈值的时候,即背景区域在整个待检测图像中所占的比例就增大了,那么背景区域中就包含了一定数目的有效内容,从而对待检测图像的背景区域进行场景识别就可以得到背景区域的分类标签。此时整个待检测图像的场景分类标签,就应该由前景目标的分类标签和背景区域的分类标签共同来构成,如此才能得到整个待检测图像完整的场景分类标签。
本申请实施例中,在前景目标区域的面积占图像总面积的比值小于预设阈值的时候,就不能够直接舍弃对待检测图像的背景区域进行场景识别。此时需要对待检测图像的背景区域进行场景识别,如果识别得到待检测图像的背景区域的分类标签,那么整个待检测图像的场景分类标签,就应该由前景目标的分类标签和背景区域的分类标签共同来构成。如果对待检测图像的背景区域进行场景识别,但是未识别得到待检测图像的背景区域的分类标签,那么整个待检测图像的场景分类标签依然只包括前景目标的分类标签。大大提高了所得到的待检测图像的场景分类标签的准确性。
在一个实施例中,预设阈值为三分之二。
具体地,待检测图像中前景目标区域的面积占图像总面积的比值以三分之二作为划分,即待检测图像中前景目标区域的面积占图像总面积的比值大于等于三分之二,则认为此时前景目标区域占待检测图像的面积较大,就可以忽略对背景区域进行场景识别。只将前景目标的分类标签作为整个待检测图像的场景分类标签。
待检测图像中前景目标区域的面积占图像总面积的比值小于三分之二,则认为此时前景目标区域占待检测图像的面积较小,即背景区域在待检测图像中所占的比例就有所上升,此时就不能忽略对背景区域进行场景识别。将对背景区域进行场景识别所获得的背景区域的分类标签及前景目标的分类标签共同作为待检测图像的场景分类标签。当然,在本申请其他实施例中,也可以给预设阈值设置其他合理的数值,例如,五分之四或百分之七十等。
本申请实施例中,预设阈值可以是根据大量的样本图像进行分析,分析出图像中前景目标区域的面积占图像总面积的比值大于等于某个阈值的时候,对图像的背景区域进行场景识别得出场景类别的概率非常小,即在图像中前景目标区域的面积占图像总面积的比值大于等于某个阈值的时候,对图像的背景区域进行场景识别是毫无意义的,并不能改变图像的场景类别标签。因此,将该阈值作为预设阈值用来判断是否需要对待检测图像的背景区域进行场景识别得到背景区域的分类标签,从而与前景目标的分类标签一起构成待检测图像的分类标签。采用预设阈值可以在图像中前景目标区域的面积占图像总面积的比值大于等于预设阈值的时候,可以直接忽略对背景区域进行场景识别,如此就可以节省步骤、降低功耗。
在一个实施例中,在将前景目标的分类标签作为待检测图像的场景分类标签之后,包括:根据待检测图像的场景分类标签对待检测图像进行相对应的图像处理。
本申请实施例中,在得到了待检测图像的场景分类标签之后,场景分类标签就可以用来作为对待检测图像进行后期处理的依据,可以根据场景分类标签来对待检测图像进行针对性地图像处理,从而大大提高图像的质量。例如,在待检测图像中前景目标区域的面积占图像总面积的比值大于等于预设阈值的时候,此时只需要对前景目标进行目标检测,得到前景目标的分类标签。将前景目标的分类标签作为整个待检测图像的场景分类标签。例如,对一张自拍人像面积达到了整个图像面积的预设阈值的待检测图像而言,得到待检测图像的场景分类标签为人像,此时就可以对整张图像采用与人像对应的处理方式进行图像处理,当然,更精确地,也可以对图像中的人像区域采用与人像对应的处理方式进行图像处理,使得处理之后的图像效果较好。
在一个实施例中,将前景目标的分类标签及待检测图像的背景区域的分类标签作为待检测图像的场景分类标签之后,包括:
根据前景目标的分类标签对待检测图像的前景目标区域进行相对应的图像处理,根据待检测图像的背景区域的分类标签对待检测图像的背景区域进行相对应的图像处理。
本申请实施例中,在待检测图像中前景目标区域的面积占图像总面积的比值小于预设阈值的时候,此时需要对待检测图像的背景区域进行场景识别,得到背景区域的分类标签。然后将待检测图像的背景区域的分类标签与前景目标的分类标签的组合,作为待检测图像的场景分类标签。例如,对于一张前景目标为人像,背景区域为雪景的待检测图像,且前景目标区域的面积占图像总面积的比值小于预设阈值。所以就需要将背景区域的分类标签-雪景,与前景目标的分类标签-人像的组合,即雪景+人像的组合作为待检测图像的场景分类标签。再根据雪景+人像这样的场景分类标签对这张图像进行相应的图像处理,使得处理之后的图像效果较好。
具体地,雪景为背景区域所对应的分类标签,所以对待检测图像的背景区域采用与雪景对应的图像处理方式,专门针对背景区域进行图像处理。人像为前景目标区域对应的分类标签,所以可以对前景目标区域采用与人像对应的图像处理方式,专门针对前景目标区域进行图像处理。对于不同的分类标签差异性地进行图像处理,从而能够使得前景目标区域与背景区域都可以达到比较好的图像处理效果。当然,如果预先设置了一种前景目标的分类标签为人像、背景区域的分类标签为雪景的图像处理方式,则也可以直接采用这种图像处理方式对整个图像进行处理,从而获得统一均匀的图像处理效果,避免前景目标区域和背景区域采用不同的处理方式,而使得两者之间的结合部分略显突兀。
在一个具体的实施例中,提供了一种图像处理方法,以该方法应用于图1中的电子设备为例进行说明,包括:
步骤一:根据大量的样本图像进行分析,分析出图像中前景目标区域的面积占图像总面积的比值大于等于某个阈值的时候,对图像的背景区域进行场景识别是毫无意义的,并不能改变图像的场景类别标签。将该阈值作为预设阈值存储在数据库中;
步骤二:从待检测图像中获取前景目标区域,计算出前景目标区域的面积占待检测图像总面积的比值;
步骤三:对前景目标区域进行目标检测,得到前景目标的分类标签;
步骤四:判断前景目标区域的面积占图像总面积的比值是否大于等于预设阈值;
步骤五:若是,则不对待检测图像进行背景分类,直接将前景目标的分类标签作为待检测图像的场景分类标签,并根据待检测图像的场景分类标签对待检测图像进行相对应的图像处理;
步骤六;若否,则对待检测图像的背景区域进行场景识别,得到待检测图像的背景区域的分类标签,将待检测图像的背景区域的分类标签与前景目标的分类标签的组合,作为待检测图像的场景分类标签;
步骤七;根据待检测图像的背景区域的分类标签对待检测图像的背景区域进行相对应的图像处理,根据待检测图像的前景目标的分类标签对待检测图像的前景目标区域进行相对应的图像处理。
本申请实施例中,对待检测图像进行前景目标检测,得到前景目标检测结果。其中,前景目标检测结果包括所计算出的前景目标区域的面积占待检测图像总面积的比值,及对前景目标区域进行目标检测,所得到的前景目标的分类标签。如此,便于后续根据前景目标区域的面积占待检测图像总面积的比值,来判断待检测图像的场景分类标签时只需要考虑前景目标的分类标签即可,还是需要同时考虑背景区域的分类标签。从而可以根据比值的大小情况,选择性对待检测图像的背景区域进行场景识别,得到待检测图像的背景区域的分类标签的步骤,从而降低了功耗,提高了效率。再根据待检测图像的场景分类标签对待检测图像进行相对应的图像处理,使得处理之后的图像效果更好。
在一个实施例中,如图6所示,提供了一种图像处理装置600包括:前景目标检测模块620、背景分类舍弃模块640及第一场景分类标签获取模块660。其中,
前景目标检测模块620,用于对待检测图像进行前景目标检测,得到前景目标检测结果,前景目标检测结果包括前景目标的面积占待检测图像总面积的比值及前景目标的分类标签;
背景分类舍弃模块640,用于当前景目标的面积占待检测图像总面积的比值大于等于预设阈值的时候,则不对待检测图像进行背景分类;
第一场景分类标签获取模块660,用于将前景目标的分类标签作为待检测图像的场景分类标签。
在一个实施例中,如图7所示,前景目标检测模块620包括:
前景目标区域获取模块622,用于从待检测图像中获取前景目标区域;
计算模块624,用于计算出前景目标区域的面积占待检测图像总面积的比值,比值即为前景目标的面积占待检测图像总面积的比值;
前景目标的分类标签获取模块626,用于对前景目标区域进行目标检测,得到前景目标的分类标签;
前景目标检测结果获取模块628,用于根据前景目标的面积占待检测图像总面积的比值及前景目标的分类标签得到前景目标检测结果。
在一个实施例中,如图8所示,提供了一种图像处理装置600还包括:
判断模块630,用于判断前景目标区域的面积占图像总面积的比值是否大于等于预设阈值;
背景分类模块650,用于若否,则对待检测图像的背景区域进行背景分类,得到待检测图像的背景区域的分类标签;
第二场景分类标签获取模块670,用于将前景目标的分类标签及待检测图像的背景区域的分类标签作为待检测图像的场景分类标签。
在一个实施例中,如图9所示,还提供了一种图像处理装置600,还包括图像处理模块680,用于根据待检测图像的场景分类标签对待检测图像进行相对应的图像处理。
在一个实施例中,图像处理模块680,还用于根据前景目标的分类标签对待检测图像的前景目标区域进行相对应的图像处理,根据待检测图像的背景区域的分类标签对待检测图像的背景区域进行相对应的图像处理。
上述图像处理装置中各个模块的划分仅用于举例说明,在其他实施例中,可将图像处理装置按照需要划分为不同的模块,以完成上述图像处理装置的全部或部分功能。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各实施例所提供的图像处理方法的步骤。
在一个实施例中,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述各实施例所提供的图像处理方法的步骤。
本申请实施例还提供了一种计算机程序产品,当其在计算机上运行时,使得计算机执行上述各实施例所提供的图像处理方法的步骤。
本申请实施例还提供了一种电子设备。如图9所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该电子设备可以为包括手机、平板电脑、PDA(Personal Digital Assistant,个人数字助理)、POS(Point of Sales,销售终端)、车载电脑、穿戴式设备等任意终端设备,以电子设备为手机为例:
图10为与本申请实施例提供的电子设备相关的手机的部分结构的框图。参考图10,手机包括:射频(Radio Frequency,RF)电路910、存储器920、输入单元930、显示单元940、传感器950、音频电路990、无线保真(wireless fidelity,WiFi)模块970、处理器980、以及电源990等部件。本领域技术人员可以理解,图10所示的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,RF电路910可用于收发信息或通话过程中,信号的接收和发送,可将基站的下行信息接收后,给处理器980处理;也可以将上行的数据发送给基站。通常,RF电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier,LNA)、双工器等。此外,RF电路910还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(Global System ofMobile communication,GSM)、通用分组无线服务(General Packet Radio Service,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband CodeDivision Multiple Access,WCDMA)、长期演进(Long Term Evolution,LTE))、电子邮件、短消息服务(Short Messaging Service,SMS)等。
存储器920可用于存储软件程序以及模块,处理器980通过运行存储在存储器920的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器920可主要包括程序存储区和数据存储区,其中,程序存储区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能的应用程序、图像播放功能的应用程序等)等;数据存储区可存储根据手机的使用所创建的数据(比如音频数据、通讯录等)等。此外,存储器920可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元930可用于接收输入的数字或字符信息,以及产生与手机900的用户设置以及功能控制有关的键信号输入。具体地,输入单元930可包括触控面板931以及其他输入设备932。触控面板931,也可称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板931上或在触控面板931附近的操作),并根据预先设定的程式驱动相应的连接装置。在一个实施例中,触控面板931可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器980,并能接收处理器980发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板931。除了触控面板931,输入单元930还可以包括其他输入设备932。具体地,其他输入设备932可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)等中的一种或多种。
显示单元940可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元940可包括显示面板941。在一个实施例中,可以采用液晶显示器(LiquidCrystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板941。在一个实施例中,触控面板931可覆盖显示面板941,当触控面板931检测到在其上或附近的触摸操作后,传送给处理器980以确定触摸事件的类型,随后处理器980根据触摸事件的类型在显示面板941上提供相应的视觉输出。虽然在图10中,触控面板931与显示面板941是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板931与显示面板941集成而实现手机的输入和输出功能。
手机900还可包括至少一种传感器950,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板941的亮度,接近传感器可在手机移动到耳边时,关闭显示面板941和/或背光。运动传感器可包括加速度传感器,通过加速度传感器可检测各个方向上加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换)、振动识别相关功能(比如计步器、敲击)等;此外,手机还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器等。
音频电路990、扬声器991和传声器992可提供用户与手机之间的音频接口。音频电路990可将接收到的音频数据转换后的电信号,传输到扬声器991,由扬声器991转换为声音信号输出;另一方面,传声器992将收集的声音信号转换为电信号,由音频电路990接收后转换为音频数据,再将音频数据输出处理器980处理后,经RF电路910可以发送给另一手机,或者将音频数据输出至存储器920以便后续处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块970可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图10示出了WiFi模块970,但是可以理解的是,其并不属于手机900的必须构成,可以根据需要而省略。
处理器980是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器920内的软件程序和/或模块,以及调用存储在存储器920内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。在一个实施例中,处理器980可包括一个或多个处理单元。在一个实施例中,处理器980可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等;调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器980中。
手机900还包括给各个部件供电的电源990(比如电池),优选的,电源可以通过电源管理系统与处理器980逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
在一个实施例中,手机900还可以包括摄像头、蓝牙模块等。
本申请所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。合适的非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM),它用作外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种图像处理方法,其特征在于,包括:
对待检测图像进行前景目标检测,得到前景目标检测结果,所述前景目标检测结果包括前景目标的面积占所述待检测图像总面积的比值及前景目标的分类标签;
当前景目标的面积占所述待检测图像总面积的比值大于等于预设阈值的时候,则不对所述待检测图像进行背景分类;
将所述前景目标的分类标签作为所述待检测图像的场景分类标签。
2.根据权利要求1所述的方法,其特征在于,对待检测图像进行前景目标检测,得到前景目标检测结果,包括:
从待检测图像中获取前景目标区域;
计算出所述前景目标区域的面积占所述待检测图像总面积的比值,所述比值即为前景目标的面积占所述待检测图像总面积的比值;
对所述前景目标区域进行目标检测,得到所述前景目标的分类标签;
根据所述前景目标的面积占所述待检测图像总面积的比值及所述前景目标的分类标签得到前景目标检测结果。
3.根据权利要求2所述的方法,其特征在于,在对待检测图像进行前景目标检测,得到前景目标检测结果之后,包括:
判断所述前景目标区域的面积占所述图像总面积的比值是否大于等于预设阈值;
若否,则对所述待检测图像的背景区域进行背景分类,得到所述待检测图像的背景区域的分类标签;
将所述前景目标的分类标签及所述待检测图像的背景区域的分类标签作为所述待检测图像的场景分类标签。
4.根据权利要求1所述的方法,其特征在于,所述预设阈值为三分之二。
5.根据权利要求1所述的方法,其特征在于,在将所述前景目标的分类标签作为所述待检测图像的场景分类标签之后,包括:
根据所述待检测图像的场景分类标签对所述待检测图像进行相对应的图像处理。
6.根据权利要求3所述的方法,其特征在于,将所述前景目标的分类标签及所述待检测图像的背景区域的分类标签作为所述待检测图像的场景分类标签之后,包括:
根据所述前景目标的分类标签对所述待检测图像的前景目标区域进行相对应的图像处理,根据所述待检测图像的背景区域的分类标签对所述待检测图像的背景区域进行相对应的图像处理。
7.一种图像处理装置,其特征在于,所述装置包括:
前景目标检测模块,用于对待检测图像进行前景目标检测,得到前景目标检测结果,所述前景目标检测结果包括前景目标的面积占所述待检测图像总面积的比值及前景目标的分类标签;
背景分类舍弃模块,用于当前景目标的面积占所述待检测图像总面积的比值大于等于预设阈值的时候,则不对所述待检测图像进行背景分类;
场景分类标签获取模块,用于将所述前景目标的分类标签作为所述待检测图像的场景分类标签。
8.根据权利要求7所述的装置,所述前景目标检测模块,包括:
前景目标区域获取模块,用于从待检测图像中获取前景目标区域;
计算模块,用于计算出所述前景目标区域的面积占所述待检测图像总面积的比值,所述比值即为前景目标的面积占所述待检测图像总面积的比值;
前景目标的分类标签获取模块,用于对所述前景目标区域进行目标检测,得到所述前景目标的分类标签;
前景目标检测结果获取模块,用于根据所述前景目标的面积占所述待检测图像总面积的比值及所述前景目标的分类标签得到前景目标检测结果。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的图像处理方法的步骤。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的图像处理方法的步骤。
CN201810699340.6A 2018-06-29 2018-06-29 图像处理方法和装置、存储介质、电子设备 Pending CN108921086A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810699340.6A CN108921086A (zh) 2018-06-29 2018-06-29 图像处理方法和装置、存储介质、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810699340.6A CN108921086A (zh) 2018-06-29 2018-06-29 图像处理方法和装置、存储介质、电子设备

Publications (1)

Publication Number Publication Date
CN108921086A true CN108921086A (zh) 2018-11-30

Family

ID=64423182

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810699340.6A Pending CN108921086A (zh) 2018-06-29 2018-06-29 图像处理方法和装置、存储介质、电子设备

Country Status (1)

Country Link
CN (1) CN108921086A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111898622A (zh) * 2019-05-05 2020-11-06 阿里巴巴集团控股有限公司 信息处理、信息显示与模型训练方法、系统及设备
WO2021203863A1 (zh) * 2020-04-10 2021-10-14 腾讯科技(深圳)有限公司 基于人工智能的物体检测方法、装置、设备及存储介质
CN114532918A (zh) * 2022-01-26 2022-05-27 深圳市杉川机器人有限公司 清洁机器人及其目标检测方法、装置及存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101266710A (zh) * 2007-03-14 2008-09-17 中国科学院自动化研究所 一种基于规则的全天候智能视频分析监控方法
EP2013817A2 (en) * 2006-04-17 2009-01-14 Objectvideo, Inc. Video segmentation using statistical pixel modeling
CN103745230A (zh) * 2014-01-14 2014-04-23 四川大学 一种自适应群体异常行为分析方法
CN104008554A (zh) * 2014-06-17 2014-08-27 深圳市赛为智能股份有限公司 基于视频的铁路线小目标检测方法及系统
CN105931241A (zh) * 2016-04-22 2016-09-07 南京师范大学 一种自然场景图像的自动标注方法
CN106534693A (zh) * 2016-11-25 2017-03-22 努比亚技术有限公司 一种照片处理方法、装置及终端
CN106550243A (zh) * 2016-12-09 2017-03-29 武汉斗鱼网络科技有限公司 直播视频处理方法、装置及电子设备
US20170161905A1 (en) * 2015-12-07 2017-06-08 Avigilon Analytics Corporation System and method for background and foreground segmentation
CN106952222A (zh) * 2017-03-17 2017-07-14 成都通甲优博科技有限责任公司 一种交互式图像虚化方法及装置
CN107368786A (zh) * 2017-06-16 2017-11-21 华南理工大学 一种基于机器视觉的乘客越过扶手带检测算法
CN107657051A (zh) * 2017-10-16 2018-02-02 广东欧珀移动通信有限公司 一种图片标签的生成方法、终端设备及存储介质
CN107944414A (zh) * 2017-12-05 2018-04-20 广东欧珀移动通信有限公司 图像处理方法、装置、电子设备及计算机可读存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2013817A2 (en) * 2006-04-17 2009-01-14 Objectvideo, Inc. Video segmentation using statistical pixel modeling
CN101266710A (zh) * 2007-03-14 2008-09-17 中国科学院自动化研究所 一种基于规则的全天候智能视频分析监控方法
CN103745230A (zh) * 2014-01-14 2014-04-23 四川大学 一种自适应群体异常行为分析方法
CN104008554A (zh) * 2014-06-17 2014-08-27 深圳市赛为智能股份有限公司 基于视频的铁路线小目标检测方法及系统
US20170161905A1 (en) * 2015-12-07 2017-06-08 Avigilon Analytics Corporation System and method for background and foreground segmentation
CN105931241A (zh) * 2016-04-22 2016-09-07 南京师范大学 一种自然场景图像的自动标注方法
CN106534693A (zh) * 2016-11-25 2017-03-22 努比亚技术有限公司 一种照片处理方法、装置及终端
CN106550243A (zh) * 2016-12-09 2017-03-29 武汉斗鱼网络科技有限公司 直播视频处理方法、装置及电子设备
CN106952222A (zh) * 2017-03-17 2017-07-14 成都通甲优博科技有限责任公司 一种交互式图像虚化方法及装置
CN107368786A (zh) * 2017-06-16 2017-11-21 华南理工大学 一种基于机器视觉的乘客越过扶手带检测算法
CN107657051A (zh) * 2017-10-16 2018-02-02 广东欧珀移动通信有限公司 一种图片标签的生成方法、终端设备及存储介质
CN107944414A (zh) * 2017-12-05 2018-04-20 广东欧珀移动通信有限公司 图像处理方法、装置、电子设备及计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LI F F等: "A bayesian hierarchical model for learning natural scene categories", 《IEEE COMPUTER SOCIETY CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
薛梦霞等: "基于视觉显著性的场景目标识别", 《控制工程》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111898622A (zh) * 2019-05-05 2020-11-06 阿里巴巴集团控股有限公司 信息处理、信息显示与模型训练方法、系统及设备
CN111898622B (zh) * 2019-05-05 2022-07-15 阿里巴巴集团控股有限公司 信息处理、信息显示与模型训练方法、系统及设备
WO2021203863A1 (zh) * 2020-04-10 2021-10-14 腾讯科技(深圳)有限公司 基于人工智能的物体检测方法、装置、设备及存储介质
CN114532918A (zh) * 2022-01-26 2022-05-27 深圳市杉川机器人有限公司 清洁机器人及其目标检测方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN109002787B (zh) 图像处理方法和装置、存储介质、电子设备
CN107729889B (zh) 图像处理方法和装置、电子设备、计算机可读存储介质
CN107124555B (zh) 控制对焦的方法、装置、计算机设备及计算机可读存储介质
CN107784271B (zh) 指纹识别方法及相关产品
CN109325518B (zh) 图像的分类方法、装置、电子设备和计算机可读存储介质
WO2019020014A1 (zh) 解锁控制方法及相关产品
CN109086761B (zh) 图像处理方法和装置、存储介质、电子设备
WO2018113512A1 (zh) 图像处理方法以及相关装置
CN111582116B (zh) 一种视频抹除痕迹检测方法、装置、设备和存储介质
CN110933312B (zh) 拍照控制方法及相关产品
CN108229574B (zh) 一种图片筛选的方法、装置和移动终端
CN110830706A (zh) 图像处理方法和装置、存储介质、电子设备
CN109086680A (zh) 图像处理方法、装置、存储介质和电子设备
CN109409235B (zh) 图像识别方法和装置、电子设备、计算机可读存储介质
CN107995422A (zh) 图像拍摄方法和装置、计算机设备、计算机可读存储介质
CN108021669B (zh) 图像分类方法和装置、电子设备、计算机可读存储介质
CN108650442A (zh) 图像处理方法和装置、存储介质、电子设备
CN108921086A (zh) 图像处理方法和装置、存储介质、电子设备
CN107330867B (zh) 图像合成方法、装置、计算机可读存储介质和计算机设备
CN108491733A (zh) 隐私应用推荐方法和装置、存储介质、电子设备
CN110363702B (zh) 图像处理方法及相关产品
CN111737520A (zh) 一种视频分类方法、视频分类装置、电子设备及存储介质
US10706282B2 (en) Method and mobile terminal for processing image and storage medium
CN112381798A (zh) 一种输电线路缺陷识别方法和终端
CN108600634B (zh) 图像处理方法和装置、存储介质、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181130

RJ01 Rejection of invention patent application after publication