CN108229344A - 图像处理方法和装置、电子设备、计算机程序和存储介质 - Google Patents

图像处理方法和装置、电子设备、计算机程序和存储介质 Download PDF

Info

Publication number
CN108229344A
CN108229344A CN201711376170.XA CN201711376170A CN108229344A CN 108229344 A CN108229344 A CN 108229344A CN 201711376170 A CN201711376170 A CN 201711376170A CN 108229344 A CN108229344 A CN 108229344A
Authority
CN
China
Prior art keywords
image
treated
target
network
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711376170.XA
Other languages
English (en)
Inventor
田茂清
伊帅
闫俊杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Sensetime Technology Co Ltd
Original Assignee
Shenzhen Sensetime Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Sensetime Technology Co Ltd filed Critical Shenzhen Sensetime Technology Co Ltd
Priority to CN201711376170.XA priority Critical patent/CN108229344A/zh
Publication of CN108229344A publication Critical patent/CN108229344A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本公开实施例公开了一种图像处理方法和装置、电子设备、计算机程序和存储介质。其中,方法包括:将当前图像分割为前景图像及背景图像,所述前景图像包括检测目标;对所述当前图像中对应于所述背景图像的部分进行偏差消除处理,获得处理后的图像;对所述处理后的图像进行目标检测处理,得到所述图像的目标检测结果,有利于提高目标检测的准确度。

Description

图像处理方法和装置、电子设备、计算机程序和存储介质
技术领域
本公开属于图像处理技术领域,特别是涉及一种图像处理方法和装置、电子设备、计算机程序和存储介质。
背景技术
行人检索是智能视频监控的一项重要组成部分。行人检索主要是根据给定的待检索图像,从图像库中查找与待检索图像具有同一个人的图像。目前解决行人检索问题的基本方法主要是通过特征提取算法和计算相似度的算法,利用特征提取算法提取图像的特征,利用计算相似度的算法计算不同图像的特征之间的相似度,从而根据相似度高低的排序判定待检索的目标图像。目前在行人检索领域大多采取基于深度学习的方法提取特征,获得图像的特征向量,再对特征向量进行相似度的确定,从图像库中检索与待检索图像的特征向量距离最近的图像。
发明内容
本公开实施例提供一种图像处理技术方案。
根据本公开实施例的一个方面,提供一种图像处理方法,包括:
将当前图像分割为前景图像及背景图像,所述前景图像包括检测目标;
对所述当前图像中对应于所述背景图像的部分进行偏差消除处理,获得处理后的图像;
对所述处理后的图像进行目标检测处理,得到所述图像的目标检测结果。
可选地,在本发明上述任一方法实施例中,所述对所述当前图像中对应于所述背景图像的部分进行偏差消除处理,包括:
以随机选取的图像替换所述当前图像中对应于所述背景图像的部分。
可选地,在本发明上述任一方法实施例中,所述对所述当前图像中对应于所述背景图像的部分进行偏差消除处理,包括:
以平均像素值填充所述当前图像中对应于所述背景图像的部分。
可选地,在本发明上述任一方法实施例中,所述对所述处理后的图像进行目标检测处理,得到所述图像的目标检测结果,包括:
对所述处理后的图像进行特征提取,得到所述检测目标的全局特征;
对所述处理后的图像进行特征提取,得到所述检测目标的局部特征;
融合所述全局特征与所述局部特征,获得所述检测目标的特征数据;
根据所述特征数据,确定所述图像的目标检测结果。
可选地,在本发明上述任一方法实施例中,所述对所述处理后的图像进行特征提取,得到所述检测目标的局部特征,包括:
将所述处理后的图像分割为多个子图像,每个所述子图像包括所述检测目标的一部分;
对所述多个子图像中的每个子图像进行特征提取,获得每个所述子图像对应于所述检测目标的局部特征。
可选地,在本发明上述任一方法实施例中,所述检测目标包括人体;
所述将所述处理后的图像分割为多个子图像,包括:
将所述处理后的图像分割为分别包括人体的头部、上半身及下半身的三个子图像;
所述对所述多个子图像中的每个子图像进行特征提取,包括:
对所述多个子图像中包括人体的头部的子图像进行特征提取,得到所述人体的头部特征;
对所述多个子图像中包括人体的上半身的子图像进行特征提取,得到所述人体的上半身特征;以及
对所述多个子图像中包括人体的下半身的子图像进行特征提取,得到所述人体的下半身特征。
可选地,在本发明上述任一方法实施例中,所述将所述处理后的图像分割为分别包括人体的头部、上半身及下半身的三个子图像,包括:
对所述处理后的图像进行人体解析处理,得到所述处理后的图像的人体解析结果;
根据所述人体解析结果,将所述处理后的图像分割为分别包括人体的头部、上半身及下半身的三个子图像。
可选地,在本发明上述任一方法实施例中,目标识别神经网络包括:全局特征提取网络、图像分割网络及局部特征提取网络,其中,所述局部特征提取网络包括与所述多个子图像对应的多个子网络;
所述对所述处理后的图像进行特征提取,得到所述检测目标的全局特征,包括:
通过所述全局特征提取网络对所述处理后的图像进行特征提取,得到所述检测目标的全局特征;
所述将所述处理后的图像分割为多个子图像,包括:
通过所述图像分割网络将所述处理后的图像分割为多个子图像;
所述对所述多个子图像中的每个子图像进行特征提取,包括:
通过所述局部特征提取网络包括的多个子网络中每个子网络对对应的子图像进行特征提取,得到所述对应的子图像对于所述检测目标的局部特征。
可选地,在本发明上述任一方法实施例中,所述多个子网络的个数与所述多个子图像的个数相同,并且所述多个子网络与所述多个子图像一一对应;和/或
所述多个子网络具有相同的参数。
可选地,在本发明上述任一方法实施例中,所述通过所述局部特征提取网络包括的多个子网络中每个子网络对对应的子图像进行特征提取,包括:
通过所述子网络获取所述全局特征提取网络得到的中间特征,利用所述中间特征对对应的子图像进行特征提取,得到所述对应的子图像对于所述检测目标的局部特征。
可选地,在本发明上述任一方法实施例中,所述子网络利用所述中间特征对对应的子图像进行特征提取,包括:
所述子网络对所述中间特征进行过滤处理,得到与所述子网络对应的子图像相对应的过滤后特征;
所述子网络利用所述过滤后特征对对应的子图像进行特征提取。
可选地,在本发明上述任一方法实施例中,所述全局特征是通过所述全局特征提取网络的第一部分对所述中间特征进行处理得到的;
所述局部特征是所述子网络中的第一部分利用所述过滤后特征进行处理得到的;
所述全局特征提取网络的第一部分与所述子网络的第一部分具有相同的参数。
可选地,在本发明上述任一方法实施例中,所述根据所述特征数据,确定所述图像的目标检测结果,包括:
确定所述特征数据与预设图像库中至少一个预设图像中的检测目标对应的预设特征数据之间的相似度;
将与所述特征数据之间的相似度大于相似度阈值的预设特征数据所对应的预设图像中的检测目标,作为所述图像的目标检测结果。
可选地,在本发明上述任一方法实施例中,所述对所述处理后的图像进行目标检测处理,得到所述图像的目标检测结果,包括:
通过目标识别神经网络,对所述处理后的图像进行目标检测处理,得到所述图像的目标检测结果。
可选地,在本发明上述任一方法实施例中,所述当前图像为具有标注信息的样本图像;
所述方法还包括:
根据所述图像的目标检测结果与所述标注信息,训练所述目标识别神经网络。
可选地,在本发明上述任一方法实施例中,所述根据所述图像的目标检测结果与所述标注信息,训练所述目标识别神经网络,包括:
确定所述图像的目标检测结果与所述标注信息之间的差异;
若所述检测结果与所述标注信息之间的差异超过预设差异范围,调整所述目标识别神经网络的参数。
可选地,在本发明上述任一方法实施例中,所述将当前图像分割为前景图像及背景图像,包括:
通过图像分割神经网络,将当前图像分割为前景图像及背景图像。
根据本公开实施例的另一个方面,提供一种图像处理装置,包括:
图像分割单元,用于将当前图像分割为前景图像及背景图像,所述前景图像包括检测目标;
背景处理单元,用于对所述当前图像中对应于所述背景图像的部分进行偏差消除处理,获得处理后的图像;
目标检测单元,用于对所述处理后的图像进行目标检测处理,得到所述图像的目标检测结果。
可选地,在本发明上述任一装置实施例中,所述背景处理单元,具体用于以随机选取的图像替换所述当前图像中对应于所述背景图像的部分。
可选地,在本发明上述任一装置实施例中,所述背景处理单元,具体用于以平均像素值填充所述当前图像中对应于所述背景图像的部分。
可选地,在本发明上述任一装置实施例中,所述目标检测单元,包括:
全局特征提取模块,用于对所述处理后的图像进行特征提取,得到所述检测目标的全局特征;
局部特征提取模块,用于对所述处理后的图像进行特征提取,得到所述检测目标的局部特征;
特征融合模块,用于融合所述全局特征与所述局部特征,获得所述检测目标的特征数据;
目标检测模块,用于根据所述特征数据,确定所述图像的目标检测结果。
可选地,在本发明上述任一装置实施例中,所述局部特征提取模块,包括:
图像分割子模块,用于将所述处理后的图像分割为多个子图像,每个所述子图像包括所述检测目标的一部分;
局部特征提取子模块,用于对所述多个子图像中的每个子图像进行特征提取,获得每个所述子图像对应于所述检测目标的局部特征。
可选地,在本发明上述任一装置实施例中,所述检测目标包括人体;
所述图像分割子模块,具体用于将所述处理后的图像分割为分别包括人体的头部、上半身及下半身的三个子图像;
所述局部特征提取子模块,具体用于:
对所述多个子图像中包括人体的头部的子图像进行特征提取,得到所述人体的头部特征;
对所述多个子图像中包括人体的上半身的子图像进行特征提取,得到所述人体的上半身特征,以及
对所述多个子图像中包括人体的下半身的子图像进行特征提取,得到所述人体的下半身特征。
可选地,在本发明上述任一装置实施例中,所述图像分割子模块,具体用于:
对所述处理后的图像进行人体解析处理,得到所述处理后的图像的人体解析结果;
根据所述人体解析结果,将所述处理后的图像分割为分别包括人体的头部、上半身及下半身的三个子图像。
可选地,在本发明上述任一装置实施例中,目标识别神经网络包括:全局特征提取网络、图像分割网络及局部特征提取网络,其中,所述局部特征提取网络包括与所述多个子图像对应的多个子网络;
所述全局特征提取模块,具体用于通过所述全局特征提取网络对所述处理后的图像进行特征提取,得到所述检测目标的全局特征;
所述图像分割子模块,具体用于通过所述图像分割网络,将所述处理后的图像分割为多个子图像;
所述局部特征提取子模块,具体用于通过所述局部特征提取网络包括的多个子网络中每个子网络对对应的子图像进行特征提取,得到所述对应的子图像对于所述检测目标的局部特征。
可选地,在本发明上述任一装置实施例中,所述多个子网络的个数与所述多个子图像的个数相同,并且所述多个子网络与所述多个子图像一一对应;和/或
所述多个子网络具有相同的参数。
可选地,在本发明上述任一装置实施例中,所述局部特征提取子模块,具体用于通过所述子网络获取所述全局特征提取网络得到的中间特征,利用所述中间特征对对应的子图像进行特征提取,得到所述对应的子图像对于所述检测目标的局部特征。
可选地,在本发明上述任一装置实施例中,所述子网络利用所述中间特征对对应的子图像进行特征提取,包括:
所述子网络对所述中间特征进行过滤处理,得到与所述子网络对应的子图像相对应的过滤后特征;
所述子网络利用所述过滤后特征对对应的子图像进行特征提取。
可选地,在本发明上述任一装置实施例中,所述全局特征是通过所述全局特征提取网络的第一部分对所述中间特征进行处理得到的;
所述局部特征是所述子网络中的第一部分利用所述过滤后特征进行处理得到的;
所述全局特征提取网络的第一部分与所述子网络的第一部分具有相同的参数。
可选地,在本发明上述任一装置实施例中,所述目标检测模块,具体用于:
确定所述特征数据与预设图像库中至少一个预设图像中的检测目标对应的预设特征数据之间的相似度;
将与所述特征数据之间的相似度大于相似度阈值的预设特征数据所对应的预设图像中的检测目标,作为所述图像的目标检测结果。
可选地,在本发明上述任一装置实施例中,所述目标检测单元,具体用于通过目标识别神经网络,对所述处理后的图像进行目标检测处理,得到所述图像的目标检测结果。
可选地,在本发明上述任一装置实施例中,所述当前图像为具有标注信息的样本图像;
所述装置还包括:
网络训练单元,用于根据所述图像的目标检测结果与所述标注信息,训练所述目标识别神经网络。
可选地,在本发明上述任一装置实施例中,所述网络训练单元,具体用于:
确定所述图像的目标检测结果与所述标注信息之间的差异;
若所述检测结果与所述标注信息之间的差异超过预设差异范围,调整所述目标识别神经网络的参数。
可选地,在本发明上述任一装置实施例中,所述图像分割单元,具体用于通过图像分割神经网络,将当前图像分割为前景图像及背景图像。
根据本公开实施例的又一个方面,提供的一种电子设备,包括上述任一实施例所述的装置。
根据本公开实施例的再一个方面,提供的一种电子设备,包括:
存储器,用于存储可执行指令;以及
处理器,用于与所述存储器通信以执行所述可执行指令从而完成上述任一实施例所述的方法。
根据本公开实施例的再一个方面,提供的一种计算机程序,包括计算机可读代码,当所述计算机可读代码在设备上运行时,所述设备中的处理器执行用于实现上述任一实施例所述方法的指令。
根据本公开实施例的再一个方面,提供的一种计算机程序产品,用于存储计算机可读指令,所述指令被执行时使得计算机执行上述任一实施例所述的方法。
在一个可选实施方式中,所述计算机程序产品具体为计算机存储介质,在另一个可选实施方式中,所述计算机程序产品具体为软件产品,例如SDK等。
基于本公开上述实施例提供的图像处理方法和装置、电子设备、计算机程序和存储介质,通过将图像分割为前景图像及背景图像,使前景图像中包括检测目标,对图像中对应于背景图像的部分进行偏差消除处理,获得处理后的图像,对处理后的图像进行目标检测处理,得到图像的目标检测结果,有利于消除图像背景对于图像特征提取的干扰,从而提高检测精度。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同描述一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
图1是本公开实施例图像处理方法一个实施例的流程图。
图2A至图2D是本公开实施例图像处理方法一个具体示例的示意图。
图3是本公开实施例图像处理方法另一个实施例的流程图。
图4是本公开实施例图像处理方法又一个实施例的流程图。
图5是实现图4中本公开实施例图像处理方法的网络模型示例的结构示意图。
图6是本公开实施例图像处理装置一个实施例的结构示意图。
图7是本公开实施例图像处理装置另一个实施例的结构示意图。
图8是本公开实施例图像处理装置又一个实施例的结构示意图。
图9是本公开实施例电子设备一个实施例的结构示意图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件的相对布置、数字表达式和数值不限制本公开的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开实施例可以应用于计算机系统/服务器,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与计算机系统/服务器一起使用的众所周知的计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
计算机系统/服务器可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
目前,大多数行人检索方法会受到图像中背景信息的干扰,这是由于大多数行人检索方法都没有考虑图像中背景信息对行人检索特征提取的影响。由于目前大多数行人检索方法是基于包含行人的整张图像做特征提取,图像中背景和前景的像素都具有同样的影响,所以背景信息相似的行人图像往往具有较高的相似度。
应理解,这里的图像处理方法可以应用于实际对于图像的目标检测,例如,利用神经网络对图像进行目标检测,或者也可以应用于在神经网络的训练过程中对于图像的目标检测,本公开实施例对上述方法的应用场景不作限定。
图1是本公开实施例图像处理方法一个实施例的流程图。如图1所示,该实施例的方法包括:
102,将当前图像分割为前景图像及背景图像,前景图像包括检测目标。
在本公开实施例中,可以通过多种方式进行图像的前背景分割。在一个或多个可选例子中,可以通过图像分割神经网络将当前图像分割为前景图像及背景图像,即将当前图像输入图像分割神经网络,利用图像分割神经网络学习到的视觉特征对当前图像进行分割,输出当前图像的前景图像及背景图像。
可选地,图像分割神经网络可以采用卷积神经网络。或者,图像分割神经网络也可以采用其他方式实现,本公开实施例对图像分割神经网络的具体实现不作限定。
可选地,在通过图像分割神经网络将当前图像分割为前景图像及背景图像之前,还可以基于标注有前/背景信息的多个样本图像训练图像分割神经网络,相应地,在完成对图像分割神经网络的训练之后,可以通过训练好的图像分割神经网络,将当前图像分割为前景图像及背景图像。其中,对于图像分割神经网络的训练可以采用任意可能的神经网络训练方法,例如随机梯度下降法等,本公开实施例对此不做限定。
可选地,检测目标可以为人物或其他类型的物体,本公开实施例对此不做限定。
104,对当前图像中对应于背景图像的部分进行偏差消除处理,获得处理后的图像。
具体地,可以对图像中对应于背景图像的部分(即背景部分)进行偏差消除处理或干扰消除处理,以消除背景部分对后续图像特征的提取的干扰。其中,可以保持图像中的前景部分不变,而仅对背景部分进行处理,得到处理后的图像。
在一个可选例子中,可以以随机选取的图像替换当前图像中对应于背景图像的部分,获得处理后的图像。例如,可以从包括至少一个预设图像的预设图库中随机选择其中一个预设图像,并以该随机选取的图像替换图像的背景部分,但本公开实施例不限于此。
在另一个可选例子中,可以以平均像素值填充当前图像中对应于背景图像的部分,获得处理后的图像。其中,该平均像素值可以是预先设置的,或者可以是通过对图像的部分或全部像素点的像素值进行平均处理得到的,或者,可以是通过对多个图像中的部分或全部像素点的像素值进行平均处理得到的,本公开实施例对该平均像素值的确定方式不作限定。
可选地,还可以通过其他方式对图像的背景部分进行偏差消除处理,本公开实施例对此不做限定。
106,对处理后的图像进行目标检测处理,得到图像的目标检测结果。
可选地,可以通过神经网络(以下称为目标识别神经网络)或其他机器学习方法对处理后的图像进行目标检测处理,得到图像的目标检测结果。其中,在一个可选例子中,目标识别神经网络可以采用卷积神经网络或其他类型的神经网络,本公开实施例对此不做限定。
可选地,在当前图像为具有标注信息的样本图像时,在对处理后的图像进行目标检测处理,得到图像的目标检测结果之后,还可以根据图像的目标检测结果与标注信息,训练目标识别神经网络。具体地,样本图像可以具有标注信息,该标注信息可以包括样本图像中包括的检测目标的信息,作为一个例子,假设检测目标为行人,则样本图像的标注信息可以包括样本图像中行人的姓名、性别、年龄、国籍、职业等任意一项或多项。这样,通过利用背景消除后的图像训练神经网络,可以提高神经网络的鲁棒性。
可选地,对于目标识别神经网络的训练可以采用随机梯度下降法等方法,本公开实施例对神经网络的训练方法不做限定。
在一个或多个可选例子中,可以确定图像的目标检测结果与标注信息之间的差异。可选地,如果该差异未超过预设范围,则表明神经网络的预测结果的准确性在可接受范围内,可以进行对下一样本图像的处理或结束对神经网络的训练。可选地,若图像的目标检测结果与标注信息之间的差异超过预设差异范围,则可以调整目标识别神经网络的参数,并利用参数调整后的神经网络进行对下一样本图像的处理或结束对神经网络的训练,本公开实施例对此不做限定。
基于本公开上述实施例提供的图像处理方法,通过将图像分割为前景图像及背景图像,使前景图像中包括检测目标,对图像中对应于背景图像的部分进行偏差消除处理,获得处理后的图像,对处理后的图像进行目标检测处理,得到图像的目标检测结果,利用图像分割技术替换图像的背景,增加了具有相同前景不同背景的图像,实现了针对图像背景信息的数据增强,当采用数据增强后的图像作为样本图像对神经网络模型进行训练时,可以使训练出来的神经网络模型执行任务只依赖于图像的前景信息,而不受到图像中背景信息的影响,从而增加了神经网络模型在不同背景下的鲁棒性,当将其应用于行人检索方法时,可以有效对抗图像中背景信息的干扰。另外,本公开实施例提供的方法还可以应用于其他计算机视觉任务的数据增强,例如行人属性问题的数据增强。
请参阅图2A至图2D所示的例子。其中,图2A为四张原始图像,图2B为对图2A中四张原始图像中的前景分别进行平均像素值填充得到的四张图像,图2C为对图2A中四张原始图像中的背景分别进行平均像素值填充得到的四张图像,图2D为对图2A中四张原始图像中的背景分别进行随机图像替换得到的四张图像。对上述四组图像进行比对试验,可以得出以平均像素值填充背景得到的图像和以随机选取的图像替换背景得到的图像训练的神经网络模型,在识别物体时受到图像中背景信息的影响较小,神经网络模型在不同背景下的鲁棒性较好。
下面将结合图3和图4,详细描述本公开实施例中对处理后的图像进行目标检测的流程。应理解,图3和图4所示的例子仅仅是为了帮助本领域技术人员更好地理解本公开的技术方案,而不应理解成对本公开的限定。本领域技术人员可以在图3和图4的基础上进行各种变换,而这种变换也应理解成本公开技术方案的一部分。
如图3所示,该实施例的方法包括:
302,对处理后的图像进行特征提取,得到检测目标的全局特征。
可选地,检测目标的全局特征可以是通过进行一次或多次特征提取得到的,本公开实施例对此不做限定。
304,对处理后的图像进行特征提取,得到检测目标的局部特征。
在一个可选例子中,可以利用图像分割技术将处理后的图像分割为多个子图像,每个子图像包括检测目标的一部分,然后,可以对多个子图像中的每个子图像进行特征提取,获得每个子图像对应于检测目标的局部特征。
可选地,假设检测目标具体为行人,则可以将处理后的图像分割为三个子图像,分别包括行人的头部、上半身和下半身。这样,通过对三个子图像分别进行特征提取,可以得到行人的头部特征、上半身特征和下半身特征等局部特征,但本公开实施例对此不做限定。
306,融合全局特征与局部特征,获得检测目标的特征数据。
可选地,全局特征与局部特征的融合可以采用例如概率统计等特征融合方法来实现,本公开实施例对特征融合的具体实现不作限定。
308,根据特征数据,确定图像的目标检测结果。
可选地,可以确定特征数据与预设图像库中至少一个预设图像中的检测目标对应的预设特征数据之间的相似度。作为一个例子,可以将确定得到的相似度与相似度阈值进行比较,并将与特征数据之间的相似度大于相似度阈值的预设特征数据所对应的预设图像中的检测目标,作为该图像的目标物体检测结果。作为另一个例子,可以将与特征数据之间的相似度最大的预设特征数据所对应的预设图像中的检测目标,作为该图像的目标物体检测结果。或者,也可以采用其他方式,其中,利用特征数据得到图像的相似度的确定可以采用例如余弦距离等相似度确定方法,本公开实施例对此不做限定。
由于目前大多数行人检索方法是提取整个行人图像的特征,当图像库的数据量非常大时,会出现很多整体非常相似的行人,使图像中的这些行人非常难以分辨,影响检索的效果。
基于本公开上述实施例提供的图像处理方法,通过对图像进行特征提取,得到图像中检测目标的全局特征及局部特征,融合全局特征与局部特征获得检测目标的特征数据,根据特征数据,确定图像的目标检测结果,在对图像中的检测目标进行提取特征时,除了提取检测目标整体的全局特征,还增加了对检测目标局部特征的提取,根据所提取的检测目标的局部特征可以获得图像中检测目标各部分的细节特征,通过将全局特征与局部特征融合可以获得能够反映图像中检测目标各部分细节特征的特征数据,当利用这样的特征数据对检测目标进行识别时,可以获得更准确的识别结果,当将其应用于行人检索方法时,可以有效的区分整体非常相似的行人图像,获得更好的检索效果。另外,本公开实施例提供的方法还可以应用于其他计算机视觉任务的特征提取,例如行人属性问题的特征提取。
在图4中所示的例子中,为了便于理解,假设检测目标为行人,但本公开实施例不限于此。
402,对处理后的图像进行特征提取,得到行人的全局特征。
404,将处理后的图像分割为分别包括人体的头部、上半身及下半身的三个子图像。
可选地,可以对处理后的图像进行人体解析处理,得到处理后的图像的人体解析结果,并根据人体解析结果,将处理后的图像分割为分别包括人体的头部、上半身及下半身的三个子图像,但本公开实施例对分割图像的具体实现不作限定。
406,对三个子图像中包括人体的头部的子图像进行特征提取,得到人体的头部特征;对三个子图像中包括人体的上半身的子图像进行特征提取,得到人体的上半身特征;以及对三个子图像中包括人体的下半身的子图像进行特征提取,得到人体的下半身特征。
此时,人体的局部特征可以包括头部特征、上半身特征和下半身特征。可选地,还可以采取其他方式进行图像分割,相应地,人体的局部特征也可以包括其他类型的特征,但本公开实施例对此不做限定。
可选地,402与406可以同时进行,即在提取图像中行人全局特征的同时,对多个子图像中的每个子图像进行行人局部特征的提取。或者,402和406可以以任意先后顺序执行,本公开实施例对此不做限定。
408,融合全局特征与各局部特征,获得行人的特征数据。
410,根据特征数据,确定图像的行人检测结果。
可选地,在本公开实施例中,可以通过目标识别神经网络对处理后的图像进行目标检测处理,得到图像的目标检测结果,例如,可以将处理后的图像输入到目标识别神经网络进行处理,得到图像的目标检测结果。下面结合图5所示的一个例子详细说明本公开实施例的目标识别神经网络。目标识别神经网络可以包括:全局特征提取网络502、图像分割网络504及局部特征提取网络506,其中,全局特征提取网络502可以用于对输入图像进行特征提取处理,得到检测目标的全局特征,图像分割网络504可以用于对输入图像进行图像分割处理,得到多个子图像,并将多个子图像输出到局部特征提取网络。局部特征提取网络506可以用于对多个子图像中的每个子图像进行特征提取处理,得到该每个子图像的局部特征。可选地,全局特征提取网络502还可以根据全局特征和多个局部特征,确定输入图像的目标检测结果。
应理解,在图5所示的例子中,目标识别神经网络具体为卷积神经网络,但本公开实施例中的目标识别神经网络也可以为其他类型的神经网络,本公开实施例对此不做限定。
可选地,图像分割网络504可以通过对输入图像进行人体解析处理,将输入图像分割为多个子图像。
可选地,局部特征提取网络506可以包括与多个子图像对应的多个子网络,每个子网络对应于一个子图像。其中,可选地,多个子网络的个数与多个子图像的个数相同,并且多个子网络与多个子图像一一对应,每个子网络可以用于对对应的子图像进行处理,得到对应的局部特征。或者,多个子网络的个数也可以大于多个子图像的个数,相应地,每个子图像可以采用一个或至少两个子网络进行处理,本公开实施例对此不做限定。
可选地,多个子网络可以以相同或不同的方式对对应的子图像进行处理。可选地,多个子网络可以具有相同的结构,而其具体参数可以通过训练分别得到。作为一个可选例子,多个子网络可以具有相同的参数,例如,层结构、计算核参数,等等。此外,某个子网络和全局特征提取网络502可以以相同或不同的方式进行特征提取。作为一个例子,子网络用于进行特征提取的部分和全局特征提取网络502中用于进行特征提取的部分可以具有相同的结构,例如,可以具有相同的参数。作为另一个例子,子网络和全局特征提取网络502中用于特征提取的部分可以具有相同或相似的参数,但本公开实施例不限于此。
在图5所示的例子中,以检测目标为行人且将处理后的图像分割为包括头部的子图像、包括上半身的子图像和包括下半身的子图像为例,局部特征提取网络503包括三个子网络,三个子网络分别对应于包括人体的头部、上半身及下半身的三个子图像,通过三个子网络分别对对应的三个子图像进行特征提取,可以得到人体的头部特征、上半身特征及下半身特征。
如图5所示,全局特征提取网络502可以包括卷积网络、特征提取模块1、特征提取模块2、特征提取模块3和全连接层等模块,本公开实施例对此不做限定。
局部特征提取网络506中的三个子网络可以具有相似的结构。每个子网络可以包括过滤处理模块、特征提取模块2和特征提取模块3等结构,其中,可选地,过滤处理模块可以通过gating来实现,但本公开实施例不限于此。
可选地,如图5所示,全局特征提取网络502中的卷积网络和特征提取模块1可以依次对输入图像进行处理,得到特征提取模块1的输出特征,即中间特征,局部特征提取网络506中的三个子网络可以分别获取该中间特征,并利用中间特征分别得到局部特征。
可选地,子网络可以对获取到的中间特征进行过滤处理,得到与子网络对应的子图像相对应的过滤后特征,并利用该过滤后特征得到局部特征。具体地,如图5所示,可以利用特征提取模块2和特征提取模块3依次对过滤后特征进行特征提取处理,得到局部特征。
此外,全局特征提取网络502中的第一部分(即特征提取模块2和特征提取模块3)也可以获取该中间特征,并对该中间特征进行处理,得到全局特征。
可选地,全局特征提取网络502的特征提取模块2和各个子网络中的特征提取模块2可以具有相同的参数。可选地,全局特征提取网络502的特征提取模块3和各个子网络中的特征提取模块3可以具有相同的参数,但本公开实施例不限于此。
可选地,图5所示的一个或多个特征提取模块可以通过Inception网络实现,但本公开实施例不限于此。
可选地,全局特征与局部特征可以均为特征向量,例如均为256维的特征向量,全局特征与局部特征的融合可以是将检测目标的一个256维的全局特征向量与检测目标的各个256维的局部特征向量进行融合,再经过一个全连接层后降维到256维的特征向量,作为特征数据。
可选地,图像分割网络与将当前图像分割为前景图像及背景图像的图像分割神经网络可以具有相似的结构,并且可以是在对目标识别神经网络训练之前预先进行训练,但本公开实施例对此不作限定。
基于本公开上述实施例提供的图像处理方法,通过对图像进行特征提取,得到图像中检测目标的全局特征,将图像分割为多个子图像,使每个子图像包括检测目标的一部分,对每个子图像进行特征提取,获得每个子图像对应于检测目标的局部特征,融合全局特征与局部特征,获得检测目标的特征数据,根据特征数据,确定图像的目标检测结果,在对图像中的检测目标进行提取特征时,除了提取检测目标整体的全局特征,还增加了利用图像分割技术对检测目标局部特征的提取,根据所提取的检测目标的局部特征可以获得图像中检测目标各部分的细节特征,通过将全局特征与局部特征融合可以获得能够反映图像中检测目标各部分细节特征的特征数据,当利用这样的特征数据对检测目标进行识别时,可以获得更准确的识别结果,当将其应用于行人检索方法时,可以有效的区分整体非常相似的行人图像,获得更好的检索效果。另外,本公开实施例提供的方法还可以应用于其他计算机视觉任务的特征提取,例如行人属性问题的特征提取。
图6是本公开实施例图像处理装置一个实施例的结构示意图。如图6所示,该实施例的图像处理装置包括:图像分割单元602、背景处理单元604和目标检测单元606。其中,
图像分割单元606,用于将当前图像分割为前景图像及背景图像,前景图像包括检测目标。
在本公开实施例中,图像分割单元602可以通过多种方式进行图像的前背景分割。在一个或多个可选例子中,可以通过图像分割神经网络将当前图像分割为前景图像及背景图像,即将当前图像输入图像分割神经网络,利用图像分割神经网络学习到的视觉特征对当前图像进行分割,输出当前图像的前景图像及背景图像。
可选地,图像分割神经网络可以采用卷积神经网络。或者,图像分割神经网络也可以采用其他方式实现,本公开实施例对图像分割神经网络的具体实现不作限定。
可选地,在通过图像分割神经网络将当前图像分割为前景图像及背景图像之前,还可以基于标注有前/背景信息的多个样本图像训练图像分割神经网络,相应地,在完成对图像分割神经网络的训练之后,可以通过训练好的图像分割神经网络,将当前图像分割为前景图像及背景图像。其中,对于图像分割神经网络的训练可以采用任意可能的神经网络训练方法,例如随机梯度下降法等,本公开实施例对此不做限定。
可选地,检测目标可以为人物或其他类型的物体,本公开实施例对此不做限定。
背景处理单元604,用于对当前图像中对应于背景图像的部分进行偏差消除处理,获得处理后的图像。
具体地,背景处理单元604可以对图像中对应于背景图像的部分(即背景部分)进行偏差消除处理或干扰消除处理,以消除背景部分对后续图像特征的提取的干扰。其中,可以保持图像中的前景部分不变,而仅对背景部分进行处理,得到处理后的图像。
在一个可选例子中,背景处理单元604可以以随机选取的图像替换当前图像中对应于背景图像的部分,获得处理后的图像。例如,可以从包括至少一个预设图像的预设图库中随机选择其中一个预设图像,并以该随机选取的图像替换图像的背景部分,但本公开实施例不限于此。
在另一个可选例子中,背景处理单元604可以以平均像素值填充当前图像中对应于背景图像的部分,获得处理后的图像。其中,该平均像素值可以是预先设置的,或者可以是通过对图像的部分或全部像素点的像素值进行平均处理得到的,或者,可以是通过对多个图像中的部分或全部像素点的像素值进行平均处理得到的,本公开实施例对该平均像素值的确定方式不作限定。
可选地,背景处理单元604还可以通过其他方式对图像的背景部分进行偏差消除处理,本公开实施例对此不做限定。
目标检测单元606,用于对处理后的图像进行目标检测处理,得到图像的目标检测结果。
可选地,目标检测单元606可以通过目标识别神经网络或其他机器学习方法对处理后的图像进行目标检测处理,得到图像的目标检测结果。其中,在一个可选例子中,目标识别神经网络可以采用卷积神经网络或其他类型的神经网络,本公开实施例对此不做限定。
可选地,在当前图像为具有标注信息的样本图像时,图像处理装置还包括网络训练单元,网络训练单元用于根据图像的目标检测结果与标注信息,训练目标识别神经网络。具体地,样本图像可以具有标注信息,该标注信息可以包括样本图像中包括的检测目标的信息,作为一个例子,假设检测目标为行人,则样本图像的标注信息可以包括样本图像中行人的姓名、性别、年龄、国籍、职业等任意一项或多项。这样,通过利用背景消除后的图像训练神经网络,可以提高神经网络的鲁棒性。
可选地,对于目标识别神经网络的训练可以采用随机梯度下降法等方法,本公开实施例对神经网络的训练方法不做限定。
在一个或多个可选例子中,网络训练单元可以用于确定图像的目标检测结果与标注信息之间的差异。可选地,如果该差异未超过预设范围,则表明神经网络的预测结果的准确性在可接受范围内,可以进行对下一样本图像的处理或结束对神经网络的训练。可选地,若图像的目标检测结果与标注信息之间的差异超过预设差异范围,则可以调整目标识别神经网络的参数,并利用参数调整后的神经网络进行对下一样本图像的处理或结束对神经网络的训练,本公开实施例对此不做限定。
基于本公开上述实施例提供的图像处理装置,通过将图像分割为前景图像及背景图像,使前景图像中包括检测目标,对图像中对应于背景图像的部分进行偏差消除处理,获得处理后的图像,对处理后的图像进行目标检测处理,得到图像的目标检测结果,利用图像分割技术替换图像的背景,增加了具有相同前景不同背景的图像,实现了针对图像背景信息的数据增强,当采用数据增强后的图像作为样本图像对神经网络模型进行训练时,可以使训练出来的神经网络模型执行任务只依赖于图像的前景信息,而不受到图像中背景信息的影响,从而增加了神经网络模型在不同背景下的鲁棒性,当将其应用于行人检索方法时,可以有效对抗图像中背景信息的干扰。另外,本公开实施例提供的方法还可以应用于其他确定机视觉任务的数据增强,例如行人属性问题的数据增强。
下面将结合图7和图8,详细描述本公开实施例中目标检测单元的具体结构。应理解,图7和图8所示的例子仅仅是为了帮助本领域技术人员更好地理解本公开的技术方案,而不应理解成对本公开的限定。本领域技术人员可以在图7和图8的基础上进行各种变换,而这种变换也应理解成本公开技术方案的一部分。
如图7所示,该实施例的目标检测单元包括:全局特征提取模块702、局部特征提取模块704、特征融合模块706和目标检测模块708。其中,
全局特征提取模块702,用于对处理后的图像进行特征提取,得到检测目标的全局特征。
可选地,检测目标的全局特征可以是通过进行一次或多次特征提取得到的,本公开实施例对此不做限定。
局部特征提取模块704,用于对处理后的图像进行特征提取,得到检测目标的局部特征。
在一个可选例子中,局部特征提取模块704可以利用图像分割技术将处理后的图像分割为多个子图像,每个子图像包括检测目标的一部分,然后,可以对多个子图像中的每个子图像进行特征提取,获得每个子图像对应于检测目标的局部特征。
特征融合模块706,用于融合全局特征与局部特征,获得检测目标的特征数据。
可选地,全局特征与局部特征的融合可以采用例如概率统计等特征融合方法来实现,本公开实施例对特征融合的具体实现不作限定。
目标检测模块708,用于根据特征数据,确定图像的目标检测结果。
可选地,目标检测模块708可以确定特征数据与预设图像库中至少一个预设图像中的检测目标对应的预设特征数据之间的相似度。作为一个例子,可以将确定得到的相似度与相似度阈值进行比较,并将与特征数据之间的相似度大于相似度阈值的预设特征数据所对应的预设图像中的检测目标,作为该图像的目标检测结果。作为另一个例子,可以将与特征数据之间的相似度最大的预设特征数据所对应的预设图像中的检测目标,作为该图像的目标物体检测结果。或者,也可以采用其他方式,其中,利用特征数据得到图像的相似度的确定可以采用例如余弦距离等相似度确定方法,本公开实施例对此不做限定。
基于本公开上述实施例提供的图像处理装置,通过对图像进行特征提取,得到图像中检测目标的全局特征及局部特征,融合全局特征与局部特征获得检测目标的特征数据,根据特征数据,确定图像的目标检测结果,在对图像中的检测目标进行提取特征时,除了提取检测目标整体的全局特征,还增加了对检测目标局部特征的提取,根据所提取的检测目标的局部特征可以获得图像中检测目标各部分的细节特征,通过将全局特征与局部特征融合可以获得能够反映图像中检测目标各部分细节特征的特征数据,当利用这样的特征数据对检测目标进行识别时,可以获得更准确的识别结果,当将其应用于行人检索方法时,可以有效的区分整体非常相似的行人图像,获得更好的检索效果。另外,本公开实施例提供的方法还可以应用于其他计算机视觉任务的特征提取,例如行人属性问题的特征提取。
在图8中所示的例子中,为了便于理解,假设检测目标为行人,但本公开实施例不限于此。
如图8所示,该实施例的目标检测单元包括:全局特征提取模块802、图像分割子模块804、局部特征提取子模块806、特征融合模块808和目标检测模块810。其中,
全局特征提取模块802,用于对处理后的图像进行特征提取,得到行人的全局特征。
图像分割子模块804,用于将处理后的图像分割为分别包括人体的头部、上半身及下半身的三个子图像。
可选地,图像分割子模块804可以对处理后的图像进行人体解析处理,得到处理后的图像的人体解析结果,并根据人体解析结果,将处理后的图像分割为分别包括人体的头部、上半身及下半身的三个子图像,但本公开实施例对分割图像的具体实现不作限定。
局部特征提取子模块806,用于对三个子图像中包括人体的头部的子图像进行特征提取,得到人体的头部特征;对三个子图像中包括人体的上半身的子图像进行特征提取,得到人体的上半身特征;以及对三个子图像中包括人体的下半身的子图像进行特征提取,得到人体的下半身特征。
此时,人体的局部特征可以包括头部特征、上半身特征和下半身特征。可选地,还可以采取其他方式进行图像分割,相应地,人体的局部特征也可以包括其他类型的特征,但本公开实施例对此不做限定。
特征融合模块808,用于融合全局特征与各局部特征,获得行人的特征数据。
目标检测模块810,用于根据特征数据,确定图像的行人检测结果。
可选地,在本公开实施例中,目标检测单元可以通过目标识别神经网络对处理后的图像进行目标检测处理,得到图像的目标检测结果,例如,可以将处理后的图像输入到目标识别神经网络进行处理,得到图像的目标检测结果。下面结合图5所示的一个例子详细说明本公开实施例的目标识别神经网络。目标识别神经网络可以包括:全局特征提取网络502、图像分割网络504及局部特征提取网络506,其中,全局特征提取模块802可以通过全局特征提取网络502对输入图像进行特征提取处理,得到检测目标的全局特征,图像分割子模块804可以通过图像分割网络504对输入图像进行图像分割处理,得到多个子图像,并将多个子图像输出到局部特征提取网络。局部特征提取子模块806可以通过局部特征提取网络506对多个子图像中的每个子图像进行特征提取处理,得到该每个子图像的局部特征。可选地,全局特征提取网络502还可以根据全局特征和多个局部特征,确定输入图像的目标检测结果。
应理解,在图5所示的例子中,目标识别神经网络具体为卷积神经网络,但本公开实施例中的目标识别神经网络也可以为其他类型的神经网络,本公开实施例对此不做限定。
可选地,图像分割子模块804可以通过图像分割网络504对输入图像进行人体解析处理,将输入图像分割为多个子图像。
可选地,局部特征提取网络506可以包括与多个子图像对应的多个子网络,每个子网络对应于一个子图像。其中,可选地,多个子网络的个数与多个子图像的个数相同,并且多个子网络与多个子图像一一对应,每个子网络可以用于对对应的子图像进行处理,得到对应的局部特征。或者,多个子网络的个数也可以大于多个子图像的个数,相应地,每个子图像可以采用一个或至少两个子网络进行处理,本公开实施例对此不做限定。
可选地,多个子网络可以以相同或不同的方式对对应的子图像进行处理。可选地,多个子网络可以具有相同的结构,而其具体参数可以通过训练分别得到。作为一个可选例子,多个子网络可以具有相同的参数,例如,层结构、计算核参数,等等。此外,某个子网络和全局特征提取网络502可以以相同或不同的方式进行特征提取。作为一个例子,子网络用于进行特征提取的部分和全局特征提取网络502中用于进行特征提取的部分可以具有相同的结构,例如,可以具有相同的参数。作为另一个例子,子网络和全局特征提取网络502中用于特征提取的部分可以具有相同或相似的参数,但本公开实施例不限于此。
可选地,图像分割网络与将当前图像分割为前景图像及背景图像的图像分割神经网络可以具有相似的结构,并且可以是在对目标识别神经网络训练之前预先进行训练,但本公开实施例对此不作限定。
基于本公开上述实施例提供的图像处理装置,通过对图像进行特征提取,得到图像中检测目标的全局特征,将图像分割为多个子图像,使每个子图像包括检测目标的一部分,对每个子图像进行特征提取,获得每个子图像对应于检测目标的局部特征,融合全局特征与局部特征,获得检测目标的特征数据,根据特征数据,确定图像的目标检测结果,在对图像中的检测目标进行提取特征时,除了提取检测目标整体的全局特征,还增加了利用图像分割技术对检测目标局部特征的提取,根据所提取的检测目标的局部特征可以获得图像中检测目标各部分的细节特征,通过将全局特征与局部特征融合可以获得能够反映图像中检测目标各部分细节特征的特征数据,当利用这样的特征数据对检测目标进行识别时,可以获得更准确的识别结果,当将其应用于行人检索方法时,可以有效的区分整体非常相似的行人图像,获得更好的检索效果。另外,本公开实施例提供的方法还可以应用于其他确定机视觉任务的特征提取,例如行人属性问题的特征提取。
另外,本公开实施例还提供了一种电子设备,例如可以是移动终端、个人确定机(PC)、平板电脑、服务器等,该电子设备设置有本公开上述任一实施例的图像处理装置。
本公开实施例还提供了一种电子设备,例如可以是移动终端、个人确定机(PC)、平板电脑、服务器等。下面参考图9,其示出了适于用来实现本申请实施例的终端设备或服务器的电子设备900的结构示意图:如图9所示,确定机系统900包括一个或多个处理器、通信部等,所述一个或多个处理器例如:一个或多个中央处理单元(CPU)901,和/或一个或多个图像处理器(GPU)913等,处理器可以根据存储在只读存储器(ROM)902中的可执行指令或者从存储部分908加载到随机访问存储器(RAM)903中的可执行指令而执行各种适当的动作和处理。通信部912可包括但不限于网卡,所述网卡可包括但不限于IB(Infiniband)网卡。
处理器可与只读存储器902和/或随机访问存储器930中通信以执行可执行指令,通过总线904与通信部912相连、并经通信部912与其他目标设备通信,从而完成本申请实施例提供的任一项方法对应的操作,例如,将当前图像分割为前景图像及背景图像,前景图像包括检测目标;对当前图像中对应于背景图像的部分进行偏差消除处理,获得处理后的图像;对处理后的图像进行目标检测处理,得到图像的目标检测结果。
此外,在RAM 903中,还可存储有装置操作所需的各种程序和数据。CPU901、ROM902以及RAM903通过总线904彼此相连。在有RAM903的情况下,ROM902为可选模块。RAM903存储可执行指令,或在运行时向ROM902中写入可执行指令,可执行指令使处理器901执行上述通信方法对应的操作。输入/输出(I/O)接口905也连接至总线904。通信部912可以集成设置,也可以设置为具有多个子模块(例如多个IB网卡),并在总线链接上。
以下部件连接至I/O接口405:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的确定机程序根据需要被安装入存储部分908。
需要说明的,如图9所示的架构仅为一种可选实现方式,在具体实践过程中,可根据实际需要对上述图9的部件数量和类型进行选择、删减、增加或替换;在不同功能部件设置上,也可采用分离设置或集成设置等实现方式,例如GPU和CPU可分离设置或者可将GPU集成在CPU上,通信部可分离设置,也可集成设置在CPU或GPU上,等等。这些可替换的实施方式均落入本公开公开的保护范围。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行流程图所示的方法的程序代码,程序代码可包括对应执行本申请实施例提供的方法步骤对应的指令,例如,将当前图像分割为前景图像及背景图像,前景图像包括检测目标;对当前图像中对应于背景图像的部分进行偏差消除处理,获得处理后的图像;对处理后的图像进行目标检测处理,得到图像的目标检测结果。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(CPU)901执行时,执行本申请的方法中限定的上述功能。
在一个或多个可选实施方式中,本公开实施例还提供了一种计算机程序程序产品,用于存储计算机可读指令,该指令被执行时使得计算机执行上述任一可能的实现方式中的图像处理方法。
该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选例子中,该计算机程序产品具体体现为计算机存储介质,在另一个可选例子中,该计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
在一个或多个可选实施方式中,本公开实施例还提供了一种图像处理方法及其对应的装置和电子设备、计算机存储介质、计算机程序以及计算机程序产品,其中,该方法包括:第一装置向第二装置发送图像处理指示,该指示使得第二装置执行上述任一可能的实施例中的图像处理方法;第一装置接收第二装置发送的图像的目标检测结果。
在一些实施例中,该图像处理指示可以具体为调用指令,第一装置可以通过调用的方式指示第二装置执行图像处理,相应地,响应于接收到调用指令,第二装置可以执行上述图像处理方法中的任意实施例中的步骤和/或流程。
应理解,本公开实施例中的“第一”、“第二”等术语仅仅是为了区分,而不应理解成对本公开实施例的限定。
还应理解,在本公开中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
可能以许多方式来实现本公开的方法和装置、设备。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置、设备。用于方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
本公开的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本公开限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本公开的原理和实际应用,并且使本领域的普通技术人员能够理解本公开从而设计适于特定用途的带有各种修改的各种实施例。

Claims (10)

1.一种图像处理方法,其特征在于,包括:
将当前图像分割为前景图像及背景图像,所述前景图像包括检测目标;
对所述当前图像中对应于所述背景图像的部分进行偏差消除处理,获得处理后的图像;
对所述处理后的图像进行目标检测处理,得到所述图像的目标检测结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述当前图像中对应于所述背景图像的部分进行偏差消除处理,包括:
以随机选取的图像替换所述当前图像中对应于所述背景图像的部分。
3.根据权利要求1所述的方法,其特征在于,所述对所述当前图像中对应于所述背景图像的部分进行偏差消除处理,包括:
以平均像素值填充所述当前图像中对应于所述背景图像的部分。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述对所述处理后的图像进行目标检测处理,得到所述图像的目标检测结果,包括:
对所述处理后的图像进行特征提取,得到所述检测目标的全局特征;
对所述处理后的图像进行特征提取,得到所述检测目标的局部特征;
融合所述全局特征与所述局部特征,获得所述检测目标的特征数据;
根据所述特征数据,确定所述图像的目标检测结果。
5.根据权利要求4所述的方法,其特征在于,所述对所述处理后的图像进行特征提取,得到所述检测目标的局部特征,包括:
将所述处理后的图像分割为多个子图像,每个所述子图像包括所述检测目标的一部分;
对所述多个子图像中的每个子图像进行特征提取,获得每个所述子图像对应于所述检测目标的局部特征。
6.一种图像处理装置,其特征在于,包括:
图像分割单元,用于将当前图像分割为前景图像及背景图像,所述前景图像包括检测目标;
背景处理单元,用于对所述当前图像中对应于所述背景图像的部分进行偏差消除处理,获得处理后的图像;
目标检测单元,用于对所述处理后的图像进行目标检测处理,得到所述图像的目标检测结果。
7.一种电子设备,其特征在于,包括权利要求6所述的装置。
8.一种电子设备,其特征在于,包括:
存储器,用于存储可执行指令;以及
处理器,用于与所述存储器通信以执行所述可执行指令从而完成权利要求1至5中任意一项所述的方法。
9.一种计算机程序,包括计算机可读代码,其特征在于,当所述计算机可读代码在设备上运行时,所述设备中的处理器执行用于实现权利要求1至5中任意一项所述方法的指令。
10.一种计算机存储介质,用于存储计算机可读取的指令,其特征在于,所述指令被执行时执行权利要求1至5中任意一项所述的方法。
CN201711376170.XA 2017-12-19 2017-12-19 图像处理方法和装置、电子设备、计算机程序和存储介质 Pending CN108229344A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711376170.XA CN108229344A (zh) 2017-12-19 2017-12-19 图像处理方法和装置、电子设备、计算机程序和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711376170.XA CN108229344A (zh) 2017-12-19 2017-12-19 图像处理方法和装置、电子设备、计算机程序和存储介质

Publications (1)

Publication Number Publication Date
CN108229344A true CN108229344A (zh) 2018-06-29

Family

ID=62649875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711376170.XA Pending CN108229344A (zh) 2017-12-19 2017-12-19 图像处理方法和装置、电子设备、计算机程序和存储介质

Country Status (1)

Country Link
CN (1) CN108229344A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109614278A (zh) * 2018-10-16 2019-04-12 深圳壹账通智能科技有限公司 自动化测试过程中问题定位的方法、装置和终端
CN109635141A (zh) * 2019-01-29 2019-04-16 京东方科技集团股份有限公司 用于检索图像的方法、电子设备和计算机可读存储介质
CN109815881A (zh) * 2019-01-18 2019-05-28 成都旷视金智科技有限公司 行为识别模型的训练方法、行为识别方法、装置及设备
CN109859218A (zh) * 2019-02-25 2019-06-07 北京邮电大学 病理图关键区域确定方法、装置、电子设备及存储介质
CN110163053A (zh) * 2018-08-02 2019-08-23 腾讯科技(深圳)有限公司 生成人脸识别的负样本的方法、装置及计算机设备
CN110232407A (zh) * 2019-05-29 2019-09-13 深圳市商汤科技有限公司 图像处理方法和装置、电子设备和计算机存储介质
CN110782426A (zh) * 2018-09-11 2020-02-11 成都极米科技股份有限公司 一种背景提取方法及目标判别方法
CN110913246A (zh) * 2019-11-28 2020-03-24 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质
CN111798250A (zh) * 2019-12-31 2020-10-20 支付宝实验室(新加坡)有限公司 用于确定官方文档的真实性的方法和系统
CN112215123A (zh) * 2020-10-09 2021-01-12 腾讯科技(深圳)有限公司 一种目标检测方法、装置及存储介质
WO2023056833A1 (zh) * 2021-10-09 2023-04-13 北京字节跳动网络技术有限公司 背景图生成、图像融合方法、装置、电子设备及可读介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2327238A1 (en) * 1999-12-04 2001-06-04 Luratech Gesellschaft Fuer Luft-Und Raumfahrttechnologie & Multimedia H Method for compressing scanned colored and gray-scale documents
CN1996346A (zh) * 2005-12-29 2007-07-11 电子科技大学 基于轮廓的车型识别方法
CN102609722A (zh) * 2012-02-07 2012-07-25 西安理工大学 视频图像中形状的局部与全局特征结构融合方法
CN105631413A (zh) * 2015-12-23 2016-06-01 中通服公众信息产业股份有限公司 一种基于深度学习的跨场景行人搜索方法
CN107316031A (zh) * 2017-07-04 2017-11-03 北京大学深圳研究生院 用于行人重识别的图像特征提取方法
CN107341805A (zh) * 2016-08-19 2017-11-10 北京市商汤科技开发有限公司 图像前背景分割及网络模型训练、图像处理方法和装置
CN107423747A (zh) * 2017-04-13 2017-12-01 中国人民解放军国防科学技术大学 一种基于深度卷积网络的显著性目标检测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2327238A1 (en) * 1999-12-04 2001-06-04 Luratech Gesellschaft Fuer Luft-Und Raumfahrttechnologie & Multimedia H Method for compressing scanned colored and gray-scale documents
CN1996346A (zh) * 2005-12-29 2007-07-11 电子科技大学 基于轮廓的车型识别方法
CN102609722A (zh) * 2012-02-07 2012-07-25 西安理工大学 视频图像中形状的局部与全局特征结构融合方法
CN105631413A (zh) * 2015-12-23 2016-06-01 中通服公众信息产业股份有限公司 一种基于深度学习的跨场景行人搜索方法
CN107341805A (zh) * 2016-08-19 2017-11-10 北京市商汤科技开发有限公司 图像前背景分割及网络模型训练、图像处理方法和装置
CN107423747A (zh) * 2017-04-13 2017-12-01 中国人民解放军国防科学技术大学 一种基于深度卷积网络的显著性目标检测方法
CN107316031A (zh) * 2017-07-04 2017-11-03 北京大学深圳研究生院 用于行人重识别的图像特征提取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HAIYU ZHAO等: "Spindle Net: Person Re-identification with Human Body Region Guided Feature Decomposition and Fusion", 《2017 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION(CVPR)》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163053A (zh) * 2018-08-02 2019-08-23 腾讯科技(深圳)有限公司 生成人脸识别的负样本的方法、装置及计算机设备
US11302118B2 (en) 2018-08-02 2022-04-12 Tencent Technology (Shenzhen) Company Limited Method and apparatus for generating negative sample of face recognition, and computer device
CN110782426B (zh) * 2018-09-11 2022-07-12 成都极米科技股份有限公司 一种背景提取方法及目标判别方法
CN110782426A (zh) * 2018-09-11 2020-02-11 成都极米科技股份有限公司 一种背景提取方法及目标判别方法
CN109614278A (zh) * 2018-10-16 2019-04-12 深圳壹账通智能科技有限公司 自动化测试过程中问题定位的方法、装置和终端
CN109815881A (zh) * 2019-01-18 2019-05-28 成都旷视金智科技有限公司 行为识别模型的训练方法、行为识别方法、装置及设备
CN109635141B (zh) * 2019-01-29 2021-04-27 京东方科技集团股份有限公司 用于检索图像的方法、电子设备和计算机可读存储介质
CN109635141A (zh) * 2019-01-29 2019-04-16 京东方科技集团股份有限公司 用于检索图像的方法、电子设备和计算机可读存储介质
US11113586B2 (en) * 2019-01-29 2021-09-07 Boe Technology Group Co., Ltd. Method and electronic device for retrieving an image and computer readable storage medium
CN109859218A (zh) * 2019-02-25 2019-06-07 北京邮电大学 病理图关键区域确定方法、装置、电子设备及存储介质
CN110232407B (zh) * 2019-05-29 2022-03-15 深圳市商汤科技有限公司 图像处理方法和装置、电子设备和计算机存储介质
CN110232407A (zh) * 2019-05-29 2019-09-13 深圳市商汤科技有限公司 图像处理方法和装置、电子设备和计算机存储介质
CN110913246A (zh) * 2019-11-28 2020-03-24 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质
CN111798250A (zh) * 2019-12-31 2020-10-20 支付宝实验室(新加坡)有限公司 用于确定官方文档的真实性的方法和系统
CN112215123A (zh) * 2020-10-09 2021-01-12 腾讯科技(深圳)有限公司 一种目标检测方法、装置及存储介质
CN112215123B (zh) * 2020-10-09 2022-10-25 腾讯科技(深圳)有限公司 一种目标检测方法、装置及存储介质
WO2023056833A1 (zh) * 2021-10-09 2023-04-13 北京字节跳动网络技术有限公司 背景图生成、图像融合方法、装置、电子设备及可读介质

Similar Documents

Publication Publication Date Title
CN108229344A (zh) 图像处理方法和装置、电子设备、计算机程序和存储介质
TWI773189B (zh) 基於人工智慧的物體檢測方法、裝置、設備及儲存媒體
US10121072B1 (en) Unsupervised removal of text from form images
CN105574513B (zh) 文字检测方法和装置
CN108510472B (zh) 用于处理图像的方法和装置
CN110399890A (zh) 图像识别方法、装置、电子设备及可读存储介质
CN108921159A (zh) 用于检测安全帽的佩戴情况的方法和装置
CN109214343A (zh) 用于生成人脸关键点检测模型的方法和装置
CN109522908A (zh) 基于区域标签融合的图像显著性检测方法
CN107688784A (zh) 一种基于深层特征和浅层特征融合的字符识别方法及存储介质
CN106886995A (zh) 多线性示例回归器聚合的图像显著对象分割方法
CN108205676B (zh) 提取图像文字区域的方法和装置
CN110941978B (zh) 一种未识别身份人员的人脸聚类方法、装置及存储介质
CN109446061A (zh) 一种页面检测方法、计算机可读存储介质及终端设备
US20230053911A1 (en) Detecting an object in an image using multiband and multidirectional filtering
CN108171208A (zh) 信息获取方法和装置
CN108491825A (zh) 信息生成方法和装置
CN109165644A (zh) 目标检测方法和装置、电子设备、存储介质、程序产品
CN105117740A (zh) 字体识别方法及装置
EP3239897A1 (en) Method and apparatus for determining the similarity between multivariate data sets
CN113792623B (zh) 安检ct目标物识别方法和装置
CN104966109A (zh) 医疗化验单图像分类方法及装置
CN114332809A (zh) 一种图像识别方法、装置、电子设备和存储介质
CN108647629A (zh) 一种图像识别定位方法、视频中图像轨迹识别方法和装置
CN108986145A (zh) 视频图像处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination