CN110110666A - 目标检测方法和装置 - Google Patents
目标检测方法和装置 Download PDFInfo
- Publication number
- CN110110666A CN110110666A CN201910379637.9A CN201910379637A CN110110666A CN 110110666 A CN110110666 A CN 110110666A CN 201910379637 A CN201910379637 A CN 201910379637A CN 110110666 A CN110110666 A CN 110110666A
- Authority
- CN
- China
- Prior art keywords
- detected
- image
- target
- detection
- characteristic pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Abstract
本公开的实施例公开了目标检测方法和装置。该方法的一具体实施方式包括:获取待检测图像;对待检测图像进行分析以确定待检测图像是否显示有检测目标;响应于确定待检测图像显示有检测目标,将待检测图像输入至预先训练的目标检测模型,得到检测结果信息,其中,检测结果信息用于指示检测目标显示在待检测图像中的位置。该实施方式避免了目标检测模型对不显示检测目标的待检测图像的处理所带来的不必要的功耗。
Description
技术领域
本公开的实施例涉及计算机技术领域,具体涉及目标检测方法和装置。
背景技术
目标检测是当前计算机视觉和数字图像处理的一个热门方向。目标检测可以广泛应用于人脸检测和识别、步态识别、实例分割、机器人或智能车导航、智能监控等诸多领域。而且由于如深度学习等方法的快速发展,也带动目标检测算法的快速发展。
在基于神经网络实现的目标检测方法的实际应用中,经常会出现处理的图像中并没有检测目标的情况。而一般地无论图像中是否有检测目标,实现目标检测的神经网络还是会利用各个网络层对图像进行处理。
发明内容
本公开的实施例提出了目标检测方法和装置。
第一方面,本公开的实施例提供了一种目标检测方法,该方法包括:获取待检测图像;对待检测图像进行分析以确定待检测图像是否显示有检测目标;响应于确定待检测图像显示有检测目标,将待检测图像输入至预先训练的目标检测模型,得到检测结果信息,其中,检测结果信息用于指示检测目标显示在待检测图像中的位置。
在一些实施例中,响应于确定待检测图像不显示检测目标,输出用于提示待检测图像不显示检测目标的提示信息。
在一些实施例中,对待检测图像进行分析以确定待检测图像是否显示有检测目标,包括:将待检测图像输入至预先训练的、用于分类的卷积神经网络,以确定待检测图像是否显示有检测目标。
在一些实施例中,目标检测模型的网络层包括至少一个特征提取层、池化层和全连接层;以及将待检测图像输入至预先训练的目标检测模型,得到检测结果信息,包括:利用至少一个特征提取层提取待检测图像的特征图;利用池化层对提取的特征图的尺寸进行调整,以得到预设尺寸的特征图;将得到的预设尺寸的特征图输入至全连接层,以得到检测结果信息。
在一些实施例中,预设尺寸的特征图包括至少两个不同预设尺寸的特征图。
在一些实施例中,检测目标包括人脸。
第二方面,本公开的实施例提供了一种目标检测装置,该装置包括:获取单元,被配置成获取待检测图像;确定单元,被配置成对待检测图像进行分析以确定待检测图像是否显示有检测目标;检测单元,被配置成响应于确定待检测图像显示有检测目标,将待检测图像输入至预先训练的目标检测模型,得到检测结果信息,其中,检测结果信息用于指示检测目标显示在待检测图像中的位置。
在一些实施例中,上述装置还包括:输出单元,被配置成响应于确定待检测图像不显示检测目标,输出用于提示待检测图像不显示检测目标的提示信息。
在一些实施例中,确定单元进一步被配置成:将待检测图像输入至预先训练的、用于分类的卷积神经网络,以确定待检测图像是否显示有检测目标。
在一些实施例中,目标检测模型的网络层包括至少一个特征提取层、池化层和全连接层;以及检测单元进一步被配置成:利用至少一个特征提取层提取待检测图像的特征图;利用池化层对提取的特征图的尺寸进行调整,以得到预设尺寸的特征图;将得到的预设尺寸的特征图输入至全连接层,以得到检测结果信息。
在一些实施例中,预设尺寸的特征图包括至少两个不同预设尺寸的特征图。
在一些实施例中,检测目标包括人脸。
第三方面,本公开的实施例提供了一种终端,该终端包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
在目标检测模型的实际应用中,常常会出现待检测图像不显示检测目标的情况。例如,手机上安装有基于目标检测模型实现人脸检测的应用。由于用户在打开手机摄像头时,可能摄像头会先对准墙壁、天花板等,或者在使用过程中,可能会出现用户将手机暂时搁置的情况。这些情况下,上述应用基于摄像头获取到的图像都是没有人脸的。
又例如,在一些应用基于目标检测模型实现人脸检测的安检设备的场景下,由于前后两个经过安检的用户需要隔离开一定的距离,因此,在前一个用户安检完成,下一个用户还未接近安检设备时,安检设备所拍摄的也是没有人脸的图像。
而由于现有技术中,目标检测模型在处理图像时是针对所有获取到的图像,都会经过目标检测模型的各个网络层进行处理,以得到最终的检测结果。
一般地,目标检测模型在处理图像的过程中,计算量通常是很大的,对应的功耗也会很高。因此,目标检测模型对不显示检测目标的待检测图像的处理过程是不必要的,还会导致较大的功耗。
本公开的实施例提供的目标检测方法和装置,通过在利用目标检测模型对待处理图像进行处理之前,先分析待检测图像是否显示有检测目标,以及在确定待检测图像显示有检测目标时,再利用目标检测模型对待处理图像进行处理,从而可以避免目标检测模型对不显示检测目标的待检测图像的处理所带来的不必要的功耗。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开的一个实施例可以应用于其中的示例性系统架构图;
图2是根据本公开的目标检测方法的一个实施例的流程图;
图3是根据本公开的实施例的目标检测方法的一个应用场景的示意图;
图4是根据本公开的目标检测方法的又一个实施例的流程图;
图5是根据本公开的目标检测装置的一个实施例的结构示意图;
图6是适于用来实现本公开的实施例的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的目标检测方法或目标检测装置的实施例的示例性架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种客户端应用。例如浏览器类应用、搜索类应用、即时通讯类应用等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如为终端设备101、102、103上所安装的客户端应用提供支持的后端服务器。服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器105为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
终端设备101、102、103上可以安装有图像处理类应用、工具等。其中,图像处理类应用、工具等可以分析待检测图像以确定待检测图像是否显示有检测目标,以及在确定待检测图像显示有检测目标时,将待检测图像输入至目标检测模型,以得到检测结果信息。此时,示例性系统架构100可以不存在服务器105和网络104。
需要说明的是,待检测图像显示有检测目标可以理解为待检测图像包括呈现有检测目标的图像区域。例如,拍摄的检测目标的图像即为显示有检测目标的图像。当然,拍摄内容不包含检测目标时所拍摄的图像即为不显示检测目标的图像。
终端设备101、102、103可以是具有摄像功能(如配置有摄像头102)的电子设备。此时,终端设备101、102、103可以利用摄像头获取待检测图像。
终端设备101、102、103也可以与其他电子设备或数据库等通信连接。此时,终端设备101、102、103可以从其他电子设备或数据库等获取待检测图像。上述待检测图像也可以直接存储在终端设备101、102、103的本地。此时,终端设备101、102、103可以直接获取本地所存储的待检测图像并进行处理。此时,终端设备101、102、103可以不具备摄像功能。
需要说明的是,本公开的实施例所提供的目标检测方法一般由终端设备101、102、103执行,相应地,目标检测装置一般设置于终端设备101、102、103中。
还需要指出的是,服务器105中也可以安装有图像处理类应用、工具等,服务器105也可以基于图像处理类应用、工具等对获取的待检测图像进行处理。此时,本公开的实施例所提供的目标检测方法也可以由服务器105执行,相应地,目标检测装置也可以设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,其示出了根据本公开的目标检测方法的一个实施例的流程200。该目标检测方法包括以下步骤:
步骤201,获取待检测图像。
在本实施例中,待检测图像可以是任意的图像。根据不同的应用场景,用于目标检测的方法的执行主体(如图1所示的终端设备101)可以灵活采用各种方式来获取待检测图像。
例如,上述执行主体可以从本地获取待检测图像。又例如,上述执行主体可以利用其上所安装的各种应用下载待检测图像。又例如,上述执行主体可以利用从连接的存储设备或摄像机等设备获取待检测图像。又例如,在上述执行主体具备摄像功能时,可以通过开启摄像功能获取待检测图像。
步骤202,对待检测图像进行分析以确定待检测图像是否显示有检测目标。
在本实施例中,检测目标可以是各种对象。例如,检测目标可以包括吃、穿、住、行、用等涉及的各类对象,检测目标也可以包括如人、动物、植物等等。可选地,检测目标可以包括人脸。
检测目标可以是由技术人员预先指定的对象。检测目标也可以是根据技术人员预先设置的筛选条件所确定的对象。例如,筛选条件可以是:对应所在的图像区域的面积和待检测图像的面积的比值大于预设阈值的对象。
上述执行主体可以利用各种图像分析方法对待检测图像进行分析以确定待检测图像是否显示有检测目标。
其中,确定待检测图像是否显示有检测目标,实质即是一个图像二分类的问题。因此,可以利用各种图像分类方法来对待检测图像进行分析处理。图像分类方法包括如基于特征描述及检测的图像分类算法、如基于神经网络的图像分类算法、基于NearestNeighbor(近邻取样)分类器的图像分类算法等等。
可选地,可以将待检测图像输入至预先训练的、用于分类的卷积神经网络,以确定待检测图像是否显示有检测目标。其中,卷积神经网络的网络结构和参数(如包含哪些网络层、采用哪种激活函数、损失函数等)都可以根据不同的应用场景灵活设置。
例如,卷积神经网络通常可以包括输入层、卷积层、全连接层和输出层。又例如,卷积神经网络可以包括输入层、卷积层、扁平化层、全连接层、输出层。基于卷积神经网络的图像分类算法已是目前广泛研究和应用的公知技术,在此不再赘述。
步骤203,响应于确定待检测图像显示有检测目标,将待检测图像输入至预先训练的目标检测模型,得到检测结果信息。
在本实施例中,在确定待检测图像显示有检测目标时,可以利用预先训练的目标检测模型对待检测图像进行处理以得到检测结果信息。其中,检测结果信息可以用于指示检测目标显示在待检测图像中的位置。
其中,目标检测模型可以是现有的基于各种目标检测算法的神经网络模型。常用的目标检测算法包括如YOLO(You Only Look Once)、SSD(Single Shot MultiBoxDetector)、Faster R-CNN(Faster Regions with Convolutional Neural NetworksFeatures)等等。
可选地,响应于确定待检测图像不显示检测目标,输出用于提示待检测图像不显示检测目标的提示信息。即在确定待检测图像不显示检测目标时,可以不再利用目标检测模型对待检测图像进行处理,直接输出提示信息以提示待检测图像不显示检测目标。
继续参见图3,图3是根据本实施例的目标检测方法的应用场景的一个示意图300。在图3的应用场景中,用户的手机301上可以安装基于人脸检测模型302进行人脸检测的应用。该应用可以通过调用手机301的摄像功能获取待检测图像303。
之后,该应用可以先将待检测图像303输入至分类模型304,得到检测结果为待检测图像303显示有人脸。此时,可以将待检测图像303输入至人脸检测模型302,得到人脸检测结果(如图中标号305所示)。
若根据分类模型304得到的检测结果为待检测图像303不显示人脸。此时,可以向用户提示请对准人脸进行拍摄。此时,就可以避免不显示人脸的待检测图像再通过整个人脸检测模型302被处理的过程,可以有效地节省手机电量。
本公开的上述实施例提供的方法通过在利用目标检测模型对待处理图像进行处理之前,先分析待检测图像是否显示有检测目标,以及在确定待检测图像显示有检测目标时,再利用目标检测模型对待处理图像进行处理,从而可以避免目标检测模型对不显示检测目标的待检测图像的处理过程。
一般地,目标检测算法通常比较复杂,所涉及的计算量非常大。例如,通常需要对图像不断的卷积操作,然后针对大量预设的候选检测框分别计算,再从中选取出检测目标所对应的候选检测框等。而分析图像是否显示有检测目标可以视为图像二分类问题,一般仅需要简单的图像特征分析,即通常只需要一些图像卷积操作即可以实现。和目标检测模型处理图像的过程相比,省去了定位检测目标对应的位置的过程,因此,分析图像是否显示有检测目标的过程简单,对应的功耗很低。
基于此,通过先分析待检测图像是否显示有检测目标,以避免目标检测模型对不显示检测目标的待检测图像的处理,可以避免目标检测模型对不显示检测目标的待检测图像的处理所带来的不必要的功耗,实现终端设备的节能。
进一步参考图4,其示出了目标检测方法的又一个实施例的流程400。该目标检测方法的流程400,包括以下步骤:
步骤401,获取待检测图像。
步骤402,将待检测图像输入至预先训练的、用于分类的卷积神经网络,以确定待检测图像是否显示有检测目标。
上述步骤401和402的具体的执行过程可参考图2对应实施例中的步骤201和202的相关说明,在此不再赘述。
步骤403,响应于确定待检测图像显示有检测目标,利用目标检测模型的至少一个特征提取层提取待检测图像的特征图,利用目标检测模型的池化层对提取的特征图的尺寸进行调整,以得到预设尺寸的特征图,以及将得到的预设尺寸的特征图输入至全连接层,以得到检测结果信息。
在本步骤中,目标检测模型可以包括至少一个特征提取层、池化层和全连接层。其中,特征提取层可以用于提取输入的图像的特征。至少一个特征提取层中的各个特征提取层顺序连接,前一个特征提取层输出的特征图可以作为下一个特征提取层的输入。基于此,可以利用至少一个特征提取层提取待检测图像的特征图。
之后可以将提取的特征图输入至池化层,以对特征图的尺寸进行调整,得到预设尺寸的特征图。其中,预设尺寸可以根据应用需求由技术人员预先设置。之后可以将预设尺寸的特征图输入至全连接层,得到检测结果信息。其中,具体地池化方法可以根据不同的应用场景灵活选择。常用的池化方法包括均值池化、最大池化等等。
由于全连接层通常会处理固定尺寸的特征图,而待检测图像的大小可能是变化的,因此,针对不同尺寸的待检测图像,利用至少一个特征提取层提取出的特征图的尺寸也不同。因此,可以利用池化层来根据需求调整特征图的尺寸,使得输入至全连接层的特征图的尺寸相同。另外,由于池化操作可以减小特征图的尺寸,降低了全连接层需要处理的特征的维度,从而可以提升处理速度。
可选地,利用池化层得到的预设尺寸的特征图可以包括至少两个不同预设尺寸的特征图。即可以利用池化层对输入的特征图进行两种或两种以上的不同尺寸调整。此时,可以将得到的至少两个不同预设尺寸的特征图连接后输入至全连接层。
其中,至少两种不同的预设尺寸同样可以由技术人员根据需求预先进行设置。根据预先设置的不同的预设尺寸以及所处理的待检测图像的特征图的尺寸,动态地计算不同的预设尺寸分别对应的池化参数(如池化窗口的大小、步长等等)。进而可以根据所确定的池化参数,利用各种池化方法(如均值池化、最大池化等)得到不同的预设尺寸分别对应的特征图。
由于得到了至少两种不同尺寸的特征图,即可以得到不同尺度的特征信息,进而也就使得后续图像处理时是基于更多的特征信息进行的,有助于提升检测结果的准确性。
步骤404,响应于确定待检测图像不显示检测目标,输出用于提示待检测图像不显示检测目标的提示信息。
本步骤404的具体的执行过程可参考图2对应实施例中的步骤203的相关说明,在此不再赘述。
本实施例中的目标检测方法在利用目标检测模型对显示有检测目标的待检测图像进行处理时,利用池化层将特征提取层提取的待检测图像的特征图调整为预设尺寸的特征图,降低了全连接层需要处理的特征的维度,从而可以提升图像检测速度。
进一步参考图5,作为对上述各图所示方法的实现,本公开提供了目标检测装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例提供的目标检测装置500包括获取单元501、确定单元502和检测单元503。其中,获取单元501被配置成获取待检测图像;确定单元502被配置成对待检测图像进行分析以确定待检测图像是否显示有检测目标;检测单元503被配置成响应于确定待检测图像显示有检测目标,将待检测图像输入至预先训练的目标检测模型,得到检测结果信息,其中,检测结果信息用于指示检测目标显示在待检测图像中的位置。
在本实施例中,目标检测装置500中:获取单元501、确定单元502和检测单元503的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201、步骤202和步骤203的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,上述目标检测装置500还包括:输出单元(图中未示出)被配置成响应于确定待检测图像不显示检测目标,输出用于提示待检测图像不显示检测目标的提示信息。
在本实施例的一些可选的实现方式中,确定单元502进一步被配置成:将待检测图像输入至预先训练的、用于分类的卷积神经网络,以确定待检测图像是否显示有检测目标。
在本实施例的一些可选的实现方式中,目标检测模型的网络层包括至少一个特征提取层、池化层和全连接层;以及检测单元503进一步被配置成:利用至少一个特征提取层提取待检测图像的特征图;利用池化层对提取的特征图的尺寸进行调整,以得到预设尺寸的特征图;将得到的预设尺寸的特征图输入至全连接层,以得到检测结果信息。
在本实施例的一些可选的实现方式中,预设尺寸的特征图包括至少两个不同预设尺寸的特征图。
在本实施例的一些可选的实现方式中,检测目标包括人脸。
本公开的上述实施例提供的装置,通过获取单元获取待检测图像;确定单元对待检测图像进行分析以确定待检测图像是否显示有检测目标;检测单元响应于确定待检测图像显示有检测目标,将待检测图像输入至预先训练的目标检测模型,得到检测结果信息,其中,检测结果信息用于指示检测目标显示在待检测图像中的位置,从而避免目标检测模型对不显示检测目标的待检测图像的处理所带来的不必要的功耗。
下面参考图6,其示出了适于用来实现本公开的实施例的电子设备(例如图1中的终端设备)600的结构示意图。本公开的实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图6示出的终端设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图6中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开的实施例的方法中限定的上述功能。
需要说明的是,本公开的实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述终端中所包含的;也可以是单独存在,而未装配入该终端中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该终端执行时,使得该终端:获取待检测图像;对待检测图像进行分析以确定待检测图像是否显示有检测目标;响应于确定待检测图像显示有检测目标,将待检测图像输入至预先训练的目标检测模型,得到检测结果信息,其中,检测结果信息用于指示检测目标显示在待检测图像中的位置。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、确定单元和检测单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取待检测图像的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (14)
1.一种目标检测方法,包括:
获取待检测图像;
对所述待检测图像进行分析以确定所述待检测图像是否显示有检测目标;
响应于确定所述待检测图像显示有检测目标,将所述待检测图像输入至预先训练的目标检测模型,得到检测结果信息,其中,所述检测结果信息用于指示检测目标显示在所述待检测图像中的位置。
2.根据权利要求1所述的方法,其中,所述方法还包括:
响应于确定所述待检测图像不显示检测目标,输出用于提示所述待检测图像不显示检测目标的提示信息。
3.根据权利要求1所述的方法,其中,所述对所述待检测图像进行分析以确定所述待检测图像是否显示有检测目标,包括:
将所述待检测图像输入至预先训练的、用于分类的卷积神经网络,以确定所述待检测图像是否显示有检测目标。
4.根据权利要求1所述的方法,其中,所述目标检测模型的网络层包括至少一个特征提取层、池化层和全连接层;以及
所述将所述待检测图像输入至预先训练的目标检测模型,得到检测结果信息,包括:
利用所述至少一个特征提取层提取所述待检测图像的特征图;
利用所述池化层对提取的特征图的尺寸进行调整,以得到预设尺寸的特征图;
将得到的预设尺寸的特征图输入至所述全连接层,以得到检测结果信息。
5.根据权利要求4所述的方法,其中,所述预设尺寸的特征图包括至少两个不同预设尺寸的特征图。
6.根据权利要求1-5之一所述的方法,其中,检测目标包括人脸。
7.一种目标检测装置,包括:
获取单元,被配置成获取待检测图像;
确定单元,被配置成对所述待检测图像进行分析以确定所述待检测图像是否显示有检测目标;
检测单元,被配置成响应于确定所述待检测图像显示有检测目标,将所述待检测图像输入至预先训练的目标检测模型,得到检测结果信息,其中,所述检测结果信息用于指示检测目标显示在所述待检测图像中的位置。
8.根据权利要求7所述的装置,其中,所述装置还包括:
输出单元,被配置成响应于确定所述待检测图像不显示检测目标,输出用于提示所述待检测图像不显示检测目标的提示信息。
9.根据权利要求7所述的装置,其中,所述确定单元进一步被配置成:
将所述待检测图像输入至预先训练的、用于分类的卷积神经网络,以确定所述待检测图像是否显示有检测目标。
10.根据权利要求7所述的装置,其中,所述目标检测模型的网络层包括至少一个特征提取层、池化层和全连接层;以及
所述检测单元进一步被配置成:
利用所述至少一个特征提取层提取所述待检测图像的特征图;
利用所述池化层对提取的特征图的尺寸进行调整,以得到预设尺寸的特征图;
将得到的预设尺寸的特征图输入至所述全连接层,以得到检测结果信息。
11.根据权利要求10所述的装置,其中,所述预设尺寸的特征图包括至少两个不同预设尺寸的特征图。
12.根据权利要求7-11之一所述的装置,其中,检测目标包括人脸。
13.一种终端,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
14.一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910379637.9A CN110110666A (zh) | 2019-05-08 | 2019-05-08 | 目标检测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910379637.9A CN110110666A (zh) | 2019-05-08 | 2019-05-08 | 目标检测方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110110666A true CN110110666A (zh) | 2019-08-09 |
Family
ID=67488769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910379637.9A Pending CN110110666A (zh) | 2019-05-08 | 2019-05-08 | 目标检测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110110666A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110427915A (zh) * | 2019-08-14 | 2019-11-08 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN110941987A (zh) * | 2019-10-10 | 2020-03-31 | 北京百度网讯科技有限公司 | 目标对象识别方法、装置、电子设备及存储介质 |
CN111402297A (zh) * | 2020-03-25 | 2020-07-10 | 杭州博雅鸿图视频技术有限公司 | 目标追踪检测方法、系统、电子设备及存储介质 |
CN112036251A (zh) * | 2020-08-04 | 2020-12-04 | 汇纳科技股份有限公司 | 用于用户着装检测的实现方法、系统、介质及终端 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426850A (zh) * | 2015-11-23 | 2016-03-23 | 深圳市商汤科技有限公司 | 一种基于人脸识别的关联信息推送设备及方法 |
CN105678267A (zh) * | 2016-01-08 | 2016-06-15 | 浙江宇视科技有限公司 | 一种场景识别方法及装置 |
CN106067031A (zh) * | 2016-05-26 | 2016-11-02 | 北京新长征天高智机科技有限公司 | 基于人工纠错机制与深度学习网络协作机器视觉识别系统 |
CN107590482A (zh) * | 2017-09-29 | 2018-01-16 | 百度在线网络技术(北京)有限公司 | 信息生成方法和装置 |
CN107666573A (zh) * | 2017-10-13 | 2018-02-06 | 北京奇虎科技有限公司 | 摄像头场景下对象视频的录制方法及装置、计算设备 |
CN107729872A (zh) * | 2017-11-02 | 2018-02-23 | 北方工业大学 | 基于深度学习的人脸表情识别方法及装置 |
CN108171135A (zh) * | 2017-12-21 | 2018-06-15 | 深圳云天励飞技术有限公司 | 人脸检测方法、装置及计算机可读存储介质 |
CN108764310A (zh) * | 2018-05-17 | 2018-11-06 | 西安电子科技大学 | 基于多尺度多特征深度森林的sar目标识别方法 |
CN108921822A (zh) * | 2018-06-04 | 2018-11-30 | 中国科学技术大学 | 基于卷积神经网络的图像目标计数方法 |
CN108921830A (zh) * | 2018-06-21 | 2018-11-30 | 北京信息科技大学 | 一种基于图像检索的人数统计方法 |
CN109145928A (zh) * | 2017-06-16 | 2019-01-04 | 杭州海康威视数字技术股份有限公司 | 一种基于图像的车头朝向识别方法及装置 |
CN109410261A (zh) * | 2018-10-08 | 2019-03-01 | 浙江科技学院 | 基于金字塔池化模块的单目图像深度估计方法 |
CN109726739A (zh) * | 2018-12-04 | 2019-05-07 | 深圳大学 | 一种目标检测方法和系统 |
-
2019
- 2019-05-08 CN CN201910379637.9A patent/CN110110666A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426850A (zh) * | 2015-11-23 | 2016-03-23 | 深圳市商汤科技有限公司 | 一种基于人脸识别的关联信息推送设备及方法 |
CN105678267A (zh) * | 2016-01-08 | 2016-06-15 | 浙江宇视科技有限公司 | 一种场景识别方法及装置 |
CN106067031A (zh) * | 2016-05-26 | 2016-11-02 | 北京新长征天高智机科技有限公司 | 基于人工纠错机制与深度学习网络协作机器视觉识别系统 |
CN109145928A (zh) * | 2017-06-16 | 2019-01-04 | 杭州海康威视数字技术股份有限公司 | 一种基于图像的车头朝向识别方法及装置 |
CN107590482A (zh) * | 2017-09-29 | 2018-01-16 | 百度在线网络技术(北京)有限公司 | 信息生成方法和装置 |
CN107666573A (zh) * | 2017-10-13 | 2018-02-06 | 北京奇虎科技有限公司 | 摄像头场景下对象视频的录制方法及装置、计算设备 |
CN107729872A (zh) * | 2017-11-02 | 2018-02-23 | 北方工业大学 | 基于深度学习的人脸表情识别方法及装置 |
CN108171135A (zh) * | 2017-12-21 | 2018-06-15 | 深圳云天励飞技术有限公司 | 人脸检测方法、装置及计算机可读存储介质 |
CN108764310A (zh) * | 2018-05-17 | 2018-11-06 | 西安电子科技大学 | 基于多尺度多特征深度森林的sar目标识别方法 |
CN108921822A (zh) * | 2018-06-04 | 2018-11-30 | 中国科学技术大学 | 基于卷积神经网络的图像目标计数方法 |
CN108921830A (zh) * | 2018-06-21 | 2018-11-30 | 北京信息科技大学 | 一种基于图像检索的人数统计方法 |
CN109410261A (zh) * | 2018-10-08 | 2019-03-01 | 浙江科技学院 | 基于金字塔池化模块的单目图像深度估计方法 |
CN109726739A (zh) * | 2018-12-04 | 2019-05-07 | 深圳大学 | 一种目标检测方法和系统 |
Non-Patent Citations (1)
Title |
---|
孙伟 等: "《嵌入式图像处理系统工程案例精选 DaVinci系统设计与实现》", 30 April 2017 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110427915A (zh) * | 2019-08-14 | 2019-11-08 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN110941987A (zh) * | 2019-10-10 | 2020-03-31 | 北京百度网讯科技有限公司 | 目标对象识别方法、装置、电子设备及存储介质 |
CN110941987B (zh) * | 2019-10-10 | 2023-04-07 | 北京百度网讯科技有限公司 | 目标对象识别方法、装置、电子设备及存储介质 |
CN111402297A (zh) * | 2020-03-25 | 2020-07-10 | 杭州博雅鸿图视频技术有限公司 | 目标追踪检测方法、系统、电子设备及存储介质 |
CN112036251A (zh) * | 2020-08-04 | 2020-12-04 | 汇纳科技股份有限公司 | 用于用户着装检测的实现方法、系统、介质及终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109214343B (zh) | 用于生成人脸关键点检测模型的方法和装置 | |
CN108898086B (zh) | 视频图像处理方法及装置、计算机可读介质和电子设备 | |
CN108898186B (zh) | 用于提取图像的方法和装置 | |
CN109902659B (zh) | 用于处理人体图像的方法和装置 | |
US20190188530A1 (en) | Method and apparatus for processing image | |
CN107578017A (zh) | 用于生成图像的方法和装置 | |
CN111369427B (zh) | 图像处理方法、装置、可读介质和电子设备 | |
CN108197618B (zh) | 用于生成人脸检测模型的方法和装置 | |
CN110110666A (zh) | 目标检测方法和装置 | |
CN109993150B (zh) | 用于识别年龄的方法和装置 | |
CN107491771A (zh) | 人脸检测方法和装置 | |
CN108986169A (zh) | 用于处理图像的方法和装置 | |
CN109308490A (zh) | 用于生成信息的方法和装置 | |
CN109829432A (zh) | 用于生成信息的方法和装置 | |
CN108133197B (zh) | 用于生成信息的方法和装置 | |
CN111783626B (zh) | 图像识别方法、装置、电子设备及存储介质 | |
CN109034069A (zh) | 用于生成信息的方法和装置 | |
CN110059623B (zh) | 用于生成信息的方法和装置 | |
CN109472264A (zh) | 用于生成物体检测模型的方法和装置 | |
CN110059624B (zh) | 用于检测活体的方法和装置 | |
CN108062544A (zh) | 用于人脸活体检测的方法和装置 | |
CN108876858A (zh) | 用于处理图像的方法和装置 | |
CN108171211A (zh) | 活体检测方法和装置 | |
CN109977839A (zh) | 信息处理方法和装置 | |
CN109241934A (zh) | 用于生成信息的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190809 |