CN109948616A - 图像检测方法、装置、电子设备及计算机可读存储介质 - Google Patents
图像检测方法、装置、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN109948616A CN109948616A CN201910233086.5A CN201910233086A CN109948616A CN 109948616 A CN109948616 A CN 109948616A CN 201910233086 A CN201910233086 A CN 201910233086A CN 109948616 A CN109948616 A CN 109948616A
- Authority
- CN
- China
- Prior art keywords
- detection result
- detected
- couple candidate
- candidate detection
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
Abstract
本申请提供了一种图像检测方法、装置、电子设备及计算机可读存储介质。该方法包括:对待检测图像进行目标检测处理,得到待检测图像中针对目标对象的至少一个候选检测结果;对待检测图像进行语义分割处理,得到待检测图像中各个像素的语义信息;根据各个候选检测结果及待检测图像中各个像素的语义信息,对各个候选检测结果进行过滤处理,得到最终检测结果。本申请利用待检测图像中像素的语义信息来辅助对待检测图像的目标检测,能够有效提升目标检测的精度。
Description
技术领域
本申请涉及图像处理技术领域,具体而言,本申请涉及一种图像检测方法、装置、电子设备及计算机可读存储介质。
背景技术
随着人们依赖图像获取信息、表达信息和传递信息的场景越来越多,以及更高品质的图像采集设备的广泛应用,图像处理技术成为一项热门的研究课题。其中,对目标对象的检测与识别是图像处理的关键技术之一,也逐渐受到更多重视,例如在航空航天、生物医学、公安军事以及交通管理等领域,目标检测技术都体现了充分的应用价值。
简单来说,目标检测是一种在图像中检测出指定类型的目标对象的技术,例如人脸检测,目的就是在图像中检测出所有的人脸。检测的过程一般是通过计算机经过一系列的算法处理后,得到目标对象的识别结果及其位置。
对于人类来说,通过对图片中不同颜色模块的感知定位并分类出其中目标对象并不困难。但是对于计算机来说,由于图像容易受到背景及环境的影响,例如光照变化、局部遮挡、目标尺度变化等,使得目标检测不可能尽善尽美,也会出现识别错误等问题,例如把一些并非人脸的对象检测为人脸。
发明内容
为克服上述技术问题或者至少部分地解决上述技术问题,特提出以下技术方案:
第一方面,本申请提供了一种图像检测方法,该方法包括:
对待检测图像进行目标检测处理,得到所述待检测图像中针对目标对象的至少一个候选检测结果;
对所述待检测图像进行语义分割处理,得到所述待检测图像中各个像素的语义信息;
根据各个候选检测结果及所述待检测图像中各个像素的语义信息,对各个候选检测结果进行过滤处理,得到最终检测结果。
在一种可选的实现方式中,所述根据各个候选检测结果及所述待检测图像中各个像素的语义信息,对各个候选检测结果进行过滤处理,包括:
确定各个候选检测结果中的每个候选检测结果分别对应所述待检测图像的目标区域;
基于所述待检测图像中各个像素的语义信息,确定每个候选检测结果对应的目标区域中各个像素的语义信息;
根据每个候选检测结果对应的目标区域中各个像素的语义信息,对每个候选检测结果进行过滤处理。
在一种可选的实现方式中,所述对所述待检测图像进行语义分割处理,得到所述待检测图像中各个像素的语义信息,包括:
通过预训练的语义分割网络,对所述待检测图像进行语义分割处理,得到所述待检测图像中各个像素的语义信息。
在一种可选的实现方式中,所述根据每个候选检测结果对应的目标区域中各个像素的语义信息,对每个候选检测结果进行过滤处理,包括:
根据每个候选检测结果对应的目标区域中各个像素的语义信息包含的具体对象类型,确定每个候选检测结果对应的目标区域中各种具体对象类型的像素的数量;
根据每个候选检测结果对应的目标区域中至少一种具体对象类型的像素的数量,确定所述至少一种具体对象类型的像素分别所占的比例;
当任一候选检测结果的所述至少一种具体对象类型的像素的比例符合预设过滤规则时,对所述任一候选检测结果进行过滤处理。
在一种可选的实现方式中,所述确定各个候选检测结果中的每个候选检测结果分别对应所述待检测图像的目标区域,包括:
确定每个候选检测结果的尺寸信息;
将每个候选检测结果的尺寸信息按照预定倍数进行缩放;
根据每个候选检测结果缩放后的尺寸信息,在所述待检测图像中确定每个候选检测结果对应的目标区域。
在一种可选的实现方式中,所述对待检测图像进行目标检测处理,得到所述待检测图像中针对目标对象的至少一个候选检测结果,包括:
通过预训练的针对所述目标对象的检测网络,对待检测图像进行目标检测处理,得到所述待检测图像中针对目标对象的至少一个候选检测结果。
第二方面,本申请提供了一种图像检测装置,该装置包括:
检测模块,用于对待检测图像进行目标检测处理,得到所述待检测图像中针对目标对象的至少一个候选检测结果;
语义分割模块,用于对所述待检测图像进行语义分割处理,得到所述待检测图像中各个像素的语义信息;
过滤模块,用于根据各个候选检测结果及所述待检测图像中各个像素的语义信息,对各个候选检测结果进行过滤处理,得到最终检测结果。
在一种可选的实现方式中,所述过滤模块在用于根据各个候选检测结果及所述待检测图像中各个像素的语义信息,对各个候选检测结果进行过滤处理时,具体用于:
确定各个候选检测结果中的每个候选检测结果分别对应所述待检测图像的目标区域;
基于所述待检测图像中各个像素的语义信息,确定每个候选检测结果对应的目标区域中各个像素的语义信息;
根据每个候选检测结果对应的目标区域中各个像素的语义信息,对每个候选检测结果进行过滤处理。
在一种可选的实现方式中,所述语义分割模块在用于对所述待检测图像进行语义分割处理,得到所述待检测图像中各个像素的语义信息时,具体用于:
通过预训练的语义分割网络,对所述待检测图像进行语义分割处理,得到所述待检测图像中各个像素的语义信息。
在一种可选的实现方式中,所述过滤模块在用于根据每个候选检测结果对应的目标区域中各个像素的语义信息,对每个候选检测结果进行过滤处理时,具体用于:
根据每个候选检测结果对应的目标区域中各个像素的语义信息包含的具体对象类型,确定每个候选检测结果对应的目标区域中各种具体对象类型的像素的数量;
根据每个候选检测结果对应的目标区域中至少一种具体对象类型的像素的数量,确定所述至少一种具体对象类型的像素分别所占的比例;
当任一候选检测结果的所述至少一种具体对象类型的像素的比例符合预设过滤规则时,对所述任一候选检测结果进行过滤处理。
在一种可选的实现方式中,所述过滤模块在用于确定各个候选检测结果中的每个候选检测结果分别对应所述待检测图像的目标区域时,具体用于:
确定每个候选检测结果的尺寸信息;
将每个候选检测结果的尺寸信息按照预定倍数进行缩放;
根据每个候选检测结果缩放后的尺寸信息,在所述待检测图像中确定每个候选检测结果对应的目标区域。
在一种可选的实现方式中,所述检测模块在用于对待检测图像进行目标检测处理,得到所述待检测图像中针对目标对象的至少一个候选检测结果时,具体用于:
通过预训练的针对所述目标对象的检测网络,对待检测图像进行目标检测处理,得到所述待检测图像中针对目标对象的至少一个候选检测结果。
第三方面,本申请提供了一种电子设备,该电子设备包括:
处理器和存储器,存储器存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如本申请的第一方面所示的方法。
第四方面,本申请提供了一种计算机可读存储介质,计算机存储介质用于存储计算机指令、程序、代码集或指令集,当其在计算机上运行时,使得计算机执行如本申请的第一方面所示的方法。
本申请提供的图像检测方法、装置、电子设备及计算机可读存储介质,采用对待检测图像进行目标检测处理,得到待检测图像中针对目标对象的至少一个候选检测结果;对待检测图像进行语义分割处理,得到待检测图像中各个像素的语义信息;根据各个候选检测结果及待检测图像中各个像素的语义信息,对各个候选检测结果进行过滤处理,得到最终检测结果,即本申请利用待检测图像中像素的语义信息来辅助对待检测图像的目标检测,能够有效提升目标检测的精度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图做简单的介绍。
图1为本申请实施例提供的一种图像检测方法的流程示意图;
图2为本申请实施例提供的目标检测方法的示意图;
图3为本申请实施例提供的一种图像检测装置的结构示意图;
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请实施例提供了一种图像检测方法,如图1所示,该方法包括:
步骤S101:对待检测图像进行目标检测处理,得到待检测图像中针对目标对象的至少一个候选检测结果;
步骤S102:对待检测图像进行语义分割处理,得到待检测图像中各个像素的语义信息;
步骤S103:根据各个候选检测结果及待检测图像中各个像素的语义信息,对各个候选检测结果进行过滤处理,得到最终检测结果。
具体而言,在步骤S101之前,需要获取待检测图像,其中待检测图像可以是实时拍摄的,也可以读取本地存储的,还可以是从网络或其他设备接收的。实际应用中,若获取的是视频流,则视频流中的每一帧图像都可看作待检测图像,均分别执行步骤S101~步骤S103,已完成对视频流的处理。
进一步地,步骤S101中,对待检测图像进行目标检测处理,一种可能的实现方式中,如图2所示,可通过检测网络对待检测图像进行目标检测处理。可选地,检测网络可以为神经网络或其他机器学习算法模型,若采用神经网络作为检测网络,可使用卷积神经网络或其他类型的神经网络,本申请实施例对此不做限定。
本申请实施例中,不限定目标检测处理的目标对象,例如可以是人脸检测,也可以是其他对象检测。可以理解的是,对于不同的目标对象,可采用不同的检测网络进行目标检测处理,具体地,可以在检测网络的训练阶段针对目标对象进行训练,得到所需的针对目标对象的检测网络。即本步骤中,通过预训练的针对目标对象的检测网络,对待检测图像进行目标检测处理,得到待检测图像中针对目标对象的至少一个候选检测结果。
另外,本申请实施例中,也不限定目标检测处理的目标对象的种类,例如可以是单类目标检测,也可以是多类目标检测。对于多类目标检测,具体可以通过直接训练多类目标检测的检测模型来实现,也可以通过多个单类目标检测的检测模型的联合处理来实现,本领域技术人员可以根据实际情况选择合适的处理方式。
随后,便可得到待检测图像中针对目标对象的至少一个候选检测结果,即目标检测处理过程会将待检测图像中检测到的每一个目标对象均作为对应的一个候选检测结果输出,作为示例地,人脸检测过程会输出待检测图像中检测出的所有人脸。实际应用中,每个候选检测结果可以以检测框信息的形式输出,其中,每个检测框信息对应的检测框能够包含相应的目标对象。一种可能实现的示例中,目标检测处理过程可以将至少一个候选检测结果输出为一个目标列表,以便于后续候选检测结果的筛选。
进一步地,步骤S102中,对待检测图像进行语义分割处理,一种可能的实现方式中,如图2所示,通过预训练的语义分割网络,对待检测图像进行语义分割处理。同理地,语义分割网络可以为神经网络或其他机器学习算法模型,若采用神经网络作为检测网络,可使用卷积神经网络或其他类型的神经网络,本申请实施例对此不做限定。
随后,便可得到待检测图像中各个像素的语义信息,即语义分割处理过程会输出待检测图像的每个像素的分类。作为示例地,一个场景下的语义分割处理过程可能会把待检测图像的每个像素区分为天空、地面、树木、人体、车辆、建筑或者其他物体等,其他场景下,还可以为其他分类情况。需要说明的是,通过语义分割处理过程分类的对象可能包含“人、汽车”等一般概念上的物体,也可能包含“天空、土地、道路”等非典型物体,为便于描述,下文中均以对象类型来描述可分割的各种类型的区域。
即每个像素的语义信息可以表达为具体对象类型,例如,步骤S102直接输出某个像素的具体对象类型为天空。
可以理解的是,具体的分类效果(包括语义信息的分类类型和分类数量等)可通过对语义分割网络的训练来实现,本领域技术人员可以根据实际情况选择相应训练后的语义分割网络来进行处理。
一种可行的实现方式中,在对待处理图片通过步骤S101和步骤S102分别进行目标检测处理和语义分割处理之前,可以对待处理图片进行预处理,例如数据去噪,数据规范化等,以提升目标检测处理和语义分割处理的准确性和可靠性。
本申请实施例中,步骤S101和步骤S102可以先后执行,例如先执行步骤S101,再执行步骤S102;或者先执行步骤S102,再执行步骤S101;又或者,步骤S101和步骤S102也可以同时执行,本领域技术人员可以根据实际情况进行设置,在此不做限定。
进一步地,在步骤S103中,根据各个候选检测结果及待检测图像中各个像素的语义信息,对各个候选检测结果进行过滤处理,即根据语义分割的结果,可以把常理上不可能出现的候选检测结果排除。
举例说明,如果某个区域的像素的语义信息,该区域被分类为天空,那么该区域里出现汽车底部的可能性非常低。
具体而言,如图2所示,本申请实施例可以结合待检测图像的语义分割结果,通过预定的过滤算法对各个候选检测结果进行过滤处理,排除掉违反常理的候选检测结果,有效降低图像目标检测的错误率,得到改善后的最终检测结果。
可见,本申请实施例提供的图像检测方法,利用待检测图像中像素的语义信息来辅助对待检测图像的目标检测,能够有效提升目标检测的精度。
本申请实施例为步骤S103的执行提供了一种可行的过滤算法,具体地,针对每个候选检测结果的筛查,包括以下步骤:
步骤S1031:确定各个候选检测结果中的每个候选检测结果分别对应待检测图像的目标区域;
步骤S1032:基于待检测图像中各个像素的语义信息,确定每个候选检测结果对应的目标区域中各个像素的语义信息;
步骤S1033:根据每个候选检测结果对应的目标区域中各个像素的语义信息,对每个候选检测结果进行过滤处理。
由上文可知,每一个候选检测结果均会对应待检测图像中检测到的目标对象,步骤S1031中,确定每个候选检测结果分别对应待检测图像的目标区域,即确定每个候选检测结果对应的目标对象在待检测图像中的区域(为便于描述,下文中将该区域称为检测区域)。本申请实施例中,目标区域可以直接为该检测区域,也可以是对检测区域进行适当的调整后包含的区域。
具体而言,对检测区域进行适当调整的方式,即确定每个候选检测结果分别对应所述待检测图像的目标区域,包括:
步骤SA:确定每个候选检测结果的尺寸信息;
步骤SB:将每个候选检测结果的尺寸信息按照预定倍数进行缩放;
步骤SC:根据每个候选检测结果缩放后的尺寸信息,在待检测图像中确定每个候选检测结果对应的目标区域。
本申请实施例的步骤SA中,确定每个候选检测结果的尺寸信息,即确定每个候选检测结果的检测区域的尺寸信息,例如以检测结果为检测框信息为例,尺寸信息可以为检测框的高和宽{h,w}。或者,尺寸信息也可以为像素尺寸等其他类型的信息。
实际应用中,步骤SA还可以包括确定每个候选检测结果的位置信息。
例如以检测结果为检测框信息为例,位置信息可以为检测框的左上角在待处理图像中的坐标信息{x,y}。或者,位置信息也可以为边距信息等其他类型的信息。
本申请实施例的步骤SB中,可以将每个候选检测结果的尺寸信息按照预定倍数进行缩放。
作为示例地,一个可能的使用场景中,目标检测是人脸检测,对于每一个人脸框(例如尺寸信息为{h,w}),可以去统计人脸框和它下方8倍高度范围内的目标区域(即尺寸信息为{8h,w}),即该目标区域可以表示一个人像的区域。
其他使用场景中,也可以采用其他方式来缩放尺寸信息,本领域技术人员可以根据实际情况来进行设置,即设置进行缩放的预定倍数,以在步骤SC中,根据每个候选检测结果缩放后的尺寸信息,在待检测图像中确定每个候选检测结果对应的目标区域。或者,还可以根据每个候选检测结果缩放后的尺寸信息以及确定出的位置信息,在待检测图像中确定每个候选检测结果对应的目标区域。
本申请实施例中,在通过步骤S1031确定出目标区域后,步骤S1032中,基于待检测图像中各个像素的语义信息,确定每个候选检测结果对应的目标区域中各个像素的语义信息。
由于步骤S102中已确定出待检测图像中各个像素的语义信息,根据目标区域对应于待检测图像的尺寸信息、位置信息等信息,即可直接匹配出目标区域中各个像素的语义信息。
本申请实施例的步骤S1033中,可以根据每个候选检测结果对应的目标区域中各个像素的语义信息,对每个候选检测结果进行过滤处理,若每个候选检测结果对应的目标区域中各个像素的语义信息判断出任一候选检测结果不符合常理,则将其从各个候选检测结果中删除,否则,保留该候选检测结果。
可以理解,针对每一个候选检测结果,均可以通过上述过程来判断是否保留,并将判断出的保留的全部候选检测结果作为最终检测结果。
本申请实施例中,步骤S1033具体可通过以下过程来实现:根据每个候选检测结果对应的目标区域中各个像素的语义信息包含的具体对象类型,确定每个候选检测结果对应的目标区域中各种具体对象类型的像素的数量;根据每个候选检测结果对应的目标区域中至少一种具体对象类型的像素的数量,确定至少一种具体对象类型的像素分别所占的比例;当任一候选检测结果的至少一种具体对象类型的像素的比例符合预设过滤规则时,对任一候选检测结果进行过滤处理。
作为示例地,语义分割处理区分出的像素的具体对象类型包括天空、地面、人、建筑、车辆、其他等6类。该方案中,针对每个候选检测结果,需要确定对应的目标区域中这6类中的一类和多类像素分别对应的数量,再结合6类像素数量的总和(即目标区域中像素的总数量),即可确定出目标区域分别属于其中一类和多类的概率。例如目标区域天空类型的像素的数量为N,而目标区域中像素的总数量为S,则该目标区域中天空类型的像素所占的比例P=N/S。其他类型的像素所占的比例计算方式类似,在此不再赘述。
该方案中,任一候选检测结果的至少一种具体对象类型的像素的比例符合预设过滤规则时,例如结合上述人脸检测场景,某候选检测结果的目标区域内的“地面”分类少于10%,和/或“天空”分类大于30%,则可以认为目标人脸出现在了不符合常理的区域,应该过滤掉。可以理解,该场景和过滤规则仅为举例,本领域技术人员可以根据实际应用场景对过滤规则进行设置,以实现对各个候选检测结果进行过滤处理,本申请实施例在此不作限定。
本申请实施例提供的图像检测方法,利用待检测图像中像素的语义信息来辅助对待检测图像的目标检测,能够有效提升目标检测的精度。
本申请实施例还提供了一种图像检测装置,如图3所示,该一种图像检测装置30可以包括:检测模块301、语义分割模块302、过滤模块303,其中,
检测模块301用于对待检测图像进行目标检测处理,得到待检测图像中针对目标对象的至少一个候选检测结果;
语义分割模块302用于对待检测图像进行语义分割处理,得到待检测图像中各个像素的语义信息;
过滤模块303用于根据各个候选检测结果及待检测图像中各个像素的语义信息,对各个候选检测结果进行过滤处理,得到最终检测结果。
在一种可选的实现方式中,过滤模块303在用于根据各个候选检测结果及待检测图像中各个像素的语义信息,对各个候选检测结果进行过滤处理时,具体用于:
确定各个候选检测结果中的每个候选检测结果分别对应待检测图像的目标区域;
基于待检测图像中各个像素的语义信息,确定每个候选检测结果对应的目标区域中各个像素的语义信息;
根据每个候选检测结果对应的目标区域中各个像素的语义信息,对每个候选检测结果进行过滤处理。
在一种可选的实现方式中,语义分割模块302在用于对待检测图像进行语义分割处理,得到待检测图像中各个像素的语义信息时,具体用于:
通过预训练的语义分割网络,对待检测图像进行语义分割处理,得到待检测图像中各个像素的语义信息。
在一种可选的实现方式中,过滤模块303在用于根据每个候选检测结果对应的目标区域中各个像素的语义信息,对每个候选检测结果进行过滤处理时,具体用于:
根据每个候选检测结果对应的目标区域中各个像素的语义信息包含的具体对象类型,确定每个候选检测结果对应的目标区域中各种具体对象类型的像素的数量;
根据每个候选检测结果对应的目标区域中至少一种具体对象类型的像素的数量,确定至少一种具体对象类型的像素分别所占的比例;
当任一候选检测结果的至少一种具体对象类型的像素的比例符合预设过滤规则时,对任一候选检测结果进行过滤处理。
在一种可选的实现方式中,过滤模块303在用于确定各个候选检测结果中的每个候选检测结果分别对应待检测图像的目标区域时,具体用于:
确定每个候选检测结果的尺寸信息;
将每个候选检测结果的尺寸信息按照预定倍数进行缩放;
根据每个候选检测结果缩放后的尺寸信息,在待检测图像中确定每个候选检测结果对应的目标区域。
在一种可选的实现方式中,检测模块301在用于对待检测图像进行目标检测处理,得到待检测图像中针对目标对象的至少一个候选检测结果时,具体用于:
通过预训练的针对目标对象的检测网络,对待检测图像进行目标检测处理,得到待检测图像中针对目标对象的至少一个候选检测结果。
本申请实施例提供的图像检测装置,利用待检测图像中像素的语义信息来辅助对待检测图像的目标检测,能够有效提升目标检测的精度。
所属领域的技术人员可以清楚地了解到,本申请实施例提供的图像检测装置,其实现原理及产生的技术效果和前述方法实施例相同,为描述的方便和简洁,装置实施例部分未提及之处,可参考前述方法实施例中相应内容,在此不再赘述。
本申请实施例还提供了一种电子设备(计算设备),如图4所示,图4所示的电子设40包括:处理器401和存储器402,存储器402存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、至少一段程序、代码集或指令集由处理器401加载并执行以实现前述任一方法实施例中相应内容。
可选地,电子设备40还可以包括收发器403。处理器401和收发器403相连,如通过总线404相连。需要说明的是,实际应用中收发器403不限于一个,该电子设备40的结构并不构成对本申请实施例的限定。
其中,处理器401可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器401也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线404可包括一通路,在上述组件之间传送信息。总线404可以是PCI总线或EISA总线等。总线404可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器402可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
本申请实施例还提供了一种计算机可读存储介质,该计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种图像检测方法,其特征在于,包括:
对待检测图像进行目标检测处理,得到所述待检测图像中针对目标对象的至少一个候选检测结果;
对所述待检测图像进行语义分割处理,得到所述待检测图像中各个像素的语义信息;
根据各个候选检测结果及所述待检测图像中各个像素的语义信息,对各个候选检测结果进行过滤处理,得到最终检测结果。
2.根据权利要求1所述的图像检测方法,其特征在于,所述根据各个候选检测结果及所述待检测图像中各个像素的语义信息,对各个候选检测结果进行过滤处理,包括:
确定各个候选检测结果中的每个候选检测结果分别对应所述待检测图像的目标区域;
基于所述待检测图像中各个像素的语义信息,确定每个候选检测结果对应的目标区域中各个像素的语义信息;
根据每个候选检测结果对应的目标区域中各个像素的语义信息,对每个候选检测结果进行过滤处理。
3.根据权利要求1所述的图像检测方法,其特征在于,所述对所述待检测图像进行语义分割处理,得到所述待检测图像中各个像素的语义信息,包括:
通过预训练的语义分割网络,对所述待检测图像进行语义分割处理,得到所述待检测图像中各个像素的语义信息。
4.根据权利要求2所述的图像检测方法,其特征在于,所述根据每个候选检测结果对应的目标区域中各个像素的语义信息,对每个候选检测结果进行过滤处理,包括:
根据每个候选检测结果对应的目标区域中各个像素的语义信息包含的具体对象类型,确定每个候选检测结果对应的目标区域中各种具体对象类型的像素的数量;
根据每个候选检测结果对应的目标区域中至少一种具体对象类型的像素的数量,确定所述至少一种具体对象类型的像素分别所占的比例;
当任一候选检测结果的所述至少一种具体对象类型的像素的比例符合预设过滤规则时,对所述任一候选检测结果进行过滤处理。
5.根据权利要求2所述的图像检测方法,其特征在于,所述确定各个候选检测结果中的每个候选检测结果分别对应所述待检测图像的目标区域,包括:
确定每个候选检测结果的尺寸信息;
将每个候选检测结果的尺寸信息按照预定倍数进行缩放;
根据每个候选检测结果缩放后的尺寸信息,在所述待检测图像中确定每个候选检测结果对应的目标区域。
6.根据权利要求1-5任一项所述的图像检测方法,其特征在于,所述对待检测图像进行目标检测处理,得到所述待检测图像中针对目标对象的至少一个候选检测结果,包括:
通过预训练的针对所述目标对象的检测网络,对待检测图像进行目标检测处理,得到所述待检测图像中针对目标对象的至少一个候选检测结果。
7.一种图像检测装置,其特征在于,包括:
检测模块,用于对待检测图像进行目标检测处理,得到所述待检测图像中针对目标对象的至少一个候选检测结果;
语义分割模块,用于对所述待检测图像进行语义分割处理,得到所述待检测图像中各个像素的语义信息;
过滤模块,用于根据各个候选检测结果及所述待检测图像中各个像素的语义信息,对各个候选检测结果进行过滤处理,得到最终检测结果。
8.根据权利要求7所述的图像检测装置,其特征在于,所述过滤模块在用于根据各个候选检测结果及所述待检测图像中各个像素的语义信息,对各个候选检测结果进行过滤处理时,具体用于:
确定各个候选检测结果中的每个候选检测结果分别对应所述待检测图像的目标区域;
基于所述待检测图像中各个像素的语义信息,确定每个候选检测结果对应的目标区域中各个像素的语义信息;
根据每个候选检测结果对应的目标区域中各个像素的语义信息,对每个候选检测结果进行过滤处理。
9.一种电子设备,其特征在于,包括:
处理器和存储器,所述存储器存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1-6任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机存储介质用于存储计算机指令、程序、代码集或指令集,当其在计算机上运行时,使得计算机执行如权利要求1-6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910233086.5A CN109948616B (zh) | 2019-03-26 | 2019-03-26 | 图像检测方法、装置、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910233086.5A CN109948616B (zh) | 2019-03-26 | 2019-03-26 | 图像检测方法、装置、电子设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109948616A true CN109948616A (zh) | 2019-06-28 |
CN109948616B CN109948616B (zh) | 2021-05-25 |
Family
ID=67010757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910233086.5A Active CN109948616B (zh) | 2019-03-26 | 2019-03-26 | 图像检测方法、装置、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109948616B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110781899A (zh) * | 2019-10-23 | 2020-02-11 | 维沃移动通信有限公司 | 图像处理方法及电子设备 |
CN111444921A (zh) * | 2020-03-25 | 2020-07-24 | 浙江华睿科技有限公司 | 划痕缺陷检测方法、装置、计算设备和存储介质 |
CN111507958A (zh) * | 2020-04-15 | 2020-08-07 | 全球能源互联网研究院有限公司 | 目标检测方法、检测模型的训练方法及电子设备 |
CN111539961A (zh) * | 2019-12-13 | 2020-08-14 | 山东浪潮人工智能研究院有限公司 | 一种目标分割方法、装置以及设备 |
CN111539962A (zh) * | 2020-01-10 | 2020-08-14 | 济南浪潮高新科技投资发展有限公司 | 一种目标图像分类方法、装置以及介质 |
CN112639881A (zh) * | 2020-01-21 | 2021-04-09 | 深圳市大疆创新科技有限公司 | 距离测量方法、可移动平台、设备和存储介质 |
CN113096077A (zh) * | 2021-03-25 | 2021-07-09 | 深圳力维智联技术有限公司 | 异常比例检测方法、装置、设备及计算机可读存储介质 |
CN113836445A (zh) * | 2021-09-16 | 2021-12-24 | 北京百度网讯科技有限公司 | 语义化方法、装置、电子设备及可读存储介质 |
CN114445819A (zh) * | 2020-10-19 | 2022-05-06 | 武汉斗鱼网络科技有限公司 | 一种字符过滤处理方法、系统、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107301400A (zh) * | 2017-06-23 | 2017-10-27 | 深圳市唯特视科技有限公司 | 一种语义导向的半监督视频对象分割方法 |
CN107886117A (zh) * | 2017-10-30 | 2018-04-06 | 国家新闻出版广电总局广播科学研究院 | 基于多特征提取和多任务融合的目标检测算法 |
CN108229575A (zh) * | 2018-01-19 | 2018-06-29 | 百度在线网络技术(北京)有限公司 | 用于检测目标的方法和装置 |
CN109063559A (zh) * | 2018-06-28 | 2018-12-21 | 东南大学 | 一种基于改良区域回归的行人检测方法 |
CN109409371A (zh) * | 2017-08-18 | 2019-03-01 | 三星电子株式会社 | 用于图像的语义分割的系统和方法 |
-
2019
- 2019-03-26 CN CN201910233086.5A patent/CN109948616B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107301400A (zh) * | 2017-06-23 | 2017-10-27 | 深圳市唯特视科技有限公司 | 一种语义导向的半监督视频对象分割方法 |
CN109409371A (zh) * | 2017-08-18 | 2019-03-01 | 三星电子株式会社 | 用于图像的语义分割的系统和方法 |
CN107886117A (zh) * | 2017-10-30 | 2018-04-06 | 国家新闻出版广电总局广播科学研究院 | 基于多特征提取和多任务融合的目标检测算法 |
CN108229575A (zh) * | 2018-01-19 | 2018-06-29 | 百度在线网络技术(北京)有限公司 | 用于检测目标的方法和装置 |
CN109063559A (zh) * | 2018-06-28 | 2018-12-21 | 东南大学 | 一种基于改良区域回归的行人检测方法 |
Non-Patent Citations (2)
Title |
---|
刘丹 等: "结合语义信息的行人检测方法", 《电子测量与仪器学报》 * |
黄莉芝: "基于深度卷积神经网络的目标检测算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110781899A (zh) * | 2019-10-23 | 2020-02-11 | 维沃移动通信有限公司 | 图像处理方法及电子设备 |
CN110781899B (zh) * | 2019-10-23 | 2022-11-25 | 维沃移动通信有限公司 | 图像处理方法及电子设备 |
CN111539961A (zh) * | 2019-12-13 | 2020-08-14 | 山东浪潮人工智能研究院有限公司 | 一种目标分割方法、装置以及设备 |
CN111539962A (zh) * | 2020-01-10 | 2020-08-14 | 济南浪潮高新科技投资发展有限公司 | 一种目标图像分类方法、装置以及介质 |
CN112639881A (zh) * | 2020-01-21 | 2021-04-09 | 深圳市大疆创新科技有限公司 | 距离测量方法、可移动平台、设备和存储介质 |
CN111444921A (zh) * | 2020-03-25 | 2020-07-24 | 浙江华睿科技有限公司 | 划痕缺陷检测方法、装置、计算设备和存储介质 |
CN111507958A (zh) * | 2020-04-15 | 2020-08-07 | 全球能源互联网研究院有限公司 | 目标检测方法、检测模型的训练方法及电子设备 |
CN111507958B (zh) * | 2020-04-15 | 2023-05-26 | 全球能源互联网研究院有限公司 | 目标检测方法、检测模型的训练方法及电子设备 |
CN114445819A (zh) * | 2020-10-19 | 2022-05-06 | 武汉斗鱼网络科技有限公司 | 一种字符过滤处理方法、系统、电子设备及存储介质 |
CN113096077A (zh) * | 2021-03-25 | 2021-07-09 | 深圳力维智联技术有限公司 | 异常比例检测方法、装置、设备及计算机可读存储介质 |
CN113096077B (zh) * | 2021-03-25 | 2024-05-03 | 深圳力维智联技术有限公司 | 异常比例检测方法、装置、设备及计算机可读存储介质 |
CN113836445A (zh) * | 2021-09-16 | 2021-12-24 | 北京百度网讯科技有限公司 | 语义化方法、装置、电子设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109948616B (zh) | 2021-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109948616A (zh) | 图像检测方法、装置、电子设备及计算机可读存储介质 | |
CN104166841B (zh) | 一种视频监控网络中指定行人或车辆的快速检测识别方法 | |
CN109284733B (zh) | 一种基于yolo和多任务卷积神经网络的导购消极行为监控方法 | |
CN105574550A (zh) | 一种车辆识别方法及装置 | |
CN107358242B (zh) | 目标区域颜色识别方法、装置及监控终端 | |
CN104063712B (zh) | 一种车辆信息提取方法和系统 | |
CN105488453B (zh) | 一种基于图像处理的驾驶员未系安全带检测识别方法 | |
CN104268528B (zh) | 一种人群聚集区域检测方法和装置 | |
CN105654066A (zh) | 一种车辆识别方法及装置 | |
WO2019127273A1 (zh) | 一种多人脸检测方法、装置、服务器、系统及存储介质 | |
CN110349136A (zh) | 一种基于深度学习的篡改图像检测方法 | |
CN106250838A (zh) | 车辆识别方法及系统 | |
CN106372666B (zh) | 一种目标识别方法及装置 | |
CN112215255B (zh) | 一种目标检测模型的训练方法、目标检测方法及终端设备 | |
CN109558823A (zh) | 一种以图搜图的车辆识别方法及系统 | |
CN106022285A (zh) | 一种基于卷积神经网络的车款识别方法及装置 | |
CN109871780B (zh) | 一种人脸质量判决方法、系统及人脸识别方法、系统 | |
CN104517104A (zh) | 一种基于监控场景下的人脸识别方法及系统 | |
CN109886222A (zh) | 人脸识别方法、神经网络训练方法、装置及电子设备 | |
US8503768B2 (en) | Shape description and modeling for image subscene recognition | |
CN101980242A (zh) | 人脸面相判别方法、系统及公共安全系统 | |
CN109886147A (zh) | 一种基于单网络多任务学习的车辆多属性检测方法 | |
CN104615986A (zh) | 利用多检测器对场景变化的视频图像进行行人检测的方法 | |
CN107292318A (zh) | 基于中心暗通道先验信息的图像显著性物体检测方法 | |
CN102385592A (zh) | 图像概念的检测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |