CN109766928A - 一种基于图像的物体分类方法、系统和电子设备 - Google Patents

一种基于图像的物体分类方法、系统和电子设备 Download PDF

Info

Publication number
CN109766928A
CN109766928A CN201811575009.XA CN201811575009A CN109766928A CN 109766928 A CN109766928 A CN 109766928A CN 201811575009 A CN201811575009 A CN 201811575009A CN 109766928 A CN109766928 A CN 109766928A
Authority
CN
China
Prior art keywords
area
image
region
network
under test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811575009.XA
Other languages
English (en)
Other versions
CN109766928B (zh
Inventor
张发恩
张祥伟
秦永强
赵江华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Innovation Qizhi (chongqing) Technology Co Ltd
Original Assignee
Innovation Qizhi (chongqing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Innovation Qizhi (chongqing) Technology Co Ltd filed Critical Innovation Qizhi (chongqing) Technology Co Ltd
Priority to CN201811575009.XA priority Critical patent/CN109766928B/zh
Publication of CN109766928A publication Critical patent/CN109766928A/zh
Application granted granted Critical
Publication of CN109766928B publication Critical patent/CN109766928B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种基于图像的物体分类方法、系统和电子设备,本方法通过识别图像的物体所在的第一区域,并对第一区域的物体特征上生成多个第二区域,再对多个所述第二区域进行细分,分类筛选出包含有待测物体的第三区域,并对第三区域进行细分,获得包含有待测物体的区别特征的第四区域,最后对所述待测物体所在第一区域、第二区域、第三区域以及第四区域进行识别分类,得到待测物体的分类信息。通过对待处理图像的物体区域进行多级分类筛选,提高了对物体的分类的准确性。

Description

一种基于图像的物体分类方法、系统和电子设备
【技术领域】
本发明属于图像识别领域,特别涉及一种基于图像的物体分类方法、系统和电子设备。
【背景技术】
图像识别技术已经越来越多地应用于人们的生活中,例如网络监管对图像进行识别并分类、电子设备的智能识别功能,都应用到了图像识别技术。图像识别技术可用于对图像内的物体进行分类,使生活和工作更加便捷和智能。
但是在现有技术中,对基于图像的物体分类方法中部分物体的分类并不准确,同一种类别的物体可能具有非常相似的特征,可能会使得分类的置信度降低。例如,对同一类饮料的不同口味的瓶子都是相同的,此时对饮料的分类结果无法细分到该种类别饮料是何种口味的。则通过现有的分类方法对具有非常相似特征的物体进行分类时,分类的次数较少,其准确度不高,容易造成错误分类。
【发明内容】
为克服目前的基于图像的物体分类方法存在的分类结果不准确的问题,本发明提供一种基于图像的物体分类方法、系统和电子设备。
本发明解决技术问题的技术方案是提供一种基于图像的物体分类方法,其包括如下步骤:
步骤S1:获取包含至少一个待测物体的待处理图像;
步骤S2:将所述图像输入至初筛网络,在图像中物体所在的区域生成第一区域;
步骤S3:将所述第一区域输入至细筛网络,在第一区域内生成多个包含物体特征的第二区域;
步骤S4:将多个所述第二区域输入至第一关键位置检测网络,筛选出包含所述待测物体特征的第三区域;
步骤S5:将所述第三区域输入至第二关键位置检测网络,筛选出包含所述待测物体特征中区别特征的第四区域;及
步骤S6:将所述待测物体所在的第一区域、第二区域、第三区域以及第四区域输入至分类网络,获得物体的分类信息。
优选地,在步骤S3与步骤S4之间还包括:
步骤S3-4:判断第二区域是否筛选出包含待测物体的特征,若是则进入步骤S4,若否,则返回步骤S2。
优选地,步骤S4具体包含以下步骤:将多个所述第二区域输入至第一关键位置检测网络中的关键区域检测网络,获得包含所述待测物体特征的关键区域;将多个所述第二区域输入至第一关键位置检测网络中的关键点检测网络,获得包含所述待测物体特征的关键点;选取同时包含关键区域和关键点的第一区域,将该第一区域内第二区域定义为第三区域。
优选地,步骤S5具体包含以下步骤:
步骤S51:将所述第三区域输入至第二关键位置检测网络进行识别。
步骤S52:对步骤S51中识别的多个所述第三区域进行筛选,获得包含所述待测物体上区别特征的第四区域。
优选地,所述分类网络可设置多级分类网络,以进一步对图像内的物体进行细分。
优选地,在所述分类网络获得物体分类信息后,将分类结果进行归一化处理,获得物体分类的置信度,根据置信度判断分类结果是否准确。
本发明为了解决上述技术问题还提供一种基于图像的物体分类系统,其特征在于,包括:图像获取单元,用于获取包含至少一个待测物体的待处理图像;图像初筛单元,用于将所述图像输入至初筛网络,在图像中物体所在的区域生成第一区域;图像细筛单元,用于将所述第一区域输入至细筛网络,在第一区域内生成多个包含物体特征的第二区域;判断单元,用于判断第二区域是否筛选出包含所需的物体特征;第一关键位置检测单元,用于将多个所述第二区域输入至第一关键位置检测网络,筛选出包含所述待测物体特征的第三区域;第二关键位置检测单元,用于将所述第三区域输入至第二关键位置检测网络,筛选出包含所述待测物体特征中的区别特征,以获得第四区域;及分类单元,用于将所述待测物体所在的第一区域、第二区域、第三区域以及第四区域输入至分类网络,获得物体的分类信息。
优选地,所述图像初筛单元和图像细筛单元可设置多个,以使所述系统在不同复杂程度的图像中筛选出包含物体特征的区域。
优选地,还包括归一化单元,用于将分类信息进行归一化处理,获得物体分类的置信度。
本发明为了解决上述技术问题还提供一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被设置为运行时执行上述任一项中所述的基于图像的物体分类方法;所述处理器被设置为通过所述计算机程序执行上述任一项中所述的基于图像的物体分类方法。
与现有技术相比,本发明具有如下有益效果:以往基于图像的物体的分类方法,由于有的物体之间存在非常相似的特征,对物体进行分类的次数较少,其准确度不高,容易造成错误分类。本方法通过识别图像的物体所在的第一区域,并根据第一区域之内不同的物体特征,以获得多个第二区域,再对多个所述第二区域进行进一步分析,以分类筛选出包含有待测物体的第三区域,并对第三区域进行细分,获得包含有待测物体的区别特征的第四区域,最后将待测物体所在的第一区域、第二区域、第三区域以及第四区域输入分类网络进行识别分类,得到待测物体的具体分类信息。通过对待处理图像的物体区域进行多级分类筛选,提高了对物体的分类的准确性。
判断第二区域是否筛选出包含待测物体的特征,若是,则进行下一步分类,若否,则返回进行重新分类筛选。通过对第二区域的判断,以确保可对所述第二区域内包含有待测物体的特征是否被全部找出,从而可提高分类的准确性。
将多个所述第二区域输入至第一关键位置检测网络中的关键区域检测网络,获得包含所述待测物体特征的关键区域;和/或将多个所述第二区域输入至第一关键位置检测网络中的关键点检测网络,获得包含所述待测物体特征的关键点;将得到的关键区域和关键点所在的第二区域求交集,获得包含所述待测物体特征的第三区域。通过第一关键位置检测网络,将多个所述第二区域中,筛选出位于待测物体上的第三区域,降低物体分类的错误率。
将所述第三区域输入至第二关键位置检测网络,第二关键位置检测网络识别所述待测物体上的区别特征。对步骤S51中识别的多个所述第三区域进行筛选,获得包含所述待测物体上区别特征的第四区域。通过第二关键位置检测网络,对第三区域进行进一步分类筛选,以获得待测物体中具有区别特征的所述第四区域。
所述分类网络可设置多级分类网络,以进一步对图像内的物体进行细分。可根据需要设置多级分类网络,进一步提高对物体的种类细分。
通过设置归一化处理,获得物体分类的置信度,使用者可通过归一化处理及时发现分类网络中的误差以进行调整,进一步提高分类的准确性,减小错误分类的概率。
【附图说明】
图1为本发明第一实施例提供的一种基于图像的物体分类方法的整体流程示意图;
图2a为本发明第一实施例提供的一种基于图像的物体分类方法步骤S2生成第一区域的示意图;
图2b为本发明第一实施例提供的一种基于图像的物体分类方法步骤S2的细节流程示意图;
图3a为本发明第一实施例提供的一种基于图像的物体分类方法步骤S3生成第二区域示意图;
图3b为本发明第一实施例提供的一种基于图像的物体分类方法步骤S3的细节流程示意图;
图4a为本发明第一实施例提供的一种基于图像的物体分类方法步骤S4生成第三区域示意图;
图4b为本发明第一实施例提供的一种基于图像的物体分类方法步骤S4的细节流程示意图;
图5为本发明第一实施例提供的一种基于图像的物体分类方法步骤S5的细节流程示意图;
图6为本发明第一实施例提供的一种基于图像的物体分类方法步骤S6的细节流程示意图;
图7为本发明第一实施例提供的一种基于图像的物体分类方法步骤S7的细节流程示意图;
图8为本发明第二实施例提供的一种基于图像的物体分类系统的模块示意图;
图9为本发明第三实施例提供的一种电子设备的模块示意图。
附图标识说明:
1、图像获取单元;2、图像初筛单元;3、图像细筛单元;4、判断单元;5、第一关键位置检测单元;6、第二关键位置检测单元;7、分类单元;8、归一化单元;
10、存储器;20、处理器;
100、第一饮料;101、第二饮料;
200、杯子;300、第一区域;
400、第二区域;401、瓶盖区域;402、第一标签区域;403、顶部区域;404、第二标签区域;
500、第三区域。
【具体实施方式】
为了使本发明的目的,技术方案及优点更加清楚明白,以下结合附图及实施实例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,一种基于图像的物体分类方法包括以下步骤:
步骤S1:获取包含至少一个待测物体的待处理图像。
具体地,所述待处理图像包含背景以及至少一个物体。其中,所述物体中包含背景物体以及待测物体。为了便于说明,在本发明中,使用多种类型和口味的饮料为示例,所述待处理图像包括背景物体以及至少一瓶饮料,但是其仅作为本发明的示例说明,不作为本发明的限定。
步骤S2:将所述图像输入至初筛网络,在图像中物体所在的区域生成第一区域。具体地,在经过初筛网络后,将背景物体以及待测物体所在的区域以矩形区域标记出来,一个物体对应一个矩形区域。例如,将所述饮料和背景物体所在的区域,以多个矩形区域标记饮料和背景物体所在的区域。
步骤S3:将所述第一区域输入至细筛网络,在第一区域内生成多个包含物体特征的第二区域。具体地,经过细筛网络,在所述第一区域中的背景物体和待测物体对应的物体特征上生成多个四边形区域的第二区域。此处所指的物体的特征包括如背景物体和待测物体的颜色、形状、图案等特征信息,可基于所述神经网络决定,也可基于人工选择而做相应的选择。例如,在上述第一区域内的饮料和背景物体的特征上,生成多个四边形区域,以获得所述第二区域。
步骤S4:将多个所述第二区域输入至第一关键位置检测网络,筛选出包含所述待测物体特征的第三区域。可以理解,多个所述第二区域中,包含有背景物体和待测物体的特征,在所述第二区域经过第一关键位置检测网络的筛选后,获得包含待测物体特征的第三区域。
例如,多个所述第二区域内包含有背景物体以及饮料,经过第一关键位置检测网络的筛选后,可获得多个所述第二区域内包含饮料的特征的第三区域。
步骤S5:将所述第三区域输入至第二关键位置检测网络,筛选出包含所述待测物体特征中的区别特征,以获得第四区域。可以理解,多个所述第三区域中,包含有待测物体的多个特征,其中部分特征为待测物体所属的类别中的共有特征,部分特征为待测物体所属的类别中的区别特征,经过第二关键位置检测网络进行筛选,可获得包含所述区别特征的第四区域。
例如,同种口味的饮料,通常包含有多处相同的特征,如相同的瓶身、瓶盖等,若直接进行分类可能会导致分类错误,第二关键位置检测网络将所述第三区域筛选出包含有所述饮料中与其它口味的饮料的区别特征,例如饮料标签,以获得所述第四区域,使得在后续的分类中,在对饮料的分类时,可根据所述第四区域获得饮料的口味分类。
步骤S6:将所述待测物体所在的第一区域、第二区域、第三区域以及第四区域输入至分类网络,获得物体的分类信息。具体地,通过上述第三区域和第四区域的分类筛选,获得所述待测物体所在的第一区域和第二区域,进一步将所述待测物体所在的第一区域、第二区域、第三区域以及第四区域输入至分类网络,并对待测物体进行分类。例如,通过识别上述第一区域、第二区域、第三区域以及第四区域内的特征,将饮料细分为A类型的苹果味饮料或B类型的芒果味饮料。及
步骤S7:将步骤S6的结果与预设的分类模板进行归一化处理,获得物体分类的置信度。通过设置归一化处理,获得物体分类的置信度,使用者可通过归一化处理及时发现分类网络中的误差以进行调整,避免获得错误的分类结果。
可选地,在步骤S3与步骤S4之间,还包括:
步骤S3-4:判断第二区域是否筛选出包含待测物体的特征,若是则进入步骤S4,若否,则返回步骤S2。以确保经过步骤S3后,所述第二区域内包含有待测物体的特征,提高分类的准确性。
请结合图2a和图2b,在本发明一些实施例中,步骤S2:将所述图像输入至初筛网络,在图像中物体所在的区域生成第一区域。如图2a中所示,以饮料为例,图像包含待测物体中的第一饮料100以及背景物体中的杯子200、第二饮料101,其中第一饮料100和第二饮料101具有相同的饮料标签A,而第一饮料100为瓶装,第二饮料400为罐装。经过初筛网络,在杯子200、第一饮料100和第二饮料101所在的区域各生成一个矩形的第一区域300。
步骤S2具体包括步骤S21~S22,可以理解,步骤S21~S22仅为该实施例的一种实施方式,其实施方式并不限定于步骤S21~S22,如图2b中所示,其步骤具体如下:
步骤S21:将图像输入至初筛网络,初筛网络根据预设的神经网络识别图像内的每个物体。及
步骤S22:将步骤S21中识别到的物体所在的区域生成多个第一区域。
需要说明的是,在上述步骤S2中,所述初筛网络可以为图像切割网络,用于将图像中所有物体所在的区域形成矩形边界。
请结合图3a和图3b,步骤S3:将所述第一区域输入至细筛网络,在第一区域内生成多个包含物体特征的第二区域。如图3a中所示,在上述步骤S2中的图2a中得到的三个所述第一区域300,在输入至细筛网络后,第一区域300内在第一饮料100、第二饮料101和杯子200的特征上生成多个所述第二区域400,具体地,第二区域400中包括生成于第一饮料100的瓶盖区域上的瓶盖区域401、标签信息A上的第一标签区域402,和生成于第二饮料101上的顶部区域的403、标签信息A区域上的第二标签区域404。
步骤S3具体包括步骤S31~S34。可以理解,步骤S31~S34仅为该实施例的一种实施方式,其实施方式并不限定于步骤S31~S34,如图3b中所示,其步骤流程如下:
步骤S31:提供多张训练图像,训练图像上标记有至少一个位于物体特征上的候选区域。例如,至少一个候选区域位于所述训练图像内的饮料区域上。
步骤S32:将所述训练图像转换成数据集。
步骤S33:将所述数据集输入至一初始细筛网络,让初始细筛网络获得物体的候选区域位置的权重。及
步骤S34:根据步骤S33中获得的权重得到所需的细筛网络,所述细筛网络通过获得的权重找出待处理图像内物体特征对应的第二区域。例如,经过多次训练得到的所述细筛网络,在所述待处理图像内饮料的特征区域上生成至少一个第二区域。需要说明的是,在上述步骤S3中,所述细筛网络可以为候选框生成网络,用于在第一区域内物体的特征上生成多个第二区域。
可以理解,经过多次训练后的细筛网络,在识别物体时,由于背景物体与待测物体之上可能会含有部分相同的特征,因此,如果仅仅基于第二区域进行分析,则容易将无需分类的背景物体也进行识别,而使分类结果出错,因此,为了进一步提高所述待测物体分类的准确度,则还需对获得的所述第二区域进行进一步的筛选。
请结合图3a、4a和图4b,步骤S4:将多个所述第二区域输入至第一关键位置检测网络,筛选出包含所述待测物体特征的第三区域。如图4a所示,以上述第一饮料100、第二饮料101和杯子200为例,将多个所述第二区域400输入至第一关键位置检测网络后,识别出多个第二区域400中位于第一饮料100上的第二区域200并将其定义为第三区域500。步骤4具体包括步骤S41~S43,可以理解,步骤S41~S43仅为该实施例的一种实施方式,其实施方式并不限定于步骤S41~S43,如图4b中所示,其步骤流程如下:
步骤S41:将多个所述第二区域输入至第一关键位置检测网络中的关键区域检测网络,获得包含所述待测物体特征的关键区域。具体地,所述关键区域检测网络通过训练得到多个不同第二区域的权重,检测多个第二区域中并进行对比筛选,所述权重可直接反映第二区域中多个不同区域的重要性,从而可基于多个第二区域的重要性筛选出所述关键区域。如图3a图所示,杯子200的特征经过筛选后不属于待测物体,而由于第一标签区域402和第二标签区域404具有相同的特征,因此,仅仅基于第一标签区域402与第二标签区域404并不能筛选出待测物体的特征是第一饮料100还是第二饮料101。
步骤S42:将多个所述第二区域输入至第一关键位置检测网络中的关键点检测网络,获得包含所述待测物体特征的关键点。具体地,所述关键点检测网络通过训练得到的权重,检测第二区域中多个点并进行对比筛选,所述权重直接反映第二区域中多个不同点的重要性,从而可基于关键点的重要性筛选出最终的所述关键点。如图3a所示,对瓶盖区域401以及顶部区域403进行关键点筛选,瓶盖区域401包含瓶盖特征,顶部区域403不包含瓶盖特征,则获得第一饮料100为待测物体。
步骤S43:选取同时包含关键区域和关键点的第一区域,将该第一区域内第二区域定义为第三区域。如图4a所示,将第一饮料100所在的第一区域300内的第二区域400定义为第三区域500。
例如,同种类型和同种口味的饮料,可能包含有罐装和瓶装两种包装,可通过关键点检测网络,对饮料的瓶盖进行识别,此时瓶装饮料的瓶盖就会被识别,而罐装饮料由于没有瓶盖的特征,因此罐装饮料并不会被识别。
可以理解,步骤S41与步骤S42的执行的顺序可置换,或两个步骤可同时进行。
通过第一关键位置检测网络,在多个所述第二区域中,筛选出位于待测物体上的第三区域,从而可进一步降低物体分类的错误率,避免将背景物体中的第二区域纳入分类的区域。
请结合图4a和图5,步骤S5:将所述第三区域输入至第二关键位置检测网络,筛选出包含所述待测物体特征中区别特征的第四区域。如图4a中所示,位于标签信息A上的第三区域500内的特征即为区别特征。步骤S5具体包括步骤S51~S52。可以理解,步骤S51~S52仅为该实施例的一种实施方式,其实施方式并不限定于步骤S51~S52。
步骤S51:将所述第三区域输入至第二关键位置检测网络进行识别。例如,同种类型不同种口味的饮料上包含有相同的瓶身、瓶盖,有不同的饮料标签,则所述饮料标签即为区别特征。及
步骤S52:对步骤S51中识别的多个所述第三区域进行筛选,获得包含所述待测物体上区别特征的第四区域。例如,所述饮料标签上,含有不同的“苹果味”、“芒果味”等文字,第二关键位置检测网络筛选出包含该类区别图形特征区域以获得所述第四区域。
请参阅图6,步骤S6:将所述待测物体所在的第一区域、第二区域、第三区域以及第四区域输入至分类网络,获得物体的分类信息。步骤S6具体包括步骤S61~S63,在本实施例中,步骤S6以RA-CNN(Recurrent Attention Convolutional Neural Network—基于递归注意力模型的卷积神经网络)获得物体的分类信息为例,可以理解,步骤S61~S63仅为该实施例的一种实施方式,其实施方式并不限定于步骤S61~S63。
步骤S61:将所述待测物体所在的第一区域、第二区域、第三区域以及第四区域输入至分类网络。以对第四区域内的待测物体进行分类。
步骤S62:分类网络将第一区域、第二区域、第三区域以及第四区域依次输入到分类网络中的三层卷积层中,得到注意力区域信息。及
步骤S63:将获得的注意力区域信息与预设的物体模型匹配,得到物体类别的分类信息。例如,饮料经过分类网络进行分类之后,可以确认饮料的口味是苹果味还是芒果味的饮料。具体地,所述物体模型为待处理图像中物体的模型,用于给所述分类网络提供对应的权重,所述物体模型是所述分类网络经过训练得到。
可选地,所述分类网络可设置多级分类网络,以进一步对图像内的物体进行细分
可选地,在本实施例中所提供的分类网络,还可以对该分类网络进行多次训练,也即,将多个物体的模型数据进行导入至第二分类网络,以提高对物体的识别效率。
可选地,该实施例还可以对上述训练后得到的多个物体的模型数据进行更换或者增加,可根据需要识别多种物体的类别。
请参阅图7,步骤S7:将步骤S6的结果与预设的分类模板进行归一化处理,获得物体分类的置信度,具体包括步骤S71~S74。可以理解,步骤S71~S74仅为该实施例的一种实施方式,其实施方式并不限定于步骤S71~S74。
步骤S71:将步骤S63中分类后的物体信息与预设的物体模型进行匹配。
步骤S72:判断分类后的物体信息是否与预设的物体模型相匹配,
若是,则输出至步骤S73:输出图像内物体分类的最终结果;
若否,则输出至步骤S74:返回步骤S1,重新进行分类。
例如,预设的物体模型为包含苹果味和芒果味的饮料,在上述步骤S6中对饮料的分类结果为苹果味饮料,将该分类结果的苹果味饮料与预设的苹果味饮料模型进行匹配。
本发明第二实施例提供一种基于图像的物体分类系统。如图8所示,该基于图像的物体分类系统包括:图像获取单元1、图像初筛单元2、图像细筛单元3、判断单元4、第一关键位置检测单元5、第二关键位置检测单元6以及分类单元7。
图像获取单元1,用于获取包含至少一个待测物体的待处理图像。
图像初筛单元2,用于将所述图像输入至初筛网络,在图像中物体所在的区域生成第一区域。
图像细筛单元3,用于将所述第一区域输入至细筛网络,在第一区域内生成多个包含物体特征的第二区域。
判断单元4,用于判断第二区域是否筛选出包含所需物体特征。
第一关键位置检测单元5,用于将多个所述第二区域输入至第一关键位置检测网络,筛选出包含所述待测物体特征的第三区域。及
第二关键位置检测单元6,用于将所述第三区域输入至第二关键位置检测网络,筛选出包含所述待测物体特征中区别特征的第四区域。
分类单元7,用于将所述待测物体所在的第一区域、第二区域、第三区域以及第四区域输入至分类网络,获得物体的分类信息。
可选地,所述基于图像的物体分类系统还包括归一化单元8,用于将物体分类的结果进行归一化处理,以获得物体分类的置信度。
可选地,所述分类单元可设置多级分类单元,以进一步对图像内的物体进行细分,以获得更加准确的分类信息。
具体地,所述基于图像的物体分类系统对图像内物体的分类方法、过程与上述基于图像的物体分类方法相同。
请参阅图9,本发明第三实施例提供一种电子设备,所述电子设备包括存储器10和处理器20,所述存储器10中存储有计算机程序,所述计算机程序被设置为运行时执行上述任一项基于图像的物体分类方法实施例中的步骤。所述处理器20被设置为通过所述计算机程序执行上述任一项基于图像的物体分类方法实施例中的步骤。
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
与现有技术相比,本发明具有如下有益效果:以往基于图像的物体的分类方法,由于有的物体之间存在非常相似的特征,对物体进行分类的次数较少,其准确度不高,容易造成错误分类。本方法通过识别图像的物体所在的第一区域,并根据第一区域之内不同的物体特征,以获得多个第二区域,再对多个所述第二区域进行进一步分析,以分类筛选出包含有待测物体的第三区域,并对第三区域进行细分,获得包含有待测物体的区别特征的第四区域,最后将待测物体所在的第一区域、第二区域、第三区域以及第四区域输入分类网络进行识别分类,得到待测物体的具体分类信息。通过对待处理图像的物体区域进行多级分类筛选,提高了对物体的分类的准确性。
判断第二区域是否筛选出包含待测物体的特征,若是,则进行下一步分类,若否,则返回进行重新分类筛选。通过对第二区域的判断,以确保可对所述第二区域内包含有待测物体的特征是否被全部找出,从而可提高分类的准确性。
将多个所述第二区域输入至第一关键位置检测网络中的关键区域检测网络,获得包含所述待测物体特征的关键区域;和/或将多个所述第二区域输入至第一关键位置检测网络中的关键点检测网络,获得包含所述待测物体特征的关键点;将得到的关键区域和关键点所在的第二区域求交集,获得包含所述待测物体特征的第三区域。通过第一关键位置检测网络,将多个所述第二区域中,筛选出位于待测物体上的第三区域,降低物体分类的错误率。
将所述第三区域输入至第二关键位置检测网络,第二关键位置检测网络识别所述待测物体上的区别特征。对步骤S51中识别的多个所述第三区域进行筛选,获得包含所述待测物体上区别特征的第四区域。通过第二关键位置检测网络,对第三区域进行进一步分类筛选,以获得待测物体中具有区别特征的所述第四区域。
所述分类网络可设置多级分类网络,以进一步对图像内的物体进行细分。可根据需要设置多级分类网络,进一步提高对物体的种类细分。
通过设置归一化处理,获得物体分类的置信度,使用者可通过归一化处理及时发现分类网络中的误差以进行调整,进一步提高分类的准确性,减小错误分类的概率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内所作的任何修改,等同替换和改进等均应包含本发明的保护范围之内。

Claims (10)

1.一种基于图像的物体分类方法,其特征在于,包括如下步骤:
步骤S1:获取包含至少一个待测物体的待处理图像;
步骤S2:将所述图像输入至初筛网络,在图像中物体所在的区域生成第一区域;
步骤S3:将所述第一区域输入至细筛网络,在第一区域内生成多个包含物体特征的第二区域;
步骤S4:将多个所述第二区域输入至第一关键位置检测网络,筛选出包含所述待测物体特征的第三区域;
步骤S5:将所述第三区域输入至第二关键位置检测网络,筛选出包含所述待测物体特征中区别特征的第四区域;及
步骤S6:将所述待测物体所在的第一区域、第二区域、第三区域以及第四区域输入至分类网络,获得物体的分类信息。
2.如权利要求1中所述基于图像的物体分类方法,其特征在于:
在步骤S3与步骤S4之间还包括:
步骤S3-4:判断第二区域是否筛选出包含待测物体的特征,若是则进入步骤S4,若否,则返回步骤S2。
3.如权利要求1中所述基于图像的物体分类方法,其特征在于,步骤S4具体包含以下步骤:
将多个所述第二区域输入至第一关键位置检测网络中的关键区域检测网络,获得包含所述待测物体特征的关键区域;
将多个所述第二区域输入至第一关键位置检测网络中的关键点检测网络,获得包含所述待测物体特征的关键点;
选取同时包含关键区域和关键点的第一区域,将该第一区域内第二区域定义为第三区域。
4.如权利要求1中所述基于图像的物体分类方法,其特征在于,步骤S5具体包含以下步骤:
步骤S51:将所述第三区域输入至第二关键位置检测网络进行识别。
步骤S52:对步骤S51中识别的多个所述第三区域进行筛选,获得包含所述待测物体上区别特征的第四区域。
5.如权利要求1中所述基于图像的物体分类方法,其特征在于:所述分类网络可设置多级分类网络,以进一步对图像内的物体进行细分。
6.如权利要求1中所述基于图像的物体分类方法,其特征在于:在所述分类网络获得物体分类信息后,将分类结果进行归一化处理,获得物体分类的置信度,根据置信度判断分类结果是否准确。
7.一种基于图像的物体分类系统,其特征在于,包括:
图像获取单元,用于获取包含至少一个待测物体的待处理图像;
图像初筛单元,用于将所述图像输入至初筛网络,在图像中物体所在的区域生成第一区域;
图像细筛单元,用于将所述第一区域输入至细筛网络,在第一区域内生成多个包含物体特征的第二区域;
判断单元,用于判断第二区域是否筛选出包含所需的物体特征;
第一关键位置检测单元,用于将多个所述第二区域输入至第一关键位置检测网络,筛选出包含所述待测物体特征的第三区域;
第二关键位置检测单元,用于将所述第三区域输入至第二关键位置检测网络,筛选出包含所述待测物体特征中的区别特征,以获得第四区域;及
分类单元,将所述待测物体所在的第一区域、第二区域、第三区域以及第四区域输入至分类网络,获得物体的分类信息。
8.如权利要求7中所述基于图像的物体分类系统,其特征在于:所述图像初筛单元和图像细筛单元可设置多个,以使所述系统在不同复杂程度的图像中筛选出包含物体特征的区域。
9.如权利要求7中所述基于图像的物体分类系统,其特征在于:还包括归一化单元,用于将分类信息进行归一化处理,获得物体分类的置信度。
10.一种电子设备,包括存储器和处理器,其特征在于:所述存储器中存储有计算机程序,所述计算机程序被设置为运行时执行所述权利要求1至6任一项中所述的基于图像的物体分类方法;
所述处理器被设置为通过所述计算机程序执行所述权利要求1至6任一项中所述的基于图像的物体分类方法。
CN201811575009.XA 2018-12-21 2018-12-21 一种基于图像的物体分类方法、系统和电子设备 Active CN109766928B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811575009.XA CN109766928B (zh) 2018-12-21 2018-12-21 一种基于图像的物体分类方法、系统和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811575009.XA CN109766928B (zh) 2018-12-21 2018-12-21 一种基于图像的物体分类方法、系统和电子设备

Publications (2)

Publication Number Publication Date
CN109766928A true CN109766928A (zh) 2019-05-17
CN109766928B CN109766928B (zh) 2020-04-17

Family

ID=66451943

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811575009.XA Active CN109766928B (zh) 2018-12-21 2018-12-21 一种基于图像的物体分类方法、系统和电子设备

Country Status (1)

Country Link
CN (1) CN109766928B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160260014A1 (en) * 2015-03-06 2016-09-08 Panasonic Intellectual Property Management Co., Ltd. Learning method and recording medium
CN106886795A (zh) * 2017-02-17 2017-06-23 北京维弦科技有限责任公司 基于图像中的显著物体的物体识别方法
CN106960214A (zh) * 2017-02-17 2017-07-18 北京维弦科技有限责任公司 基于图像的物体识别方法
CN107944022A (zh) * 2017-12-11 2018-04-20 努比亚技术有限公司 图片分类方法、移动终端及计算机可读存储介质
CN108229509A (zh) * 2016-12-16 2018-06-29 北京市商汤科技开发有限公司 用于识别物体类别的方法及装置、电子设备
CN108898060A (zh) * 2018-05-30 2018-11-27 珠海亿智电子科技有限公司 车载环境下基于卷积神经网络的车型识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160260014A1 (en) * 2015-03-06 2016-09-08 Panasonic Intellectual Property Management Co., Ltd. Learning method and recording medium
CN105938558A (zh) * 2015-03-06 2016-09-14 松下知识产权经营株式会社 学习方法
CN108229509A (zh) * 2016-12-16 2018-06-29 北京市商汤科技开发有限公司 用于识别物体类别的方法及装置、电子设备
CN106886795A (zh) * 2017-02-17 2017-06-23 北京维弦科技有限责任公司 基于图像中的显著物体的物体识别方法
CN106960214A (zh) * 2017-02-17 2017-07-18 北京维弦科技有限责任公司 基于图像的物体识别方法
CN107944022A (zh) * 2017-12-11 2018-04-20 努比亚技术有限公司 图片分类方法、移动终端及计算机可读存储介质
CN108898060A (zh) * 2018-05-30 2018-11-27 珠海亿智电子科技有限公司 车载环境下基于卷积神经网络的车型识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JIANLONG FU 等: ""Look Closer to See Better:Recurrent Attention Convolutional Neural Network for Fine-grained Image Recognition"", 《2017 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION(CVPR)》 *

Also Published As

Publication number Publication date
CN109766928B (zh) 2020-04-17

Similar Documents

Publication Publication Date Title
Vogel et al. A semantic typicality measure for natural scene categorization
CN106897738B (zh) 一种基于半监督学习的行人检测方法
CN110378420A (zh) 一种图像检测方法、装置及计算机可读存储介质
CN106408030B (zh) 基于中层语义属性和卷积神经网络的sar图像分类方法
US9916520B2 (en) Automated food recognition and nutritional estimation with a personal mobile electronic device
CN109447169A (zh) 图像处理方法及其模型的训练方法、装置和电子系统
CN1276384C (zh) 视频流可分类符号分离的方法与系统
CN103679189B (zh) 场景识别的方法和装置
CN110059654A (zh) 一种基于细粒度识别的菜品自动结算及饮食健康管理方法
US9576223B2 (en) Method and system for evaluating the resemblance of a query object to reference objects
CN108229509A (zh) 用于识别物体类别的方法及装置、电子设备
CN106447625A (zh) 基于人脸图像序列的属性识别方法及装置
CN107871101A (zh) 一种人脸检测方法及装置
KR102040309B1 (ko) 멀티미디어 콘텐츠와 연관되는 후각 정보 인식 장치 및 방법, 라벨 정보 생성 장치 및 방법
CN105574550A (zh) 一种车辆识别方法及装置
CN102034107B (zh) 基于鲁棒视觉注意特征与稀疏表示的不良图像判别方法
US11335086B2 (en) Methods and electronic devices for automated waste management
CN108875805A (zh) 基于深度学习的利用检测识别一体化提高检测精度的方法
CN107403128A (zh) 一种物品识别方法及装置
CN107016022A (zh) 教学难点大数据分析系统
CN106897949A (zh) 学校教学质量大数据分析系统
CN114549993B (zh) 实验中线段图像的评分方法、系统、设备及可读存储介质
CN103164687A (zh) 一种色情图像侦测的方法和系统
CN108446588A (zh) 一种双时相遥感影像变化检测方法及系统
CN108734159A (zh) 一种图像中敏感信息的检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant