CN109934214A - 一种对象类别的训练、检测方法及装置 - Google Patents
一种对象类别的训练、检测方法及装置 Download PDFInfo
- Publication number
- CN109934214A CN109934214A CN201910132553.5A CN201910132553A CN109934214A CN 109934214 A CN109934214 A CN 109934214A CN 201910132553 A CN201910132553 A CN 201910132553A CN 109934214 A CN109934214 A CN 109934214A
- Authority
- CN
- China
- Prior art keywords
- feature information
- sorted
- fisrt feature
- information
- characteristic area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
本申请公开了一种对象类别的训练、检测方法及装置。该方法按照对象类别信息,获取待检测图片中至少一种对象的对象类别,并根据至少一种对象的位置信息,获取至少一种对象中每种对象的至少一个特征区域,至少一个特征区域包括部分或完整的对象信息;根据至少一种对象的第一特征信息和相应对象的对象类别,训练对象分类模型,对象分类模型包括至少一种对象的对象类别与相应对象的第一特征信息的对应关系,至少一种对象的第一特征信息是采用预设特征提取算法,从每种对象的至少一个特征区域中提取的。该方法通过每个对象的特征区域,获取每个对象的第一特征信息,与现有技术相比,有效的解决了密集情况下严重漏检测的问题,提高了检测的准确性。
Description
技术领域
本申请涉及图像识别技术领域,尤其涉及一种对象类别的训练、检测方法及装置。
背景技术
在超市中,商家以及消费者需要实时地获得货架上的商品相关信息,如商品种类。目前商品相关信息的获得都是通过人工获得,但是超市的商品数目巨大,人工获得商品种类的方式成本高并且效率低,因此基于对象种类的检测方法具有重要的研究意义和商业价值。
目前,目标对象检测方法主要包括单网络多目标检测器(Single Shot MultiboxDetector,SSD)目标对象检测方法和你只看一次(You Only Look Once,YOLO)目标对象检测方法,即只看一遍图片就能把所有的对象都识别出来的目标对象检测方法。YOLO目标对象检测方法是直接回归出对象的位置和类别。SSD目标对象检测方法不仅可以在一个网络中直接回归出对象的类别和位置。同时也利用了基于区域的概念,在检测的过程中,使用了许多候选区域作为感兴趣区域ROI,使检测精度相对YOLO有提高。
然而,发明人发现SSD目标对象检测方法为了解决特征框重叠问题,首先计算每个特征框面积,然后根据每种面积的特征框在softmax函数中的概率score进行排序,将score最大的特征框放入队列中。计算其余特征框分别与当前最大score的特征框的重叠程度IOU,其中,IOU为两个特征框交集面积除以两个特征框并集面积,去除IOU大于重叠阈值的特征框,但对于密集的多个待检测对象容易造成对象丢失的情况,导致检测的准确性不高。
发明内容
本申请实施例提供一种对象类别的训练、检测方法及装置,解决了现有技术存在的上述问题,以提高检测的准确性。
第一方面,提供了一种对象类别的训练方法,该方法可以包括:
按照对象类别信息,获取待检测图片中至少一种对象的对象类别;
根据所述至少一种对象中在所述待检测图片上的位置信息,对所述至少一种对象进行位置标记,得到所述至少一种对象的标记位置,所述标记位置包括对象的至少一个位置点;
根据所述至少一种对象的标记位置,采用预设区域提取算法,获取所述至少一种对象中每种对象的至少一个特征区域,所述至少一个特征区域包括部分或完整的对象信息;
根据所述至少一种对象的第一特征信息和相应对象的对象类别,训练对象分类模型,所述对象分类模型包括所述至少一种对象的对象类别与相应对象的第一特征信息的对应关系,所述至少一种对象的第一特征信息是采用预设特征提取算法,从所述每种对象的至少一个特征区域中提取的。
在一个可选的实现中,根据所述至少一种对象的标记位置,采用预设区域提取算法,获取所述至少一种对象中每种对象的至少一个特征区域,包括:
将所述至少一种对象中每种对象的标记位置为中心,采用预设区域提取算法,得到所述每种对象的至少一个特征区域。
第二方面,提供了一种对象类别的检测方法,该方法可以包括:
根据接收的当前图片中待分类对象的位置信息,对所述待分类对象进行位置标记,得到所述待分类对象的标记位置,所述标记位置包括所述待分类对象的至少一个位置点;
根据所述待分类对象的标记位置,采用预设区域提取算法,获取所述待分类对象的至少一个特征区域,所述至少一个特征区域包括部分或完整的待分类对象信息;
采用预设特征提取算法,获取所述至少一个特征区域中所述待分类对象的第二特征信息;
查找对象分类模型存储的至少一种对象的第一特征信息中与所述第二特征信息匹配的第一特征信息;
若查找到,则根据所述对象分类模型存储的所述至少一种对象的对象类别与相应对象的第一特征信息的对应关系,将所述匹配的第一特征信息对应的对象类别确定为所述待分类对象的对象类别。
在一个可选的实现中,查找存储的至少一种对象的第一特征信息中与所述第二特征信息匹配的第一特征信息,包括:
采用预设相似度算法,得到所述第二特征信息与至少一种对象中每种对象的第一特征信息间的相似度;
若所述相似度不小于预设相似度阈值,则确定所述待分类对象与所述第一特征信息对应的对象匹配。
在一个可选的实现中,所述方法还包括:
若查找不到与所述第二特征信息匹配的第一特征信息,则在所述对象分类模型中存储所述第二特征信息,以更新所述对象分类模型。
第三方面,提供了一种对象类别的训练装置,该装置可以包括:获取单元、标记单元和训练单元;
所述获取单元,用于按照对象类别信息,获取待检测图片中至少一种对象的对象类别;
所述标记单元,用于根据所述至少一种对象中在所述待检测图片上的位置信息,对所述至少一种对象进行位置标记,得到所述至少一种对象的标记位置,所述标记位置包括对象的至少一个位置点;
所述获取单元,还用于根据所述至少一种对象的标记位置,采用预设区域提取算法,获取所述至少一种对象中每种对象的至少一个特征区域,所述至少一个特征区域包括部分或完整的对象信息;
所述训练单元,用于根据所述至少一种对象的第一特征信息和相应对象的对象类别,训练对象分类模型,所述对象分类模型包括所述至少一种对象的对象类别与相应对象的第一特征信息的对应关系,所述至少一种对象的第一特征信息是采用预设特征提取算法,从所述每种对象的至少一个特征区域中提取的。
在一个可选的实现中,所述获取单元,具体用于将所述至少一种对象中每种对象的标记位置为中心,采用预设区域提取算法,得到所述每种对象的至少一个特征区域。
第四方面,提供了一种对象类别的训练装置,该装置可以包括:标记单元、获取单元、查找单元和确定单元;
所述标记单元,用于根据接收的当前图片中待分类对象的位置信息,对所述待分类对象进行位置标记,得到所述待分类对象的标记位置,所述标记位置包括所述待分类对象的至少一个位置点;
所述获取单元,用于根据所述待分类对象的标记位置,采用预设区域提取算法,获取所述待分类对象的至少一个特征区域,所述至少一个特征区域包括部分或完整的待分类对象信息;
采用预设特征提取算法,获取所述至少一个特征区域中所述待分类对象的第二特征信息;
所述查找单元,用于查找对象分类模型存储的至少一种对象的第一特征信息中与所述第二特征信息匹配的第一特征信息;
所述确定单元,用于若查找到,则根据所述对象分类模型存储的所述至少一种对象的对象类别与相应对象的第一特征信息的对应关系,将所述匹配的第一特征信息对应的对象类别确定为所述待分类对象的对象类别。
在一个可选的实现中,所述查找单元,具体用于采用预设相似度算法,得到所述第二特征信息与至少一种对象中每种对象的第一特征信息间的相似度;
若所述相似度不小于预设相似度阈值,则确定所述待分类对象与所述第一特征信息对应的对象匹配。
在一个可选的实现中,所述装置还包括存储单元;
所述存储单元,用于若查找不到与所述第二特征信息匹配的第一特征信息,则在所述对象分类模型中存储所述第二特征信息,以更新所述对象分类模型。
第五方面,提供了一种电子设备,该电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面中任一所述的方法步骤或上述第二方面中任一项上所述的方法步骤。
第六方面,提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一所述的方法步骤或上述第二方面中任一所述的方法步骤。
本发明上述方法实施例按照对象类别信息,获取待检测图片中至少一种对象的对象类别,并根据至少一种对象的位置信息,获取至少一种对象中每种对象的至少一个特征区域,至少一个特征区域包括部分或完整的对象信息;根据至少一种对象的第一特征信息和相应对象的对象类别,训练对象分类模型,对象分类模型包括至少一种对象的对象类别与相应对象的第一特征信息的对应关系,至少一种对象的第一特征信息是采用预设特征提取算法,从每种对象的至少一个特征区域中提取的。该方法通过每个对象的特征区域,获取每个对象的第一特征信息,与现有技术相比,有效的解决了密集情况下严重漏检测的问题,提高了检测的准确性。
附图说明
图1为本发明实施例提供的一种对象类别的训练方法的流程示意图;
图2为本发明实施例提供的一种待检测图片的示意图;
图3A为本发明实施例提供的一种对象特征区域的区域示意图;
图3B为本发明实施例提供的另一种对象特征区域的区域示意图;
图4为本发明实施例提供的一种对象类别的检测方法的流程示意图;
图5为本发明实施例提供的一种对象类别的训练装置的结构示意图;
图6为本发明实施例提供的一种对象类别的检测装置的结构示意图;
图7为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,并不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本发明实施例提供的对象类别的训练和检测方法可以应用在服务器上,也可以应用在终端上。为了保证训练和检测的精确性,服务器可以是具有较强计算能力的应用服务器或云服务器;终端可以是具有较强的计算能力的用户设备(User Equipment,UE)、具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备、移动台(Mobile station,MS)等。其中,对象可以是商品。
下面以服务器或终端中的处理器为执行主体为例进行详细描述。
图1为本发明实施例提供的一种对象类别的训练方法的流程示意图。如图1所示,该方法可以包括:
步骤110、采集待检测图片,待检测图片包括至少一种对象。
处理器通过摄像头采集待检测图片,如图2所示,待检测图片包括9种对象。
步骤120、按照对象类别信息,获取至少一种对象的对象类别。
当对象是饮用商品时,对象类别信息可以包括纯净水类、碳酸类、果汁类等。
处理器按照已知的对象类别信息,对至少一种对象进行分类,得到至少一种对象的对象类别,并进行存储。结合图2,0号商品、1号商品和2号商品的类别如表1所示。
表1
序号 | 类别 |
0 | 水类 |
1 | 果汁类 |
2 | 碳酸类 |
步骤130、根据至少一种对象在待检测图片上的位置信息,获取至少一种对象中每种对象的至少一个特征区域。
处理器可以采用位置识别等定位方法,获取至少一种对象在待检测图片上的位置信息,并对每种对象进行位置标记,得到每种对象的标记位置,其中,每种对象的标记位置可以包括该对象的至少一个位置点,也就是说,标记位置可以是该对象的任一位置点,也可以包括该对象的多个位置点。
根据至少一种对象的标记位置,采用预设区域提取算法,获取至少一种对象中每种对象的至少一个特征区域,至少一个特征区域可以包括部分或完整的对象信息;
例如,当标记位置包括对象的一个位置点时,该标记位置可以是对象的中心位置,处理器将该标记位置为中心,采用预设区域算法,不断调节预设区域大小,以得到对象的至少一个特征区域。如图3A和图3B所示的示意图为图2中0号商品和4号商品的特征区域,A点和B点分别为0号商品和4号商品的标记位置,其中,0号商品和4号商品的特征区域均包含0号商品和4号商品的完整商品信息。
步骤140、采用预设特征提取算法,从每个对象的至少一个特征区域中提取该对象的第一特征信息。
处理器将获取的至少一种对象中每种对象的至少一个特征区域输入至两层全连接层(fully connected layers,FC),即fc1和fc2,即fc1和fc2均包括4096个神经元节点,针对一个特征区域,fc2输出4096个特征信息。若某一对象存在10个特征区域,则fc2输出的第一特征信息包括10*4096个特征信息。第一特征信息可以以向量的形式进行存储。
步骤150、根据至少一种对象的第一特征信息和至少一种对象对应的对象类别,训练对象分类模型。
对象分类模型包括至少一种对象的对象类别与相应对象的第一特征信息的对应关系。
本发明上述方法实施例按照对象类别信息,获取待检测图片中至少一种对象的对象类别,并根据至少一种对象中在待检测图片上的位置信息,获取至少一种对象中每种对象的至少一个特征区域,至少一个特征区域包括部分或完整的对象信息;根据至少一种对象的第一特征信息和相应对象的对象类别,训练对象分类模型,对象分类模型包括至少一种对象的对象类别与相应对象的第一特征信息的对应关系,至少一种对象的第一特征信息是采用预设特征提取算法,从每种对象的至少一个特征区域中提取的。该方法通过每个对象的特征区域,获取每个对象的第一特征信息,与现有技术相比,有效的解决了密集情况下严重漏检测的问题,提高了检测的准确性。
图4为本发明实施例提供的一种对象类别的检测方法的流程示意图。如图4所示,该方法可以包括:
步骤410、接收当前图片,当前图片包括待分类对象。
步骤420、根据待分类对象在待检测图片上的位置信息,获取待分类对象的特征区域。
根据待分类对象在待检测图片上的位置信息,对待分类对象进行位置标记,得到待分类对象的标记位置。标记位置包括待分类对象的至少一个位置点,并根据待分类对象的标记位置,采用预设区域提取算法,获取待分类对象的至少一个特征区域,至少一个特征区域包括部分或完整的待分类对象信息。
步骤430、采用预设特征提取算法,获取至少一个特征区域中待分类对象的第二特征信息。
其中,预设特征提取算法可以是卷积算法。
可以理解的是,第二特征信息与步骤140的第一特征信息的获取过程相同。
步骤440、查找对象分类模型存储的至少一种对象的第一特征信息中与第二特征信息匹配的第一特征信息。
采用预设相似度算法,得到第二特征信息与至少一种对象中每种对象的第一特征信息间的相似度。
若相似度小于预设相似度阈值,则确定待分类对象与第一特征信息对应的对象不匹配,执行步骤460;
若相似度不小于预设相似度阈值,则确定待分类对象与第一特征信息对应的对象匹配,执行步骤450。
步骤450、根据对象分类模型存储的至少一种对象中每种对象的对象类别与相应对象的第一特征信息的对应关系,将匹配的第一特征信息对应的对象类别确定为待分类对象的对象类别。
具体的,当前图片通过卷积层提取第二特征信息,第二特征信息经过两层全连接层fc1和fc2后,输出商品分类的结果,其中,fc1、fc2均包括4096个神经元节点。
步骤460、在对象分类模型中存储第二特征信息。
存储第二特征信息后,对该第二特征信息命名,以更新对象分类模型。
本发明上述方法实施例根据接收的当前图片中待分类对象的位置信息,对待分类对象进行位置标记,得到待分类对象的标记位置,标记位置包括待分类对象的至少一个位置点;根据待分类对象的标记位置,采用预设区域提取算法,获取待分类对象的至少一个特征区域,至少一个特征区域包括部分或完整的待分类对象信息;采用预设特征提取算法,获取所述至少一个特征区域中待分类对象的第二特征信息;查找对象分类模型存储的至少一种对象的第一特征信息中与第二特征信息匹配的第一特征信息;若查找到,则根据对象分类模型存储的至少一种对象的对象类别与相应对象的第一特征信息的对应关系,将匹配的第一特征信息对应的对象类别确定为待分类对象的对象类别。该方法通过特征信息比对的方式确定对象类型,避免了每次有新对象加入时就需要重新训练整个模型的问题,减少了检测工作量,提高了检测效率。
与上述方法对应的,本发明实施例还提供一种对象类别的训练装置,如图5所示,该装置包括:获取单元510、标记单元520和训练单元530;
获取单元510,用于按照对象类别信息,获取待检测图片中至少一种对象的对象类别;
标记单元520,用于根据所述至少一种对象中在所述待检测图片上的位置信息,对所述至少一种对象进行位置标记,得到所述至少一种对象的标记位置,所述标记位置包括对象的至少一个位置点;
获取单元510,还用于根据所述至少一种对象的标记位置,采用预设区域提取算法,获取所述至少一种对象中每种对象的至少一个特征区域,所述至少一个特征区域包括部分或完整的对象信息;
训练单元530,用于根据所述至少一种对象的第一特征信息和相应对象的对象类别,训练对象分类模型,所述对象分类模型包括所述至少一种对象的对象类别与相应对象的第一特征信息的对应关系,所述至少一种对象的第一特征信息是采用预设特征提取算法,从所述每种对象的至少一个特征区域中提取的。
在一个可选的实现中,获取单元510,具体用于将所述至少一种对象中每种对象的标记位置为中心,采用预设区域提取算法,得到所述每种对象的至少一个特征区域。
本发明上述实施例提供的对象类别的训练装置的各功能单元的功能,可以通过上述各方法步骤来实现,因此,本发明实施例提供的对象类别的训练装置中的各个单元的具体工作过程和有益效果,在此不复赘述。
与上述方法对应的,本发明实施例还提供一种对象类别的检测装置,如图6所示,该装置包括:标记单元610、获取单元620、查找单元630和确定单元640;
标记单元610,用于根据接收的当前图片中待分类对象的位置信息,对所述待分类对象进行位置标记,得到所述待分类对象的标记位置,所述标记位置包括所述待分类对象的至少一个位置点;
获取单元620,用于根据所述待分类对象的标记位置,采用预设区域提取算法,获取所述待分类对象的至少一个特征区域,所述至少一个特征区域包括部分或完整的待分类对象信息;采用预设特征提取算法,获取所述至少一个特征区域中所述待分类对象的第二特征信息;
查找单元630,用于查找对象分类模型存储的至少一种对象的第一特征信息中与所述第二特征信息匹配的第一特征信息;
确定单元640,用于若查找到,则根据所述对象分类模型存储的所述至少一种对象的对象类别与相应对象的第一特征信息的对应关系,将所述匹配的第一特征信息对应的对象类别确定为所述待分类对象的对象类别。
在一个可选的实现中,查找单元630,具体用于采用预设相似度算法,得到所述第二特征信息与至少一种对象中每种对象的第一特征信息间的相似度;
若所述相似度不小于预设相似度阈值,则确定所述待分类对象与所述第一特征信息对应的对象匹配。
在一个可选的实现中,所述装置还包括存储单元650;
存储单元650,用于若查找不到与所述第二特征信息匹配的第一特征信息,则在所述对象分类模型中存储所述第二特征信息,以更新所述对象分类模型。
本发明上述实施例提供的对象类别的检测装置的各功能单元的功能,可以通过上述各方法步骤来实现,因此,本发明实施例提供的对象类别的检测装置中的各个单元的具体工作过程和有益效果,在此不复赘述。
本发明实施例还提供了一种电子设备,如图7所示,包括处理器710、通信接口720、存储器730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。
存储器730,用于存放计算机程序;
处理器710,用于执行存储器730上所存放的程序时,实现如下步骤:
按照对象类别信息,获取待检测图片中至少一种对象的对象类别;
根据所述至少一种对象中在所述待检测图片上的位置信息,对所述至少一种对象进行位置标记,得到所述至少一种对象的标记位置,所述标记位置包括对象的至少一个位置点;
根据所述至少一种对象的标记位置,采用预设区域提取算法,获取所述至少一种对象中每种对象的至少一个特征区域,所述至少一个特征区域包括部分或完整的对象信息;
根据所述至少一种对象的第一特征信息和相应对象的对象类别,训练对象分类模型,所述对象分类模型包括所述至少一种对象的对象类别与相应对象的第一特征信息的对应关系,所述至少一种对象的第一特征信息是采用预设特征提取算法,从所述每种对象的至少一个特征区域中提取的。
在一个可选的实现中,根据所述至少一种对象的标记位置,采用预设区域提取算法,获取所述至少一种对象中每种对象的至少一个特征区域,包括:
将所述至少一种对象中每种对象的标记位置为中心,采用预设区域提取算法,得到所述每种对象的至少一个特征区域。
或者,实现如下步骤:
根据接收的当前图片中待分类对象的位置信息,对所述待分类对象进行位置标记,得到所述待分类对象的标记位置,所述标记位置包括所述待分类对象的至少一个位置点;
根据所述待分类对象的标记位置,采用预设区域提取算法,获取所述待分类对象的至少一个特征区域,所述至少一个特征区域包括部分或完整的待分类对象信息;
采用预设特征提取算法,获取所述至少一个特征区域中所述待分类对象的第二特征信息;
查找对象分类模型存储的至少一种对象的第一特征信息中与所述第二特征信息匹配的第一特征信息;
若查找到,则根据所述对象分类模型存储的所述至少一种对象的对象类别与相应对象的第一特征信息的对应关系,将所述匹配的第一特征信息对应的对象类别确定为所述待分类对象的对象类别。
在一个可选的实现中,查找存储的至少一种对象的第一特征信息中与所述第二特征信息匹配的第一特征信息,包括:
采用预设相似度算法,得到所述第二特征信息与至少一种对象中每种对象的第一特征信息间的相似度;
若所述相似度不小于预设相似度阈值,则确定所述待分类对象与所述第一特征信息对应的对象匹配。
在一个可选的实现中,所述方法还包括:
若查找不到与所述第二特征信息匹配的第一特征信息,则在所述对象分类模型中存储所述第二特征信息,以更新所述对象分类模型。
上述提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
由于上述实施例中电子设备的各器件解决问题的实施方式以及有益效果可以参见图1和图4所示的实施例中的各步骤来实现,因此,本发明实施例提供的电子设备的具体工作过程和有益效果,在此不复赘述。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的训练方法和检测方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的训练方法和检测方法。
本领域内的技术人员应明白,本申请实施例中的实施例可提供为方法、系统、或计算机程序产品。因此,本申请实施例中可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例中可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例中是参照根据本申请实施例中实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。
显然,本领域的技术人员可以对本申请实施例中实施例进行各种改动和变型而不脱离本申请实施例中实施例的精神和范围。这样,倘若本申请实施例中实施例的这些修改和变型属于本申请实施例中权利要求及其等同技术的范围之内,则本申请实施例中也意图包含这些改动和变型在内。
Claims (12)
1.一种对象类别的训练方法,其特征在于,所述方法包括:
按照对象类别信息,获取待检测图片中至少一种对象的对象类别;
根据所述至少一种对象中在所述待检测图片上的位置信息,对所述至少一种对象进行位置标记,得到所述至少一种对象的标记位置,所述标记位置包括相应对象的至少一个位置点;
根据所述至少一种对象的标记位置,采用预设区域提取算法,获取所述至少一种对象中每种对象的至少一个特征区域,所述至少一个特征区域包括部分或完整的对象信息;
根据所述至少一种对象的第一特征信息和相应对象的对象类别,训练对象分类模型,所述对象分类模型包括所述至少一种对象的对象类别与相应对象的第一特征信息的对应关系,所述至少一种对象的第一特征信息是采用预设特征提取算法,从所述每种对象的至少一个特征区域中提取的。
2.如权利要求1所述的方法,其特征在于,根据所述至少一种对象的标记位置,采用预设区域提取算法,获取所述至少一种对象中每种对象的至少一个特征区域,包括:
将所述至少一种对象中每种对象的标记位置为中心,采用预设区域提取算法,得到所述每种对象的至少一个特征区域。
3.一种对象类别的检测方法,其特征在于,所述方法包括:
根据接收的当前图片中待分类对象的位置信息,对所述待分类对象进行位置标记,得到所述待分类对象的标记位置,所述标记位置包括所述待分类对象的至少一个位置点;
根据所述待分类对象的标记位置,采用预设区域提取算法,获取所述待分类对象的至少一个特征区域,所述至少一个特征区域包括部分或完整的待分类对象信息;
采用预设特征提取算法,获取所述至少一个特征区域中所述待分类对象的第二特征信息;
查找对象分类模型存储的至少一种对象的第一特征信息中与所述第二特征信息匹配的第一特征信息;
若查找到,则根据所述对象分类模型存储的所述至少一种对象的对象类别与相应对象的第一特征信息的对应关系,将所述匹配的第一特征信息对应的对象类别确定为所述待分类对象的对象类别。
4.如权利要求3所述的方法,其特征在于,查找存储的至少一种对象的第一特征信息中与所述第二特征信息匹配的第一特征信息,包括:
采用预设相似度算法,得到所述第二特征信息与至少一种对象中每种对象的第一特征信息间的相似度;
若所述相似度不小于预设相似度阈值,则确定所述待分类对象与所述第一特征信息对应的对象匹配。
5.如权利要求3所述的方法,其特征在于,所述方法还包括:
若查找不到与所述第二特征信息匹配的第一特征信息,则在所述对象分类模型中存储所述第二特征信息,以更新所述对象分类模型。
6.一种对象类别的训练装置,其特征在于,所述装置包括:获取单元、标记单元和训练单元;
所述获取单元,用于按照对象类别信息,获取待检测图片中至少一种对象的对象类别;
所述标记单元,用于根据所述至少一种对象中在所述待检测图片上的位置信息,对所述至少一种对象进行位置标记,得到所述至少一种对象的标记位置,所述标记位置包括对象的至少一个位置点;
所述获取单元,还用于根据所述至少一种对象的标记位置,采用预设区域提取算法,获取所述至少一种对象中每种对象的至少一个特征区域,所述至少一个特征区域包括部分或完整的对象信息;
所述训练单元,用于根据所述至少一种对象的第一特征信息和相应对象的对象类别,训练对象分类模型,所述对象分类模型包括所述至少一种对象的对象类别与相应对象的第一特征信息的对应关系,所述至少一种对象的第一特征信息是采用预设特征提取算法,从所述每种对象的至少一个特征区域中提取的。
7.如权利要求6所述的装置,其特征在于,
所述获取单元,具体用于将所述至少一种对象中每种对象的标记位置为中心,采用预设区域提取算法,得到所述每种对象的至少一个特征区域。
8.一种对象类别的检测装置,其特征在于,所述装置包括:标记单元、获取单元、查找单元和确定单元;
所述标记单元,用于根据接收的当前图片中待分类对象的位置信息,对所述待分类对象进行位置标记,得到所述待分类对象的标记位置,所述标记位置包括所述待分类对象的至少一个位置点;
所述获取单元,用于根据所述待分类对象的标记位置,采用预设区域提取算法,获取所述待分类对象的至少一个特征区域,所述至少一个特征区域包括部分或完整的待分类对象信息;
采用预设特征提取算法,获取所述至少一个特征区域中所述待分类对象的第二特征信息;
所述查找单元,用于查找对象分类模型存储的至少一种对象的第一特征信息中与所述第二特征信息匹配的第一特征信息;
所述确定单元,用于若查找到,则根据所述对象分类模型存储的所述至少一种对象的对象类别与相应对象的第一特征信息的对应关系,将所述匹配的第一特征信息对应的对象类别确定为所述待分类对象的对象类别。
9.如权利要求8所述的装置,其特征在于,所述查找单元,具体用于采用预设相似度算法,得到所述第二特征信息与至少一种对象中每种对象的第一特征信息间的相似度;
若所述相似度不小于预设相似度阈值,则确定所述待分类对象与所述第一特征信息对应的对象匹配。
10.如权利要求8所述的装置,其特征在于,所述装置还包括存储单元;
所述存储单元,用于若查找不到与所述第二特征信息匹配的第一特征信息,则在所述对象分类模型中存储所述第二特征信息,以更新所述对象分类模型。
11.一种电子设备,其特征在于,所述电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存储的程序时,实现权利要求1-2任一所述的方法步骤或权利要求3-5任一所述的方法步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-2任一所述的方法步骤或权利要求3-5任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910132553.5A CN109934214A (zh) | 2019-02-22 | 2019-02-22 | 一种对象类别的训练、检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910132553.5A CN109934214A (zh) | 2019-02-22 | 2019-02-22 | 一种对象类别的训练、检测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109934214A true CN109934214A (zh) | 2019-06-25 |
Family
ID=66985743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910132553.5A Pending CN109934214A (zh) | 2019-02-22 | 2019-02-22 | 一种对象类别的训练、检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109934214A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413820A (zh) * | 2019-07-12 | 2019-11-05 | 深兰科技(上海)有限公司 | 一种图片描述信息的获取方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101968884A (zh) * | 2009-07-28 | 2011-02-09 | 索尼株式会社 | 检测视频图像中的目标的方法和装置 |
CN103207870A (zh) * | 2012-01-17 | 2013-07-17 | 华为技术有限公司 | 一种照片分类管理方法、服务器、装置及系统 |
CN106529527A (zh) * | 2016-09-23 | 2017-03-22 | 北京市商汤科技开发有限公司 | 物体检测方法和装置、数据处理装置和电子设备 |
US20170124415A1 (en) * | 2015-11-04 | 2017-05-04 | Nec Laboratories America, Inc. | Subcategory-aware convolutional neural networks for object detection |
CN107247930A (zh) * | 2017-05-26 | 2017-10-13 | 西安电子科技大学 | 基于cnn和选择性注意机制的sar图像目标检测方法 |
CN108460389A (zh) * | 2017-02-20 | 2018-08-28 | 阿里巴巴集团控股有限公司 | 一种识别图像中对象的类型预测方法、装置及电子设备 |
CN108460427A (zh) * | 2018-03-29 | 2018-08-28 | 国信优易数据有限公司 | 一种分类模型训练方法、装置以及分类方法及装置 |
-
2019
- 2019-02-22 CN CN201910132553.5A patent/CN109934214A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101968884A (zh) * | 2009-07-28 | 2011-02-09 | 索尼株式会社 | 检测视频图像中的目标的方法和装置 |
CN103207870A (zh) * | 2012-01-17 | 2013-07-17 | 华为技术有限公司 | 一种照片分类管理方法、服务器、装置及系统 |
US20170124415A1 (en) * | 2015-11-04 | 2017-05-04 | Nec Laboratories America, Inc. | Subcategory-aware convolutional neural networks for object detection |
CN106529527A (zh) * | 2016-09-23 | 2017-03-22 | 北京市商汤科技开发有限公司 | 物体检测方法和装置、数据处理装置和电子设备 |
CN108460389A (zh) * | 2017-02-20 | 2018-08-28 | 阿里巴巴集团控股有限公司 | 一种识别图像中对象的类型预测方法、装置及电子设备 |
CN107247930A (zh) * | 2017-05-26 | 2017-10-13 | 西安电子科技大学 | 基于cnn和选择性注意机制的sar图像目标检测方法 |
CN108460427A (zh) * | 2018-03-29 | 2018-08-28 | 国信优易数据有限公司 | 一种分类模型训练方法、装置以及分类方法及装置 |
Non-Patent Citations (1)
Title |
---|
XINGYU ZENG ET AL: "Crafting GBD-Net for Object Detection", 《COMPUTER VISION AND PATTERN RECOGNITION》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413820A (zh) * | 2019-07-12 | 2019-11-05 | 深兰科技(上海)有限公司 | 一种图片描述信息的获取方法及装置 |
CN110413820B (zh) * | 2019-07-12 | 2022-03-29 | 深兰科技(上海)有限公司 | 一种图片描述信息的获取方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113379718B (zh) | 一种目标检测方法、装置、电子设备以及可读存储介质 | |
CN109446889A (zh) | 基于孪生匹配网络的物体追踪方法及装置 | |
CN112560862B (zh) | 文本识别方法、装置及电子设备 | |
CN113205041B (zh) | 结构化信息提取方法、装置、设备和存储介质 | |
CN114092963B (zh) | 关键点检测及模型训练方法、装置、设备和存储介质 | |
US20220301219A1 (en) | Methods, apparatuses, devices and storage medium for predicting correlation between objects | |
US20140247993A1 (en) | Landmark localization via visual search | |
US11756205B2 (en) | Methods, devices, apparatuses and storage media of detecting correlated objects involved in images | |
CN108182457A (zh) | 用于生成信息的方法和装置 | |
CN109726678A (zh) | 一种车牌识别的方法及相关装置 | |
AU2021203869A1 (en) | Methods, devices, electronic apparatuses and storage media of image processing | |
US20220300774A1 (en) | Methods, apparatuses, devices and storage media for detecting correlated objects involved in image | |
Hao et al. | [Retracted] Fast Recognition Method for Multiple Apple Targets in Complex Occlusion Environment Based on Improved YOLOv5 | |
CN109699003B (zh) | 位置确定方法及装置 | |
CN109934214A (zh) | 一种对象类别的训练、检测方法及装置 | |
CN104504692A (zh) | 基于区域对比度的图像中显著对象的提取方法 | |
Pham et al. | Deepaco: A robust deep learning-based automatic checkout system | |
CN113158710B (zh) | 一种视频分类的方法、装置、终端及存储介质 | |
CN113936158A (zh) | 一种标签匹配方法及装置 | |
CN113628272A (zh) | 室内定位方法、装置、电子设备及存储介质 | |
CN111753730A (zh) | 一种图像审查方法及装置 | |
CN117615363B (zh) | 基于信令数据分析目标车辆内人员的方法、装置、设备 | |
CN113221809B (zh) | 一种基于剪影图的运动状态识别方法、电子设备及介质 | |
WO2022195338A1 (en) | Methods, apparatuses, devices and storage media for detecting correlated objects involved in image | |
Wen | Graph Structure-based Salient Object Detection for Point Clouds |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190625 |