CN111461101A - 工服标志的识别方法、装置、设备及存储介质 - Google Patents
工服标志的识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111461101A CN111461101A CN202010310872.3A CN202010310872A CN111461101A CN 111461101 A CN111461101 A CN 111461101A CN 202010310872 A CN202010310872 A CN 202010310872A CN 111461101 A CN111461101 A CN 111461101A
- Authority
- CN
- China
- Prior art keywords
- information
- processing
- target
- mark
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及物流检测领域,公开了一种工服标志的识别方法、装置、设备及存储介质,用于提高对工服标志的识别准确度。工服标志的识别方法包括:获取待处理的原始图像数据,并对原始图像数据进行图像增强处理和尺寸大小转换处理,得到目标图像,原始图像数据为预置场景下的员工图像数据;通过预置的目标模型,对目标图像进行特征图提取处理和边界框生成处理,得到初始区域信息;对初始区域信息进行人像检测处理和区域分割处理,得到候选区域信息;通过目标模型,对候选区域信息进行卷积处理和锚框匹配处理,得到目标区域信息;根据预置的工服标志信息,对目标区域信息中的图像信息进行识别,得到工服标志识别结果。
Description
技术领域
本发明涉及物流检测领域,尤其涉及一种工服标志的识别方法、装置、设备及存储介质。
背景技术
在物流行业中,为了提升企业形象和展示企业文化内涵,对快递员的着装进行制服统一规范管理。目前,对于快递员工服的宣导和检查,是通过获取员工的着装视频数据,将着装视频数据发送到审核端,通过审核端接收对应的工服标志检测结果,以判断该快递员穿着工服。
在现有技术中,通过审核端获取着装视频数据的工服特征数据,存在表征能力有限的问题,使得对工服特征数据中工服标记特征的提取不充分,致使工服标记特征所融合的语义信息较少,导致对工服标志的识别准确度低。
发明内容
本发明的主要目的在于解决对工服标志的识别准确度低的问题。
本发明第一方面提供了一种工服标志的识别方法,包括:
获取待处理的原始图像数据,并对所述原始图像数据进行图像增强处理和尺寸大小转换处理,得到目标图像,所述原始图像数据为预置场景下的员工图像数据;
通过预置的目标模型,对所述目标图像进行特征图提取处理和边界框生成处理,得到初始区域信息;
对所述初始区域信息进行人像检测处理和区域分割处理,得到候选区域信息;
通过所述目标模型,对所述候选区域信息进行卷积处理和锚框匹配处理,得到目标区域信息;
根据预置的工服标志信息,对所述目标区域信息中的图像信息进行识别,得到工服标志识别结果。
可选的,在本发明第一方面的第一种实现方式中,所述通过预置的目标模型,对所述目标图像进行特征图提取处理和边界框生成处理,得到初始区域信息,包括:
调用预置的目标模型,所述目标模型包括单镜头多盒检测器网络,所述单镜头多盒检测器网络包括超分辨率测试序列算法和确定性网络;
通过所述超分辨率测试序列算法,提取所述目标图像的特征图,得到初始特征图;
对所述初始特征图进行注意力机制处理,得到注意力融合特征图;
通过所述确定性网络对所述注意力融合特征图进行多层级的运算处理,得到多个尺度的特征图;
基于所述多个尺度的特征图生成所述目标图像的边界框,得到初始区域信息,所述初始区域信息包括边界框内的目标图像信息。
可选的,在本发明第一方面的第二种实现方式中,所述对所述初始区域信息进行人像检测处理和区域分割处理,得到候选区域信息,包括:
对所述初始区域信息进行图像灰度化处理、图像滤波处理、降噪处理和边缘检测,得到图像轮廓信息;
对所述图像轮廓信息进行人像轮廓识别并进行人体工服着装部位检测,得到工服着装区域;
按照预置的工服划分区域对所述工服着装区域进行边界框标记,得到候选区域信息,所述候选区域信息包括边界框标记的工服着装图像信息。
可选的,在本发明第一方面的第三种实现方式中,所述通过所述目标识别模型,对所述候选区域信息进行卷积处理和锚框匹配处理,得到目标区域信息,包括:
通过所述目标模型中的移动端神经网络,对所述候选区域信息进行多层级滤波处理和融合处理,得到待处理区域信息;
根据预置的工服标志锚框和匹配算法,对所述待处理区域信息进行预测和分类,得到目标区域信息。
可选的,在本发明第一方面的第四种实现方式中,所述根据预置的工服标志信息,对所述目标区域信息中的图像信息进行识别,得到工服标志识别结果,包括:
获取预置的工服标志信息对应的工服标志特征矩阵向量,以及所述目标区域信息中图像信息对应的图像特征矩阵向量;
通过预置相似度计算算法计算所述图像特征矩阵向量与所述工服标志特征矩阵向量之间的相似度,得到多个相似度值;
判断所述多个相似度值是否均大于预设阈值;
若所述多个相似度值均大于预设阈值,则判定所述目标区域信息对应的图像为工服标志,得到工服标志识别结果。
可选的,在本发明第一方面的第五种实现方式中,所述获取待处理的原始图像数据之前,所述工服标志的识别方法还包括:
获取工服标记的标注样本文件集,并对所述标注样本文件集进行数据格式转换和分类,得到工服标志训练集和工服标志测试集;
通过预置的单镜头多盒检测器网络,对所述工服标志训练集进行特征图提取处理、边界框生成处理、卷积处理和锚框匹配处理,得到单镜头多盒检测器识别模型;
通过所述单镜头多盒检测器识别模型,对所述工服标志测试集进行运算处理,得到测试结果;
根据预置损失函数和所述测试结果,对所述单镜头多盒检测器识别模型的权重值进行迭代调整,得到预置的目标模型。
可选的,在本发明第一方面的第六种实现方式中,所述根据预置的工服标志信息,对所述目标区域信息中的图像信息进行识别,得到工服标志识别结果之后,所述工服标志的识别方法还包括:
对所述工服标志识别结果进行筛选,得到目标信息,所述目标信息包括所述目标区域信息中的图像信息不是工服标志的信息,以及所述目标区域信息对应的原始图像数据;
将所述目标信息发送至预置的检查客户端,并接收所述检查客户端返回的检查结果;
根据所述检查结果对所述目标信息进行更新。
本发明第二方面提供了一种工服标志的识别装置,包括:
转换处理模块,用于获取待处理的原始图像数据,并对所述原始图像数据进行图像增强处理和尺寸大小转换处理,得到目标图像,所述原始图像数据为预置场景下的员工图像数据;
提取生成模块,用于通过预置的目标模型,对所述目标图像进行特征图提取处理和边界框生成处理,得到初始区域信息;
检测分割模块,用于对所述初始区域信息进行人像检测处理和区域分割处理,得到候选区域信息;
卷积匹配模块,用于通过所述目标模型,对所述候选区域信息进行卷积处理和锚框匹配处理,得到目标区域信息;
识别模块,用于根据预置的工服标志信息,对所述目标区域信息中的图像信息进行识别,得到工服标志识别结果。
可选的,在本发明第二方面的第一种实现方式中,所述提取生成模块具体用于:
调用预置的目标模型,所述目标模型包括单镜头多盒检测器网络,所述单镜头多盒检测器网络包括超分辨率测试序列算法和确定性网络;
通过所述超分辨率测试序列算法,提取所述目标图像的特征图,得到初始特征图;
对所述初始特征图进行注意力机制处理,得到注意力融合特征图;
通过所述确定性网络对所述注意力融合特征图进行多层级的运算处理,得到多个尺度的特征图;
基于所述多个尺度的特征图生成所述目标图像的边界框,得到初始区域信息,所述初始区域信息包括边界框内的目标图像信息。
可选的,在本发明第二方面的第二种实现方式中,所述检测分割模块具体用于:
对所述初始区域信息进行图像灰度化处理、图像滤波处理、降噪处理和边缘检测,得到图像轮廓信息;
对所述图像轮廓信息进行人像轮廓识别并进行人体工服着装部位检测,得到工服着装区域;
按照预置的工服划分区域对所述工服着装区域进行边界框标记,得到候选区域信息,所述候选区域信息包括边界框标记的工服着装图像信息。
可选的,在本发明第二方面的第三种实现方式中,所述卷积匹配模块具体用于:
通过所述目标模型中的移动端神经网络,对所述候选区域信息进行多层级滤波处理和融合处理,得到待处理区域信息;
根据预置的工服标志锚框和匹配算法,对所述待处理区域信息进行预测和分类,得到目标区域信息。
可选的,在本发明第二方面的第四种实现方式中,所述识别模块包括:
获取预置的工服标志信息对应的工服标志特征矩阵向量,以及所述目标区域信息中图像信息对应的图像特征矩阵向量;
通过预置相似度计算算法计算所述图像特征矩阵向量与所述工服标志特征矩阵向量之间的相似度,得到多个相似度值;
判断所述多个相似度值是否均大于预设阈值;
若所述多个相似度值均大于预设阈值,则判定所述目标区域信息对应的图像为工服标志,得到工服标志识别结果。
可选的,在本发明第二方面的第五种实现方式中,所述工服标志的识别装置,还包括:
格式转换模块,用于获取工服标记的标注样本文件集,并对所述标注样本文件集进行数据格式转换和分类,得到工服标志训练集和工服标志测试集;
训练模块,用于通过预置的单镜头多盒检测器网络,对所述工服标志训练集进行特征图提取处理、边界框生成处理、卷积处理和锚框匹配处理,得到单镜头多盒检测器识别模型;
运算处理模块,用于通过所述单镜头多盒检测器识别模型,对所述工服标志测试集进行运算处理,得到测试结果;
迭代调整模块,用于根据预置损失函数和所述测试结果,对所述单镜头多盒检测器识别模型的权重值进行迭代调整,得到预置的目标模型。
可选的,在本发明第二方面的第六种实现方式中,所述工服标志的识别装置,还包括:
筛选模块,用于对所述工服标志识别结果进行筛选,得到目标信息,所述目标信息包括所述目标区域信息中的图像信息不是工服标志的信息,以及所述目标区域信息对应的原始图像数据;
发送接收模块,用于将所述目标信息发送至预置的检查客户端,并接收所述检查客户端返回的检查结果;
更新模块,用于根据所述检查结果对所述目标信息进行更新。
本发明第三方面提供了一种工服标志的识别设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述工服标志的识别设备执行上述的工服标志的识别方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的工服标志的识别方法。
本发明提供的技术方案中,获取待处理的原始图像数据,并对原始图像数据进行图像增强处理和尺寸大小转换处理,得到目标图像,原始图像数据为预置场景下的员工图像数据;通过预置的目标模型,对目标图像进行特征图提取处理和边界框生成处理,得到初始区域信息;对初始区域信息进行人像检测处理和区域分割处理,得到候选区域信息;通过目标模型,对候选区域信息进行卷积处理和锚框匹配处理,得到目标区域信息;根据预置的工服标志信息,对目标区域信息中的图像信息进行识别,得到工服标志识别结果。本发明中,通过将原始图像数据进行图像增强处理和尺寸大小转换,以便于对小目标区域的识别,通过初始区域信息、候选区域信息和目标区域信息的多层检测筛选,提高对小目标的区域信息提取的准确性,以及增强目标区域信息对应的特征图所融合的语义信息,从而,提高了对工服标志的识别准确度。
附图说明
图1为本发明实施例中工服标志的识别方法的一个实施例示意图;
图2为本发明实施例中工服标志的识别方法的另一个实施例示意图;
图3为本发明实施例中工服标志的识别装置的一个实施例示意图;
图4为本发明实施例中工服标志的识别装置的另一个实施例示意图;
图5为本发明实施例中工服标志的识别设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种工服标志的识别方法、装置、设备及存储介质,提高对工服标志的识别准确度。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中工服标志的识别方法的一个实施例包括:
101、获取待处理的原始图像数据,并对原始图像数据进行图像增强处理和尺寸大小转换处理,得到目标图像,原始图像数据为预置场景下的员工图像数据。
可以理解的是,本发明的执行主体可以为工服标志的识别装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
连接局域网的监控摄像头采集预置场景下的员工视频数据,并将该员工视频数据存储在DVR磁盘录像机上。当预置的监控平台(decision support system,DSS)监测到有员工视频数据存储在DVR磁盘录像机上时,监控平台从DVR磁盘录像机上提取该员工视频数据,并按照预置的定时机制每隔设定的预设时段启动截图功能,对员工视频数据进行截图得到待处理的原始图像数据,并将该原始图像数据发送至服务器,服务器接收该原始图像数据,以实现原始图像数据的获取。
其中,预置场景可为办公区域场景(包括但不限于仓库、办公室和特定的上下班打卡区域)。图像增强处理可包括对比度增强处理和非线性灰度变换处理,以便于后续对原始图像数据的分析处理。尺寸大小转换处理可为将原始图像数据的尺寸大小扩大为预设的尺寸大小,以便于后续对小目标(工服标志)的区域提取和识别。
102、通过预置的目标模型,对目标图像进行特征图提取处理和边界框生成处理,得到初始区域信息。
目标模型可为单镜头多盒检测器网络(single shot multibox detector,SSD)。服务器获得目标图像后,可调用预置的目标模型,通过该目标模型中超分辨率测试序列网络(oxford visual geometry group,VGG)和经过卷积通道剪枝后的残差网络resnet,对目标图像进行卷积池化处理(特征图提取处理)和边界框生成处理。其中,该经过卷积通道剪枝后的残差网络resnet为在现有的残差网络网络结构基础上进行卷积通道剪枝后所得,具体为输入层与一个采样层连接,并对批量标准化层(batch normalization,BN)加入Gamma系数的L1正则约束项,以实现BN层的稀疏化。通过卷积通道剪枝后的残差网络resnet,在保证精度的基础上,提高处理的速度。
服务器通过预置的目标模型,对目标图像进行特征图提取处理,得到的六个阶段的六个不同尺度的特征图后,将第一阶段的特征图和第六个阶段的特征图进行注意力融合,得到最终的特征图,例如:得到的六个阶段的六个不同尺度的特征图为A、B、C、D、E和F,对应的阶段分别为第一阶段、第二阶段、第三阶段、第四阶段、第五阶段和第六阶段,第一阶段为最低级,第六阶段为最高级,通过预置的注意力机制对A和F进行注意力编解码后再进行融合,以融合更多的语义信息,从而为后续提高对特征图上小目标的预测准确性奠定基础。
需要说明的是,服务器在对初始特征图(经过特征图提取处理所得的特征图)进行边界框生成处理后所得的目标特征图,将目标特征图进行最大池化处理和卷积处理,以扩大目标特征图的尺寸大小,从而便于后续对工服标志的区域读取,例如:将目标特征图的尺寸大小控制为46*46*384。
103、对初始区域信息进行人像检测处理和区域分割处理,得到候选区域信息。
服务器对初始区域信息进行人像检测处理的方式,可以为:通过预置的人体关键点检测算法对初始区域信息进行检测,以判断初始区域信息对应的图像信息中是否存在人像,若存在人像,则进一步检测人像的人体关键点连接的完整性,将人体关键点连接不完整的人像进行标记和剔除,得到人体关键点连接完整的初始区域信息,以提高人像检测所得的区域信息的准确性,例如:初始区域信息分别为G1和G2,服务器通过预置的人体关键点检测算法对G1和G2进行检测,得到G2中存在人像,检测G2中人体关键点连接的完整性,得到G2中存在一个完整的人体关键点连接和一个只有头部关键点连接的人体关键点连接,即说明G2中有两个人像甲和乙,甲头部以下的身体图像和乙的身体图像重叠了,对甲进行标记,并对甲对应的图像区域进行截取,只剩下乙对应的图像区域(即人体关键点连接完整的初始区域信息)。
服务器获得人体关键点连接完整的初始区域信息之后,根据预置的工服颜色特征和形状特征,对人体关键点连接完整的初始区域信息进行识别,获得对应的工服区域,再结合预置的工服标记位置和着装的人体关键点生成工服区域上对应位置的边界框,以提高对工服标记等小目标的获取和识别准确度,例如:人体关键点连接完整的初始区域信息为G3、G4、G5和G6,预置的工服颜色特征为黄色,形状特征为马甲形状,经过检测识别得到G4和G6为对应的工服区域,则根据工服标记在工服靠近左胸的位置上,对工服区域进行边界框标记,得到包含对应的边界框的图像信息(即对应的工服区域)。
服务器进行区域分割处理的方式可以为:生成工服区域上对应位置的边界框之后,对工服区域的图像数据进行图像灰度化处理和边缘检测处理,根据边缘轮廓对对应的工服区域的图像数据进行边界框标记,得到候选区域信息,提高候选区域信息获取的准确性,例如:对应的工服区域为G7,对G7进行图像灰度化处理、边缘检测处理和边界框标记,得到H1、H2和H3三个边界框区域(即候选区域信息),H1、H2和H3分别为H2上面的空白区域、文字与工服标记的区域以及H2下面的空白区域。
104、通过目标模型,对候选区域信息进行卷积处理和锚框匹配处理,得到目标区域信息。
其中,目标区域信息为锚框匹配处理后锚框内对应的图像信息。服务器获得候选区域信息后,通过目标模型中经过卷积通道剪枝后或经过调整卷积核大小或减少层级的残差网络resnet,对候选区域信息进行多次的非线性变换处理(卷积和池化处理)得到生成待匹配边界框的待匹配特征图,其中,该卷积核大小和池化核大小可均为1*1。计算预置的工服标记锚框与待匹配特征图上的每个待匹配边界框之间的交并比值,将交并比值大于目标阈值的待匹配边界框作为目标区域信息,其中,目标区域信息包括标记有边界框的图像数据对应的特征信息。
服务器进行锚框匹配处理的方式可以为:结合交并比值和属于每个类别的概率值对待匹配边界框进行分析,得到目标区域信息,提高目标区域信息的准确性,例如:待匹配边界框为B1、B2和B3,预置的锚框为C1,将C1映射到候选区域信息对应的图像上,得到对应的锚框区域M1,计算M1分别与B1、B2和B3之间的交并比值D1、D2和D3,计算M1分别在B1、B2和B3上属于工服标记类别的感受野权重B11、B21和B31,并通过B11、B21和B31和M1的分类结果分别计算出M1属于工服标记类别的概率值N1、N2和N3,D2和D3大于阈值Y1,N3大于阈值Y2,则B3对应的图像信息为目标区域信息,或者,若D1与N1的算术均值或加权均值大于阈值Y3,则B1对应的区域信息为目标区域信息,对于D2与N2以及D3与N3,同理可得。
105、根据预置的工服标志信息,对目标区域信息中的图像信息进行识别,得到工服标志识别结果。
其中,工服标志分析识别结果包括目标区域信息对应的原始图像数据和分析结果,服务器通过计算预置的工服标志信息与目标区域信息之间的相似度,根据相似度对目标区域信息中的图像信息进行识别,例如:目标区域信息为Q1,预置的工服标志信息为Q2,计算Q1和Q2之间的相似度Q3,判断Q3是否大于预设的阈值,若大于或等于,则判定目标区域信息对应的图像为工服标记,若小于,则判定目标区域信息对应的图像不为工服标记。
服务器在得到工服标记识别结果中的分析结果为目标区域信息对应的图像不为工服标记后,对该图像进行人脸识别和信息匹配,得到对应的员工信息,提高其信息的多角度性和有效性,例如:目标区域信息F1对应的图像不为工服标记,则获取F1对应的人像信息,对人像信息进行人脸识别处理,获得对应的人脸信息,根据该人脸信息从预置的数据库中匹配对应的员工信息。将该员工信息链接到对应的工服标志识别结果,将链接员工信息的工服标志识别结果发送到预置存储空间,并渲染至预置的显示页面。
本发明实施例中,通过将原始图像数据进行图像增强处理和尺寸大小转换,以便于对小目标区域的识别,通过初始区域信息、候选区域信息和目标区域信息的多层检测筛选,提高对小目标的区域信息提取的准确性,以及增强目标区域信息对应的特征图所融合的语义信息,从而,提高了对工服标志的识别准确度。
请参阅图2,本发明实施例中工服标志的识别方法的另一个实施例包括:
201、获取待处理的原始图像数据,并对原始图像数据进行图像增强处理和尺寸大小转换处理,得到目标图像,原始图像数据为预置场景下的员工图像数据。
具体地,服务器获取待处理的原始图像数据之前,获取工服标记的标注样本文件集,并对标注样本文件集进行数据格式转换和分类,得到工服标志训练集和工服标志测试集;通过预置的单镜头多盒检测器网络,对工服标志训练集进行特征图提取处理、边界框生成处理、卷积处理和锚框匹配处理,得到单镜头多盒检测器识别模型;通过单镜头多盒检测器识别模型,对工服标志测试集进行运算处理,得到测试结果;根据预置损失函数和测试结果,对单镜头多盒检测器识别模型的权重值进行迭代调整,得到预置的目标模型。
其中,工服标记的标注样本文件集为预置员工工服样本中的工服标志进行标注后所生成的可扩展标记语言文本文件。服务器通过将标注样本文件集转换为用于存放电子表格或数据的文件格式(comma separate values,CSV)格式文件,根据CSV格式文件基于数据流图的处理框架TensorFlow训练文件(即工服标志训练集和工服标志测试集),按照预设比例将TensorFlow训练文件分为工服标志训练集和工服标志测试集。CSV格式文件中每一个对象object标签代表一个标注框,都会在csv文件中生成一条数据,每条数据包括属性,例如:图片文件名,宽度,高度,类别,框的左上角x值,框的左上角y值,框的右上角x值,框的右上角y值。
需要说明的是,服务器在根据预置损失函数和测试结果,对单镜头多盒检测器识别模型的权重值进行迭代调整之前,可对单镜头多盒检测器网络进行调整,以减少其训练时间和提高目标模型的精度,例如:将单镜头多盒检测器网络中的主网络框架VGG替换为Mobile Net;或者,对单镜头多盒检测器网络中的特征金字塔网络(feature pyramidnetworks,FPN)添加转换器;或者,对单镜头多盒检测器网络中的主网络框架中的VGG网络和Resnet网络进行通道数裁剪。
202、通过预置的目标模型,对目标图像进行特征图提取处理和边界框生成处理,得到初始区域信息。
具体地,服务器调用预置的目标模型,目标模型包括单镜头多盒检测器网络,单镜头多盒检测器网络包括超分辨率测试序列算法和确定性网络;通过超分辨率测试序列算法,提取目标图像的特征图,得到初始特征图;对初始特征图进行注意力机制处理,得到注意力融合特征图;通过确定性网络对注意力融合特征图进行多层级的运算处理,得到多个尺度的特征图;基于多个尺度的特征图生成目标图像的边界框,得到初始区域信息,初始区域信息包括边界框内的目标图像信息。
服务器通过结合超分辨率测试序列算法VGG和确定性网络DetNet对目标图像进行特征图提取处理,以结合确定性网络对于深层网络的分辨率较大的性能,提高特征图提取处理的精度。
需要说明的是,服务器可通过将初始特征图进行注意力值与矩阵向量的融合,得到注意力融合特征图,以使注意力融合特征图能融合更多的语义信息,例如:计算初始特征图W的注意力值,将注意力值与初始特征图对应的矩阵向量K相乘,得到注意力融合特征图W*K;或者,服务器可将初始特征图进行注意力值与矩阵向量的融合后再与初始特征图进行融合,得到注意力融合特征图,以使注意力融合特征图能融合更多的语义信息,例如:计算初始特征图W的注意力值,将注意力值与初始特征图对应的矩阵向量K相乘,得到W*K,再将W*K与W相加或相乘,得到注意力融合特征图。
203、对初始区域信息进行人像检测处理和区域分割处理,得到候选区域信息。
具体地,服务器对初始区域信息进行图像灰度化处理、图像滤波处理、降噪处理和边缘检测,得到图像轮廓信息;对图像轮廓信息进行人像轮廓识别并进行人体工服着装部位检测,得到工服着装区域;按照预置的工服划分区域对工服着装区域进行边界框标记,得到候选区域信息,候选区域信息包括边界框标记的工服着装图像信息。
例如:服务器对初始区域信息进行图像灰度化处理、图像滤波处理、降噪处理和边缘检测,得到图像轮廓信息甲和乙,进行人像轮廓识别之后,得到甲为人像,乙为货物,根据上半身的人体工服着装部位以及工服的形状对甲进行检测,得到工服着装区域甲1,预置的工服划分区域为区域1和区域2,区域1为有文字和工服标记的区域(一个边界框标注,内框),区域2为整个工服的区域(一个边界框标注,外框),则生成甲1的两个边界框,一个内框1(相对人体,为对应左胸腔的位置),一个外框1,内框1和外框1对应的工服着装图像信息就是候选区域信息。以此操作,提高对小目标的边框标记,从而提高对小目标的识别。
204、通过目标模型,对候选区域信息进行卷积处理和锚框匹配处理,得到目标区域信息。
具体地,服务器通过目标模型中的移动端神经网络,对候选区域信息进行多层级滤波处理和融合处理,得到待处理区域信息;根据预置的工服标志锚框和匹配算法,对待处理区域信息进行预测和分类,得到目标区域信息。
服务器获得候选区域信息后,对候选区域信息的图像进行检测和分类,得到大物体图像的区域信息和小物体图像的区域信息,通过目标模型中的移动端神经网络MobileNet对大物体图像的区域信息和小物体图像的区域信息进行对应的处理,得到待处理区域信息,以提高对小目标信息的识别,以及丰富其语义信息,例如:服务器得到大物体图像的区域信息1和小物体图像的区域信息2,使用浅层网络(有位置信息)和深层网络(有语义信息)对区域信息2进行多层级滤波处理和融合处理,使用深层网络对区域信息1进行多层级滤波处理和融合处理,从而得到待处理区域信息。
需要说明的是,服务器可通过匹配算法giou计算预置的工服标志锚框与待处理区域信息之间的giou值,根据该giou值判断待处理区域信息中的边界框是否为所需的目标框(疑似工服标志的边界框),从而得到目标区域信息。
205、根据预置的工服标志信息,对目标区域信息中的图像信息进行识别,得到工服标志识别结果。
具体地,服务器获取预置的工服标志信息对应的工服标志特征矩阵向量,以及目标区域信息中图像信息对应的图像特征矩阵向量;通过预置相似度计算算法计算图像特征矩阵向量与工服标志特征矩阵向量之间的相似度,得到多个相似度值;判断多个相似度值是否均大于预设阈值;若多个相似度值均大于预设阈值,则判定目标区域信息对应的图像为工服标志,得到工服标志识别结果。
多个相似度值可以为服务器通过一种相似度计算算法计算不同类型的特征向量之间的相似度所得的多个值,例如:图像特征矩阵向量包括图像的颜色特征向量1和形状特征向量1,工服标志特征矩阵向量包括工服标记的颜色特征向量2和形状特征向量2,服务器通过余弦相似度算法计算颜色特征向量1和颜色特征向量2之间的相似度,得到相似度值1,以及计算形状特征向量1和形状特征向量2之间的相似度,得到相似度值2。
多个相似度值也可以为服务器通过多种相似度计算算法计算综合类型的特征向量之间的相似度所得的多个值,通过综合多种算法,提高相似度值判断的准确性,例如:图像特征矩阵向量中融合了图像的颜色特征向量和形状特征,工服标志特征矩阵向量融合了工服标记的颜色特征向量和形状特征,服务器通过欧几里得距离算法计算图像特征矩阵向量与工服标志特征矩阵向量之间的相似度,得到相似度值3,通过曼哈顿距离算法计算图像特征矩阵向量与工服标志特征矩阵向量之间的相似度,得到相似度值4,通过余弦相似度算法计算图像特征矩阵向量与工服标志特征矩阵向量之间的相似度,得到相似度值5。
多个相似度值也可以为部分相似度值为同一种相似度计算算法计算所得,另一部分为多个相似度计算算法计算所得,例如:多个相似度值分别为V1、V2、V3、V4、V5和V6,V1、V2和V3为通过余弦相似度算法计算图像特征矩阵向量与工服标志特征矩阵向量之间的相似度所得,V4为通过曼哈顿距离算法计算图像特征矩阵向量与工服标志特征矩阵向量之间的相似度所得,V5为通过欧几里得距离算法计算图像特征矩阵向量与工服标志特征矩阵向量之间的相似度所得,V6为通过皮尔森相关系数算法计算图像特征矩阵向量与工服标志特征矩阵向量之间的相似度所得。
206、对工服标志识别结果进行筛选,得到目标信息,目标信息包括目标区域信息中的图像信息不是工服标志的信息,以及目标区域信息对应的原始图像数据。
服务器对工服标志识别结果进行判断,判断其目标区域信息中的图像是否为工服标志,若是,则将对应的目标区域信息确定为工服标记图像信息,并获取对应的员工信息,判定该员工着装工服,创建工服标志图像信息和对应的员工信息之间的对应关系,将其对应关系存储至预置的着装工服哈希表中;若不是,则将判定结果、目标区域信息和目标区域信息对应的原始图像数据确定为目标信息。其中,服务器可通过对目标区域信息对应的人像进行人脸识别,并根据人脸识别所得的信息从预置数据库中进行检索,从而获得对应的员工信息。
207、将目标信息发送至预置的检查客户端,并接收检查客户端返回的检查结果。
服务器将目标信息发送至预置的检查客户端,可以为:获取检查客户端对应的检查优先级,将目标信息发送至预置的检查客户端后根据检查优先级进行处理,其中,检查客户端可包括除了目标模型之前的其他神经卷积网络识别模型和检查者对应的检查平台,例如:检查优先级为:最优先-其他神经卷积网络识别模型和次优先-检查者,即服务器先将目标信息发送至其他神经卷积网络识别模型,通过其他神经卷积网络识别模型对目标信息进行识别,得到识别结果,再将识别结果和目标信息发送到检查者对应的检查平台,由检查者对识别结果和目标信息进行核对和修正,并将核对和修正后的识别结果和目标信息输入检查客户端中,由检查客户端将核对和修正后的识别结果和目标信息发送至服务器。
服务器将目标信息发送至预置的检查客户端,也可以为:获取检查客户端对应的检查层级和更正者,根据检查层级将目标信息发送至更正者对应的检查客户端,例如:更正者为T1、T2和T3,先将目标信息分别发送至T1对应的检查客户端1和T2对应的检查客户端2,由检查客户端1接收T1输入的更正结果1,由检查客户端2接收T2输入的更正结果2,计算更正结果1和更正结果2的相似度值,并判断该相似度值是否小于目标阈值,若是,则将目标信息发送至T3对应的检查客户端3,由检查客户端2接收T2输入的更正结果3,并将更正结果3发送至服务器;若不是,则将更正结果1和更正结果2合并后,发送至服务器。
208、根据检查结果对目标信息进行更新。
服务器判断检查结果是否与工服标志识别结果不一样,若是,则不对工服标志识别结果进行处理,或者将目标信息存储至预置数据库;若不是,则将目标信息中的工服标志识别结果替换为检查结果。通过结合检查客户端对应的其他识别模型的识别结果和人工检查结果对目标信息进行修正更新,以提高工服标志的识别准确度。
需要说明的是,服务器可将工服标记图像信息和经过更新后的目标信息输入至目标模型,通过预置的优化算法对目标模型进行优化,得到优化后的目标模型,以提高目标模型对工服标志的识别准确度。
本发明实施例中,通过将原始图像数据进行图像增强处理和尺寸大小转换,以便于对小目标区域的识别,通过初始区域信息、候选区域信息和目标区域信息的多层检测筛选,提高对小目标的区域信息提取的准确性,以及增强目标区域信息对应的特征图所融合的语义信息,通过结合检查客户端对应的其他识别模型的识别结果和人工检查结果对目标信息进行修正更新,从而,提高了对工服标志的识别准确度。
上面对本发明实施例中工服标志的识别方法进行了描述,下面对本发明实施例中工服标志的识别装置进行描述,请参阅图3,本发明实施例中工服标志的识别装置一个实施例包括:
转换处理模块301,用于获取待处理的原始图像数据,并对原始图像数据进行图像增强处理和尺寸大小转换处理,得到目标图像,原始图像数据为预置场景下的员工图像数据;
提取生成模块302,用于通过预置的目标模型,对目标图像进行特征图提取处理和边界框生成处理,得到初始区域信息;
检测分割模块303,用于对初始区域信息进行人像检测处理和区域分割处理,得到候选区域信息;
卷积匹配模块304,用于通过目标模型,对候选区域信息进行卷积处理和锚框匹配处理,得到目标区域信息;
识别模块305,用于根据预置的工服标志信息,对目标区域信息中的图像信息进行识别,得到工服标志识别结果。
上述工服标志的识别装置中各个模块的功能实现与上述工服标志的识别方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明实施例中,通过将原始图像数据进行图像增强处理和尺寸大小转换,以便于对小目标区域的识别,通过初始区域信息、候选区域信息和目标区域信息的多层检测筛选,提高对小目标的区域信息提取的准确性,以及增强目标区域信息对应的特征图所融合的语义信息,从而,提高了对工服标志的识别准确度。
请参阅图4,本发明实施例中工服标志的识别装置的另一个实施例包括:
转换处理模块301,用于获取待处理的原始图像数据,并对原始图像数据进行图像增强处理和尺寸大小转换处理,得到目标图像,原始图像数据为预置场景下的员工图像数据;
提取生成模块302,用于通过预置的目标模型,对目标图像进行特征图提取处理和边界框生成处理,得到初始区域信息;
检测分割模块303,用于对初始区域信息进行人像检测处理和区域分割处理,得到候选区域信息;
卷积匹配模块304,用于通过目标模型,对候选区域信息进行卷积处理和锚框匹配处理,得到目标区域信息;
识别模块305,用于根据预置的工服标志信息,对目标区域信息中的图像信息进行识别,得到工服标志识别结果;
筛选模块306,用于对工服标志识别结果进行筛选,得到目标信息,目标信息包括目标区域信息中的图像信息不是工服标志的信息,以及目标区域信息对应的原始图像数据;
发送接收模块307,用于将目标信息发送至预置的检查客户端,并接收检查客户端返回的检查结果;
更新模块308,用于根据检查结果对目标信息进行更新。
可选的,提取生成模块302还可以具体用于:
调用预置的目标模型,目标模型包括单镜头多盒检测器网络,单镜头多盒检测器网络包括超分辨率测试序列算法和确定性网络;
通过超分辨率测试序列算法,提取目标图像的特征图,得到初始特征图;
对初始特征图进行注意力机制处理,得到注意力融合特征图;
通过确定性网络对注意力融合特征图进行多层级的运算处理,得到多个尺度的特征图;
基于多个尺度的特征图生成目标图像的边界框,得到初始区域信息,初始区域信息包括边界框内的目标图像信息。
可选的,检测分割模块303还可以具体用于:
对初始区域信息进行图像灰度化处理、图像滤波处理、降噪处理和边缘检测,得到图像轮廓信息;
对图像轮廓信息进行人像轮廓识别并进行人体工服着装部位检测,得到工服着装区域;
按照预置的工服划分区域对工服着装区域进行边界框标记,得到候选区域信息,候选区域信息包括边界框标记的工服着装图像信息。
可选的,卷积匹配模块304还可以具体用于:
通过目标模型中的移动端神经网络,对候选区域信息进行多层级滤波处理和融合处理,得到待处理区域信息;
根据预置的工服标志锚框和匹配算法,对待处理区域信息进行预测和分类,得到目标区域信息。
可选的,识别模块305还可以具体用于:
获取预置的工服标志信息对应的工服标志特征矩阵向量,以及目标区域信息中图像信息对应的图像特征矩阵向量;
通过预置相似度计算算法计算图像特征矩阵向量与工服标志特征矩阵向量之间的相似度,得到多个相似度值;
判断多个相似度值是否均大于预设阈值;
若多个相似度值均大于预设阈值,则判定目标区域信息对应的图像为工服标志,得到工服标志识别结果。
可选的,工服标志的识别装置,还包括:
格式转换模块309,用于获取工服标记的标注样本文件集,并对标注样本文件集进行数据格式转换和分类,得到工服标志训练集和工服标志测试集;
训练模块310,用于通过预置的单镜头多盒检测器网络,对工服标志训练集进行特征图提取处理、边界框生成处理、卷积处理和锚框匹配处理,得到单镜头多盒检测器识别模型;
运算处理模块311,用于通过单镜头多盒检测器识别模型,对工服标志测试集进行运算处理,得到测试结果;
迭代调整模块312,用于根据预置损失函数和测试结果,对单镜头多盒检测器识别模型的权重值进行迭代调整,得到预置的目标模型。
上述工服标志的识别装置中各模块和各单元的功能实现与上述工服标志的识别方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明实施例中,通过将原始图像数据进行图像增强处理和尺寸大小转换,以便于对小目标区域的识别,通过初始区域信息、候选区域信息和目标区域信息的多层检测筛选,提高对小目标的区域信息提取的准确性,以及增强目标区域信息对应的特征图所融合的语义信息,通过结合检查客户端对应的其他识别模型的识别结果和人工检查结果对目标信息进行修正更新,从而,提高了对工服标志的识别准确度。
上面图3和图4从模块化功能实体的角度对本发明实施例中的工服标志的识别装置进行详细描述,下面从硬件处理的角度对本发明实施例中工服标志的识别设备进行详细描述。
图5是本发明实施例提供的一种工服标志的识别设备的结构示意图,该工服标志的识别设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对工服标志的识别设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在工服标志的识别设备500上执行存储介质530中的一系列指令操作。
工服标志的识别设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的工服标志的识别设备结构并不构成对工服标志的识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述工服标志的识别方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种工服标志的识别方法,其特征在于,所述工服标志的识别方法包括:
获取待处理的原始图像数据,并对所述原始图像数据进行图像增强处理和尺寸大小转换处理,得到目标图像,所述原始图像数据为预置场景下的员工图像数据;
通过预置的目标模型,对所述目标图像进行特征图提取处理和边界框生成处理,得到初始区域信息;
对所述初始区域信息进行人像检测处理和区域分割处理,得到候选区域信息;
通过所述目标模型,对所述候选区域信息进行卷积处理和锚框匹配处理,得到目标区域信息;
根据预置的工服标志信息,对所述目标区域信息中的图像信息进行识别,得到工服标志识别结果。
2.根据权利要求1所述的工服标志的识别方法,其特征在于,所述通过预置的目标模型,对所述目标图像进行特征图提取处理和边界框生成处理,得到初始区域信息,包括:
调用预置的目标模型,所述目标模型包括单镜头多盒检测器网络,所述单镜头多盒检测器网络包括超分辨率测试序列算法和确定性网络;
通过所述超分辨率测试序列算法,提取所述目标图像的特征图,得到初始特征图;
对所述初始特征图进行注意力机制处理,得到注意力融合特征图;
通过所述确定性网络对所述注意力融合特征图进行多层级的运算处理,得到多个尺度的特征图;
基于所述多个尺度的特征图生成所述目标图像的边界框,得到初始区域信息,所述初始区域信息包括边界框内的目标图像信息。
3.根据权利要求1所述的工服标志的识别方法,其特征在于,所述对所述初始区域信息进行人像检测处理和区域分割处理,得到候选区域信息,包括:
对所述初始区域信息进行图像灰度化处理、图像滤波处理、降噪处理和边缘检测,得到图像轮廓信息;
对所述图像轮廓信息进行人像轮廓识别并进行人体工服着装部位检测,得到工服着装区域;
按照预置的工服划分区域对所述工服着装区域进行边界框标记,得到候选区域信息,所述候选区域信息包括边界框标记的工服着装图像信息。
4.根据权利要求1所述的工服标志的识别方法,其特征在于,所述通过所述目标识别模型,对所述候选区域信息进行卷积处理和锚框匹配处理,得到目标区域信息,包括:
通过所述目标模型中的移动端神经网络,对所述候选区域信息进行多层级滤波处理和融合处理,得到待处理区域信息;
根据预置的工服标志锚框和匹配算法,对所述待处理区域信息进行预测和分类,得到目标区域信息。
5.根据权利要求1所述的工服标志的识别方法,其特征在于,所述根据预置的工服标志信息,对所述目标区域信息中的图像信息进行识别,得到工服标志识别结果,包括:
获取预置的工服标志信息对应的工服标志特征矩阵向量,以及所述目标区域信息中图像信息对应的图像特征矩阵向量;
通过预置相似度计算算法计算所述图像特征矩阵向量与所述工服标志特征矩阵向量之间的相似度,得到多个相似度值;
判断所述多个相似度值是否均大于预设阈值;
若所述多个相似度值均大于预设阈值,则判定所述目标区域信息对应的图像为工服标志,得到工服标志识别结果。
6.根据权利要求1-5中任一项所述的工服标志的识别方法,其特征在于,所述获取待处理的原始图像数据之前,所述工服标志的识别方法还包括:
获取工服标记的标注样本文件集,并对所述标注样本文件集进行数据格式转换和分类,得到工服标志训练集和工服标志测试集;
通过预置的单镜头多盒检测器网络,对所述工服标志训练集进行特征图提取处理、边界框生成处理、卷积处理和锚框匹配处理,得到单镜头多盒检测器识别模型;
通过所述单镜头多盒检测器识别模型,对所述工服标志测试集进行运算处理,得到测试结果;
根据预置损失函数和所述测试结果,对所述单镜头多盒检测器识别模型的权重值进行迭代调整,得到预置的目标模型。
7.根据权利要求1所述的工服标志的识别方法,其特征在于,所述根据预置的工服标志信息,对所述目标区域信息中的图像信息进行识别,得到工服标志识别结果之后,所述工服标志的识别方法还包括:
对所述工服标志识别结果进行筛选,得到目标信息,所述目标信息包括所述目标区域信息中的图像信息不是工服标志的信息,以及所述目标区域信息对应的原始图像数据;
将所述目标信息发送至预置的检查客户端,并接收所述检查客户端返回的检查结果;
根据所述检查结果对所述目标信息进行更新。
8.一种工服标志的识别装置,其特征在于,所述工服标志的识别装置包括:
转换处理模块,用于获取待处理的原始图像数据,并对所述原始图像数据进行图像增强处理和尺寸大小转换处理,得到目标图像,所述原始图像数据为预置场景下的员工图像数据;
提取生成模块,用于通过预置的目标模型,对所述目标图像进行特征图提取处理和边界框生成处理,得到初始区域信息;
检测分割模块,用于对所述初始区域信息进行人像检测处理和区域分割处理,得到候选区域信息;
卷积匹配模块,用于通过所述目标模型,对所述候选区域信息进行卷积处理和锚框匹配处理,得到目标区域信息;
识别模块,用于根据预置的工服标志信息,对所述目标区域信息中的图像信息进行识别,得到工服标志识别结果。
9.一种工服标志的识别设备,其特征在于,所述工服标志的识别设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述工服标志的识别设备执行如权利要求1-7中任意一项所述的工服标志的识别方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述工服标志的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010310872.3A CN111461101B (zh) | 2020-04-20 | 2020-04-20 | 工服标志的识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010310872.3A CN111461101B (zh) | 2020-04-20 | 2020-04-20 | 工服标志的识别方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111461101A true CN111461101A (zh) | 2020-07-28 |
CN111461101B CN111461101B (zh) | 2023-05-19 |
Family
ID=71684649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010310872.3A Active CN111461101B (zh) | 2020-04-20 | 2020-04-20 | 工服标志的识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111461101B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111860471A (zh) * | 2020-09-21 | 2020-10-30 | 之江实验室 | 一种基于特征检索的工服穿戴识别方法及系统 |
CN112348765A (zh) * | 2020-10-23 | 2021-02-09 | 深圳市优必选科技股份有限公司 | 数据增强方法、装置、计算机可读存储介质及终端设备 |
CN112507787A (zh) * | 2020-11-03 | 2021-03-16 | 北京深睿博联科技有限责任公司 | 基于正样本筛选视障人员障碍物的目标检测方法及装置 |
CN113392713A (zh) * | 2021-05-20 | 2021-09-14 | 上海可深信息科技有限公司 | 一种工衣工服穿戴识别方法 |
CN115009204A (zh) * | 2022-04-21 | 2022-09-06 | 内蒙古中科装备有限公司 | 加氢降噪实现方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180012463A1 (en) * | 2016-07-11 | 2018-01-11 | Google Inc. | Methods and Systems for Person Detection in a Video Feed |
WO2019192397A1 (zh) * | 2018-04-04 | 2019-10-10 | 华中科技大学 | 一种任意形状的场景文本端到端识别方法 |
CN110956115A (zh) * | 2019-11-26 | 2020-04-03 | 证通股份有限公司 | 场景识别方法及装置 |
-
2020
- 2020-04-20 CN CN202010310872.3A patent/CN111461101B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180012463A1 (en) * | 2016-07-11 | 2018-01-11 | Google Inc. | Methods and Systems for Person Detection in a Video Feed |
WO2019192397A1 (zh) * | 2018-04-04 | 2019-10-10 | 华中科技大学 | 一种任意形状的场景文本端到端识别方法 |
CN110956115A (zh) * | 2019-11-26 | 2020-04-03 | 证通股份有限公司 | 场景识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
张淑芳;朱彤;: "基于残差单发多框检测器模型的交通标志检测与识别" * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111860471A (zh) * | 2020-09-21 | 2020-10-30 | 之江实验室 | 一种基于特征检索的工服穿戴识别方法及系统 |
CN112348765A (zh) * | 2020-10-23 | 2021-02-09 | 深圳市优必选科技股份有限公司 | 数据增强方法、装置、计算机可读存储介质及终端设备 |
CN112507787A (zh) * | 2020-11-03 | 2021-03-16 | 北京深睿博联科技有限责任公司 | 基于正样本筛选视障人员障碍物的目标检测方法及装置 |
CN112507787B (zh) * | 2020-11-03 | 2022-08-05 | 北京深睿博联科技有限责任公司 | 基于正样本筛选视障人员障碍物的目标检测方法及装置 |
CN113392713A (zh) * | 2021-05-20 | 2021-09-14 | 上海可深信息科技有限公司 | 一种工衣工服穿戴识别方法 |
CN115009204A (zh) * | 2022-04-21 | 2022-09-06 | 内蒙古中科装备有限公司 | 加氢降噪实现方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111461101B (zh) | 2023-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111461101A (zh) | 工服标志的识别方法、装置、设备及存储介质 | |
CN110148130B (zh) | 用于检测零件缺陷的方法和装置 | |
JP6884517B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN108875600A (zh) | 一种基于yolo的车辆信息检测和跟踪方法、装置及计算机存储介质 | |
US20070041638A1 (en) | Systems and methods for real-time object recognition | |
CN108229418B (zh) | 人体关键点检测方法和装置、电子设备、存储介质和程序 | |
TW201419169A (zh) | 物體識別裝置、物體識別方法及程式產品 | |
CN112419202B (zh) | 基于大数据及深度学习的野生动物图像自动识别系统 | |
CN110942456B (zh) | 篡改图像检测方法、装置、设备及存储介质 | |
CN112633297A (zh) | 目标对象的识别方法、装置、存储介质以及电子装置 | |
CN111553422A (zh) | 手术器械自动识别回收方法及系统 | |
CN114862845A (zh) | 手机触摸屏的缺陷检测方法、装置、设备及存储介质 | |
CN115147418B (zh) | 缺陷检测模型的压缩训练方法和装置 | |
KR101018299B1 (ko) | 영상에서 복수의 물체를 감지하는 방법 및 장치 | |
CN113657370B (zh) | 一种文字识别方法及其相关设备 | |
CN111507119A (zh) | 标识码识别方法、装置、电子设备及计算机可读存储介质 | |
CN117218633A (zh) | 一种物品检测方法、装置、设备及存储介质 | |
JPH11306325A (ja) | 対象物検出装置及び対象物検出方法 | |
CN115908344A (zh) | 一种基于MLCT-YOLO的Micro LED芯片缺陷检测方法 | |
CN112232390B (zh) | 一种高像素大图像的识别方法和系统 | |
CN111046861B (zh) | 识别红外影像的方法、构建识别模型的方法及应用 | |
CN113887652A (zh) | 基于形态和多示例学习的遥感图像弱小目标检测方法 | |
CN114266749B (zh) | 一种基于TridentNet的图像处理方法 | |
CN115131619B (zh) | 基于点云和图像融合的特高压零件分拣方法和系统 | |
CN117173545B (zh) | 一种基于计算机图形学的证照原件识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |