CN113743481B

CN113743481B - 类人化图像识别方法和系统

Info

Publication number: CN113743481B
Application number: CN202110958257.8A
Authority: CN
Inventors: 杨海涛; 刘爽; 夏伟杰; 陶咏志; 李铮; 孙海洋; 冯霄鹏; 向磊
Original assignee: China Information Technology Designing and Consulting Institute Co Ltd; Beijing Telecom Planning and Designing Institute Co Ltd
Current assignee: China Information Technology Designing and Consulting Institute Co Ltd; Beijing Telecom Planning and Designing Institute Co Ltd
Priority date: 2021-08-20
Filing date: 2021-08-20
Publication date: 2024-04-16
Anticipated expiration: 2041-08-20
Also published as: CN113743481A

Abstract

本发明公开了一种类人化图像识别方法和系统，通过将真实场景的图像数据分类投入训练，得到独立的算法模块，提高算法的精确度，再结合人类的思维逻辑，引入逻辑判断，在算法模块外增加逻辑判断，自动选择合适的算法模型，提高算法模块的匹配性，从根本上解决真实应用场景中距离、光照、角度、形状等干扰因素对图像识别的影响，减少算法无法适应真实应用场景中距离、光照、角度、形状变化所引起的误报、错报、漏报和重报问题。

Description

类人化图像识别方法和系统

技术领域

本发明涉及图像识别领域，尤其是涉及类人化图像识别方法和系统。

背景技术

图像识别技术是信息时代的一门重要技术，其产生目的是为了让计算机代替人类去处理大量的物理信息。近几年，随着计算机技术的发展，人类对图像识别技术的认识越来越深刻，已经研发出大量基于机器学习的机器视觉算法模型，如：R-CNN、Fast-RCNN、yolo、ssd、DSSD、FPN FRCN、RetinaNet。目前，使用基于机器学习的机器视觉算法模型的图像识别技术已经广泛应用在安全、生物、工业、农业、交通、医疗等领域，但其应用效果并不理想，难以对实际工作产生价值，用户体验差。这是因为真实的应用场景往往是复杂多变的，包含了各种可能性。如，待识别目标的距离、拍摄角度、拍摄时光线、形状以及背景环境的变化所呈现出来的图像特征可能是完全不同的，而基于机器学习的机器视觉算法模型无法应对多变的环境和目标，仅能对通用场景下图像特征稳定的图像进行准确识别，这就导致在实际应用中产生大量的误报、错报、漏报和重报，无法实现代替人类进行有效信息收集的目的。

当前常用的图像识别方法，通常先识别特定的目标，再识别该目标的细节，如先识别车辆，再进行车牌检测。该方案通过识别目标的从属关系避免一部分不合理的误报和错报，但并没有提高图像识别的准确率。因为，其没有从根本上解决真实应用场景中距离、光照、角度、形状等干扰因素对图像识别的影响。

发明内容

本发明目的在于提供一种类人化图像识别方法和系统，通过引入逻辑判断，自动选择合适的算法模型，从根本上解决真实应用场景中距离、光照、角度、形状等干扰因素对图像识别的影响。

为实现上述目的，本发明可采取下述技术方案：

本发明所述类人化图像识别方法，包括下述步骤：

S1，样本数据分类；所述样本数据是在具体真实应用场景中采集到的图像；所述分类包括第一分类和第二分类；按照待检测目标所关联的第一图像特征在具体真实应用场景中的出现情景，将所述第一分类分为若干个一级分类和若干个从属于一级分类的二级分类；按照具体真实应用场景中客观因素对待检测目标的影响，将所述第二分类分为若干个一级分类和若干个从属于一级分类的二级分类；

S2，制作训练数据集；所述训练数据集是同一分类下样本数据的集合体；其中第一分类的每个一级分类为一个训练数据集；第二分类的每个二级分类为一个训练数据集；

S3，训练数据集数据增强处理；通过对图像中局部或整体像素值进行数据增强，使原来特征不明显的区域变得相对突出，同时抑制不相关的区域特征，用于加强训练数据集中图像的特征；

S4，利用Yolo v5单目标检测算法，训练每个训练数据集，获得不同的检测模型；其中，第一分类的每个一级分类用于获得与待检测目标相关的第一图像特征检测模型；第二分类的每个二级分类用于获得针对不同检测目标的检测模型；

S5，将第一分类和第二分类的一级分类进行组合，形成多个检测通道；每个所述检测通道均包含通用检测模型和从第一分类一级分类训练数据集中获得的所有检测模型以及从第二分类一级分类包含的所有二级分类训练数据集中获得的所有检测模型；

S6，根据图像采集设备的采集情景，为每个图像采集设备配置相应的检测通道；

S7，获得待检测图像和待检测目标，进入采集待检测图像的图像采集设备配置的检测通道；

S8，根据判断规则判断与待检测目标相关的第一图像特征；如果该步没有判断出与待检测目标相关的第一图像特征，则直接执行S10步；

S9，调用检测通道第一分类一级分类检测模型，识别待检测图像中与待检测目标相关的第一图像特征，并将第一图像特征截取保存；

S10，根据内置判断规则判断检测通道中与S8步中截取的第一图像特征最匹配的第二分类一级分类的二级分类；如果没有第一图像特征，则根据内置判断规则判断检测通道中与待检测图像最匹配的第二分类一级分类的二级分类；

S11，根据S10步中判断出的第二分类一级分类的二级分类和S7步中获得得待检测目标，调用检测通道内与待检测目标相关的第二分类一级分类的二级分类检测模型，识别第一图像特征中的待检测目标；

S12，通过坐标映射的方式，将待检测目标的定位映射到待检测图像上，完成待检测目标的识别。

进一步地，S1步中，所述具体真实应用场景中客观因素包括光线、拍摄角度、拍摄距离和体位变化。

优选地，S3步中，所述数据增强方式包括旋转、增强对比度和亮度、加噪声、模糊和镜像。

优选地，S5步中，所述通用检测模型包括图像碰撞检测模型和图像相似性分析检测模型。

本发明所述类人化图像识别系统，包括逻辑处理模块和算法集成模块；

所述算法集成模块由若干个检测通道组成，每个所述检测通道包括从第一分类一级分类训练数据集中获得的检测模型、从第二分类一级分类包含的所有二级分类训练数据集中获得的检测模型和通用检测模型；

所述第一分类是按照待检测目标所关联的第一图像特征在具体真实应用场景中的出现情景，划分为若干个所述一级分类和若干个从属于所述一级分类的所述二级分类；所述第二分类是按照具体真实应用场景中客观因素对待检测目标的影响，划分为若干个所述一级分类和若干个从属于所述一级分类的所述二级分类；所述具体真实应用场景中客观因素包括光线、拍摄角度、拍摄距离和体位变化等；

所述训练数据集是同一分类下样本数据的集合体；其中所述第一分类的每个所述一级分类为一个所述训练数据集；所述第二分类的每个所述二级分类为一个所述训练数据集；

所述检测模型是利用Yolo v5单目标检测算法，训练每个所述训练数据集，获得不同的检测模型；其中，所述第一分类的每个所述一级分类用于获得与待检测目标相关的第一图像特征检测模型；所述第二分类的每个所述二级分类用于获得针对不同检测目标的检测模型；

所述通用检测模型包括图像碰撞检测模型和图像相似性分析检测模型；

所述逻辑处理模块，由若干个逻辑判断通道组成；所述逻辑判断通道包含第一逻辑和第二逻辑；所述第一逻辑用于判断与待检测目标相关的第一图像特征；根据所述第一逻辑的判断结果，调用所述算法集成模块所述第一分类一级分类中用于识别第一图像特征的检测模型，对第一图像特征进行标记和截取；所述第二逻辑用于判断与所述第一图像特征最匹配的所述第二分类二级分类中用于识别所述待检测目标的检测模型，调用所述算法集成模块所述第二分类二级分类中用于识别所述待检测目标的检测模型，完成所述待检测目标的检测识别。

进一步地，所述逻辑处理模块，还包括第三逻辑，用于对异常的图像识别结果进一步识别确认并作出提醒。

进一步地，当所述第一逻辑无法判断与所述待检测目标相关的第一图像特征时，则直接进入所述第二逻辑判断与该图像最匹配的所述第二分类二级分类中用于识别所述待检测目标的检测模型,调用所述算法集成模块所述第二分类二级分类中用于识别待检测目标的检测模型，完成所述待检测目标的检测识别。

进一步地，当在待检测图像中识别到大量人体时，所述第三逻辑根据人体数量判断是否为异常活动，进行警示提醒；当在所述待检测图像中识别出烟雾或火焰时，所述第三逻辑通过调用所述通用检测模型中的相似性分析模型和图像碰撞检测模型，进一步确认是否为烟雾或火焰，并作出警示提醒。

本发明优点在于将真实场景的图像数据分类投入训练，得到独立的算法模块，提高算法的精确度，再结合人类的思维逻辑，在算法模块外增加逻辑判断，提高算法模块的匹配性，来解决算法无法适应真实应用场景中距离、光照、角度、形状变化所引起的误报、错报、漏报和重报。

附图说明

图1是本发明所述系统架构图。

图2是本发明所述系统检测通道示意图。

图3是本发明所述方法流程图。

图4是本发明所述方法应用于工地场景的第一分类说明。

图5是本发明所述方法应用于工地场景的第一分类说明。

图6是本发明所述方法应用于工地场景的检测通道示意图。

图7是本发明所述方法应用于工地场景的安全帽和反光衣识别流程图。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，本发明所述类人化图像识别系统，包括逻辑处理模块和算法集成模块；

算法集成模块由若干个检测通道组成；如图2所示，每个检测通道包括从第一分类一级分类训练数据集中获得的检测模型、从第二分类一级分类包含的所有二级分类训练数据集中获得的检测模型和通用检测模型；

所述第一分类是按照待检测目标所关联的第一图像特征在具体真实应用场景中的出现情景，分为若干个一级分类和若干个从属于一级分类的二级分类；所述第二分类是按照具体真实应用场景中客观因素对待检测目标的影响，分为若干个一级分类和若干个从属于一级分类的二级分类；所述具体真实应用场景中客观因素包括光线、拍摄角度、拍摄距离和体位变化等；

所述训练数据集是同一分类下样本数据的集合体；其中第一分类的每个一级分类为一个训练数据集；第二分类的每个二级分类为一个训练数据集；

所述检测模型是利用Yolo v5单目标检测算法，训练每个训练数据集，获得不同的检测模型；其中，第一分类的每个一级分类用于获得与待检测目标相关的第一图像特征检测模型；第二分类的每个二级分类用于获得针对不同检测目标的检测模型；

所述通用检测模型包括图像碰撞检测模型、图像相似性分析检测模型等；

逻辑处理模块有若干个逻辑判断通道组成，逻辑判断通道包含第一逻辑、第二逻辑，第一逻辑用于判断与待检测目标相关的第一图像特征，根据第一逻辑的判断结果，调用算法集成模块第一分类一级分类中用于识别第一图像特征的检测模型，对第一图像特征进行标记和截取；第二逻辑用于判断与第一图像特征最匹配的第二分类二级分类中用于识别待检测目标的检测模型，调用算法集成模块第二分类二级分类中用于识别待检测目标的检测模型，完成待检测目标的检测识别；当第一逻辑无法判断与待检测目标相关的第一图像特征时，则直接进入第二逻辑判断与该图像最匹配的第二分类二级分类中用于识别待检测目标的检测模型；调用算法集成模块第二分类二级分类中用于识别待检测目标的检测模型，完成待检测目标的检测识别；

逻辑判断通道还包括第三逻辑，用于对异常的图像识别结果进一步识别确认并作出提醒；当在待检测图像中识别到大量人体时，第三逻辑根据人体数量判断是否为异常活动，进行警示提醒；当在待检测图像中识别出烟雾或火焰时，第三逻辑通过调用通用检测模型中的相似性分析模型和图像碰撞检测模型，进一步确认是否为烟雾或火焰，并作出警示提醒。通过将真实场景的图像数据分类投入训练，得到独立的算法模块，提高算法的精确度，再结合人类的思维逻辑，在算法模块外增加逻辑判断，提高算法模块的匹配性，来解决算法无法适应真实应用场景中距离、光照、角度、形状变化所引起的误报、错报、漏报和重报。

如图3所示，本发明所述方法，包括以下步骤：

S1，样本数据分类；所述样本数据是在具体真实应用场景中采集到的图像；所述分类包括第一分类和第二分类；按照待检测目标所关联的第一图像特征在具体真实应用场景中的出现情景，将所述第一分类分为若干个一级分类和若干个从属于一级分类的二级分类；按照具体真实应用场景中客观因素对待检测目标的影响，将所述第二分类分为若干个一级分类和若干个从属于一级分类的二级分类；所述具体真实应用场景中客观因素包括光线、拍摄角度、拍摄距离和体位变化等；

S3，训练数据集数据增强处理；为了加强训练数据集中图像的特征，通过对图像中局部或整体像素值进行数据增强，使原来特征不明显的区域变得相对突出，同时抑制不相关的区域特征；具体采取的数据增强方式包括旋转（对原始图像数据做90°旋转）、增强对比度和亮度（调整图像像素值的增益和偏差参数，使图像对比度和亮度增强）、加噪声（在图像像素值中随机加入高斯噪声，增加鲁棒性）、模糊（通过边缘模糊或对图像不感兴趣区域进行模糊）和镜像（水平镜像或垂直镜像）；

S5，将第一分类和第二分类的一级分类进行组合，形成多个检测通道；每个检测通道均包含通用检测模型和从第一分类一级分类训练数据集中获得的所有检测模型以及从第二分类一级分类包含的所有二级分类训练数据集中获得的所有检测模型；

S12，通过坐标映射的方式，将待检测目标的定位映射到待检测图像上，完成待检测目标的识别；

具体实施例1，以工地应用场景为例，详细描述本发明所述类人化图像识别方法，包括以下步骤：

S1，样本数据分类；将工地现场真实应用场景中采集到的图像进行分类，所述分类包括第一分类和第二分类；其中，如图4所示，按照待检测目标所关联的第一图像特征在工地现场中出现情景，将所述第一分类分为3个一级分类，分别为对象、场景和事件；每个一级分类又包括4个二级分类，其中一级分类对象包括二级分类人、大型机械、物料和车辆；一级分类场景包括二级分类工人生活区、进出闸机口、高层作业面和平面作业区；一级分类事件包括二级分类工人作业、大量人口聚集、大型机械作业和物料运输；如图5所示，按照具体真实应用场景中客观因素对待检测目标的影响，将所述第二分类分为4个一级分类，包括角度、光照、距离和体位，每个一级分类均包括若干个二级分类；其中一级分类角度包括二级分类俯视角、仰视角和平视角；一级分类光照包括二级分类白天、傍晚、夜晚；一级分类距离包括二级分类远距离、中距离和近距离；一级分类体位包括二级分类站立、躺卧和弯曲；

S2，制作训练数据集；将第一分类的每个一级分类作为一个训练数据集；第二分类的每个二级分类作为一个训练数据集；则第一分类一级分类将样本数据分为对象训练数据集训练数据集、场景和事件训练数据集；第二分类二级分类将样本数据分为俯视角训练数据集、仰视角训练数据集、平视角训练数据集、白天训练数据集、傍晚训练数据集、夜晚训练数据集、远距离训练数据集、中距离训练数据集、近距离训练数据集、站立训练数据集、躺卧训练数据集和弯曲训练数据集；

S4，利用Yolo v5单目标检测算法，训练每个训练数据集，获得不同的检测模型；针对第一分类一级分类构建的训练数据集将获得一级分类对象中人体、大型机械、物料和车辆检测模型；一级分类场景中工人生活区、进出闸机口、高层作业面和平面作业区下的人体、大型机械、物料和车辆检测模型；一级分类事件中工人作业、大量人口聚集、大型机械作业和物料运输下的人体、大型机械、物料和车辆检测模型；

针对第二分类二级分类构建的每个训练数据集均将获得相应二级分类的口罩检测模型、反光衣检测模型、安全帽检测模型、界定区域防护检测模型、车牌检测模型、火焰检测模型、烟雾检测模型和特殊物检测模型等；如针对第二分类二级分类远距离训练数据集，将获得远距离口罩检测模型、反光衣检测模型、安全帽检测模型、界定区域防护检测模型、车牌检测模型、火焰检测模型、烟雾检测模型和特殊物检测模型等；

S5，如图6所示，将第一分类和第二分类的一级分类进行组合，形成12个检测通道，分别为对象和角度、对象和光照、对象和距离、对象和体位、场景和角度、场景和光照、场景和距离、场景和体位、事件和角度、事件和光照、事件和距离以及事件和体位；每个检测通道均包含通用检测模型和从第一分类一级分类中获得的检测模型以及从第二分类一级分类包含的所有二级分类获得的检测模型；在对象和距离检测通道中，包括图像碰撞检测模型、图像相似性分析检测模型等通用检测模型，还包括从第一分类一级分类对象训练数据集中获得的人体、大型机械、物料和车辆检测模型；以及从第二分类一级分类距离包含的二级分类远距离、中距离和近距离训练数据集中获得的所有的口罩检测模型、反光衣检测模型、安全帽检测模型、界定区域防护检测模型、车牌检测模型、火焰检测模型、烟雾检测模型和特殊物检测模型等；

S6，根据图像采集设备的采集情景，为每个图像采集设备配置相应的检测通道；如，对于安装在工地进出闸机口的图像采集设备，其主要采集情景为近距离的人，因此可以配置对象和距离检测通道；

S7，获得待检测图像和待检测目标，进入采集待检测图像的图像采集设备配置的检测通道；如安装在工地进出闸机口的图像采集设备采集的图像，进行安全帽和反光衣的识别，则待检测图像进入对象和距离检测通道；

S8，根据判断规则判断与待检测目标相关的第一图像特征；在S7步中获得的待检测目标为安全帽、反光衣，则根据内置判断规则，与待检测目标相关的第一图像特征即为人体；如果进行火焰和烟雾判断时，没有判断出与待检测目标相关的第一图像特征，则直接执行S10步；

S9，调用检测通道第一分类一级分类检测模型，识别待检测图像中与待检测目标相关的第一图像特征，并将第一图像特征截取保存；在S9步中已判断出与待检测目标相关的第一图像特征为人体，则调用对象和距离检测通道中第一分类一级分类对象检测模型中相关的人体检测模型，识别出待检测图像中的人体，并将人体截取保存；

针对对象和距离检测通道，其第二分类一级分类为距离，一级分类距离包括二级分类远距离、近距离和中距离；当第一图像特征图像宽度的像素值在0-20之间时，则判断出对象和距离检测通道中与第一图像特征最匹配的第二分类一级分类距离的二级分类为远距离；当第一图像特征图像宽度的像素值在20-60之间时，则判断出对象和距离检测通道中与第一图像特征最匹配的第二分类一级分类距离的二级分类为中距离；当第一图像特征图像宽度的像素值在60以上时，则判断出对象和距离检测通道中与第一图像特征最匹配的第二分类一级分类距离的二级分类为近距离；

当检测通道中第二分类一级分类为角度时，根据图像采集设备设备实时反馈的角度参数，判断检测通道中与第一图像特征最匹配的第二分类一级分类角度的二级分类为俯视角、仰视角或平视角；

当检测通道中第二分类一级分类为光照时，根据色选机原理，通过分辨待检测图像的RGB值，判断检测通道中与第一图像特征最匹配的第二分类一级分类光照的二级分类为白天、傍晚或夜晚；

当检测通道中第二分类一级分类为体位时，基于人体姿态识别算法OpenPose，判断检测通道中与第一图像特征最匹配的第二分类一级分类体位的二级分类为站立、躺卧或弯曲；

如图7所示，对安装在工地进出闸机口的图像采集设备采集的图像进行安全帽和反光衣的识别时，首先根据图像采集设备的采集情景，为该图像采集设备配置对象和距离检测通道；判断与待检测目标安全帽和发光衣相关的第一图像特征为人体；调用对象和距离检测通道中的对象人体检测模型，识别第一图像特征人体，并将人体图像截取保存下来；根据截取第一图像特征图像宽度的像素值，判断出该第一图像特征属于对象和距离检测通道中第二分类一级分类距离的二级分类远距离，调用对象和距离检测通道中远距离安全帽检测模型和远距离反光衣检测模型识别出第一图像特征中的安全帽和反光衣；通过坐标映射的方式，将安全帽和反光衣定位到待检测图像中，完成待检测目标的识别。

Claims

1.一种类人化图像识别方法，其特征在于：包括下述步骤：

S5，将第一分类和第二分类的一级分类进行组合，形成多个检测通道；每个所述检测通道均包含通用检测模型和从第一分类一级分类训练数据集中获得的所有检测模型以及从第二分类一级分类包含的所有二级分类训练数据集中获得的所有检测模型；所述通用检测模型包括图像碰撞检测模型和图像相似性分析检测模型；

2.根据权利要求1所述的方法，其特征在于：S1步中，所述具体真实应用场景中客观因素包括光线、拍摄角度、拍摄距离和体位变化。

3.根据权利要求1所述的方法，其特征在于：S3步中，所述数据增强方式包括旋转、增强对比度和亮度、加噪声、模糊和镜像。

4.一种类人化图像识别系统，其特征在于：包括逻辑处理模块和算法集成模块；

所述第一分类是按照待检测目标所关联的第一图像特征在具体真实应用场景中的出现情景，划分为若干个所述一级分类和若干个从属于所述一级分类的所述二级分类；所述第二分类是按照具体真实应用场景中客观因素对待检测目标的影响，划分为若干个所述一级分类和若干个从属于所述一级分类的所述二级分类；所述具体真实应用场景中客观因素包括光线、拍摄角度、拍摄距离和体位变化；

5.根据权利要求4所述的系统，其特征在于：所述逻辑处理模块，还包括第三逻辑，用于对异常的图像识别结果进一步识别确认并作出提醒。

6.根据权利要求4所述的系统，其特征在于：当所述第一逻辑无法判断与所述待检测目标相关的第一图像特征时，则直接进入所述第二逻辑判断与该图像最匹配的所述第二分类二级分类中用于识别所述待检测目标的检测模型,调用所述算法集成模块所述第二分类二级分类中用于识别待检测目标的检测模型，完成所述待检测目标的检测识别。

7.根据权利要求5所述的系统，其特征在于：当在待检测图像中识别到大量人体时，所述第三逻辑根据人体数量判断是否为异常活动，进行警示提醒；当在所述待检测图像中识别出烟雾或火焰时，所述第三逻辑通过调用所述通用检测模型中的相似性分析模型和图像碰撞检测模型，进一步确认是否为烟雾或火焰，并作出警示提醒。