CN116862980B - 图像边缘的目标检测框位置优化校正方法、系统、介质及终端 - Google Patents
图像边缘的目标检测框位置优化校正方法、系统、介质及终端 Download PDFInfo
- Publication number
- CN116862980B CN116862980B CN202310692849.9A CN202310692849A CN116862980B CN 116862980 B CN116862980 B CN 116862980B CN 202310692849 A CN202310692849 A CN 202310692849A CN 116862980 B CN116862980 B CN 116862980B
- Authority
- CN
- China
- Prior art keywords
- target detection
- correction
- frame
- detection frame
- corrected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 227
- 238000012937 correction Methods 0.000 title claims abstract description 190
- 238000000034 method Methods 0.000 title claims description 60
- 238000005457 optimization Methods 0.000 title claims description 36
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 29
- 230000008569 process Effects 0.000 claims description 13
- 238000012216 screening Methods 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 abstract description 14
- 230000001788 irregular Effects 0.000 description 11
- 238000009434 installation Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000003384 imaging method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 4
- 208000027418 Wounds and injury Diseases 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 208000014674 injury Diseases 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 235000019800 disodium phosphate Nutrition 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004549 pulsed laser deposition Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请提供的图像边缘的目标检测框位置优化校正方法、系统、介质及终端,属于目标检测框位置优化校正技术领域,本发明通过目标检测算法对实时采集的图像中的人员进行检测,获取当前画面中所有人员人体位置信息的目标检测框,同时将每个人的目标检测框与多个预先设定的校正框进行比对,最终确认当前目标检测框进行优化校正的方案,并最终获取校正后的目标检测框,保障了当前画面中所有人体的目标检测框与实际人体位置之间的贴合情况,有效提高了人体和作业区域相对位置判定的准确率,在保障工厂人员安全的情况下保障了工厂正常的生产效率。
Description
技术领域
本申请涉及目标检测框位置优化校正技术领域,特别是涉及图像边缘的目标检测框位置优化校正方法、系统、介质及终端。
背景技术
随着工业自动化的发展,工厂大规模机械化生产代替传统人力生产的浪潮已然到来,随之而来的便是人机作业过程中的人员安全问题,例如机械臂等大型作业设备伤人事件时有发生。为保障人机作业中的人员安全,诞生了多种安全产品及安全辅助类产品,如安全门锁、光栅、激光扫描仪等传统设备。其中,能够对整个作业区域进行安全防护的代表性产品当属激光扫描仪,一旦人体进入其设定的作业区域即可触发关停信号,联动作业设备停机以保护人身安全。但其缺陷是无法对人和物体进行有效的区分,当非人目标进入作业区域时亦会触发作业设备停机,导致生产意外中断。而新兴的如采用摄像头视觉识别的方案,能对实时图像进行人员目标检测,并确定人员目标所在图像中的位置,由此可判定该人员是否进入图像中设定的作业区域。但此方案中,人体与安全防护区域相对位置的判定可能出现较大误差。
产生误差的原因是:摄像头采集的图像是2D的,使用常用的目标检测算法得到的人体目标是该2D图像上的矩形框,而设定的作业区域则是该2D图像上的多边形区域。常规的判定方法是,计算人体目标所在的矩形框与作业区域的多边形在图像上是否存在位置重叠,若重叠则判定人体目标已进入设定的作业区域。但由于3D空间到2D图像的成像存在投影关系,加之摄像头镜头导致的成像畸变,靠近图像边缘的人体矩形框往往不能很好的贴合人形,导致易误判作业区域外的人体(常为区域轮廓线边缘附近)处于作业区域中。在实际生产环境的影响是,只要当工作人员从作业区域边线旁走过时就极易触发设备停机,进而影响工厂生产效率。
发明内容
鉴于以上所述现有技术的缺点,本申请的目的在于提供一种图像边缘的目标检测框位置优化校正方法、系统、介质及终端,用于解决现有技术中由于摄像头对工厂作业区域进行实时画面采集并进行人员位置检测中出现的图像边缘目标检测框不贴合人体而产生的人体和作业区域相对位置关系判定异常的技术问题。
为实现上述目的及其他相关目的,本申请的第一方面提供一种图像边缘的目标检测框位置优化校正方法,包括:获取全景作业图像,并在所述全景作业图像中定位出用以表征作业区域的作业定位框;从所述全景作业图像中提取人体位置信息,并采用目标检测算法基于所述人体位置信息生成对应的目标检测框;基于检测框优化算法筛选出位于全景作业图像边缘的且需校正的目标检测框进行优化校正,据以得到校正后的目标检测框;获取校正后的目标检测框以及无需校正的目标检测框,将其与作业定位框进行位置重叠判定后输出所述人体位置信息与所述作业区域的相对位置关系信息,以判定全景作业图像中出现的人体是否进入作业区域。
于本申请的第一方面的一些实施例中,对所述需校正的目标检测框进行优化校正的过程包括:在所述全景作业图像中预先标定若干个校正框;根据各校正框所对应的图像采集设备的采集角度来设定该校正框的校正角度;基于各所述校正框的校正角度得到该校正框所对应的宽度缩放系数;根据各所述校正框的校正角度及缩放系数对筛选出的需校正的目标检测框进行优化校正。
于本申请的第一方面的一些实施例中,各所述校正框采用不同形态的闭合区域进行设定。
于本申请的第一方面的一些实施例中,对所述需校正的目标检测框进行筛选的过程包括:将所述目标检测框与各所述校正框进行相对位置判定;若所述目标检测框落于任一所述校正框内,则所述目标检测框需进行优化校正;若所述目标检测框不落于各所述校正框内,则所述目标检测框无需进行优化校正。
于本申请的第一方面的一些实施例中,判断所述目标检测框是否落于任一所述校正框内的方式包括:若所述目标检测框的中心点位于所述校正框内,则所述目标检测框落于所述校正框内;若所述目标检测框的中心点在所述校正框外,则所述目标检测框不落于所述校正框内。
于本申请的第一方面的一些实施例中,所述根据各校正框所对应的采集设备的采集角度来设定该校正框的校正角度,其方法包括:采用虚线表示所述校正框的校正角度;所述校正角度的计算公式如下:x_bias=x2-x1;y_bias=y2-y1;angle=atan(x_bias/y_bias)*180/3.14;其中,(x1,y1)为所述虚线的起点坐标,(x2,y2)为所述虚线的终点坐标,x_bias为所述虚线的横向坐标偏移量,y_bias为所述虚线的竖向坐标偏移量,atan()函数为反正切函数,angle为校正角度。
于本申请的第一方面的一些实施例中,所述基于各所述校正框的校正角度得到该校正框所对应的宽度缩放系数,其方法包括:所述宽度缩放系数与所述校正角度成映射关系;所述映射关系如下所示:0<=angle<5时,widthScaleFactor=0.9;5<=angle<10时,widthScaleFactor=0.8;10<=angle<15时,widthScaleFactor=0.75;15<=angle<∞时,widthScaleFactor=0.7;其中,angle为校正角度,widthScaleFactor为宽度缩放系数。
为实现上述目的及其他相关目的,本申请的第二方面提供一种图像边缘的目标检测框位置优化校正系统,其特征在于,包括:图像采集模块,获取全景作业图像,并在所述全景作业图像中定位出用以表征作业区域的作业定位框;筛选校正模块,从所述全景作业图像中提取人体位置信息,并采用目标检测算法基于所述人体位置信息生成对应的目标检测框;基于检测框优化算法筛选出位于全景作业图像边缘的且需校正的目标检测框进行优化校正,据以得到校正后的目标检测框;位置判定模块,获取校正后的目标检测框以及无需校正的目标检测框,将其与作业定位框进行位置重叠判定后输出所述人体位置信息与所述作业区域的相对位置关系信息,以判定全景作业图像中出现的人体是否进入作业区域。
为实现上述目的及其他相关目的,本申请的第三方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述图像边缘的目标检测框位置优化校正方法。
为实现上述目的及其他相关目的,本申请的第四方面提供一种电子终端,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行图像边缘的目标检测框位置优化校正方法。
如上所述,本申请的图像边缘的目标检测框位置优化校正方法、系统、介质及终端,具有以下有益效果:
本发明通过目标检测算法对实时采集的图像中的人员进行检测,获取当前画面中所有人员人体位置信息的目标检测框,同时将每个人的目标检测框与多个预先设定的校正框进行比对,最终确认当前目标检测框进行优化校正的方案,并最终获取校正后的目标检测框,保障了当前画面中所有人体的目标检测框与实际人体位置之间的贴合情况,有效提高了人体和作业区域相对位置判定的准确率,在保障工厂人员安全的情况下保障了工厂正常的生产效率。
附图说明
图1显示为本申请一实施例中图像边缘的目标检测框位置优化校正方法的流程示意图。
图2显示为本申请一实施例中目标检测框(实线)及校正框(虚线)与作业定位框(不规则多边形)相对位置示意图。
图3显示为本申请一实施例中对所述需校正的目标检测框进行优化校正的流程示意图。
图4显示为本申请一实施例中校正框的结构示意图。
图5显示为本申请一实施例中图像边缘的目标检测框位置优化校正系统的结构示意图。
图6显示为本申请一实施例中电子终端的结构示意图。
具体实施方式
以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,在下述描述中,参考附图,附图描述了本申请的若干实施例。应当理解,还可使用其他实施例,并且可以在不背离本申请的精神和范围的情况下进行机械组成、结构、电气以及操作上的改变。下面的详细描述不应该被认为是限制性的,并且本申请的实施例的范围仅由公布的专利的权利要求书所限定。这里使用的术语仅是为了描述特定实施例,而并非旨在限制本申请。空间相关的术语,例如“上”、“下”、“左”、“右”、“下面”、“下方”、“下部”、“上方”、“上部”等,可在文中使用以便于说明图中所示的一个元件或特征与另一元件或特征的关系。
在本申请中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”、“固持”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
为了使本发明的目的、技术方案及优点更加清楚明白,通过下述实施例并结合附图,对本发明实施例中的技术方案的进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定发明。
在对本发明进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释:
YOLOX:YOLOX是迄今为止YOLO衍生算法中性能最好的算法。YOLOX是目前最新的YOLO系列算法,包括YOLOX-s、YOLOX-m、YOLOX-l、YOLOX-x和YOLOX-Darknet53,以及轻量级网络结构,包括YOLOX-Nano和YOLOX-Tiny。YOLOX目标检测算法主要是在YOLOv3的基础上做了四个方面的改进。输入端的改进:主要是对输入的图像数据进行了Mosaic和MixUp两种数据增强策略,大大丰富了检测物体的背景。骨干特征提取网络的改进:在Darknet53中增加了CSP模块,在骨干网络中使用了Silu激活函数。在下采样的过程中,使用切片的方法保证信息不丢失,然后通过卷积操作得到特征图。特征融合模块:YOLOX在特征提取网络和最终输出层之间增加了SPP(空间特征金字塔)模块和PANet模块,使网络融合多尺度特征信息进行融合。Detector模块:YOLOX将YOLO模型从anchor-base改为anchor-free模型,避免改变数据集时需要重新聚类anchor frame的大小,减少detector网络的参数。YOLOX将解耦检测头引入检测模块,并使用解耦的检测头分别计算分类和定位的结果。与前几代YOLO相比,YOLOX模型的速度和准确率都有所提升。
本发明实施例提供一种图像边缘的目标检测框位置优化校正方法、系统、介质及终端。就图像边缘的目标检测框位置优化校正方法的实施而言,本发明实施例将对图像边缘的目标检测框位置优化校正的示例性实施场景进行说明。
如图1所示,展示了本发明一实施例中图像边缘的目标检测框位置优化校正方法的流程示意图,主要包括如下各步骤:
步骤S11:获取全景作业图像,并在所述全景作业图像中定位出用以表征作业区域的作业定位框。
于本实施例中,所述获取全景作业图像是由图像采集设备对准所述作业区域进行实时图像画面采集。所述表征作业区域的作业定位框采用不规则多边形,可以通过不规则多边形对作业区域进行更细致地划分,以保证获取精确的作业定位框。应理解的是,本实施例中利用图像采集设备实时采集获取的全景作业图像范围要大于作业区域,才能进一步明确作业区域和工作人员的安全区域,以用于确认当前工作人员是否存在潜在危险,是否需要设备停止工作。
进一步地,所述图像采集设备可以是摄像模组,所述摄像模组包括摄像装置、存储装置和处理装置。所述摄像装置包括但不限于:照相机、视频摄像机、集成有光学系统或CCD芯片的摄像模块、集成有光学系统和CMOS芯片的摄像模块等。
具体而言,图像采集设备可以是一个或多个,采用一个图像采集设备可以节约设备资源;采用多个图像采集设备采集同一作业区域的实时画面,可以避免错过采集某部分区域现场工作人员进入作业区域的实时画面,或者当其中一个图像采集设备损坏的情况下有备用的图像采集设备,从而不影响全景作业图像的采集。
步骤S12:从所述全景作业图像中提取人体位置信息,并采用目标检测算法基于所述人体位置信息生成对应的目标检测框;基于检测框优化算法筛选出位于全景作业图像边缘的且需校正的目标检测框进行优化校正,据以得到校正后的目标检测框。
于本实施例中,所述目标检测框采用矩形框,矩形框与人体形象更贴合,且对应的矩形框将人体整体包含在内,以便于通过矩形框的设置方式记录详细准确的人体位置信息,同时避免人体部位进入作业区域造成人员身体伤害。所述目标检测算法可采用基于候选区域的算法(如R-CNN、Fast R-CNN、R-FCN等),也可采用基于回归方法的算法(如YOLOX、SSD、YOLOv系列等)。本实施例优选YOLOX,YOLOX算法相较于其他目标检测算法检测精度高、速度快,检测速度与精度最为均衡,对小目标检测性能更佳。
为了便于理解,结合图2说明,在实际运用场景中,现场工作人员出现在摄像头采集的图像画面中,由于摄像头成像的原因,当人体越接近摄像头所采集图像画面的边缘,人体图像的失真越大,显示在所采集的图像中就是人体出现倾斜情况越严重。又因为在本实施例中人体所在位置的目标检测框设置为矩形框,如图2所示的实线矩形框,可以看出,当工作人员处于摄像头实时采集的图像边缘时,其并未进入作业区域,但是因为在图像边缘位置的人体倾斜,此时获取的目标检测框右上角部分已进入作业定位框,与实际人体位置判断存在差别,出现人体和作业区域相对位置关系判定异常的情况,这种误判定容易导致现场设备误停机,影响工厂生产效率。
因此,本实施例中需要针对图像边缘的目标检测框进行优化校正,以获取校正后的目标检测框,如图2所示的虚线矩形框,可以看出,校正后的目标检测框更贴合实际人体姿态,所记载的人体位置信息更准确,有利于提高使用实时图像采集方法判断作业区域中工作人员闯入的准确率,在保障工作人员安全的情况下保障了工厂正常的生产效率。
于本实施例中,对所述需校正的目标检测框进行优化校正的过程如图3所示,并结合图4说明,主要包括:
步骤S121:在所述全景作业图像中预先标定若干个校正框。
需说明的是,各所述校正框的标定是根据现场图像采集设备安装确认后,基于现场实时采集到的全景作业图像进行设定,图像采集设备的安装方式和数量对校正框的标定都有影响,所述安装方式包括吊顶直视安装、高点墙面俯视安装以及水平平视安装等方式。
进一步地,在一些示例中,各所述校正框采用不同形态的闭合区域进行设定。其中,所述不同形态包括圆形、方形、扇形、不规则多边形等(如图4所示)。所述校正框是根据现场实时采集到的全景作业图像中出现的人体实际位置偏移区域进行设定,而其中校正框选用不同形态是基于现场的图像采集设备的成像情况进行随机选择,本实施例不做限定。所述校正框随机选择不同形态是为了提升所述校正框的普适性,旨在通过更多不同形态的校正框使适应于现场工作人员在各个位置的目标检测框,以便于目标检测框进行优化校正。
步骤S122:根据各校正框所对应的采集设备的采集角度来设定该校正框的校正角度。
需说明的是,图像采集设备的安装方式不同,则采集角度也不同,且若存在多个图像采集设备,所标定的校正框其所对应的采集设备也不同,因此,各校正框的校正角度是根据其所对应的采集设备的采集角度来设置的。比如,当摄像头安装在正上方,采集到的人体位置倾斜程度比较小,则校正角度的设置偏小;若摄像头的安装位置越远,采集到的人体位置越倾斜,则对应的校正角度需越大。
于本实施例中,所述计算校正框的校正角度的方法包括:采用虚线表示所述校正框的校正角度(如图4所示);根据各虚线的坐标信息计算其对应的校正框的校正角度,所述校正角度的计算公式如下:
x_bias = x2 - x1; (公式1)
y_bias = y2 - y1; (公式2)
angle = atan(x_bias / y_bias) * 180 / 3.14; (公式3)
其中,(x1,y1)为所述虚线的起点坐标,(x2,y2)为所述虚线的终点坐标,x_bias为所述虚线的横向坐标偏移量,y_bias为所述虚线的竖向坐标偏移量,atan()函数为反正切函数,angle为校正角度。
步骤S123:基于各所述校正框的校正角度得到该校正框所对应的宽度缩放系数。
需理解的是,根据各校正框的校正角度来选取其对应的宽度缩放系数。进一步地,获取所述校正框所对应的宽度缩放系数的方法包括:所述宽度缩放系数与所述校正角度成映射关系;所述映射关系如下所示:
0 <= angle < 5时,widthScaleFactor = 0.9; (公式4)
5 <= angle < 10时,widthScaleFactor = 0.8; (公式5)
10 <= angle < 15时,widthScaleFactor = 0.75; (公式6)
15 <= angle < ∞时,widthScaleFactor = 0.7; (公式7)
其中,angle为校正角度,widthScaleFactor为宽度缩放系数。
可以理解的是,当校正角度越大,其所对应的宽度缩放系数随之减小,因为在实际优化校正过程中,若校正角度过大,说明旋转角度大,则在校正过程中旋转矩形框会造成很大的变形,此时宽度缩放系数值小,说明原始目标检测框的缩放程度大。比如当当校正角度小于5时,宽度缩放系数为0.9,即表示缩放后的矩形框为原始矩形框的90%,说明矩形框缩放的程度比较小;比如当校正角度大于15时,宽度缩放系数为0.7,即表示缩放后的矩形框为原始矩形框的70%。可以看出,校正角度越大,其缩放程度也越大。
步骤S124:根据各所述校正框的校正角度及缩放系数对筛选出的需校正的目标检测框进行优化校正。
值得说明的是,根据各所述校正框的校正角度及缩放系数对需校正的目标检测框进行优化校正,具体的,确认当前目标检测框对应的校正框,获取当前校正框的校正角度及宽度缩放系数,通过旋转角度以及宽度缩放等方法优化校正当前目标检测框。校正后的目标检测框与实际工作场景中的人体更贴合,人体位置信息更准确,保障了当前画面中所有目标检测框和人体之间的贴合情况,极大的避免了由于目标检测框和人体不贴合的情况而导致人体位置信息和作业区域相对位置判定异常的问题。
步骤S13:获取校正后的目标检测框以及无需校正的目标检测框,将其与作业定位框进行位置重叠判定后输出所述人体位置信息与所述作业区域的相对位置关系信息,以判定全景作业图像中出现的人体是否进入作业区域。其中,所述相对位置关系信息包括:人体进入作业区域,即人体与作业区域接触或在作业区域内;人体未进入作业区域,即人体远离作业区域或经过但未碰触到作业区域。
需强调的是,本实施例中通过摄像头等图像采集设备实时采集现场工作厂区的图像画面,当作业区域的不规则多边形与目标检测框的矩形框存在位置重叠时,即判定现场有人员进入该作业区域后,需要生产设备立即停止运行,避免造成人员受伤。
进一步地,本实施例的目标检测框采用矩形框的方式标注人体位置信息(比如矩形框的高度、宽度以及坐标点等),与所述作业定位框进行位置重叠判定,是通过对目标检测框的矩形框和作业定位框的不规则多边形进行比较,包括两者坐标点大小比较、两者相交面积比较、矩形框的坐标点与不规则多边形的位置关系比较,通过比较确认当前人体位置信息与作业区域的相对位置关系以确认现场工作人员是否处于设定的作业区域内。
又因为当使用摄像头实时采集现场图像画面时,现场工作人员可能会出现在当前摄像头所采集的图像画面中的任意区域,当人体位置位于图像画面的中间位置时,此时人体姿态和摄像头成像后的人体姿态基本一致,此时获得的目标检测框可以直接用于与作业区域的作业定位框进行位置重叠判定,即利用目标检测算法得到目标检测框的坐标信息与当前作业定位框的不规则多边形的坐标信息可以联合判定当前人体是否处于作业区域内,以便于及时控制设备停止,避免造成人身伤害。
但是,当人体位置位于图像画面的边缘位置时,人体姿态在图像中会出现倾斜,此时倾斜的人体位置信息通过目标检测算法计算得到的目标检测框不符合实际工作场景中的人体姿态,需对该目标检测框进行优化校正。因此,需使用校正后的目标检测框以及无需校正的目标检测框与所述作业区域的作业定位框进行位置重叠判定,输出的相对位置关系信息结果更准确,避免出现误判定的情况。
于本申请一实施例中,对所述需校正的目标检测框进行筛选的过程包括:将所述目标检测框与各所述校正框进行相对位置判定;若所述目标检测框落于任一所述校正框内,则所述目标检测框需进行优化校正;若所述目标检测框不落于各所述校正框内,则所述目标检测框无需进行优化校正。
需说明的是,在对所述需校正的目标检测框进行优化校正之前,需对目标检测框进行筛选以获得需校正的目标检测框,因为当使用摄像头实时采集现场图像画面时,现场工作区域可能有多个工作人员时,且现场工作人员可能会出现在当前摄像头所采集的图像画面中的任意区域,因此会生成若干个目标检测框。但是并不是每个目标检测框都需要进行优化校正,需要将各目标检测框分别与预先设定的各校正框进行相对位置判定,通过判断目标检测框是否落于任一校正框内,以此判定各个目标检测框是否需要进行优化校正,即若目标检测框落于任一校正框内,则该目标检测框需要进行优化校正,且采用该目标检测框落入的校正框内的校正方案对其进行优化校正,以输出校正后的目标检测框。
于本申请一实施例中,判断所述目标检测框是否落于任一所述校正框内的方式包括:若所述目标检测框的中心点位于所述校正框内,则所述目标检测框落于所述校正框内;若所述目标检测框的中心点在所述校正框外,则所述目标检测框不落于所述校正框内。
具体而言,本实施例中筛选需校正的目标检测框时,其中判断目标检测框是否落于任一所述校正框内的方式是指判断目标检测框的矩形框的中心点是否位于任一校正框的不规则多边形中,若矩形框的中心点位于任一校正框的不规则多边形中,则说明目标检测框落于其中心点所位于的校正框内。
需强调的是,在实际运用场景中,由于工业自动化的大力发展,工厂越来越重视人员安全问题,传统的安全围栏、光栅、扫描仪等方案无法做到对作业区域的全方位实时监控报警或控制第三方设备,越来越多的工厂采用图像采集设备如摄像头等加上目标检测算法的方案进行作业区域人员安全管控,但由于视觉目标检测的方案产生的误检和误判定情况极大的影响工厂的生产效率和工作人员的人身安全,采用本发明的优化校正方法可以有效解决由于摄像头成像和目标检测框带来的误判定问题,保障工作人员安全的基础下同时保障了工厂的生产效率。
为了便于理解本申请的一种于图像边缘的目标检测框位置优化校正方法,本发明提供以下具体实施例进行说明,具体步骤如下:
步骤1:利用摄像头进行现场实时画面采集获取图像信息,对获取的实时图像信息进行目标检测计算,主要目标为人体,得出当前画面中全部人体的目标检测框。
步骤2:针对每一个目标检测框需要进行位置判定,判定当前目标检测框和已标定的校正框的相对位置关系,当目标检测框不落于校正框时则不需要对目标检测框进行校正,直接返回目标检测框信息。若目标检测框落于校正框时即目标检测框中心点位于校正框时,则进行下一步骤对该目标检测框进行优化校正。
步骤3:确认当前需校正的目标检测框对应的校正框,获取当前校正框的校正角度以及宽度缩放系数,通过角度旋转和宽度缩放等方法校正当前目标检测框,并返回校正后的目标检测框的坐标信息。
步骤4:将上述步骤2和3获取的目标检测框与预先设定的作业区域的作业定位框进行相对位置判定,以输出相对位置关系结果。
步骤5:重复步骤1至步骤4的操作,进行实时视频流分析,判定摄像头实时采集画面中人体和作业区域的相对位置关系,保障人员安全的同时保障工厂的生产效率。
如图6所示,展示了本发明实施例中的一种图像边缘的目标检测框位置优化校正系统的结构示意图。本实施例中,图像边缘的目标检测框位置优化校正系统500包括:图像采集模块501,获取全景作业图像,并在所述全景作业图像中定位出用以表征作业区域的作业定位框;筛选校正模块502,从所述全景作业图像中提取人体位置信息,并采用目标检测算法基于所述人体位置信息生成对应的目标检测框;基于检测框优化算法筛选出位于全景作业图像边缘的且需校正的目标检测框进行优化校正,据以得到校正后的目标检测框;位置判定模块503,获取校正后的目标检测框以及无需校正的目标检测框,将其与作业定位框进行位置重叠判定后输出所述人体位置信息与所述作业区域的相对位置关系信息,以判定全景作业图像中出现的人体是否进入作业区域。
需要说明的是:上述实施例提供的一种图像边缘的目标检测框位置优化校正系统在进行目标检测框位置优化校正时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的一种图像边缘的目标检测框位置优化校正系统与一种图像边缘的目标检测框位置优化校正方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述图像边缘的目标检测框位置优化校正方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
于本申请提供的实施例中,所述计算机可读写存储介质可以包括只读存储器、随机存取存储器、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁存储设备、闪存、U盘、移动硬盘、或者能够用于存储具有指令或数据结构形式的期望的程序代码并能够由计算机进行存取的任何其它介质。另外,任何连接都可以适当地称为计算机可读介质。例如,如果指令是使用同轴电缆、光纤光缆、双绞线、数字订户线(DSL)或者诸如红外线、无线电和微波之类的无线技术,从网站、服务器或其它远程源发送的,则所述同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线电和微波之类的无线技术包括在所述介质的定义中。然而,应当理解的是,计算机可读写存储介质和数据存储介质不包括连接、载波、信号或者其它暂时性介质,而是旨在针对于非暂时性、有形的存储介质。如申请中所使用的磁盘和光盘包括压缩光盘(CD)、激光光盘、光盘、数字多功能光盘(DVD)、软盘和蓝光光盘,其中,磁盘通常磁性地复制数据,而光盘则用激光来光学地复制数据。
如图6所示,展示了本发明一实施例中的电子终端的结构示意图,包括:至少一个处理器601、存储器602、至少一个网络接口604和用户接口606。装置中的各个组件通过总线系统605耦合在一起。可以理解的是,总线系统605用于实现这些组件之间的连接通信。总线系统605除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图6中将各种总线都标为总线系统。
其中,用户接口606可以包括显示器、键盘、鼠标、轨迹球、点击枪、按键、按钮、触感板或者触摸屏等。
可以理解,存储器602可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,StaticRandom Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous StaticRandomAccess Memory)。本发明实施例描述的存储器旨在包括但不限于这些和任意其它适合类别的存储器。
本发明实施例中的存储器602用于存储各种类别的数据以支持电子终端600的操作。这些数据的示例包括:用于在电子终端600上操作的任何可执行程序,如操作系统6021和应用程序6022;操作系统6021包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序6022可以包含各种应用程序,例如媒体播放器(MediaPlayer)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例提供的一种图像边缘的目标检测框位置优化校正方法可以包含在应用程序6022中。
上述本发明实施例揭示的方法可以应用于处理器601中,或者由处理器601实现。处理器601可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器601中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器601可以是通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器601可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器601可以是微处理器或者任何常规的处理器等。结合本发明实施例所提供的配件优化方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成前述方法的步骤。
在示例性实施例中,电子终端600可以被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,ProgrammableLogic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable LogicDevice),用于执行前述方法。
综上所述,本申请提供的图像边缘的目标检测框位置优化校正方法、系统、介质及终端,本发明通过目标检测算法对实时采集的图像中的人员进行检测,获取当前画面中所有人员人体位置信息的目标检测框,同时将每个人的目标检测框与多个预先设定的校正框进行比对,最终确认当前目标检测框进行优化校正的方案,并最终获取校正后的目标检测框,保障了当前画面中所有人体的目标检测框与实际人体位置之间的贴合情况,有效提高了人体和作业区域相对位置判定的准确率,在保障工厂人员安全的情况下保障了工厂正常的生产效率。所以,本申请有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。
Claims (5)
1.一种图像边缘的目标检测框位置优化校正方法,其特征在于,包括:
获取全景作业图像,并在所述全景作业图像中定位出用以表征作业区域的作业定位框;
从所述全景作业图像中提取人体位置信息,并采用目标检测算法基于所述人体位置信息生成对应的目标检测框;基于检测框优化算法筛选出位于全景作业图像边缘的且需校正的目标检测框进行优化校正,以得到校正后的目标检测框;其中,
对所述需校正的目标检测框进行优化校正的过程包括:在所述全景作业图像中预先标定若干个校正框;各所述校正框采用不同形态的闭合区域进行设定;根据各所述校正框所对应的图像采集设备的采集角度来设定该校正框的校正角度;基于各所述校正框的校正角度得到该校正框所对应的宽度缩放系数;根据各所述校正框的校正角度及缩放系数对筛选出的需校正的目标检测框进行优化校正;所述校正框是根据现场实时采集到的全景作业图像中出现的人体实际位置偏移区域进行设定;确认当前目标检测框对应的校正框,获取当前校正框的校正角度和宽度缩放系数,通过旋转角度和宽度缩放优化校正当前目标检测框;
对所述需校正的目标检测框进行筛选的过程包括:将所述目标检测框与各所述校正框进行相对位置判定;若所述目标检测框落于任一所述校正框内,则所述目标检测框需进行优化校正;若所述目标检测框不落于各所述校正框内,则所述目标检测框无需进行优化校正;
判断所述目标检测框是否落于任一所述校正框内的方式包括:若所述目标检测框的中心点位于所述校正框内,则所述目标检测框落于所述校正框内;若所述目标检测框的中心点在所述校正框外,则所述目标检测框不落于所述校正框内;
获取校正后的目标检测框以及无需校正的目标检测框,将其与作业定位框进行位置重叠判定后输出所述人体位置信息与所述作业区域的相对位置关系信息,以判定全景作业图像中出现的人体是否进入作业区域。
2.根据权利要求1所述的图像边缘的目标检测框位置优化校正方法,其特征在于,所述基于各所述校正框的校正角度得到该校正框所对应的宽度缩放系数,其方法包括:
所述宽度缩放系数与所述校正角度成映射关系;所述映射关系如下所示:
0<=angle<5时,widthScaleFactor=0.9;
5<=angle<10时,widthScaleFactor=0.8;
10<=angle<15时,widthScaleFactor=0.75;
15<=angle<∞时,widthScaleFactor=0.7;
其中,angle为校正角度,widthScaleFactor为宽度缩放系数。
3.一种图像边缘的目标检测框位置优化校正系统,其特征在于,包括:
图像采集模块,获取全景作业图像,并在所述全景作业图像中定位出用以表征作业区域的作业定位框;
筛选校正模块,从所述全景作业图像中提取人体位置信息,并采用目标检测算法基于所述人体位置信息生成对应的目标检测框;基于检测框优化算法筛选出位于全景作业图像边缘的且需校正的目标检测框进行优化校正,以得到校正后的目标检测框;其中,
对所述需校正的目标检测框进行优化校正的过程包括:在所述全景作业图像中预先标定若干个校正框;各所述校正框采用不同形态的闭合区域进行设定;根据各所述校正框所对应的图像采集设备的采集角度来设定该校正框的校正角度;基于各所述校正框的校正角度得到该校正框所对应的宽度缩放系数;根据各所述校正框的校正角度及缩放系数对筛选出的需校正的目标检测框进行优化校正;所述校正框是根据现场实时采集到的全景作业图像中出现的人体实际位置偏移区域进行设定;确认当前目标检测框对应的校正框,获取当前校正框的校正角度和宽度缩放系数,通过旋转角度和宽度缩放优化校正当前目标检测框;
对所述需校正的目标检测框进行筛选的过程包括:将所述目标检测框与各所述校正框进行相对位置判定;若所述目标检测框落于任一所述校正框内,则所述目标检测框需进行优化校正;若所述目标检测框不落于各所述校正框内,则所述目标检测框无需进行优化校正;
判断所述目标检测框是否落于任一所述校正框内的方式包括:若所述目标检测框的中心点位于所述校正框内,则所述目标检测框落于所述校正框内;若所述目标检测框的中心点在所述校正框外,则所述目标检测框不落于所述校正框内;位置判定模块,获取校正后的目标检测框以及无需校正的目标检测框,将其与作业定位框进行位置重叠判定后输出所述人体位置信息与所述作业区域的相对位置关系信息,以判定全景作业图像中出现的人体是否进入作业区域。
4.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至2中任一项所述图像边缘的目标检测框位置优化校正方法。
5.一种电子终端,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行如权利要求1至2中任一项所述图像边缘的目标检测框位置优化校正方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310692849.9A CN116862980B (zh) | 2023-06-12 | 2023-06-12 | 图像边缘的目标检测框位置优化校正方法、系统、介质及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310692849.9A CN116862980B (zh) | 2023-06-12 | 2023-06-12 | 图像边缘的目标检测框位置优化校正方法、系统、介质及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116862980A CN116862980A (zh) | 2023-10-10 |
CN116862980B true CN116862980B (zh) | 2024-01-23 |
Family
ID=88218095
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310692849.9A Active CN116862980B (zh) | 2023-06-12 | 2023-06-12 | 图像边缘的目标检测框位置优化校正方法、系统、介质及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116862980B (zh) |
Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201515458A (zh) * | 2013-10-09 | 2015-04-16 | Aver Information Inc | 具投影功能之實物攝影機以及其運作方法 |
WO2020014881A1 (zh) * | 2018-07-17 | 2020-01-23 | 华为技术有限公司 | 一种图像校正方法和终端 |
CN110751151A (zh) * | 2019-10-12 | 2020-02-04 | 上海眼控科技股份有限公司 | 车身图像的文本字符检测方法及设备 |
CN111241947A (zh) * | 2019-12-31 | 2020-06-05 | 深圳奇迹智慧网络有限公司 | 目标检测模型的训练方法、装置、存储介质和计算机设备 |
CN112183304A (zh) * | 2020-09-24 | 2021-01-05 | 高新兴科技集团股份有限公司 | 离位检测方法、系统及计算机存储介质 |
CN112418217A (zh) * | 2020-11-20 | 2021-02-26 | 北京百度网讯科技有限公司 | 用于识别字符的方法、装置、设备和介质 |
CN112560675A (zh) * | 2020-12-15 | 2021-03-26 | 三峡大学 | Yolo与旋转-融合策略相结合的鸟类视觉目标检测方法 |
WO2021093329A1 (zh) * | 2019-11-12 | 2021-05-20 | 苏宁易购集团股份有限公司 | 交互行为识别方法、装置、计算机设备和存储介质 |
CN112861711A (zh) * | 2021-02-05 | 2021-05-28 | 深圳市安软科技股份有限公司 | 区域入侵检测方法、装置、电子设备及存储介质 |
WO2021135424A1 (zh) * | 2019-12-30 | 2021-07-08 | 上海商汤临港智能科技有限公司 | 图像处理方法、装置、存储介质和电子设备 |
WO2021185812A1 (en) * | 2020-03-18 | 2021-09-23 | Connaught Electronics Ltd. | Object detection and guiding a vehicle |
WO2021192028A1 (ja) * | 2020-03-24 | 2021-09-30 | ソニーグループ株式会社 | 学習装置及び学習方法 |
CN113569600A (zh) * | 2020-04-29 | 2021-10-29 | 深圳云天励飞技术有限公司 | 物体重识别的方法、装置、电子设备及存储介质 |
CN113673519A (zh) * | 2021-08-24 | 2021-11-19 | 平安科技(深圳)有限公司 | 基于文字检测模型的文字识别方法及其相关设备 |
CN113903058A (zh) * | 2021-11-19 | 2022-01-07 | 上海玉贲智能科技有限公司 | 一种基于区域人员识别的智能控制系统 |
WO2022160569A1 (zh) * | 2021-01-29 | 2022-08-04 | 成都商汤科技有限公司 | 安检异常事件检测方法及装置、电子设备和存储介质 |
CN115131732A (zh) * | 2022-07-01 | 2022-09-30 | 西南交通大学 | 一种结合目标检测和语义分割的安全带违规佩戴检测方法 |
WO2022264533A1 (ja) * | 2021-06-15 | 2022-12-22 | 日立Astemo株式会社 | 検知枠位置精度向上システム、及び検知枠位置補正方法 |
CN115761214A (zh) * | 2022-11-03 | 2023-03-07 | 武汉中海庭数据技术有限公司 | 一种基于改进目标检测框的目标检测方法及装置 |
CN115880765A (zh) * | 2021-09-27 | 2023-03-31 | 顺丰科技有限公司 | 区域入侵异常行为检测方法、装置及计算机设备 |
CN116109936A (zh) * | 2022-10-21 | 2023-05-12 | 中国科学院长春光学精密机械与物理研究所 | 基于光学遥感的目标检测与识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220245941A1 (en) * | 2019-06-12 | 2022-08-04 | Hangzhou Ezviz Software Co., Ltd. | Method and device for detecting abnormal target, and storage medium |
-
2023
- 2023-06-12 CN CN202310692849.9A patent/CN116862980B/zh active Active
Patent Citations (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201515458A (zh) * | 2013-10-09 | 2015-04-16 | Aver Information Inc | 具投影功能之實物攝影機以及其運作方法 |
WO2020014881A1 (zh) * | 2018-07-17 | 2020-01-23 | 华为技术有限公司 | 一种图像校正方法和终端 |
CN110751151A (zh) * | 2019-10-12 | 2020-02-04 | 上海眼控科技股份有限公司 | 车身图像的文本字符检测方法及设备 |
WO2021093329A1 (zh) * | 2019-11-12 | 2021-05-20 | 苏宁易购集团股份有限公司 | 交互行为识别方法、装置、计算机设备和存储介质 |
WO2021135424A1 (zh) * | 2019-12-30 | 2021-07-08 | 上海商汤临港智能科技有限公司 | 图像处理方法、装置、存储介质和电子设备 |
CN111241947A (zh) * | 2019-12-31 | 2020-06-05 | 深圳奇迹智慧网络有限公司 | 目标检测模型的训练方法、装置、存储介质和计算机设备 |
WO2021185812A1 (en) * | 2020-03-18 | 2021-09-23 | Connaught Electronics Ltd. | Object detection and guiding a vehicle |
WO2021192028A1 (ja) * | 2020-03-24 | 2021-09-30 | ソニーグループ株式会社 | 学習装置及び学習方法 |
EP4099264A1 (en) * | 2020-03-24 | 2022-12-07 | Sony Group Corporation | Learning device and learning method |
CN113569600A (zh) * | 2020-04-29 | 2021-10-29 | 深圳云天励飞技术有限公司 | 物体重识别的方法、装置、电子设备及存储介质 |
CN112183304A (zh) * | 2020-09-24 | 2021-01-05 | 高新兴科技集团股份有限公司 | 离位检测方法、系统及计算机存储介质 |
CN112418217A (zh) * | 2020-11-20 | 2021-02-26 | 北京百度网讯科技有限公司 | 用于识别字符的方法、装置、设备和介质 |
CN112560675A (zh) * | 2020-12-15 | 2021-03-26 | 三峡大学 | Yolo与旋转-融合策略相结合的鸟类视觉目标检测方法 |
WO2022160569A1 (zh) * | 2021-01-29 | 2022-08-04 | 成都商汤科技有限公司 | 安检异常事件检测方法及装置、电子设备和存储介质 |
CN112861711A (zh) * | 2021-02-05 | 2021-05-28 | 深圳市安软科技股份有限公司 | 区域入侵检测方法、装置、电子设备及存储介质 |
WO2022264533A1 (ja) * | 2021-06-15 | 2022-12-22 | 日立Astemo株式会社 | 検知枠位置精度向上システム、及び検知枠位置補正方法 |
CN113673519A (zh) * | 2021-08-24 | 2021-11-19 | 平安科技(深圳)有限公司 | 基于文字检测模型的文字识别方法及其相关设备 |
CN115880765A (zh) * | 2021-09-27 | 2023-03-31 | 顺丰科技有限公司 | 区域入侵异常行为检测方法、装置及计算机设备 |
CN113903058A (zh) * | 2021-11-19 | 2022-01-07 | 上海玉贲智能科技有限公司 | 一种基于区域人员识别的智能控制系统 |
CN115131732A (zh) * | 2022-07-01 | 2022-09-30 | 西南交通大学 | 一种结合目标检测和语义分割的安全带违规佩戴检测方法 |
CN116109936A (zh) * | 2022-10-21 | 2023-05-12 | 中国科学院长春光学精密机械与物理研究所 | 基于光学遥感的目标检测与识别方法 |
CN115761214A (zh) * | 2022-11-03 | 2023-03-07 | 武汉中海庭数据技术有限公司 | 一种基于改进目标检测框的目标检测方法及装置 |
Non-Patent Citations (9)
Title |
---|
Improved YOLOv5 in Remote Sensing Slender and Rotating Target Detection;Zhong Bo 等;2022 IEEE International Conference on Electrical Engineering, Big Data and Algorithms (EEBDA);918-923 * |
Real-Time Security Monitoring System for Intelligent Multi-region Transfer Platform;Rongxuan Si 等;Intelligent Robotics: Third China Annual Conference, CCF CIRAC 2022, Proceedings. Communications in Computer and Information Science;305-315 * |
Rotated Box Is Back: An Accurate Box Proposal Network for Scene Text Detection;Jusung Lee 等;Document Analysis and Recognition;49–63 * |
Rotated object detection with forward-looking sonar in underwater applications;Gustavo Neves 等;Expert Systems with Applications;1-18 * |
SARD: Towards Scale-Aware Rotated Object Detection in Aerial Imagery;Yashan Wang 等;IEEE Access;173855-173865 * |
基于无锚框的目标检测方法及其在复杂场景下的应用进展;刘小波 等;自动化学报;1-24 * |
基于深度卷积神经网络的遥感图像目标检测方法;刘思远 等;工业控制计算机;第33卷(第05期);72-74、130 * |
旋转人脸检测算法;张立亮 等;计算机应用与软件;第36卷(第12期);137-142 * |
高分辨率遥感图像目标检测方法研究;张锟;中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑;第2023年卷(第1期);C028-454 * |
Also Published As
Publication number | Publication date |
---|---|
CN116862980A (zh) | 2023-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11024052B2 (en) | Stereo camera and height acquisition method thereof and height acquisition system | |
US9501692B2 (en) | Method and apparatus for projective volume monitoring | |
CN111339951A (zh) | 体温测量方法、装置及系统 | |
US10083513B2 (en) | Information presentation device, stereo camera system, and information presentation method | |
CN112837302B (zh) | 模具的状态监测方法、装置、工控机、存储介质及系统 | |
CN110491060B (zh) | 一种机器人及其安全监控方法、装置及存储介质 | |
CN106791700B (zh) | 一种企业关键区域人员路径安全监控系统及方法 | |
JP2013156109A (ja) | 距離計測装置 | |
JP5525495B2 (ja) | 映像監視装置、映像監視方法およびプログラム | |
CN107005655A (zh) | 图像处理方法 | |
US11928805B2 (en) | Information processing apparatus, information processing method, and storage medium for defect inspection and detection | |
JP2017049676A (ja) | 姿勢判定装置および物体検知装置 | |
CN112307912A (zh) | 一种基于摄像头确定人员轨迹的方法及系统 | |
CN104102069A (zh) | 一种成像系统的对焦方法及装置、成像系统 | |
CN114022810A (zh) | 建筑工地爬架防护网工作状态检测方法、系统、介质及终端 | |
JP2010045501A (ja) | 画像監視装置 | |
JP6683889B2 (ja) | 画像検索装置 | |
CN116862980B (zh) | 图像边缘的目标检测框位置优化校正方法、系统、介质及终端 | |
WO2020153264A1 (ja) | 校正方法および校正装置 | |
CN108737733B (zh) | 信息提示方法和装置、电子设备、计算机可读存储介质 | |
JP3244850B2 (ja) | ナンバープレート読み取り装置 | |
JP6448457B2 (ja) | 撮影方向変動検出装置および撮影方向変動検出方法 | |
JP2011061651A (ja) | 不審物検知システム | |
CN112784703A (zh) | 一种基于多光谱的人员行动轨迹确定方法 | |
CN113108919A (zh) | 人体温度检测方法、装置和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |