CN113469057A - 火眼视频自适应检测方法、装置、设备及介质 - Google Patents

火眼视频自适应检测方法、装置、设备及介质 Download PDF

Info

Publication number
CN113469057A
CN113469057A CN202110751278.2A CN202110751278A CN113469057A CN 113469057 A CN113469057 A CN 113469057A CN 202110751278 A CN202110751278 A CN 202110751278A CN 113469057 A CN113469057 A CN 113469057A
Authority
CN
China
Prior art keywords
detection result
target
result set
initial
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110751278.2A
Other languages
English (en)
Other versions
CN113469057B (zh
Inventor
陈晓方
林清扬
谢世文
谢永芳
孙玉波
石珏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202110751278.2A priority Critical patent/CN113469057B/zh
Publication of CN113469057A publication Critical patent/CN113469057A/zh
Application granted granted Critical
Publication of CN113469057B publication Critical patent/CN113469057B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本公开实施例中提供了一种火眼视频自适应检测方法、装置、设备及介质,属于图像处理技术领域,具体包括:采集目标区域对应的初始视频;从初始视频中截取多张初始图片,并对全部初始图片添加饱和度通道,形成RGBS四通道的样本图片;将全部样本图片训练原始模型,得到目标模型;将初始视频输入目标模型,形成初始检测结果集;采用预设算法剔除初始检测结果集中的异常的检测结果,得到中间检测结果集;检测中间检测结果集中的缺失值,并对全部缺失值进行填补,得到目标检测结果集;对目标检测结果集进行自适应滤波,得到包含火眼标注框的目标视频。通过本公开的方案,提高了火眼视频检测方法的抗干扰性、检测结果稳定性和鲁棒性。

Description

火眼视频自适应检测方法、装置、设备及介质
技术领域
本公开实施例涉及图像处理技术领域,尤其涉及一种火眼视频自适应检测方法、装置、设备及介质。
背景技术
目前,在工业生产中,金属铝的使用、深加工和处理都是较为常见的环节,例如较为常见的铝电解过程,铝电解过程需要在铝电解槽中进行,铝电解槽电解质的过热度是指电解质温度与初晶温度的差值。过热度直接影响铝电解的电流效率,同时影响电解槽的炉膛形状及稳定性,进而影响电解槽的寿命。因此,在铝电解过程中,需要对火眼位置和状态进行实时监控。但是现有的火眼视频的检测方法主要是基于阈值法和改进的阈值法来对火眼进行检测,但是需要人工调参,较为麻烦,易受外界环境如光照、拍摄角度等因素影响,对不同环境的适用性不强,在复杂环境下易造成错检漏检的情况。
或者采用YOLO模型来检测火眼视频,但是YOLO模型是基于单张图片的,视频中相邻帧火眼内熔融电解质的运动情况差异会对YOLO模型的检测结果造成影响,造成相邻帧的检测结果存在随机细微抖动现象,以及,YOLO模型是基于数据的,不同铝电解厂的生产状况差异导致不同铝电解厂内电解槽环境存在较大差异,采用一个铝电解厂采集数据训练的模型直接用到另一个铝电解厂的铝电解槽上,会造成识别结果存在小部分错检、误检、结果波动大的问题,无法稳定的检测出火眼视频。
可见,亟需一种抗干扰性、检测结果稳定性和鲁棒性强的火眼视频自适应检测方法。
发明内容
有鉴于此,本公开实施例提供一种火眼视频自适应检测方法、装置、设备及介质,至少部分解决现有技术中存在检测效率和检测精准度较差的问题。
第一方面,本公开实施例提供了一种火眼视频自适应检测方法,包括:
采集目标区域对应的初始视频,其中,所述目标区域包括火眼的位置;
从所述初始视频中截取多张初始图片,并对全部所述初始图片添加饱和度通道,形成RGBS四通道的样本图片;
将全部所述样本图片训练原始模型,得到目标模型;
将所述初始视频输入所述目标模型,得到所述初始视频中每一帧对应的检测结果,形成初始检测结果集;
采用预设算法剔除所述初始检测结果集中的异常的检测结果,得到中间检测结果集;
检测所述中间检测结果集中的缺失值,并对全部所述缺失值进行填补,得到目标检测结果集;
对所述目标检测结果集进行自适应滤波,得到包含火眼标注框的目标视频。
根据本公开实施例的一种具体实现方式,所述将所述初始视频输入所述目标模型,得到所述初始视频中每一帧对应的检测结果,形成初始检测结果集的步骤,包括:
所述目标模型对所述初始视频中每一帧进行目标检测,得到每一帧对应的目标物体数量及对应的坐标;
根据所述初始视频中的全部帧对应的目标物体数量及对应的坐标,形成所述初始检测结果集。
根据本公开实施例的一种具体实现方式,所述采用预设算法剔除所述初始检测结果集中的异常的检测结果,得到中间检测结果集的步骤之前,所述方法还包括:
当检测到所述初始视频中的目标帧包含的目标物体数量不为1时,则判定所述目标帧的检测结果为异常;
将所述检测结果为异常的目标帧标识为异常帧。
根据本公开实施例的一种具体实现方式,所述采用预设算法剔除所述初始检测结果集中的异常的检测结果,得到中间检测结果集的步骤,包括:
采用DBSCAN聚类算法剔除全部所述异常帧中所述火眼的坐标异常值;
对剔除坐标异常值后的初始检测结果集采用三西格马定律剔除所述异常帧中所述火眼的规格异常值,得到中间检测结果集。
根据本公开实施例的一种具体实现方式,所述检测所述中间检测结果集中的缺失值,并对全部所述缺失值进行填补,得到目标检测结果集的步骤,包括:
将所述中间检测结果集中的第一帧初始化滑动指数平均算法;
根据所述滑动指数平均算法计算所述初始视频中每一帧的历史平均加权值;
分别将全部所述缺失值对应帧的上一帧的历史平均加权值作为当前帧的初始预测值,形成所述目标检测结果集。
根据本公开实施例的一种具体实现方式,所述对所述目标检测结果集进行自适应滤波,得到包含火眼标注框的目标视频的步骤,包括:
将所述目标检测结果集中的第一帧初始化递归最小二乘滤波器;
将所述目标检测结果集中的全部帧依次输入所述递归最小二乘滤波器,得到所述目标视频。
根据本公开实施例的一种具体实现方式,所述将全部所述样本图片训练原始模型,得到目标模型的步骤之前,所述方法还包括:
获取中间模型;
将所述中间模型的输入卷积层修改为四通道,得到所述目标模型。
第二方面,本公开实施例提供了一种火眼视频自适应检测装置,包括:
采集模块,用于采集目标区域对应的初始视频,其中,所述目标区域包括火眼的位置;
截取模块,用于从所述初始视频中截取多张初始图片,并对全部所述初始图片添加饱和度通道,形成RGBS四通道的样本图片;
训练模块,用于将全部所述样本图片训练原始模型,得到目标模型;
输入模块,用于将所述初始视频输入所述目标模型,得到所述初始视频中每一帧对应的检测结果,形成初始检测结果集;
剔除模块,用于采用预设算法剔除所述初始检测结果集中的异常的检测结果,得到中间检测结果集;
填补模块,用于检测所述中间检测结果集中的缺失值,并对全部所述缺失值进行填补,得到目标检测结果集;
滤波模块,用于对所述目标检测结果集进行自适应滤波,得到包含火眼标注框的目标视频。
第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:
至少一个处理器;以及,
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述第一方面或第一方面的任一实现方式中的火眼视频自适应检测方法。
第四方面,本公开实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述第一方面或第一方面的任一实现方式中的火眼视频自适应检测方法。
第五方面,本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述第一方面或第一方面的任一实现方式中的火眼视频自适应检测方法。
本公开实施例中的火眼视频自适应检测方案,包括:采集目标区域对应的初始视频,其中,所述目标区域包括火眼的位置;从所述初始视频中截取多张初始图片,并对全部所述初始图片添加饱和度通道,形成RGBS四通道的样本图片;将全部所述样本图片训练原始模型,得到目标模型;将所述初始视频输入所述目标模型,得到所述初始视频中每一帧对应的检测结果,形成初始检测结果集;采用预设算法剔除所述初始检测结果集中的异常的检测结果,得到中间检测结果集;检测所述中间检测结果集中的缺失值,并对全部所述缺失值进行填补,得到目标检测结果集;对所述目标检测结果集进行自适应滤波,得到包含火眼标注框的目标视频。
本公开实施例的有益效果为:通过本公开的方案,对初始视频进行处理形成四通道图像并以此训练检测模型,然后采用目标模型对初始视频进行检测并剔除异常值、填补缺失值以及进行自适应滤波,从而得到稳定的火眼标注框,提高了火眼视频检测的抗干扰性、检测结果稳定性和鲁棒性。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本公开实施例提供的一种火眼视频自适应检测方法的流程示意图;
图2为本公开实施例提供的一种火眼视频自适应检测方法的部分流程示意图;
图3为本公开实施例提供的一种火眼视频自适应检测装置的结构示意图;
图4为本公开实施例提供的电子设备示意图。
具体实施方式
下面结合附图对本公开实施例进行详细描述。
以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
目前,在工业生产中,金属铝的使用、深加工和处理都是较为常见的环节,例如较为常见的铝电解过程,铝电解过程需要在铝电解槽中进行,铝电解槽电解质的过热度是指电解质温度与初晶温度的差值。过热度直接影响铝电解的电流效率,同时影响电解槽的炉膛形状及稳定性,进而影响电解槽的寿命。因此,在铝电解过程中,需要对火眼位置和状态进行实时监控。但是现有的火眼视频的检测方法主要是基于阈值法和改进的阈值法来对火眼进行检测,但是需要人工调参,较为麻烦,易受外界环境如光照、拍摄角度等因素影响,对不同环境的适用性不强,在复杂环境下易造成错检漏检的情况。
当前,随着计算机视觉技术与深度学习的发展,基于深度学习的目标检测方法可以更好的对图像中的目标进行检测,在复杂环境下鲁棒性更好。YOLO是一类基于深度学习神经网络构架的物体检测算法,它将物体检测作为一个回归问题进行求解,输入图像经过网络模型的预测,便能得到图像中所有物体的位置和其所属类别及相应的置信概率,这一类方法包括YOLOv1,YOLOv2,YOLOv3,YOLOv4,scaled-YOLOv4一系列方法。但是直接采用YOLO模型来检测火眼视频。但是YOLO模型是基于单张图片的,视频中相邻帧火眼内熔融电解质的运动情况差异会对YOLO模型的检测结果造成影响,造成相邻帧的检测结果存在随机细微抖动现象,以及,YOLO模型是基于数据的,不同铝电解厂的生产状况差异导致不同铝电解厂内电解槽环境存在较大差异,采用一个铝电解厂采集数据训练的模型直接用到另一个铝电解厂的铝电解槽上,会造成识别结果存在小部分错检、误检、结果波动大的问题,无法稳定的检测出火眼视频。
本公开实施例提供一种火眼视频自适应检测方法,所述方法可以应用于铝电解厂场景的铝电解槽火眼视频检测和定位过程。
参见图1,为本公开实施例提供的一种火眼视频自适应检测方法的流程示意图。如图1所示,所述方法主要包括以下步骤:
S101,采集目标区域对应的初始视频,其中,所述目标区域包括火眼的位置;
具体实施时,当应用场景为铝电解厂内的铝电解过程时,需要对火眼的位置进行实时监测,所述目标区域可以至少包含所述火眼的区域,或者大于所述火眼的区域。电子设备可以内置有视频采集模块或者外接有视频采集装置,所述视频采集模块或者外接的视频采集装置对所述目标区域的视频进行实施采集,得到所述初始视频,所述初始视频可以直接发送至处理器进行实时分析处理,也可以将所述初始视频存储至预设的存储空间内,在需要对所述初始视频进行分析时从所述预设的存储空间内提取。
S102,从所述初始视频中截取多张初始图片,并对全部所述初始图片添加饱和度通道,形成RGBS四通道的样本图片;
具体实施时,可以从所述初始视频中截取多张初始图片,然后在HSV色彩空间中提取其饱和度(S)通道,结合原RGB色彩空间三通道形成RGBS四通道的样本图片。当然,添加所述饱和度通道前,在截图多张所述初始图片后,还可以对全部所述初始图片采用图像几何变换、颜色偏移等数据增强方法进行预处理,进一步增强对所述初始视频中干扰因素的抗干扰能力。
S103,将全部所述样本图片训练原始模型,得到目标模型;
可选的,步骤S103所述的,将全部所述样本图片训练原始模型,得到目标模型之前,所述方法还包括:
获取中间模型;
将所述中间模型的输入卷积层修改为四通道,得到所述目标模型。
具体实施时,可以通过已有的数据库中选取所述中间模型,例如,可以选用Scaled-YOLOV4模型作为所述中间模型,然后改变Scaled-YOLOV4模型的输入卷积层,使其适应四通道图像输入,再将全部所述样本图片作为输入,训练基于YOLO的中间模型,得到铝电解槽火眼检测模型并将其定义为所述目标模型。
S104,将所述初始视频输入所述目标模型,得到所述初始视频中每一帧对应的检测结果,形成初始检测结果集;
具体实施时,可以将所述初始视频输入基于YOLO模型的目标模型,得到所述初始视频中每一帧对应的检测结果,形成所述初始检测结果集。例如,使用经过训练的YOLO模型对原始火眼视频每一帧图像进行目标检测,得到每一视频帧中特定目标所在物体类别对应的原始检测结果。
S105,采用预设算法剔除所述初始检测结果集中的异常的检测结果,得到中间检测结果集;
考虑到使用基于YOLO模型的目标模型对所述初始视频进行检测时,可能会存在小部分错检、误检或结果波动大的问题,无法稳定的检测出火眼视频。可以预先设置有对应的精度算法,在得到所述初始检测结果集后,剔除所述初始检测结果集中的异常的检测结果,得到所述中间检测结果集。
S106,检测所述中间检测结果集中的缺失值,并对全部所述缺失值进行填补,得到目标检测结果集;
考虑到原始结果漏检与异常值剔除的原因,当前结果存在一些缺失值。需要对缺失值进行填补。同时当前的检测结果未考虑视频中相邻帧火眼内熔融电解质的运动情况差异对检测结果造成影响,造成相邻帧的检测结果存在随机细微抖动现象。因此需要对所述中间检测结果集中的缺失值进行缺失值填补,得到更平滑的数据,消除随机抖动的影响,提高检测的鲁棒性。
S107,对所述目标检测结果集进行自适应滤波,得到包含火眼标注框的目标视频。
在经过异常值的剔除和缺失值的填补后,形成所述目标检测结果集,然后对所述目标检测结果集进行自适应滤波,得到稳定精准的包含火眼标注框的目标视频。
本实施例提供的火眼视频自适应检测方法,通过对初始视频进行处理形成四通道图像并以此训练基于YOLO模型的检测模型,然后采用基于YOLO模型的目标模型对初始视频进行检测并剔除异常值、填补缺失值以及进行自适应滤波,从而得到稳定的火眼标注框,提高了火眼视频检测的抗干扰性、检测结果稳定性和鲁棒性。
在上述实施例的基础上,如图2所示,步骤S104所述的,将所述初始视频输入所述目标模型,得到所述初始视频中每一帧对应的检测结果,形成初始检测结果集,包括:
S201,所述目标模型对所述初始视频中每一帧进行目标检测,得到每一帧对应的目标物体数量及对应的坐标;
例如,将所述初始视频输入基于YOLO模型的的目标模型,第t帧的原始结果记为
Figure BDA0003146332260000101
n为第t帧原始检测结果的个数。其中
Figure BDA0003146332260000102
为第t帧第i个原始检测结果,
Figure BDA0003146332260000103
分别为该检测结果标注框的左上角x坐标,左上角y坐标,右下角x坐标,右下角y坐标。
S202,根据所述初始视频中的全部帧对应的目标物体数量及对应的坐标,形成所述初始检测结果集。
在经过YOLO模型的检测得到所述初始视频中每一帧包含的目标物体数量以及每个目标物体对于的坐标之后,可以根据所述初始视频中的全部帧对应的目标物体数量及对应的坐标,形成所述初始检测结果集。
可选的,步骤S105所述的,采用预设算法剔除所述初始检测结果集中的异常的检测结果,得到中间检测结果集之前,所述方法还包括:
当检测到所述初始视频中的目标帧包含的目标物体数量不为1时,则判定所述目标帧的检测结果为异常;
将所述检测结果为异常的目标帧标识为异常帧。
具体实施时,考虑到当进行铝电解时,火眼视频中火眼个数为1个,可以对所述初始检测结果中的每一帧进行筛查,当所述目标帧中的目标物体数量n=1时,说明火眼检测框检测个数正常,但仍然可能存在错检现象,当n>1时,说明原始结果存在将背景结果误判为火眼的误检现象,当n=0时,说明原始结果无法检测出火眼,存在漏检现象,可以将检测到异常结果的帧均标识为异常帧。
进一步的,步骤S105所述的,采用预设算法剔除所述初始检测结果集中的异常的检测结果,得到中间检测结果集,包括:
采用DBSCAN聚类算法剔除全部所述异常帧中所述火眼的坐标异常值;
具体实施时,DBSCAN算法是一种基于密度的聚类算法,它不需要预先指定簇的个数同时最终簇的个数不确定。DBSCAN算法有两个参数:扫描半径eps与最小包含点数minPts。其算法步骤如下:
A.检测尚未检查过的数据点p,如果p未被处理(归为某个簇或者标记为噪声),则检查其邻域,若包含的对象数不小于minPts,建立新簇C,将其中的所有点加入候选集N;
B.对候选集N中所有尚未被处理的对象q,检查其邻域,若至少包含minPts个对象,则将这些对象加入N;如果q未归入任何一个簇,则将q加入C;
C.重复步骤B,继续检查N中未处理的对象,当前候选集N为空;
D.重复步骤A~C,直到所有对象都归入了某个簇或标记为噪声。
完成聚类操作后,取包含样本数量最多簇的结果作为正常值,其他簇的结果作为异常值并去除。
对剔除坐标异常值后的初始检测结果集采用三西格马定律剔除所述异常帧中所述火眼的规格异常值,得到中间检测结果集。
具体实施时,考虑到经过DBSCAN聚类算法的筛选剔除之后,大部分异常值已被去除,但是DBSCAN聚类算法直接考虑的是火眼检测框的左上角坐标
Figure BDA0003146332260000111
与右下角坐标
Figure BDA0003146332260000112
没有直接考虑火眼的位置与大小。
对DBSCAN聚类算法的结果
Figure BDA0003146332260000113
进行坐标变换得到集合
Figure BDA0003146332260000121
Figure BDA0003146332260000122
其中
Figure BDA0003146332260000123
为相应火眼标注框中心的x坐标,
Figure BDA0003146332260000124
为相应火眼标注框中心的y坐标,
Figure BDA0003146332260000125
为相应火眼标注框的宽度,
Figure BDA0003146332260000126
为相应火眼标注框的高度。对于对集合Ω″的每一个属性X∈{Xcenter,Ycenter,W,H},其均值为
Figure BDA0003146332260000127
标准差为
Figure BDA0003146332260000128
可计算出置信范围为(μ-3σ,μ+3σ),将属性值不在置信范围内的样本作为异常样本进行剔除。
经过两步剔除之后的结果为所述中间检测结果集
Figure BDA0003146332260000131
,其中m为所述初始视频总帧数。
在上述实施例的基础上,步骤S106所述的,检测所述中间检测结果集中的缺失值,并对全部所述缺失值进行填补,得到目标检测结果集,包括:
将所述中间检测结果集中的第一帧初始化滑动指数平均算法;
根据所述滑动指数平均算法计算所述初始视频中每一帧的历史平均加权值;
分别将全部所述缺失值对应帧的上一帧的历史平均加权值作为当前帧的初始预测值,形成所述目标检测结果集。
具体实施时,考虑到原始火眼视频中火眼的位置、大小大致不变,对于缺失值可采用对历史数据取平均值的方式来填补缺失值;由于距离缺失值越近的历史数据更能反映缺失值的情况,拟采用滑动指数平均的方法来对缺失值进行填补,对距离缺失值更近的历史数据赋予更大的权重。滑动指数平均的计算公式如下:
Figure BDA0003146332260000132
其中,α为加权系数,xt为t时刻滑动平均前的值,x′t为t时刻滑动平均后的值。
然后采用原始视频第一帧的火眼标注框结果初始化滑动指数平均算法。按原始视频帧顺序依次取第i帧经过异常值剔除的火眼标注框
Figure BDA0003146332260000133
进行处理。当
Figure BDA0003146332260000134
时,将
Figure BDA0003146332260000135
输入滑动指数平均算法得到当前时刻的历史加权平均值
Figure BDA0003146332260000141
当Dt″=None,即第i帧存在缺失,将上一帧的历史加权平均值作为当前帧的原始预测值
Figure BDA0003146332260000142
并根据所述滑动指数平均算法分别将全部所述缺失值对应帧的上一帧的历史平均加权值作为当前帧的初始预测值,形成所述目标检测结果集。
在上述实施例的基础上,步骤S107所述的,对所述目标检测结果集进行自适应滤波,得到包含火眼标注框的目标视频,包括:
将所述目标检测结果集中的第一帧初始化递归最小二乘滤波器;
将所述目标检测结果集中的全部帧依次输入所述递归最小二乘滤波器,得到所述目标视频。
具体实施时,考虑到YOLO模型的输出结果只基于单帧图片,视频中相邻帧火眼内熔融电解质的运动情况差异会对YOLO模型的检测结果造成影响,导致相邻帧的结果存在抖动现象。本发明拟采用自适应滤波的方式,按视频时间顺序迭代的方法对经过异常值剔除的原始结果进行进一步处理。
递归最小二乘滤波是一种迭代式的基于最小均方误差准则的自适应滤波算法。本算法使用二阶递归最小二乘滤波器,其计算公式为:
Figure BDA0003146332260000143
其中xk为第k时刻滤波器的输入值,
Figure BDA0003146332260000144
分别为第k时刻滤波器的输出、输出的一阶导数预测值、二阶导数预测值,
Figure BDA0003146332260000151
Figure BDA0003146332260000156
为时变增益。
采用原始视频第一帧的火眼标注框结果初始化递归最小二乘滤波器;按原始视频帧顺序依次取第t帧经过异常值填补的火眼标注框
Figure BDA0003146332260000152
进行处理,将其输入递归最小二乘滤波器,得到最终滤波平滑的结果
Figure BDA0003146332260000153
经过整个流程处理的铝电解槽的包含火眼标注框的目标视频为
Figure BDA0003146332260000154
其中m为所述初始视频的帧数,
Figure BDA0003146332260000155
Figure BDA0003146332260000157
分别为第t帧火眼标注框中心x坐标、中心y坐标、宽度和高度。
与上面的方法实施例相对应,参见图3,本公开实施例还提供了一种火眼视频自适应检测装置30,包括:
采集模块301,用于采集目标区域对应的初始视频,其中,所述目标区域包括火眼的位置;
截取模块302,用于从所述初始视频中截取多张初始图片,并对全部所述初始图片添加饱和度通道,形成RGBS四通道的样本图片;
训练模块303,用于将全部所述样本图片训练原始模型,得到目标模型;
输入模块304,用于将所述初始视频输入所述目标模型,得到所述初始视频中每一帧对应的检测结果,形成初始检测结果集;
剔除模块305,用于采用预设算法剔除所述初始检测结果集中的异常的检测结果,得到中间检测结果集;
填补模块306,用于检测所述中间检测结果集中的缺失值,并对全部所述缺失值进行填补,得到目标检测结果集;
滤波模块307,用于对所述目标检测结果集进行自适应滤波,得到包含火眼标注框的目标视频。
图3所示装置可以对应的执行上述方法实施例中的内容,本实施例未详细描述的部分,参照上述方法实施例中记载的内容,在此不再赘述。
参见图4,本公开实施例还提供了一种电子设备40,该电子设备包括:至少一个处理器以及与该至少一个处理器通信连接的存储器。其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述方法实施例中的火眼视频自适应检测方法。
本公开实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述方法实施例中的火眼视频自适应检测方法。
本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述方法实施例中的火眼视频自适应检测方法。
下面参考图4,其示出了适于用来实现本公开实施例的电子设备40的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,电子设备40可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备40操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备40与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种装置的电子设备40,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备可以执行上述方法实施例的相关步骤。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备可以执行上述方法实施例的相关步骤。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种火眼视频自适应检测方法,其特征在于,包括:
采集目标区域对应的初始视频,其中,所述目标区域包括火眼的位置;
从所述初始视频中截取多张初始图片,并对全部所述初始图片添加饱和度通道,形成RGBS四通道的样本图片;
将全部所述样本图片训练原始模型,得到目标模型;
将所述初始视频输入所述目标模型,得到所述初始视频中每一帧对应的检测结果,形成初始检测结果集;
采用预设算法剔除所述初始检测结果集中的异常的检测结果,得到中间检测结果集;
检测所述中间检测结果集中的缺失值,并对全部所述缺失值进行填补,得到目标检测结果集;
对所述目标检测结果集进行自适应滤波,得到包含火眼标注框的目标视频。
2.根据权利要求1所述的方法,其特征在于,所述将所述初始视频输入所述目标模型,得到所述初始视频中每一帧对应的检测结果,形成初始检测结果集的步骤,包括:
所述目标模型对所述初始视频中每一帧进行目标检测,得到每一帧对应的目标物体数量及对应的坐标;
根据所述初始视频中的全部帧对应的目标物体数量及对应的坐标,形成所述初始检测结果集。
3.根据权利要求2所述的方法,其特征在于,所述采用预设算法剔除所述初始检测结果集中的异常的检测结果,得到中间检测结果集的步骤之前,所述方法还包括:
当检测到所述初始视频中的目标帧包含的目标物体数量不为1时,则判定所述目标帧的检测结果为异常;
将所述检测结果为异常的目标帧标识为异常帧。
4.根据权利要求3所述的方法,其特征在于,所述采用预设算法剔除所述初始检测结果集中的异常的检测结果,得到中间检测结果集的步骤,包括:
采用DBSCAN聚类算法剔除全部所述异常帧中所述火眼的坐标异常值;
对剔除坐标异常值后的初始检测结果集采用三西格马定律剔除所述异常帧中所述火眼的规格异常值,得到中间检测结果集。
5.根据权利要求4所述的方法,其特征在于,所述检测所述中间检测结果集中的缺失值,并对全部所述缺失值进行填补,得到目标检测结果集的步骤,包括:
将所述中间检测结果集中的第一帧初始化滑动指数平均算法;
根据所述滑动指数平均算法计算所述初始视频中每一帧的历史平均加权值;
分别将全部所述缺失值对应帧的上一帧的历史平均加权值作为当前帧的初始预测值,形成所述目标检测结果集。
6.根据权利要求5所述的方法,其特征在于,所述对所述目标检测结果集进行自适应滤波,得到包含火眼标注框的目标视频的步骤,包括:
将所述目标检测结果集中的第一帧初始化递归最小二乘滤波器;
将所述目标检测结果集中的全部帧依次输入所述递归最小二乘滤波器,得到所述目标视频。
7.根据权利要求1所述的方法,其特征在于,所述将全部所述样本图片训练原始模型,得到目标模型的步骤之前,所述方法还包括:
获取中间模型;
将所述中间模型的输入卷积层修改为四通道,得到所述目标模型。
8.一种火眼视频自适应检测装置,其特征在于,包括:
采集模块,用于采集目标区域对应的初始视频,其中,所述目标区域包括火眼的位置;
截取模块,用于从所述初始视频中截取多张初始图片,并对全部所述初始图片添加饱和度通道,形成RGBS四通道的样本图片;
训练模块,用于将全部所述样本图片训练原始模型,得到目标模型;
输入模块,用于将所述初始视频输入所述目标模型,得到所述初始视频中每一帧对应的检测结果,形成初始检测结果集;
剔除模块,用于采用预设算法剔除所述初始检测结果集中的异常的检测结果,得到中间检测结果集;
填补模块,用于检测所述中间检测结果集中的缺失值,并对全部所述缺失值进行填补,得到目标检测结果集;
滤波模块,用于对所述目标检测结果集进行自适应滤波,得到包含火眼标注框的目标视频。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述权利要求1-7中任一项所述的火眼视频自适应检测方法。
10.一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述权利要求1-7中任一项所述的火眼视频自适应检测方法。
CN202110751278.2A 2021-07-02 2021-07-02 火眼视频自适应检测方法、装置、设备及介质 Active CN113469057B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110751278.2A CN113469057B (zh) 2021-07-02 2021-07-02 火眼视频自适应检测方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110751278.2A CN113469057B (zh) 2021-07-02 2021-07-02 火眼视频自适应检测方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN113469057A true CN113469057A (zh) 2021-10-01
CN113469057B CN113469057B (zh) 2023-04-28

Family

ID=77877611

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110751278.2A Active CN113469057B (zh) 2021-07-02 2021-07-02 火眼视频自适应检测方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113469057B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020103676A1 (zh) * 2018-11-23 2020-05-28 腾讯科技(深圳)有限公司 图像识别方法、装置、系统及存储介质
CN111767783A (zh) * 2020-04-22 2020-10-13 杭州海康威视数字技术股份有限公司 行为检测、模型训练方法、装置、电子设备及存储介质
WO2020206861A1 (zh) * 2019-04-08 2020-10-15 江西理工大学 基于YOLO v3的针对交通枢纽关键物体的检测方法
CN111967393A (zh) * 2020-08-18 2020-11-20 杭州师范大学 一种基于改进YOLOv4的安全帽佩戴检测方法
CN112132090A (zh) * 2020-09-28 2020-12-25 天地伟业技术有限公司 一种基于yolov3的烟火自动检测预警方法
CN112861998A (zh) * 2021-03-16 2021-05-28 上海东普信息科技有限公司 神经网络模型构建方法、安全通道异常监测方法及系统
CN112906463A (zh) * 2021-01-15 2021-06-04 上海东普信息科技有限公司 基于图像的火情检测方法、装置、设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020103676A1 (zh) * 2018-11-23 2020-05-28 腾讯科技(深圳)有限公司 图像识别方法、装置、系统及存储介质
WO2020206861A1 (zh) * 2019-04-08 2020-10-15 江西理工大学 基于YOLO v3的针对交通枢纽关键物体的检测方法
CN111767783A (zh) * 2020-04-22 2020-10-13 杭州海康威视数字技术股份有限公司 行为检测、模型训练方法、装置、电子设备及存储介质
CN111967393A (zh) * 2020-08-18 2020-11-20 杭州师范大学 一种基于改进YOLOv4的安全帽佩戴检测方法
CN112132090A (zh) * 2020-09-28 2020-12-25 天地伟业技术有限公司 一种基于yolov3的烟火自动检测预警方法
CN112906463A (zh) * 2021-01-15 2021-06-04 上海东普信息科技有限公司 基于图像的火情检测方法、装置、设备及存储介质
CN112861998A (zh) * 2021-03-16 2021-05-28 上海东普信息科技有限公司 神经网络模型构建方法、安全通道异常监测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZUGUO CHEN等: "Semantic Network Based on Intuitionistic Fuzzy Directed Hyper-Graphs and Application to Aluminum Electrolysis Cell Condition Identification", 《DIGITAL OBJECT IDENTIFIER》 *
宋建国等: "基于YOLOv2模型的道路目标检测改进算法", 《软件导刊》 *

Also Published As

Publication number Publication date
CN113469057B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
CN111476309B (zh) 图像处理方法、模型训练方法、装置、设备及可读介质
CN109726739A (zh) 一种目标检测方法和系统
CN112037223B (zh) 图像缺陷检测方法、装置及电子设备
CN110910445B (zh) 一种物件尺寸检测方法、装置、检测设备及存储介质
CN112801047B (zh) 缺陷检测方法、装置、电子设备及可读存储介质
CN110335313A (zh) 音频采集设备定位方法及装置、说话人识别方法及系统
CN111222509A (zh) 目标检测方法、装置及电子设备
CN112232311A (zh) 人脸跟踪方法、装置及电子设备
CN112052730A (zh) 一种3d动态人像识别监控设备及方法
CN110069997B (zh) 场景分类方法、装置及电子设备
CN113592033B (zh) 油罐图像识别模型训练方法、油罐图像识别方法和装置
CN114898154A (zh) 一种增量式目标检测方法、装置、设备及介质
CN115272182A (zh) 车道线检测方法、装置、电子设备和计算机可读介质
CN114445684A (zh) 车道线分割模型的训练方法、装置、设备及存储介质
CN111627029B (zh) 图像实例分割结果的获取方法及装置
CN110378936B (zh) 光流计算方法、装置及电子设备
CN110555861B (zh) 光流计算方法、装置及电子设备
CN110197459B (zh) 图像风格化生成方法、装置及电子设备
CN113469057B (zh) 火眼视频自适应检测方法、装置、设备及介质
CN111832354A (zh) 目标对象年龄识别方法、装置及电子设备
CN113379733B (zh) 无参考图像质量评价的分块标签权重度量方法及设备
CN114972113A (zh) 图像处理方法、装置、电子设备及可读存储介质
CN111414921B (zh) 样本图像处理方法、装置、电子设备及计算机存储介质
CN111680754B (zh) 图像分类方法、装置、电子设备及计算机可读存储介质
CN112036519B (zh) 基于多位sigmoid的分类处理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant