CN109448307A - 一种火源目标的识别方法和装置 - Google Patents
一种火源目标的识别方法和装置 Download PDFInfo
- Publication number
- CN109448307A CN109448307A CN201811340534.3A CN201811340534A CN109448307A CN 109448307 A CN109448307 A CN 109448307A CN 201811340534 A CN201811340534 A CN 201811340534A CN 109448307 A CN109448307 A CN 109448307A
- Authority
- CN
- China
- Prior art keywords
- candidate
- fire disaster
- characteristic pattern
- feature
- roi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000012360 testing method Methods 0.000 claims abstract description 34
- 230000000306 recurrent effect Effects 0.000 claims abstract description 11
- 238000000605 extraction Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 4
- 238000003860 storage Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 18
- 238000013527 convolutional neural network Methods 0.000 description 14
- 230000009467 reduction Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 230000003213 activating effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000003475 lamination Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B17/00—Fire alarms; Alarms responsive to explosion
- G08B17/12—Actuation by presence of radiation or particles, e.g. of infrared radiation or of ions
- G08B17/125—Actuation by presence of radiation or particles, e.g. of infrared radiation or of ions by using a video camera to detect fire or smoke
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Emergency Management (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种火源目标的识别方法和装置,涉及图像检测技术领域。其中,本发明的火源目标识别方法基于Faster RCNN算法进行火源目标识别,包括:将待测图像输入特征提取网络,以得到所述待测图像的特征图;将所述特征图输入候选区域生成网络,以得到候选框,然后将所述候选框映射至所述特征图上,以得到感兴趣区ROI;基于最小外接矩形算法对所述ROI进行处理,以得到固定尺寸的候选特征图;将所述候选特征图输入分类与回归网络,以预测所述候选特征图是否包括火源目标,并对所述候选框进行位置调整。通过以上步骤,能够解决现有火源目标识别方法存在的检测速度慢、检测精度低、鲁棒性差的问题。
Description
技术领域
本发明涉及图像检测技术领域,尤其涉及一种火源目标的识别方法和装置。
背景技术
目标识别是指一个特殊目标(或一种类型的目标)从其它目标(或其它类型的目标)中被区分出来的过程。在消防领域,对图像进行火源目标识别,准确定位火源目标所在位置,便于后续跟踪、分析火灾情况。
目前,对于火源目标的图像识别主要是根据火源目标所具有的特性,比如色谱特性、可见光和红外辐射特性、蔓延趋势情况等,来区分出火源或烟雾区。在现有技术中,主要包括以下两种火源目标检测方法:一是基于BP神经网络对人工选取的图像颜色特征、纹理特征和形状特征进行分析,以识别火源目标;另一种是先对图像进行分割,然后基于火源目标特性从图像中识别出火灾区域。
本发明的发明人发现:第一种方法对人工选取的特征具有较强的依赖性,识别效果受人工选取的特征的影响较大;第二种方法虽然能识别出火源目标,但是存在处理时间长、复杂度高、鲁棒性差等问题。
因此,针对以上不足,需要提供一种新的火源目标识别方法和装置。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是解决现有火源目标识别方法存在的检测速度慢、检测精度低、鲁棒性差的问题。
(二)技术方案
为了解决上述技术问题,一方面,本发明提供了一种火源目标识别方法。
本发明的火源目标识别方法基于Faster RCNN算法进行火源目标识别,包括:将待测图像输入特征提取网络,以得到所述待测图像的特征图;将所述特征图输入候选区域生成网络,以得到候选框,然后将所述候选框映射至所述特征图上,以得到感兴趣区ROI;基于最小外接矩形算法对所述ROI进行处理,以得到固定尺寸的候选特征图;将所述候选特征图输入分类与回归网络,以预测所述候选特征图是否包括火源目标,并对所述候选框进行位置调整。
可选地,所述方法还包括:在执行所述将待测图像输入特征提取网络的步骤之前,对采集的彩色图像进行灰度处理,以得到所述待测图像。
可选地,所述特征提取网络采用VGG16网络结构的一部分,包括:第一至第五卷积单元;其中,第一、二卷积单元各自包括两个卷积层;第三、四、五卷积单元各自包括三个卷积层;以及,在每个卷积层后设置的非线性单元和在相邻两个卷积单元之间设置的池化层。
可选地,所述非线性单元采用Leaky ReLu函数,其表达式为:
其中,x为非线性单元的输入,f(x)为非线性单元的输出,α为常系数。
为了解决上述技术问题,另一方面,本发明还提供了一种火源目标识别装置。
本发明的火源目标识别装置基于Faster RCNN算法进行火源目标识别,包括:特征提取模块,用于将待测图像输入特征提取网络,以得到所述待测图像的特征图;ROI生成模块,用于将所述特征图输入候选区域生成网络,以得到候选框,然后将所述候选框映射至所述特征图上,以得到感兴趣区ROI;ROI处理模块,用于基于最小外接矩形算法对所述ROI进行处理,以得到固定尺寸的候选特征图;预测模块,用于将所述候选特征图输入分类与回归网络,以预测所述候选特征图是否包括火源目标,并对所述候选框进行位置调整。
可选地,所述装置还包括:预处理模块,用于对采集的彩色图像进行灰度处理,以得到所述待测图像。
可选地,所述特征提取网络采用VGG16网络结构的一部分,包括:第一至第五卷积单元;其中,第一、二卷积单元各自包括两个卷积层;第三、四、五卷积单元各自包括三个卷积层;以及,在每个卷积层后设置的非线性单元和在相邻两个卷积单元之间设置的池化层。
可选地,所述非线性单元采用Leaky ReLu函数,其表达式为:
其中,x为非线性单元的输入,f(x)为非线性单元的输出,α为常系数。
为了解决上述技术问题,再一方面,本发明还提供了一种电子设备。
本发明的电子设备,包括:一个或多个处理器;以及,存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明的火源目标的识别方法。
为了解决上述技术问题,又一方面,本发明还提供了一种计算机可读介质。
本发明的计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明的火源目标的识别方法。
(三)有益效果
本发明的上述技术方案具有如下优点:通过基于Faster R-CNN算法进行火源目标识别,提高了火源目标识别的检测速度和检测精度,减少少报和漏报的情况。通过在FasterR-CNN算法中,采用最小外接矩形算法对ROI进行处理,能够得到固定大小的候选特征图,能够减少背景信息、突出前景信息,提高火源目标识别的准确率。
附图说明
图1是本发明实施例一的火源目标的识别方法的流程图;
图2是本发明实施例二的火源目标的识别方法的流程图;
图3是本发明实施例二中的特征提取网络的结构示意图;
图4是本发明实施例三的火源目标的识别装置的模块组成示意图;
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
如图1所示,本发明实施例提供的火源目标的识别方法基于Faster RCNN算法进行火源目标识别,主要包括以下步骤:
步骤S101、将待测图像输入特征提取网络,以得到所述待测图像的特征图。
示例性地,所述特征提取网络可以为VGG16网络结构的一部分,包括:第一至第五卷积单元;其中,第一、二卷积单元各自包括两个卷积层;第三、四、五卷积单元各自包括三个卷积层;以及,在每个卷积层后设置的非线性单元和在相邻两个卷积单元之间设置的池化层。其中,卷积层的主要作用为提取待测图像的局部特征;非线性单元(或者称为激活函数)的主要作用为对特征数据加入非线性因素;池化层的主要作用为实现特征数据的降维、减小特征数据的空间大小等。另外,在具体实施时,所述特征提取网络还可以采用其他卷积神经网络结构,比如ZF Net等。
步骤S102、将所述特征图输入候选区域生成网络,以得到候选框,然后将所述候选框映射至所述特征图上,以得到感兴趣区ROI。
其中,所述候选区域生成网络(RPN)可包括:一个卷积层、两个并行的全连接层。在该步骤中,可先通过在所述特征图上面移动卷积层的n*n(比如3*3)滑窗,以生成256维或512维的全连接特征,然后将全连接特征输入两个并行的全连接层,以粗略地进行类别预测和边框回归,然后通过对两个并行的全连接层的预测结果进行汇总,以筛选出候选框。接下来,将得到的候选框映射至所述特征图上,以得到感兴趣区(ROI)。
步骤S103、基于最小外接矩形算法对所述ROI进行处理,以得到固定尺寸的候选特征图。
步骤S104、将所述候选特征图输入分类与回归网络,以预测所述候选特征图是否包括火源目标,并对所述候选框进行位置调整。
在本发明实施例中,通过基于Faster R-CNN算法进行火源目标识别,提高了火源目标识别的检测速度和检测精度,减少少报和漏报的情况。通过在Faster R-CNN算法中,采用最小外接矩形算法对ROI进行处理,能够得到固定大小的候选特征图,能够减少背景信息、突出前景信息,提高火源目标识别的准确率。
实施例二
如图2所示,本发明实施例提供的火源目标的识别方法主要基于Faster RCNN算法进行火源目标识别,主要包括以下步骤:
步骤S201、基于无人机载摄像头对火源区域进行拍摄,得到彩色图像。
步骤S202、对彩色图像进行灰度处理,并基于处理得到的灰度图像构建训练样本集和测试样本集。
在具体实施时,也可先将采集得到的彩色图像划分为训练样本集和测试样本集,再对彩色图像进行灰度处理。
步骤S203、基于训练样本集对基于Faster RCNN算法的网络结构进行训练,以得到训练后的网络结构;所述训练后的网络结构包括:特征提取网络、候选区域生成网络、分类与回归网络。
步骤S204、将测试样本集中的待测图像输入特征提取网络,以得到所述待测图像的特征图。
示例性地,所述特征提取网络可以为VGG16网络结构的一部分(如图3所示),包括:第一至第五卷积单元;其中,第一、二卷积单元各自包括两个卷积层;第三、四、五卷积单元各自包括三个卷积层;以及,在每个卷积层后设置的非线性单元和在相邻两个卷积单元之间设置的池化层。
在特征提取网络中,所述卷积层的主要作用为提取待测图像的局部特征。在一可选实施方式中,可将特征提取网络中卷积层的卷积核(或称为“过滤器”)设为3*3的矩阵,通过在待测图像上移动卷积核并通过计算待测图像对应位置像素与卷积核的点积得到的矩阵,即可看做卷积层提取的局部特征。在特征提取网络中,所述非线性单元(或者称为激活函数)的主要作用为对特征数据加入非线性因素。在特征提取网络中,所述池化层的主要作用为实现特征数据的降维、减小特征数据的空间大小等。在一可选实施方式中,所述池化层可采用最大池化的方法进行池化处理。
在一可选实施方式中,所述非线性单元可采用Leaky ReLu函数,其表达式为:
其中,x为非线性单元的输入,f(x)为非线性单元的输出,α为常系数。示例性地,α可设为0.01。
在本发明实施例中,通过在Faster R-CNN算法中,采用Leaky ReLU函数修正了数据分布,保留一些负轴的值,使正负轴的信息都不会丢失。
步骤S205、将所述特征图输入候选区域生成网络,以得到候选框,然后将所述候选框映射至所述特征图上,以得到感兴趣区ROI。
其中,所述候选区域生成网络(RPN)可包括:一个卷积层、两个并行的全连接层。在该步骤中,可先通过在所述特征图上面移动卷积层的n*n(比如3*3)滑窗,以生成256维或512维的全连接特征,然后将全连接特征输入两个并行的全连接层,以粗略地进行类别预测和边框回归,然后通过对两个并行的全连接层的预测结果进行汇总,以筛选出候选框。接下来,将得到的候选框映射至所述特征图上,以得到感兴趣区(ROI)。
步骤S206、基于最小外接矩形算法对所述ROI进行处理,以得到固定尺寸的候选特征图。
最小外接矩形算法一般包括以下步骤:首先确定边框区域,设定旋转中心,将边框区域按一定角度沿旋转中心旋转,并记录其轮廊在坐标系方向上的外接矩形参数(比如长度、宽度、面积),以得到面积最小的外接矩形。
具体来说,在该步骤中,可先确定ROI中每个候选框内图像的最外层轮廓,然后基于最小外接矩形算法确定所述最外层轮廓的最小外接矩形,并以该最小外接矩形的中心点为中心、以固定的长度和宽度在特征图上绘制矩形,并将绘制的矩形作为尺寸调整后的候选框,从而得到多个固定尺寸的候选特征图。进一步,为了提高图像处理速度,还可在确定ROI中每个候选框内图像的最外层轮廓之前,先对ROI中每个候选框内的图像进行均值滤波和二值化处理。
在现有技术中,通常是通过最大池化方法对ROI进行处理以得到固定尺寸的候选特征图,这种方式可能造成特征图信息丢失,进而影响火源目标识别效果。与现有技术相比,本发明实施例通过步骤S206无需对特征图作进一步的池化处理,有效避免了特征图信息丢失的情况,有助于提高火源目标识别效果。
在本发明实施例中,通过在Faster R-CNN算法中,采用最小外接矩形算法对ROI进行处理,能够得到固定大小的候选特征图,能够减少背景信息、突出前景信息,提高火源目标识别的准确率。
步骤S207、将所述候选特征图输入分类与回归网络,以预测所述候选特征图是否包括火源目标,并对所述候选框进行位置调整。
其中,所述分类与回归网络包括分类器和回归器。分类器用于对所述候选特征图是否包括火源目标进行预测,回归器用于对所述候选框进行位置调整。在一可选实施方式中,所述分类器可采用softmax函数计算类别概率。进一步,可基于Softmax Loss函数对分类器进行训练。具体来说,Softmax Loss函数的表达式如下:
其中,Sj为Softmax函数的输出向量S的第j个值,yj为该候选特征图的类别,L表示Softmax Loss的计算结果。
在本发明实施例中,通过以上步骤能够实现火源目标的识别,有效解决现有火源目标识别方法存在的检测速度慢、检测精度低、鲁棒性差的问题。具体来说,本发明实施例通过基于Faster R-CNN算法进行火源目标识别,提高了火源目标识别的检测速度和检测精度,减少少报和漏报的情况。通过在Faster R-CNN算法中,采用Leaky ReLU函数修正了数据分布,保留一些负轴的值,使正负轴的信息都不会丢失。通过在Faster R-CNN算法中,采用最小外接矩形算法对ROI进行处理,能够得到固定大小的候选特征图,能够减少背景信息、突出前景信息,提高火源目标识别的准确率。
实施例三
如图4所示,本发明实施例提供的火源目标的识别装置400主要基于Faster RCNN算法进行火源目标识别,主要包括以下模块:特征提取模块401、ROI生成模块402、ROI处理模块403、预测模块404。
特征提取模块401,用于将待测图像输入特征提取网络,以得到所述待测图像的特征图。
示例性地,所述特征提取网络可以为VGG16网络结构的一部分,包括:第一至第五卷积单元;其中,第一、二卷积单元各自包括两个卷积层;第三、四、五卷积单元各自包括三个卷积层;以及,在每个卷积层后设置的非线性单元和在相邻两个卷积单元之间设置的池化层。其中,卷积层的主要作用为提取待测图像的局部特征;非线性单元(或者称为激活函数)的主要作用为对特征数据加入非线性因素;池化层的主要作用为实现特征数据的降维、减小特征数据的空间大小等。
在特征提取网络中,所述卷积层的主要作用为提取待测图像的局部特征。在一可选实施方式中,可将特征提取网络中卷积层的卷积核(或称为“过滤器”)设为3*3的矩阵,通过在待测图像上移动卷积核并通过计算待测图像对应位置像素与卷积核的点积得到的矩阵,即可看做卷积层提取的局部特征。在特征提取网络中,所述非线性单元(或者称为激活函数)的主要作用为对特征数据加入非线性因素。在特征提取网络中,所述池化层的主要作用为实现特征数据的降维、减小特征数据的空间大小等。在一可选实施方式中,所述池化层可采用最大池化的方法进行池化处理。
在一可选实施方式中,所述非线性单元可采用Leaky ReLu函数,其表达式为:
其中,x为非线性单元的输入,f(x)为非线性单元的输出,α为常系数。示例性地,α可设为0.01。
在本发明实施例中,通过在Faster R-CNN算法中,采用Leaky ReLU函数修正了数据分布,保留一些负轴的值,使正负轴的信息都不会丢失。
ROI生成模块402,用于将所述特征图输入候选区域生成网络,以得到候选框,然后将所述候选框映射至所述特征图上,以得到感兴趣区ROI。
其中,所述候选区域生成网络(RPN)可包括:一个卷积层、两个并行的全连接层。具体来说,ROI生成模块402可先通过在所述特征图上面移动卷积层的n*n(比如3*3)滑窗,以生成256维或512维的全连接特征,然后将全连接特征输入两个并行的全连接层,以粗略地进行类别预测和边框回归,然后通过对两个并行的全连接层的预测结果进行汇总,以筛选出候选框。接下来,ROI生成模块402将得到的候选框映射至所述特征图上,以得到感兴趣区(ROI)。
ROI处理模块403,用于基于最小外接矩形算法对所述ROI进行处理,以得到固定尺寸的候选特征图。
最小外接矩形算法一般包括以下步骤:首先确定边框区域,设定旋转中心,将边框区域按一定角度沿旋转中心旋转,并记录其轮廊在坐标系方向上的外接矩形参数(比如长度、宽度、面积),以得到面积最小的外接矩形。
具体来说,ROI处理模块403可先确定ROI中每个候选框内图像的最外层轮廓,然后基于最小外接矩形算法确定所述最外层轮廓的最小外接矩形,并以该最小外接矩形的中心点为中心、以固定的长度和宽度在特征图上绘制矩形,并将绘制的矩形作为尺寸调整后的候选框,从而得到多个固定尺寸的候选特征图。进一步,为了提高图像处理速度,ROI处理模块403还可在确定ROI中每个候选框内图像的最外层轮廓之前,先对ROI中每个候选框内的图像进行均值滤波和二值化处理。
在现有技术中,通常是通过最大池化方法对ROI进行处理以得到固定尺寸的候选特征图,这种方式可能造成特征图信息丢失,进而影响火源目标识别效果。与现有技术相比,本发明实施例通过设置ROI处理模块403,无需对特征图作进一步的池化处理,有效避免了特征图信息丢失的情况,有助于提高火源目标的识别效果。
在本发明实施例中,通过在Faster R-CNN算法中,采用最小外接矩形算法对ROI进行处理,能够得到固定大小的候选特征图,能够减少背景信息、突出前景信息,提高火源目标识别的准确率。
预测模块404,用于将所述候选特征图输入分类与回归网络,以预测所述候选特征图是否包括火源目标,并对所述候选框进行位置调整。
其中,所述分类与回归网络包括分类器和回归器。分类器用于对所述候选特征图是否包括火源目标进行预测,回归器用于对所述候选框进行位置调整。在一可选实施方式中,所述分类器可采用softmax函数计算类别概率。进一步,预测模块404可基于SoftmaxLoss函数对分类器进行训练。具体来说,Softmax Loss函数的表达式如下:
其中,Sj为Softmax函数的输出向量S的第j个值,yj为该候选特征图的类别,L表示Softmax Loss的计算结果。
在本发明实施例中,通过以上装置能够实现火源目标的识别,有效解决现有火源目标识别方法存在的检测速度慢、检测精度低、鲁棒性差的问题。具体来说,本发明实施例通过基于Faster R-CNN算法进行火源目标识别,提高了火源目标识别的检测速度和检测精度,减少少报和漏报的情况。通过在Faster R-CNN算法中,采用Leaky ReLU函数修正了数据分布,保留一些负轴的值,使正负轴的信息都不会丢失。通过在Faster R-CNN算法中,采用最小外接矩形算法对ROI进行处理,能够得到固定大小的候选特征图,能够减少背景信息、突出前景信息,提高火源目标识别的准确率。
作为另一方面,本发明还提供了一种电子设备,该电子设备可包括:一个或多个处理器;以及,存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的火源目标的识别方法。
作为再一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备执行以下流程:将待测图像输入特征提取网络,以得到所述待测图像的特征图;将所述特征图输入候选区域生成网络,以得到候选框,然后将所述候选框映射至所述特征图上,以得到感兴趣区ROI;基于最小外接矩形算法对所述ROI进行处理,以得到固定尺寸的候选特征图;将所述候选特征图输入分类与回归网络,以预测所述候选特征图是否包括火源目标,并对所述候选框进行位置调整。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种火源目标的识别方法,其特征在于,所述方法基于Faster RCNN算法进行火源目标识别,包括:
将待测图像输入特征提取网络,以得到所述待测图像的特征图;
将所述特征图输入候选区域生成网络,以得到候选框,然后将所述候选框映射至所述特征图上,以得到感兴趣区ROI;
基于最小外接矩形算法对所述ROI进行处理,以得到固定尺寸的候选特征图;
将所述候选特征图输入分类与回归网络,以预测所述候选特征图是否包括火源目标,并对所述候选框进行位置调整。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在执行所述将待测图像输入特征提取网络的步骤之前,对采集的彩色图像进行灰度处理,以得到所述待测图像。
3.根据权利要求1所述的方法,其特征在于,所述特征提取网络采用VGG16网络结构的一部分,包括:
第一至第五卷积单元;其中,第一、二卷积单元各自包括两个卷积层;第三、四、五卷积单元各自包括三个卷积层;
以及,在每个卷积层后设置的非线性单元和在相邻两个卷积单元之间设置的池化层。
4.根据权利要求3所述的方法,其特征在于,所述非线性单元采用Leaky ReLu函数,其表达式为:
其中,x为非线性单元的输入,f(x)为非线性单元的输出,α为常系数。
5.一种火源目标的识别装置,其特征在于,所述装置基于Faster RCNN算法进行火源目标识别,包括:
特征提取模块,用于将待测图像输入特征提取网络,以得到所述待测图像的特征图;
ROI生成模块,用于将所述特征图输入候选区域生成网络,以得到候选框,然后将所述候选框映射至所述特征图上,以得到感兴趣区ROI;
ROI处理模块,用于基于最小外接矩形算法对所述ROI进行处理,以得到固定尺寸的候选特征图;
预测模块,用于将所述候选特征图输入分类与回归网络,以预测所述候选特征图是否包括火源目标,并对所述候选框进行位置调整。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
预处理模块,用于对采集的彩色图像进行灰度处理,以得到所述待测图像。
7.根据权利要求5所述的装置,其特征在于,所述特征提取网络采用VGG16网络结构的一部分,包括:
第一至第五卷积单元;其中,第一、二卷积单元各自包括两个卷积层;第三、四、五卷积单元各自包括三个卷积层;
以及,在每个卷积层后设置的非线性单元和在相邻两个卷积单元之间设置的池化层。
8.根据权利要求7所述的方法,其特征在于,所述非线性单元采用Leaky ReLu函数,其表达式为:
其中,x为非线性单元的输入,f(x)为非线性单元的输出,α为常系数。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至4中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至4中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811340534.3A CN109448307A (zh) | 2018-11-12 | 2018-11-12 | 一种火源目标的识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811340534.3A CN109448307A (zh) | 2018-11-12 | 2018-11-12 | 一种火源目标的识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109448307A true CN109448307A (zh) | 2019-03-08 |
Family
ID=65551613
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811340534.3A Pending CN109448307A (zh) | 2018-11-12 | 2018-11-12 | 一种火源目标的识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109448307A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109815917A (zh) * | 2019-01-28 | 2019-05-28 | 孙刘云 | 一种消防无人机进行火源目标识别的方法 |
CN110705339A (zh) * | 2019-04-15 | 2020-01-17 | 中国石油大学(华东) | 一种基于c-c3d的手语识别方法 |
CN110956611A (zh) * | 2019-11-01 | 2020-04-03 | 武汉纺织大学 | 一种集成卷积神经网络的烟雾检测方法 |
CN110975191A (zh) * | 2019-12-24 | 2020-04-10 | 尹伟 | 一种无人机灭火方法 |
CN111160336A (zh) * | 2019-12-09 | 2020-05-15 | 平安科技(深圳)有限公司 | 目标检测方法、装置及计算机可读存储介质 |
CN112101373A (zh) * | 2019-06-18 | 2020-12-18 | 富士通株式会社 | 基于深度学习网络的对象检测方法、装置和电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107247949A (zh) * | 2017-08-02 | 2017-10-13 | 北京智慧眼科技股份有限公司 | 基于深度学习的人脸识别方法、装置和电子设备 |
CN107945153A (zh) * | 2017-11-07 | 2018-04-20 | 广东广业开元科技有限公司 | 一种基于深度学习的路面裂缝检测方法 |
WO2018079400A1 (ja) * | 2016-10-24 | 2018-05-03 | ホーチキ株式会社 | 火災監視システム |
CN108509978A (zh) * | 2018-02-28 | 2018-09-07 | 中南大学 | 基于cnn的多级特征融合的多类目标检测方法及模型 |
-
2018
- 2018-11-12 CN CN201811340534.3A patent/CN109448307A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018079400A1 (ja) * | 2016-10-24 | 2018-05-03 | ホーチキ株式会社 | 火災監視システム |
CN107247949A (zh) * | 2017-08-02 | 2017-10-13 | 北京智慧眼科技股份有限公司 | 基于深度学习的人脸识别方法、装置和电子设备 |
CN107945153A (zh) * | 2017-11-07 | 2018-04-20 | 广东广业开元科技有限公司 | 一种基于深度学习的路面裂缝检测方法 |
CN108509978A (zh) * | 2018-02-28 | 2018-09-07 | 中南大学 | 基于cnn的多级特征融合的多类目标检测方法及模型 |
Non-Patent Citations (2)
Title |
---|
万建伟等: "《实用高光谱遥感图像压缩》", 30 April 2012 * |
严云洋等: "基于Faster R-CNN模型的火焰检测", 《南京师大学报(自然科学版)》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109815917A (zh) * | 2019-01-28 | 2019-05-28 | 孙刘云 | 一种消防无人机进行火源目标识别的方法 |
CN110705339A (zh) * | 2019-04-15 | 2020-01-17 | 中国石油大学(华东) | 一种基于c-c3d的手语识别方法 |
CN112101373A (zh) * | 2019-06-18 | 2020-12-18 | 富士通株式会社 | 基于深度学习网络的对象检测方法、装置和电子设备 |
CN110956611A (zh) * | 2019-11-01 | 2020-04-03 | 武汉纺织大学 | 一种集成卷积神经网络的烟雾检测方法 |
CN111160336A (zh) * | 2019-12-09 | 2020-05-15 | 平安科技(深圳)有限公司 | 目标检测方法、装置及计算机可读存储介质 |
CN110975191A (zh) * | 2019-12-24 | 2020-04-10 | 尹伟 | 一种无人机灭火方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109448307A (zh) | 一种火源目标的识别方法和装置 | |
CN109344736B (zh) | 一种基于联合学习的静态图像人群计数方法 | |
Tao et al. | Smoke detection based on deep convolutional neural networks | |
CN109325418A (zh) | 基于改进YOLOv3的道路交通环境下行人识别方法 | |
CN109741318A (zh) | 基于有效感受野的单阶段多尺度特定目标的实时检测方法 | |
CN103632158B (zh) | 森林防火监控方法及森林防火监控系统 | |
CN107240122A (zh) | 基于时空连续相关滤波的视频目标跟踪方法 | |
CN106780498A (zh) | 基于逐像素点深度卷积网络上皮和基质组织自动分割方法 | |
CN113591968A (zh) | 一种基于非对称注意力特征融合的红外弱小目标检测方法 | |
CN104182772A (zh) | 一种基于深度学习的手势识别方法 | |
CN110795982A (zh) | 一种基于人体姿态分析的表观视线估计方法 | |
Shen et al. | In teacher we trust: Learning compressed models for pedestrian detection | |
CN108960404A (zh) | 一种基于图像的人群计数方法及设备 | |
CN109919246A (zh) | 基于自适应特征聚类和多重损失融合的行人重识别方法 | |
CN110969121A (zh) | 一种基于深度学习的高分辨率雷达目标识别算法 | |
CN112149665A (zh) | 一种基于深度学习的高性能多尺度目标检测方法 | |
CN113191359A (zh) | 基于支持与查询样本的小样本目标检测方法与系统 | |
Liu et al. | Defect detection of the surface of wind turbine blades combining attention mechanism | |
CN115272876A (zh) | 一种基于深度学习的遥感图像船舶目标检测方法 | |
Sun et al. | Image target detection algorithm compression and pruning based on neural network | |
CN117079095A (zh) | 基于深度学习的高空抛物检测方法、系统、介质和设备 | |
Wei et al. | Novel green-fruit detection algorithm based on D2D framework | |
CN111105436B (zh) | 目标跟踪方法、计算机设备及存储介质 | |
Roy et al. | AWDMC-Net: classification of adversarial weather degraded multiclass scenes using a convolution neural network | |
CN103093241B (zh) | 基于同质化处理的光学遥感图像非匀质云层判别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190308 |