CN110322423A - 一种基于图像融合的多模态图像目标检测方法 - Google Patents
一种基于图像融合的多模态图像目标检测方法 Download PDFInfo
- Publication number
- CN110322423A CN110322423A CN201910355408.3A CN201910355408A CN110322423A CN 110322423 A CN110322423 A CN 110322423A CN 201910355408 A CN201910355408 A CN 201910355408A CN 110322423 A CN110322423 A CN 110322423A
- Authority
- CN
- China
- Prior art keywords
- image
- model
- network
- infrared
- registration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 29
- 238000000034 method Methods 0.000 claims abstract description 43
- 238000002156 mixing Methods 0.000 claims abstract description 29
- 230000004927 fusion Effects 0.000 claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 26
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 16
- 230000006870 function Effects 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims abstract description 13
- 230000005855 radiation Effects 0.000 claims abstract description 7
- 238000005070 sampling Methods 0.000 claims abstract description 7
- 238000011176 pooling Methods 0.000 claims abstract description 5
- 239000011248 coating agent Substances 0.000 claims abstract description 4
- 238000000576 coating method Methods 0.000 claims abstract description 4
- 230000004069 differentiation Effects 0.000 claims abstract description 4
- 230000000717 retained effect Effects 0.000 claims abstract description 4
- 230000008602 contraction Effects 0.000 claims abstract description 3
- 238000012360 testing method Methods 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000001931 thermography Methods 0.000 claims description 2
- 238000011524 similarity measure Methods 0.000 claims 1
- 238000013528 artificial neural network Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000007500 overflow downdraw method Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000155 melt Substances 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10048—Infrared image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种基于图像融合的多模态图像目标检测方法,包括:1)将预先采集好的红外图像及其可见光图像,制作多模态图像数据集;2)将预处理好的成对图像作为融合模型中生成模型G的输入;生成模型G基于U‑Net等全卷积网络,以残差网络为基础的卷积神经网络作为生成网络模型结构,包括收缩过程和扩张过程,收缩路径包括多个卷积加ReLU激活层再加最大池化(Max Pooling)结构,下采样的每一步特征通道数都增加一倍,输出生成的融合图像;融合图像输入融合模型中的判别网络模型;根据训练过程中损失函数的变化,按迭代次数调节学习率训练指标,经训练,基于自有多模态图像数据集,能够得到同时保留红外图像热辐射特征和可见光图像结构性纹理特征的图像融合模型。
Description
技术领域
本发明属于深度学习、计算机视觉和图像融合领域,涉及一种基于深度神经网络的红外 -可见光的多模态图像融合模型和目标检测模型的目标检测方法。
背景技术
在自然环境中,物体会辐射出人眼无法看到的不同频率的电磁波,称为热辐射[1]。使 用红外传感器所拍摄出的红外图像,能够记录不同物体的热辐射。红外(InfraredImage,IR) 图像相较于可见光(Visible Image,VI)图像,具有如下特征:能够减少阳光,烟雾等外部 环境的影响[1];对具有明显红外热特性的物体和区域敏感。目前红外图像中的目标检测任 务应用较广,包括军事、电力、建筑等方向均有重要应用。然而,红外图像不具有较高的空 间分辨率和较丰富的细节和明暗对比度,可见边缘和物体细节等往往不可见。红外传感器仅 从一个方面获取信息,因此无法提供所有必需的信息。
对于红外图像而言,利用图像融合技术,可以针对同一个目标得到的不同的图像,以最 大化提取有用信息为目的,生成包含可见光图像中丰富的细节信息和红外图像中热信息的互 补的融合图像[2],可作为目标检测这一高层视觉任务的基础;也可以应用于医疗影像、电 力缺陷等具体应用任务之上。
目标检测(ObjectDetection)是模式识别领域中一个基础性的研究课题,作为被检测物 体的两种不同信息的表达方式,物体类别的获取和物体位置信息的采集是物体检测任务主要 针对的两个问题,主要的评价指标是准确性和实时性。目标检测任务也逐渐由传统方法向深 度学习方法转变,特别是Ross B.Girshick教授R-CNN,FastR-CNN,FasterR-CNN这三项 里程碑式的工作,开创了把深度学习方法应用于目标检测的先河,学界也开启了新的一轮基 于深度学习方法的目标检测技术研究讨论和进展[4]。
目标检测包括以下几个步骤,创建样本数据集(一般均包括正样本和负样本),选择和 提取目标特征,训练检测器。图像数据集中包含相当大的数据量,可以处理原始的图像数据 来得到和其他相比最符合其类别的特点,即提取其特征。可把维数较高的原始数据空间中表 现出的模式,通过非线性特征提取方法进行降维,用于分类和检测。
卷积神经网络(ConvolutionalNeuralNetwork,CNN)提供了一种端到端的学习模型,经 过训练后的卷积神经网络能够较好的学习到图像中的特征,并且完成对图像特征的提取和分 类。
现有的红外和可见光图像融合方法,一般根据其采用的基础理论可主要分为七类。即多 尺度变换,稀疏表示,神经网络和其他方法。基于多尺度变换的方法是图像融合中最活跃的 领域,其假设图像由不同区域中的多个层组成。此类型方法将源图像分解为多个层,使用人 工设计的特定规则分别融合相应的层,并相应地通过逆变换重建目标图像。用于图像分解和 重建的常用变换,包括小波变换,图像金字塔,曲线波等方法。基于稀疏表示的方法,利用 在超完备字典中具有稀疏基础的线性组合的图像的可能表示,来实现其融合。基于神经网络 的方法,通过设计人工神经网络(ArtificialNeuralNetwork,ANN)来模仿人脑的感知行为处 理神经信息,具有良好的适应性,容错性和抗噪声能力。综上所述,现有通用性红外和可见 光图像融合方法各有优缺,因而综合以上的混合模型着力于具体应用需求,结合了特定方法 的优点来提高图像融合性能。除上述外,现今学界亦有基于总变差,模糊理论和信息熵等理 论的图像融合方法[3]。
参考文献
[1]Ma J,Ma Y,Li C.Infrared and visible image fusion methods andapplications:a survey[J].Information Fusion,2019,45:153-178.
[2]王峰,程咏梅.基于Shearlet变换域改进的IR与灰度VIS图像融合算法[J].控制与决策,2017(4):703-708.
[3]Li S,Kang X,Fang L,et al.Pixel-level image fusion:A survey ofthestate ofthe art[J]. Information Fusion,2017,33:100-112.
[4]Elguebaly T,Bouguila N.Finite asymmetric generalized Gaussianmixture models learning for infrared object detection[J].Computer Vision andImage Understanding,2013, 117(12):1659-1671.
发明内容
本发明的目的是提供一种可以提升小目标检测效果的多模态图像目标检测方法。本方法 将图像融合网络作为目标检测模型的前序步骤,提出一种通用的适用于红外图像的目标检测 方法,在获取同一目标的红外和可见光图像的基础上,将图像对通过融合模型生成同时具有 红外和可见光图像特征的融合图像,再通过基于深度神经网络的目标检测模型对融合图像进 行检测,从而克服单一红外传感器的缺少结构特征的问题,对检测结果的提升和实际工程应 用有着重要意义。技术方案如下:
一种基于图像融合的多模态图像目标检测方法,包括下列步骤:
1)将预先采集好的红外图像及其可见光图像,制作多模态图像数据集,图像格式均为 单通道,包含具有结构和纹理特征的可见光图像和具有热成像信息的红外图像,按照图像模 态分别制作训练集和测试集。
2)将步骤1得到的训练集中的红外和可见光的多模态图像对进行包括进行裁剪和旋转 平移操作在内的图像预处理,将预处理好的成对图像作为融合模型中生成模型G的输入;
生成模型G基于U-Net等全卷积网络,以残差网络为基础的卷积神经网络作为生成网 络模型结构,包括收缩过程和扩张过程,收缩路径包括多个卷积加ReLU激活层再加最大池 化(Max Pooling)结构,下采样的每一步特征通道数都增加一倍,输出生成的融合图像。
3)将步骤2中得到生成模型G输出的融合图像输入融合模型中的判别网络模型D,判 别网络模型D由一组孪生架构的卷积神经网络组成,对生成的融合图像进行无监督的质量 评估,包括一组由交叉熵、重建误差、结构误差组成的损失函数,用以对融合图像和训练集 中的原图像进行相似度丈量,来确定图像融合任务的完成度;同时优化生成网络G和判别 网络D,方法为:输入训练集中原图像,更新G,误差变大;更新D,误差变小;更新G, 重建误差变小,最终实现纳什均衡的动态平衡和同时优化;优化方法采用最小二乘的生成对 抗方法。
4)重复进行步骤3,根据训练过程中损失函数的变化,按迭代次数调节学习率训练指标.
经训练,基于自有多模态图像数据集,能够得到同时保留红外图像热辐射特征和可见光 图像结构性纹理特征的图像融合模型。
5)在步骤1中构造的测试集中取红外和可见光的多模态图像对,输入到步骤4中训练 得到的融合模型中,继而输出融合图像。
再将得到的测试集,融合串联进基于深度卷积神经网络的检测模型,以在检测行人的红 外热信息进行试例分析,得到行人的位置以及置信度。
该方法根据红外图像和可见光图像分别具有的热辐射特性和结构化特性,基于图像融合 技术,利用深度神经网络的生成对抗模型和深度目标检测算法,通过训练融合图像生成模型 和检测模型,能够生成同时具有红外辐射和清晰结构的融合图像,将融合模型和检测模型混 合串联,相较于单一红外图像,速度相对较快,并且能够显著提升检测的准确度。
附图说明
图1专利流程图
图2融合模型架构图
图3红外和可见光图像及其融合结果图
图4检测结果图
具体实施方法
为使本发明的技术方案更加清楚,下面结合附图对本发明具体实施方案做进一步的描 述。具体实施方案流程图如图1所示。
本方案的融合网络工作目标是,基于生成对抗网络的结构,学习一种映射函数,该函数 根据多个未标记集合给出的两个输入图像生成融合图像,分别为可见光输入图像v与红外输 入图像u。该网络不仅限于两种图像间的图像域转换,而是可以用于未标记的图像集,应用 于融合任务。
融合图像不仅能够保留红外图像中目标和背景之间高对比度的特性,而且相比于源图像 中能够保留更多纹理细节,类似锐化的红外图像,融合图像具有清晰的突出显示的目标和丰 富的纹理,模型亦可以能够融合不同分辨率的源图像。
判别模型用于判断融合图像间的相似度,生成模型的任务是去产生一个同时包含红外和 可见光信息的融合图像。这两个模型一起对抗训练,生成模型产生一张图片去欺骗判别模型, 然后判别模型去判断这张图片是真是假,最终在这两个模型训练的过程中,两个模型的能力 越来越强,最终达到稳态。
1.构建融合图像生成网络模型(G):
参考U-Net等全卷积网络,构建以残差网络为基础的卷积神经网络作为生成网络模型结 构,包括左边的收缩路径和右边的扩张路径。收缩路径包括多个卷积加RELU激活层再加 最大池化的结构,下采样的每一步特征通道数都增加一倍。
扩张路径的每一步包括上采样、卷积(减少一半通道数),和相应收缩路径中的剪裁过 的特征层的串联以及RELU激活。最后一层用了1×1卷积映射到想要的目标分布。
神经元输入与输出:
2.构建融合图像判别网络模型(D):
构建用于判断融合图像间的相似性度量的分类网络,来分辨融合图像的真实度,即信息 保留度,来引导训练的方向面向图像质量评价指标和图像信息度进行训练。
其中判别网络模型的损失函数如下:
交叉熵损失函数,用于全局优化:
采用交叉熵损失函数,是针对的是生成的融合图片质量不高以及训练过程不稳定这两个 缺陷进行改进。在判别模型D中的最后一个输出层的节点个数与分类任务的目标数相等, 那么对于每一个样例,神经网络得到一个数组作为输出结果,这个数组也就是样本的融合结 果,是神经网络的期望输出结果。
用于无监督的用于G的相似损失函数:
用于检验信息保留程度的G的重构损失函数:
当输入被检测为融合样本对的时候,相似损失函数逐渐减小,相同类型的融合图像会持 续在特征空间形成聚类。反之,当网络输入不相似的样本对时,相似损失函数会逐渐变大。 通过最小化损失函数,最后可以使正样本对之间距离逐渐变小,负样本对之间距离逐渐变大, 从而满足融合任务的需要。
3.训练图像融合生成对抗网络
生成对抗网络训练需要达到纳什均衡,梯度下降法较难实现,所以训练GAN不够稳定, 本技术方法采用如下方法帮助训练:
3.1.使用Wasserstein距离稳定收敛
根据直线采样,梯度惩罚引入参数λ,去掉鉴别器的批正则化,使用Adam参数设置,引入双面惩罚和二次惩罚。
表征了在最优路径规划下的最小消耗,衡量了原始两个分布之间的距离。
3.2.特征匹配方法
使用判别器中间层的特征来匹配图像的真伪,并将其作为一个监督信号来训练生成器, 使得其生成数据会匹配真实数据的统计特性以及判别器中间层的预期特征值。
3.3.小批量方法
判别器每次考虑一小批的样本而不是一个单独样本,使得不同样本在空间上有合适的距 离。
3.4.历史平均方法
加入一个惩罚项来惩罚和历史平均权重相差过多的权重值。
3.5.输入规范化和批规范化
将图像规范化至固定范围,针对真实数据和生成数据构建不同的小批。
3.6.自适应矩估计动态收敛方法
针对生成模型G使用自适应矩估计法Adam作为优化器,针对判别模型D使用随机梯度下降法SGD作为优化器,并且在生成器的不同层去除输入作为噪声。
3.7.控制变量
使用控制变量GAN,以及通过人工约束明确G适应的输入图像任务和顺序。聚焦于图 像的每一部分,输出特征图而不是只输出单一的值。引入一个部分注意力机制用于对更重要 的地方进行融合操作,可以更集中于不同的地方。
4.检测网络搭建
检测网络的输入是融合图像提取的候选区域,输出为固定长度的特征向量。候选区域输 入图像金字塔池化(Spatial Pyramid Pooling)后,将该区域按照N种的尺度划分方法分别划 定了N种S×S的划分区域,每种划分后的候选区域共计有S×S个块(Block)。
将每种候选区域划分中的每一块(Block)进行最大池化(Max Pooling)下采样,共提 取出个特征,并组成特征向量进入候选区域网络,该网络对图像中的物体候选区域 进行捕获,该方法可以将物体候选区域的捕获——物体候选区域的筛选——区域中该物体的 分类完全整合于卷积神经网络方法,实现了在物体检测领域首次完全利用深度学习的方法进 行操作。
该网络能够利用不同尺度的兴趣点(即Anchor)将由原图映射而来的特征图进行物体 位置提取,并且将生成的候选区域输入识别网络,识别网络和候选区域网络互相进行微调优 化的过程对物体的位置进行不断逼近,同时获取物体类别信息。
人体检测网络结构
5.检测网络训练
首先应用数据增强,其主要分为训练集增强和测试集增强。训练集增强我们主要用了随 机裁剪、平行翻转、随机擦除。通过附加测试集增强,主要包括翻转、平移、变化尺度等等。 从高斯分布中得到一个随机的权重值,然后将这个权重值除以输入的节点个数的开根号,得 到的新的值为权重的初始值。该学习率参数不断减少,对当前网络做快照,之后学习率调大, 反复此过程。得到多个模型,最后做融合。不过考虑到复赛的模型数量限制,最后我们的学 习率采用了5个训练轮次1e-4,5个训练轮次1e-5,5个训练轮次1e-6的方式。
Claims (1)
1.一种基于图像融合的多模态图像目标检测方法,包括下列步骤:
1)将预先采集好的红外图像及其可见光图像,制作多模态图像数据集,图像格式均为单通道,包含具有结构和纹理特征的可见光图像和具有热成像信息的红外图像,按照图像模态分别制作训练集和测试集。
2)将步骤1得到的训练集中的红外和可见光的多模态图像对进行包括进行裁剪和旋转平移操作在内的图像预处理,将预处理好的成对图像作为融合模型中生成模型G的输入;
生成模型G基于U-Net等全卷积网络,以残差网络为基础的卷积神经网络作为生成网络模型结构,包括收缩过程和扩张过程,收缩路径包括多个卷积加ReLU激活层再加最大池化(Max Pooling)结构,下采样的每一步特征通道数都增加一倍,输出生成的融合图像;
3)将步骤2中得到生成模型G输出的融合图像输入融合模型中的判别网络模型D,判别网络模型D由一组孪生架构的卷积神经网络组成,对生成的融合图像进行无监督的质量评估,包括一组由交叉熵、重建误差、结构误差组成的损失函数,用以对融合图像和训练集中的原图像进行相似度丈量,来确定图像融合任务的完成度;同时优化生成网络G和判别网络D,方法为:输入训练集中原图像,更新G,误差变大;更新D,误差变小;更新G,重建误差变小,最终实现纳什均衡的动态平衡和同时优化;优化方法采用最小二乘的生成对抗方法;
4)重复进行步骤3,根据训练过程中损失函数的变化,按迭代次数调节学习率训练指标.
经训练,基于自有多模态图像数据集,能够得到同时保留红外图像热辐射特征和可见光图像结构性纹理特征的图像融合模型;
5)在步骤1中构造的测试集中取红外和可见光的多模态图像对,输入到步骤4中训练得到的融合模型中,继而输出融合图像;
再将得到的测试集,融合串联进基于深度卷积神经网络的检测模型,以在检测行人的红外热信息进行试例分析,得到行人的位置以及置信度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910355408.3A CN110322423B (zh) | 2019-04-29 | 2019-04-29 | 一种基于图像融合的多模态图像目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910355408.3A CN110322423B (zh) | 2019-04-29 | 2019-04-29 | 一种基于图像融合的多模态图像目标检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110322423A true CN110322423A (zh) | 2019-10-11 |
CN110322423B CN110322423B (zh) | 2023-03-31 |
Family
ID=68113054
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910355408.3A Active CN110322423B (zh) | 2019-04-29 | 2019-04-29 | 一种基于图像融合的多模态图像目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110322423B (zh) |
Cited By (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110956621A (zh) * | 2019-11-27 | 2020-04-03 | 北京航空航天大学合肥创新研究院 | 一种基于神经网络的组织癌变的检测方法及系统 |
CN111161201A (zh) * | 2019-12-06 | 2020-05-15 | 北京理工大学 | 基于细节增强通道注意力的红外与可见光图像融合方法 |
CN111178443A (zh) * | 2019-12-31 | 2020-05-19 | 东软集团股份有限公司 | 模型参数选择、图像分类、信息识别方法及装置、设备 |
CN111260594A (zh) * | 2019-12-22 | 2020-06-09 | 天津大学 | 一种无监督的多模态图像融合方法 |
CN111275692A (zh) * | 2020-01-26 | 2020-06-12 | 重庆邮电大学 | 基于生成对抗网络的红外小目标检测方法 |
CN111401203A (zh) * | 2020-03-11 | 2020-07-10 | 西安应用光学研究所 | 基于多维图像融合的目标识别方法 |
CN111489354A (zh) * | 2020-05-18 | 2020-08-04 | 国网浙江省电力有限公司检修分公司 | 电力塔架上鸟巢的检测方法、装置、服务器及存储介质 |
CN111680592A (zh) * | 2020-05-28 | 2020-09-18 | 东风柳州汽车有限公司 | 车内生物检测方法、装置、设备及存储介质 |
CN111696027A (zh) * | 2020-05-20 | 2020-09-22 | 电子科技大学 | 一种基于适应性注意力机制的多模态的图像风格迁移方法 |
CN111915571A (zh) * | 2020-07-10 | 2020-11-10 | 云南电网有限责任公司带电作业分公司 | 融合残差网络与U-Net网络的图像变化检测方法、装置、存储介质及设备 |
CN111915566A (zh) * | 2020-07-03 | 2020-11-10 | 天津大学 | 基于循环一致对抗网络的红外样本目标检测方法 |
CN111931767A (zh) * | 2020-08-05 | 2020-11-13 | 哈尔滨工业大学(深圳) | 一种基于图片信息度的多模型目标检测方法、装置、系统及存储介质 |
CN112016524A (zh) * | 2020-09-25 | 2020-12-01 | 北京百度网讯科技有限公司 | 模型训练方法、人脸识别方法、装置、设备和介质 |
CN112149634A (zh) * | 2020-10-23 | 2020-12-29 | 北京百度网讯科技有限公司 | 图像生成器的训练方法、装置、设备以及存储介质 |
CN112487947A (zh) * | 2020-11-26 | 2021-03-12 | 西北工业大学 | 基于图像融合与目标检测网络的低照度图像目标检测方法 |
CN112488033A (zh) * | 2020-12-10 | 2021-03-12 | 北京金山云网络技术有限公司 | 数据集的构建方法、装置、电子设备及存储介质 |
CN112683787A (zh) * | 2019-10-17 | 2021-04-20 | 神讯电脑(昆山)有限公司 | 物件表面检测系统及其基于人工神经网络的检测方法 |
CN112862860A (zh) * | 2021-02-07 | 2021-05-28 | 天津大学 | 一种用于多模态目标跟踪的对象感知图像融合方法 |
CN112927139A (zh) * | 2021-03-23 | 2021-06-08 | 广东工业大学 | 一种双目热成像系统及超分辨率图像获取方法 |
CN113066026A (zh) * | 2021-03-26 | 2021-07-02 | 重庆邮电大学 | 基于深度神经网络的内窥镜图像烟雾净化方法 |
CN113239800A (zh) * | 2021-05-12 | 2021-08-10 | 上海善索智能科技有限公司 | 目标检测方法及目标检测装置 |
CN113326735A (zh) * | 2021-04-29 | 2021-08-31 | 南京大学 | 一种基于YOLOv5的多模态小目标检测方法 |
CN113393410A (zh) * | 2021-07-26 | 2021-09-14 | 浙江大华技术股份有限公司 | 一种图像融合方法、装置、电子设备及存储介质 |
CN113590879A (zh) * | 2021-08-05 | 2021-11-02 | 哈尔滨理工大学 | 一种缩短时间戳网络解决多事件视频问答系统、方法、计算机及存储介质 |
CN113627504A (zh) * | 2021-08-02 | 2021-11-09 | 南京邮电大学 | 基于生成对抗网络的多模态多尺度特征融合目标检测方法 |
CN113947555A (zh) * | 2021-09-26 | 2022-01-18 | 国网陕西省电力公司西咸新区供电公司 | 基于深度神经网络的红外与可见光融合的视觉系统及方法 |
CN114399790A (zh) * | 2021-12-31 | 2022-04-26 | 中国科学院大学 | 一种基于非配准多模态数据的微小人物检测方法 |
CN114494245A (zh) * | 2022-03-31 | 2022-05-13 | 广东省有色工业建筑质量检测站有限公司 | 墙体结构孔气密性检测的图像识别方法 |
CN116630762A (zh) * | 2023-06-25 | 2023-08-22 | 山东卓业医疗科技有限公司 | 一种基于深度学习的多模态医学图像融合方法 |
US12111267B2 (en) | 2019-05-15 | 2024-10-08 | Getac Holdings Corporation | System for detecting surface type of object and artificial neural network-based method for detecting surface type of object |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101546428A (zh) * | 2009-05-07 | 2009-09-30 | 西北工业大学 | 基于区域分割的序列红外与可见光图像融合 |
US20100067768A1 (en) * | 2008-09-18 | 2010-03-18 | Siemens Corporate Research, Inc. | Method and System for Physiological Image Registration and Fusion |
CN103500443A (zh) * | 2013-10-10 | 2014-01-08 | 中国科学院上海技术物理研究所 | 一种基于傅里叶变换的红外偏振图像融合方法 |
CN103778618A (zh) * | 2013-11-04 | 2014-05-07 | 国家电网公司 | 一种可见光图像和红外图像的融合方法 |
JP2014192743A (ja) * | 2013-03-27 | 2014-10-06 | Olympus Corp | 撮像装置、構図アシスト装置、構図アシスト方法、及び構図アシストプログラム |
CN105825491A (zh) * | 2016-03-17 | 2016-08-03 | 江苏科技大学 | 一种基于混合模型的图像融合方法 |
CN107240096A (zh) * | 2017-06-01 | 2017-10-10 | 陕西学前师范学院 | 一种红外与可见光图像融合质量评价方法 |
WO2018076732A1 (zh) * | 2016-10-31 | 2018-05-03 | 广州飒特红外股份有限公司 | 红外图像和可见光图像融合的方法及装置 |
CN108090888A (zh) * | 2018-01-04 | 2018-05-29 | 北京环境特性研究所 | 基于视觉注意模型的红外图像和可见光图像的融合检测方法 |
CN108090521A (zh) * | 2018-01-12 | 2018-05-29 | 广州视声智能科技有限公司 | 一种生成式对抗网络模型的图像融合方法和判别器 |
CN108537742A (zh) * | 2018-03-09 | 2018-09-14 | 天津大学 | 一种基于生成对抗网络的遥感图像全色锐化方法 |
CN108830819A (zh) * | 2018-05-23 | 2018-11-16 | 青柠优视科技(北京)有限公司 | 一种深度图像与红外图像的图像融合方法及装置 |
CN109118467A (zh) * | 2018-08-31 | 2019-01-01 | 武汉大学 | 基于生成对抗网络的红外与可见光图像融合方法 |
-
2019
- 2019-04-29 CN CN201910355408.3A patent/CN110322423B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100067768A1 (en) * | 2008-09-18 | 2010-03-18 | Siemens Corporate Research, Inc. | Method and System for Physiological Image Registration and Fusion |
CN101546428A (zh) * | 2009-05-07 | 2009-09-30 | 西北工业大学 | 基于区域分割的序列红外与可见光图像融合 |
JP2014192743A (ja) * | 2013-03-27 | 2014-10-06 | Olympus Corp | 撮像装置、構図アシスト装置、構図アシスト方法、及び構図アシストプログラム |
CN103500443A (zh) * | 2013-10-10 | 2014-01-08 | 中国科学院上海技术物理研究所 | 一种基于傅里叶变换的红外偏振图像融合方法 |
CN103778618A (zh) * | 2013-11-04 | 2014-05-07 | 国家电网公司 | 一种可见光图像和红外图像的融合方法 |
CN105825491A (zh) * | 2016-03-17 | 2016-08-03 | 江苏科技大学 | 一种基于混合模型的图像融合方法 |
WO2018076732A1 (zh) * | 2016-10-31 | 2018-05-03 | 广州飒特红外股份有限公司 | 红外图像和可见光图像融合的方法及装置 |
CN107240096A (zh) * | 2017-06-01 | 2017-10-10 | 陕西学前师范学院 | 一种红外与可见光图像融合质量评价方法 |
CN108090888A (zh) * | 2018-01-04 | 2018-05-29 | 北京环境特性研究所 | 基于视觉注意模型的红外图像和可见光图像的融合检测方法 |
CN108090521A (zh) * | 2018-01-12 | 2018-05-29 | 广州视声智能科技有限公司 | 一种生成式对抗网络模型的图像融合方法和判别器 |
CN108537742A (zh) * | 2018-03-09 | 2018-09-14 | 天津大学 | 一种基于生成对抗网络的遥感图像全色锐化方法 |
CN108830819A (zh) * | 2018-05-23 | 2018-11-16 | 青柠优视科技(北京)有限公司 | 一种深度图像与红外图像的图像融合方法及装置 |
CN109118467A (zh) * | 2018-08-31 | 2019-01-01 | 武汉大学 | 基于生成对抗网络的红外与可见光图像融合方法 |
Non-Patent Citations (3)
Title |
---|
张宝华: "基于多尺度变换和稀疏表示的多源图像融合算法研究", 《中国优秀硕士论文数据库(工程科技Ⅱ辑)》 * |
赵令令: "基于超列的变电设备红外与可见光图像配准研究", 《中国优秀硕士论文数据库(工程科技Ⅱ辑)》 * |
陈木生: "结合NSCT和压缩感知的红外与可见光图像融合", 《中国图象图形学报》 * |
Cited By (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12111267B2 (en) | 2019-05-15 | 2024-10-08 | Getac Holdings Corporation | System for detecting surface type of object and artificial neural network-based method for detecting surface type of object |
CN112683787A (zh) * | 2019-10-17 | 2021-04-20 | 神讯电脑(昆山)有限公司 | 物件表面检测系统及其基于人工神经网络的检测方法 |
CN110956621A (zh) * | 2019-11-27 | 2020-04-03 | 北京航空航天大学合肥创新研究院 | 一种基于神经网络的组织癌变的检测方法及系统 |
CN110956621B (zh) * | 2019-11-27 | 2022-09-13 | 北京航空航天大学合肥创新研究院 | 一种基于神经网络的组织癌变的检测方法及系统 |
CN111161201A (zh) * | 2019-12-06 | 2020-05-15 | 北京理工大学 | 基于细节增强通道注意力的红外与可见光图像融合方法 |
CN111161201B (zh) * | 2019-12-06 | 2022-05-31 | 北京理工大学 | 基于细节增强通道注意力的红外与可见光图像融合方法 |
CN111260594A (zh) * | 2019-12-22 | 2020-06-09 | 天津大学 | 一种无监督的多模态图像融合方法 |
CN111260594B (zh) * | 2019-12-22 | 2023-10-31 | 天津大学 | 一种无监督的多模态图像融合方法 |
CN111178443A (zh) * | 2019-12-31 | 2020-05-19 | 东软集团股份有限公司 | 模型参数选择、图像分类、信息识别方法及装置、设备 |
CN111178443B (zh) * | 2019-12-31 | 2023-10-31 | 东软集团股份有限公司 | 模型参数选择、图像分类、信息识别方法及装置、设备 |
CN111275692A (zh) * | 2020-01-26 | 2020-06-12 | 重庆邮电大学 | 基于生成对抗网络的红外小目标检测方法 |
CN111275692B (zh) * | 2020-01-26 | 2022-09-13 | 重庆邮电大学 | 基于生成对抗网络的红外小目标检测方法 |
CN111401203A (zh) * | 2020-03-11 | 2020-07-10 | 西安应用光学研究所 | 基于多维图像融合的目标识别方法 |
CN111489354A (zh) * | 2020-05-18 | 2020-08-04 | 国网浙江省电力有限公司检修分公司 | 电力塔架上鸟巢的检测方法、装置、服务器及存储介质 |
CN111696027A (zh) * | 2020-05-20 | 2020-09-22 | 电子科技大学 | 一种基于适应性注意力机制的多模态的图像风格迁移方法 |
CN111680592A (zh) * | 2020-05-28 | 2020-09-18 | 东风柳州汽车有限公司 | 车内生物检测方法、装置、设备及存储介质 |
CN111915566A (zh) * | 2020-07-03 | 2020-11-10 | 天津大学 | 基于循环一致对抗网络的红外样本目标检测方法 |
CN111915566B (zh) * | 2020-07-03 | 2022-03-15 | 天津大学 | 基于循环一致对抗网络的红外样本目标检测方法 |
CN111915571A (zh) * | 2020-07-10 | 2020-11-10 | 云南电网有限责任公司带电作业分公司 | 融合残差网络与U-Net网络的图像变化检测方法、装置、存储介质及设备 |
CN111931767A (zh) * | 2020-08-05 | 2020-11-13 | 哈尔滨工业大学(深圳) | 一种基于图片信息度的多模型目标检测方法、装置、系统及存储介质 |
CN111931767B (zh) * | 2020-08-05 | 2023-09-15 | 哈尔滨工业大学(深圳) | 一种基于图片信息度的多模型目标检测方法、装置、系统及存储介质 |
CN112016524A (zh) * | 2020-09-25 | 2020-12-01 | 北京百度网讯科技有限公司 | 模型训练方法、人脸识别方法、装置、设备和介质 |
CN112016524B (zh) * | 2020-09-25 | 2023-08-08 | 北京百度网讯科技有限公司 | 模型训练方法、人脸识别方法、装置、设备和介质 |
CN112149634B (zh) * | 2020-10-23 | 2024-05-24 | 北京神州数码云科信息技术有限公司 | 图像生成器的训练方法、装置、设备以及存储介质 |
CN112149634A (zh) * | 2020-10-23 | 2020-12-29 | 北京百度网讯科技有限公司 | 图像生成器的训练方法、装置、设备以及存储介质 |
CN112487947A (zh) * | 2020-11-26 | 2021-03-12 | 西北工业大学 | 基于图像融合与目标检测网络的低照度图像目标检测方法 |
CN112488033B (zh) * | 2020-12-10 | 2024-10-18 | 北京金山云网络技术有限公司 | 数据集的构建方法、装置、电子设备及存储介质 |
CN112488033A (zh) * | 2020-12-10 | 2021-03-12 | 北京金山云网络技术有限公司 | 数据集的构建方法、装置、电子设备及存储介质 |
CN112862860A (zh) * | 2021-02-07 | 2021-05-28 | 天津大学 | 一种用于多模态目标跟踪的对象感知图像融合方法 |
CN112862860B (zh) * | 2021-02-07 | 2023-08-01 | 天津大学 | 一种用于多模态目标跟踪的对象感知图像融合方法 |
CN112927139B (zh) * | 2021-03-23 | 2023-06-02 | 广东工业大学 | 一种双目热成像系统及超分辨率图像获取方法 |
CN112927139A (zh) * | 2021-03-23 | 2021-06-08 | 广东工业大学 | 一种双目热成像系统及超分辨率图像获取方法 |
CN113066026A (zh) * | 2021-03-26 | 2021-07-02 | 重庆邮电大学 | 基于深度神经网络的内窥镜图像烟雾净化方法 |
CN113066026B (zh) * | 2021-03-26 | 2022-05-20 | 重庆邮电大学 | 基于深度神经网络的内窥镜图像烟雾净化方法 |
CN113326735B (zh) * | 2021-04-29 | 2023-11-28 | 南京大学 | 一种基于YOLOv5的多模态小目标检测方法 |
CN113326735A (zh) * | 2021-04-29 | 2021-08-31 | 南京大学 | 一种基于YOLOv5的多模态小目标检测方法 |
CN113239800A (zh) * | 2021-05-12 | 2021-08-10 | 上海善索智能科技有限公司 | 目标检测方法及目标检测装置 |
CN113393410A (zh) * | 2021-07-26 | 2021-09-14 | 浙江大华技术股份有限公司 | 一种图像融合方法、装置、电子设备及存储介质 |
CN113627504A (zh) * | 2021-08-02 | 2021-11-09 | 南京邮电大学 | 基于生成对抗网络的多模态多尺度特征融合目标检测方法 |
CN113590879B (zh) * | 2021-08-05 | 2022-05-31 | 哈尔滨理工大学 | 一种缩短时间戳网络解决多事件视频问答系统、方法、计算机及存储介质 |
CN113590879A (zh) * | 2021-08-05 | 2021-11-02 | 哈尔滨理工大学 | 一种缩短时间戳网络解决多事件视频问答系统、方法、计算机及存储介质 |
CN113947555A (zh) * | 2021-09-26 | 2022-01-18 | 国网陕西省电力公司西咸新区供电公司 | 基于深度神经网络的红外与可见光融合的视觉系统及方法 |
CN114399790A (zh) * | 2021-12-31 | 2022-04-26 | 中国科学院大学 | 一种基于非配准多模态数据的微小人物检测方法 |
CN114399790B (zh) * | 2021-12-31 | 2022-11-18 | 中国科学院大学 | 一种基于非配准多模态数据的微小人物检测方法、介质和设备 |
CN114494245A (zh) * | 2022-03-31 | 2022-05-13 | 广东省有色工业建筑质量检测站有限公司 | 墙体结构孔气密性检测的图像识别方法 |
CN116630762A (zh) * | 2023-06-25 | 2023-08-22 | 山东卓业医疗科技有限公司 | 一种基于深度学习的多模态医学图像融合方法 |
CN116630762B (zh) * | 2023-06-25 | 2023-12-22 | 山东卓业医疗科技有限公司 | 一种基于深度学习的多模态医学图像融合方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110322423B (zh) | 2023-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110322423A (zh) | 一种基于图像融合的多模态图像目标检测方法 | |
CN108537191B (zh) | 一种基于结构光摄像头的三维人脸识别方法 | |
CN101540048B (zh) | 一种基于支持向量机的图像质量评价方法 | |
CN111709902A (zh) | 基于自注意力机制的红外和可见光图像融合方法 | |
CN111291639B (zh) | 基于分层变分自编码的跨源舰船特征融合学习与识别方法 | |
CN105741267B (zh) | 聚类引导深度神经网络分类的多源图像变化检测方法 | |
CN109871875B (zh) | 一种基于深度学习的建筑物变化检测方法 | |
CN107909109B (zh) | 基于显著性和多尺度深度网络模型的sar图像分类方法 | |
CN108564565A (zh) | 一种基于深度学习的电力设备红外图像多目标定位方法 | |
CN105426875A (zh) | 一种基于深度卷积神经网络的人脸识别方法和考勤系统 | |
CN106295124A (zh) | 利用多种图像检测技术综合分析基因子图相似概率量的方法 | |
CN109002848B (zh) | 一种基于特征映射神经网络的弱小目标检测方法 | |
CN103793690A (zh) | 一种基于皮下血流探测的人体生物活体检测方法及应用 | |
Chen et al. | Agricultural remote sensing image cultivated land extraction technology based on deep learning | |
CN111709318B (zh) | 一种基于生成对抗网络的高分辨率遥感图像分类方法 | |
CN106408030A (zh) | 基于中层语义属性和卷积神经网络的sar图像分类方法 | |
CN114170511B (zh) | 基于Cascade RCNN的路面裂缝病害识别方法 | |
CN103971329A (zh) | 一种基于遗传优化细胞神经网络的多源图像融合方法 | |
CN109671274A (zh) | 一种基于特征构造和融合的公路风险自动评估方法 | |
CN115953666B (zh) | 一种基于改进Mask-RCNN的变电站现场进度识别方法 | |
CN111914758A (zh) | 一种基于卷积神经网络的人脸活体检测方法及装置 | |
CN104778466A (zh) | 一种联合多种上下文线索的图像关注区域检测方法 | |
Kuang | Face image feature extraction based on deep learning algorithm | |
CN107437091A (zh) | 多层限制玻尔兹曼机的sar图像正负类变化检测方法 | |
CN113671599A (zh) | 一种基于全球气候模式的登陆气旋识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |