CN104851099A - 一种基于表示学习的图像融合方法 - Google Patents

一种基于表示学习的图像融合方法 Download PDF

Info

Publication number
CN104851099A
CN104851099A CN201510267449.9A CN201510267449A CN104851099A CN 104851099 A CN104851099 A CN 104851099A CN 201510267449 A CN201510267449 A CN 201510267449A CN 104851099 A CN104851099 A CN 104851099A
Authority
CN
China
Prior art keywords
image
fusion
source image
learning
deep
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510267449.9A
Other languages
English (en)
Other versions
CN104851099B (zh
Inventor
陈占伟
黄伟
陈松岭
张少辉
陈立勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University of Light Industry
Original Assignee
Zhoukou Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhoukou Normal University filed Critical Zhoukou Normal University
Priority to CN201510267449.9A priority Critical patent/CN104851099B/zh
Publication of CN104851099A publication Critical patent/CN104851099A/zh
Application granted granted Critical
Publication of CN104851099B publication Critical patent/CN104851099B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • G06T7/344Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于表示学习的图像融合方法,包括如下步骤:获取多源图像,通过由稀疏自编码器组成的深度神经网络、由玻尔兹曼机组成的深度置信网络和深度卷积神经网络的学习架构对多源图像的特征进行学习,并利用这些自动学习的特征完成多源图像的融合,建立图像融合模型;研究图像融合模型的凸优化问题,利用深度学习中的非监督预训练对该网络进行初始化,从而使该网络在训练的过程中快速地找到最优解;根据多源图像的特点,通过两个或多个深度学习网络。本发明利用人工智能和基于深度学习的特征表示方法研究图像的特征级融合,与传统的像素级融合方法相比,该方法能更好地理解图像信息,从而进一步提高图像融合的质量。

Description

一种基于表示学习的图像融合方法
技术领域
本发明涉及图像融合技术领域,具体涉及一种基于表示学习的图像融合方法。
背景技术
由于社会和科技的进步,成像探测波段已经从单一可见光-近红外向极紫外/中远红外/太赫兹等多波段发展,形成了丰富波段的各种现代成像探测与图像获取技术。这些技术使人们能方便地获取多种多样的图像信息。在各个行业,人们从各个角度用各种传感器获取了大量的具有各种表征的图像信息,也就是多模态图像信息。一方面图像的信息是用不同传感器所获取,对同一物体不同传感器所获取的图像信息,具有不同的表征。另一方面,即使对相同传感器所获取相同物体对象的图像信息,也因自然原因(如天气、光照),而产生不同质量图像。人们迫切希望从这些多源、多模态图像来获取特定的对应物体的丰富全面的表征,从而让这些图像信息帮助人们去认识社会、认识自然,并为人们的日常工作和生活起到重要的帮助作用。
图像融合是指将多源传感器所采集到的关于同一场景/目标的图像数据进行融合处理的计算机视觉技术,它最大限度地提取各自传感器成像数据中的互补信息,最后综合成高质量的图像,以改善图像的计算机解译精度和可靠性、提升原始图像的空间分辨率和光谱分辨率、提高图像信息的利用率,提高目标识别和分析解释能力。因此,图像融合(Image Fusion)、处理和识别为现代计算机视觉和应用数学界所普遍关注。
迄今为止,图像融合的模型及其数学理论的研究极不完善,有许多问题亟需解决,如是否针对某一个实际图像融合的共性问题,可否建立一个统一的数学理论框架?再有如何利用图像融合技术重构实时、准确的图像信息,也是一个重大问题。正是因为上述原因,本项目拟用基于深度学习的特征表示学习的方法建立尽可能完备的针对多源图像的融合模型,并该模型进行优化求解,并开展相应的理论研究。如展开多源图像融合中互补特征保持的特征表示学习的理论研究与分析,提高多源融合图像的空间和光谱分辨率,并用GPU云计算并行处理方法得到高维多模态数据的融合识别的最优深度学习算法,将其应用于具体实际问题,充分融合多源图像的互补性特征,克服目标提取与识别中图像数据的不完整性等,为遥感和医学等领域完整的图像信息识别和预测提供强有力的理论支撑。
发明内容
为解决上述问题,本发明提供了一种基于表示学习的图像融合方法。
为实现上述目的,本发明采取的技术方案为:
一种基于表示学习的图像融合方法,包括如下步骤:
S1、获取多源图像,通过由稀疏自编码器组成的深度神经网络、由玻尔兹曼机组成的深度置信网络和深度卷积神经网络的学习架构对多源图像的特征进行学习,并利用这些自动学习的特征完成多源图像的融合,建立图像融合模型;
S2、研究图像融合模型的凸优化问题,利用深度学习中的非监督预训练对该网络进行初始化,从而使该网络在训练的过程中快速地找到最优解;
S3、根据多源图像的特点,通过两个或多个深度学习网络,建立协同训练的深度学习网络,从而实现表示学习的图像融合技术;
S4、利用GPU加快多源图像融合模型的求解速度,以及利用并行优化算法实现多核或云计算的并行计算。
本发明具有以下有益效果:
(1)利用人工智能和基于深度学习的特征表示方法研究图像的特征级融合,与传统的像素级融合方法相比,该方法能更好地理解图像信息,从而进一步提高图像融合的质量;
(2)根据多源图像处理的要求出发,尤其是针对多源遥感图像,要考虑它的光谱信息和空间结构信息,在已有的模型基础上,融入了光谱保真项和能更好恢复图像的边缘、纹理和几何结构的空间保真项,得到新的融合模型及其算法;
(3)研究是新模型、算法和综合应用有效结合,充分考虑算法的高效性(快速、并行,参数自适应),并利用目前图形硬件编程(GPU)和分布式并行(云)计算架构,具备处理大规模高维数据的融合能力。
附图说明
图1为本发明实施例一种基于表示学习的图像融合方法的流程图。
图2为本发明实施例一种基于表示学习的图像融合方法中步骤S4的流程图。
具体实施方式
为了使本发明的目的及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明实施例提供了一种基于表示学习的图像融合方法,包括如下步骤:
S1、获取多源图像,通过由稀疏自编码器组成的深度神经网络、由玻尔兹曼机组成的深度置信网络和深度卷积神经网络的学习架构对多源图像的特征进行学习,并利用这些自动学习的特征完成多源图像的融合,建立图像融合模型;
S2、研究图像融合模型的凸优化问题,利用深度学习中的非监督预训练对该网络进行初始化,从而使该网络在训练的过程中快速地找到最优解;
S3、根据多源图像的特点,通过两个或多个深度学习网络,建立协同训练的深度学习网络,从而实现表示学习的图像融合技术;
S4、利用GPU加快多源图像融合模型的求解速度,以及利用并行优化算法实现多核或云计算的并行计算。
本具体实施利用表示学习的方法可以对多源遥感图像进行融合,充分利用目前遥感卫星拍摄图像的各种信息,使其价值得到充分的利用。目前,遥感卫星由于成像仪器的限制,很难获取高空间分辨率和高光谱分辨率的图像,通过该方法能很好地解决该问题。同时本项目充分考虑算法的高效性,并利用GPU和分布式并行计算架构,具备处理大规模高维数据的融合能力,使其很高的使用价值。
项目研究新的图像融合技术及其快速实现的软件,可以进一步提高图像融合的结果。目前主流的遥感图像处理软件ENVI只能实现一些简单的融合方法,并不能很好地满足用户的需求,通过本项目的研究可以很好地弥补不足之处。项目完成后,可以形成行业化软件,利于推广,并可以应用到其它行业,经济效益十分明显。项目利用深度学习的最新技术,对多源遥感图像进行信息融合,可以很好地解决遥感成像仪器的硬件瓶颈,使遥感图像得到充分的利用,延长目前的遥感成像仪器的使用周期,促进了遥感图像在各个领域中的发展。项目在实现快速及并行算法时,通过云服务器上解决信息孤岛化,从而可以降低了企业软硬件投入成本和管理成本
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (1)

1.一种基于表示学习的图像融合方法,其特征在于,包括如下步骤:
S1、获取多源图像,通过由稀疏自编码器组成的深度神经网络、由玻尔兹曼机组成的深度置信网络和深度卷积神经网络的学习架构对多源图像的特征进行学习,并利用这些自动学习的特征完成多源图像的融合,建立图像融合模型;
S2、研究图像融合模型的凸优化问题,利用深度学习中的非监督预训练对该网络进行初始化,从而使该网络在训练的过程中快速地找到最优解;
S3、根据多源图像的特点,通过两个或多个深度学习网络,建立协同训练的深度学习网络,从而实现表示学习的图像融合技术;
S4、利用GPU加快多源图像融合模型的求解速度,以及利用并行优化算法实现多核或云计算的并行计算。
CN201510267449.9A 2015-05-21 2015-05-21 一种基于表示学习的图像融合方法 Expired - Fee Related CN104851099B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510267449.9A CN104851099B (zh) 2015-05-21 2015-05-21 一种基于表示学习的图像融合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510267449.9A CN104851099B (zh) 2015-05-21 2015-05-21 一种基于表示学习的图像融合方法

Publications (2)

Publication Number Publication Date
CN104851099A true CN104851099A (zh) 2015-08-19
CN104851099B CN104851099B (zh) 2018-07-03

Family

ID=53850726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510267449.9A Expired - Fee Related CN104851099B (zh) 2015-05-21 2015-05-21 一种基于表示学习的图像融合方法

Country Status (1)

Country Link
CN (1) CN104851099B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295714A (zh) * 2016-08-22 2017-01-04 中国科学院电子学研究所 一种基于深度学习的多源遥感图像融合方法
CN106373109A (zh) * 2016-08-31 2017-02-01 南方医科大学 一种医学图像模态合成的方法
CN106845525A (zh) * 2016-12-28 2017-06-13 上海电机学院 一种基于底层融合特征的深度置信网络图像分类协议
CN106934765A (zh) * 2017-03-14 2017-07-07 长沙全度影像科技有限公司 基于深度卷积神经网络与深度信息的全景图像融合方法
CN106952220A (zh) * 2017-03-14 2017-07-14 长沙全度影像科技有限公司 一种基于深度学习的全景图像融合方法
CN106991397A (zh) * 2017-03-31 2017-07-28 中国科学院电子学研究所 基于视觉显著性约束深度置信网络的遥感图像检测方法
CN107369147A (zh) * 2017-07-06 2017-11-21 江苏师范大学 基于自我监督学习的图像融合方法
CN107992904A (zh) * 2017-12-22 2018-05-04 重庆邮电大学 基于多源信息融合的林业生态环境人机交互方法
CN109151727A (zh) * 2018-07-28 2019-01-04 天津大学 基于改进的dbn的wlan指纹定位数据库构建方法
CN109345497A (zh) * 2018-09-14 2019-02-15 淮阴师范学院 基于模糊算子的图像融合处理方法及系统、计算机程序
CN109580629A (zh) * 2018-08-24 2019-04-05 绍兴文理学院 曲轴止推片智能检测方法及系统
CN109700528A (zh) * 2019-02-27 2019-05-03 江苏霆升科技有限公司 一种实时构建心脏三维模型方法及装置
CN110068544A (zh) * 2019-05-08 2019-07-30 广东工业大学 物质识别网络模型训练方法及太赫兹光谱物质识别方法
CN110110765A (zh) * 2019-04-23 2019-08-09 四川九洲电器集团有限责任公司 一种基于深度学习的多源数据融合目标识别方法
CN110784507A (zh) * 2019-09-05 2020-02-11 贵州人和致远数据服务有限责任公司 人口信息数据的融合方法及系统
CN111539447A (zh) * 2020-03-17 2020-08-14 广东省智能制造研究所 一种基于高光谱与太赫兹数据深度融合的分类方法
US11293763B2 (en) 2017-12-06 2022-04-05 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for determining new roads on a map
US11537813B1 (en) * 2020-09-30 2022-12-27 Amazon Technologies, Inc. System for synthesizing data

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593474A (zh) * 2013-11-28 2014-02-19 中国科学院自动化研究所 基于深度学习的图像检索排序方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593474A (zh) * 2013-11-28 2014-02-19 中国科学院自动化研究所 基于深度学习的图像检索排序方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
兰霞: "半监督协同训练算法的研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295714B (zh) * 2016-08-22 2020-01-21 中国科学院电子学研究所 一种基于深度学习的多源遥感图像融合方法
CN106295714A (zh) * 2016-08-22 2017-01-04 中国科学院电子学研究所 一种基于深度学习的多源遥感图像融合方法
CN106373109A (zh) * 2016-08-31 2017-02-01 南方医科大学 一种医学图像模态合成的方法
CN106373109B (zh) * 2016-08-31 2018-10-26 南方医科大学 一种医学图像模态合成的方法
CN106845525A (zh) * 2016-12-28 2017-06-13 上海电机学院 一种基于底层融合特征的深度置信网络图像分类协议
CN106934765A (zh) * 2017-03-14 2017-07-07 长沙全度影像科技有限公司 基于深度卷积神经网络与深度信息的全景图像融合方法
CN106952220A (zh) * 2017-03-14 2017-07-14 长沙全度影像科技有限公司 一种基于深度学习的全景图像融合方法
CN106991397A (zh) * 2017-03-31 2017-07-28 中国科学院电子学研究所 基于视觉显著性约束深度置信网络的遥感图像检测方法
CN107369147A (zh) * 2017-07-06 2017-11-21 江苏师范大学 基于自我监督学习的图像融合方法
CN107369147B (zh) * 2017-07-06 2020-12-25 江苏师范大学 基于自我监督学习的图像融合方法
US11293763B2 (en) 2017-12-06 2022-04-05 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for determining new roads on a map
CN107992904A (zh) * 2017-12-22 2018-05-04 重庆邮电大学 基于多源信息融合的林业生态环境人机交互方法
CN109151727B (zh) * 2018-07-28 2020-11-10 天津大学 基于改进的dbn的wlan指纹定位数据库构建方法
CN109151727A (zh) * 2018-07-28 2019-01-04 天津大学 基于改进的dbn的wlan指纹定位数据库构建方法
CN109580629A (zh) * 2018-08-24 2019-04-05 绍兴文理学院 曲轴止推片智能检测方法及系统
CN109345497A (zh) * 2018-09-14 2019-02-15 淮阴师范学院 基于模糊算子的图像融合处理方法及系统、计算机程序
CN109345497B (zh) * 2018-09-14 2021-12-03 淮阴师范学院 基于模糊算子的图像融合处理方法及系统、计算机程序
CN109700528A (zh) * 2019-02-27 2019-05-03 江苏霆升科技有限公司 一种实时构建心脏三维模型方法及装置
CN110110765A (zh) * 2019-04-23 2019-08-09 四川九洲电器集团有限责任公司 一种基于深度学习的多源数据融合目标识别方法
CN110068544A (zh) * 2019-05-08 2019-07-30 广东工业大学 物质识别网络模型训练方法及太赫兹光谱物质识别方法
CN110068544B (zh) * 2019-05-08 2021-09-17 广东工业大学 物质识别网络模型训练方法及太赫兹光谱物质识别方法
CN110784507A (zh) * 2019-09-05 2020-02-11 贵州人和致远数据服务有限责任公司 人口信息数据的融合方法及系统
CN110784507B (zh) * 2019-09-05 2022-12-09 贵州人和致远数据服务有限责任公司 人口信息数据的融合方法及系统
CN111539447A (zh) * 2020-03-17 2020-08-14 广东省智能制造研究所 一种基于高光谱与太赫兹数据深度融合的分类方法
CN111539447B (zh) * 2020-03-17 2022-04-22 广东省科学院智能制造研究所 一种基于高光谱与太赫兹数据深度融合的分类方法
US11537813B1 (en) * 2020-09-30 2022-12-27 Amazon Technologies, Inc. System for synthesizing data

Also Published As

Publication number Publication date
CN104851099B (zh) 2018-07-03

Similar Documents

Publication Publication Date Title
CN104851099A (zh) 一种基于表示学习的图像融合方法
Yeh et al. Lightweight deep neural network for joint learning of underwater object detection and color conversion
Li et al. Deep learning-based object detection techniques for remote sensing images: A survey
CN109949316B (zh) 一种基于rgb-t融合的电网设备图像弱监督实例分割方法
Li et al. Fast accurate fish detection and recognition of underwater images with fast r-cnn
CN108537191B (zh) 一种基于结构光摄像头的三维人脸识别方法
CN109086754A (zh) 一种基于深度学习的人体姿态识别方法
CN107463954B (zh) 一种模糊异谱图像的模板匹配识别方法
CN110135277B (zh) 一种基于卷积神经网络的人体行为识别方法
CN113158943A (zh) 一种跨域红外目标检测方法
Manikandan et al. Hand gesture detection and conversion to speech and text
Lin et al. Building damage assessment from post-hurricane imageries using unsupervised domain adaptation with enhanced feature discrimination
CN109977834B (zh) 从深度图像中分割人手与交互物体的方法和装置
CN113901931B (zh) 一种基于知识蒸馏模型的红外和可见光视频的行为识别方法
Balasuriya et al. Learning platform for visually impaired children through artificial intelligence and computer vision
Zhang et al. A marine organism detection framework based on the joint optimization of image enhancement and object detection
CN114926734B (zh) 基于特征聚合和注意融合的固体废弃物检测装置及方法
CN107766810B (zh) 一种云、影检测方法
Li et al. IIE-SegNet: Deep semantic segmentation network with enhanced boundary based on image information entropy
CN113792807B (zh) 皮肤病分类模型训练方法、系统、介质和电子设备
CN111368800A (zh) 手势识别方法及装置
Liu et al. TransCloudSeg: Ground-based cloud image segmentation with transformer
Sharma et al. State of-the-Art Analysis of Multiple Object Detection Techniques using Deep Learning
Liu et al. RETRACTED: Learning spatiotemporal features with 3D DenseNet and attention for gesture recognition
CN115984958A (zh) 一种应用在低照度环境下的煤矿井下人员动作识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Chen Zhanwei

Inventor after: Zhang Shaohui

Inventor after: Huang Wei

Inventor after: Chen Liyong

Inventor before: Chen Zhanwei

Inventor before: Huang Wei

Inventor before: Chen Songling

Inventor before: Zhang Shaohui

Inventor before: Chen Liyong

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20180518

Address after: 466001 School of computer science, Zhoukou Normal University, Wenchang Road, Chuan Hui District, Zhoukou, Henan

Applicant after: Zhoukou Normal University

Applicant after: Zhengzhou University of Light Industry

Address before: 466001 School of computer science, Zhoukou Normal University, Wenchang Road, Chuan Hui District, Zhoukou, Henan

Applicant before: Zhoukou Normal University

GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180703

Termination date: 20190521