CN108805157B - 基于部分随机监督离散式哈希的遥感图像分类方法 - Google Patents
基于部分随机监督离散式哈希的遥感图像分类方法 Download PDFInfo
- Publication number
- CN108805157B CN108805157B CN201810321172.7A CN201810321172A CN108805157B CN 108805157 B CN108805157 B CN 108805157B CN 201810321172 A CN201810321172 A CN 201810321172A CN 108805157 B CN108805157 B CN 108805157B
- Authority
- CN
- China
- Prior art keywords
- discrete
- hash
- coding
- remote sensing
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 239000011159 matrix material Substances 0.000 claims abstract description 30
- 238000012360 testing method Methods 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 18
- 230000006870 function Effects 0.000 claims description 28
- 239000013598 vector Substances 0.000 claims description 15
- 230000001419 dependent effect Effects 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 5
- 125000004122 cyclic group Chemical group 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 2
- 238000004364 calculation method Methods 0.000 description 4
- 238000011480 coordinate descent method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于部分随机监督离散式哈希的遥感图像目标分类方法。根据标定好的真实数据,对遥感图像进行目标分割,对分割好的目标进行特征提取,每个目标均用特征向量进行表示,所有目标的特征向量组合成特征矩阵;对每一类样本按照相同比例划分为训练样本和测试样本;对所有样本进行离散哈希编码;对所有样本进行部分随机哈希编码;将离散哈希编码与部分随机编码相结合,迭代优化参数,最终获得更精准的哈希编码;根据所生成的哈希编码,计算汉明距离,完成分类。该方法解决了在处理遥感图像过程中,数据量过大导致的计算复杂度高的问题,实现了对遥感图像进行快速有效的分类。
Description
技术领域
本发明涉及遥感图像分类方法,特别是一种基于部分随机监督离散式哈希的遥感图像分类方法。
背景技术
由于卫星与飞行器技术的高速发展,遥感数据的应用变得越来越广泛,目标分类也逐渐成为遥感数据分析中最重要的任务之一。然而,随着遥感图像数据量和分辨率的显著提高,目标分类也变得更具有挑战性。因此,有效的特征表示方法对于遥感图像目标分类是十分有意义的。近年来有许多这方面的技术被提出,大致可以分为三类:基于手工特征的方法,基于深度特征学习的方法以及基于非监督特征学习的方法。由于高效的检索以及数据储存能力,哈希学习目前在大规模视觉问题中应用十分广泛。现有的哈希学习方法主要可以分为两大类:数据独立方法与数据依赖方法。数据独立方法即不利用任何训练数据,只采用随机映射作为哈希函数,而数据依赖方法则从给出的训练数据中自主学习得到哈希函数,以此保留数据的特性。数据独立方法算法简单,但相比较数据依赖方法,其准确率要低的多。数据依赖方法可以进一步划分为以下两类:
(1)监督式哈希。通过数据的标签信息学习得到更为准确的哈希函数。典型的方法有:基于核的监督式哈希、监督离散式哈希以及快速监督离散式哈希等。
(2)非监督式哈希。在学习过程中,不需要提供数据的标签信息,通过保留训练数据的结构、分布以及其它信息来学习得到哈希函数。典型的方法有:谱哈希、离散图哈希、可扩展图哈希等。
哈希编码主要是由0和1或者-1和1组成的,而生成编码的过程属于离散优化问题,这是一个比较困难的问题。为了解决这个问题,绝大多数哈希方法选择先忽视离散约束,解决一个近似的连续问题,再将所得到的编码进行量化,从而实现编码的离散表达。这样的解决方式简单,但在一定程度上降低了最终编码的准确性。近期出现的一些方法采用的是逐位迭代优化的方式。采用离散循环坐标下降法可以得到每一位的闭形式解,从而解决问题。
发明内容
本发明的目的在于提供一种遥感图像分类方法,针对遥感图像数据量大,计算复杂的问题,结合数据独立和数据依赖方法,完成遥感图像的哈希表示精确分类。
实现本发明目的的技术解决方案为:一种基于部分随机监督离散式哈希的遥感图像分类方法,包括以下步骤:
步骤1、根据标定好的真实数据,对遥感图像进行目标分割,分割得到的目标组成训练和测试所用的样本;
步骤2、对分割好的目标进行特征提取,每个目标均用特征向量进行表示,所有目标的特征向量组合成特征矩阵;
步骤3、对每一类样本按照相同比例划分为训练样本和测试样本;
步骤4、对所有样本进行离散哈希编码;
步骤5、对所有样本进行部分随机哈希编码;
步骤6、将离散哈希编码与部分随机编码相结合,使两个编码之间的误差最小化,迭代优化参数,最终获得更精准的哈希编码;
步骤7、根据所生成的哈希编码,计算汉明距离,完成分类。
与现有技术相比,本发明的显著优点在于:(1)通过随机投影,可以有效地降低计算复杂度,为后续计算提供便利;(2)通过由数据生成的权值矩阵,可以有效利用原始遥感数据信息,所获取的哈希编码的准确率也会更高,最终使得分类准确率得到保证。
附图说明
图1是本发明的流程图。
图2是本发明基于部分随机监督离散式哈希的遥感图像分类方法的整体流程图。
图3是本发明基于部分随机监督离散式哈希的遥感图像分类方法中,随机编码生成部分的流程图。
图4是遥感图像数据集的各类示例图。
图5是本发明得到的部分可视化分类结果图。
具体实施方式
本发明结合了哈希学习中的两大类方法——数据独立方法和数据依赖方法。该方法将离散二进制编码的生成模型和部分随机约束模型相结合。通过随机投影,可以解决遥感图像数据量大所带来的计算复杂度高的问题,而通过由训练数据生成的权重矩阵,可以在哈希编码的生成过程中很好地保留数据之间的语义相似性。对于目标函数的优化问题,本方法采用的是循环迭代优化法对参数进行迭代优化,将优化过程分解为三步,从而解决多变量求解最优解的问题。在哈希编码生成过程中,本方法采用了离散循环坐标下降法,通过这样的方式,可以对编码进行逐位优化,从而解决哈希学习中的离散约束问题。在测试阶段,对测试数据集进行哈希编码后,根据所生成的编码,计算汉明距离,对测试样本可能属于的类别进行概率计算,最终概率最大的类别被判定为预测类别。
结合图1,本发明的基于部分随机监督离散式哈希的遥感图像分类方法包括以下步骤:
步骤1、根据标定好的真实数据即样本坐标,对遥感图像进行目标分割,分割得到的目标组成训练和测试所用的样本;
步骤2、对分割好的目标进行特征提取,每个目标均用特征向量进行表示,所有目标的特征向量组合成特征矩阵;
步骤3、对每一类样本按照相同比例划分为训练样本和测试样本;
步骤4、对所有样本进行离散哈希编码;
步骤5、对所有样本进行部分随机哈希编码;
步骤6、将离散哈希编码与部分随机编码相结合,使两个编码之间的误差最小化,迭代优化参数,最终获得更精准的哈希编码;
步骤7、根据所生成的哈希编码,计算汉明距离,完成分类。
步骤4中所述对所有样本进行离散哈希编码的具体方法为:
其中,表示标定的真实数据标签矩阵, 表示分类权值矩阵,c和λ分别为类别的数量以及正则参数;目标函数中的第一项本质是一个损失函数,可以用其它任意正确的损失函数来代替,为计算和描述简便,本方法选择的是l2损失。
s.t.B∈{-1,1}r×n
步骤5中所述对所有样本进行部分随机哈希编码的具体方法为:
在部分随机哈希中,随机生成一个投影矩阵A∈Rd×r以及一个偏移行向量b∈Rr,将提取的特征向量xi投影至低维空间,得到矩阵F;利用sign函数可得到二值化矩阵,命名为H。将H嵌入数据依赖线性模型如下:
线性模型HLβ将数据映射回原始特征空间,使得二值编码与样本数据之间的误差最小化。
针对此部分的离散约束,用sigmoid函数s(x)=1/(1+e-x)代替最初的sign函数,最终需要优化的问题为:
最终得到部分随机哈希编码H
步骤6将离散哈希编码与部分随机编码相结合,优化参数,最终获得更精准的哈希编码的具体方法为:
结合离散哈希编码与部分随机编码,目标函数定义如下:
s.t.B∈{-1,1}r×n
由目标函数可知,这是一个包含3个未知变量的最小化问题。采用交替迭代的方式来逐步优化解决本问题。
解决该问题的步骤分为以下三步:
固定F和B,对W进行优化,通过正则化最小二乘问题可以求解得到:w=(BBT+λ1I)- 1BYT;
固定F和W,对B进行优化,此时子问题可定义为如下形式:
s.t.B∈{-1,1}r×n
进行简单数学变化可得:
s.t.B∈{-1,1}r×n
其中V=WY+λ2F(X)+λ3H由于B的离散约束,直接求解是十分困难的,故而采用一个近似的解决方案:B的每一行通过固定其他行来进行求解,即依次学习每一个比特,直到所有比特学习完毕。根据这个思路,通过离散坐标循环下降法依次更新B矩阵的每一行。最终可得:bi=sgn(vi-B′TW′wi)。
步骤7所述根据所生成的哈希编码,计算汉明距离,完成分类的具体方法为:对测试样本集进行部分随机编码后,嵌入监督离散式编码,最终生成部分随机监督离散式编码,根据所生成的编码,计算汉明距离,对测试样本可能属于的类别进行概率计算,最终概率最大的类别被判定为预测类别。
下面结合实施例对本发明作进一步说明:
本发明实施示例的流程如图2所示。
(1)数据集NWPU VHR-10由650幅图像组成,其中共有3896个目标。目标一共有10类,包括:飞机、船舶、油桶、车辆等,图4给出了各个类别的示例图。
(2)对所有分割得到的目标进行Gist特征提取。以单个目标作为单位,每个目标提取512维度的特征。
(3)按比例随机选取2896个目标作为训练目标,其对应的特征向量组成特征矩阵作为训练集,剩余的1000个目标作为测试目标,其对应的特征向量组成特征矩阵作为测试集。
(4)将所有目标的类别标签信息写入训练集和测试集,完成数据集的制作。
(5)图3给出了部分随机哈希编码生成的示意图。利用随机投影矩阵和随机偏移向量,将训练数据集投影至隐藏空间,对投影后的训练数据集进行二值化,嵌入数据独立的线性模型后对参数进行优化,通过简单数学计算后,生成部分随机哈希编码。
(6)随机选取训练数据中的锚点,通过RBF核函数投影训练数据,获取哈希函数,随机初始化离散监督式哈希的初始编码。将部分随机哈希编码嵌入,作为生成离散监督式哈希编码目标函数的一个约束条件,循环生成离散监督式哈希的三个迭代优化步骤:F步、W步和B步。最终得到部分随机的离散监督式哈希编码。
(7)图2的下半部分给出了测试阶段示意图。对特征向量进行部分随机离散监督式哈希编码,通过计算汉明距离,在汉明空间内进行比较,最终判定测试数据所属类别。
(8)图5给出了本方法的可视化分类结果图。随机抽取了分类完成后的各类中的9个样本,其中用虚线框标记的样本为分类出错的样本。
实验结果表明,该方法针对遥感图像的数据特性,通过结合数据独立方法和数据依赖方法,解决了在处理遥感图像过程中,数据量过大导致的计算复杂度高的问题;同时,采用离散循环坐标下降法,结合了离散监督式哈希,使得最终的分类结果取得了较好的效果,实现了对遥感图像进行快速有效的分类。
Claims (2)
1.一种基于部分随机监督离散式哈希的遥感图像分类方法,其特征在于包括以下步骤:
步骤1、根据标定好的真实数据,对遥感图像进行目标分割,分割得到的目标组成训练和测试所用的样本;
步骤2、对分割好的目标进行特征提取,每个目标均用特征向量进行表示,所有目标的特征向量组合成特征矩阵;
步骤3、对每一类样本按照相同比例划分为训练样本和测试样本;
步骤5、对所有样本进行部分随机哈希编码;在部分随机哈希中,随机生成一个投影矩阵A∈Rd×r以及一个偏移行向量b∈Rr,将提取的特征向量xi投影至低维空间;利用sign函数得到二值化的矩阵HL;将HL嵌入数据依赖线性模型:
针对此部分的离散约束,用sigmoid函数s(x)代替sign函数,优化的问题转变为:
步骤6、将离散哈希编码与部分随机编码相结合,使两个编码之间的误差最小化,迭代优化参数,最终获得更精准的哈希编码;结合离散哈希编码与部分随机编码,目标函数定义如下:
固定F和W,对B进行优化,此时子问题定义为如下形式:
即:
其中,V=WY+λ2F(X)+λ3H,由于B的离散约束,采用一个近似的解决方案:B的每一行通过固定其他行来求解,即依次学习每一个比特,直到所有比特学习完毕;通过离散坐标循环下降法依次更新B矩阵的每一行;最终可得:bi=sgn(vi-B′TW′wi);
步骤7、根据所生成的哈希编码,计算汉明距离,完成分类。
2.根据权利要求1所述的遥感图像分类方法,其特征在于:步骤7所述根据所生成的哈希编码,计算汉明距离,完成分类的具体方法为:对测试样本集进行部分随机编码后,嵌入监督离散式编码,最终生成部分随机监督离散式编码,根据所生成的编码,计算汉明距离,对测试样本可能属于的类别进行概率计算,最终概率最大的类别被判定为预测类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810321172.7A CN108805157B (zh) | 2018-04-11 | 2018-04-11 | 基于部分随机监督离散式哈希的遥感图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810321172.7A CN108805157B (zh) | 2018-04-11 | 2018-04-11 | 基于部分随机监督离散式哈希的遥感图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108805157A CN108805157A (zh) | 2018-11-13 |
CN108805157B true CN108805157B (zh) | 2022-02-18 |
Family
ID=64095298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810321172.7A Active CN108805157B (zh) | 2018-04-11 | 2018-04-11 | 基于部分随机监督离散式哈希的遥感图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108805157B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110766065A (zh) * | 2019-10-18 | 2020-02-07 | 山东浪潮人工智能研究院有限公司 | 一种基于深度超信息的哈希学习方法 |
CN110781902A (zh) * | 2019-10-28 | 2020-02-11 | 山东浪潮人工智能研究院有限公司 | 一种鲁棒二值属性学习方法及系统 |
CN111626408B (zh) * | 2020-05-22 | 2021-08-06 | 深圳前海微众银行股份有限公司 | 哈希编码方法、装置、设备及可读存储介质 |
CN111612080B (zh) * | 2020-05-22 | 2021-11-09 | 深圳前海微众银行股份有限公司 | 模型解释方法、设备及可读存储介质 |
CN111881312B (zh) * | 2020-07-24 | 2022-07-05 | 成都成信高科信息技术有限公司 | 一种图像数据集分类划分方法 |
CN112906804B (zh) * | 2021-03-02 | 2023-12-19 | 华南理工大学 | 一种针对组织病理学图像的哈希样本平衡癌症标注方法 |
CN114022701B (zh) * | 2021-10-21 | 2022-06-24 | 南京审计大学 | 基于近邻监督离散判别哈希的图像分类方法 |
CN113887661B (zh) * | 2021-10-25 | 2022-06-03 | 济南大学 | 一种基于表示学习重构残差分析的图像集分类方法及系统 |
CN119027832A (zh) * | 2024-10-25 | 2024-11-26 | 杭州电子科技大学 | 一种基于渐进迭代训练的大规模作物优化制图方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101536035A (zh) * | 2006-08-31 | 2009-09-16 | 公立大学法人大阪府立大学 | 图像识别方法、图像识别装置以及图像识别程序 |
CN104298791A (zh) * | 2014-11-19 | 2015-01-21 | 中国石油大学(华东) | 一种基于集成哈希编码的快速图像检索方法 |
CN107729513A (zh) * | 2017-10-25 | 2018-02-23 | 鲁东大学 | 基于语义对齐的离散监督跨模态哈希检索方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9087267B2 (en) * | 2011-06-10 | 2015-07-21 | Image Vision Labs, Inc. | Image scene recognition |
CN105868743B (zh) * | 2016-05-31 | 2018-11-27 | 天津中科智能识别产业技术研究院有限公司 | 一种基于快速监督离散哈希的人脸检索方法 |
CN106095811B (zh) * | 2016-05-31 | 2018-11-27 | 天津中科智能识别产业技术研究院有限公司 | 一种基于最优编码的监督离散哈希的图像检索方法 |
-
2018
- 2018-04-11 CN CN201810321172.7A patent/CN108805157B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101536035A (zh) * | 2006-08-31 | 2009-09-16 | 公立大学法人大阪府立大学 | 图像识别方法、图像识别装置以及图像识别程序 |
CN104298791A (zh) * | 2014-11-19 | 2015-01-21 | 中国石油大学(华东) | 一种基于集成哈希编码的快速图像检索方法 |
CN107729513A (zh) * | 2017-10-25 | 2018-02-23 | 鲁东大学 | 基于语义对齐的离散监督跨模态哈希检索方法 |
Non-Patent Citations (2)
Title |
---|
Partial Randomness Hashing for Large-Scale Remote Sensing Image Retrieval;Peng Li et al;《IEEE Geoscience and Remote Sensing Letters》;20170331;第14卷(第3期);第464-468页 * |
Supervised Discrete Hashing;Fumin Shen et al;《2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)》;20150612;第37-45页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108805157A (zh) | 2018-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108805157B (zh) | 基于部分随机监督离散式哈希的遥感图像分类方法 | |
Luo et al. | Robust discrete code modeling for supervised hashing | |
CN113012212B (zh) | 一种基于深度信息融合的室内场景三维点云重建方法和系统 | |
WO2021164625A1 (en) | Method of training an image classification model | |
CN110188827B (zh) | 一种基于卷积神经网络和递归自动编码器模型的场景识别方法 | |
CN109783682B (zh) | 一种基于点对相似度的深度非松弛哈希图像检索方法 | |
CN108734210B (zh) | 一种基于跨模态多尺度特征融合的对象检测方法 | |
CN111125411B (zh) | 一种深度强相关哈希学习的大规模图像检索方法 | |
CN109273054B (zh) | 基于关系图谱的蛋白质亚细胞区间预测方法 | |
CN108829848A (zh) | 一种图像检索方法和系统 | |
CN107315765A (zh) | 一种大规模图片集分布式近似搜索的方法 | |
CN112149705A (zh) | 分类模型的训练方法、系统、计算机设备及存储介质 | |
CN106777038A (zh) | 一种基于序列保留哈希的超低复杂度图像检索方法 | |
EP4354353A1 (en) | Unsupervised pre-training of geometric vision models | |
CN114677646A (zh) | 一种基于Vision Transformer的跨域行人重识别方法 | |
CN114692732A (zh) | 一种在线标签更新的方法、系统、装置及存储介质 | |
Fu et al. | Deep momentum uncertainty hashing | |
CN114781779A (zh) | 一种无监督能耗异常检测方法、装置及存储介质 | |
Song et al. | Test-time adaptation in the dynamic world with compound domain knowledge management | |
US20240338799A1 (en) | Utilizing regularized forward diffusion for improved inversion of digital images | |
CN112488221A (zh) | 一种基于动态刷新正样本图像库的道路路面异常检测方法 | |
Liu et al. | Margin-based two-stage supervised hashing for image retrieval | |
Zhang et al. | An optimized dimensionality reduction model for high-dimensional data based on restricted Boltzmann machines | |
CN115129713A (zh) | 数据检索方法、装置、计算机设备和存储介质 | |
CN115457596A (zh) | 基于相机感知图学习的无监督行人重识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |