CN111611954B - 基于改进K-means算法的高光谱图像分类方法及装置 - Google Patents

基于改进K-means算法的高光谱图像分类方法及装置 Download PDF

Info

Publication number
CN111611954B
CN111611954B CN202010465998.8A CN202010465998A CN111611954B CN 111611954 B CN111611954 B CN 111611954B CN 202010465998 A CN202010465998 A CN 202010465998A CN 111611954 B CN111611954 B CN 111611954B
Authority
CN
China
Prior art keywords
hyperspectral image
sample
means algorithm
hyperspectral
image classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010465998.8A
Other languages
English (en)
Other versions
CN111611954A (zh
Inventor
马御棠
王达达
钱国超
彭庆军
黄然
周仿荣
赵加能
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electric Power Research Institute of Yunnan Power Grid Co Ltd
Original Assignee
Electric Power Research Institute of Yunnan Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of Yunnan Power Grid Co Ltd filed Critical Electric Power Research Institute of Yunnan Power Grid Co Ltd
Priority to CN202010465998.8A priority Critical patent/CN111611954B/zh
Publication of CN111611954A publication Critical patent/CN111611954A/zh
Application granted granted Critical
Publication of CN111611954B publication Critical patent/CN111611954B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/194Terrestrial scenes using hyperspectral data, i.e. more or other wavelengths than RGB
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Astronomy & Astrophysics (AREA)
  • Multimedia (AREA)
  • Remote Sensing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及高光谱图像处理技术领域,特别地,涉及一种基于改进K‑means算法的高光谱图像分类方法及装置。一定程度上可以解决高光谱遥感的图像光谱维度高、聚类中心获取不合理、分类耗时的问题。所述方法采用带权重的欧式距离作为距离函数,能有效的提升了高光谱图像的分类精度。首先对原始图像进行预处理,使用主成分分析方法降低高光谱图像的光谱维度,然后对数据进行归一化处理。将完整的图像数据输入到将加权欧式距离作为距离函数的K‑means算法进行分类,最终得到高光谱图像中每个像素的分类结果。

Description

基于改进K-means算法的高光谱图像分类方法及装置
技术领域
本申请涉及高光谱图像处理技术领域,特别地,涉及一种基于改进K-means算法的高光谱图像分类方法及装置。
背景技术
遥感图像越来越多地被应用于气象预测、植被分析、地质勘探、海洋遥感、环境检测以及城市规划等领域。有关高光谱图像的分类技术的应用一直以来都是其中一个备受关注的应用方向,其目的是对高光谱图像中每个像素点对应的地表物体类别实现准确判定。然而在实际应用中,由于光谱数据量庞大且波段间的信息相关性强且主次影响关系难以分清,要获得较为满意的分类精度是一件具有挑战性的工作。
目前应用于图像分类的算法大多集中在监督算法上,该系列的方法顾及地物的光谱,纹理等信息,在分类效果上已经取得一定的成果,然而却存在一些问题,如严重依赖地面采样数据,人为干扰程度大,自动化程度低的特点。
然而高光谱图像的波段较多,场景复杂,同时聚类中心和距离函数的选择对K-means算法的分类效果影响较大,使得K-means算法在高光谱遥感图像分类中的分类效果较差,在分类精度上仍有很大的提升空间。
发明内容
本申请提供了一种基于改进K-means算法的高光谱图像分类方法及装置,通过降低高光谱图像的维数、归一化处理数据、构建遗传算法初始聚类、根据样本到类中心的加权欧氏距离进行划分类,一定程度上可以解决高光谱遥感的图像光谱维度高、聚类中心获取不合理、分类耗时的问题。
本申请的实施例是这样实现的:
本申请实施例的第一方面提供一种基于改进K-means算法的高光谱图像分类方法,所述方法包括:
S1、获取具有标签的高光谱图像原始数据,所述图像中每个像素对应一个样本;
S2、采用主成分分析方法对高光谱图像进行处理,降低所述高光谱图像的维数,并对所述原始数据进行归一化处理;
S3、利用遗传算法初始k个类的类中心;
S4、计算每一个样本到每个类中心的加权欧氏距离,将所述样本划分到距离最小的类;
S5、在满足收敛条件时,得到高光谱图像分类结果;否则,重新计算特征权值,重复步骤S4。
本申请实施例的第二方面提供一种基于改进K-means算法的高光谱图像分类装置,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序时执行如本申请实施例的第一方面提供发明内容中任意一项所述的方法。
本申请实施例的第三方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令中的至少部分指令被处理器执行时,实现本申请实施例的第一方面提供发明内容中任意一项所述的方法。
本申请的有益效果在于:通过遗传算法来初始化聚类中心,将聚类中心作为遗传信息,并编码为字符串,可以减少运算时间,提高分类精度;进一步通过构建加权欧式距离作为K-means算法的距离函数,可以体现特征之间的相互关系加权,实现将不同权重的特征统计进距离中,可有效提高分类精度。
附图说明
具体为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请实施例一种基于改进K-means算法的高光谱图像分类系统100的示意图;
图2示出了本申请实施例一种示例性计算设备200的示意图;
图3示出了本申请实施例基于改进K-means算法的高光谱图像分类方法流程示意图;
图4示出了本申请实施例遗传算法种群初始化流程步骤图;
图5示出了本申请实施例特征权值获取流程示意图。
具体实施方式
现在将描述某些示例性实施方案,以从整体上理解本文所公开的装置和方法的结构、功能、制造和用途的原理。这些实施方案的一个或多个示例已在附图中示出。本领域的普通技术人员将会理解,在本文中具体描述并示出于附图中的装置和方法为非限制性的示例性实施方案,并且本发明的多个实施方案的范围仅由权利要求书限定。结合一个示例性实施方案示出或描述的特征可与其他实施方案的特征进行组合。这种修改和变型旨在包括在本发明的范围之内。
本说明书通篇提及的“多个实施例”、“一些实施例”、“一个实施例”或“实施例”等,意味着结合该实施例描述的具体特征、结构或特性包括在至少一个实施例中。因此,本说明书通篇出现的短语“在多个实施例中”、“在一些实施例中”、“在至少另一个实施例中”或“在实施例中”等并不一定都指相同的实施例。此外,在一个或多个实施例中,具体特征、结构或特性可以任何合适的方式进行组合。因此,在无限制的情形下,结合一个实施例示出或描述的具体特征、结构或特性可全部或部分地与一个或多个其他实施例的特征、结构或特性进行组合。这种修改和变型旨在包括在本发明的范围之内。
图1是根据本申请的一些实施例所示的一种基于改进K-means算法的高光谱图像分类系统100的示意图。基于改进K-means算法的高光谱图像分类系统100是一个为可以对高光谱图像自动进行分类的平台。基于改进K-means算法的高光谱图像分类系统100可以包括一个服务器110、至少一个存储设备120、至少一个网络130、一个或多个数据采集设备150-1、150-2……150-N。服务器110可以包括一个处理引擎112。
在一些实施例中,服务器110可以是一个单独的服务器或者一个服务器群组。所述服务器群组可以是集中式的或分布式的(例如,服务器110可以是一个分布式的系统)。在一些实施例中,服务器110可以是本地的或远程的。例如,服务器110可以通过网络130访问存储在存储设备120中的数据。服务器110可以直接连接到存储设备120访问存储数据。在一些实施例中,服务器110可以在一个云平台上实现。所述云平台可以包括私有云、公共云、混合云、社区云、分布云、多重云等或上述举例的任意组合。在一些实施例中,服务器110可以在与本申请图2所示的计算设备上实现,包括计算设备200中的一个或多个部件。
在一些实施例中,服务器110可以包括一个处理引擎112。处理引擎112可以处理与服务请求相关的信息和/或数据以执行本申请描述的一个或多个功能。例如,处理引擎112可以基于获取数据采集设备150传送的原始数据,并通过网络130发送至存储设备120,用于更新存储在其中的数据。在一些实施例中,处理引擎112可以包括一个或多个处理器。处理引擎112可以包括一个或多个硬件处理器,例如中央处理器(CPU)、专用集成电路(ASIC)、专用指令集处理器(ASIP)、图像处理器(GPU)、物理运算处理器(PPU)、数字信号处理器(DSP)、现场可编辑门阵列(FPGA)、可编辑逻辑器件(PLD)、控制器、微控制器单元、精简指令集计算机(RISC)、微处理器等或上述举例的任意组合。
存储设备120可以存储数据和/或指令。在一些实施例中,存储设备120可以存储从数据采集设备150获得的原始数据。在一些实施例中,存储设备120可以存储供服务器110执行或使用的数据和/或指令,服务器110可以通过执行或使用所述数据和/或指令以实现本申请描述的实施例方法。在一些实施例中,存储设备120可以包括大容量存储器、可移动存储器、挥发性读写存储器、只读存储器(ROM)等或上述举例的任意组合。在一些实施例中,存储设备120可以在一个云平台上实现。例如所述云平台可以包括私有云、公共云、混合云、社区云、分布云、多重云等或上述举例的任意组合。
在一些实施例中,存储设备120可以与网络130连接以实现与基于改进K-means算法的高光谱图像分类系统100中的一个或多个部件之间的通信。基于改进K-means算法的高光谱图像分类系统100的一个或多个部件可以通过网络130访问存储在存储设备120中的数据或指令。在一些实施例中,存储设备120可以直接与基于改进K-means算法的高光谱图像分类系统100的一个或多个部件连接或通信。在一些实施例中,存储设备120可以是服务器110的一部分。
网络130可以促进信息和/或数据的交换。在一些实施例中,基于改进K-means算法的高光谱图像分类系统100中的一个或多个部件可以通过网络130向基于改进K-means算法的高光谱图像分类系统100中的其他部件发送信息和/或数据。例如,服务器110可以通过网络130从数据采集设备150获取/得到原始数据。在一些实施例中,网络130可以是有线网络或无线网络中的任意一种,或其组合。在一些实施例中,网络130可以包括一个或多个网络接入点。例如,网络130可能包括有线或无线网络接入点,如基站和/或互联网交换点130-1、130-2等等。通过接入点,基于改进K-means算法的高光谱图像分类系统100的一个或多个部件可能连接到网络130以交换数据和/或信息。
数据采集设备150可以将采集到的原始数据发送到基于改进K-means算法的高光谱图像分类系统100中的一个或多个设备中。例如,数据采集设备150可以原始数据发送至服务器110进行处理,或存储设备120中进行存储。
图2是根据本申请的一些实施例所示的一种示例性计算设备200的示意图。服务器110、存储设备120和数据采集设备150可以在计算设备200上实现。例如,处理引擎112可以在计算设备200上实现并被配置为实现本申请中所披露的功能。
计算设备200可以包括用来实现本申请所描述的系统的任意部件。例如,处理引擎112可以在计算设备200上通过其硬件、软件程序、固件或其组合实现。为了方便起见图中仅绘制了一台计算机,但是本申请所描述的与基于改进K-means算法的高光谱图像分类系统100相关的计算功能可以以分布的方式、由一组相似的平台所实施,以分散系统的处理负荷。
计算设备200可以包括与网络连接的通信端口250,用于实现数据通信。计算设备200可以包括一个处理器220,可以以一个或多个处理器的形式执行程序指令。示例性的电脑平台可以包括一个内部总线210、不同形式的程序存储器和数据存储器包括,例如,硬盘270、和只读存储器(ROM)230或随机存储器(RAM)240,用于存储由计算机处理和/或传输的各种各样的数据文件。示例性的计算设备可以包括存储在只读存储器230、随机存储器240和/或其他类型的非暂时性存储介质中的由处理器220执行的程序指令。本申请的方法和/或流程可以以程序指令的方式实现。计算设备200也包括输入/输出部件260,用于支持电脑与其他部件之间的输入/输出。计算设备200也可以通过网络通讯接收本披露中的程序和数据。
为理解方便,图2中仅示例性绘制了一个处理器。然而,需要注意的是,本申请中的计算设备200可以包括多个处理器,因此本申请中描述的由一个处理器实现的操作和/或方法也可以共同地或独立地由多个处理器实现。例如,如果在本申请中,计算设备200的处理器执行步骤1和步骤2,应当理解的是,步骤1和步骤2也可以由计算设备200的两个不同的处理器共同地或独立地执行。
图3示出了本申请实施例基于改进K-means算法的高光谱图像分类方法流程示意图。
在步骤S1中、获取具有标签的高光谱图像原始数据,所述图像中每个像素对应一个样本。
高光谱图像是一种由高光谱成像仪获取的、光谱维度高的图像立方体,其空间平面上包含了大量表征地物像元的像素,每个像素都由一条近似连续的光谱特征构成。光谱特征本质上是该地物目标对不同波长的光的反射率,且反映了特定地物材质和属性,因而可以被用于判断像素对应的地物类别。高光谱图像的大数据量以及高维度的特征都给图像处理以及分类任务带来了巨大的挑战。另外由于高光谱图像像素的光谱特征无法人为识别,标记样本的难度也相当大,常常涉及实地探测考察,因此标记过程十分耗时和代价昂贵。一般情况下,高光谱图像的训练标签特别少,在这种情况下高维光谱特征将会导致分类难度更加高,出现“休斯”现象。当前许多高光谱图像分类方法都受困于如何从标记信息少、特征维度高的高光谱数据中挖掘有效的信息以提升分类能力。
在步骤S2中、采用主成分分析方法对高光谱图像进行处理,降低所述高光谱图像的维数,并对所述原始数据进行归一化处理。
采用主成分分析方法对原始高光谱数据进行降维,对每一个像素点的光谱特征进行归一化处理。
在一些实施例中,归一化方法有两种形式,一种是把数变为(0,1)之间的小数,一种是把有量纲表达式变为无量纲表达式。主要是为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速。归一化是一种简化计算的方式,即将有量纲的表达式,经过变换成为纯量。在一些实施例中,归一化处理采用极值法。极值法是一种重要的数学思想和分析方法。对数据不足而感到无从下手的计算或混合物组成判断的题目,采用极端假设的方法以确定混合体系中各物质的名称、质量分数、体积分数,这样使一些抽象的复杂问题具体化、简单化。
主成分分析(Principal Component Analysis,PCA)是一种多变量统计方法,它是最常用的降维方法之一,通过正交变换将一组可能存在相关性的变量数据转换为一组线性不相关的变量,转换后的变量被称为主成分,通常可以使用两种方法进行PCA,分别是特征分解或奇异值分解。
在一些实施例中,对原始高光谱图像进行降维包括:采用主成分分析法,将X×Y×C的高维光谱图像从光谱维度将数据向低维空间进行映射转换到由K个特征向量构建的新空间中,降低至X×Y×K的低维光谱图像。
在一些实施例中,对原始高光谱图像数据进行归一化处理,包括:采用min-max标准化方法对样本的光谱特征数据进行归一化处理,转换公式为:
其中max为样本数据的最大值,min为样本数据的最小值,通过对原始数据的线性变换,使所有数据的转换结果落到[0,1]区间。
在步骤S3中、利用遗传算法初始k个类的类中心。
遗传进化算法是仿真生物遗传学和自然选择机理通过人工方式所构造的一类搜索算法,在一个解空间上,随机的给定一组解,这组解称为父亲种群,通过这组解的交叉,变异构建出新的解,称为下一代种群,然后在目前已有的所有解中抽取表现好的解组成新的父亲种群,然后重复上述过程,直到达到了迭代条件或者获取到了最优解。
遗传进化算法中染色体又可以叫做基因型个体(individuals),一定数量的个体组成了种群(population),种群中个体的数量叫做种群大小。遗传算法的优点是对数据总体搜索求优的能力较强,而其缺陷是局部搜索能力较差。
图4示出了本申请实施例遗传算法种群初始化流程步骤图。
在一些实施例中,所述遗传算法,其种群初始化过程为:
在步骤401中,产生一个随机整数,表示为:
Ki∈(Kmin,Kmax),
其中,Kmin设置为2,Kmax等于图像的所要划分类别数加上1。
在步骤402中,从数据中随机选取Ki个数据进行浮点数偏码,最终完成一个字符串的构建。
在步骤403中,重复该过程P次,直至完成P个字符串的构建,P值为所要划分的类别数,最终完成种群初始化。
在一些实施例中,所述遗传算法的适应度函数采用的是Davies-Bouldin指标,选择算子为轮盘选择法。
交叉算子为单点交叉法,交叉点为:
fi=rand()mod Ki,
其中,rand()为随机产生一个整数,Ki为字符串中聚类中心的数量,mod表示取余运算。
交叉过程中每一个聚类中心都不可分,交叉点只能为两个聚类中心之间,该算子的交叉概率为μa
在变异算子中,突变个体G,表示为:
G=Xa,i+F(Xb,i+Xc,i),
Fi+1=Fi(i/(i+1)),
其中,i为迭代次数,F0为随机数,F0∈(0.5,1),Xa,i、Xb,i、Xc,i为在某次迭代中随机挑选的聚类中心,该算子的突变概率为μb
在一些实施例中,遗传算法运行至种群中最大适应度值稳定时认为达到收敛。
在步骤S4中、计算每一个样本到每个类中心的加权欧氏距离,将所述样本划分到距离最小的类。
欧氏距离,也称为欧几里得度量(euclidean metric),是一个通常采用的距离定义,指在m维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)。在二维和三维空间中的欧氏距离就是两点之间的实际距离。
距离函数采用加权欧氏距离,具体公式表示为:
其中,Wj代表第j个特征的特征值,初始值为1,此时距离函数退化为普通欧氏距离。xkj表示样本xk的第j个特征,Okj表示第k类的类中心的第j个特征。
在步骤S5中、在满足收敛条件时,得到高光谱图像分类结果;否则,重新计算特征权值,重复步骤S4。
在一些实施例中,所述收敛条件为:所述加权欧氏距离大于等于预设阈值δ,或迭代大于预设最大迭代次数。
步骤S5中设置的收敛条件,即迭代条件为设定一个阀值δ,任意两个聚类中间的距离diff大于δ时,则迭代停止;如果不满足迭代条件,则重新计算特征权值。
图5示出了本申请实施例特征权值获取流程示意图。
在步骤501中,从样本x的同类样本集中找到x的r个最近样本集R。
先对每一个样本x的同类样本集中找到x的r个最近样本集R,Ra表示同类样本集的第a(a=1,2,…,r)个样本。
在步骤502中,从样本x的不同类样本集中分别找到r个最近邻样本构成不同类临近样本集F。
从x的各个不同类样本集中分别找到r个最近邻样本构成不同类临近样本集F,Fk,b表示第k个非同类样本集的第b(b=1,2,…,r)个样本,
在步骤503中,计算第j个特征的特征权重,表示如下:
其中,L(Tj,x,Ra)是样本x和Ra在第j个特征上的距离,L(Tj,x,Fk,b)是样本x和Fk,b在第j个特征上的距离,Pk表示第k类样本在全部样本中出现的概率,Py表示样本x所属类在全部样本中出现的概率,m为迭代次数,初值为1。
本申请实施例还提供了一种基于改进K-means算法的高光谱图像分类装置,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序时执行如本申请实施例所述基于改进K-means算法的高光谱图像分类方法的内容。
本申请实施例还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令中的至少部分指令被处理器执行时,实现如本申请实施例所述基于改进K-means算法的高光谱图像分类方法的内容。
本申请的有益效果在于,通过遗传算法来初始化聚类中心,将聚类中心作为遗传信息,并编码为字符串,可以减少运算时间,提高分类精度;进一步通过构建加权欧式距离作为K-means算法的距离函数,可以体现特征之间的相互关系加权,实现将不同权重的特征统计进距离中,可有效提高分类精度。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN)、或连接至外部计算机(例如通过因特网)、或在云计算环境中、或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外,对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是,如果本申请附属材料中的描述、定义、和/或术语的使用与本申请所述内容有不一致或冲突的地方,以本申请的描述、定义和/或术语的使用为准。

Claims (8)

1.一种基于改进K-means算法的高光谱图像分类方法,其特征在于,所述方法包括:
S1、获取具有标签的高光谱图像原始数据,所述图像中每个像素对应一个样本;
S2、采用主成分分析方法对高光谱图像进行处理,降低所述高光谱图像的维数,并对所述原始数据进行归一化处理;
S3、利用遗传算法初始k个类的类中心;
S4、计算每一个样本到每个类中心的加权欧氏距离,将所述样本划分到距离最小的类;
S5、在满足收敛条件时,得到高光谱图像分类结果;否则,重新计算特征权值,重复步骤S4;
所述收敛条件为:
所述加权欧氏距离大于等于预设阈值δ,或迭代大于预设最大迭代次数;
所述特征权值,其获取执行如下:
从样本x的同类样本集中找到x的r个最近样本集R;
从样本x的不同类样本集中分别找到r个最近邻样本构成不同类临近样本集F;
计算第j个特征的特征权重,表示如下:
其中,Ra表示同类样本集的第a(a=1,2,…,r)个样本,Fk,b表示第k个非同类样本集的第b(b=1,2,…,r)个样本,L(Tj,x,Ra)是样本x和Ra在第j个特征上的距离,L(Tj,x,Fk,b)是样本x和Fk,b在第j个特征上的距离,Pk表示第k类样本在全部样本中出现的概率,Py表示样本y所属类在全部样本中出现的概率,m为迭代次数,初值为1。
2.如权利要求1所述基于改进K-means算法的高光谱图像分类方法,其特征在于,采用主成分分析方法对高光谱图像进行处理,降低所述高光谱图像的维数,并对所述原始数据进行归一化处理,具体执行如下:
降低所述高光谱图像的维数,包括:采用主成分分析法,将X×Y×C的高维光谱图像从光谱维度将数据向低维空间进行映射转换到由K个特征向量构建的新空间中,降低至X×Y×K的低维光谱图像;
对所述原始数据进行归一化处理,包括:采用min-max标准化方法对原始数据进行归一化处理。
3.如权利要求1所述基于改进K-means算法的高光谱图像分类方法,其特征在于,所述遗传算法,其种群初始化过程为:
产生一个随机整数Ki∈(Kmin,Kmax),其中,Kmin设置为2,Kmax等于图像所要划分类别数加上1;
从数据中随机选取Ki个数据进行浮点数偏码,完成一个字符串的构建;
重复上述过程P次,直至完成P个字符串的构建,最终完成种群初始化,其中,P为所要划分的类别数。
4.如权利要求1所述基于改进K-means算法的高光谱图像分类方法,其特征在于,
所述遗传算法,其适应度函数采用Davies-Bouldin指标,选择算子为轮盘选择法,遗传算法运行至种群中最大适应度值稳定时认为达到收敛。
5.如权利要求1所述基于改进K-means算法的高光谱图像分类方法,其特征在于,所述加权欧氏距离,表示为:
其中Wj代表第j个特征的特征值,初始值为1,此时距离函数退化为普通欧氏距离;xkj表示样本xk的第j个特征,Okj表示第k类的类中心的第j个特征。
6.如权利要求1所述基于改进K-means算法的高光谱图像分类方法,其特征在于,所述阈值δ,任意两个聚类中间的距离大于δ,则迭代停止;如果不满足迭代条件,则重新计算特征权值。
7.一种基于改进K-means算法的高光谱图像分类装置,其特征在于,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序时执行如权利要求1-6中任一所述基于改进K-means算法的高光谱图像分类方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令中的至少部分指令被处理器执行时,实现如权利要求1-6中任意一项所述基于改进K-means算法的高光谱图像分类方法。
CN202010465998.8A 2020-05-28 2020-05-28 基于改进K-means算法的高光谱图像分类方法及装置 Active CN111611954B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010465998.8A CN111611954B (zh) 2020-05-28 2020-05-28 基于改进K-means算法的高光谱图像分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010465998.8A CN111611954B (zh) 2020-05-28 2020-05-28 基于改进K-means算法的高光谱图像分类方法及装置

Publications (2)

Publication Number Publication Date
CN111611954A CN111611954A (zh) 2020-09-01
CN111611954B true CN111611954B (zh) 2023-11-24

Family

ID=72196922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010465998.8A Active CN111611954B (zh) 2020-05-28 2020-05-28 基于改进K-means算法的高光谱图像分类方法及装置

Country Status (1)

Country Link
CN (1) CN111611954B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426697A (zh) * 2011-10-24 2012-04-25 西安电子科技大学 基于遗传粗糙集c均值聚类的图像分割方法
CN102915445A (zh) * 2012-09-17 2013-02-06 杭州电子科技大学 一种改进型的神经网络高光谱遥感影像分类方法
CN103150580A (zh) * 2013-03-18 2013-06-12 武汉大学 一种高光谱图像半监督分类方法及装置
CN104252625A (zh) * 2013-06-28 2014-12-31 河海大学 样本自适应多特征加权的遥感图像分类方法
CN106355202A (zh) * 2016-08-31 2017-01-25 广州精点计算机科技有限公司 一种基于k‑均值聚类的图像特征提取方法
WO2018083142A1 (en) * 2016-11-02 2018-05-11 Ventana Medical Systems, Inc. Systems and methods for encoding image features of high-resolution digital images of biological specimens
CN110135432A (zh) * 2019-05-24 2019-08-16 哈尔滨工程大学 一种基于K-means聚类的高光谱遥感图像分割方法
CN110188785A (zh) * 2019-03-28 2019-08-30 山东浪潮云信息技术有限公司 一种基于遗传算法的数据聚类分析方法
CN110543913A (zh) * 2019-09-04 2019-12-06 西南科技大学 一种基于遗传算法的近邻传播聚类方法
CN110766087A (zh) * 2019-10-29 2020-02-07 山东正云信息科技有限公司 一种基于离差最大化法改进k-means的提高数据聚类质量的方法
CN110852227A (zh) * 2019-11-04 2020-02-28 中国科学院遥感与数字地球研究所 高光谱图像深度学习分类方法、装置、设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9147265B2 (en) * 2012-06-04 2015-09-29 Raytheon Company System and method for rapid cluster analysis of hyperspectral images

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426697A (zh) * 2011-10-24 2012-04-25 西安电子科技大学 基于遗传粗糙集c均值聚类的图像分割方法
CN102915445A (zh) * 2012-09-17 2013-02-06 杭州电子科技大学 一种改进型的神经网络高光谱遥感影像分类方法
CN103150580A (zh) * 2013-03-18 2013-06-12 武汉大学 一种高光谱图像半监督分类方法及装置
CN104252625A (zh) * 2013-06-28 2014-12-31 河海大学 样本自适应多特征加权的遥感图像分类方法
CN106355202A (zh) * 2016-08-31 2017-01-25 广州精点计算机科技有限公司 一种基于k‑均值聚类的图像特征提取方法
WO2018083142A1 (en) * 2016-11-02 2018-05-11 Ventana Medical Systems, Inc. Systems and methods for encoding image features of high-resolution digital images of biological specimens
CN110188785A (zh) * 2019-03-28 2019-08-30 山东浪潮云信息技术有限公司 一种基于遗传算法的数据聚类分析方法
CN110135432A (zh) * 2019-05-24 2019-08-16 哈尔滨工程大学 一种基于K-means聚类的高光谱遥感图像分割方法
CN110543913A (zh) * 2019-09-04 2019-12-06 西南科技大学 一种基于遗传算法的近邻传播聚类方法
CN110766087A (zh) * 2019-10-29 2020-02-07 山东正云信息科技有限公司 一种基于离差最大化法改进k-means的提高数据聚类质量的方法
CN110852227A (zh) * 2019-11-04 2020-02-28 中国科学院遥感与数字地球研究所 高光谱图像深度学习分类方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种基于空间信息和遗传算法的半监督高光谱图像分类方法;胡冬翠;谢福鼎;杨俊;张永;;测绘通报(第10期);第22-26页 *
基于K均值聚类的高光谱遥感影像分类研究;赵洁;;地理空间信息;第14卷(第03期);第26-29页 *

Also Published As

Publication number Publication date
CN111611954A (zh) 2020-09-01

Similar Documents

Publication Publication Date Title
Thurau et al. Descriptive matrix factorization for sustainability adopting the principle of opposites
Xu et al. ℓ0-based sparse hyperspectral unmixing using spectral information and a multi-objectives formulation
CN109034224B (zh) 基于双分支网络的高光谱分类方法
CN111091247A (zh) 基于深度神经网络模型融合的电力负荷预测方法、装置
CN111144214B (zh) 基于多层堆栈式自动编码器的高光谱图像解混方法
CN113821670B (zh) 图像检索方法、装置、设备及计算机可读存储介质
Barman et al. Transfer learning for small dataset
CN108171279A (zh) 一种多视角视频自适应乘积Grassmann流形子空间聚类方法
Cai et al. Improving sampling-based image matting with cooperative coevolution differential evolution algorithm
CN109993208A (zh) 一种有噪声图像的聚类处理方法
Mu et al. Auto-CASH: A meta-learning embedding approach for autonomous classification algorithm selection
CN114118369A (zh) 一种基于群智能优化的图像分类卷积神经网络设计方法
CN114937173A (zh) 一种基于动态图卷积网络的高光谱图像快速分类方法
Liebmann et al. Hierarchical correlation clustering in multiple 2d scalar fields
CN108509840B (zh) 基于量子记忆优化机制的高光谱遥感图像波段选择方法
CN111126467B (zh) 一种基于多目标正余弦算法的遥感影像空谱聚类方法
CN113065520A (zh) 一种面向多模态数据的遥感图像分类方法
CN111611954B (zh) 基于改进K-means算法的高光谱图像分类方法及装置
CN115273645B (zh) 一种室内面要素自动聚类的地图制图方法
CN116912550A (zh) 一种基于地物依赖关系的异构卷积网络遥感影像土地利用并行分类方法
Giudice et al. A fast palette reordering technique based on GPU-optimized genetic algorithms
Wang et al. Adaptive hypergraph superpixels
CN114626459A (zh) 使用粒子群优化多核支持向量机的高光谱图像空谱联合分类方法及系统
CN112307288A (zh) 一种用于多渠道的用户聚类方法
Böhm et al. Massively parallel graph drawing and representation learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant