CN113869513A - 一种基于遗传算法的分类规则阈值优化方法 - Google Patents
一种基于遗传算法的分类规则阈值优化方法 Download PDFInfo
- Publication number
- CN113869513A CN113869513A CN202111089890.4A CN202111089890A CN113869513A CN 113869513 A CN113869513 A CN 113869513A CN 202111089890 A CN202111089890 A CN 202111089890A CN 113869513 A CN113869513 A CN 113869513A
- Authority
- CN
- China
- Prior art keywords
- classification
- threshold
- error rate
- genetic algorithm
- minimum error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002068 genetic effect Effects 0.000 title claims abstract description 50
- 238000005457 optimization Methods 0.000 title claims abstract description 39
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000011156 evaluation Methods 0.000 claims abstract description 8
- 238000012544 monitoring process Methods 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 29
- 230000008569 process Effects 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 abstract description 3
- 238000007418 data mining Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 230000005570 vertical transmission Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000010429 evolutionary process Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/24765—Rule-based classification
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Genetics & Genomics (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Physiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
一种基于遗传算法的分类规则阈值优化方法,涉及基于遥感影像的分类、数据挖掘等领域,本发明根据分类规则准备遥感分类特征和现有分类结果,查找分类规则涉及的特征并计算其值域作为优化阈值上下限,以分类规则阈值为推荐阈值;初始化遗传算法并在评估函数中根据规则和随机生成的阈值对遥感分类特征进行分类,与现有分类结果比较并计算错误率作为当前阈值的适应度;在监控函数中记录每一代最小错误率,在最小错误率不变时结束迭代;运行遗传算法,在最小错误率不变时得到一系列阈值和最小错误率;最小错误率对应的阈值即为优化阈值。本发明能高效优化分类规则的阈值,克服了分类规则涉及多个指标时目视判断方法难以有效优化其阈值的问题。
Description
技术领域
本发明涉及一种基于遗传算法的分类规则阈值优化方法,涉及基于遥感影像的分类、数据挖掘等技术领域。
背景技术
随着大数据等技术的进步,人们已不再满足于仅获取较好的分类结果,开始挖掘产生这一分类结果的分类规则。在遥感影像分类方面,人们已通过大量实践总结了一系列的分类规则,如归一化植被指数(NDVI)可以识别植被。但是,这类规则的阈值是变化的,如植被的类型、植被的生长状况均会影响NDVI值。那么,为了应用这些规则,需要手动调整阈值,并使用目视方法判断阈值的可用性。当分类规则涉及多个指标时,这些阈值将难以高效调整。
遗传算法通过模拟群落在自然筛选情况下的进化过程,可以对分类规则的各指标阈值进行迭代优化,获取最贴近当前区域的阈值。应用更新后的分类规则,可以获取相对更新前更优的分类结果,也可以克服区域研究区域调整、影像成像时间不同等带来的差异。
目前,基于遗传算法的分类规则阈值优化方法还未见报道。
发明内容
为了解决现有的遥感技术难以高效调整分类规则阈值的问题,本发明提供一种基于遗传算法的分类规则阈值优化方法。
本发明为解决技术问题所采用的技术方案如下:
本发明的一种基于遗传算法的分类规则阈值优化方法,包括以下步骤:
步骤一、准备遥感数据,包括现有分类结果数据和分类特征数据;
步骤二、根据所提供的分类规则拆分出此分类规则所涉及的分类特征和阈值,所提供的阈值作为遗传算法的推荐解;
步骤三、统计分类特征在分类特征数据中的值域,用于约束遗传算法的优化过程;
步骤四、初始化遗传算法,将步骤三中得到的分类特征在分类特征数据中的值域范围作为阈值的下限和上限,指定推荐解为步骤二中提供的阈值;
步骤五、创建遗传算法的评估函数,根据分类规则及相应阈值进行分类,与现有分类结果数据进行比较并计算错误率,将此错误率作为评估函数的适应度;
步骤六、创建遗传算法的监控函数,记录每一代的最小错误率,并在最小错误率不再改变时结束迭代;
步骤七、重复步骤四至步骤六对遗传算法进行迭代,直至当前最小错误率不再改变,得到一系列阈值和对应的最小错误率,最小错误率对应的阈值即为优化阈值。
进一步的,步骤一中,选择2019年吉林向海国家级自然保护区的部分湿地解译结果作为现有分类结果数据;利用Google Earth Engine云平台将相关特征合并成为一幅影像作为分类特征数据。
进一步的,步骤三中,采用R语言quantile函数获取1%分位数作为阈值下限,获取99%分位数作为阈值上限。
进一步的,步骤四中,基于R语言genalg包rbga函数初始化遗传算法,将计算的阈值下限、阈值上限、推荐阈值传递给初始化函数,种群规模设为200,迭代次数设为100,变异率为0.01。
进一步的,步骤五中,编写遗传算法的evalFunc函数,首先记录遗传算法产生的随机阈值,然后根据分类规则所涉及的分类特征和这些随机阈值进行分类,获取分类结果;将分类结果与现有分类结果逐像素比较,计算错误率作为适应度。
进一步的,步骤六中,编写遗传算法的monitorFunc函数,首先获取并记录当前迭代种群下的最小错误率,然后查找记录中前30次迭代的逐代最小错误率,若当前最小错误率不再改变,对应的30个最小错误率的方差为0,则中止优化,否则继续进行优化。
进一步的,步骤六中,最小错误率不再改变的判定方式采用差分求和方法。
进一步的,步骤七中,运行rbga函数,不断迭代优化,直至最小错误率不再改变,得到一系列阈值和对应的最小错误率,最小错误率对应的阈值即为优化阈值,并更新规则。
本发明的有益效果是:
本发明基于现有分类结果、分类特征与分类规则,根据分类规则准备遥感分类特征数据和现有分类结果数据,查找分类规则涉及的特征并计算其值域,统计所涉及的分类特征值域作为阈值优化的下限和上限,并将所提供分类规则的阈值作为推荐阈值;初始化遗传算法获得一系列随机阈值,并在评估函数中根据规则和随机生成的阈值对遥感分类特征数据进行分类,与现有分类结果数据比较并计算错误率,以此作为当前阈值的适应度;在监控函数中记录每一代的最小错误率,并在最小错误率不再改变时提前结束迭代以提升优化效率,保证计算的高效性;运行遗传算法,在最小错误率不再改变或达到指定迭代次数时,得到一系列阈值和对应的最小错误率;其中,最小错误率对应的阈值即为分类规则适配到当前区域的优化阈值。
本发明克服了分类规则涉及多个指标时目视判断方法难以有效优化其阈值的问题。本发明所涉及的分类规则阈值优化方法快捷有效,提高了分类规则阈值优化的准确度和效率,对基于规则的遥感分类方法具有极其重要的意义。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例共同用于解释本发明,并不构成对本发明的限制。在附图中:
图1为分类规则所涉及特征合成的影像与现有的湿地分布数据。
图2为遗传算法逐代的最小错误率。
图3为遗传算法产生的阈值和相应的错误率。
图4为优化前湿地分类规则产生的分类结果与现有的湿地分布数据。
图5为优化后湿地分类规则产生的分类结果与现有的湿地分布数据。
具体实施方式
以下结合附图对本发明作进一步详细说明。
本发明的一种基于遗传算法的分类规则阈值优化方法,主要包括以下步骤:
步骤一、准备遥感数据,包括现有分类结果数据和分类特征数据。
其中,选择2019年吉林向海国家级自然保护区的部分湿地解译结果作为现有分类结果数据;利用Google Earth Engine云平台将相关特征合并成为一幅影像作为分类特征数据。具体为:利用Google Earth Engine云平台获取2019年5月到2019年10月的Sentinel-1SAR影像和Sentinel-2MSI影像,根据所提供的2020年湿地识别规则“B5<1500&VH/VV>=1.5&(B3-B11)/(B3+B11)>=-0.5”计算相应的分类特征,其中,B3表示Sentinel-2卫星的波段3(绿波段),B5表示Sentinel-2卫星的波段5(红边波段1),B11表示Sentinel-2卫星的波段11(短波红外波段1),VH表示Sentinel-1卫星的VH波段(垂直发射、水平接收),VV表示Sentinel-1卫星的VV波段(垂直发射、垂直接收),并合并成为一幅影像(如图1所示)。
步骤二、根据所提供的分类规则拆分出这一分类规则所涉及的分类特征和阈值。其中,所提供的阈值作为遗传算法的推荐解以及迭代的起始。所提供的分类特征数据由所提供的分类规则决定。
此处所涉及的分类特征分别为B5、VH/VV和(B3-B11)/(B3+B11),阈值分别为1500、1.5和-0.5。
步骤三、根据所提供的分类规则所涉及的分类特征统计分类特征在分类特征数据中的值域,用于约束遗传算法的优化过程。具体为:采用R语言quantile函数获取1%分位数作为阈值下限,分别为674.5、1.21和-0.635,获取99%分位数作为阈值上限,分别为3104、2.42和0.831。除了使用分位数范围,也可使用最值等。
步骤四、初始化遗传算法,指定优化阈值的最小值和最大值(将步骤三中得到的分类特征在分类特征数据中的值域范围作为阈值的下限和上限),指定推荐解为步骤二中提供的阈值。具体为:基于R语言genalg包rbga函数初始化遗传算法,将计算的阈值下限、阈值上限、推荐阈值传递给初始化函数,种群规模设为200,迭代次数设为100,变异率为0.01。
步骤五、创建遗传算法的评估函数,根据分类规则及相应阈值进行分类,与现有分类结果数据进行比较并计算错误率,将这一错误率作为评估函数的适应度。具体为:编写遗传算法的evalFunc函数,首先记录遗传算法产生的随机阈值,然后根据分类规则所涉及的分类特征和这些随机阈值进行分类,获取分类结果;将分类结果与现有分类结果逐像素比较,计算错误率作为适应度。
步骤六、创建遗传算法的监控函数,记录每一代的最小错误率,并在最小错误率不再改变时提前结束迭代,从而提升优化效率。具体为:编写遗传算法的monitorFunc函数,首先获取并记录当前迭代种群下的最小错误率,然后查找记录中前30次迭代的逐代最小错误率,若当前最小错误率不再改变(对应的30个最小错误率的方差为0),则中止优化,否则继续进行优化。最小错误率不再改变的判定方式较多,如差分求和等。
步骤七、重复步骤四至步骤六对遗传算法进行迭代,直至当前最小错误率不再改变,得到一系列阈值和对应的最小错误率,最小错误率对应的阈值即为优化阈值。具体为:运行rbga函数,不断迭代优化,直至最小错误率不再改变(如图2所示),得到一系列阈值和对应的最小错误率(如图3所示)。最小错误率对应的阈值即为优化阈值,并更新湿地识别规则为“B5<1123&VH/VV>=1.84&(B3-B11)/(B3+B11)>=-0.53”。
使用优化前的规则和优化后的规则分别进行分类,其最小错误率分别为15.4%和12.4%,得到的空间分布结果分别如图4和图5所示。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种基于遗传算法的分类规则阈值优化方法,其特征在于,包括以下步骤:
步骤一、准备遥感数据,包括现有分类结果数据和分类特征数据;
步骤二、根据所提供的分类规则拆分出此分类规则所涉及的分类特征和阈值,该阈值作为遗传算法的推荐解;
步骤三、统计分类规则所涉及的分类特征在分类特征数据中的值域,用于约束遗传算法的优化过程;
步骤四、初始化遗传算法,将步骤三中得到的分类特征在分类特征数据中的值域范围作为阈值的下限和上限,指定推荐解为步骤二中提供的阈值;
步骤五、创建遗传算法的评估函数,根据分类规则及相应阈值进行分类,与现有分类结果数据进行比较并计算错误率,将此错误率作为评估函数的适应度;
步骤六、创建遗传算法的监控函数,记录每一代的最小错误率,并在最小错误率不再改变时结束迭代;
步骤七、重复步骤四至步骤六对遗传算法进行迭代,直至当前最小错误率不再改变,得到一系列阈值和对应的最小错误率,该最小错误率对应的阈值即为优化阈值。
2.根据权利要求1所述的一种基于遗传算法的分类规则阈值优化方法,其特征在于,步骤一中,选择2019年吉林向海国家级自然保护区的部分湿地解译结果作为现有分类结果数据;利用Google Earth Engine云平台将相关特征合并成为一幅影像作为分类特征数据。
3.根据权利要求2所述的一种基于遗传算法的分类规则阈值优化方法,其特征在于,步骤三中,采用R语言quantile函数获取1%分位数作为阈值下限,获取99%分位数作为阈值上限。
4.根据权利要求3所述的一种基于遗传算法的分类规则阈值优化方法,其特征在于,步骤四中,基于R语言genalg包rbga函数初始化遗传算法,将计算的阈值下限、阈值上限、推荐阈值传递给初始化函数,种群规模设为200,迭代次数设为100,变异率为0.01。
5.根据权利要求4所述的一种基于遗传算法的分类规则阈值优化方法,其特征在于,步骤五中,编写遗传算法的evalFunc函数,首先记录遗传算法产生的随机阈值,然后根据分类规则所涉及的分类特征和这些随机阈值进行分类,获取分类结果;将分类结果与现有分类结果逐像素比较,计算错误率作为适应度。
6.根据权利要求5所述的一种基于遗传算法的分类规则阈值优化方法,其特征在于,步骤六中,编写遗传算法的monitorFunc函数,首先获取并记录当前迭代种群下的最小错误率,然后查找记录中前30次迭代的逐代最小错误率,若当前最小错误率不再改变,对应的30个最小错误率的方差为0,则中止优化,否则继续进行优化。
7.根据权利要求6所述的一种基于遗传算法的分类规则阈值优化方法,其特征在于,步骤六中,最小错误率不再改变的判定方式采用差分求和方法。
8.根据权利要求6所述的一种基于遗传算法的分类规则阈值优化方法,其特征在于,步骤七中,运行rbga函数,不断迭代优化,直至最小错误率不再改变,得到一系列阈值和对应的最小错误率,最小错误率对应的阈值即为优化阈值,并更新规则。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111089890.4A CN113869513B (zh) | 2021-09-17 | 2021-09-17 | 一种基于遗传算法的分类规则阈值优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111089890.4A CN113869513B (zh) | 2021-09-17 | 2021-09-17 | 一种基于遗传算法的分类规则阈值优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113869513A true CN113869513A (zh) | 2021-12-31 |
CN113869513B CN113869513B (zh) | 2024-02-09 |
Family
ID=78996352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111089890.4A Active CN113869513B (zh) | 2021-09-17 | 2021-09-17 | 一种基于遗传算法的分类规则阈值优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113869513B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104572993A (zh) * | 2015-01-06 | 2015-04-29 | 浪潮电子信息产业股份有限公司 | 一种基于遗传算法的分类算法参数优化方法 |
CN108985054A (zh) * | 2017-06-05 | 2018-12-11 | 中国电信股份有限公司 | 威胁情报分析方法和装置 |
CA3007786A1 (en) * | 2018-06-11 | 2019-12-11 | The Governing Council Of The University Of Toronto | Data visualization platform for event-based behavior clustering |
AU2020103782A4 (en) * | 2020-11-30 | 2021-02-11 | Ningxia Medical University | Pet/ct high-dimensional feature level selection method based on genetic algorithm and variable precision rough set |
-
2021
- 2021-09-17 CN CN202111089890.4A patent/CN113869513B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104572993A (zh) * | 2015-01-06 | 2015-04-29 | 浪潮电子信息产业股份有限公司 | 一种基于遗传算法的分类算法参数优化方法 |
CN108985054A (zh) * | 2017-06-05 | 2018-12-11 | 中国电信股份有限公司 | 威胁情报分析方法和装置 |
CA3007786A1 (en) * | 2018-06-11 | 2019-12-11 | The Governing Council Of The University Of Toronto | Data visualization platform for event-based behavior clustering |
AU2020103782A4 (en) * | 2020-11-30 | 2021-02-11 | Ningxia Medical University | Pet/ct high-dimensional feature level selection method based on genetic algorithm and variable precision rough set |
Non-Patent Citations (2)
Title |
---|
MIAO WANG, XI-ZHAO WANG: ""A Research on Weight Acquisition of Weighted Fuzzy Production Rules Based on Genetic Algorithm"", 《2006 INTERNATIONAL CONFERENCE ON MACHINE LEARNING AND CYBERNETICS》 * |
陈丹: ""基于优化决策树的高分辨率遥感影像分类技术研究"", 《中国博士学位论文全文数据库 信息科技辑》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113869513B (zh) | 2024-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105488528B (zh) | 基于改进自适应遗传算法的神经网络图像分类方法 | |
CN110298321B (zh) | 基于深度学习图像分类的道路阻断信息提取方法 | |
CN107133496B (zh) | 基于流形学习与闭环深度卷积双网络模型的基因特征提取方法 | |
CN107392919B (zh) | 基于自适应遗传算法的灰度阈值获取方法、图像分割方法 | |
CN109886146B (zh) | 基于机器视觉检测的洪灾信息遥感智能采集方法及设备 | |
Gleason et al. | A fusion approach for tree crown delineation from lidar data. | |
CN110211109B (zh) | 基于深度神经网络结构寻优的图像变化检测方法 | |
CN114118369A (zh) | 一种基于群智能优化的图像分类卷积神经网络设计方法 | |
CN112508851A (zh) | 一种基于cnn分类算法的泥岩岩性识别系统 | |
CN107240100B (zh) | 一种基于遗传算法的图像分割方法和系统 | |
CN115170943A (zh) | 一种基于迁移学习的改进视觉Transformer海底底质声呐图像分类方法 | |
CN109598771B (zh) | 一种多地貌特征约束的地形合成方法 | |
CN111882573B (zh) | 一种基于高分辨率影像数据的耕地地块提取方法及系统 | |
CN114003900A (zh) | 变电站二次系统网络入侵检测方法、装置及系统 | |
Xiao et al. | Filtering method of rock points based on BP neural network and principal component analysis | |
CN113869513A (zh) | 一种基于遗传算法的分类规则阈值优化方法 | |
CN110245666B (zh) | 基于双隶属度驱动的多目标区间值模糊聚类图像分割方法 | |
CN111737688A (zh) | 基于用户画像的攻击防御系统 | |
De Stefano et al. | A GA-based feature selection algorithm for remote sensing images | |
CN114581470B (zh) | 一种基于植物群落行为的图像边缘检测方法 | |
CN115731119A (zh) | 基于非匹配地质图像的自动去噪方法 | |
CN112907503B (zh) | 基于自适应卷积神经网络的南美白对虾品质检测方法 | |
CN113869514B (zh) | 一种基于遗传算法的多知识集成与优化方法 | |
CN112183444A (zh) | 城市景观分类优化方法及装置、设备及介质 | |
CN113869515B (zh) | 一种融合遗传算法和决策树算法的知识提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |