CN105740600A - 一种基于l1正则化的土地指标筛选方法 - Google Patents

一种基于l1正则化的土地指标筛选方法 Download PDF

Info

Publication number
CN105740600A
CN105740600A CN201610015269.6A CN201610015269A CN105740600A CN 105740600 A CN105740600 A CN 105740600A CN 201610015269 A CN201610015269 A CN 201610015269A CN 105740600 A CN105740600 A CN 105740600A
Authority
CN
China
Prior art keywords
index
value
plot
fuzzy
soil
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610015269.6A
Other languages
English (en)
Inventor
王金凤
王文中
陈润健
陈嘉杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Agricultural University
Original Assignee
South China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Agricultural University filed Critical South China Agricultural University
Priority to CN201610015269.6A priority Critical patent/CN105740600A/zh
Publication of CN105740600A publication Critical patent/CN105740600A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于L1正则化的土地指标筛选方法,该方法使用模糊测度值描述地块影响指标或地块影响指标子集,以表达其对目标地块质量的影响度;通过模糊积分的计算基于模糊测度的目标值,再通过求解模糊测度值,筛选重要土地指标集;最后根据选取的重要土地指标集构建决策树评判模型,进行地块质量评价。本发明依靠模糊积分构建土地指标相关的线性规划方程,采用L1正则化方法求得一组模糊测度稀疏解,少数非零解对应的变量即为重要指标,从而达到土地指标筛选的目的。

Description

一种基于L1正则化的土地指标筛选方法
技术领域
本发明属于计算机信息领域,是一种通过L1方法对土地整治指标进行筛选的方法。
背景技术
土地整治工作中,土地指标系统的构建对质量评估是至关重要的。因此土地指标的选择影响到评估和决策。目前,许多人重点研究土地指标系统的优化和选择,最多使用的是最小方差法用于选择层次分析过程中的指标权重。但是土地指标是繁多复杂的,与社会、经济、生态等因素相关。例如,功能分类指标(FCIi)是综合了产量值、经济服务值、生态敏感度以及季节收割重要度等因素。传统上,土地指标系统根据专家经验完成构建,但是,人为因素会使这些评估失去客观性和一致性。而分析层次法中准确的权重获取也是非常困难的。
发明内容
针对现有技术所存在的上述问题,本发明提出一种基于L1正则化的土地指标筛选方法,该方法依靠模糊积分构建土地指标相关的线性规划方程,采用L1正则化方法求得一组模糊测度稀疏解,少数非零解对应的变量即为重要指标,从而达到土地指标筛选的目的。
本发明采用如下技术方案来实现:基于L1正则化的土地指标筛选方法,包括以下步骤:
S1、使用模糊测度值描述地块影响指标或地块影响指标子集,以表达其对目标地块质量的影响度;
S2、假定含l个例子的数据集合称为训练集,其中每个例子包含一个决策特征Y和n个预测特征x1,x2,...,xn,正整数l表示数据集的大小,决策特征指示每个例子属于哪一类,此分类所有可能的值的集合由C=c1,c2,...,cm表示,预测特征的值由一个n维向量f(x1),f(x2),...,f(xn)所表示,向量的范围是n维欧几里得空间的子集;
S3、通过模糊积分的计算基于模糊测度的目标值,如下面的公式:
∫ f d μ = Σ j = 1 2 n - 1 z j μ j - - - ( 1 )
其中
其中,表示的小数部分,μ为模糊测度;
S4、求解模糊测度值,筛选重要土地指标集;
S5、根据步骤S4选取的重要土地指标集构建决策树评判模型,进行地块质量评价。
优选地,所述步骤S3中,将j以二进制的形式jnjn-1…j1表示,则有 { i | f r c ( j 2 i ) ∈ [ 0 , 1 2 ) } = { i | j i = 0 } .
优选地,所述步骤S4采用基于L1正则化方法,使得的值最小,从而得到一组带有少量非零值的解,通过调节其中的参数λ来控制非零值的个数,这组非零解对应的土地指标或指标集则是筛选得到的重要土地指标集。
本发明中的每个指标都可以看作土地数据库的特征,而土地的等级分类为预测目标。本发明提出了基于L1正则化的方法求解土地指标重要度,通过模糊积分构建线性方程组,所求稀疏解用以确定最终的重要土地指标集。与现有技术相比,本发明具有如下有益效果:
本发明依据土地数据使用科学方法客观地选择土地指标,避免了人为因素的影响;依靠模糊积分构建土地指标相关的线性规划方程,采用L1正则化方法求得一组模糊测度稀疏解,少数非零解对应的变量即为重要指标,从而达到土地指标筛选的目的。
附图说明
图1为本发明实施例的流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的具体实施方式不局限于此。
实施例
模糊测度的使用能够很好地描述土地指标之间的交互作用对决策的重要度。令X表示同一个地块的所有指标集合。对于我们考虑A组指标影响土地质量的情况。每一组可能都有不同的影响程度:存在直接或者间接作用。令μ(A)表示A组指标的重要度,那么集合函数μ:P(X)→[0,∞)是单调的,并且即模糊测度。
本发明的实施流程如图1所示,具体包括以下步骤:
S1、使用模糊测度值描述地块影响指标或地块影响指标子集,以表达其对目标地块质量的影响度。
我们所用的地块影响指标如表1所示,指标可以被看作是数据库特征,构成全集X={x1,x2,x3},对于每一个指标和每一组指标子集,都有一个不同的模糊测度值与之对应,来描述其对目标地块质量的影响度。由于模糊测度的非可加性,土地指标对地块质量的影响并不独立,使得所有指标对于目标地块质量的全局影响不仅仅是每个指标影响的简单加和。当指标众多时,我们需要选择相对重要的指标体系来对地块进行评价。
表1土地评价指标表
S2、假定有一个数据集合称为训练集,含有l个例子,其中每个例子包含一个决策特征Y和n个预测特征x1,x2,...,xn,正整数l表示数据集的大小,决策特征指示每个例子属于哪一类,此分类所有可能的值的集合可以由C=c1,c2,...,cm表示。预测特征的值由一个n维向量f(x1),f(x2),...,f(xn)所表示,向量的范围是n维欧几里得空间的子集,例如,第k个例子包含n个特征和一个决策值,即可以表示为fk(x1),fk(x2),…,fk(xn),Yk),k=1,2,…,l,。
S3、通过模糊积分的计算基于模糊测度的目标值,如下面的公式:
∫ f d μ = Σ j = 1 2 n - 1 z j μ j - - - ( 1 )
其中
其中,表示的小数部分。上面的公式中,如果将j以二进制的形式jnjn-1…j1表示,则有 { i | f r c ( j 2 i ) ∈ ( 1 2 , 1 ) } = { i | j i = 1 } { i | f r c ( j 2 i ) ∈ [ 0 , 1 2 ) } = { i | j i = 0 } . 对于已知的数据库,很容易建立一组以未知模糊测度μ为系数的线性方程。
S4、求解模糊测度值,筛选重要土地指标集。
为了解得模糊测度值,我们采用基于L1正则化方法,使得的值最小,从而会得到一组带有少量非零值的解,通过调节其中的参数λ来控制非零值的个数,这组非零解对应的土地指标或指标集则是筛选得到的重要土地指标集。
为了更好地说明此专利的效果,本发明以一组真实土地数据为例,土地指标集合如表2所示,X={x1,x2,…,x23},对应每一项指标,不同地块都有不同的取值。使用模糊测度方法来进一步跟踪各个指标和指标组合对地块质量的影响程度。具体的实施采用Matlab7.2编程实现,其中L1正则化方法求解模糊测度可直接调用LASSO函数包来完成,经过多次实验,最终压缩参数λ确定在100,最终解得的模糊测度有值的位置所对应的指标集合为{10000000}和{1111100},而对应的真正的指标标号则为{x4,x6,x8,x9,x10}。因此,筛选出的指标集包括公共福利、人均收入、空气污染度、污染密度和水污染。
S5、根据已经选取的重要土地指标集构建决策树评判模型,进行地块质量评价。
为了说明本方法的性能,我们还和基于粗糙集的特征选取方法进行比较,同时根据已经选取的重要土地指标集构建决策树评判模型,进行地块质量评价。分别从重要指标集大小、决策树的大小、评判准确度等方面进行比较,各自获取的指标集和评价结果如表3所示。
表2数据库描述
表3.性能比较
从表3我们可以看出,基于模糊测度筛选的重要指标集最小,而评判准确度最高,所构建的决策树模型也是最小,时间复杂度和空间复杂度都是最优。从而证明本发明提出的基于L1正则化进行模糊测度求解的指标筛选方法是切实有效的。
本发明的实施方式并不受上述实施例的限制,其他任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (3)

1.一种基于L1正则化的土地指标筛选方法,其特征在于,包括以下步骤:
S1、使用模糊测度值描述地块影响指标或地块影响指标子集,以表达其对目标地块质量的影响度;
S2、假定含l个例子的数据集合称为训练集,其中每个例子包含一个决策特征Y和n个预测特征x1,x2,...,xn,正整数l表示数据集的大小,决策特征指示每个例子属于哪一类,此分类所有可能的值的集合由C=c1,c2,...,cm表示,预测特征的值由一个n维向量f(x1),f(x2),...,f(xn)所表示,向量的范围是n维欧几里得空间的子集;
S3、通过模糊积分的计算基于模糊测度的目标值,如下面的公式:
∫ f d μ = Σ j = 1 2 n - 1 z j μ j - - - ( 1 )
其中
其中,表示的小数部分,μ为模糊测度;
S4、求解模糊测度值,筛选重要土地指标集;
S5、根据步骤S4选取的重要土地指标集构建决策树评判模型,进行地块质量评价。
2.根据权利要求1所述的土地指标筛选方法,其特征在于,所述步骤S3中,将j以二进制的形式jnjn-1…j1表示,则有 { i | f r c ( j 2 i ) ∈ ( 1 2 , 1 ) } = { i | j i = 1 } { i | f r c ( j 2 i ) ∈ [ 0 , 1 2 ) } = { i | j i = 0 } .
3.根据权利要求1所述的土地指标筛选方法,其特征在于,所述步骤S4采用基于L1正则化方法,使得的值最小,从而得到一组带有少量非零值的解,通过调节其中的参数λ来控制非零值的个数,这组非零解对应的土地指标或指标集则是筛选得到的重要土地指标集。
CN201610015269.6A 2016-01-08 2016-01-08 一种基于l1正则化的土地指标筛选方法 Pending CN105740600A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610015269.6A CN105740600A (zh) 2016-01-08 2016-01-08 一种基于l1正则化的土地指标筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610015269.6A CN105740600A (zh) 2016-01-08 2016-01-08 一种基于l1正则化的土地指标筛选方法

Publications (1)

Publication Number Publication Date
CN105740600A true CN105740600A (zh) 2016-07-06

Family

ID=56246296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610015269.6A Pending CN105740600A (zh) 2016-01-08 2016-01-08 一种基于l1正则化的土地指标筛选方法

Country Status (1)

Country Link
CN (1) CN105740600A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106952170A (zh) * 2017-02-20 2017-07-14 中国农业大学 一种基于随机森林的县域耕地自然质量评价方法
CN114971164A (zh) * 2022-04-13 2022-08-30 江苏禹润水务研究院有限公司 一种基于人工智能的污泥处理设备异常检测方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722755A (zh) * 2011-06-20 2012-10-10 新疆林业科学院 新疆土地退化评价指标体系

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722755A (zh) * 2011-06-20 2012-10-10 新疆林业科学院 新疆土地退化评价指标体系

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
J. WANG ET AL.: "A fuzzy intelligent system for land consolidation – a case study in Shunde, China", 《SOLID EARTH》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106952170A (zh) * 2017-02-20 2017-07-14 中国农业大学 一种基于随机森林的县域耕地自然质量评价方法
CN114971164A (zh) * 2022-04-13 2022-08-30 江苏禹润水务研究院有限公司 一种基于人工智能的污泥处理设备异常检测方法及系统
CN114971164B (zh) * 2022-04-13 2023-09-22 江苏禹润水务研究院有限公司 一种基于人工智能的污泥处理设备异常检测方法及系统

Similar Documents

Publication Publication Date Title
Farsadnia et al. Identification of homogeneous regions for regionalization of watersheds by two-level self-organizing feature maps
Liu et al. Uncertainty and confidence in land cover classification using a hybrid classifier approach
CN110796284A (zh) 细颗粒物污染等级的预测方法、装置及计算机设备
CN108549954A (zh) 风险模型训练方法、风险识别方法、装置、设备及介质
Wan et al. A knowledge-based decision support system to analyze the debris-flow problems at Chen-Yu-Lan River, Taiwan
CN109146144A (zh) 基于改进贝叶斯网络的滑坡灾害预测方法
CN104899473A (zh) 一种河流断面退化评价方法
Adamo et al. Expert knowledge for translating land cover/use maps to General Habitat Categories (GHC)
CN101894270A (zh) 面向遥感影像分类的样本自动选取方法
CN103886334A (zh) 一种多指标融合的高光谱遥感影像降维方法
CN107945534A (zh) 一种基于gmdh神经网络的交通车流量预测方法
Ayhan et al. Analysis of image classification methods for remote sensing
CN108388828A (zh) 一种综合多源遥感数据的滨海湿地土地覆盖信息提取方法
Maheswari et al. Efficient Drinking Water Quality Analysis using Machine Learning Model with Hyper-Parameter Tuning
CN105740600A (zh) 一种基于l1正则化的土地指标筛选方法
CN113139717B (zh) 作物苗情分级遥感监测方法及装置
CN104834966A (zh) 一种基于蚁群分类算法的渔场预报方法
CN111882573B (zh) 一种基于高分辨率影像数据的耕地地块提取方法及系统
CN113344130A (zh) 差异化巡河策略的生成方法及装置
CN111666999A (zh) 一种遥感图像的分类方法
CN104008397B (zh) 一种基于图像集的目标跟踪算法
KR20170112469A (ko) 데이터마이닝 기법을 이용한 종합 수질 평가지수의 산정방법
Szoszkiewicz et al. Measures of central tendency of aquatic habitat parameters: application to river macrophyte communities
Kiran et al. Classification of groundwater by applying Simplified Fuzzy Adaptive Resonance Theory.
Parsa et al. Multitemporal Landsat data to quick mapping of paddy field based on statistical parameters of vegetation index (case study: Tanggamus, Lampung)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160706