CN117391265A - 基于大数据分析的林业病虫灾害风险预测方法 - Google Patents
基于大数据分析的林业病虫灾害风险预测方法 Download PDFInfo
- Publication number
- CN117391265A CN117391265A CN202311704500.9A CN202311704500A CN117391265A CN 117391265 A CN117391265 A CN 117391265A CN 202311704500 A CN202311704500 A CN 202311704500A CN 117391265 A CN117391265 A CN 117391265A
- Authority
- CN
- China
- Prior art keywords
- pest
- data
- disease
- cluster
- occurrence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 241000607479 Yersinia pestis Species 0.000 title claims abstract description 480
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000007405 data analysis Methods 0.000 title claims abstract description 21
- 201000010099 disease Diseases 0.000 claims abstract description 236
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 236
- 238000009825 accumulation Methods 0.000 claims abstract description 27
- 241000238631 Hexapoda Species 0.000 claims description 132
- 238000010606 normalization Methods 0.000 claims description 14
- 230000001186 cumulative effect Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 2
- 241000196324 Embryophyta Species 0.000 description 89
- 230000002265 prevention Effects 0.000 description 9
- 238000011161 development Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 241001491790 Bupalus piniaria Species 0.000 description 1
- 241000254173 Coleoptera Species 0.000 description 1
- 241000256602 Isoptera Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Educational Administration (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Probability & Statistics with Applications (AREA)
- Agronomy & Crop Science (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及林业病虫害风险预测领域,具体涉及一种基于大数据分析的林业病虫灾害风险预测方法。该方法首先获取待测林业区域的病虫害数据,对病虫害数据进行聚类获得多个聚类簇,分析聚类簇中病虫害数据的发病次数和发病累计时间以及相同类型的病虫害数据的数量,获得每个病虫害数据的发生可能性,分析每个类型的病虫害数据的数量以及对应病虫害数据的发生年份,获得每个聚类簇的病虫害重视程度,基于病虫害重视程度对发生可能性进行调整,获得每个病虫害类型的真实风险程度,基于真实风险程度对待测林业区域的病虫灾害风险进行预测。本发明能够针对病虫害类型对林业病虫灾害风险进行准确的预测,同时还能够对新型病虫害进行有效预测。
Description
技术领域
本发明涉及林业病虫害风险预测领域,具体涉及一种基于大数据分析的林业病虫灾害风险预测方法。
背景技术
病虫灾害对林业发展是一种严重威胁,对病虫灾害风险的有效预测,能够及时针对即将发生的病虫灾害实施针对性的防治措施,预防病虫灾害的影响范围进一步扩大,降低病虫灾害对林业发展造成的损失,因此病虫灾害风险的预测对林业发展具有重要意义。
相关技术中通常利用历史病虫害相关数据进行神经网络的训练,从而基于构建的预测模型对病虫灾害风险进行预测,但由于林业区域中病虫害的类型众多,对于不同类型的病虫害需要使用特定的防治手段,同时新型病虫害的出现更是加大了预测难度,导致通过现有的方法无法针对病虫害的类型对林业病虫灾害风险进行准确的预测。
发明内容
为了解决通过现有的方法无法针对病虫害的类型对林业病虫灾害风险进行准确的预测的技术问题,本发明的目的在于提供一种基于大数据分析的林业病虫灾害风险预测方法,所采用的技术方案具体如下:
本发明提出了一种基于大数据分析的林业病虫灾害风险预测方法,所述方法包括:
获取待测林业区域在预设数量的历史年份中每个年份的相同预设时期的病虫害数据,所述病虫害数据至少包括病虫害类型、发生年份、发生月份、发病次数和发病累计时间;
对病虫害数据进行聚类获得不同的聚类簇,根据每个聚类簇中病虫害数据的发病次数的差异和发病累计时间的差异,以及对应聚类簇中相同病虫害类型的病虫害数据的数量,获得聚类簇中每个病虫害数据的发生可能性;
根据所有聚类簇中相同病虫害类型的病虫害数据的数量、对应病虫害数据的发生年份以及每个聚类簇中的病虫害类型,获得每个聚类簇的病虫害重视程度;根据聚类簇的病虫害重视程度和对应聚类簇中病虫害数据的发生可能性,获得每个病虫害类型的真实风险程度;
基于所述真实风险程度对待测林业区域在预设时期内不同病虫害类型的灾害风险进行预测。
进一步地,所述根据每个聚类簇中病虫害数据的发病次数的差异和发病累计时间的差异,以及对应聚类簇中相同病虫害类型的病虫害数据的数量,获得聚类簇中每个病虫害数据的发生可能性包括:
将每个聚类簇中相同病虫害类型的病虫害数据的数量,作为每个聚类聚中对应病虫害类型的出现次数;
将每个聚类簇中所有病虫害数据的发病次数的平均值,作为对应聚类簇的整体次数;
将每个聚类簇中所有病虫害数据的发病累计时间的平均值,作为对应聚类簇的整体累计时间;
根据每个病虫害数据的病虫害类型的所述出现次数与对应聚类簇中所有病虫害数据的总数量的差异、对应病虫害数据的发病次数与所述整体次数的差异、对应病虫害数据的发病累计时间与所述整体累计时间的差异,获得聚类簇中每个病虫害数据的发生可能性。
进一步地,所述根据每个病虫害数据的病虫害类型的所述出现次数与对应聚类簇中所有病虫害数据的总数量的差异、对应病虫害数据的发病次数与所述整体次数的差异、对应病虫害数据的发病累计时间与所述整体累计时间的差异,获得聚类簇中每个病虫害数据的发生可能性包括:
所述发生可能性的计算公式为:
其中,表示第/>个聚类簇中第/>个病虫害数据的发生可能性;/>表示第/>个聚类簇中第/>个病虫害数据的病虫害类型的出现次数;/>表示第/>个聚类簇中病虫害数据的数量;/>表示差异度符号;/>表示第/>个聚类簇中第/>个病虫害数据的发病次数;/>表示第个聚类簇的整体次数;/>表示第/>个聚类簇中第/>个病虫害数据的发病累计时间;/>表示第/>个聚类簇的整体累计时间;/>表示归一化函数。
进一步地,所述根据所有聚类簇中相同病虫害类型的病虫害数据的数量、对应病虫害数据的发生年份以及每个聚类簇中的病虫害类型,获得每个聚类簇的病虫害重视程度包括:
将当前年份和病虫害数据的发生年份的差值,作为对应病虫害数据的时间距离;
根据所有聚类簇中相同病虫害类型的病虫害数据的数量和对应病虫害数据的所述时间距离,获得对应病虫害类型的初始重视程度;
对每个聚类簇中所有病虫害类型的所述初始重视程度的平均值进行归一化,获得每个聚类簇的病虫害重视程度,且所有聚类簇的病虫害重视程度的和值为1。
进一步地,所述根据所有聚类簇中相同病虫害类型的病虫害数据的数量和对应病虫害数据的所述时间距离,获得对应病虫害类型的初始重视程度包括:
对所有聚类簇中相同病虫害类型的病虫害数据的数量进行归一化,获得对应病虫害类型的发生频繁度;
对所有聚类簇中相同病虫害类型的所有病虫害数据的所述时间距离的平均值进行负相关的归一化,获得对应病虫害类型的新颖程度;
将所述发生频繁度和所述新颖程度的乘积值,作为对应病虫害类型的初始重视程度。
进一步地,所述根据聚类簇的病虫害重视程度和对应聚类簇中病虫害数据的发生可能性,获得每个病虫害类型的真实风险程度包括:
将聚类簇的所述病虫害重视程度和对应聚类簇中病虫害数据的所述发生可能性的乘积值,作为对应病虫害数据的初始风险程度;
将所有聚类簇中相同病虫害类型的所有病虫害数据的初始风险程度的平均值,作为对应病虫害类型的真实风险程度。
进一步地,所述基于所述真实风险程度对待测林业区域在预设时期内不同病虫害类型的灾害风险进行预测包括:
将大于预设风险阈值的真实风险程度对应的病虫害类型,视为待测林业区域在所述预设时期内发生的病虫灾害。
进一步地,所述聚类的算法为迭代自组织聚类算法。
进一步地,所述预设数量为10。
进一步地,所述预设时期为一个月或至少连续的两个月。
本发明具有如下有益效果:
本发明考虑到林业区域中病虫害的类型众多,并且新型病虫害的出现加大了预测难度,因此本发明对多个历史年份中同一预设时期的病虫害数据进行聚类,便于后续针对聚类簇中的病虫害数据进行分析,由于每个病虫害数据能够反映待测林业区域当时发生的病虫害的情况,因此可首先对每个聚类簇中的病虫害数据进行分析,通过获取的发生可能性反映对应病虫害情况发生的风险;考虑到对于经常发生的病虫害类型需要更高重视,对于新型病虫害的防治手段较少,同样需要更高的重视,而新型病虫害发生的年份距离当前年份较近,因此可对所有聚类簇中相同病虫害类型的病虫害数据的数量、对应病虫害数据的发生年份以及每个聚类簇中的病虫害类型进行分析,通过获取的病虫害重视程度反映对聚类簇中存在的病虫害类型重视的程度,便于提高后续获取的病虫害类型的真实风险程度的准确度,从而可基于真实风险程度对待测林业区域在预设时期中不同病虫害类型的灾害风险进行更加准确而有效的预测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种基于大数据分析的林业病虫灾害风险预测方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于大数据分析的林业病虫灾害风险预测方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于大数据分析的林业病虫灾害风险预测方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种基于大数据分析的林业病虫灾害风险预测方法流程图,该方法包括:
步骤S1:获取待测林业区域在预设数量的历史年份中每个年份的相同预设时期的病虫害数据,病虫害数据至少包括病虫害类型、发生年份、发生月份、发病次数和发病累计时间。
病虫灾害严重威胁了林业的发展,对病虫灾害风险的有效预测,能够及时针对即将发生的病虫灾害实施针对性的防治措施,预防病虫灾害的影响范围进一步扩大,降低病虫灾害对林业发展造成的损失;现有方法通常基于历史病虫害相关数据或病虫害相关图像对神经网络进行训练,基于构建的预测模型对病虫灾害风险进行预测,但由于林业区域中病虫害的类型众多,对于不同类型的病虫害需要使用特定的防治手段,同时新型病虫害的出现更是加大了预测难度,导致通过现有的方法无法针对病虫害的类型对林业病虫灾害风险进行有效预测,因此本发明提出一种基于大数据分析的林业病虫灾害风险预测方法以解决该问题。
本发明实施例首先从待测林业区域所属林业局的病虫害数据库中,采集该待测林业区域在预设数量的历史年份中每年相同预设时期的病虫害数据,在本发明的一个实施例中预设数量设置为10,预设时期为每年的第一个月、第二个月和第三个月,即采集待测林业区域在过去10年中每年的前三个月的病虫害数据,预设数量的具体数值和预设时期的具体范围均可根据具体实施场景由实施者自行设置,在此不作限定,其中,预设时期需要设置连续整数的月份,例如每年的1月或4月、5月和6月或2月、3月、4月和5月等。
对于每个病虫害数据的结构至少包括病虫害类型、发生年份、发生月份、发病次数和发病累计时间五个维度的数据信息,其中病虫害类型为该待测林业区域在预设数量的历史年份中出现的所有类型的病虫害,待测林业区域中常见的病虫害类型包括例如腐烂病、枯萎病、天牛、白蚁、松毛虫等,由于病虫害类型通常为文本数据,因此在本发明的一个实施例通过对每个病虫害类型进行编号,实现对病虫害类型的量化,例如该待测林业区域的病虫害类型包括,则对应的编号为/>,发生年份为该病虫害发生时所在的年份,发生月份表示该病虫害发生时所在的月份,发病次数为该病虫害类型在对应发生年份的对应发生月份中所发生的次数,发病累计时间为该病虫害在对应发病次数下发生时的持续时间的累加值,例如某个病虫害数据的发病次数为2,则发病累计时间为这两次发病所持续的时间的累加值,发病累计时间的单位为天。
获取到病虫害数据后,便可在后续中对病虫害数据中不同维度的数据进行分析,进而可针对病虫害类型对待测林业区域在预设时期内的病虫灾害风险进行准确预测。
步骤S2:对病虫害数据进行聚类获得不同的聚类簇,根据每个聚类簇中病虫害数据的发病次数的差异和发病累计时间的差异,以及对应聚类簇中相同病虫害类型的病虫害数据的数量,获得聚类簇中每个病虫害数据的发生可能性。
为了在后续中能够对可能出现的新型病虫灾害进行准确预测,本发明实施例首先对病虫害数据进行聚类,获得不同的聚类簇,由于病虫害数据能够反映待测林业区域在当时发生的病虫灾害情况,而病虫害数据的发病次数越多,发病累计时间越长,以及对应病虫害类型的病虫害数据的数量越多,说明该病虫害数据对应的病虫灾害情况发生的越频繁,因此可首先对每个聚类簇中病虫害数据的发病次数的差异和发病累计时间的差异,以及对应聚类簇中相同病虫害类型的病虫害数据的数量进行分析,通过获取的发生可能性反映聚类簇中每个病虫害数据对应的病虫灾害情况发生的频繁性,同时在后续中可基于发生可能性对不同病虫害类型的灾害风险进行预测。在本发明的一个实施例中使用迭代自组织聚类算法对病虫害数据进行聚类,迭代自组织聚类算法是本领域技术人员熟知的技术手段,在此不做赘述,在本发明的其他实施例中也可使用例如k-means算法等其他聚类算法进行聚类,在此不做限定。
优选地,在本发明的一个实施例中每个聚类簇中每个病虫害数据的发生可能性的获取方法具体包括:
由于聚类簇中每个病虫害数据的发病次数与该聚类簇中整体上的发病次数之间的差异能够反映出该病虫害数据对应的病虫灾害情况发生的频繁性,同时病虫害数据的发病累计时间反映了预设单位时间内该病虫害发生时总的持续时间,并且聚类簇中相同病虫害类型的病虫害数据越多,说明在历史年份中该病虫害类型对应的病虫害数据对应的病虫灾害情况发生的越频繁;因此将每个聚类簇中相同病虫害类型的病虫害数据的数量,作为每个聚类聚中对应病虫害类型的出现次数,将每个聚类簇中所有病虫害数据的发病次数的平均值,作为对应聚类簇的整体次数;将每个聚类簇中所有病虫害数据的发病累计时间的平均值,作为对应聚类簇的整体累计时间;进而根据每个病虫害数据的病虫害类型的出现次数与对应聚类簇中所有病虫害数据的总数量的差异、对应病虫害数据的发病次数与整体次数的差异、对应病虫害数据的发病累计时间与整体累计时间的差异,获得聚类簇中每个病虫害数据的发生可能性。发生可能性的表达式可以具体例如为:
其中,表示第/>个聚类簇中第/>个病虫害数据的发生可能性;/>表示第/>个聚类簇中第/>个病虫害数据的病虫害类型的出现次数;/>表示第/>个聚类簇中病虫害数据的数量;/>表示差异度符号;/>表示第/>个聚类簇中第/>个病虫害数据的发病次数;/>表示第个聚类簇的整体次数;/>表示第/>个聚类簇中第/>个病虫害数据的发病累计时间;/>表示第/>个聚类簇的整体累计时间;/>表示归一化函数。
在本发明的一个实施例中,归一化处理可以具体例如为最大最小值归一化处理,并且,后续步骤中的归一化均可以采用最大最小值归一化处理,在本发明的其他实施例中可以根据数值具体范围选择其他归一化方法,对此不再赘述。
在聚类簇中每个病虫害数据的发生可能性的获取过程中,表示聚类簇中与该病虫害数据的病虫害类型相同的病虫害数据的数量占聚类簇中所有病虫害数据的数量的比重,/>越大,说明在历史年份中该病虫害数据对应的病虫灾害情况发生的越频繁,则该病虫害数据的发生可能性/>越大,/>用于反映该病虫害数据的发病累计时间与聚类簇的整体累计时间之间的差异,/>越大,说明该病虫害数据对应的病虫灾害发生时所持续的总时间越长,则病虫害数据的发生可能性/>越大,当/>时,说明该病虫害数据的发病次数/>高于聚类簇所有病虫害数据的发病次数的平均值/>,此时越大,说明该病虫害数据对应的病虫灾害发生的越频繁,则该病虫害数据的发生可能性/>就越大,当/>时,说明该病虫害数据的发病次数/>低于聚类簇所有病虫害数据的发病次数的平均值/>,此时/>越大,说明该病虫害数据对应的病虫灾害越不易发生,则该病虫害数据的发生可能性/>就越小,因此利用差异度符号控制/>与发生可能性/>之间的映射关系,同时利用归一化函数将发生可能性/>限定在/>范围内,便于后续对病虫灾害发生风险的评估分析。
步骤S3:根据所有聚类簇中相同病虫害类型的病虫害数据的数量、对应病虫害数据的发生年份以及每个聚类簇中的病虫害类型,获得每个聚类簇的病虫害重视程度;根据聚类簇的病虫害重视程度和对应聚类簇中病虫害数据的发生可能性,获得每个病虫害类型的真实风险程度。
在对病虫灾害风险预测的过程中,对于历史年份中经常发生的病虫害类型,需要提高对其的重视程度,同时对于新型病虫灾害,由于对其的防治手段较少,也需要提高对新型病虫灾害的重视程度,并且对于某些病虫害类型由于对其已经有了大量有效的防治手段,因此可适当降低对其的重视程度,而在对病虫害数据进行聚类后,能够将经常发生的病虫害类型和一些新型病虫害划分到不同的聚类簇中,同时所有聚类簇中相同病虫害类型的病虫害数据的数量能够反映该病虫害类型在历史年份中发生的频繁性,并且对于新型病虫害虽然其对应的病虫害数据的数量较少,但其发生的年份距离当前年份较近,对于已经有了有效防治手段的病虫害类型,其对应的病虫害数据的数量较少的同时发生的年份距离当前年份较远,因此可对所有聚类簇中相同病虫害类型的病虫害数据的数量、对应病虫害数据的发生年份以及每个聚类簇中的病虫害类型进行分析,通过获得的病虫害重视程度反映对该聚类簇中病虫害类型的重视程度,后续中可基于病虫害重视程度对病虫害数据的发生可能性进行调整,进而提高对不同病虫害类型发生风险预测的准确度。
优选地,在本发明的一个实施例中每个聚类簇的病虫害重视程度的获取方法具体包括:
将当前年份和病虫害数据的发生年份的差值,作为对应病虫害数据的时间距离,其中当前年份为进行病虫灾害预测时所在的年份;对所有聚类簇中相同病虫害类型的病虫害数据的数量进行归一化,获得对应病虫害类型的发生频繁度;对所有聚类簇中相同病虫害类型的所有病虫害数据的时间距离的平均值进行负相关的归一化,获得对应病虫害类型的新颖程度;将发生频繁度和新颖程度的乘积值,作为对应病虫害类型的初始重视程度;进而可基于初始重视程度对每个聚类簇中存在的病虫害类型进行分析,对每个聚类簇中所有病虫害类型的初始重视程度的平均值进行归一化,获得每个聚类簇的病虫害重视程度,且所有聚类簇的病虫害重视程度的和值为1。病虫害重视程度的表达式可以具体例如为:
其中,表示第/>个聚类簇的病虫害重视程度;/>表示第/>个聚类簇中所有病虫害类型的初始重视程度的平均值;/>表示第/>个聚类簇中所有病虫害类型的初始重视程度的平均值;/>表示聚类簇的数量;/>表示第/>个聚类簇中病虫害类型的数量;/>表示第/>个聚类簇中第/>个病虫害类型对应的病虫害数据在所有聚类簇中的数量;/>表示相同病虫害类型的病虫害数据的数量的最大值;/>表示当前年份;/>表示第/>个聚类簇中第/>个病虫害类型对应的第/>个病虫害数据的发生年份;/>表示以自然常数/>为底的指数函数。
在每个聚类簇的病虫害重视程度的获取过程中,病虫害重视程度越大,说明该聚类簇中病虫害数据对应的病虫害类型越需要被重视,表示聚类簇中每个病虫害类型的初始重视程度,其中,/>表示聚类簇中每个病虫害类型的发生频繁度,/>越大,说明该病虫害类型在历史年份中发生的次数越多,进而说明该病虫害类型在历史年份中发生的越频繁,越需要被重视,则该病虫害类型的初始重视程度越大,/>用于对/>进行归一化,表示聚类簇中每个病虫害类型的新颖程度,表示该病虫害类型的病虫害数据的时间距离,/>越小,说明该病虫害数据对应的病虫害类型发生的年份距离当前年份越近,进而说明该病虫害类型越可能为新型病虫害,则该病虫害类型的新颖程度越大,该病虫害类型越需要被重视,则该病虫害类型的初始重视程度越大,进而对该聚类簇中所有的病虫害类型的初始重视程度的平均值进行归一化,得到聚类聚的病虫害重视程度/>,其中/>用于对/>进行归一化,保证所有聚类簇的病虫害重视程度的和值为1。
通过上述过程获取到每个聚类簇的病虫害重视程度,并可利用病虫害重视程度对对应聚类簇中每个病虫害数据的发生可能性进行调整,从而获得每个病虫害类型的真实风险程度,后续中可通过真实风险程度对待测林业区域在预设时期内不同病虫害类型的灾害风险进行预测。
优选地,在本发明的一个实施例中每个病虫害类型的真实风险程度的获取方法具体包括:
将聚类簇的病虫害重视程度和对应聚类簇中病虫害数据的发生可能性的乘积值,作为对应病虫害数据的初始风险程度;将所有聚类簇中相同病虫害类型的所有病虫害数据的初始风险程度的平均值,作为对应病虫害类型的真实风险程度。真实风险程度的表达式可以具体例如为:
其中,表示第/>个病虫害类型的真实风险程度;/>表示第/>个病虫害类型的第/>个病虫害数据的初始风险程度;/>表示所有聚类簇中第/>个病虫害类型的病虫害数据的数量;/>表示第/>个聚类簇中第/>个病虫害数据的初始风险程度;/>表示第/>个聚类簇中第/>个病虫害数据的发生可能性;/>表示第/>个聚类簇的病虫害重视程度。
在每个病虫害类型的真实风险程度的获取过程中,真实风险程度越大,说明该病虫害类型发生的可能性越大,并且其危害性越大,由于对不同聚类簇中存在的病虫害类型的重视程度不同,因此利用每个聚类簇的病虫害重视程度/>对该聚类簇中每个病虫害数据的发生可能性/>进行加权调整,从而得到聚类簇中每个病虫害数据的初始风险程度,初始风险程度/>越大,说明该病虫害数据对应病虫害类型越可能发生,同时其危害性越大,进而将相同病虫害类型的病虫害数据对应的初始风险程度的平均值,作为该病虫害类型的真实风险程度/>。
获取到每个病虫害类型的真实风险程度后,在后续中便可基于真实风险程度对待测林业区域在预设时期内不同病虫害类型的病虫灾害的发生风险进行准确预测。
步骤S4:基于真实风险程度对待测林业区域在预设时期内不同病虫害类型的灾害风险进行预测。
由于真实风险程度能够反映出不同病虫害类型发生的可能性以及危害性,并且上述过程是对待测林业区域在预设时期内的病虫害数据进行分析的,因此可基于真实风险程度对待测林业区域在预设时期内的病虫灾害风险进行准确且有效的预测。
优选地,在本发明的一个实施例中对待测林业区域在预设时期内的病虫灾害风险进行预测的方法具体包括:
将大于预设风险阈值的真实风险程度对应的病虫害类型,视为待测林业区域在每年的预设时期内发生的病虫灾害,进而可提前对不同类型的病虫灾害实施防治措施,在本发明的一个实施例中预设风险阈值设置为0.5,预设风险阈值的具体数值也可根据具体实施场景由实施者自行设置,在此不作限定。
在本发明的其他实施例中也可对真实风险程度按照从大到小的顺序进行排序,对于越靠前的真实风险程度,其对应的病虫害类型的病虫灾害越可能发生且危害性越大,则越需要对该病虫害类型的病虫灾害做好提前防治的准备。
综上所述,本发明实施例首先获取待测林业区域在预设数量的历史年份中每个年份的相同预设时期的病虫害数据,然后对病虫害数据进行聚类获得不同的聚类簇,并根据每个聚类簇中病虫害数据的发病次数的差异和发病累计时间的差异,以及对应聚类簇中相同病虫害类型的病虫害数据的数量,获得聚类簇中每个病虫害数据的发生可能性,根据所有聚类簇中相同病虫害类型的病虫害数据的数量、对应病虫害数据的发生年份以及每个聚类簇中的病虫害类型,获得每个聚类簇的病虫害重视程度,并基于每个聚类簇的病虫害重视程度对对应聚类簇中每个病虫害数据的发生可能性进行加权调整,获得每个病虫害类型的真实风险程度,从而基于真实风险程度对待测林业区域在预设时期内的病虫灾害风险进行预测。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
Claims (10)
1.一种基于大数据分析的林业病虫灾害风险预测方法,其特征在于,所述方法包括:
获取待测林业区域在预设数量的历史年份中每个年份的相同预设时期的病虫害数据,所述病虫害数据至少包括病虫害类型、发生年份、发生月份、发病次数和发病累计时间;
对病虫害数据进行聚类获得不同的聚类簇,根据每个聚类簇中病虫害数据的发病次数的差异和发病累计时间的差异,以及对应聚类簇中相同病虫害类型的病虫害数据的数量,获得聚类簇中每个病虫害数据的发生可能性;
根据所有聚类簇中相同病虫害类型的病虫害数据的数量、对应病虫害数据的发生年份以及每个聚类簇中的病虫害类型,获得每个聚类簇的病虫害重视程度;根据聚类簇的病虫害重视程度和对应聚类簇中病虫害数据的发生可能性,获得每个病虫害类型的真实风险程度;
基于所述真实风险程度对待测林业区域在预设时期内不同病虫害类型的灾害风险进行预测。
2.根据权利要求1所述的一种基于大数据分析的林业病虫灾害风险预测方法,其特征在于,所述根据每个聚类簇中病虫害数据的发病次数的差异和发病累计时间的差异,以及对应聚类簇中相同病虫害类型的病虫害数据的数量,获得聚类簇中每个病虫害数据的发生可能性包括:
将每个聚类簇中相同病虫害类型的病虫害数据的数量,作为每个聚类聚中对应病虫害类型的出现次数;
将每个聚类簇中所有病虫害数据的发病次数的平均值,作为对应聚类簇的整体次数;
将每个聚类簇中所有病虫害数据的发病累计时间的平均值,作为对应聚类簇的整体累计时间;
根据每个病虫害数据的病虫害类型的所述出现次数与对应聚类簇中所有病虫害数据的总数量的差异、对应病虫害数据的发病次数与所述整体次数的差异、对应病虫害数据的发病累计时间与所述整体累计时间的差异,获得聚类簇中每个病虫害数据的发生可能性。
3.根据权利要求2所述的一种基于大数据分析的林业病虫灾害风险预测方法,其特征在于,所述根据每个病虫害数据的病虫害类型的所述出现次数与对应聚类簇中所有病虫害数据的总数量的差异、对应病虫害数据的发病次数与所述整体次数的差异、对应病虫害数据的发病累计时间与所述整体累计时间的差异,获得聚类簇中每个病虫害数据的发生可能性包括:
所述发生可能性的计算公式为:
其中,表示第/>个聚类簇中第/>个病虫害数据的发生可能性;/>表示第/>个聚类簇中第/>个病虫害数据的病虫害类型的出现次数;/>表示第/>个聚类簇中病虫害数据的数量;/>表示差异度符号;/>表示第/>个聚类簇中第/>个病虫害数据的发病次数;/>表示第/>个聚类簇的整体次数;/>表示第/>个聚类簇中第/>个病虫害数据的发病累计时间;/>表示第/>个聚类簇的整体累计时间;/>表示归一化函数。
4.根据权利要求1所述的一种基于大数据分析的林业病虫灾害风险预测方法,其特征在于,所述根据所有聚类簇中相同病虫害类型的病虫害数据的数量、对应病虫害数据的发生年份以及每个聚类簇中的病虫害类型,获得每个聚类簇的病虫害重视程度包括:
将当前年份和病虫害数据的发生年份的差值,作为对应病虫害数据的时间距离;
根据所有聚类簇中相同病虫害类型的病虫害数据的数量和对应病虫害数据的所述时间距离,获得对应病虫害类型的初始重视程度;
对每个聚类簇中所有病虫害类型的所述初始重视程度的平均值进行归一化,获得每个聚类簇的病虫害重视程度,且所有聚类簇的病虫害重视程度的和值为1。
5.根据权利要求4所述的一种基于大数据分析的林业病虫灾害风险预测方法,其特征在于,所述根据所有聚类簇中相同病虫害类型的病虫害数据的数量和对应病虫害数据的所述时间距离,获得对应病虫害类型的初始重视程度包括:
对所有聚类簇中相同病虫害类型的病虫害数据的数量进行归一化,获得对应病虫害类型的发生频繁度;
对所有聚类簇中相同病虫害类型的所有病虫害数据的所述时间距离的平均值进行负相关的归一化,获得对应病虫害类型的新颖程度;
将所述发生频繁度和所述新颖程度的乘积值,作为对应病虫害类型的初始重视程度。
6.根据权利要求1所述的一种基于大数据分析的林业病虫灾害风险预测方法,其特征在于,所述根据聚类簇的病虫害重视程度和对应聚类簇中病虫害数据的发生可能性,获得每个病虫害类型的真实风险程度包括:
将聚类簇的所述病虫害重视程度和对应聚类簇中病虫害数据的所述发生可能性的乘积值,作为对应病虫害数据的初始风险程度;
将所有聚类簇中相同病虫害类型的所有病虫害数据的初始风险程度的平均值,作为对应病虫害类型的真实风险程度。
7.根据权利要求1所述的一种基于大数据分析的林业病虫灾害风险预测方法,其特征在于,所述基于所述真实风险程度对待测林业区域在预设时期内不同病虫害类型的灾害风险进行预测包括:
将大于预设风险阈值的真实风险程度对应的病虫害类型,视为待测林业区域在所述预设时期内发生的病虫灾害。
8.根据权利要求1所述的一种基于大数据分析的林业病虫灾害风险预测方法,其特征在于,所述聚类的算法为迭代自组织聚类算法。
9.根据权利要求1所述的一种基于大数据分析的林业病虫灾害风险预测方法,其特征在于,所述预设数量为10。
10.根据权利要求1所述的一种基于大数据分析的林业病虫灾害风险预测方法,其特征在于,所述预设时期为一个月或至少连续的两个月。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311704500.9A CN117391265B (zh) | 2023-12-13 | 2023-12-13 | 基于大数据分析的林业病虫灾害风险预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311704500.9A CN117391265B (zh) | 2023-12-13 | 2023-12-13 | 基于大数据分析的林业病虫灾害风险预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117391265A true CN117391265A (zh) | 2024-01-12 |
CN117391265B CN117391265B (zh) | 2024-03-05 |
Family
ID=89435921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311704500.9A Active CN117391265B (zh) | 2023-12-13 | 2023-12-13 | 基于大数据分析的林业病虫灾害风险预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117391265B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160076317A (ko) * | 2014-12-22 | 2016-06-30 | 주식회사 케이티 | 병해충 발생 예측 장치 및 방법 |
US20180018414A1 (en) * | 2016-07-12 | 2018-01-18 | Tata Consultancy Services Limited | Systems and methods for pest forecasting using historical pesticide usage information |
WO2018058821A1 (zh) * | 2016-09-30 | 2018-04-05 | 深圳前海弘稼科技有限公司 | 一种基于种植设备的病虫害预测方法及装置 |
WO2018099220A1 (zh) * | 2016-11-30 | 2018-06-07 | 深圳前海弘稼科技有限公司 | 一种种植设备中植物病虫害预测方法及装置 |
CN108197794A (zh) * | 2017-12-27 | 2018-06-22 | 深圳春沐源控股有限公司 | 一种病虫害风险预估系统及方法 |
CN110837926A (zh) * | 2019-11-04 | 2020-02-25 | 四川省烟草公司广元市公司 | 一种基于大数据的烟草主要病虫害预测方法 |
KR20200044216A (ko) * | 2018-10-11 | 2020-04-29 | 순천대학교 산학협력단 | 빅데이터를 이용한 병해충 발생 예측 시스템 및 방법 |
WO2020179961A1 (ko) * | 2019-03-05 | 2020-09-10 | 주식회사 넥스모스 | 식물의 병해충과 동물 및 인간의 감염성 질병 예측 서비스 시스템 |
CN111738138A (zh) * | 2020-06-19 | 2020-10-02 | 安徽大学 | 一种耦合气象特征区域尺度的小麦条绣病严重度遥感监测方法 |
CN112836903A (zh) * | 2021-03-25 | 2021-05-25 | 中化现代农业有限公司 | 病虫害风险预测方法 |
CN114201636A (zh) * | 2021-12-10 | 2022-03-18 | 安吉县自然资源和规划局 | 一种基于大数据分析的林业虫灾发生的预测方法 |
CN115131683A (zh) * | 2022-08-25 | 2022-09-30 | 金乡县林业保护和发展服务中心(金乡县湿地保护中心、金乡县野生动植物保护中心、金乡县国有白洼林场) | 基于高分辨率遥感影像的林业信息识别方法 |
CN115271209A (zh) * | 2022-07-27 | 2022-11-01 | 浙江天演维真网络科技股份有限公司 | 一种病虫害预测方法、装置、设备和介质 |
CN116206208A (zh) * | 2023-05-05 | 2023-06-02 | 河东区志远苗木种植专业合作社 | 一种基于人工智能的林业病虫害快速分析系统 |
-
2023
- 2023-12-13 CN CN202311704500.9A patent/CN117391265B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160076317A (ko) * | 2014-12-22 | 2016-06-30 | 주식회사 케이티 | 병해충 발생 예측 장치 및 방법 |
US20180018414A1 (en) * | 2016-07-12 | 2018-01-18 | Tata Consultancy Services Limited | Systems and methods for pest forecasting using historical pesticide usage information |
WO2018058821A1 (zh) * | 2016-09-30 | 2018-04-05 | 深圳前海弘稼科技有限公司 | 一种基于种植设备的病虫害预测方法及装置 |
WO2018099220A1 (zh) * | 2016-11-30 | 2018-06-07 | 深圳前海弘稼科技有限公司 | 一种种植设备中植物病虫害预测方法及装置 |
CN108197794A (zh) * | 2017-12-27 | 2018-06-22 | 深圳春沐源控股有限公司 | 一种病虫害风险预估系统及方法 |
KR20200044216A (ko) * | 2018-10-11 | 2020-04-29 | 순천대학교 산학협력단 | 빅데이터를 이용한 병해충 발생 예측 시스템 및 방법 |
WO2020179961A1 (ko) * | 2019-03-05 | 2020-09-10 | 주식회사 넥스모스 | 식물의 병해충과 동물 및 인간의 감염성 질병 예측 서비스 시스템 |
CN110837926A (zh) * | 2019-11-04 | 2020-02-25 | 四川省烟草公司广元市公司 | 一种基于大数据的烟草主要病虫害预测方法 |
CN111738138A (zh) * | 2020-06-19 | 2020-10-02 | 安徽大学 | 一种耦合气象特征区域尺度的小麦条绣病严重度遥感监测方法 |
CN112836903A (zh) * | 2021-03-25 | 2021-05-25 | 中化现代农业有限公司 | 病虫害风险预测方法 |
CN114201636A (zh) * | 2021-12-10 | 2022-03-18 | 安吉县自然资源和规划局 | 一种基于大数据分析的林业虫灾发生的预测方法 |
CN115271209A (zh) * | 2022-07-27 | 2022-11-01 | 浙江天演维真网络科技股份有限公司 | 一种病虫害预测方法、装置、设备和介质 |
CN115131683A (zh) * | 2022-08-25 | 2022-09-30 | 金乡县林业保护和发展服务中心(金乡县湿地保护中心、金乡县野生动植物保护中心、金乡县国有白洼林场) | 基于高分辨率遥感影像的林业信息识别方法 |
CN116206208A (zh) * | 2023-05-05 | 2023-06-02 | 河东区志远苗木种植专业合作社 | 一种基于人工智能的林业病虫害快速分析系统 |
Non-Patent Citations (3)
Title |
---|
曹庆先;庞正轰;杨秀好;方丽英;: "广西森林病虫害监测状况的系统聚类分析", 广西林业科学, no. 01, 30 March 2007 (2007-03-30) * |
林世方;钱月霞;: "应用模糊聚类方法确定水稻病虫发生程度", 中国植保导刊, no. 03, 31 December 1989 (1989-12-31) * |
韦艳玲;: "基于主成份分析的模糊聚类虫害预测模型研究", 广西工学院学报, no. 02, 25 June 2009 (2009-06-25) * |
Also Published As
Publication number | Publication date |
---|---|
CN117391265B (zh) | 2024-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111555921B (zh) | 告警根因的定位方法、装置、计算机设备和存储介质 | |
CN104881783A (zh) | 电子银行账户欺诈行为及风险检测方法与系统 | |
CN104809335A (zh) | 一种环境变化对疾病发病影响的分析预测模型 | |
CN111612041A (zh) | 异常用户识别方法及装置、存储介质、电子设备 | |
CN110444011B (zh) | 交通流高峰识别方法、装置、电子设备及存储介质 | |
CN112445690B (zh) | 信息获取方法、装置及电子设备 | |
CN111612038A (zh) | 异常用户检测方法及装置、存储介质、电子设备 | |
CN114338351B (zh) | 网络异常根因确定方法、装置、计算机设备及存储介质 | |
US20240185159A1 (en) | Systems And Methods For Identifying An Officer At Risk Of An Adverse Event | |
CN118210864A (zh) | 基于云计算的金融大数据云存储方法 | |
CN114219228A (zh) | 一种基于em聚类算法的体育场疏散评价方法 | |
CN110689140A (zh) | 一种通过大数据进行轨交报警数据智能管理的方法 | |
CN112732690B (zh) | 一种用于慢病检测及风险评估的稳定系统及方法 | |
CN117391265B (zh) | 基于大数据分析的林业病虫灾害风险预测方法 | |
CN115146890A (zh) | 企业运营风险告警方法、装置、计算机设备和存储介质 | |
CN109508350B (zh) | 一种对数据进行采样的方法和装置 | |
CN117408367A (zh) | 一种基于pso-rf的输电线路山火跳闸概率预测方法 | |
CN109870551A (zh) | 一种海洋水质监测方法 | |
CN115830413A (zh) | 一种图像特征库的更新方法、校验方法及相关设备 | |
CN110969209B (zh) | 一种陌生人识别方法、装置、电子设备及存储介质 | |
CN112465073B (zh) | 一种基于距离的数值分布异常检测方法及检测系统 | |
CN114707420A (zh) | 一种信贷欺诈行为识别方法、装置、设备及存储介质 | |
CN113205363A (zh) | 一种基于大数据的业务指标监测方法及装置 | |
CN112232329A (zh) | 入侵信号识别的多核svm训练、报警方法、装置及系统 | |
CN111768031A (zh) | 一种基于arma算法预测人群聚集趋势的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |