CN113298280A - 农业育种大数据的深度挖掘与智能决策算法 - Google Patents
农业育种大数据的深度挖掘与智能决策算法 Download PDFInfo
- Publication number
- CN113298280A CN113298280A CN202010108269.7A CN202010108269A CN113298280A CN 113298280 A CN113298280 A CN 113298280A CN 202010108269 A CN202010108269 A CN 202010108269A CN 113298280 A CN113298280 A CN 113298280A
- Authority
- CN
- China
- Prior art keywords
- data
- mining
- agricultural breeding
- intelligent decision
- big data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24564—Applying rules; Deductive queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Fuzzy Systems (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Mining & Mineral Resources (AREA)
- Marine Sciences & Fisheries (AREA)
- Primary Health Care (AREA)
- Animal Husbandry (AREA)
- Agronomy & Crop Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了农业育种大数据的深度挖掘与智能决策算法,涉及农业育种技术领域;为了解决数据挖掘计算出的置信度准确度不足问题;具体深度挖掘包括以下步骤:数据预处理阶段:了解农业育种的技术特点,确定农业用户的具体需求,并进行数据存储;从原始数据库中选取相关数据或样本;检查数据的完整性及一致性,消除噪声数据;数据挖掘阶段:确定要发现的知识类型,根据确定的目标选择合适的数据挖掘算法,运用所选算法,提取相关知识并以一定的方式表示。本发明通过数据挖掘的方法,可以得出环境温度数据和土壤各项参数等因素是如何影响农作物种子发育的,从而能够最大限度的提高农作物产量。
Description
技术领域
本发明涉及农业育种技术领域,尤其涉及农业育种大数据的深度挖掘与智能决策算法。
背景技术
随着科技的发展,运用大数据的先进技术对农业各主要生产领域在生产过程中采集的大量数据进行分析处理,进而提供“精准化”的农资配方、“智慧化”的管理决策和设施控制,达到农业增产、农民增收的目的是一个重要的技术手段。
经检索,中国专利申请号为CN201910613961.2的专利,公开了一种基于无监督深度学习的农业大数据挖掘方法,包括:定义双向深度递归神经网络计算公式、定义深度双向深度递归神经网络计算公式、特征学习、数据预处理、最后得到预测值。上述专利中通过深度递归神经网络把多个传统神经网络的隐藏层神经元连接起来,每个神经网络表示某一时刻输入输出的一个模型,把多个连续时刻的模型连在一起,就可以结合前后时刻的内容来进行分析预测,以用于农业大数据的挖掘,填补现有技术在这一方面的空白;但是该方法在运用时,智慧化程度较低,数据挖掘计算出的置信度准确度不足。
发明内容
本发明的目的是为了解决现有技术中存在的缺点,而提出的农业育种大数据的深度挖掘与智能决策算法。
为了实现上述目的,本发明采用了如下技术方案:
农业育种大数据的深度挖掘与智能决策算法,深度挖掘包括以下步骤:
S1:数据预处理阶段:了解农业育种的技术特点,确定农业用户的具体需求,并进行数据存储;从原始数据库中选取相关数据或样本;检查数据的完整性及一致性,消除噪声数据;
S2:数据挖掘阶段:确定要发现的知识类型,根据确定的目标选择合适的数据挖掘算法,运用所选算法,提取相关知识并以一定的方式表示;
S3:知识评估与表示阶段:对在数据挖掘过程中发现的模式进行评估;使用可视化和知识表示相关技术,呈现农业育种所挖掘的知识。
优选地:智能决策算法包括以下步骤:
S11:刻化数据库中数据的一般特性;使用X、Y表示“数据库中满足条件的X记录可能可满足条件Y”,首先找到具备足够支持度的项集,然后由频繁项集构成关联规则,并计算置信度;
S12:在当前数据上进行推断和预测,推断农业育种的技术发展;推算和预测采用演化分析法。
优选地:所述寻找频繁项集的算法使用Apriori算法,首先计算频繁1-项集;然后根据频繁K-项集{p1,p2,……pK},{q1,q2,……qK}计算频繁(K+1)-项集,其中pi=qi,1≦i≦K-1,且该(K+1)-项集为{p1′,p2′,……pK′qK};最后判定该(K+1)-项集是否频繁即可。
优选地:所述置信度计算规则为:
count(AandB)为满足条件A以及B的数据项目,count(A)为满足条件A的数据项数目。
优选地:所述演化分析方法包括以下步骤:
S21:进行趋势分析,确定趋势的常用方法是计算数据n阶的变化平均值;
S22:进行相似搜索,相似搜索用于找出与给定序列最接近的数据序列;
S23:进行序列模式挖掘:挖掘相对时间或其它维属性出现频率高的模式;
S33:挖掘具有周期的模式或者关联规则。
优选地:所述数据预处理阶段的数据采集包括植入土壤或暴露在空气中的传感器监控土壤性状和环境状况的数据、实验室研究监测育种的发育状况和健康状况。
优选地:所述原始数据库的数据通过物联网传输到远程控制中心并将数据通过分布式存储横向扩展结构进行大数据存储;随后通过分布式软件架构并进行计算结构进行大数据处理。
优选地:所述大数据存储时采用数据仓库系统进行存储,数据仓库系统包括抽取数据与加载数据程序、整理并转换数据程序、备份与备存数据程序以及管理所有查询程序。
优选地:所述数据仓库系统的大小大于100GB。
本发明的有益效果为:
1.通过植入土壤或暴露在空气中的传感器监控土壤性状和环境状况,通过实验室研究监测育种的发育状况和健康状况;数据通过物联网传输到远程控制中心并将数据通过分布式存储横向扩展结构进行大数据存储;随后通过分布式软件架构并进行计算结构进行大数据处理;从而可以及时查清当前农作物的生长环境和变化确实,确定农作物的生产目标,通过数据挖掘的方法,可以得出环境温度数据和土壤各项参数等因素是如何影响农作物种子发育的,从而能够最大限度的提高农作物产量。
2.通过建立智能决策算法,建立准确置信度计算规则,提高了置信度计算的准确度,提高了大数据计算挖掘的准确性,提高了农业育种大数据库存储的稳定性和准确性。
附图说明
图1为本发明提出的农业育种大数据的深度挖掘与智能决策算法的示意图。
具体实施方式
下面结合具体实施方式对本专利的技术方案作进一步详细地说明。
下面详细描述本专利的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利,而不能理解为对本专利的限制。
在本专利的描述中,需要理解的是,术语“中心”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利的限制。
在本专利的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“设置”应做广义理解,例如,可以是固定相连、设置,也可以是可拆卸连接、设置,或一体地连接、设置。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本专利中的具体含义。
实施例1:
农业育种大数据的深度挖掘与智能决策算法,如图1所示,深度挖掘包括以下步骤:
S1:数据预处理阶段:了解农业育种的技术特点,确定农业用户的具体需求,并进行数据存储;从原始数据库中选取相关数据或样本;检查数据的完整性及一致性,消除噪声数据;
S2:数据挖掘阶段:确定要发现的知识类型,根据确定的目标选择合适的数据挖掘算法,运用所选算法,提取相关知识并以一定的方式表示;
S3:知识评估与表示阶段:对在数据挖掘过程中发现的模式进行评估;使用可视化和知识表示相关技术,呈现农业育种所挖掘的知识。
智能决策算法包括以下步骤:
S11:刻化数据库中数据的一般特性;使用X、Y表示“数据库中满足条件的X记录可能可满足条件Y”,首先找到具备足够支持度的项集,然后由频繁项集构成关联规则,并计算置信度;
其中,寻找频繁项集的算法使用Apriori算法,首先计算频繁1-项集;然后根据频繁K-项集{p1,p2,……pK},{q1,q2,……qK}计算频繁(K+1)-项集,其中pi=qi,1≦i≦K-1,且该(K+1)-项集为{p1′,p2′,……pK′qK};最后判定该(K+1)-项集是否频繁即可;
其中,置信度计算规则为:
其中,count(AandB)为满足条件A以及B的数据项目,count(A)为满足条件A的数据项数目;
S12:在当前数据上进行推断和预测,推断农业育种的技术发展;推算和预测采用演化分析法;
其演化分析方法包括以下步骤:
S21:进行趋势分析,确定趋势的常用方法是计算数据n阶的变化平均值;
S22:进行相似搜索,相似搜索用于找出与给定序列最接近的数据序列;
S23:进行序列模式挖掘:挖掘相对时间或其它维属性出现频率高的模式;
S33:挖掘具有周期的模式或者关联规则。
通过植入土壤或暴露在空气中的传感器监控土壤性状和环境状况,通过实验室研究监测育种的发育状况和健康状况;数据通过物联网传输到远程控制中心并将数据通过分布式存储横向扩展结构进行大数据存储;随后通过分布式软件架构并进行计算结构进行大数据处理;从而可以及时查清当前农作物的生长环境和变化确实,确定农作物的生产目标,通过数据挖掘的方法,可以得出环境温度熟读和土壤各项参数等因素是如何影响农作物种子发育的,从而能够最大限度的提高农作物产量。
实施例2:
农业育种大数据的深度挖掘与智能决策算法,为了更好的保障大数据的稳定存储,数据存储时采用数据仓库系统进行存储,数据仓库系统包括抽取数据与加载数据程序、整理并转换数据程序、备份与备存数据程序以及管理所有查询程序;
其中,一个数据仓库系统的大小大于100GB。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (10)
1.农业育种大数据的深度挖掘与智能决策算法,其特征在于,深度挖掘包括以下步骤:
S1:数据预处理阶段:了解农业育种的技术特点,确定农业用户的具体需求,并进行数据存储;从原始数据库中选取相关数据或样本;检查数据的完整性及一致性,消除噪声数据;
S2:数据挖掘阶段:确定要发现的知识类型,根据确定的目标选择合适的数据挖掘算法,运用所选算法,提取相关知识并以一定的方式表示;
S3:知识评估与表示阶段:对在数据挖掘过程中发现的模式进行评估;使用可视化和知识表示相关技术,呈现农业育种所挖掘的知识。
2.根据权利要求1所述的农业育种大数据的深度挖掘与智能决策算法,其特征在于,智能决策算法包括以下步骤:
S11:刻化数据库中数据的一般特性;使用X、Y表示“数据库中满足条件的X记录可能可满足条件Y”,首先找到具备足够支持度的项集,然后由频繁项集构成关联规则,并计算置信度;
S12:在当前数据上进行推断和预测,推断农业育种的技术发展;推算和预测采用演化分析法。
3.根据权利要求2所述的农业育种大数据的深度挖掘与智能决策算法,其特征在于,所述寻找频繁项集的算法使用Apriori算法,首先计算频繁1-项集;然后根据频繁K-项集{p1,p2,……pK},{q1,q2,……qK}计算频繁(K+1)-项集,其中pi=qi,1≦i≦K-1,且该(K+1)-项集为{p1′,p2′,……pK′qK};最后判定该(K+1)-项集是否频繁即可。
6.根据权利要求2所述的农业育种大数据的深度挖掘与智能决策算法,其特征在于,所述演化分析方法包括以下步骤:
S21:进行趋势分析,确定趋势的常用方法是计算数据n阶的变化平均值;
S22:进行相似搜索,相似搜索用于找出与给定序列最接近的数据序列;
S23:进行序列模式挖掘:挖掘相对时间或其它维属性出现频率高的模式;
S33:挖掘具有周期的模式或者关联规则。
7.根据权利要求1所述的农业育种大数据的深度挖掘与智能决策算法,其特征在于,所述数据预处理阶段的数据采集包括植入土壤或暴露在空气中的传感器监控土壤性状和环境状况的数据、实验室研究监测育种的发育状况和健康状况。
8.根据权利要求1所述的农业育种大数据的深度挖掘与智能决策算法,其特征在于,所述原始数据库的数据通过物联网传输到远程控制中心并将数据通过分布式存储横向扩展结构进行大数据存储;随后通过分布式软件架构并进行计算结构进行大数据处理。
9.根据权利要求8所述的农业育种大数据的深度挖掘与智能决策算法,其特征在于,所述大数据存储时采用数据仓库系统进行存储,数据仓库系统包括抽取数据与加载数据程序、整理并转换数据程序、备份与备存数据程序以及管理所有查询程序。
10.根据权利要求9所述的农业育种大数据的深度挖掘与智能决策算法,其特征在于,所述数据仓库系统的大小大于100GB。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010108269.7A CN113298280A (zh) | 2020-02-21 | 2020-02-21 | 农业育种大数据的深度挖掘与智能决策算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010108269.7A CN113298280A (zh) | 2020-02-21 | 2020-02-21 | 农业育种大数据的深度挖掘与智能决策算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113298280A true CN113298280A (zh) | 2021-08-24 |
Family
ID=77317590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010108269.7A Withdrawn CN113298280A (zh) | 2020-02-21 | 2020-02-21 | 农业育种大数据的深度挖掘与智能决策算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113298280A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114879585A (zh) * | 2022-07-11 | 2022-08-09 | 黑龙江省农业科学院黑河分院 | 一种面向精准农业的网络化大豆低温育种的智能监控系统 |
-
2020
- 2020-02-21 CN CN202010108269.7A patent/CN113298280A/zh not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114879585A (zh) * | 2022-07-11 | 2022-08-09 | 黑龙江省农业科学院黑河分院 | 一种面向精准农业的网络化大豆低温育种的智能监控系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108241905B (zh) | 用于预测土壤和/或植物状况的方法 | |
CN108304970B (zh) | 苹果贮藏期的快速预测方法及系统、气调贮藏监控系统 | |
CN112906298B (zh) | 一种基于机器学习的蓝莓产量预测方法 | |
CN110020712A (zh) | 一种基于聚类的优化粒子群bp网络预测方法和系统 | |
CN116316599A (zh) | 一种智能用电负荷预测方法 | |
CN113298280A (zh) | 农业育种大数据的深度挖掘与智能决策算法 | |
Paudel et al. | Prediction of crop yield based-on soil moisture using machine learning algorithms | |
CN112926251B (zh) | 一种基于机器学习的滑坡位移高精度预测方法 | |
CN112232387B (zh) | 基于lselm-rfe的粮食作物病害症状的有效特征识别方法 | |
CN111062511B (zh) | 基于决策树与神经网络的水产养殖病害预测方法及系统 | |
CN113127464A (zh) | 农业大数据环境特征处理方法、装置及电子设备 | |
CN112132334A (zh) | 一种用于城市生活垃圾产量的预测方法 | |
CN109409748B (zh) | 一种耕地质量评价指标关联性的检核方法及系统 | |
CN116720620A (zh) | 一种基于IPSO算法优化CNN-BiGRU-Attention网络模型的储粮通风温度预测方法 | |
Ranjan et al. | Artificial intelligence applications in soil & crop management | |
CN115546179A (zh) | 基于优化模糊深度网络的林木胸径材积精准预测方法 | |
Mimboro et al. | Weather monitoring system AIoT based for oil palm plantation using recurrent neural network algorithm | |
Gu et al. | Research on the model for tobacco disease prevention and control based on case-based reasoning and knowledge graph | |
CN113284620B (zh) | 一种职业健康数据分析模型的建立方法 | |
CN108845075A (zh) | 基于深度学习网络的堆肥腐熟实时预测方法 | |
CN108681576A (zh) | 一种基于红花质量决策树的数据挖掘方法 | |
Alameen | Improving the Accuracy of Multi-Valued Datasets in Agriculture Using Logistic Regression and LSTM-RNN Method | |
Vanarase et al. | Crop Prediction Using Data Mining and Machine Learning Techniques | |
CN115018357A (zh) | 一种面向生产绩效提升的农户画像构建方法及系统 | |
Alshahrani et al. | Chaotic Jaya Optimization Algorithm with Computer Vision based Soil Type Classification for Smart Farming |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210824 |