CN111062511A - 基于决策树与神经网络的水产养殖病害预测方法及系统 - Google Patents
基于决策树与神经网络的水产养殖病害预测方法及系统 Download PDFInfo
- Publication number
- CN111062511A CN111062511A CN201911113206.4A CN201911113206A CN111062511A CN 111062511 A CN111062511 A CN 111062511A CN 201911113206 A CN201911113206 A CN 201911113206A CN 111062511 A CN111062511 A CN 111062511A
- Authority
- CN
- China
- Prior art keywords
- data
- layer
- neural network
- input
- decision tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 72
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 72
- 238000003066 decision tree Methods 0.000 title claims abstract description 61
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 49
- 238000009360 aquaculture Methods 0.000 title claims abstract description 46
- 244000144974 aquaculture Species 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000004364 calculation method Methods 0.000 claims abstract description 6
- 230000015654 memory Effects 0.000 claims description 50
- 239000011159 matrix material Substances 0.000 claims description 30
- 238000012549 training Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 20
- 230000007787 long-term memory Effects 0.000 claims description 11
- 238000003062 neural network model Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 125000004122 cyclic group Chemical group 0.000 claims description 10
- 230000006403 short-term memory Effects 0.000 claims description 10
- 238000013138 pruning Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 4
- 230000000306 recurrent effect Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000002776 aggregation Effects 0.000 claims description 2
- 238000004220 aggregation Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 claims description 2
- 238000006467 substitution reaction Methods 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 abstract description 8
- 230000007774 longterm Effects 0.000 abstract description 4
- 230000035772 mutation Effects 0.000 abstract description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 230000004913 activation Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000238424 Crustacea Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000001314 paroxysmal effect Effects 0.000 description 1
- 235000015170 shellfish Nutrition 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/80—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
- Y02A40/81—Aquaculture, e.g. of fish
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Agronomy & Crop Science (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开公开了基于决策树与神经网络的水产养殖病害预测方法及系统,本公开主要融合长短期记忆循环神经网络以及决策树两种算法,来进行水产养殖病害预测。而改进的C4.5算法则增加了去除相关性大的因素这一环节,从而有效的减少了不必要的计算,将预测的数据代入决策树中进行判断病害是否爆发以及所属类型,可以有效解决长期依赖问题,记住时间段的信息是它们必备的技能;具有擅长处理复杂突变的时序数据的特点,可以更加精准的预测水产病害的发生,实用性强,预测精度高,可以帮助养殖户及时的解决水产病害减少经济损失。
Description
技术领域
本公开涉及人工智能技术领域,具体涉及基于决策树与神经网络的水产养殖病害预测方法及系统。
背景技术
我国传统水产养殖主要是“三靠”:靠经验、靠体力、靠天气,导致水资源利用率和劳动生产率低,与国际先进水平有较大差距。与此同时,水体污染严重,水产病害频繁等问题导致养殖风险大、水产品质量安全隐患突出等。每年水产养殖病害影响面积占全国总水产养殖面积10%以上,直接经济损失高达上百亿元,已经成为我国水产养殖健康发展的主要障碍之一。根据水产养殖动植物疾病监测预报,2017年,我国水产养殖因病害造成的经济损失约361亿元,其中鱼类占33.8%,甲壳类占40.7%,贝类占13.2%,其他占12.4%。随着我国人民生活水平不断提高,水产品已经成为人们日常餐桌上必不可少的美食,但是由于水产养殖病害频发导致现在养殖业出现养殖用药过量,造成养殖品种体内毒素富集严重,严重影响消费者的健康。因此对水产病害进行预测分析对我国水产养殖具有极其重要的意义。
现有技术大都采用灰色预测模型、BP神经网络模型。但灰色预测模型对时间序列平滑性要求较高,有快速衰减和递增的属性,所以他的时效性有限,不适合做长期的预测或者分析。标准BP神经网络算法收敛速度慢、局部极值、难以确定隐层数和隐层的节点个数。由于收集的水体数据中有许多属性相关性较大,如果将所有属性都用C4.5算法进行计算,则会造成一定的资源浪费,降低计算效率。
发明内容
本公开提供基于决策树与神经网络的水产养殖病害预测方法及系统,本公开主要融合长短期记忆循环神经网络以及决策树两种算法,来进行水产养殖病害预测。而改进的C4.5算法则增加了去除相关性大的因素这一环节,从而有效的减少了不必要的计算。本发明预建立改进的C4.5-LSTM预测模型(C4.5为决策树生成算法)来对水产养殖病害进行预测。首先收集历史的水温、PH值、溶氧量、放养。密度、硬度、盐度、微量元素含量、水产养殖病害爆发与否以及病害所属类型等数据,将数据进行预处理后运用改进的C4.5算法训练生成决策树(主要为去除相关性较大的属性、特征选择、决策树生成、剪枝)。通过决策树的确定影响水产养殖病害爆发的主要n个因素。接下来收集这n个因素的数据并进行数据清洗,将处理好的数据建立长短期记忆循环神经网络模型预测各因素的值。最后将预测的数据代入决策树中进行判断病害是否爆发以及所属类型。传统的神经网络并不能做到长期记忆,之前的信息不能连接到当前的任务,即存在“长期依赖”问题。但长短期记忆循环神经网络模型擅长处理可变长度的时间序列的数据输入,且网络具有自连接的隐层,即当前时刻隐层的状态依靠前一时刻隐层的状态进行更新,可以有效解决长期依赖问题,记住时间段的信息是它们必备的技能。
为了实现上述目的,根据本公开的一方面,提供基于决策树与神经网络的水产养殖病害预测方法,所述方法包括以下步骤:
步骤一:数据采集。收集水体m个因素x1,x2,…xm的数据及对应的病害数据将数据导入Excel表格中,对数据进行预处理即填补数据中的缺失值,去除数据中的异常值。
步骤二:生成决策树。随机抽取其中的80%组数据作为决策树的训练集,剩余的20%组数据作为决策树的测试集。采取改进的C4.5算法生成决策树。
去除相关性大的属性:
步骤2.1,利用公式(1)计算两两因素之间的相关系数:
其中x、y为两个因素,分别为两个因素所有数据的平均值,即,为因素x的平均值,为因素y的平均值,n为数据总数。当p达到0.95时,则认为两个因素相关性过大,此时分别判断这两个因素对病害爆发的影响大小,剔除影响力较小的因素。
步骤2.2,分裂属性的选择:
利用公式(2)计算对L分类(按水产病害类型进行分类)所需要的期望信息:
其中,m为数据集中水产疾病的种类数量,pi为对应疾病在数据集中出现的概率。
利用公式(3)计算因素xi的分裂信息:
其中,训练集L通过因素xi的属性值划分为t个子数据聚集即在训练集L中xi的可能的取值结果,|Lj|表示第j个子数据聚集中样本数量,|L|表示划分之前数据集中样本总数量。
利用公式(4)、(5)计算因素xi的信息增益率:
步骤2.3,采用PEP(Pessimistic Error Pruning)剪枝法进行因素的选择最终确定因素个数y。
步骤三:采集处理后的数据。收集上一步骤中的n个因素y1,y2…yn的数据将数据导入Excel表格中并将数据进行预处理即填补数据中的缺失值,去除数据中的异常值。
步骤四:标准化处理数据。利用min-max标准化公式(6)分别将y1,y2…yn的r行数据yij归一化。
其中i=1…n,j=1…r,yimax为第i个因素的所有数据的最大值,yimin为第i个因素的最小值。
步骤五:划分数据。将上一步骤中处理好的数据随机选取80%组数据作为训练集,剩余20%组数据作为测试集。
步骤六:设置输入、输出层。设置网络输入为每次每个因素的35条数据作为输入,
Y={yij|i=1,2…n,j=1,2,…35},3个数据作为输出O={oi|i=1,2,3},网络经过训练会输出接下来连续3个时间段各因素含量的预测值。
步骤七:隐藏层参数设置。确定激活函数为ELU函数和tanh函数,由隐藏层到输出层的激活函数选择sigmod函数。
步骤八:构建长短期记忆循环神经网络。
it=E(Wxixt+Whiht-1+bi) (7)
ft=E(Wxfxt+Whfht-1+bf) (8)
ot=E(Wxoxt+Whoht-1+bo) (9)
ct=ft⊙ct-1+it⊙tanh(Wxcxt+Whcht-1+bc) (10)
ht=ot⊙tanh(ct) (11)
式中:it为输入门限层(input gate);ft为遗忘门限层(forget gate);ot为输出门限层(output gate);ct为记忆细胞在t时刻的状态;xt为输入层的输入向量;ht为隐藏层的输出向量,ht-1为t-1时刻隐藏层的输出向量;⊙是指矩阵逐元素点乘;bγ是各层输出的偏差向量,如bi是输入门限层的偏差向量,bf是遗忘门限层的偏差向量,bo是输出门限层的偏差向量,bc是记忆细胞的偏差向量;E(x)是ELU函数;Wαβ是对应层的权重矩阵,如Wxf是输入层到遗忘门限层的权重矩阵,Whf是隐藏层到遗忘门限层的权重矩阵,Wxi是输入层到输入门限层的权重矩阵、Wxo是输入层到输出门限层的权重矩阵、Who是隐藏层到输出门限层的权重矩阵、Whi是隐藏层到输入门限层的权重矩阵、Wxc是输入层到记忆细胞的权重矩阵、Whc是隐藏层到记忆细胞的权重矩阵;ct用于更新细胞状态。由式(10)可知遗忘门ft控制有多少上一时刻的记忆细胞中的信息ct-1可以传输到当前时刻的记忆细胞中;输入门it控制有多少信息可以流入记忆细胞ct中;而输出门ot控制有多少当前时刻的记忆细胞ct中的信息可以流入当前隐藏层ht中。
步骤九:训练长短期记忆循环神经网络模型。将步骤五中划分好的数据代入模型进行训练过程中,由小批量梯度下降法寻找使预测值与真实值相差最小的值,提高模型的精确度。确定先决条件即确定优化模型的假设函数及损失函数见公式(12)其中为模型预测值,xi为真实值,n为数据总数,通过计算找出最合适的LSTM神经网络中的权重。
步骤十:将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发。
本公开还提供了基于决策树与神经网络的水产养殖病害预测系统,所述系统包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下系统的单元中:
数据采集单元,用于数据采集;
生成决策树单元,用于生成决策树;
数据采集再单元,用于采集处理后的数据;
标准化单元,用于标准化处理数据;
划分数据单元,用于划分数据;
输入输出设置单元,用于设置输入、输出层;
隐藏层单元,用于隐藏层参数设置;
网络构建单元,用于构建长短期记忆循环神经网络;
网络训练单元,用于训练长短期记忆循环神经网络模型;
预测单元,用于将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发。
本公开的有益效果为:本公开提供基于决策树与神经网络的水产养殖病害预测方法及系统,现有技术没能充分考虑数据随时间变化的特点,而长短期记忆循环神经网络不仅擅长处理连续的时间序列也改善了循环神经网络的梯度消失、梯度爆炸等问题。水产病害的发生具有一定的突发性,长短期记忆神经网络具有擅长处理复杂突变的时序数据的特点。本发明将决策树与神经网络相结合可以更加精准的预测水产病害的发生。水产病害的发生不仅会给人们带来巨大的经济损失,也会影响消费者的健康,本发明实用性强,预测精度高,可以帮助养殖户及时的解决水产病害减少经济损失。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
图1所示为基于决策树与神经网络的水产养殖病害预测方法的流程图;
图2所示为基于决策树与神经网络的水产养殖病害预测系统结构图。
具体实施方式
以下将结合实施例和附图对本公开的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本公开的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如图1所示为根据本公开的基于决策树与神经网络的水产养殖病害预测方法的流程图,下面结合图1来阐述根据本公开的实施方式的基于决策树与神经网络的水产养殖病害预测方法。
本公开提出基于决策树与神经网络的水产养殖病害预测方法,具体包括以下步骤:
步骤一:数据采集。收集水体m个因素x1,x2,…xm的数据及对应的病害数据将数据导入Excel表格中,对数据进行预处理。
步骤二:生成决策树。随机抽取其中的80%组数据作为决策树的训练集,剩余的20%组数据作为决策树的测试集。采取改进的C4.5算法生成决策树。
去除相关性大的属性:
步骤2.1,利用公式(1)计算两两因素之间的相关系数:
步骤2.2,分裂属性的选择:
利用公式(2)计算对L分类(按水产病害类型进行分类)所需要的期望信息:
其中,m为数据集中水产疾病的种类数量,pi为对应疾病在数据集中出现的概率。
利用公式(3)计算因素xi的分裂信息:
其中,训练集L通过因素xi的属性值划分为t个子数据聚集,|Lj|表示第j个子数据聚集中样本数量,|L|表示划分之前数据集中样本总数量。
利用公式(3)、(4)计算因素xi的信息增益率:
步骤2.3,采用PEP(Pessimistic Error Pruning)剪枝法进行因素的选择最终确定因素个数y。
步骤三:采集处理后的数据。收集上一步骤中的n个因素y1,y2…yn的数据将数据导入Excel表格中并将数据进行预处理。
步骤四:标准化处理数据。利用min-max标准化公式(6)分别将y1,y2…yn的r行数据yij归一化。
其中i=1…n,j=1…r,yimax为第i个因素的所有数据的最大值,yimin为第i个因素的最小值。
步骤五:划分数据。将上一步骤中处理好的数据随机选取80%组数据作为训练集,剩余20%组数据作为测试集。将每个因素的数据分别依次输入模型中。
步骤六:设置输入、输出层。设置网络输入为每次每个因素的35条数据作为输入
Y={yij|i=1,2…n,j=1,2,…35},3个数据作为输出O={oi|i=1,2,3},网络经过训练会输出接下来连续3个时间段各因素含量的预测值。
步骤七:隐藏层参数设置。确定激活函数为ELU函数和tanh函数,由隐藏层到输出层的激活函数选择sigmod函数。
步骤八:构建长短期记忆循环神经网络。
it=E(Wxixt+Whiht-1+bi) (7)
ft=E(Wxfxt+Whfht-1+bf) (8)
ot=E(Wxoxt+Whoht-1+bo) (9)
ct=ft⊙ct-1+it⊙tanh(Wxcxt+Whcht-1+bc) (10)
ht=ot⊙tanh(ct) (11)
式中:it为输入门限层(input gate);ft为遗忘门限层(forget gate);ot为输出门限层(output gate);ct为记忆细胞在t时刻的状态;xt为输入层的输入向量;ht为隐藏层的输出向量,ht-1为t-1时刻隐藏层的输出向量;⊙是指矩阵逐元素点乘;bγ是各层输出的偏差向量,如bi是输入门限层的偏差向量,bf是遗忘门限层的偏差向量,bo是输出门限层的偏差向量,bc是记忆细胞的偏差向量;E(x)是ELU函数;Wαβ是对应层的权重矩阵,如Wxf是输入层到遗忘门限层的权重矩阵,Whf是隐藏层到遗忘门限层的权重矩阵,Wxi是输入层到输入门限层的权重矩阵、Wxo是输入层到输出门限层的权重矩阵、Who是隐藏层到输出门限层的权重矩阵、Whi是隐藏层到输入门限层的权重矩阵、Wxc是输入层到记忆细胞的权重矩阵、Whc是隐藏层到记忆细胞的权重矩阵;ct用于更新细胞状态。由式(10)可知遗忘门ft控制有多少上一时刻的记忆细胞中的信息ct-1可以传输到当前时刻的记忆细胞中;输入门it控制有多少信息可以流入记忆细胞ct中;而输出门ot控制有多少当前时刻的记忆细胞ct中的信息可以流入当前隐藏层ht中。
步骤九:训练长短期记忆循环神经网络模型。将数据代入模型进行训练过程中,由小批量梯度下降法寻找使预测值与真实值相差最小的值,提高模型的精确度。确定先决条件即确定优化模型的假设函数及损失函数见公式(12)其中为模型预测值,xi为真实值,n为数据总数,通过计算找出最合适的LSTM神经网络中的权重。
步骤十:将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发。
本公开的实施例提供的基于决策树与神经网络的水产养殖病害预测系统,如图2所示为本公开的基于决策树与神经网络的水产养殖病害预测系统结构图,该实施例的基于决策树与神经网络的水产养殖病害预测系统包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于决策树与神经网络的水产养殖病害预测系统实施例中的步骤。
所述系统包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下系统的单元中:
数据采集单元,用于数据采集;
生成决策树单元,用于生成决策树;
数据采集再单元,用于采集处理后的数据;
标准化单元,用于标准化处理数据;
划分数据单元,用于划分数据;
输入输出设置单元,用于设置输入、输出层;
隐藏层单元,用于隐藏层参数设置;
网络构建单元,用于构建长短期记忆循环神经网络;
网络训练单元,用于训练长短期记忆循环神经网络模型;
预测单元,用于将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发。
所述基于决策树与神经网络的水产养殖病害预测系统可以运行于桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备中。所述基于决策树与神经网络的水产养殖病害预测系统,可运行的系统可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述例子仅仅是基于决策树与神经网络的水产养殖病害预测系统的示例,并不构成对基于决策树与神经网络的水产养殖病害预测系统的限定,可以包括比例子更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述基于决策树与神经网络的水产养殖病害预测系统还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(CentralProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述基于决策树与神经网络的水产养殖病害预测系统运行系统的控制中心,利用各种接口和线路连接整个基于决策树与神经网络的水产养殖病害预测系统可运行系统的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述基于决策树与神经网络的水产养殖病害预测系统的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(SmartMediaCard,SMC),安全数字(SecureDigital,SD)卡,闪存卡(FlashCard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
尽管本公开的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,而是应当将其视作是通过参考所附权利要求考虑到现有技术为这些权利要求提供广义的可能性解释,从而有效地涵盖本公开的预定范围。此外,上文以发明人可预见的实施例对本公开进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本公开的非实质性改动仍可代表本公开的等效改动。
Claims (7)
1.基于决策树与神经网络的水产养殖病害预测方法,其特征在于,所述方法包括以下步骤:
步骤一:数据采集;
步骤二:生成决策树;
步骤三:采集处理后的数据;
步骤四:标准化处理数据;
步骤五:划分数据;
步骤六:设置输入、输出层;
步骤七:隐藏层参数设置;
步骤八:构建长短期记忆循环神经网络;
步骤九:训练长短期记忆循环神经网络模型;
步骤十:将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发。
2.根据权利要求1所述的基于决策树与神经网络的水产养殖病害预测方法,其特征在于,在步骤二中,生成决策树的方法为:
去除相关性大的属性:
步骤2.1,利用公式(1)计算两两因素之间的相关系数:
步骤2.2,分裂属性的选择:
利用公式(2)计算对L分类所需要的期望信息:
其中,m为数据集中水产疾病的种类数量,pi为对应疾病在数据集中出现的概率;
利用公式(3)计算因素xi的分裂信息:
其中,训练集L通过因素xi的属性值划分为m个子数据聚集,|Lj|表示第j个子数据聚集中样本数量,|L|表示划分之前数据集中样本总数量;
利用公式(4)、(5)计算因素xi的信息增益率:
步骤2.3,采用PEP剪枝法进行因素的选择最终确定因素个数y。
4.根据权利要求3所述的基于决策树与神经网络的水产养殖病害预测方法,其特征在于,在步骤六中,设置输入、输出层的方法为:
设置网络输入为每次每个因素的35条数据作为输入,
Y={yij|i=1,2…n,j=1,2,…35},3个数据作为输出O={oi|i=1,2,3},网络经过训练会输出接下来连续3个时间段各因素含量的预测值。
5.根据权利要求4所述的基于决策树与神经网络的水产养殖病害预测方法,其特征在于,在步骤八中,构建长短期记忆循环神经网络的方法为:
构建长短期记忆循环神经网络:
it=E(Wxixt+Whiht-1+bi) (7)
ft=E(Wxfxt+Whfht-1+bf) (8)
ot=E(Wxoxt+Whoht-1+bo) (9)
ct=ft⊙ct-1+it⊙tanh(Wxcxt+Whcht-1+bc) (10)
ht=ot⊙tanh(ct) (11)
式中:it为输入门限层(input gate);ft为遗忘门限层(forget gate);ot为输出门限层(output gate);ct为记忆细胞在t时刻的状态;xt为输入层的输入向量;ht为隐藏层的输出向量,ht-1为t-1时刻隐藏层的输出向量;⊙是指矩阵逐元素点乘;bγ是各层输出的偏差向量,如bi是输入门限层的偏差向量,bf是遗忘门限层的偏差向量,bo是输出门限层的偏差向量,bc是记忆细胞的偏差向量;E(x)是ELU函数;Wαβ是对应层的权重矩阵,如Wxf是输入层到遗忘门限层的权重矩阵,Whf是隐藏层到遗忘门限层的权重矩阵,Wxi是输入层到输入门限层的权重矩阵、Wxo是输入层到输出门限层的权重矩阵、Who是隐藏层到输出门限层的权重矩阵、Whi是隐藏层到输入门限层的权重矩阵、Wxc是输入层到记忆细胞的权重矩阵、Whc是隐藏层到记忆细胞的权重矩阵;ct用于更新细胞状态;由式(10)可知遗忘门ft控制有多少上一时刻的记忆细胞中的信息ct-1可以传输到当前时刻的记忆细胞中;输入门it控制有多少信息可以流入记忆细胞ct中;而输出门ot控制有多少当前时刻的记忆细胞ct中的信息可以流入当前隐藏层ht中。
7.基于决策树与神经网络的水产养殖病害预测系统,其特征在于,所述系统包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下系统的单元中:
数据采集单元,用于数据采集;
生成决策树单元,用于生成决策树;
数据采集再单元,用于采集处理后的数据;
标准化单元,用于标准化处理数据;
划分数据单元,用于划分数据;
输入输出设置单元,用于设置输入、输出层;
隐藏层单元,用于隐藏层参数设置;
网络构建单元,用于构建长短期记忆循环神经网络;
网络训练单元,用于训练长短期记忆循环神经网络模型;
预测单元,用于将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911113206.4A CN111062511B (zh) | 2019-11-14 | 2019-11-14 | 基于决策树与神经网络的水产养殖病害预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911113206.4A CN111062511B (zh) | 2019-11-14 | 2019-11-14 | 基于决策树与神经网络的水产养殖病害预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111062511A true CN111062511A (zh) | 2020-04-24 |
CN111062511B CN111062511B (zh) | 2023-04-25 |
Family
ID=70297866
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911113206.4A Active CN111062511B (zh) | 2019-11-14 | 2019-11-14 | 基于决策树与神经网络的水产养殖病害预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111062511B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112910859A (zh) * | 2021-01-19 | 2021-06-04 | 山西警察学院 | 基于c5.0决策树和时序分析的物联网设备监测预警方法 |
CN113254458A (zh) * | 2021-07-07 | 2021-08-13 | 赛汇检测(广州)有限公司 | 一种水产病害智能化诊断方法 |
CN114708927A (zh) * | 2022-03-09 | 2022-07-05 | 北京理工大学 | 基于灰色预测和lstm的高温合金疲劳性能预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102550455A (zh) * | 2012-01-13 | 2012-07-11 | 厦门大学 | 一种大黄鱼刺激隐核虫病害程度的判别方法 |
CN105718508A (zh) * | 2016-01-08 | 2016-06-29 | 山东省农业科学院科技信息研究所 | 一种水产养殖信息采集处理系统 |
CN108280551A (zh) * | 2018-02-02 | 2018-07-13 | 华北电力大学 | 一种利用长短期记忆网络的光伏发电功率预测方法 |
-
2019
- 2019-11-14 CN CN201911113206.4A patent/CN111062511B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102550455A (zh) * | 2012-01-13 | 2012-07-11 | 厦门大学 | 一种大黄鱼刺激隐核虫病害程度的判别方法 |
CN105718508A (zh) * | 2016-01-08 | 2016-06-29 | 山东省农业科学院科技信息研究所 | 一种水产养殖信息采集处理系统 |
CN108280551A (zh) * | 2018-02-02 | 2018-07-13 | 华北电力大学 | 一种利用长短期记忆网络的光伏发电功率预测方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112910859A (zh) * | 2021-01-19 | 2021-06-04 | 山西警察学院 | 基于c5.0决策树和时序分析的物联网设备监测预警方法 |
CN112910859B (zh) * | 2021-01-19 | 2022-06-14 | 山西警察学院 | 基于c5.0决策树和时序分析的物联网设备监测预警方法 |
CN113254458A (zh) * | 2021-07-07 | 2021-08-13 | 赛汇检测(广州)有限公司 | 一种水产病害智能化诊断方法 |
CN113254458B (zh) * | 2021-07-07 | 2022-04-08 | 赛汇检测(广州)有限公司 | 一种水产病害智能化诊断方法 |
CN114708927A (zh) * | 2022-03-09 | 2022-07-05 | 北京理工大学 | 基于灰色预测和lstm的高温合金疲劳性能预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111062511B (zh) | 2023-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111062511B (zh) | 基于决策树与神经网络的水产养殖病害预测方法及系统 | |
CN106874292A (zh) | 话题处理方法及装置 | |
CN106599065A (zh) | 一种基于Storm分布式框架的食品安全网络舆情预警系统 | |
CN109559045A (zh) | 一种人员智能化管控的方法及系统 | |
CN109829478A (zh) | 一种基于变分自编码器的问题分类方法和装置 | |
CN111666494A (zh) | 分群决策模型生成、分群处理方法、装置、设备及介质 | |
CN110516537A (zh) | 一种基于自步学习的人脸年龄估计方法 | |
CN113268370A (zh) | 一种根因告警分析方法、系统、设备及存储介质 | |
CN113407644A (zh) | 一种基于深度学习算法的企业行业二级行业多标签分类器 | |
CN111445065A (zh) | 用于数据中心制冷群控的能耗优化方法及系统 | |
Wen et al. | MapReduce-based BP neural network classification of aquaculture water quality | |
CN108509588B (zh) | 一种基于大数据的律师评估方法及推荐方法 | |
CN112785156B (zh) | 一种基于聚类与综合评价的产业领袖识别方法 | |
Benzer | Population dynamics forecasting using artificial neural networks | |
CN116702132A (zh) | 网络入侵检测方法及系统 | |
CN112200208A (zh) | 基于多维度特征融合的云工作流任务执行时间预测方法 | |
Sumangali et al. | Determination of interesting rules in FCA using information gain | |
Zhang et al. | Credit risk control algorithm based on stacking ensemble learning | |
Feng et al. | Web service QoS classification based on optimized convolutional neural network | |
Li et al. | Grey-incidence clustering decision-making method with three-parameter interval grey number based on regret theory | |
CN111221704B (zh) | 一种确定办公管理应用系统运行状态的方法及系统 | |
Huo et al. | An improved artificial bee colony algorithm for numerical functions | |
CN113743461A (zh) | 无人机集群健康度评估方法及装置 | |
CN113643283A (zh) | 一种人体衰老状况的检测方法、装置、设备及存储介质 | |
Nurmalasari et al. | Classification for Papaya Fruit Maturity Level with Convolutional Neural Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |