CN111062511A - 基于决策树与神经网络的水产养殖病害预测方法及系统 - Google Patents

基于决策树与神经网络的水产养殖病害预测方法及系统 Download PDF

Info

Publication number
CN111062511A
CN111062511A CN201911113206.4A CN201911113206A CN111062511A CN 111062511 A CN111062511 A CN 111062511A CN 201911113206 A CN201911113206 A CN 201911113206A CN 111062511 A CN111062511 A CN 111062511A
Authority
CN
China
Prior art keywords
data
layer
neural network
input
decision tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911113206.4A
Other languages
English (en)
Other versions
CN111062511B (zh
Inventor
姜春涛
黄昕
任紫薇
凌逸文
罗戬浩
曹颖
潘淑仪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan University
Original Assignee
Foshan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan University filed Critical Foshan University
Priority to CN201911113206.4A priority Critical patent/CN111062511B/zh
Publication of CN111062511A publication Critical patent/CN111062511A/zh
Application granted granted Critical
Publication of CN111062511B publication Critical patent/CN111062511B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/80Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
    • Y02A40/81Aquaculture, e.g. of fish

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开公开了基于决策树与神经网络的水产养殖病害预测方法及系统,本公开主要融合长短期记忆循环神经网络以及决策树两种算法,来进行水产养殖病害预测。而改进的C4.5算法则增加了去除相关性大的因素这一环节,从而有效的减少了不必要的计算,将预测的数据代入决策树中进行判断病害是否爆发以及所属类型,可以有效解决长期依赖问题,记住时间段的信息是它们必备的技能;具有擅长处理复杂突变的时序数据的特点,可以更加精准的预测水产病害的发生,实用性强,预测精度高,可以帮助养殖户及时的解决水产病害减少经济损失。

Description

基于决策树与神经网络的水产养殖病害预测方法及系统
技术领域
本公开涉及人工智能技术领域,具体涉及基于决策树与神经网络的水产养殖病害预测方法及系统。
背景技术
我国传统水产养殖主要是“三靠”:靠经验、靠体力、靠天气,导致水资源利用率和劳动生产率低,与国际先进水平有较大差距。与此同时,水体污染严重,水产病害频繁等问题导致养殖风险大、水产品质量安全隐患突出等。每年水产养殖病害影响面积占全国总水产养殖面积10%以上,直接经济损失高达上百亿元,已经成为我国水产养殖健康发展的主要障碍之一。根据水产养殖动植物疾病监测预报,2017年,我国水产养殖因病害造成的经济损失约361亿元,其中鱼类占33.8%,甲壳类占40.7%,贝类占13.2%,其他占12.4%。随着我国人民生活水平不断提高,水产品已经成为人们日常餐桌上必不可少的美食,但是由于水产养殖病害频发导致现在养殖业出现养殖用药过量,造成养殖品种体内毒素富集严重,严重影响消费者的健康。因此对水产病害进行预测分析对我国水产养殖具有极其重要的意义。
现有技术大都采用灰色预测模型、BP神经网络模型。但灰色预测模型对时间序列平滑性要求较高,有快速衰减和递增的属性,所以他的时效性有限,不适合做长期的预测或者分析。标准BP神经网络算法收敛速度慢、局部极值、难以确定隐层数和隐层的节点个数。由于收集的水体数据中有许多属性相关性较大,如果将所有属性都用C4.5算法进行计算,则会造成一定的资源浪费,降低计算效率。
发明内容
本公开提供基于决策树与神经网络的水产养殖病害预测方法及系统,本公开主要融合长短期记忆循环神经网络以及决策树两种算法,来进行水产养殖病害预测。而改进的C4.5算法则增加了去除相关性大的因素这一环节,从而有效的减少了不必要的计算。本发明预建立改进的C4.5-LSTM预测模型(C4.5为决策树生成算法)来对水产养殖病害进行预测。首先收集历史的水温、PH值、溶氧量、放养。密度、硬度、盐度、微量元素含量、水产养殖病害爆发与否以及病害所属类型等数据,将数据进行预处理后运用改进的C4.5算法训练生成决策树(主要为去除相关性较大的属性、特征选择、决策树生成、剪枝)。通过决策树的确定影响水产养殖病害爆发的主要n个因素。接下来收集这n个因素的数据并进行数据清洗,将处理好的数据建立长短期记忆循环神经网络模型预测各因素的值。最后将预测的数据代入决策树中进行判断病害是否爆发以及所属类型。传统的神经网络并不能做到长期记忆,之前的信息不能连接到当前的任务,即存在“长期依赖”问题。但长短期记忆循环神经网络模型擅长处理可变长度的时间序列的数据输入,且网络具有自连接的隐层,即当前时刻隐层的状态依靠前一时刻隐层的状态进行更新,可以有效解决长期依赖问题,记住时间段的信息是它们必备的技能。
为了实现上述目的,根据本公开的一方面,提供基于决策树与神经网络的水产养殖病害预测方法,所述方法包括以下步骤:
步骤一:数据采集。收集水体m个因素x1,x2,…xm的数据及对应的病害数据将数据导入Excel表格中,对数据进行预处理即填补数据中的缺失值,去除数据中的异常值。
步骤二:生成决策树。随机抽取其中的80%组数据作为决策树的训练集,剩余的20%组数据作为决策树的测试集。采取改进的C4.5算法生成决策树。
去除相关性大的属性:
步骤2.1,利用公式(1)计算两两因素之间的相关系数:
Figure BDA0002273336560000021
其中x、y为两个因素,
Figure BDA0002273336560000022
分别为两个因素所有数据的平均值,即,
Figure BDA0002273336560000023
为因素x的平均值,
Figure BDA0002273336560000024
为因素y的平均值,n为数据总数。当p达到0.95时,则认为两个因素相关性过大,此时分别判断这两个因素对病害爆发的影响大小,剔除影响力较小的因素。
步骤2.2,分裂属性的选择:
利用公式(2)计算对L分类(按水产病害类型进行分类)所需要的期望信息:
Figure BDA0002273336560000025
其中,m为数据集中水产疾病的种类数量,pi为对应疾病在数据集中出现的概率。
利用公式(3)计算因素xi的分裂信息:
Figure BDA0002273336560000026
其中,训练集L通过因素xi的属性值划分为t个子数据聚集即在训练集L中xi的可能的取值结果,|Lj|表示第j个子数据聚集中样本数量,|L|表示划分之前数据集中样本总数量。
利用公式(4)、(5)计算因素xi的信息增益率:
Figure BDA0002273336560000027
Figure BDA0002273336560000031
步骤2.3,采用PEP(Pessimistic Error Pruning)剪枝法进行因素的选择最终确定因素个数y。
步骤三:采集处理后的数据。收集上一步骤中的n个因素y1,y2…yn的数据将数据导入Excel表格中并将数据进行预处理即填补数据中的缺失值,去除数据中的异常值。
步骤四:标准化处理数据。利用min-max标准化公式(6)分别将y1,y2…yn的r行数据yij归一化。
Figure BDA0002273336560000032
其中i=1…n,j=1…r,yimax为第i个因素的所有数据的最大值,yimin为第i个因素的最小值。
步骤五:划分数据。将上一步骤中处理好的数据随机选取80%组数据作为训练集,剩余20%组数据作为测试集。
步骤六:设置输入、输出层。设置网络输入为每次每个因素的35条数据作为输入,
Y={yij|i=1,2…n,j=1,2,…35},3个数据作为输出O={oi|i=1,2,3},网络经过训练会输出接下来连续3个时间段各因素含量的预测值。
步骤七:隐藏层参数设置。确定激活函数为ELU函数和tanh函数,由隐藏层到输出层的激活函数选择sigmod函数。
步骤八:构建长短期记忆循环神经网络。
it=E(Wxixt+Whiht-1+bi) (7)
ft=E(Wxfxt+Whfht-1+bf) (8)
ot=E(Wxoxt+Whoht-1+bo) (9)
ct=ft⊙ct-1+it⊙tanh(Wxcxt+Whcht-1+bc) (10)
ht=ot⊙tanh(ct) (11)
式中:it为输入门限层(input gate);ft为遗忘门限层(forget gate);ot为输出门限层(output gate);ct为记忆细胞在t时刻的状态;xt为输入层的输入向量;ht为隐藏层的输出向量,ht-1为t-1时刻隐藏层的输出向量;⊙是指矩阵逐元素点乘;bγ是各层输出的偏差向量,如bi是输入门限层的偏差向量,bf是遗忘门限层的偏差向量,bo是输出门限层的偏差向量,bc是记忆细胞的偏差向量;E(x)是ELU函数;Wαβ是对应层的权重矩阵,如Wxf是输入层到遗忘门限层的权重矩阵,Whf是隐藏层到遗忘门限层的权重矩阵,Wxi是输入层到输入门限层的权重矩阵、Wxo是输入层到输出门限层的权重矩阵、Who是隐藏层到输出门限层的权重矩阵、Whi是隐藏层到输入门限层的权重矩阵、Wxc是输入层到记忆细胞的权重矩阵、Whc是隐藏层到记忆细胞的权重矩阵;ct用于更新细胞状态。由式(10)可知遗忘门ft控制有多少上一时刻的记忆细胞中的信息ct-1可以传输到当前时刻的记忆细胞中;输入门it控制有多少信息可以流入记忆细胞ct中;而输出门ot控制有多少当前时刻的记忆细胞ct中的信息可以流入当前隐藏层ht中。
步骤九:训练长短期记忆循环神经网络模型。将步骤五中划分好的数据代入模型进行训练过程中,由小批量梯度下降法寻找使预测值与真实值相差最小的值,提高模型的精确度。确定先决条件即确定优化模型的假设函数及损失函数见公式(12)其中
Figure BDA0002273336560000042
为模型预测值,xi为真实值,n为数据总数,通过计算找出最合适的LSTM神经网络中的权重。
Figure BDA0002273336560000041
步骤十:将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发。
本公开还提供了基于决策树与神经网络的水产养殖病害预测系统,所述系统包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下系统的单元中:
数据采集单元,用于数据采集;
生成决策树单元,用于生成决策树;
数据采集再单元,用于采集处理后的数据;
标准化单元,用于标准化处理数据;
划分数据单元,用于划分数据;
输入输出设置单元,用于设置输入、输出层;
隐藏层单元,用于隐藏层参数设置;
网络构建单元,用于构建长短期记忆循环神经网络;
网络训练单元,用于训练长短期记忆循环神经网络模型;
预测单元,用于将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发。
本公开的有益效果为:本公开提供基于决策树与神经网络的水产养殖病害预测方法及系统,现有技术没能充分考虑数据随时间变化的特点,而长短期记忆循环神经网络不仅擅长处理连续的时间序列也改善了循环神经网络的梯度消失、梯度爆炸等问题。水产病害的发生具有一定的突发性,长短期记忆神经网络具有擅长处理复杂突变的时序数据的特点。本发明将决策树与神经网络相结合可以更加精准的预测水产病害的发生。水产病害的发生不仅会给人们带来巨大的经济损失,也会影响消费者的健康,本发明实用性强,预测精度高,可以帮助养殖户及时的解决水产病害减少经济损失。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
图1所示为基于决策树与神经网络的水产养殖病害预测方法的流程图;
图2所示为基于决策树与神经网络的水产养殖病害预测系统结构图。
具体实施方式
以下将结合实施例和附图对本公开的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本公开的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如图1所示为根据本公开的基于决策树与神经网络的水产养殖病害预测方法的流程图,下面结合图1来阐述根据本公开的实施方式的基于决策树与神经网络的水产养殖病害预测方法。
本公开提出基于决策树与神经网络的水产养殖病害预测方法,具体包括以下步骤:
步骤一:数据采集。收集水体m个因素x1,x2,…xm的数据及对应的病害数据将数据导入Excel表格中,对数据进行预处理。
步骤二:生成决策树。随机抽取其中的80%组数据作为决策树的训练集,剩余的20%组数据作为决策树的测试集。采取改进的C4.5算法生成决策树。
去除相关性大的属性:
步骤2.1,利用公式(1)计算两两因素之间的相关系数:
Figure BDA0002273336560000051
其中x、y为两个因素,
Figure BDA0002273336560000061
分别为两个因素所有数据的平均值,n为数据总数。当p达到0.95时,则认为两个因素相关性过大,此时分别判断这两个因素对病害爆发的影响大小,剔除影响力较小的因素。
步骤2.2,分裂属性的选择:
利用公式(2)计算对L分类(按水产病害类型进行分类)所需要的期望信息:
Figure BDA0002273336560000062
其中,m为数据集中水产疾病的种类数量,pi为对应疾病在数据集中出现的概率。
利用公式(3)计算因素xi的分裂信息:
Figure BDA0002273336560000063
其中,训练集L通过因素xi的属性值划分为t个子数据聚集,|Lj|表示第j个子数据聚集中样本数量,|L|表示划分之前数据集中样本总数量。
利用公式(3)、(4)计算因素xi的信息增益率:
Figure BDA0002273336560000064
Figure BDA0002273336560000065
步骤2.3,采用PEP(Pessimistic Error Pruning)剪枝法进行因素的选择最终确定因素个数y。
步骤三:采集处理后的数据。收集上一步骤中的n个因素y1,y2…yn的数据将数据导入Excel表格中并将数据进行预处理。
步骤四:标准化处理数据。利用min-max标准化公式(6)分别将y1,y2…yn的r行数据yij归一化。
Figure BDA0002273336560000066
其中i=1…n,j=1…r,yimax为第i个因素的所有数据的最大值,yimin为第i个因素的最小值。
步骤五:划分数据。将上一步骤中处理好的数据随机选取80%组数据作为训练集,剩余20%组数据作为测试集。将每个因素的数据分别依次输入模型中。
步骤六:设置输入、输出层。设置网络输入为每次每个因素的35条数据作为输入
Y={yij|i=1,2…n,j=1,2,…35},3个数据作为输出O={oi|i=1,2,3},网络经过训练会输出接下来连续3个时间段各因素含量的预测值。
步骤七:隐藏层参数设置。确定激活函数为ELU函数和tanh函数,由隐藏层到输出层的激活函数选择sigmod函数。
步骤八:构建长短期记忆循环神经网络。
it=E(Wxixt+Whiht-1+bi) (7)
ft=E(Wxfxt+Whfht-1+bf) (8)
ot=E(Wxoxt+Whoht-1+bo) (9)
ct=ft⊙ct-1+it⊙tanh(Wxcxt+Whcht-1+bc) (10)
ht=ot⊙tanh(ct) (11)
式中:it为输入门限层(input gate);ft为遗忘门限层(forget gate);ot为输出门限层(output gate);ct为记忆细胞在t时刻的状态;xt为输入层的输入向量;ht为隐藏层的输出向量,ht-1为t-1时刻隐藏层的输出向量;⊙是指矩阵逐元素点乘;bγ是各层输出的偏差向量,如bi是输入门限层的偏差向量,bf是遗忘门限层的偏差向量,bo是输出门限层的偏差向量,bc是记忆细胞的偏差向量;E(x)是ELU函数;Wαβ是对应层的权重矩阵,如Wxf是输入层到遗忘门限层的权重矩阵,Whf是隐藏层到遗忘门限层的权重矩阵,Wxi是输入层到输入门限层的权重矩阵、Wxo是输入层到输出门限层的权重矩阵、Who是隐藏层到输出门限层的权重矩阵、Whi是隐藏层到输入门限层的权重矩阵、Wxc是输入层到记忆细胞的权重矩阵、Whc是隐藏层到记忆细胞的权重矩阵;ct用于更新细胞状态。由式(10)可知遗忘门ft控制有多少上一时刻的记忆细胞中的信息ct-1可以传输到当前时刻的记忆细胞中;输入门it控制有多少信息可以流入记忆细胞ct中;而输出门ot控制有多少当前时刻的记忆细胞ct中的信息可以流入当前隐藏层ht中。
步骤九:训练长短期记忆循环神经网络模型。将数据代入模型进行训练过程中,由小批量梯度下降法寻找使预测值与真实值相差最小的值,提高模型的精确度。确定先决条件即确定优化模型的假设函数及损失函数见公式(12)其中
Figure BDA0002273336560000071
为模型预测值,xi为真实值,n为数据总数,通过计算找出最合适的LSTM神经网络中的权重。
Figure BDA0002273336560000072
步骤十:将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发。
本公开的实施例提供的基于决策树与神经网络的水产养殖病害预测系统,如图2所示为本公开的基于决策树与神经网络的水产养殖病害预测系统结构图,该实施例的基于决策树与神经网络的水产养殖病害预测系统包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于决策树与神经网络的水产养殖病害预测系统实施例中的步骤。
所述系统包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下系统的单元中:
数据采集单元,用于数据采集;
生成决策树单元,用于生成决策树;
数据采集再单元,用于采集处理后的数据;
标准化单元,用于标准化处理数据;
划分数据单元,用于划分数据;
输入输出设置单元,用于设置输入、输出层;
隐藏层单元,用于隐藏层参数设置;
网络构建单元,用于构建长短期记忆循环神经网络;
网络训练单元,用于训练长短期记忆循环神经网络模型;
预测单元,用于将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发。
所述基于决策树与神经网络的水产养殖病害预测系统可以运行于桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备中。所述基于决策树与神经网络的水产养殖病害预测系统,可运行的系统可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述例子仅仅是基于决策树与神经网络的水产养殖病害预测系统的示例,并不构成对基于决策树与神经网络的水产养殖病害预测系统的限定,可以包括比例子更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述基于决策树与神经网络的水产养殖病害预测系统还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(CentralProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述基于决策树与神经网络的水产养殖病害预测系统运行系统的控制中心,利用各种接口和线路连接整个基于决策树与神经网络的水产养殖病害预测系统可运行系统的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述基于决策树与神经网络的水产养殖病害预测系统的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(SmartMediaCard,SMC),安全数字(SecureDigital,SD)卡,闪存卡(FlashCard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
尽管本公开的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,而是应当将其视作是通过参考所附权利要求考虑到现有技术为这些权利要求提供广义的可能性解释,从而有效地涵盖本公开的预定范围。此外,上文以发明人可预见的实施例对本公开进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本公开的非实质性改动仍可代表本公开的等效改动。

Claims (7)

1.基于决策树与神经网络的水产养殖病害预测方法,其特征在于,所述方法包括以下步骤:
步骤一:数据采集;
步骤二:生成决策树;
步骤三:采集处理后的数据;
步骤四:标准化处理数据;
步骤五:划分数据;
步骤六:设置输入、输出层;
步骤七:隐藏层参数设置;
步骤八:构建长短期记忆循环神经网络;
步骤九:训练长短期记忆循环神经网络模型;
步骤十:将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发。
2.根据权利要求1所述的基于决策树与神经网络的水产养殖病害预测方法,其特征在于,在步骤二中,生成决策树的方法为:
去除相关性大的属性:
步骤2.1,利用公式(1)计算两两因素之间的相关系数:
Figure FDA0002273336550000011
其中x、y为两个因素,
Figure FDA0002273336550000012
分别为两个因素所有数据的平均值,n为数据总数;当p达到0.95时,则认为两个因素相关性过大,此时分别判断这两个因素对病害爆发的影响大小,剔除影响力较小的因素;
步骤2.2,分裂属性的选择:
利用公式(2)计算对L分类所需要的期望信息:
Figure FDA0002273336550000013
其中,m为数据集中水产疾病的种类数量,pi为对应疾病在数据集中出现的概率;
利用公式(3)计算因素xi的分裂信息:
Figure FDA0002273336550000014
其中,训练集L通过因素xi的属性值划分为m个子数据聚集,|Lj|表示第j个子数据聚集中样本数量,|L|表示划分之前数据集中样本总数量;
利用公式(4)、(5)计算因素xi的信息增益率:
Figure FDA0002273336550000021
Figure FDA0002273336550000022
步骤2.3,采用PEP剪枝法进行因素的选择最终确定因素个数y。
3.根据权利要求2所述的基于决策树与神经网络的水产养殖病害预测方法,其特征在于,在步骤四中,标准化处理数据的方法为:
利用min-max标准化公式(6)分别将y1,y2…yn的r行数据yij归一化:
Figure FDA0002273336550000023
其中i=1…n,j=1…r,yimax为第i个因素的所有数据的最大值,yimin为第i个因素的最小值。
4.根据权利要求3所述的基于决策树与神经网络的水产养殖病害预测方法,其特征在于,在步骤六中,设置输入、输出层的方法为:
设置网络输入为每次每个因素的35条数据作为输入,
Y={yij|i=1,2…n,j=1,2,…35},3个数据作为输出O={oi|i=1,2,3},网络经过训练会输出接下来连续3个时间段各因素含量的预测值。
5.根据权利要求4所述的基于决策树与神经网络的水产养殖病害预测方法,其特征在于,在步骤八中,构建长短期记忆循环神经网络的方法为:
构建长短期记忆循环神经网络:
it=E(Wxixt+Whiht-1+bi) (7)
ft=E(Wxfxt+Whfht-1+bf) (8)
ot=E(Wxoxt+Whoht-1+bo) (9)
ct=ft⊙ct-1+it⊙tanh(Wxcxt+Whcht-1+bc) (10)
ht=ot⊙tanh(ct) (11)
式中:it为输入门限层(input gate);ft为遗忘门限层(forget gate);ot为输出门限层(output gate);ct为记忆细胞在t时刻的状态;xt为输入层的输入向量;ht为隐藏层的输出向量,ht-1为t-1时刻隐藏层的输出向量;⊙是指矩阵逐元素点乘;bγ是各层输出的偏差向量,如bi是输入门限层的偏差向量,bf是遗忘门限层的偏差向量,bo是输出门限层的偏差向量,bc是记忆细胞的偏差向量;E(x)是ELU函数;Wαβ是对应层的权重矩阵,如Wxf是输入层到遗忘门限层的权重矩阵,Whf是隐藏层到遗忘门限层的权重矩阵,Wxi是输入层到输入门限层的权重矩阵、Wxo是输入层到输出门限层的权重矩阵、Who是隐藏层到输出门限层的权重矩阵、Whi是隐藏层到输入门限层的权重矩阵、Wxc是输入层到记忆细胞的权重矩阵、Whc是隐藏层到记忆细胞的权重矩阵;ct用于更新细胞状态;由式(10)可知遗忘门ft控制有多少上一时刻的记忆细胞中的信息ct-1可以传输到当前时刻的记忆细胞中;输入门it控制有多少信息可以流入记忆细胞ct中;而输出门ot控制有多少当前时刻的记忆细胞ct中的信息可以流入当前隐藏层ht中。
6.根据权利要求5所述的基于决策树与神经网络的水产养殖病害预测方法,其特征在于,在步骤九中,训练长短期记忆循环神经网络模型的方法为:
训练长短期记忆循环神经网络模型:将数据代入模型进行训练过程中,由小批量梯度下降法寻找使预测值与真实值相差最小的值,提高模型的精确度;确定先决条件即确定优化模型的假设函数及损失函数见公式(12)其中
Figure FDA0002273336550000031
为模型预测值,xi为真实值,n为数据总数,通过计算找出最合适的LSTM神经网络中的权重;
Figure FDA0002273336550000032
7.基于决策树与神经网络的水产养殖病害预测系统,其特征在于,所述系统包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下系统的单元中:
数据采集单元,用于数据采集;
生成决策树单元,用于生成决策树;
数据采集再单元,用于采集处理后的数据;
标准化单元,用于标准化处理数据;
划分数据单元,用于划分数据;
输入输出设置单元,用于设置输入、输出层;
隐藏层单元,用于隐藏层参数设置;
网络构建单元,用于构建长短期记忆循环神经网络;
网络训练单元,用于训练长短期记忆循环神经网络模型;
预测单元,用于将预测出的各因素的数据组合成一组一组的数据,代入建立好的决策树中进行分类预测水产病害的爆发。
CN201911113206.4A 2019-11-14 2019-11-14 基于决策树与神经网络的水产养殖病害预测方法及系统 Active CN111062511B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911113206.4A CN111062511B (zh) 2019-11-14 2019-11-14 基于决策树与神经网络的水产养殖病害预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911113206.4A CN111062511B (zh) 2019-11-14 2019-11-14 基于决策树与神经网络的水产养殖病害预测方法及系统

Publications (2)

Publication Number Publication Date
CN111062511A true CN111062511A (zh) 2020-04-24
CN111062511B CN111062511B (zh) 2023-04-25

Family

ID=70297866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911113206.4A Active CN111062511B (zh) 2019-11-14 2019-11-14 基于决策树与神经网络的水产养殖病害预测方法及系统

Country Status (1)

Country Link
CN (1) CN111062511B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112910859A (zh) * 2021-01-19 2021-06-04 山西警察学院 基于c5.0决策树和时序分析的物联网设备监测预警方法
CN113254458A (zh) * 2021-07-07 2021-08-13 赛汇检测(广州)有限公司 一种水产病害智能化诊断方法
CN114708927A (zh) * 2022-03-09 2022-07-05 北京理工大学 基于灰色预测和lstm的高温合金疲劳性能预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102550455A (zh) * 2012-01-13 2012-07-11 厦门大学 一种大黄鱼刺激隐核虫病害程度的判别方法
CN105718508A (zh) * 2016-01-08 2016-06-29 山东省农业科学院科技信息研究所 一种水产养殖信息采集处理系统
CN108280551A (zh) * 2018-02-02 2018-07-13 华北电力大学 一种利用长短期记忆网络的光伏发电功率预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102550455A (zh) * 2012-01-13 2012-07-11 厦门大学 一种大黄鱼刺激隐核虫病害程度的判别方法
CN105718508A (zh) * 2016-01-08 2016-06-29 山东省农业科学院科技信息研究所 一种水产养殖信息采集处理系统
CN108280551A (zh) * 2018-02-02 2018-07-13 华北电力大学 一种利用长短期记忆网络的光伏发电功率预测方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112910859A (zh) * 2021-01-19 2021-06-04 山西警察学院 基于c5.0决策树和时序分析的物联网设备监测预警方法
CN112910859B (zh) * 2021-01-19 2022-06-14 山西警察学院 基于c5.0决策树和时序分析的物联网设备监测预警方法
CN113254458A (zh) * 2021-07-07 2021-08-13 赛汇检测(广州)有限公司 一种水产病害智能化诊断方法
CN113254458B (zh) * 2021-07-07 2022-04-08 赛汇检测(广州)有限公司 一种水产病害智能化诊断方法
CN114708927A (zh) * 2022-03-09 2022-07-05 北京理工大学 基于灰色预测和lstm的高温合金疲劳性能预测方法

Also Published As

Publication number Publication date
CN111062511B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
CN111062511B (zh) 基于决策树与神经网络的水产养殖病害预测方法及系统
CN106874292A (zh) 话题处理方法及装置
CN106599065A (zh) 一种基于Storm分布式框架的食品安全网络舆情预警系统
CN109559045A (zh) 一种人员智能化管控的方法及系统
CN109829478A (zh) 一种基于变分自编码器的问题分类方法和装置
CN111666494A (zh) 分群决策模型生成、分群处理方法、装置、设备及介质
CN110516537A (zh) 一种基于自步学习的人脸年龄估计方法
CN113268370A (zh) 一种根因告警分析方法、系统、设备及存储介质
CN113407644A (zh) 一种基于深度学习算法的企业行业二级行业多标签分类器
CN111445065A (zh) 用于数据中心制冷群控的能耗优化方法及系统
Wen et al. MapReduce-based BP neural network classification of aquaculture water quality
CN108509588B (zh) 一种基于大数据的律师评估方法及推荐方法
CN112785156B (zh) 一种基于聚类与综合评价的产业领袖识别方法
Benzer Population dynamics forecasting using artificial neural networks
CN116702132A (zh) 网络入侵检测方法及系统
CN112200208A (zh) 基于多维度特征融合的云工作流任务执行时间预测方法
Sumangali et al. Determination of interesting rules in FCA using information gain
Zhang et al. Credit risk control algorithm based on stacking ensemble learning
Feng et al. Web service QoS classification based on optimized convolutional neural network
Li et al. Grey-incidence clustering decision-making method with three-parameter interval grey number based on regret theory
CN111221704B (zh) 一种确定办公管理应用系统运行状态的方法及系统
Huo et al. An improved artificial bee colony algorithm for numerical functions
CN113743461A (zh) 无人机集群健康度评估方法及装置
CN113643283A (zh) 一种人体衰老状况的检测方法、装置、设备及存储介质
Nurmalasari et al. Classification for Papaya Fruit Maturity Level with Convolutional Neural Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant