CN111223574A - 一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法 - Google Patents

一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法 Download PDF

Info

Publication number
CN111223574A
CN111223574A CN202010035403.5A CN202010035403A CN111223574A CN 111223574 A CN111223574 A CN 111223574A CN 202010035403 A CN202010035403 A CN 202010035403A CN 111223574 A CN111223574 A CN 111223574A
Authority
CN
China
Prior art keywords
state
probability
hidden
model
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010035403.5A
Other languages
English (en)
Inventor
王建平
余心杰
李彧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NINGBO ACADEMY OF OCEAN AND FISHERY
Ningbo Institute of Technology of ZJU
Original Assignee
NINGBO ACADEMY OF OCEAN AND FISHERY
Ningbo Institute of Technology of ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NINGBO ACADEMY OF OCEAN AND FISHERY, Ningbo Institute of Technology of ZJU filed Critical NINGBO ACADEMY OF OCEAN AND FISHERY
Priority to CN202010035403.5A priority Critical patent/CN111223574A/zh
Publication of CN111223574A publication Critical patent/CN111223574A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K61/00Culture of aquatic animals
    • A01K61/50Culture of aquatic animals of shellfish
    • A01K61/59Culture of aquatic animals of shellfish of crustaceans, e.g. lobsters or shrimps
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/80Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
    • Y02A40/81Aquaculture, e.g. of fish

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Pathology (AREA)
  • Environmental Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Zoology (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及水产养殖技术领域,尤其涉及一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法。它包括以下步骤:S1、获取南美白对虾养殖水体信息以及气象信息;S2、采用存储模型将获取的信息进行存储;S3、通过获取的信息建立神经网络模型,然后训练样本数据;S4、建立隐马尔可夫模型,然后训练经神经网络拟合后的高相关性数据;S5、通过建立的神经网络模型以及隐马尔可夫模型来预测肝肠孢虫病的爆发概率。采用这种方法能对南美白对虾肝肠孢虫病进行预测。

Description

一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法
技术领域
本发明涉及水产养殖技术领域,尤其涉及一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法。
背景技术
南美白对虾是世界上三大优良养殖虾种之一,是我国主要的对下养殖品种。肝肠孢虫是南美白对虾养殖中的常见寄生虫疾病,传播迅速,蔓延广,全名肠道上皮细胞微孢子虫,是当前最常见的南美白对虾暴发性流行病之一。感染该寄生虫的虾并不会出现明显的大量死亡,但虾体会停止生长并正常食用饵料造成巨大的经济损失。该病往往在养殖后30-45d左右才会发现异常,虾体生长缓慢,偶尔会有白便的情况。在我国的南美白对虾养殖中发病率约为25%,减产达到15-20%,损失约3亿元。除虾苗本身肠孢虫呈阳性以外,天气因素,池底质恶化,饲料问题均可横向诱发本病。鉴于南美白对虾肝肠孢虫病症状不明显且危害巨大,急需形成相对应的预警方法。
发明内容
本发明所要解决的技术问题是:提供一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,采用这种方法能对南美白对虾肝肠孢虫病进行预测。
本发明所采用的技术方案是:一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,它包括以下步骤:
S1、获取南美白对虾养殖水体信息以及气象信息;
S2、采用存储模型将获取的信息进行存储;
S3、通过获取的信息建立神经网络模型,然后训练样本数据;
S4、建立隐马尔可夫模型,然后训练经神经网络拟合后的高相关性数据;
S5、通过建立的神经网络模型以及隐马尔可夫模型来预测肝肠孢虫病的爆发概率。
作为优选,步骤S3具体包括以下步骤:
S31、设置神经网络的输入层节点数;
S32、设置隐藏层输入函数;
S33、定义系统误差函数;
S34、计算全局误差,并且得到全局误差对尺度系数和平移系数的偏导数;
S35、针对偏导数,利用随机梯度下降法进行参数更新。
作为优选,步骤S32具体包括以下步骤:
给神经元激活率赋一个区间(-1,1)内的随机数,并且设定激励函数为
Figure BDA0002365808970000021
其中aj,bj为隐藏层第j个神经元的尺度函数和平移函数;x表示输入信号经权值和偏置计算后的输入至隐藏层的信号;且函数包括三个部分:
(1)、隐藏层第i个输入神经元:
Figure BDA0002365808970000022
(2)、隐藏层第i个输出神经元:
Figure BDA0002365808970000023
(3)、输出层第k个节点的输出:
Figure BDA0002365808970000024
其中,n表示隐藏层神经元数目,m表示样本输入数目,wkj表示隐藏层第j个神经元至第k个输出的链接权值,wij表示第i个输入样本xi至隐藏层第j个神经元的链接权值,λi为输入层偏置,λj为隐藏层偏置。
作为优选,步骤S33具体包括以下步骤:设定误差函数为
Figure BDA0002365808970000025
其中,bo为输出层各神经元的阈值,yo为为输出层输出向量,样本数据个数k。
作为优选,步骤S34具体包括以下步骤:
计算全局误差E;
Figure BDA0002365808970000026
并且得到误差函数E对wkjji尺度系数aj和平移系数bj的偏导数:
Figure BDA0002365808970000027
Figure BDA0002365808970000028
Figure BDA0002365808970000031
Figure BDA0002365808970000032
Figure BDA0002365808970000033
Figure BDA0002365808970000034
作为优选,步骤S4具体包括以下步骤:
S41、初始化隐马尔可夫模型:
将HMM模型记为h=(N,M,π,A,B)
其中,N表示HMM模型的隐藏状态数,N=(N1,N2,N3.....Nn),t时刻系统的隐藏状态即为qt
M为系统观测状态即神经网络提取的相关性序列,M=(M1,M2,M3...Mr),t时刻系统的观测状态为Ot
π表示初始隐藏状态的概率矩阵,π=(π123...πn),πi=P(q1=Ni),1≤i≤n;q1表示系统的初始装态,Ni为HMM模型的第i个隐藏状态;
A为状态转移矩阵,A=(aij)n×n,aij表示状态由i到j的概率,aij=P(qt+1=Nj|qt=Nj)i≥1,j≤n;
B为观测值概率矩阵,B=(bjk)r×n,bjk表示隐藏状态k到观测状态j的转移概率,j为隐藏层状态次序,n为隐藏层总状态数,k为观测状态次序,r为观测总状态数;
S42、建立模型:
S421、HMM模型矩阵初始化:
S422、从样本数据中取T组测量数据作为模型的观测状态序列;
S423、根据神经网络的计算结果将数据输出为观测序列O;
S424、定义前向概率at(i):al(i)=πibi(O1),
Figure BDA0002365808970000041
其中的a1(i)表示系统初始时刻第i个隐藏状态的向前概率,πi表示第i个隐藏状态的初始概率矩阵,bi(O1)表示系统初始时刻的隐藏状态为Ni观测到O1的概率,h表示HMM模型,at(j)aji表示时刻t隐藏状态为Nj,观测序列为[O1,O2,...Ot],时刻t+1隐藏状态为Ni的概率,bi(Ot+1)表示隐藏状态为Ni观测到Ot+1的概率;
S425、定义向后概率βt(i),表示t时刻(t<T)隐藏状态为Ni,t+1时刻至T时刻观测序列为[Ot+1,Ot+2,...OT]的概率:βT(i)=1,
Figure BDA0002365808970000042
其中,qt=Ni表示t时刻隐藏状态为Ni,βt+1(j)表示t-1时刻隐藏状态为Nj的后向传播概率,aij表示由状态i转移到状态j的概率,aijβt+1(j)表示t+1时刻隐藏状态为Nj,t时刻隐藏状态为Ni的概率,aijbj(Ot+1t+1(j)表示观测序列为[Ot+1,Ot+2,...OT];
S426、计算当前观测序列的前向概率和后向概率之和,
Figure BDA0002365808970000043
在时刻t设备出于状态Ni的概率为:
Figure BDA0002365808970000044
S427、给定观测序列O,在时刻t+1设备由状态Ni转移到Nj的概率:ζt(i,j)=P(qt=N,qt+1=Nj|O,λ);
S428、若模型不收敛,返回步骤S322;若模型收敛,调整相关参数。
作为优选,步骤S5具体包括以下步骤:
S51、初始状态:
δ1(i)=πibi(O1),i=1,2...n,n为隐藏层的状态数目,πi表示初始时刻状态的概率,bi(O1)表示初始时刻观测为O1,状态为Ni的概率,δ1(i)表示初始时刻观测到系统处于ni的状态的概率;
S52、递推时刻t的状态:
δt(i)=max(δt-1(1),δt-1(2),...,δt-1(n))·bi(Ot)表示t-1时刻系统n个状态中处于最大可能状态,b(Ot)表示观测到观测到系统处于ni的状态的概率。
采用以上方法与现有技术相比,本发明具有以下优点:本发明通过采集水体数据以及气象数据,然后结合神经网络模型对南美白对虾的水质与气象监控数据与肠孢虫病爆发之间的相关性进行拟合,最后通过隐马尔可夫模型来预测南美白对虾肝肠孢虫病,这样预测准确性较高。
附图说明
图1为本发明一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法的流程原理图。
具体实施方式
以下通过具体实施方式对本发明做进一步描述,但是本发明不仅限于以下具体实施方式。
本发明实施例提供一种基于大数据挖掘的南美白对虾肝肠孢虫预警模型构建方法。包括基于神经网络的相关性拟合模型与基于隐马尔可夫模型的疾病爆发概率预测模型。
其中神经网络模型用于对南美白对虾的水质与气象监控数据与肠孢虫病爆发之间的相关性进行拟合。
隐马尔可夫模型用做肠孢虫病预警模型。
具体的,第一步,获取南美白对虾的水质的水质监测与气象监测信息,如针对海水养殖的情况,使用YSI 600R多参数水质仪和TRM-ZS2型自动气象站,结合GPRS无线传输技术,对海水养殖中的水体和气象环境因子进行全面监测。
南美白对虾肝肠孢虫病的发病因素复杂,除去虾苗本身携带虫体的内生因素以外,水质因素,气象因素等外生因素波动也造成肠孢虫病爆发。该病警兆指标显现在养殖30—45d左右,饵料食用正常单虾体生长停滞,偶尔有白便的情况发生,无明显的死亡出现,造成严重的减产与饵料浪费。
鉴于肠孢虫病在养殖30d前难以发现,对预警系统要求具有准确性与自动性,本发明实施例利用大数据挖掘技术,全方面的获取水质因素包括:温度、溶解氧、PH值、浊度、盐度等水体信息。气象信息包括:气温、气压、湿度、雨、雪、霾等,作为疾病爆发的相关预警因子。
第二步,用Hadoop的Apache Hive框架,对基于大数据挖掘所获得的海量监测信息储存模型进行储存。
第三步,建立神经网络:对诸多预警因子与肠孢虫病爆发之间的相关性进行拟合。
具体的,步骤3.1:设置输入层节点K,K表示输入的数据的组数,每组数据都包含全部检测信息以及检测时间t,输出层节点设置为nM,M代表输出要求预测的时间长度,隐含层节点数n根据输入和输出的要求确定;通过过去的数据来寻找水质、气象等数据在时间t内对应肠孢虫疾病爆发间的拟合关系。以若干连续值为输入,在大量数据的拟合下,神经网络将自动掌握各因素与肠孢虫病爆发间的相关性。
确定神经网络输入样本至隐藏层的初始连接权值和偏置,隐藏层至输出层连接权值与偏置,以及各层神经元数量,神经网络深度。设置神经网络的输入层节点数,节点数视监控的数据种类决定。例如监控水温,溶氧量,PH值,浊度则设定节点数为4K,K为每类数据的组数,根据输入层调整输出层节点。
步骤3.2:设置隐藏层输入函数:给神经元激活率赋一个区间(-1,1)内的随机数,并设定激励函数为
Figure BDA0002365808970000061
函数包括三个部分:
其中aj,bj为隐藏层第j个神经元的尺度函数和平移函数。x表示输入信号经权值和偏置计算后的输入至隐藏层的信号
隐藏层第i个输入神经元:
Figure BDA0002365808970000062
隐藏层第i个输出神经元:
Figure BDA0002365808970000063
输出层第k个节点的输出:
Figure BDA0002365808970000064
n表示隐藏层神经元数目,m表示样本输入数目,wkj表示隐藏层第j个神经元至第k个输出的链接权值,wij表示第i个输入样本xi至隐藏层第j个神经元的链接权值,λi为输入层偏置,λj为隐藏层偏置。
步骤3.3:定义系统误差函数,设定误差函数为
Figure BDA0002365808970000065
bh隐含层各神经元的阈值,bo输出层各神经元的阈值,yo为输出层输出向量,样本数据个数k。
步骤3.4:计算全局误差E。
Figure BDA0002365808970000071
求误差函数E对wkjji尺度系数aj和平移系数bj的偏导数:
Figure BDA0002365808970000072
Figure BDA0002365808970000073
Figure BDA0002365808970000074
Figure BDA0002365808970000075
Figure BDA0002365808970000076
Figure BDA0002365808970000077
步骤3.5:针对偏导数,利用随机梯度下降算法对wkj,wijji,aj,bj进行参数更新,定义随机梯度下降算法步长δ,步长调整。当误差增长过大时,我们对步长进行削减,动量项设为零。当误差出现先增后长,即出现了过拟合,此时将动量项设为零。当误差下降幅度小,适当加快学习率。直到误差下降速率较快时,将动量项设置为预设值。
有第r个样本的r+1个参数因子为:
Figure BDA0002365808970000078
Figure BDA0002365808970000079
Figure BDA00023658089700000710
Figure BDA00023658089700000711
Figure BDA00023658089700000712
Figure BDA00023658089700000713
步骤4:训练样本数据:步骤3中设置的神经网络会对采集来的各项数据对南美白对虾肝肠孢虫进行相关性拟合,神经网络模型会自动调整相关的权值。开始训练后可能出现以下异常:
如果模型在训练出现了模型的过拟合,应当停止训练重新调整模型。
具体改进:
1)若出现过拟合,可能是drop层设计的舍弃参数不合适,可提高数值,如50%的丢弃概率。
2)如果模型在训练集和验证集上的结果一直很差,那表明模型参数没有能够收敛,应当停止训练更改训练策略。在使用随机梯度下降法作为参数更新理念的模型下,最可能影响模型收敛情况的原因是学习率(更新步长)lr选择不合理,可由默认的0.01调整为0.001。
若精度持续增长则表明训练状态良好。
步骤5:应用隐马尔可夫模型HMM模型进行疾病爆发概率预测:
根据步骤3,从原始数据中提取出监控因素序列X[水温、溶氧量、PH值、浊度....],其中每组样本的数据维度为m,特征维度为r,需注意r<m。
步骤5.1:初始化模型:
将HMM模型记为h=(N,M,π,A,B)
其中,N表示HMM模型的隐藏状态数,将参数的变化过程作为隐藏状态的随机过程,N=(N1,N2,N3.....Nn),t时刻系统的隐藏状态即为qt
M为系统观测状态即神经网络提取的相关性序列,M=(M1,M2,M3...Mr),t时刻系统的观测状态为Ot
π表示初始隐藏状态的概率矩阵,π=(π123...πn),πi=P(q1=Ni),1≤i≤n;q1表示系统的初始装态,Ni为HMM模型的第i个隐藏状态。
A为状态转移矩阵,表示设备由当前隐藏状态转移到另一个隐藏状态的概率矩阵,A=(aij)n×n,aij表示状态由i到j的概率,aij=P(qt+1=Nj|qt=Nj)i≥1,j≤n。
B为观测值概率矩阵,表示设备的隐藏状态到观测状态的转移概率,B=(bjk)r×n,bjk表示隐藏状态k到观测状态j的转移概率,j为隐藏层状态次序,n为隐藏层总状态数,k为观测状态次序,r为观测总状态数。
步骤5.2:建立模型
选取不同状态的采集数据,包括正常养殖条件下的数据,对(水温,溶氧量...)等不同影响程度的影响因素所带来的预警等级分析,建立HMM模型,根据前向-后向算法对采集到的设备状态数据进行模型训练,确定设备隐藏状态的状态转移矩阵,计算步骤如下:
(1)HMM模型矩阵初始化:确定π,A,B、...
(2)从样本数据中取T组测量数据作为模型的观测状态序列。
(3)根据神经网络的计算结果将数据输出为观测序列O。
(4)定义前向概率at(i):al(i)=πibi(O1),
Figure BDA0002365808970000091
其中的a1(i)表示系统初始时刻第i个隐藏状态的向前概率,πi表示第i个隐藏状态的初始概率矩阵,bi(O1)表示系统初始时刻的隐藏状态为Ni观测到O1的概率,h表示HMM模型,at(j)aji表示时刻t隐藏状态为Nj,观测序列为[O1,O2,...Ot],时刻t+1隐藏状态为Ni的概率,bi(Ot+1)表示隐藏状态为Ni观测到Ot+1的概率。
(5)定义向后概率βt(i),表示t时刻(t<T)隐藏状态为Ni,t+1时刻至T时刻观测序列为[Ot+1,Ot+2,...OT]的概率:βT(i)=1,
Figure BDA0002365808970000092
其中,qt=Ni表示t时刻隐藏状态为Ni,βt+1(j)表示t-1时刻隐藏状态为Nj的后向传播概率,aij表示由状态i转移到状态j的概率,aijβt+1(j)表示t+1时刻隐藏状态为Nj,t时刻隐藏状态为Ni的概率,aijbj(Ot+1t+1(j)表示观测序列为[Ot+1,Ot+2,...OT]。
(6)计算当前观测序列的前向概率和后向概率之和。
Figure BDA0002365808970000093
在时刻t设备出于状态Ni的概率为:
Figure BDA0002365808970000094
(7)给定观测序列O,在时刻t+1设备由状态Ni转移到Nj的概率:ζt(i,j)=P(qt=N,qt+1=Nj|O,λ)。
(8)若模型不收敛,返回步骤(2)。若模型收敛,调整相关参数。
步骤6,疾病爆发概率预测:
在对养殖环境疾病爆发风险进行预测时,输出序列O,根据训练的HMM模型,计算其所处的最大可能的疾病爆发几率,具体的:
步骤6.1:初始状态
δ1(i)=πibi(O1),i=1,2...n,n为隐藏层的状态数目,πi表示初始时刻状态的概率,bi(O1)表示初始时刻观测为O1,状态为Ni的概率,δ1(i)表示初始时刻观测到系统处于ni的状态的概率。
步骤6.2:递推时刻t的状态:
δt(i)=max(δt-1(1),δt-1(2),...,δt-1(n))·bi(Ot)表示t-1时刻系统n个状态中处于最大可能状态。b(Ot)表示观测到观测到系统处于Ni的状态的概率。
用T的最大值来表示养殖池最大可能状态及疾病爆发状态。
选取养殖池的水温,溶氧量,PH值,浊度,天气等输入神经网络输入层,隐藏层神经元数目初置为3,权重1/7,偏置[-0.2,0.2]的随机值。HMM模型初始值设为均匀分布,参数之和1。
Figure BDA0002365808970000101
预测时,养殖池肠孢虫爆发状态设置为以下档位:[正常状态,低度预警,中度预警,高度预警]。
本发明采用利用神经网络,将小波函数的尺度和平移函数作为输入层至隐藏层的权值,避免出现局部收敛,利用小波函数对数据进行因素—疾病间的相关性逼近,提高了后续对数据预测处理时的可信度;
本发明采用采用隐马尔科夫模型对数据进行处理,降低了计算复杂度,提高了肠孢虫病预测速率;
本发明采用隐马尔科夫模型采用基于时间序列的运行数据对养殖池进行疾病预测,提高了预测的可信度。
由以上技术方案可知,本发明提供的南美白对虾肠孢虫病预警系统能够实现对南美白对虾肠孢虫病的预警分析,有利于科学养殖,减少养殖损失。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的技术人员应当理解,其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行同等替换;而这些修改或者替换,并不使相应的技术方案的本质脱离本发明各实施例技术方案的精神与范围。

Claims (7)

1.一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,其特征在于,它包括以下步骤:
S1、获取南美白对虾养殖水体信息以及气象信息;
S2、采用存储模型将获取的信息进行存储;
S3、通过获取的信息建立神经网络模型,然后训练样本数据;
S4、建立隐马尔可夫模型,然后训练经神经网络拟合后的高相关性数据;
S5、通过建立的神经网络模型以及隐马尔可夫模型来预测肝肠孢虫病的爆发概率。
2.根据权利要求1所述一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,其特征在于:步骤S3具体包括以下步骤:
S31、设置神经网络的输入层节点数;
S32、设置隐藏层输入函数;
S33、定义系统误差函数;
S34、计算全局误差,并且得到全局误差对尺度系数和平移系数的偏导数;
S35、针对偏导数,利用随机梯度下降法进行参数更新。
3.根据权利要求1所述一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,其特征在于:步骤S32具体包括以下步骤:
给神经元激活率赋一个区间(-1,1)内的随机数,并且设定激励函数为
Figure FDA0002365808960000011
其中aj,bj为隐藏层第j个神经元的尺度函数和平移函数;x表示输入信号经权值和偏置计算后的输入至隐藏层的信号;且函数包括三个部分:
(1)、隐藏层第i个输入神经元:
Figure FDA0002365808960000012
(2)、隐藏层第i个输出神经元:
Figure FDA0002365808960000013
(3)、输出层第k个节点的输出:
Figure FDA0002365808960000014
其中,n表示隐藏层神经元数目,m表示样本输入数目,wkj表示隐藏层第j个神经元至第k个输出的链接权值,wij表示第i个输入样本xi至隐藏层第j个神经元的链接权值,λi为输入层偏置,λj为隐藏层偏置。
4.根据权利要求1所述一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,其特征在于:步骤S33具体包括以下步骤:设定误差函数为
Figure FDA0002365808960000021
其中,bo为输出层各神经元的阈值,yo为为输出层输出向量,样本数据个数k。
5.根据权利要求1所述一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,其特征在于:步骤S34具体包括以下步骤:
计算全局误差E;
Figure FDA0002365808960000022
并且得到误差函数E对wkjji尺度系数aj和平移系数bj的偏导数:
Figure FDA0002365808960000023
Figure FDA0002365808960000024
Figure FDA0002365808960000025
Figure FDA0002365808960000026
Figure FDA0002365808960000027
Figure FDA0002365808960000028
6.根据权利要求1所述一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,其特征在于:步骤S4具体包括以下步骤:
S41、初始化隐马尔可夫模型:
将HMM模型记为h=(N,M,π,A,B)
其中,N表示HMM模型的隐藏状态数,N=(N1,N2,N3.....Nn),t时刻系统的隐藏状态即为qt
M为系统观测状态即神经网络提取的相关性序列,M=(M1,M2,M3...Mr),t时刻系统的观测状态为Ot
π表示初始隐藏状态的概率矩阵,π=(π123...πn),πi=P(q1=Ni),1≤i≤n;q1表示系统的初始装态,Ni为HMM模型的第i个隐藏状态;
A为状态转移矩阵,A=(aij)n×n,aij表示状态由i到j的概率,aij=P(qt+1=Nj|qt=Nj)i≥1,j≤n;
B为观测值概率矩阵,B=(bjk)r×n,bjk表示隐藏状态k到观测状态j的转移概率,j为隐藏层状态次序,n为隐藏层总状态数,k为观测状态次序,r为观测总状态数;
S42、建立模型:
S421、HMM模型矩阵初始化:
S422、从样本数据中取T组测量数据作为模型的观测状态序列;
S423、根据神经网络的计算结果将数据输出为观测序列O;
S424、定义前向概率at(i):al(i)=πibi(O1),
Figure FDA0002365808960000031
其中的a1(i)表示系统初始时刻第i个隐藏状态的向前概率,πi表示第i个隐藏状态的初始概率矩阵,bi(O1)表示系统初始时刻的隐藏状态为Ni观测到O1的概率,h表示HMM模型,at(j)aji表示时刻t隐藏状态为Nj,观测序列为[O1,O2,...Ot],时刻t+1隐藏状态为Ni的概率,bi(Ot+1)表示隐藏状态为Ni观测到Ot+1的概率;
S425、定义向后概率βt(i),表示t时刻(t<T)隐藏状态为Ni,t+1时刻至T时刻观测序列为[Ot+1,Ot+2,...OT]的概率:βT(i)=1,
Figure FDA0002365808960000041
其中,qt=Ni表示t时刻隐藏状态为Ni,βt+1(j)表示t-1时刻隐藏状态为Nj的后向传播概率,aij表示由状态i转移到状态j的概率,aijβt+1(j)表示t+1时刻隐藏状态为Nj,t时刻隐藏状态为Ni的概率,aijbj(Ot+1t+1(j)表示观测序列为[Ot+1,Ot+2,...OT];
S426、计算当前观测序列的前向概率和后向概率之和,
Figure FDA0002365808960000042
在时刻t设备出于状态Ni的概率为:
Figure FDA0002365808960000043
S427、给定观测序列O,在时刻t+1设备由状态Ni转移到Nj的概率:ζt(i,j)=P(qt=N,qt+1=Nj|O,λ);
S428、若模型不收敛,返回步骤S322;若模型收敛,调整相关参数。
7.根据权利要求6所述一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,其特征在于:步骤S5具体包括以下步骤:
S51、初始状态:
δ1(i)=πibi(O1),i=1,2...n,n为隐藏层的状态数目,πi表示初始时刻状态的概率,bi(O1)表示初始时刻观测为O1,状态为Ni的概率,δ1(i)表示初始时刻观测到系统处于ni的状态的概率;
S52、递推时刻t的状态:
δt(i)=max(δt-1(1),δt-1(2),...,δt-1(n))·bi(Ot)表示t-1时刻系统n个状态中处于最大可能状态,b(Ot)表示观测到观测到系统处于ni的状态的概率。
CN202010035403.5A 2020-01-14 2020-01-14 一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法 Pending CN111223574A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010035403.5A CN111223574A (zh) 2020-01-14 2020-01-14 一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010035403.5A CN111223574A (zh) 2020-01-14 2020-01-14 一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法

Publications (1)

Publication Number Publication Date
CN111223574A true CN111223574A (zh) 2020-06-02

Family

ID=70831092

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010035403.5A Pending CN111223574A (zh) 2020-01-14 2020-01-14 一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法

Country Status (1)

Country Link
CN (1) CN111223574A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113053536A (zh) * 2021-01-15 2021-06-29 中国人民解放军军事科学院军事医学研究院 一种基于隐马尔科夫模型的传染病预测方法、系统和介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN204653414U (zh) * 2015-06-03 2015-09-23 广东海洋大学 一种南美白对虾工厂化育苗环境安全评估及预警装置
CN105701280A (zh) * 2016-01-05 2016-06-22 浙江大学城市学院 南美白对虾围塘养殖水质预测方法
CN106538437A (zh) * 2016-09-19 2017-03-29 中国农业大学 基于粗糙集理论的南美白对虾白斑病监控预警系统及方法
CN110288046A (zh) * 2019-07-02 2019-09-27 南京恩瑞特实业有限公司 一种基于小波神经网络与隐马尔科夫模型的故障预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN204653414U (zh) * 2015-06-03 2015-09-23 广东海洋大学 一种南美白对虾工厂化育苗环境安全评估及预警装置
CN105701280A (zh) * 2016-01-05 2016-06-22 浙江大学城市学院 南美白对虾围塘养殖水质预测方法
CN106538437A (zh) * 2016-09-19 2017-03-29 中国农业大学 基于粗糙集理论的南美白对虾白斑病监控预警系统及方法
CN110288046A (zh) * 2019-07-02 2019-09-27 南京恩瑞特实业有限公司 一种基于小波神经网络与隐马尔科夫模型的故障预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘双印: "基于物联网的南美白对虾疾病远程智能诊断系统" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113053536A (zh) * 2021-01-15 2021-06-29 中国人民解放军军事科学院军事医学研究院 一种基于隐马尔科夫模型的传染病预测方法、系统和介质
CN113053536B (zh) * 2021-01-15 2023-11-24 中国人民解放军军事科学院军事医学研究院 一种基于隐马尔科夫模型的传染病预测方法、系统和介质

Similar Documents

Publication Publication Date Title
Chen et al. Feed intake prediction model for group fish using the MEA-BP neural network in intensive aquaculture
Schmid et al. The LOKI underwater imaging system and an automatic identification model for the detection of zooplankton taxa in the Arctic Ocean
CN110781921A (zh) 一种基于深度残差网络与迁移学习的毒蕈图像识别方法和装置
Wang et al. Recognition and counting of typical apple pests based on deep learning
CN113591671B (zh) 一种基于Mask-Rcnn识别鱼类生长检测方法
CN113469958B (zh) 一种胚胎发育潜能预测方法、系统、设备及存储介质
CN113192026A (zh) 一种基于可见光图像的核桃成熟度检测与预测方法
CN110363218B (zh) 一种胚胎无创评估方法及装置
US11455725B2 (en) Embryo viability evaluation using AI/ML analysis of real-time video
CN114463675A (zh) 一种水下鱼类群组活动强度识别方法及装置
Kodors et al. Pear and apple recognition using deep learning and mobile
CN115812634A (zh) 一种孵前种蛋受精信息无损分拣方法及装置
CN114004433A (zh) 一种养殖鱼类生长环境调控方法及装置
CN111223574A (zh) 一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法
Li et al. An adaptive method for fish growth prediction with empirical knowledge extraction
CN116824205A (zh) 一种基于注意力多源特征融合的食用菌杂菌检测方法
CN114973024A (zh) 一种机采棉脱叶效果综合评价指标监测与评价方法及系统
Ienaga et al. Normal hatching rate estimation for bulk samples of Pacific bluefin tuna (Thunnus orientalis) eggs using deep learning
CN114419432B (zh) 一种鱼群摄食强度评估方法及装置
CN116957164A (zh) 一种基于LightGBM-XGBoost集成学习的农药残留量测量方法
CN116579504A (zh) 基于机器学习的池塘海水养殖水温的预测方法
Mowla et al. Weeds Detection Networks
Choi et al. Mate limitation in an estuarine population of copepods
Gao et al. Classification Method of Rape Root Swelling Disease Based on Convolution Neural Network
Araújo et al. Hinting Pipeline and Multivariate Regression CNN for Maize Kernel Counting on the Ear

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination