CN111223574A - 一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法 - Google Patents
一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法 Download PDFInfo
- Publication number
- CN111223574A CN111223574A CN202010035403.5A CN202010035403A CN111223574A CN 111223574 A CN111223574 A CN 111223574A CN 202010035403 A CN202010035403 A CN 202010035403A CN 111223574 A CN111223574 A CN 111223574A
- Authority
- CN
- China
- Prior art keywords
- state
- probability
- hidden
- model
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000238553 Litopenaeus vannamei Species 0.000 title claims abstract description 31
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000007418 data mining Methods 0.000 title claims abstract description 16
- 238000013528 artificial neural network Methods 0.000 claims abstract description 20
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000003062 neural network model Methods 0.000 claims abstract description 9
- 238000009360 aquaculture Methods 0.000 claims abstract description 5
- 244000144974 aquaculture Species 0.000 claims abstract description 5
- 210000002569 neuron Anatomy 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 17
- 230000007704 transition Effects 0.000 claims description 12
- 229910052760 oxygen Inorganic materials 0.000 claims description 9
- 238000013519 translation Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 3
- 230000005284 excitation Effects 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000012905 input function Methods 0.000 claims description 3
- 210000002364 input neuron Anatomy 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 210000004205 output neuron Anatomy 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 206010019842 Hepatomegaly Diseases 0.000 claims 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 16
- 201000004989 Enterocele Diseases 0.000 abstract description 2
- 206010019909 Hernia Diseases 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 17
- 201000010099 disease Diseases 0.000 description 14
- 241000238557 Decapoda Species 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 8
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 6
- 239000001301 oxygen Substances 0.000 description 6
- 230000000968 intestinal effect Effects 0.000 description 5
- 241000415078 Anemone hepatica Species 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 241000530454 Litopenaeus schmitti Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000003608 fece Anatomy 0.000 description 2
- 238000009364 mariculture Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241000588914 Enterobacter Species 0.000 description 1
- 241000243190 Microsporidia Species 0.000 description 1
- 208000030852 Parasitic disease Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 210000002490 intestinal epithelial cell Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K61/00—Culture of aquatic animals
- A01K61/50—Culture of aquatic animals of shellfish
- A01K61/59—Culture of aquatic animals of shellfish of crustaceans, e.g. lobsters or shrimps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/80—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in fisheries management
- Y02A40/81—Aquaculture, e.g. of fish
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Pathology (AREA)
- Environmental Sciences (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Marine Sciences & Fisheries (AREA)
- Zoology (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Artificial Intelligence (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及水产养殖技术领域,尤其涉及一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法。它包括以下步骤:S1、获取南美白对虾养殖水体信息以及气象信息;S2、采用存储模型将获取的信息进行存储;S3、通过获取的信息建立神经网络模型,然后训练样本数据;S4、建立隐马尔可夫模型,然后训练经神经网络拟合后的高相关性数据;S5、通过建立的神经网络模型以及隐马尔可夫模型来预测肝肠孢虫病的爆发概率。采用这种方法能对南美白对虾肝肠孢虫病进行预测。
Description
技术领域
本发明涉及水产养殖技术领域,尤其涉及一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法。
背景技术
南美白对虾是世界上三大优良养殖虾种之一,是我国主要的对下养殖品种。肝肠孢虫是南美白对虾养殖中的常见寄生虫疾病,传播迅速,蔓延广,全名肠道上皮细胞微孢子虫,是当前最常见的南美白对虾暴发性流行病之一。感染该寄生虫的虾并不会出现明显的大量死亡,但虾体会停止生长并正常食用饵料造成巨大的经济损失。该病往往在养殖后30-45d左右才会发现异常,虾体生长缓慢,偶尔会有白便的情况。在我国的南美白对虾养殖中发病率约为25%,减产达到15-20%,损失约3亿元。除虾苗本身肠孢虫呈阳性以外,天气因素,池底质恶化,饲料问题均可横向诱发本病。鉴于南美白对虾肝肠孢虫病症状不明显且危害巨大,急需形成相对应的预警方法。
发明内容
本发明所要解决的技术问题是:提供一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,采用这种方法能对南美白对虾肝肠孢虫病进行预测。
本发明所采用的技术方案是:一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,它包括以下步骤:
S1、获取南美白对虾养殖水体信息以及气象信息;
S2、采用存储模型将获取的信息进行存储;
S3、通过获取的信息建立神经网络模型,然后训练样本数据;
S4、建立隐马尔可夫模型,然后训练经神经网络拟合后的高相关性数据;
S5、通过建立的神经网络模型以及隐马尔可夫模型来预测肝肠孢虫病的爆发概率。
作为优选,步骤S3具体包括以下步骤:
S31、设置神经网络的输入层节点数;
S32、设置隐藏层输入函数;
S33、定义系统误差函数;
S34、计算全局误差,并且得到全局误差对尺度系数和平移系数的偏导数;
S35、针对偏导数,利用随机梯度下降法进行参数更新。
作为优选,步骤S32具体包括以下步骤:
其中,n表示隐藏层神经元数目,m表示样本输入数目,wkj表示隐藏层第j个神经元至第k个输出的链接权值,wij表示第i个输入样本xi至隐藏层第j个神经元的链接权值,λi为输入层偏置,λj为隐藏层偏置。
作为优选,步骤S34具体包括以下步骤:
计算全局误差E;
并且得到误差函数E对wkj,λj,λi尺度系数aj和平移系数bj的偏导数:
作为优选,步骤S4具体包括以下步骤:
S41、初始化隐马尔可夫模型:
将HMM模型记为h=(N,M,π,A,B)
其中,N表示HMM模型的隐藏状态数,N=(N1,N2,N3.....Nn),t时刻系统的隐藏状态即为qt;
M为系统观测状态即神经网络提取的相关性序列,M=(M1,M2,M3...Mr),t时刻系统的观测状态为Ot;
π表示初始隐藏状态的概率矩阵,π=(π1,π2,π3...πn),πi=P(q1=Ni),1≤i≤n;q1表示系统的初始装态,Ni为HMM模型的第i个隐藏状态;
A为状态转移矩阵,A=(aij)n×n,aij表示状态由i到j的概率,aij=P(qt+1=Nj|qt=Nj)i≥1,j≤n;
B为观测值概率矩阵,B=(bjk)r×n,bjk表示隐藏状态k到观测状态j的转移概率,j为隐藏层状态次序,n为隐藏层总状态数,k为观测状态次序,r为观测总状态数;
S42、建立模型:
S421、HMM模型矩阵初始化:
S422、从样本数据中取T组测量数据作为模型的观测状态序列;
S423、根据神经网络的计算结果将数据输出为观测序列O;
S424、定义前向概率at(i):al(i)=πibi(O1),
其中的a1(i)表示系统初始时刻第i个隐藏状态的向前概率,πi表示第i个隐藏状态的初始概率矩阵,bi(O1)表示系统初始时刻的隐藏状态为Ni观测到O1的概率,h表示HMM模型,at(j)aji表示时刻t隐藏状态为Nj,观测序列为[O1,O2,...Ot],时刻t+1隐藏状态为Ni的概率,bi(Ot+1)表示隐藏状态为Ni观测到Ot+1的概率;
S425、定义向后概率βt(i),表示t时刻(t<T)隐藏状态为Ni,t+1时刻至T时刻观测序列为[Ot+1,Ot+2,...OT]的概率:βT(i)=1,
其中,qt=Ni表示t时刻隐藏状态为Ni,βt+1(j)表示t-1时刻隐藏状态为Nj的后向传播概率,aij表示由状态i转移到状态j的概率,aijβt+1(j)表示t+1时刻隐藏状态为Nj,t时刻隐藏状态为Ni的概率,aijbj(Ot+1)βt+1(j)表示观测序列为[Ot+1,Ot+2,...OT];
S427、给定观测序列O,在时刻t+1设备由状态Ni转移到Nj的概率:ζt(i,j)=P(qt=N,qt+1=Nj|O,λ);
S428、若模型不收敛,返回步骤S322;若模型收敛,调整相关参数。
作为优选,步骤S5具体包括以下步骤:
S51、初始状态:
δ1(i)=πibi(O1),i=1,2...n,n为隐藏层的状态数目,πi表示初始时刻状态的概率,bi(O1)表示初始时刻观测为O1,状态为Ni的概率,δ1(i)表示初始时刻观测到系统处于ni的状态的概率;
S52、递推时刻t的状态:
δt(i)=max(δt-1(1),δt-1(2),...,δt-1(n))·bi(Ot)表示t-1时刻系统n个状态中处于最大可能状态,b(Ot)表示观测到观测到系统处于ni的状态的概率。
采用以上方法与现有技术相比,本发明具有以下优点:本发明通过采集水体数据以及气象数据,然后结合神经网络模型对南美白对虾的水质与气象监控数据与肠孢虫病爆发之间的相关性进行拟合,最后通过隐马尔可夫模型来预测南美白对虾肝肠孢虫病,这样预测准确性较高。
附图说明
图1为本发明一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法的流程原理图。
具体实施方式
以下通过具体实施方式对本发明做进一步描述,但是本发明不仅限于以下具体实施方式。
本发明实施例提供一种基于大数据挖掘的南美白对虾肝肠孢虫预警模型构建方法。包括基于神经网络的相关性拟合模型与基于隐马尔可夫模型的疾病爆发概率预测模型。
其中神经网络模型用于对南美白对虾的水质与气象监控数据与肠孢虫病爆发之间的相关性进行拟合。
隐马尔可夫模型用做肠孢虫病预警模型。
具体的,第一步,获取南美白对虾的水质的水质监测与气象监测信息,如针对海水养殖的情况,使用YSI 600R多参数水质仪和TRM-ZS2型自动气象站,结合GPRS无线传输技术,对海水养殖中的水体和气象环境因子进行全面监测。
南美白对虾肝肠孢虫病的发病因素复杂,除去虾苗本身携带虫体的内生因素以外,水质因素,气象因素等外生因素波动也造成肠孢虫病爆发。该病警兆指标显现在养殖30—45d左右,饵料食用正常单虾体生长停滞,偶尔有白便的情况发生,无明显的死亡出现,造成严重的减产与饵料浪费。
鉴于肠孢虫病在养殖30d前难以发现,对预警系统要求具有准确性与自动性,本发明实施例利用大数据挖掘技术,全方面的获取水质因素包括:温度、溶解氧、PH值、浊度、盐度等水体信息。气象信息包括:气温、气压、湿度、雨、雪、霾等,作为疾病爆发的相关预警因子。
第二步,用Hadoop的Apache Hive框架,对基于大数据挖掘所获得的海量监测信息储存模型进行储存。
第三步,建立神经网络:对诸多预警因子与肠孢虫病爆发之间的相关性进行拟合。
具体的,步骤3.1:设置输入层节点K,K表示输入的数据的组数,每组数据都包含全部检测信息以及检测时间t,输出层节点设置为nM,M代表输出要求预测的时间长度,隐含层节点数n根据输入和输出的要求确定;通过过去的数据来寻找水质、气象等数据在时间t内对应肠孢虫疾病爆发间的拟合关系。以若干连续值为输入,在大量数据的拟合下,神经网络将自动掌握各因素与肠孢虫病爆发间的相关性。
确定神经网络输入样本至隐藏层的初始连接权值和偏置,隐藏层至输出层连接权值与偏置,以及各层神经元数量,神经网络深度。设置神经网络的输入层节点数,节点数视监控的数据种类决定。例如监控水温,溶氧量,PH值,浊度则设定节点数为4K,K为每类数据的组数,根据输入层调整输出层节点。
其中aj,bj为隐藏层第j个神经元的尺度函数和平移函数。x表示输入信号经权值和偏置计算后的输入至隐藏层的信号
n表示隐藏层神经元数目,m表示样本输入数目,wkj表示隐藏层第j个神经元至第k个输出的链接权值,wij表示第i个输入样本xi至隐藏层第j个神经元的链接权值,λi为输入层偏置,λj为隐藏层偏置。
步骤3.4:计算全局误差E。
求误差函数E对wkj,λj,λi尺度系数aj和平移系数bj的偏导数:
步骤3.5:针对偏导数,利用随机梯度下降算法对wkj,wij,λj,λi,aj,bj进行参数更新,定义随机梯度下降算法步长δ,步长调整。当误差增长过大时,我们对步长进行削减,动量项设为零。当误差出现先增后长,即出现了过拟合,此时将动量项设为零。当误差下降幅度小,适当加快学习率。直到误差下降速率较快时,将动量项设置为预设值。
有第r个样本的r+1个参数因子为:
步骤4:训练样本数据:步骤3中设置的神经网络会对采集来的各项数据对南美白对虾肝肠孢虫进行相关性拟合,神经网络模型会自动调整相关的权值。开始训练后可能出现以下异常:
如果模型在训练出现了模型的过拟合,应当停止训练重新调整模型。
具体改进:
1)若出现过拟合,可能是drop层设计的舍弃参数不合适,可提高数值,如50%的丢弃概率。
2)如果模型在训练集和验证集上的结果一直很差,那表明模型参数没有能够收敛,应当停止训练更改训练策略。在使用随机梯度下降法作为参数更新理念的模型下,最可能影响模型收敛情况的原因是学习率(更新步长)lr选择不合理,可由默认的0.01调整为0.001。
若精度持续增长则表明训练状态良好。
步骤5:应用隐马尔可夫模型HMM模型进行疾病爆发概率预测:
根据步骤3,从原始数据中提取出监控因素序列X[水温、溶氧量、PH值、浊度....],其中每组样本的数据维度为m,特征维度为r,需注意r<m。
步骤5.1:初始化模型:
将HMM模型记为h=(N,M,π,A,B)
其中,N表示HMM模型的隐藏状态数,将参数的变化过程作为隐藏状态的随机过程,N=(N1,N2,N3.....Nn),t时刻系统的隐藏状态即为qt。
M为系统观测状态即神经网络提取的相关性序列,M=(M1,M2,M3...Mr),t时刻系统的观测状态为Ot。
π表示初始隐藏状态的概率矩阵,π=(π1,π2,π3...πn),πi=P(q1=Ni),1≤i≤n;q1表示系统的初始装态,Ni为HMM模型的第i个隐藏状态。
A为状态转移矩阵,表示设备由当前隐藏状态转移到另一个隐藏状态的概率矩阵,A=(aij)n×n,aij表示状态由i到j的概率,aij=P(qt+1=Nj|qt=Nj)i≥1,j≤n。
B为观测值概率矩阵,表示设备的隐藏状态到观测状态的转移概率,B=(bjk)r×n,bjk表示隐藏状态k到观测状态j的转移概率,j为隐藏层状态次序,n为隐藏层总状态数,k为观测状态次序,r为观测总状态数。
步骤5.2:建立模型
选取不同状态的采集数据,包括正常养殖条件下的数据,对(水温,溶氧量...)等不同影响程度的影响因素所带来的预警等级分析,建立HMM模型,根据前向-后向算法对采集到的设备状态数据进行模型训练,确定设备隐藏状态的状态转移矩阵,计算步骤如下:
(1)HMM模型矩阵初始化:确定π,A,B、...
(2)从样本数据中取T组测量数据作为模型的观测状态序列。
(3)根据神经网络的计算结果将数据输出为观测序列O。
(4)定义前向概率at(i):al(i)=πibi(O1),
其中的a1(i)表示系统初始时刻第i个隐藏状态的向前概率,πi表示第i个隐藏状态的初始概率矩阵,bi(O1)表示系统初始时刻的隐藏状态为Ni观测到O1的概率,h表示HMM模型,at(j)aji表示时刻t隐藏状态为Nj,观测序列为[O1,O2,...Ot],时刻t+1隐藏状态为Ni的概率,bi(Ot+1)表示隐藏状态为Ni观测到Ot+1的概率。
(5)定义向后概率βt(i),表示t时刻(t<T)隐藏状态为Ni,t+1时刻至T时刻观测序列为[Ot+1,Ot+2,...OT]的概率:βT(i)=1,
其中,qt=Ni表示t时刻隐藏状态为Ni,βt+1(j)表示t-1时刻隐藏状态为Nj的后向传播概率,aij表示由状态i转移到状态j的概率,aijβt+1(j)表示t+1时刻隐藏状态为Nj,t时刻隐藏状态为Ni的概率,aijbj(Ot+1)βt+1(j)表示观测序列为[Ot+1,Ot+2,...OT]。
(7)给定观测序列O,在时刻t+1设备由状态Ni转移到Nj的概率:ζt(i,j)=P(qt=N,qt+1=Nj|O,λ)。
(8)若模型不收敛,返回步骤(2)。若模型收敛,调整相关参数。
步骤6,疾病爆发概率预测:
在对养殖环境疾病爆发风险进行预测时,输出序列O,根据训练的HMM模型,计算其所处的最大可能的疾病爆发几率,具体的:
步骤6.1:初始状态
δ1(i)=πibi(O1),i=1,2...n,n为隐藏层的状态数目,πi表示初始时刻状态的概率,bi(O1)表示初始时刻观测为O1,状态为Ni的概率,δ1(i)表示初始时刻观测到系统处于ni的状态的概率。
步骤6.2:递推时刻t的状态:
δt(i)=max(δt-1(1),δt-1(2),...,δt-1(n))·bi(Ot)表示t-1时刻系统n个状态中处于最大可能状态。b(Ot)表示观测到观测到系统处于Ni的状态的概率。
用T的最大值来表示养殖池最大可能状态及疾病爆发状态。
选取养殖池的水温,溶氧量,PH值,浊度,天气等输入神经网络输入层,隐藏层神经元数目初置为3,权重1/7,偏置[-0.2,0.2]的随机值。HMM模型初始值设为均匀分布,参数之和1。
预测时,养殖池肠孢虫爆发状态设置为以下档位:[正常状态,低度预警,中度预警,高度预警]。
本发明采用利用神经网络,将小波函数的尺度和平移函数作为输入层至隐藏层的权值,避免出现局部收敛,利用小波函数对数据进行因素—疾病间的相关性逼近,提高了后续对数据预测处理时的可信度;
本发明采用采用隐马尔科夫模型对数据进行处理,降低了计算复杂度,提高了肠孢虫病预测速率;
本发明采用隐马尔科夫模型采用基于时间序列的运行数据对养殖池进行疾病预测,提高了预测的可信度。
由以上技术方案可知,本发明提供的南美白对虾肠孢虫病预警系统能够实现对南美白对虾肠孢虫病的预警分析,有利于科学养殖,减少养殖损失。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的技术人员应当理解,其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行同等替换;而这些修改或者替换,并不使相应的技术方案的本质脱离本发明各实施例技术方案的精神与范围。
Claims (7)
1.一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,其特征在于,它包括以下步骤:
S1、获取南美白对虾养殖水体信息以及气象信息;
S2、采用存储模型将获取的信息进行存储;
S3、通过获取的信息建立神经网络模型,然后训练样本数据;
S4、建立隐马尔可夫模型,然后训练经神经网络拟合后的高相关性数据;
S5、通过建立的神经网络模型以及隐马尔可夫模型来预测肝肠孢虫病的爆发概率。
2.根据权利要求1所述一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,其特征在于:步骤S3具体包括以下步骤:
S31、设置神经网络的输入层节点数;
S32、设置隐藏层输入函数;
S33、定义系统误差函数;
S34、计算全局误差,并且得到全局误差对尺度系数和平移系数的偏导数;
S35、针对偏导数,利用随机梯度下降法进行参数更新。
3.根据权利要求1所述一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,其特征在于:步骤S32具体包括以下步骤:
其中,n表示隐藏层神经元数目,m表示样本输入数目,wkj表示隐藏层第j个神经元至第k个输出的链接权值,wij表示第i个输入样本xi至隐藏层第j个神经元的链接权值,λi为输入层偏置,λj为隐藏层偏置。
6.根据权利要求1所述一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,其特征在于:步骤S4具体包括以下步骤:
S41、初始化隐马尔可夫模型:
将HMM模型记为h=(N,M,π,A,B)
其中,N表示HMM模型的隐藏状态数,N=(N1,N2,N3.....Nn),t时刻系统的隐藏状态即为qt;
M为系统观测状态即神经网络提取的相关性序列,M=(M1,M2,M3...Mr),t时刻系统的观测状态为Ot;
π表示初始隐藏状态的概率矩阵,π=(π1,π2,π3...πn),πi=P(q1=Ni),1≤i≤n;q1表示系统的初始装态,Ni为HMM模型的第i个隐藏状态;
A为状态转移矩阵,A=(aij)n×n,aij表示状态由i到j的概率,aij=P(qt+1=Nj|qt=Nj)i≥1,j≤n;
B为观测值概率矩阵,B=(bjk)r×n,bjk表示隐藏状态k到观测状态j的转移概率,j为隐藏层状态次序,n为隐藏层总状态数,k为观测状态次序,r为观测总状态数;
S42、建立模型:
S421、HMM模型矩阵初始化:
S422、从样本数据中取T组测量数据作为模型的观测状态序列;
S423、根据神经网络的计算结果将数据输出为观测序列O;
S424、定义前向概率at(i):al(i)=πibi(O1),
其中的a1(i)表示系统初始时刻第i个隐藏状态的向前概率,πi表示第i个隐藏状态的初始概率矩阵,bi(O1)表示系统初始时刻的隐藏状态为Ni观测到O1的概率,h表示HMM模型,at(j)aji表示时刻t隐藏状态为Nj,观测序列为[O1,O2,...Ot],时刻t+1隐藏状态为Ni的概率,bi(Ot+1)表示隐藏状态为Ni观测到Ot+1的概率;
S425、定义向后概率βt(i),表示t时刻(t<T)隐藏状态为Ni,t+1时刻至T时刻观测序列为[Ot+1,Ot+2,...OT]的概率:βT(i)=1,
其中,qt=Ni表示t时刻隐藏状态为Ni,βt+1(j)表示t-1时刻隐藏状态为Nj的后向传播概率,aij表示由状态i转移到状态j的概率,aijβt+1(j)表示t+1时刻隐藏状态为Nj,t时刻隐藏状态为Ni的概率,aijbj(Ot+1)βt+1(j)表示观测序列为[Ot+1,Ot+2,...OT];
S427、给定观测序列O,在时刻t+1设备由状态Ni转移到Nj的概率:ζt(i,j)=P(qt=N,qt+1=Nj|O,λ);
S428、若模型不收敛,返回步骤S322;若模型收敛,调整相关参数。
7.根据权利要求6所述一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法,其特征在于:步骤S5具体包括以下步骤:
S51、初始状态:
δ1(i)=πibi(O1),i=1,2...n,n为隐藏层的状态数目,πi表示初始时刻状态的概率,bi(O1)表示初始时刻观测为O1,状态为Ni的概率,δ1(i)表示初始时刻观测到系统处于ni的状态的概率;
S52、递推时刻t的状态:
δt(i)=max(δt-1(1),δt-1(2),...,δt-1(n))·bi(Ot)表示t-1时刻系统n个状态中处于最大可能状态,b(Ot)表示观测到观测到系统处于ni的状态的概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010035403.5A CN111223574A (zh) | 2020-01-14 | 2020-01-14 | 一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010035403.5A CN111223574A (zh) | 2020-01-14 | 2020-01-14 | 一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111223574A true CN111223574A (zh) | 2020-06-02 |
Family
ID=70831092
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010035403.5A Pending CN111223574A (zh) | 2020-01-14 | 2020-01-14 | 一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111223574A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113053536A (zh) * | 2021-01-15 | 2021-06-29 | 中国人民解放军军事科学院军事医学研究院 | 一种基于隐马尔科夫模型的传染病预测方法、系统和介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN204653414U (zh) * | 2015-06-03 | 2015-09-23 | 广东海洋大学 | 一种南美白对虾工厂化育苗环境安全评估及预警装置 |
CN105701280A (zh) * | 2016-01-05 | 2016-06-22 | 浙江大学城市学院 | 南美白对虾围塘养殖水质预测方法 |
CN106538437A (zh) * | 2016-09-19 | 2017-03-29 | 中国农业大学 | 基于粗糙集理论的南美白对虾白斑病监控预警系统及方法 |
CN110288046A (zh) * | 2019-07-02 | 2019-09-27 | 南京恩瑞特实业有限公司 | 一种基于小波神经网络与隐马尔科夫模型的故障预测方法 |
-
2020
- 2020-01-14 CN CN202010035403.5A patent/CN111223574A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN204653414U (zh) * | 2015-06-03 | 2015-09-23 | 广东海洋大学 | 一种南美白对虾工厂化育苗环境安全评估及预警装置 |
CN105701280A (zh) * | 2016-01-05 | 2016-06-22 | 浙江大学城市学院 | 南美白对虾围塘养殖水质预测方法 |
CN106538437A (zh) * | 2016-09-19 | 2017-03-29 | 中国农业大学 | 基于粗糙集理论的南美白对虾白斑病监控预警系统及方法 |
CN110288046A (zh) * | 2019-07-02 | 2019-09-27 | 南京恩瑞特实业有限公司 | 一种基于小波神经网络与隐马尔科夫模型的故障预测方法 |
Non-Patent Citations (1)
Title |
---|
刘双印: "基于物联网的南美白对虾疾病远程智能诊断系统" * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113053536A (zh) * | 2021-01-15 | 2021-06-29 | 中国人民解放军军事科学院军事医学研究院 | 一种基于隐马尔科夫模型的传染病预测方法、系统和介质 |
CN113053536B (zh) * | 2021-01-15 | 2023-11-24 | 中国人民解放军军事科学院军事医学研究院 | 一种基于隐马尔科夫模型的传染病预测方法、系统和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Feed intake prediction model for group fish using the MEA-BP neural network in intensive aquaculture | |
Schmid et al. | The LOKI underwater imaging system and an automatic identification model for the detection of zooplankton taxa in the Arctic Ocean | |
CN110781921A (zh) | 一种基于深度残差网络与迁移学习的毒蕈图像识别方法和装置 | |
Wang et al. | Recognition and counting of typical apple pests based on deep learning | |
CN113591671B (zh) | 一种基于Mask-Rcnn识别鱼类生长检测方法 | |
CN113469958B (zh) | 一种胚胎发育潜能预测方法、系统、设备及存储介质 | |
CN113192026A (zh) | 一种基于可见光图像的核桃成熟度检测与预测方法 | |
CN110363218B (zh) | 一种胚胎无创评估方法及装置 | |
US11455725B2 (en) | Embryo viability evaluation using AI/ML analysis of real-time video | |
CN114463675A (zh) | 一种水下鱼类群组活动强度识别方法及装置 | |
Kodors et al. | Pear and apple recognition using deep learning and mobile | |
CN115812634A (zh) | 一种孵前种蛋受精信息无损分拣方法及装置 | |
CN114004433A (zh) | 一种养殖鱼类生长环境调控方法及装置 | |
CN111223574A (zh) | 一种基于大数据挖掘的南美白对虾肝肠孢虫病预警方法 | |
Li et al. | An adaptive method for fish growth prediction with empirical knowledge extraction | |
CN116824205A (zh) | 一种基于注意力多源特征融合的食用菌杂菌检测方法 | |
CN114973024A (zh) | 一种机采棉脱叶效果综合评价指标监测与评价方法及系统 | |
Ienaga et al. | Normal hatching rate estimation for bulk samples of Pacific bluefin tuna (Thunnus orientalis) eggs using deep learning | |
CN114419432B (zh) | 一种鱼群摄食强度评估方法及装置 | |
CN116957164A (zh) | 一种基于LightGBM-XGBoost集成学习的农药残留量测量方法 | |
CN116579504A (zh) | 基于机器学习的池塘海水养殖水温的预测方法 | |
Mowla et al. | Weeds Detection Networks | |
Choi et al. | Mate limitation in an estuarine population of copepods | |
Gao et al. | Classification Method of Rape Root Swelling Disease Based on Convolution Neural Network | |
Araújo et al. | Hinting Pipeline and Multivariate Regression CNN for Maize Kernel Counting on the Ear |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |